




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3章正則表達(dá)式教案1.教案基本信息課程名稱Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn)課程類別選修適用專業(yè)人工智能類相關(guān)專業(yè)總學(xué)時(shí)64學(xué)時(shí)(其中理論32學(xué)時(shí),實(shí)驗(yàn)32學(xué)時(shí))總學(xué)分4.0學(xué)分本章學(xué)時(shí)6學(xué)時(shí)(其中理論3學(xué)時(shí),實(shí)驗(yàn)3學(xué)時(shí))章節(jié)名稱第3章正則表達(dá)式授課教師授課時(shí)間2.教學(xué)目標(biāo)知識(shí)目標(biāo)了解正則表達(dá)式的概念、作用和應(yīng)用范圍掌握常用正則表達(dá)式函數(shù)的語法和用法熟悉正則表達(dá)式元字符的含義和使用方法理解正則表達(dá)式在文本處理中的重要作用能力目標(biāo)能夠使用match、search、findall等函數(shù)進(jìn)行文本匹配能夠運(yùn)用元字符構(gòu)建復(fù)雜的正則表達(dá)式模式能夠進(jìn)行文本驗(yàn)證、信息提取和文本過濾能夠解決實(shí)際NLP場(chǎng)景中的文本處理問題素質(zhì)目標(biāo)培養(yǎng)邏輯思維和模式識(shí)別能力提升文本數(shù)據(jù)處理的精準(zhǔn)性和效率意識(shí)建立規(guī)范化的代碼編寫習(xí)慣養(yǎng)成解決復(fù)雜問題的分析思維3.教學(xué)重點(diǎn)與難點(diǎn)教學(xué)重點(diǎn)正則表達(dá)式的基本概念和應(yīng)用場(chǎng)景常用正則表達(dá)式函數(shù)的使用方法元字符的含義、用法和組合規(guī)則正則表達(dá)式在文本處理中的實(shí)際應(yīng)用教學(xué)難點(diǎn)復(fù)雜正則表達(dá)式模式的構(gòu)建和理解元字符的靈活組合和嵌套使用轉(zhuǎn)義字符的正確使用方法貪婪匹配與非貪婪匹配的區(qū)別解決策略通過大量實(shí)例演示元字符的具體用法采用遞進(jìn)式教學(xué),從簡(jiǎn)單到復(fù)雜逐步深入提供在線正則測(cè)試工具輔助理解設(shè)計(jì)針對(duì)性練習(xí)強(qiáng)化關(guān)鍵概念4.教學(xué)內(nèi)容與知識(shí)結(jié)構(gòu)主要知識(shí)點(diǎn)正則表達(dá)式基礎(chǔ)模塊正則表達(dá)式的定義和作用在NLP中的應(yīng)用范圍基本語法和規(guī)則函數(shù)應(yīng)用模塊match函數(shù):字符串開頭匹配search函數(shù):字符串搜索匹配findall函數(shù):查找所有匹配項(xiàng)sub函數(shù):字符串替換finditer函數(shù):迭代搜索split函數(shù):字符串分割元字符掌握模塊量詞:*、+、?、{n}、{n,}、{n,m}字符類:[]、[^]、\d、\w、\s等錨點(diǎn)邊界:^、$、\b特殊字符:\、.、|、()實(shí)踐應(yīng)用模塊數(shù)據(jù)驗(yàn)證(郵箱、電話、日期)信息提取(姓名、地址、聯(lián)系方式)文本清洗和過濾常用正則表達(dá)式模式庫(kù)知識(shí)結(jié)構(gòu)關(guān)系基礎(chǔ)概念為理論支撐層函數(shù)掌握為技術(shù)工具層元字符應(yīng)用為核心技能層實(shí)踐應(yīng)用為綜合運(yùn)用層5.教學(xué)方法與手段理論教學(xué)方法遞進(jìn)式講授法:從簡(jiǎn)單模式到復(fù)雜模式逐步深入對(duì)比分析法:對(duì)比不同函數(shù)和元字符的作用實(shí)例演示法:通過具體例子解釋抽象概念模式歸納法:總結(jié)常用的正則表達(dá)式模式實(shí)踐教學(xué)方法交互式編程:即時(shí)測(cè)試正則表達(dá)式效果案例驅(qū)動(dòng)法:通過實(shí)際問題學(xué)習(xí)技術(shù)錯(cuò)誤診斷法:分析常見錯(cuò)誤和解決方案模式構(gòu)建法:引導(dǎo)學(xué)生自主構(gòu)建表達(dá)式教學(xué)工具和平臺(tái)Python開發(fā)環(huán)境(re模塊)JupyterNotebook交互式編程在線正則表達(dá)式測(cè)試工具正則表達(dá)式可視化工具6.教學(xué)過程設(shè)計(jì)課時(shí)安排總覽課時(shí)類型內(nèi)容第1課時(shí)理論課正則表達(dá)式概念與函數(shù)介紹第2課時(shí)理論課正則表達(dá)式元字符詳解第3課時(shí)理論+實(shí)驗(yàn)正則表達(dá)式函數(shù)實(shí)踐第4課時(shí)實(shí)驗(yàn)課元字符應(yīng)用與文本處理第5課時(shí)實(shí)驗(yàn)課正則表達(dá)式綜合應(yīng)用第6課時(shí)實(shí)驗(yàn)課實(shí)訓(xùn)項(xiàng)目與案例分析各課時(shí)教學(xué)環(huán)節(jié)設(shè)計(jì)第1課時(shí)(理論):正則表達(dá)式概念與函數(shù)介紹導(dǎo)入環(huán)節(jié)(10分鐘)展示包含各種格式的文本數(shù)據(jù)(郵箱、電話、身份證號(hào)等)提問:如何快速識(shí)別和提取這些特定格式的信息?引出正則表達(dá)式在文本處理中的重要作用新課講授(30分鐘)正則表達(dá)式的定義和基本概念(8分鐘)正則表達(dá)式在NLP中的應(yīng)用范圍(7分鐘)常用正則表達(dá)式函數(shù)介紹(15分鐘)match函數(shù)的用法和特點(diǎn)search函數(shù)與match函數(shù)的區(qū)別findall函數(shù)的應(yīng)用場(chǎng)景示例演示(8分鐘)現(xiàn)場(chǎng)演示match、search、findall函數(shù)的基本用法對(duì)比不同函數(shù)在相同文本上的運(yùn)行結(jié)果課時(shí)小結(jié)(2分鐘)總結(jié)正則表達(dá)式的重要性和基本函數(shù)預(yù)告下節(jié)課元字符內(nèi)容第2課時(shí)(理論):正則表達(dá)式元字符詳解復(fù)習(xí)導(dǎo)入(5分鐘)回顧上節(jié)課的主要函數(shù)提問:如何構(gòu)建更復(fù)雜的匹配模式?新課講授(35分鐘)量詞元字符詳解(12分鐘)*、+、?的區(qū)別和應(yīng)用{n}、{n,}、{n,m}的精確控制貪婪匹配與非貪婪匹配字符類元字符解析(10分鐘)[]、[^]的字符集定義\d、\w、\s等預(yù)定義字符類大小寫敏感的字符匹配錨點(diǎn)和特殊字符(8分鐘)^、$的位置錨定轉(zhuǎn)義字符\的使用.和|的特殊作用元字符組合規(guī)則(5分鐘)互動(dòng)練習(xí)(8分鐘)學(xué)生嘗試構(gòu)建簡(jiǎn)單的正則表達(dá)式教師點(diǎn)評(píng)和糾正常見錯(cuò)誤課時(shí)小結(jié)(2分鐘)強(qiáng)調(diào)元字符的重要性和組合原則介紹下次實(shí)驗(yàn)課安排第3課時(shí)(理論+實(shí)驗(yàn)):正則表達(dá)式函數(shù)實(shí)踐理論回顧(15分鐘)快速回顧六個(gè)主要函數(shù)的用法講解sub和split函數(shù)的高級(jí)用法介紹finditer函數(shù)的迭代特性函數(shù)對(duì)比(15分鐘)同一文本使用不同函數(shù)的效果對(duì)比講解group()方法的使用技巧演示函數(shù)參數(shù)flags的作用實(shí)踐操作(50分鐘)練習(xí)1:使用match和search處理文本(15分鐘)練習(xí)2:用findall提取所有匹配項(xiàng)(15分鐘)練習(xí)3:使用sub進(jìn)行文本替換(10分鐘)練習(xí)4:用split進(jìn)行文本分割(10分鐘)答疑總結(jié)(10分鐘)解答學(xué)生在實(shí)踐中遇到的問題總結(jié)函數(shù)使用的關(guān)鍵要點(diǎn)第4課時(shí)(實(shí)驗(yàn)):元字符應(yīng)用與文本處理實(shí)驗(yàn)準(zhǔn)備(5分鐘)檢查開發(fā)環(huán)境和準(zhǔn)備測(cè)試文本回顧元字符的基本概念元字符實(shí)踐(70分鐘)量詞練習(xí)(20分鐘)練習(xí)不同量詞的匹配效果理解貪婪與非貪婪匹配的區(qū)別字符類應(yīng)用(25分鐘)使用[]構(gòu)建自定義字符集練習(xí)\d、\w、\s等預(yù)定義類掌握[^]排除字符的用法錨點(diǎn)和邊界(15分鐘)使用^和$精確定位理解\b單詞邊界的作用復(fù)雜模式構(gòu)建(10分鐘)組合多個(gè)元字符使用分組()提取信息實(shí)驗(yàn)總結(jié)(15分鐘)總結(jié)元字符的使用技巧討論常見的錯(cuò)誤和解決方法第5課時(shí)(實(shí)驗(yàn)):正則表達(dá)式綜合應(yīng)用應(yīng)用場(chǎng)景介紹(10分鐘)數(shù)據(jù)驗(yàn)證的實(shí)際需求信息提取的應(yīng)用場(chǎng)景文本清洗的重要性綜合練習(xí)(70分鐘)練習(xí)1:驗(yàn)證郵箱地址格式(15分鐘)理解郵箱地址的組成規(guī)則構(gòu)建郵箱驗(yàn)證正則表達(dá)式練習(xí)2:驗(yàn)證電話號(hào)碼格式(15分鐘)處理不同的電話號(hào)碼格式使用正則表達(dá)式進(jìn)行格式統(tǒng)一練習(xí)3:提取個(gè)人信息(20分鐘)從文本中提取姓名、年齡等信息使用分組功能精確提取練習(xí)4:文本清洗處理(20分鐘)過濾HTML標(biāo)簽和特殊字符保留中文字符,去除無關(guān)內(nèi)容成果展示(10分鐘)學(xué)生展示練習(xí)成果分享解決問題的思路和方法第6課時(shí)(實(shí)驗(yàn)):實(shí)訓(xùn)項(xiàng)目與案例分析項(xiàng)目介紹(10分鐘)介紹三個(gè)實(shí)訓(xùn)項(xiàng)目的要求和目標(biāo)分析項(xiàng)目的技術(shù)要點(diǎn)和難點(diǎn)實(shí)訓(xùn)實(shí)施(70分鐘)實(shí)訓(xùn)1:過濾《三國(guó)志》中的非中文字符(20分鐘)分析文本中的特殊字符類型設(shè)計(jì)過濾規(guī)則和正則表達(dá)式實(shí)訓(xùn)2:提取地名與郵編(25分鐘)分析地名郵編的格式特點(diǎn)使用正則表達(dá)式進(jìn)行精確提取實(shí)現(xiàn)地名郵編的對(duì)應(yīng)關(guān)系實(shí)訓(xùn)3:提取網(wǎng)頁(yè)標(biāo)簽中的文本(25分鐘)理解HTML標(biāo)簽的結(jié)構(gòu)設(shè)計(jì)正則表達(dá)式提取標(biāo)簽內(nèi)容處理嵌套標(biāo)簽的復(fù)雜情況項(xiàng)目總結(jié)(10分鐘)總結(jié)實(shí)訓(xùn)中的關(guān)鍵技術(shù)點(diǎn)討論正則表達(dá)式的局限性和替代方案7.實(shí)驗(yàn)/實(shí)踐設(shè)計(jì)實(shí)驗(yàn)一:正則表達(dá)式函數(shù)掌握實(shí)驗(yàn)?zāi)康氖炀氄莆樟鶄€(gè)主要正則表達(dá)式函數(shù)的使用理解不同函數(shù)的適用場(chǎng)景和返回結(jié)果學(xué)會(huì)使用group()方法提取分組信息實(shí)驗(yàn)內(nèi)容使用match函數(shù)進(jìn)行字符串開頭匹配使用search函數(shù)在字符串中搜索模式使用findall函數(shù)查找所有匹配項(xiàng)使用sub函數(shù)進(jìn)行字符串替換使用finditer函數(shù)進(jìn)行迭代搜索使用split函數(shù)進(jìn)行字符串分割實(shí)驗(yàn)步驟準(zhǔn)備包含多種模式的測(cè)試文本分別使用六個(gè)函數(shù)處理相同文本對(duì)比不同函數(shù)的返回結(jié)果練習(xí)group()方法的使用總結(jié)各函數(shù)的適用場(chǎng)景示例代碼:
importre
text="自然語言處理是研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。"
#使用match函數(shù)
result1=re.match('自然語言處理',text)
#使用search函數(shù)
result2=re.search('通信',text)
#使用findall函數(shù)
result3=re.findall('語言',text)實(shí)驗(yàn)二:元字符應(yīng)用練習(xí)實(shí)驗(yàn)?zāi)康恼莆樟吭~、字符類、錨點(diǎn)等元字符的使用學(xué)會(huì)構(gòu)建復(fù)雜的正則表達(dá)式模式理解貪婪匹配與非貪婪匹配的區(qū)別實(shí)驗(yàn)內(nèi)容量詞元字符的實(shí)際應(yīng)用字符類元字符的靈活使用錨點(diǎn)和邊界的精確定位特殊字符的轉(zhuǎn)義處理實(shí)驗(yàn)三:數(shù)據(jù)驗(yàn)證與信息提取實(shí)驗(yàn)?zāi)康膶W(xué)會(huì)使用正則表達(dá)式進(jìn)行數(shù)據(jù)格式驗(yàn)證掌握從復(fù)雜文本中提取特定信息的方法應(yīng)用正則表達(dá)式解決實(shí)際問題實(shí)驗(yàn)內(nèi)容驗(yàn)證郵箱地址、電話號(hào)碼、日期格式從文本中提取姓名、性別、年齡等信息清洗和過濾文本中的特殊字符處理HTML標(biāo)簽和網(wǎng)頁(yè)內(nèi)容評(píng)價(jià)標(biāo)準(zhǔn)正則表達(dá)式語法正確性(30%)匹配結(jié)果準(zhǔn)確性(35%)代碼效率和規(guī)范性(20%)問題解決創(chuàng)新性(15%)8.課后作業(yè)與拓展理論鞏固作業(yè)完成課后選擇題(1-5題)總結(jié)六個(gè)主要正則表達(dá)式函數(shù)的特點(diǎn)和用法整理常用元字符的含義和應(yīng)用場(chǎng)景設(shè)計(jì)5個(gè)不同類型的正則表達(dá)式驗(yàn)證模式實(shí)踐編程任務(wù)編寫一個(gè)通用的數(shù)據(jù)驗(yàn)證函數(shù),支持多種格式驗(yàn)證實(shí)現(xiàn)一個(gè)文本清洗工具,能夠過濾各類特殊字符開發(fā)一個(gè)信息提取器,從簡(jiǎn)歷文本中提取關(guān)鍵信息構(gòu)建一個(gè)網(wǎng)頁(yè)內(nèi)容提取器,去除HTML標(biāo)簽保留純文本拓展閱讀材料《精通正則表達(dá)式》第3版相關(guān)章節(jié)Python官方文檔re模塊詳細(xì)說明正則表達(dá)式性能優(yōu)化最佳實(shí)踐復(fù)雜文本處理案例研究思考討論題正則表達(dá)式相比其他文本處理方法有哪些優(yōu)勢(shì)和局限性?如何在保證匹配準(zhǔn)確性的同時(shí)提高正則表達(dá)式的執(zhí)行效率?在什么情況下應(yīng)該選擇正則表達(dá)式,什么情況下應(yīng)該使用其他方法?如何設(shè)計(jì)一個(gè)可維護(hù)、可擴(kuò)展的正則表達(dá)式庫(kù)?9.教學(xué)評(píng)價(jià)過程評(píng)價(jià)課堂參與(20%):回答問題和討論的積極性實(shí)驗(yàn)操作(40%):正則表達(dá)式編寫和調(diào)試能力問題解決(25%):面對(duì)復(fù)雜問題的分析能力創(chuàng)新思維(15%):提出新穎解決方案的能力結(jié)果評(píng)價(jià)理論掌握(25%):元字符和函數(shù)概念理解技能應(yīng)用(45%):正則表達(dá)式實(shí)際應(yīng)用能力代碼質(zhì)量(20%):代碼規(guī)范性和效率綜合應(yīng)用(10%):解決復(fù)雜問題的綜合能力評(píng)價(jià)標(biāo)準(zhǔn)優(yōu)秀(90-100分):熟練掌握所有元字符,能夠構(gòu)建復(fù)雜正則表達(dá)式,解決實(shí)際問題良好(80-89分):掌握基本元字符,能夠編寫常用正則表達(dá)式,完成大部分任務(wù)中等(70-79分):理解基本概念,能夠使用簡(jiǎn)單正則表達(dá)式,需要指導(dǎo)完成復(fù)雜任務(wù)及格(60-69分):了解基本用法,在幫助下能夠完成簡(jiǎn)單任務(wù),需要加強(qiáng)練習(xí)學(xué)習(xí)建議正則表達(dá)式的學(xué)習(xí)需要大量練習(xí),建議學(xué)生:多使用在線正則表達(dá)式測(cè)試工具驗(yàn)證理解收集并練習(xí)常見的正則表達(dá)式模式注意總結(jié)元字符的組合規(guī)律在實(shí)際項(xiàng)目中積極應(yīng)用所學(xué)知識(shí)10.教學(xué)反思教學(xué)效果自評(píng)學(xué)生對(duì)正則表達(dá)式概念的理解程度元字符掌握的熟練度和應(yīng)用能力復(fù)雜正則表達(dá)式構(gòu)建的成功率實(shí)際問題解決的效果和創(chuàng)新性學(xué)生反饋記錄收集學(xué)生對(duì)元字符學(xué)習(xí)難度的反饋了解學(xué)生對(duì)實(shí)驗(yàn)設(shè)計(jì)的建議記錄學(xué)生在正則表達(dá)式構(gòu)建中的常見錯(cuò)誤評(píng)估學(xué)生對(duì)理論與實(shí)踐結(jié)合的滿意度改進(jìn)措施增加更多可視化工具幫助理解抽象概念設(shè)計(jì)更多層次化的練習(xí)題滿足不同水平需求加強(qiáng)錯(cuò)誤診斷和糾正的教學(xué)環(huán)節(jié)補(bǔ)充更多實(shí)際應(yīng)用場(chǎng)景的案例下次授課調(diào)整建議增加正則表達(dá)式性能優(yōu)化的內(nèi)容提供更多在線練習(xí)資源和工具推薦加強(qiáng)與后續(xù)章節(jié)的知識(shí)銜接設(shè)計(jì)更多協(xié)作式學(xué)習(xí)活動(dòng)11.教學(xué)資源教材和參考書目主教材:《Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn)》第二版,肖剛張良均,人民郵電出版社參考書:《精通正則表達(dá)式》第3版JeffreyE.F.Friedl《Python正則表達(dá)式深入淺出》《自然語言處理實(shí)戰(zhàn)》相關(guān)章節(jié)在線資源鏈接Python官方文檔re模塊:/3/library/re.html正則表達(dá)式在線測(cè)試:/正則表達(dá)式可視化:/常用正則表達(dá)式大全:/any86/any-rule開發(fā)環(huán)境和工具必需軟件:Python3.11+,re模塊(內(nèi)置)推薦IDE:JupyterNotebook,PyCharm,VSCode在線工具:regex101,regexpal,regexr可視化工具:regexper,regulex常用正則表達(dá)式參考表元字符含義示例匹配結(jié)果.匹配任意單個(gè)字符a.cabc,aXc,a1c*匹配前一個(gè)字符0次或多次ab*cac,abc,abbc+匹配前一個(gè)字符1次或多次ab+cabc,abbc,abbbc?匹配前一個(gè)字符0次或1次ab?cac,abc\d匹配任意數(shù)字\d{3}123,456,789\w匹配字母、數(shù)字、下劃線\w+hello,test123,user_id\s匹配空白字符\s+空格,制表符,換行符^匹配字符串開頭^hellohelloworld$匹配字符串結(jié)尾world$helloworld示例代碼庫(kù)基礎(chǔ)練習(xí):六
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年社區(qū)心理健康服務(wù)與心理健康產(chǎn)業(yè)投資分析報(bào)告
- 高校產(chǎn)學(xué)研一體化模式下2025年產(chǎn)業(yè)技術(shù)創(chuàng)新與人才培養(yǎng)綜合評(píng)估報(bào)告
- 2025年能源行業(yè)儲(chǔ)能技術(shù)多元化在儲(chǔ)能電站儲(chǔ)能系統(tǒng)優(yōu)化報(bào)告
- 審計(jì)機(jī)關(guān)建設(shè)方案(3篇)
- 吊籠施工管理辦法
- 吸煙次數(shù)管理辦法
- 哈密輔警管理辦法
- 商業(yè)保險(xiǎn)管理辦法
- 商務(wù)秘書管理辦法
- 商場(chǎng)后期管理辦法
- 2025年華僑港澳臺(tái)學(xué)生聯(lián)招考試英語試卷試題(含答案詳解)
- 《晚期腎癌新視點(diǎn)》課件
- 2024-2030年中國(guó)白糖行業(yè)市場(chǎng)運(yùn)行狀況及發(fā)展規(guī)模預(yù)測(cè)報(bào)告
- 法務(wù)崗位招聘筆試題與參考答案
- 安全專題課件教學(xué)課件
- 2024自制抱桿起重吊裝方案的安全規(guī)定
- 成功食品庫(kù)房規(guī)劃方案
- 三年級(jí)下冊(cè)口算題大全(可打印版)
- 生態(tài)養(yǎng)生養(yǎng)老綜合示范區(qū)建設(shè)項(xiàng)目投資可研報(bào)告
- 四川省瀘州市2024年七年級(jí)下學(xué)期數(shù)學(xué)期末考試試卷附答案
- JT-T 1495-2024 公路水運(yùn)危險(xiǎn)性較大工程專項(xiàng)施工方案編制審查規(guī)程
評(píng)論
0/150
提交評(píng)論