Python中文自然語言處理基礎(chǔ)與實戰(zhàn)(第2版)(微課版)-教學(xué)進度表_第1頁
Python中文自然語言處理基礎(chǔ)與實戰(zhàn)(第2版)(微課版)-教學(xué)進度表_第2頁
Python中文自然語言處理基礎(chǔ)與實戰(zhàn)(第2版)(微課版)-教學(xué)進度表_第3頁
Python中文自然語言處理基礎(chǔ)與實戰(zhàn)(第2版)(微課版)-教學(xué)進度表_第4頁
Python中文自然語言處理基礎(chǔ)與實戰(zhàn)(第2版)(微課版)-教學(xué)進度表_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

學(xué)院課程教學(xué)進度計劃表(20~20學(xué)年第二學(xué)期) 課程名稱Python中文自然語言處理基礎(chǔ)與實戰(zhàn) 授課學(xué)時64 參與教學(xué)教師 授課班級/人數(shù) 專業(yè)(教研室) 填表時間教務(wù)處編印年月一、課程教學(xué)目標總體目標本課程采用"四階段遞進式"教學(xué)模式,通過基礎(chǔ)入門→核心技術(shù)→高級應(yīng)用→前沿技術(shù)的學(xué)習(xí)路徑,培養(yǎng)學(xué)生成為具備中文自然語言處理核心技能的復(fù)合型人才。課程以項目驅(qū)動教學(xué),每個階段配備相應(yīng)的實戰(zhàn)項目,確保學(xué)生能夠?qū)⒗碚撝R轉(zhuǎn)化為實際應(yīng)用能力。核心能力培養(yǎng)技術(shù)能力培養(yǎng):掌握Python中文NLP全棧技術(shù),具備獨立開發(fā)NLP應(yīng)用的能力實踐項目驅(qū)動:完成6個遞進式項目,從基礎(chǔ)工具到智能系統(tǒng)的全面實戰(zhàn)前沿技術(shù)跟蹤:接觸大語言模型等前沿技術(shù),緊跟行業(yè)發(fā)展趨勢分階段學(xué)習(xí)目標第一階段:基礎(chǔ)入門(第1-4周)環(huán)境配置與工具使用:熟練配置PythonNLP開發(fā)環(huán)境,掌握Anaconda、Jupyter等工具語料庫構(gòu)建技能:學(xué)會網(wǎng)絡(luò)爬蟲、數(shù)據(jù)清洗、語料標注等基礎(chǔ)技能正則表達式應(yīng)用:掌握文本預(yù)處理、信息提取的核心技術(shù)實戰(zhàn)項目:完成語料庫構(gòu)建項目和信息提取工具開發(fā)第二階段:核心技術(shù)(第5-10周)分詞與標注技術(shù):掌握HMM、CRF等核心算法,實現(xiàn)高精度分詞標注系統(tǒng)關(guān)鍵詞提取算法:熟練運用TF-IDF、TextRank、LDA等算法文本向量化技術(shù):深入理解Word2Vec、Doc2Vec模型原理與應(yīng)用實戰(zhàn)項目:開發(fā)多算法分詞工具和關(guān)鍵詞提取系統(tǒng)第三階段:高級應(yīng)用(第11-14周)文本挖掘技術(shù):掌握文本分類、聚類、情感分析等高級應(yīng)用深度學(xué)習(xí)方法:理解RNN、LSTM、Seq2Seq等神經(jīng)網(wǎng)絡(luò)模型模型優(yōu)化調(diào)參:學(xué)會超參數(shù)調(diào)優(yōu)、模型評估與選擇實戰(zhàn)項目:完成情感分析系統(tǒng)和深度學(xué)習(xí)文本分類項目第四階段:前沿技術(shù)(第15-17周)智能問答系統(tǒng):掌握檢索式和生成式問答系統(tǒng)設(shè)計原理大語言模型應(yīng)用:學(xué)會調(diào)用和應(yīng)用中文大模型APIPrompt工程技巧:掌握提示詞設(shè)計和模型調(diào)優(yōu)技術(shù)綜合項目:開發(fā)完整的智能問答或?qū)懽髦窒到y(tǒng)職業(yè)能力目標算法工程師能力:具備設(shè)計和優(yōu)化NLP算法的能力,能夠根據(jù)業(yè)務(wù)需求選擇合適的技術(shù)方案產(chǎn)品開發(fā)能力:能夠獨立完成從需求分析到系統(tǒng)部署的完整NLP產(chǎn)品開發(fā)流程技術(shù)創(chuàng)新能力:具備跟蹤前沿技術(shù)、持續(xù)學(xué)習(xí)的能力,為未來研究生學(xué)習(xí)或工作打下堅實基礎(chǔ)團隊協(xié)作能力:通過項目合作培養(yǎng)溝通協(xié)調(diào)、文檔撰寫、技術(shù)分享等軟技能二、教學(xué)方法與實施策略創(chuàng)新教學(xué)模式:PIDC四維教學(xué)法Project-Driven(項目驅(qū)動):6個遞進式項目貫穿整個課程,從簡單工具到復(fù)雜系統(tǒng)InteractiveLearning(互動學(xué)習(xí)):課堂討論、代碼審查、同伴評議等多種互動形式DeepThinking(深度思考):算法對比分析、方法優(yōu)缺點評估、創(chuàng)新應(yīng)用設(shè)計ContinuousPractice(持續(xù)實踐):每周編程作業(yè)、階段性項目、期末綜合應(yīng)用分層次教學(xué)策略理論教學(xué)(概念引導(dǎo)式)案例導(dǎo)入:每個新概念都從實際應(yīng)用案例開始,如"微博情感分析如何影響股價預(yù)測"原理透析:通過可視化圖表、動畫演示等方式深入淺出地解釋算法原理對比分析:橫向比較不同算法的優(yōu)缺點,培養(yǎng)學(xué)生的批判性思維前沿追蹤:介紹最新技術(shù)發(fā)展,如GPT、BERT等模型的演進歷程實踐教學(xué)(技能導(dǎo)向式)漸進式編程:從簡單的函數(shù)實現(xiàn)到完整系統(tǒng)開發(fā),逐步提升編程復(fù)雜度多平臺實踐:結(jié)合JupyterNotebook、PyCharm、TipDM等多種開發(fā)環(huán)境真實數(shù)據(jù)應(yīng)用:使用企業(yè)級數(shù)據(jù)集,模擬真實工作場景性能調(diào)優(yōu)訓(xùn)練:通過參數(shù)調(diào)整、模型優(yōu)化等提升系統(tǒng)性能協(xié)作學(xué)習(xí)(團隊合作式)小組項目開發(fā):3-4人小組完成大型項目,培養(yǎng)團隊協(xié)作能力代碼評審機制:學(xué)生互相評審代碼,提升代碼質(zhì)量和規(guī)范意識技術(shù)分享會:學(xué)生輪流分享項目經(jīng)驗和技術(shù)心得答疑互助:建立學(xué)習(xí)小組,鼓勵學(xué)生互相幫助解決問題教學(xué)資源與技術(shù)支持硬件資源:提供GPU服務(wù)器支持深度學(xué)習(xí)模型訓(xùn)練,確保實驗教學(xué)效果軟件環(huán)境:統(tǒng)一配置Anaconda環(huán)境,提供常用NLP庫和工具包數(shù)據(jù)資源:建立涵蓋新聞、評論、社交媒體等多領(lǐng)域的中文語料庫在線平臺:利用JupyterHub、GitHub等工具實現(xiàn)代碼管理和作業(yè)提交企業(yè)合作:邀請行業(yè)專家開展講座,提供實習(xí)和就業(yè)機會三、課程考核與評價體系綜合評價模式:多維度全過程考核本課程突破傳統(tǒng)的"一考定成績"模式,建立多元化、過程性、能力導(dǎo)向的評價體系,全面評估學(xué)生的理論掌握、實踐能力和創(chuàng)新思維。評價維度權(quán)重占比評價內(nèi)容評價方式評價頻次平時作業(yè)15%每周編程練習(xí)、算法實現(xiàn)、理論分析在線提交+自動評測每周1次實驗項目25%6個階段性項目的完成質(zhì)量與創(chuàng)新程度項目報告+代碼審查+現(xiàn)場演示每4-6周1次課堂表現(xiàn)10%出勤率、討論參與、互動質(zhì)量過程性觀察+同伴評價每次課期末考核50%綜合理論知識+項目答辯開卷考試(30%)+項目答辯(20%)期末1次各項考核詳細說明平時作業(yè)(15%)理論作業(yè):選擇題、簡答題、算法分析題,鞏固基礎(chǔ)知識編程作業(yè):函數(shù)實現(xiàn)、算法優(yōu)化、性能測試,提升編程能力調(diào)研作業(yè):技術(shù)調(diào)研、方法對比、應(yīng)用案例分析,拓展視野評分標準:準確性(40%)+完整性(30%)+及時性(20%)+創(chuàng)新性(10%)實驗項目(25%)項目一:語料庫構(gòu)建與管理系統(tǒng)項目二:多功能信息提取工具項目三:智能中文分詞系統(tǒng)項目四:多算法關(guān)鍵詞提取平臺項目五:情感分析與文本分類系統(tǒng)項目六:智能問答或?qū)懽髦郑ㄆ谀╉椖浚┰u分維度:功能完整性(30%)+代碼質(zhì)量(25%)+創(chuàng)新性(20%)+文檔完善度(15%)+演示效果(10%)課堂表現(xiàn)(10%)出勤考核:出勤率、遲到早退情況參與度評價:課堂討論發(fā)言次數(shù)和質(zhì)量互動表現(xiàn):提問質(zhì)量、回答問題準確性協(xié)作能力:小組合作中的貢獻度和配合度期末考核(50%)理論考試(30%):采用開卷考試形式,允許查閱資料和使用工具基礎(chǔ)理論(30%):概念理解、算法原理、方法對比技術(shù)應(yīng)用(40%):代碼分析、算法設(shè)計、問題解決綜合分析(30%):案例分析、系統(tǒng)設(shè)計、創(chuàng)新應(yīng)用項目答辯(20%):期末項目展示:系統(tǒng)演示、功能介紹、技術(shù)說明技術(shù)問答:算法原理、實現(xiàn)細節(jié)、優(yōu)化方案創(chuàng)新評價:技術(shù)創(chuàng)新點、應(yīng)用價值、發(fā)展前景特色評價機制成長檔案記錄:跟蹤學(xué)生整個學(xué)習(xí)過程,記錄技能提升軌跡同伴互評機制:學(xué)生互相評價項目和代碼,培養(yǎng)協(xié)作精神企業(yè)導(dǎo)師評價:邀請行業(yè)專家參與項目評審,提供專業(yè)建議創(chuàng)新加分政策:鼓勵學(xué)生參與競賽、發(fā)表論文、開源貢獻等補救機制:為學(xué)習(xí)困難學(xué)生提供額外輔導(dǎo)和補考機會《Python中文自然語言處理基礎(chǔ)與實戰(zhàn)》教學(xué)日歷課程性質(zhì):專業(yè)選修課總學(xué)時:64學(xué)時學(xué)分:4學(xué)分教材:肖剛,張良均.Python中文自然語言處理入門與實戰(zhàn)(第二版).北京:人民郵電出版社.2025第一階段:基礎(chǔ)入門(第1-4周,16學(xué)時)課次學(xué)時課型授課內(nèi)容作業(yè)要求評估方式12理論第1章緒論

?NLP概述與發(fā)展歷程

?中文NLP特點與挑戰(zhàn)

?開發(fā)環(huán)境介紹完成課后習(xí)題1-5題

調(diào)研3個NLP應(yīng)用實例課堂測試22理實環(huán)境配置實戰(zhàn)

?Anaconda安裝與配置

?Python環(huán)境設(shè)置

?詞云圖制作入門生成3個不同主題的詞云圖

提交環(huán)境配置截圖實驗報告32理論第2章語料庫基礎(chǔ)

?語料庫概念與分類

?語料庫構(gòu)建原則

?常用中文語料庫介紹完成課后習(xí)題1-5題

調(diào)研并比較2個開源語料庫課堂討論42理實+實踐語料獲取實踐

?網(wǎng)絡(luò)爬蟲基礎(chǔ)

?語料清洗方法

?在線語料獲取爬取指定網(wǎng)站文本數(shù)據(jù)

形成標準格式語料代碼審查52實踐語料庫構(gòu)建項目

?電影評論語料分析

?語料標注與管理

?數(shù)據(jù)質(zhì)量評估項目一:構(gòu)建新聞?wù)Z料庫

(≥100篇,含分類標簽)項目展示62理論第3章正則表達式

?正則表達式語法規(guī)則

?Pythonre模塊詳解

?常用模式與技巧完成課后習(xí)題1-8題

總結(jié)10個常用正則模式在線測試72理實+實踐正則實踐應(yīng)用

?文本清洗與預(yù)處理

?信息提取技術(shù)

?模式匹配優(yōu)化設(shè)計8個驗證模式

(郵箱、電話、身份證等)代碼測試82實踐信息提取綜合實戰(zhàn)

?簡歷信息提取器

?文本格式化處理

?提取準確率評估項目二:開發(fā)信息提取工具

支持多種數(shù)據(jù)格式功能演示第二階段:核心技術(shù)(第5-10周,24學(xué)時)課次學(xué)時課型授課內(nèi)容作業(yè)要求評估方式92理論第4章中文分詞基礎(chǔ)

?中文分詞原理與難點

?基于規(guī)則的分詞方法

?基于統(tǒng)計的分詞算法完成課后理論題

分析3種分詞方法優(yōu)缺點期中測試102理實+實踐分詞算法實現(xiàn)

?HMM模型原理與實現(xiàn)

?維特比算法詳解

?分詞效果評估實現(xiàn)簡單HMM分詞器

對比不同算法效果算法實現(xiàn)112實踐jieba分詞深入應(yīng)用

?jieba庫高級功能

?自定義詞典構(gòu)建

?分詞系統(tǒng)優(yōu)化項目三:多算法分詞工具

支持用戶詞典擴展系統(tǒng)測試122理論第5章詞性標注與NER

?詞性標注體系與方法

?命名實體識別原理

?CRF模型基礎(chǔ)完成課后習(xí)題

整理中文詞性標注規(guī)范課堂討論132理實+實踐標注技術(shù)實踐

?jieba詞性標注應(yīng)用

?HMM標注實現(xiàn)

?標注準確率評估實現(xiàn)HMM詞性標注器

評估標注效果實驗報告142實踐NER系統(tǒng)構(gòu)建

?CRF特征工程

?命名實體識別實踐

?實體鏈接技術(shù)擴展CRF特征集

提升NERF1值≥85%性能評估152理論第6章關(guān)鍵詞提取

?TF-IDF算法原理

?TextRank圖模型

?評估指標與方法完成課后習(xí)題1-5題

對比分析兩種算法差異理論考核162理實+實踐統(tǒng)計方法實踐

?TF-IDF算法實現(xiàn)

?LSA與LDA主題模型

?語義關(guān)鍵詞提取實現(xiàn)TF-IDF提取器

比較LSA和LDA效果算法對比172實踐圖模型算法應(yīng)用

?TextRank算法實現(xiàn)

?圖構(gòu)建策略優(yōu)化

?關(guān)鍵詞質(zhì)量評估項目四:多算法關(guān)鍵詞提取

支持不同領(lǐng)域文本項目答辯182理論第7章文本向量化

?詞向量模型發(fā)展歷程

?Word2Vec原理詳解

?CBOWvsSkip-Gram完成課后理論與實踐題

分析兩種模型結(jié)構(gòu)差異概念理解192理實+實踐詞向量模型訓(xùn)練

?Word2Vec模型訓(xùn)練

?詞向量質(zhì)量評估

?詞匯相似度計算訓(xùn)練領(lǐng)域詞向量模型

驗證詞向量質(zhì)量模型評估202實踐文檔向量化實現(xiàn)

?Doc2Vec模型應(yīng)用

?DMvsDBOW比較

?文本相似度計算實現(xiàn)文檔相似度系統(tǒng)

對比不同向量化方法系統(tǒng)演示第三階段:高級應(yīng)用(第11-14周,16學(xué)時)課次學(xué)時課型授課內(nèi)容作業(yè)要求評估方式212理論第8章文本分類與聚類

?文本挖掘概述

?分類算法比較

?聚類算法原理完成課后習(xí)題1-5題

分析三種分類算法特點算法分析222實踐分類聚類項目實戰(zhàn)

?垃圾短信分類

?新聞文本聚類

?模型性能優(yōu)化多算法分類對比實驗

K-means參數(shù)調(diào)優(yōu)實驗對比232理論第9章文本情感分析

?情感分析概述與分類

?詞典方法vs機器學(xué)習(xí)

?深度學(xué)習(xí)情感分析完成課后習(xí)題1-5題

對比三種方法優(yōu)缺點方法比較242實踐情感分析系統(tǒng)開發(fā)

?基于詞典的情感分析

?機器學(xué)習(xí)情感分類

?跨域情感分析項目五:多方法情感分析

在不同數(shù)據(jù)集上測試項目評估252理論第10章深度學(xué)習(xí)基礎(chǔ)

?RNN網(wǎng)絡(luò)結(jié)構(gòu)

?LSTM與GRU對比

?Seq2Seq模型架構(gòu)完成課后習(xí)題1-5題

繪制LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖結(jié)構(gòu)理解262理實+實踐深度學(xué)習(xí)框架應(yīng)用

?TensorFlow/PyTorch入門

?LSTM文本分類

?注意力機制實現(xiàn)調(diào)整LSTM超參數(shù)

比較不同配置效果參數(shù)調(diào)優(yōu)272實踐深度學(xué)習(xí)綜合實戰(zhàn)

?LSTM情感分析

?Seq2Seq機器翻譯

?GRU性能對比實現(xiàn)GRU模型

與LSTM性能對比分析模型對比282理論第11章智能問答系統(tǒng)

?問答系統(tǒng)架構(gòu)設(shè)計

?檢索式vs生成式

?多輪對話管理設(shè)計問答系統(tǒng)架構(gòu)

分析核心技術(shù)組件架構(gòu)設(shè)計第四階段:前沿技術(shù)(第14-17周,8學(xué)時)課次學(xué)時課型授課內(nèi)容作業(yè)要求評估方式292實踐問答系統(tǒng)開發(fā)實戰(zhàn)

?數(shù)據(jù)預(yù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論