Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)(第2版)(微課版)-課程大綱、授課計(jì)劃_第1頁(yè)
Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)(第2版)(微課版)-課程大綱、授課計(jì)劃_第2頁(yè)
Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)(第2版)(微課版)-課程大綱、授課計(jì)劃_第3頁(yè)
Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)(第2版)(微課版)-課程大綱、授課計(jì)劃_第4頁(yè)
Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)(第2版)(微課版)-課程大綱、授課計(jì)劃_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)》(第二版)課程大綱課程編碼課程類(lèi)別選修課程名稱Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)英文名稱FundamentalsandpracticeofChinesenaturallanguageprocessinginPython學(xué)分4建議修讀學(xué)期7總學(xué)時(shí)數(shù)64其中:實(shí)踐學(xué)時(shí)32預(yù)修課程高等數(shù)學(xué)、線性代數(shù)、概率統(tǒng)計(jì)、Python程序設(shè)計(jì)、數(shù)據(jù)挖掘考核方式考察適用專業(yè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)大綱編寫(xiě)組大綱審核人一、課程目標(biāo)1.知識(shí)與技能(支撐畢業(yè)要求:工程知識(shí)、問(wèn)題分析)。通過(guò)學(xué)習(xí),掌握自然語(yǔ)言處理的基本流程、基本知識(shí)和基本性質(zhì)。通過(guò)案例實(shí)踐掌握對(duì)完成自然語(yǔ)言處理任務(wù)所必須的各項(xiàng)技能。2.過(guò)程與方法(支撐畢業(yè)要求:設(shè)計(jì)/開(kāi)發(fā)解決方案、使用現(xiàn)代工具)。通過(guò)學(xué)習(xí),認(rèn)識(shí)自然語(yǔ)言處理的建模和算法過(guò)程,并學(xué)會(huì)運(yùn)用現(xiàn)代信息技術(shù)獲取相關(guān)信息以及解決自然語(yǔ)言處理問(wèn)題的方法等。3.情感·態(tài)度·價(jià)值觀(支撐畢業(yè)要求:個(gè)人和團(tuán)隊(duì)、終身學(xué)習(xí)、職業(yè)道德)。通過(guò)學(xué)習(xí),養(yǎng)成良好的自主學(xué)習(xí)習(xí)慣,具有吃苦耐勞的態(tài)度;在學(xué)習(xí)交流中能表現(xiàn)出團(tuán)隊(duì)協(xié)作能力。二、課程目標(biāo)與畢業(yè)要求的對(duì)應(yīng)關(guān)系畢業(yè)要求指標(biāo)點(diǎn)權(quán)重課程目標(biāo)工程知識(shí)1指標(biāo)1-1:熟悉數(shù)學(xué)和數(shù)據(jù)科學(xué)基礎(chǔ)知識(shí),具有解決數(shù)據(jù)科學(xué)問(wèn)題的基本能力。0.1知識(shí)與技能指標(biāo)1-2:具有解決大數(shù)據(jù)、人工智能問(wèn)題的能力。0.1知識(shí)與技能問(wèn)題分析2指標(biāo)2-1:具有基本的研究能力,能夠基于問(wèn)題的性質(zhì)進(jìn)行科學(xué)的分析,并采用科學(xué)的方法對(duì)工程問(wèn)題進(jìn)行研究。0.1知識(shí)與技能指標(biāo)2-2:能夠通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證工程問(wèn)題,能夠?qū)?shí)驗(yàn)數(shù)據(jù)進(jìn)行分析并得出適當(dāng)?shù)慕Y(jié)論。0.1知識(shí)與技能設(shè)計(jì)/開(kāi)發(fā)解決方案3指標(biāo)3-1:能夠設(shè)計(jì)針對(duì)大數(shù)據(jù)工程問(wèn)題的解決方案,設(shè)計(jì)滿足特定需求的系統(tǒng)。0.1過(guò)程與方法使用現(xiàn)代工具4指標(biāo)4-1:具有使用現(xiàn)代大數(shù)據(jù)工具和信息技術(shù)工具的技能。0.1過(guò)程與方法指標(biāo)4-2:具有對(duì)大數(shù)據(jù)工程問(wèn)題進(jìn)行預(yù)測(cè)與模擬的能力。0.1過(guò)程與方法個(gè)人和團(tuán)隊(duì)5指標(biāo)5-1:具有較強(qiáng)的工程實(shí)踐能力。0.1情感?態(tài)度?價(jià)值觀指標(biāo)5-2:具有團(tuán)隊(duì)協(xié)作能力,能夠就工程問(wèn)題進(jìn)行有效溝通和交流。0.1情感?態(tài)度?價(jià)值觀終身學(xué)習(xí)7指標(biāo)7-1:具有自主學(xué)習(xí)的意識(shí)和較強(qiáng)的終身學(xué)習(xí)的意識(shí)。0.05情感?態(tài)度?價(jià)值觀職業(yè)道德8指標(biāo)8-2:能夠在工程實(shí)踐中理解并遵守工程職業(yè)道德和規(guī)范,履行責(zé)任。0.05情感?態(tài)度?價(jià)值觀三、教學(xué)內(nèi)容、重難點(diǎn)和課時(shí)安排章重難點(diǎn)內(nèi)容課程目標(biāo)學(xué)時(shí)第1章緒論※1.1NLP的基本概念

1.2NLP的發(fā)展歷程

1.3NLP的研究?jī)?nèi)容

1.4NLP的幾個(gè)應(yīng)用場(chǎng)景

1.5NLP的研究現(xiàn)狀

1.6學(xué)習(xí)NLP的困難

1.7NLP基本流程

1.8NLP的開(kāi)發(fā)環(huán)境配置(Python)知識(shí)

技能4第2章語(yǔ)料庫(kù)※2.1語(yǔ)料庫(kù)概述

2.2語(yǔ)料庫(kù)種類(lèi)與原則

2.3NLTK庫(kù)

2.4獲取語(yǔ)料庫(kù)

2.5實(shí)戰(zhàn)之構(gòu)建語(yǔ)料庫(kù)與語(yǔ)料操作知識(shí)

技能

過(guò)程與方法6第3章正則表達(dá)式※3.1正則表達(dá)式

3.2正則表達(dá)式應(yīng)用知識(shí)

過(guò)程與方法6第4章中文分詞技術(shù)※4.1中文分詞簡(jiǎn)介

4.2基于規(guī)則的分詞

4.3基于統(tǒng)計(jì)的分詞

4.4中文分詞工具jieba庫(kù)

4.5中文分詞的應(yīng)用知識(shí)

技能

過(guò)程與方法6第5章詞性標(biāo)注與命名實(shí)體識(shí)別※5.1詞性標(biāo)注

5.2命名實(shí)體識(shí)別

5.3中文命名實(shí)體識(shí)別知識(shí)

技能

過(guò)程與方法6第6章關(guān)鍵詞提取※6.1關(guān)鍵詞提取技術(shù)簡(jiǎn)介

6.2關(guān)鍵詞提取算法

6.3實(shí)戰(zhàn)之提取文本關(guān)鍵詞知識(shí)

技能

過(guò)程與方法6第7章文本向量化※7.1文本向量化概述

7.2文本離散表示

7.3分布式表示-Word2Vec

7.4分布式表示-Doc2Vec

7.5實(shí)戰(zhàn)之論文相似度計(jì)算知識(shí)

技能

過(guò)程與方法6第8章文本分類(lèi)與聚類(lèi)※8.1文本挖掘簡(jiǎn)介

8.2分類(lèi)算法

8.3聚類(lèi)算法

8.4文本分類(lèi)與聚類(lèi)的步驟

8.5分類(lèi)實(shí)戰(zhàn):垃圾短信分類(lèi)

8.6聚類(lèi)實(shí)戰(zhàn):新聞文本聚類(lèi)知識(shí)

技能

過(guò)程與方法4第9章文本情感分析※9.1情感分析簡(jiǎn)介

9.2情感分析的常用方法

9.3基于詞典的情感分析

9.4基于文本分類(lèi)的情感分析

9.5基于LDA模型的情感分析知識(shí)

技能

過(guò)程與方法4第10章NLP中的深度學(xué)習(xí)技術(shù)※10.1循環(huán)神經(jīng)網(wǎng)絡(luò)概述

10.2RNN結(jié)構(gòu)簡(jiǎn)介

10.3深度學(xué)習(xí)工具簡(jiǎn)介

10.4基于LSTM的文本分類(lèi)與情感分析

10.5基于Seq2Seq的機(jī)器翻譯知識(shí)

技能

過(guò)程與方法6第11章智能問(wèn)答系統(tǒng)※11.1問(wèn)答系統(tǒng)簡(jiǎn)介

11.2問(wèn)答系統(tǒng)的主要組成

11.3基于Seq2Seq的智能問(wèn)答系統(tǒng)知識(shí)

過(guò)程與方法4第12章大語(yǔ)言模型開(kāi)發(fā)應(yīng)用※12.1大語(yǔ)言模型概述與中文模型介紹

12.2訊飛星火模型與API調(diào)用方法

12.3API配置與基礎(chǔ)應(yīng)用實(shí)現(xiàn)

12.4高級(jí)應(yīng)用開(kāi)發(fā)與項(xiàng)目實(shí)戰(zhàn)知識(shí)

技能

過(guò)程與方法4第13章基于TipDM數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)垃圾短信識(shí)別※13.1TipDM平臺(tái)介紹與垃圾短信分類(lèi)流程設(shè)計(jì)

13.2平臺(tái)操作實(shí)踐與完整項(xiàng)目實(shí)現(xiàn)過(guò)程與方法2四、課程教學(xué)方法教學(xué)方法:講授法、案例教學(xué)法,實(shí)驗(yàn)法、探究法等,突出理論分析中學(xué)生的參與性,強(qiáng)調(diào)師生的共同探討與互動(dòng)。五、實(shí)踐教學(xué)安排章節(jié)講授實(shí)踐教學(xué)第1章緒論22第2章語(yǔ)料庫(kù)42第3章正則表達(dá)式33第4章中文分詞技術(shù)33第5章詞性標(biāo)注與命名實(shí)體識(shí)別33第6章關(guān)鍵詞提取算法33第7章文本向量化33第8章文本分類(lèi)與聚類(lèi)22第9章文本情感分析22第10章NLP中的深度學(xué)習(xí)技術(shù)33第11章智能問(wèn)答系統(tǒng)22第12章大語(yǔ)言模型開(kāi)發(fā)應(yīng)用22第13章基于TipDM數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)垃圾短信識(shí)別02合計(jì)3232六、課程教學(xué)評(píng)價(jià)課程教學(xué)目標(biāo)考核內(nèi)容評(píng)價(jià)依據(jù)知識(shí)與技能自然語(yǔ)言處理基礎(chǔ)、語(yǔ)料庫(kù)、詞性標(biāo)注與命名實(shí)體識(shí)別作業(yè)、實(shí)驗(yàn)過(guò)程與方法中文文本的預(yù)處理、中文分詞技術(shù)、關(guān)鍵詞提取算法、文本向量化、機(jī)器學(xué)習(xí)算法及其應(yīng)用、文本情感分析、基于深度學(xué)習(xí)的NLP作業(yè)、實(shí)驗(yàn)、小論文情感?態(tài)度?價(jià)值觀應(yīng)用案例作業(yè)、考勤七、成績(jī)?cè)u(píng)定方法本課程平時(shí)成績(jī)及期末成績(jī)占比分別為30%,70%,平時(shí)考核形式為考勤、作業(yè)、實(shí)驗(yàn),期末考核的形式為小論文。筆試相關(guān)試題占分比例%小設(shè)計(jì)報(bào)告占分比例%平時(shí)作業(yè)相關(guān)內(nèi)容占分比例%課程分目標(biāo)達(dá)成評(píng)價(jià)方法知識(shí)與技能106030分目標(biāo)達(dá)成度={0.15×(分目標(biāo)試題平均/分目標(biāo)試題總分)+0.7×(小設(shè)計(jì)分目標(biāo)平均成績(jī)/分目標(biāo)總分)+0.15×(分目標(biāo)平時(shí)成績(jī))}/分目標(biāo)總分)過(guò)程與方法106030情感?態(tài)度?價(jià)值觀106030八、課程學(xué)習(xí)資源1.選用教材教材名稱編者出版社出版時(shí)間是否馬工程教材是否國(guó)家、省規(guī)劃教材是否國(guó)外教材Python中文自然語(yǔ)言處理入門(mén)與實(shí)戰(zhàn)(第二版)肖剛,張良均人民郵電出版社2025年否是否2.主要參考書(shū)目[1]宗成慶,統(tǒng)計(jì)自然語(yǔ)言處理,清華大學(xué)出版社,北京,2013年[2]李航,統(tǒng)計(jì)學(xué)習(xí)方法,清華大學(xué)出版社,北京,2012年[3]張良均.Python與數(shù)據(jù)挖掘[M].北京:機(jī)械工業(yè)出版社.2016.[4]張良均,譚立云.Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第2版)[M].北京:機(jī)械工業(yè)出版社.2019.九、課程學(xué)習(xí)建議理論是基礎(chǔ),python語(yǔ)言編程是技能,完成案例項(xiàng)目是目標(biāo)。十、評(píng)分標(biāo)準(zhǔn)課程目標(biāo)評(píng)分標(biāo)準(zhǔn)90-100優(yōu)80-89良70-79中60-69及格0-59

不及格知識(shí)與技能完全掌握自然語(yǔ)言處理的基本流程、基本知識(shí)和基本性質(zhì)。完全掌握自然語(yǔ)言處理任務(wù)所必須的各項(xiàng)技能。較好掌握自然語(yǔ)言處理的基本流程、基本知識(shí)和基本性質(zhì)。較好掌握自然語(yǔ)言處理任務(wù)所必須的各項(xiàng)技能?;菊莆兆匀徽Z(yǔ)言處理的基本流程、基本知識(shí)和基本性質(zhì)。基本掌握自然語(yǔ)言處理任務(wù)所必須的各項(xiàng)技能。一般自然語(yǔ)言處理的基本流程、基本知識(shí)和基本性質(zhì)。一般掌握自然語(yǔ)言處理任務(wù)所必須的各項(xiàng)技能。不能掌握自然語(yǔ)言處理的基本流程、基本知識(shí)和基本性質(zhì)。不能掌握自然語(yǔ)言處理任務(wù)所必須的各項(xiàng)技能。過(guò)程與方法完全認(rèn)識(shí)自然語(yǔ)言處理的建模和算法過(guò)程,并學(xué)會(huì)運(yùn)用現(xiàn)代信息技術(shù)獲取相關(guān)信息以及解決自然語(yǔ)言處理問(wèn)題的方法較好認(rèn)識(shí)自然語(yǔ)言處理的建模和算法過(guò)程,并學(xué)會(huì)運(yùn)用現(xiàn)代信息技術(shù)獲取相關(guān)信息以及解決自然語(yǔ)言處理問(wèn)題的方法基本認(rèn)識(shí)自然語(yǔ)言處理的建模和算法過(guò)程,并學(xué)會(huì)運(yùn)用現(xiàn)代信息技術(shù)獲取相關(guān)信息以及解決自然語(yǔ)言處理問(wèn)題的方法一般認(rèn)識(shí)自然語(yǔ)言處理的建模和算法過(guò)程,并學(xué)會(huì)運(yùn)用現(xiàn)代信息技術(shù)獲取相關(guān)信息以及解決自然語(yǔ)言處理問(wèn)題的方法不能認(rèn)識(shí)自然語(yǔ)言處理的建模和算法過(guò)程,并學(xué)會(huì)運(yùn)用現(xiàn)代信息技術(shù)獲取相關(guān)信息以及解決自然語(yǔ)言處理問(wèn)題的方法情感?態(tài)度?價(jià)值觀通過(guò)學(xué)習(xí),完全養(yǎng)成良好的自主學(xué)習(xí)習(xí)慣,具有吃苦耐勞的態(tài)度;在學(xué)習(xí)交流中能表現(xiàn)出團(tuán)隊(duì)協(xié)作能力,并形成數(shù)據(jù)驅(qū)動(dòng)的科學(xué)價(jià)值觀。通過(guò)學(xué)習(xí),養(yǎng)成良好的自主學(xué)習(xí)習(xí)慣,具有吃苦耐勞的態(tài)度;在學(xué)習(xí)交流中能表現(xiàn)出團(tuán)隊(duì)協(xié)作能力,并形成數(shù)據(jù)驅(qū)動(dòng)的科學(xué)價(jià)值觀。通過(guò)學(xué)習(xí),基本養(yǎng)成良好的自主學(xué)習(xí)習(xí)慣,具有吃苦耐勞的態(tài)度;在學(xué)習(xí)交流中能表現(xiàn)出團(tuán)隊(duì)協(xié)作能力,并形成數(shù)據(jù)驅(qū)動(dòng)的科學(xué)價(jià)值觀。通過(guò)學(xué)習(xí),養(yǎng)成了自主學(xué)習(xí)習(xí)慣,具有吃苦耐勞的態(tài)度;在學(xué)習(xí)交流中能表現(xiàn)出團(tuán)隊(duì)協(xié)作能力,并形成數(shù)據(jù)驅(qū)動(dòng)的科學(xué)價(jià)值觀。通過(guò)學(xué)習(xí),尚未養(yǎng)成自主學(xué)習(xí)習(xí)慣,具有吃苦耐勞的態(tài)度;在學(xué)習(xí)交流中能表現(xiàn)出團(tuán)隊(duì)協(xié)作能力,并形成數(shù)據(jù)驅(qū)動(dòng)的科學(xué)價(jià)值觀。注:教材更新為肖剛,張良均.Python中文自然語(yǔ)言處理入門(mén)與實(shí)戰(zhàn)(第二版).北京:人民郵電出版社.2025.學(xué)院課程教學(xué)進(jìn)度計(jì)劃表(20~20學(xué)年第二學(xué)期) 課程名稱Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn) 授課學(xué)時(shí)64 參與教學(xué)教師 授課班級(jí)/人數(shù) 專業(yè)(教研室) 填表時(shí)間教務(wù)處編印年月一、課程教學(xué)目標(biāo)總體目標(biāo)本課程采用"四階段遞進(jìn)式"教學(xué)模式,通過(guò)基礎(chǔ)入門(mén)→核心技術(shù)→高級(jí)應(yīng)用→前沿技術(shù)的學(xué)習(xí)路徑,培養(yǎng)學(xué)生成為具備中文自然語(yǔ)言處理核心技能的復(fù)合型人才。課程以項(xiàng)目驅(qū)動(dòng)教學(xué),每個(gè)階段配備相應(yīng)的實(shí)戰(zhàn)項(xiàng)目,確保學(xué)生能夠?qū)⒗碚撝R(shí)轉(zhuǎn)化為實(shí)際應(yīng)用能力。核心能力培養(yǎng)技術(shù)能力培養(yǎng):掌握Python中文NLP全棧技術(shù),具備獨(dú)立開(kāi)發(fā)NLP應(yīng)用的能力實(shí)踐項(xiàng)目驅(qū)動(dòng):完成6個(gè)遞進(jìn)式項(xiàng)目,從基礎(chǔ)工具到智能系統(tǒng)的全面實(shí)戰(zhàn)前沿技術(shù)跟蹤:接觸大語(yǔ)言模型等前沿技術(shù),緊跟行業(yè)發(fā)展趨勢(shì)分階段學(xué)習(xí)目標(biāo)第一階段:基礎(chǔ)入門(mén)(第1-4周)環(huán)境配置與工具使用:熟練配置PythonNLP開(kāi)發(fā)環(huán)境,掌握Anaconda、Jupyter等工具語(yǔ)料庫(kù)構(gòu)建技能:學(xué)會(huì)網(wǎng)絡(luò)爬蟲(chóng)、數(shù)據(jù)清洗、語(yǔ)料標(biāo)注等基礎(chǔ)技能正則表達(dá)式應(yīng)用:掌握文本預(yù)處理、信息提取的核心技術(shù)實(shí)戰(zhàn)項(xiàng)目:完成語(yǔ)料庫(kù)構(gòu)建項(xiàng)目和信息提取工具開(kāi)發(fā)第二階段:核心技術(shù)(第5-10周)分詞與標(biāo)注技術(shù):掌握HMM、CRF等核心算法,實(shí)現(xiàn)高精度分詞標(biāo)注系統(tǒng)關(guān)鍵詞提取算法:熟練運(yùn)用TF-IDF、TextRank、LDA等算法文本向量化技術(shù):深入理解Word2Vec、Doc2Vec模型原理與應(yīng)用實(shí)戰(zhàn)項(xiàng)目:開(kāi)發(fā)多算法分詞工具和關(guān)鍵詞提取系統(tǒng)第三階段:高級(jí)應(yīng)用(第11-14周)文本挖掘技術(shù):掌握文本分類(lèi)、聚類(lèi)、情感分析等高級(jí)應(yīng)用深度學(xué)習(xí)方法:理解RNN、LSTM、Seq2Seq等神經(jīng)網(wǎng)絡(luò)模型模型優(yōu)化調(diào)參:學(xué)會(huì)超參數(shù)調(diào)優(yōu)、模型評(píng)估與選擇實(shí)戰(zhàn)項(xiàng)目:完成情感分析系統(tǒng)和深度學(xué)習(xí)文本分類(lèi)項(xiàng)目第四階段:前沿技術(shù)(第15-17周)智能問(wèn)答系統(tǒng):掌握檢索式和生成式問(wèn)答系統(tǒng)設(shè)計(jì)原理大語(yǔ)言模型應(yīng)用:學(xué)會(huì)調(diào)用和應(yīng)用中文大模型APIPrompt工程技巧:掌握提示詞設(shè)計(jì)和模型調(diào)優(yōu)技術(shù)綜合項(xiàng)目:開(kāi)發(fā)完整的智能問(wèn)答或?qū)懽髦窒到y(tǒng)職業(yè)能力目標(biāo)算法工程師能力:具備設(shè)計(jì)和優(yōu)化NLP算法的能力,能夠根據(jù)業(yè)務(wù)需求選擇合適的技術(shù)方案產(chǎn)品開(kāi)發(fā)能力:能夠獨(dú)立完成從需求分析到系統(tǒng)部署的完整NLP產(chǎn)品開(kāi)發(fā)流程技術(shù)創(chuàng)新能力:具備跟蹤前沿技術(shù)、持續(xù)學(xué)習(xí)的能力,為未來(lái)研究生學(xué)習(xí)或工作打下堅(jiān)實(shí)基礎(chǔ)團(tuán)隊(duì)協(xié)作能力:通過(guò)項(xiàng)目合作培養(yǎng)溝通協(xié)調(diào)、文檔撰寫(xiě)、技術(shù)分享等軟技能二、教學(xué)方法與實(shí)施策略創(chuàng)新教學(xué)模式:PIDC四維教學(xué)法Project-Driven(項(xiàng)目驅(qū)動(dòng)):6個(gè)遞進(jìn)式項(xiàng)目貫穿整個(gè)課程,從簡(jiǎn)單工具到復(fù)雜系統(tǒng)InteractiveLearning(互動(dòng)學(xué)習(xí)):課堂討論、代碼審查、同伴評(píng)議等多種互動(dòng)形式DeepThinking(深度思考):算法對(duì)比分析、方法優(yōu)缺點(diǎn)評(píng)估、創(chuàng)新應(yīng)用設(shè)計(jì)ContinuousPractice(持續(xù)實(shí)踐):每周編程作業(yè)、階段性項(xiàng)目、期末綜合應(yīng)用分層次教學(xué)策略理論教學(xué)(概念引導(dǎo)式)案例導(dǎo)入:每個(gè)新概念都從實(shí)際應(yīng)用案例開(kāi)始,如"微博情感分析如何影響股價(jià)預(yù)測(cè)"原理透析:通過(guò)可視化圖表、動(dòng)畫(huà)演示等方式深入淺出地解釋算法原理對(duì)比分析:橫向比較不同算法的優(yōu)缺點(diǎn),培養(yǎng)學(xué)生的批判性思維前沿追蹤:介紹最新技術(shù)發(fā)展,如GPT、BERT等模型的演進(jìn)歷程實(shí)踐教學(xué)(技能導(dǎo)向式)漸進(jìn)式編程:從簡(jiǎn)單的函數(shù)實(shí)現(xiàn)到完整系統(tǒng)開(kāi)發(fā),逐步提升編程復(fù)雜度多平臺(tái)實(shí)踐:結(jié)合JupyterNotebook、PyCharm、TipDM等多種開(kāi)發(fā)環(huán)境真實(shí)數(shù)據(jù)應(yīng)用:使用企業(yè)級(jí)數(shù)據(jù)集,模擬真實(shí)工作場(chǎng)景性能調(diào)優(yōu)訓(xùn)練:通過(guò)參數(shù)調(diào)整、模型優(yōu)化等提升系統(tǒng)性能協(xié)作學(xué)習(xí)(團(tuán)隊(duì)合作式)小組項(xiàng)目開(kāi)發(fā):3-4人小組完成大型項(xiàng)目,培養(yǎng)團(tuán)隊(duì)協(xié)作能力代碼評(píng)審機(jī)制:學(xué)生互相評(píng)審代碼,提升代碼質(zhì)量和規(guī)范意識(shí)技術(shù)分享會(huì):學(xué)生輪流分享項(xiàng)目經(jīng)驗(yàn)和技術(shù)心得答疑互助:建立學(xué)習(xí)小組,鼓勵(lì)學(xué)生互相幫助解決問(wèn)題教學(xué)資源與技術(shù)支持硬件資源:提供GPU服務(wù)器支持深度學(xué)習(xí)模型訓(xùn)練,確保實(shí)驗(yàn)教學(xué)效果軟件環(huán)境:統(tǒng)一配置Anaconda環(huán)境,提供常用NLP庫(kù)和工具包數(shù)據(jù)資源:建立涵蓋新聞、評(píng)論、社交媒體等多領(lǐng)域的中文語(yǔ)料庫(kù)在線平臺(tái):利用JupyterHub、GitHub等工具實(shí)現(xiàn)代碼管理和作業(yè)提交企業(yè)合作:邀請(qǐng)行業(yè)專家開(kāi)展講座,提供實(shí)習(xí)和就業(yè)機(jī)會(huì)三、課程考核與評(píng)價(jià)體系綜合評(píng)價(jià)模式:多維度全過(guò)程考核本課程突破傳統(tǒng)的"一考定成績(jī)"模式,建立多元化、過(guò)程性、能力導(dǎo)向的評(píng)價(jià)體系,全面評(píng)估學(xué)生的理論掌握、實(shí)踐能力和創(chuàng)新思維。評(píng)價(jià)維度權(quán)重占比評(píng)價(jià)內(nèi)容評(píng)價(jià)方式評(píng)價(jià)頻次平時(shí)作業(yè)15%每周編程練習(xí)、算法實(shí)現(xiàn)、理論分析在線提交+自動(dòng)評(píng)測(cè)每周1次實(shí)驗(yàn)項(xiàng)目25%6個(gè)階段性項(xiàng)目的完成質(zhì)量與創(chuàng)新程度項(xiàng)目報(bào)告+代碼審查+現(xiàn)場(chǎng)演示每4-6周1次課堂表現(xiàn)10%出勤率、討論參與、互動(dòng)質(zhì)量過(guò)程性觀察+同伴評(píng)價(jià)每次課期末考核50%綜合理論知識(shí)+項(xiàng)目答辯開(kāi)卷考試(30%)+項(xiàng)目答辯(20%)期末1次各項(xiàng)考核詳細(xì)說(shuō)明平時(shí)作業(yè)(15%)理論作業(yè):選擇題、簡(jiǎn)答題、算法分析題,鞏固基礎(chǔ)知識(shí)編程作業(yè):函數(shù)實(shí)現(xiàn)、算法優(yōu)化、性能測(cè)試,提升編程能力調(diào)研作業(yè):技術(shù)調(diào)研、方法對(duì)比、應(yīng)用案例分析,拓展視野評(píng)分標(biāo)準(zhǔn):準(zhǔn)確性(40%)+完整性(30%)+及時(shí)性(20%)+創(chuàng)新性(10%)實(shí)驗(yàn)項(xiàng)目(25%)項(xiàng)目一:語(yǔ)料庫(kù)構(gòu)建與管理系統(tǒng)項(xiàng)目二:多功能信息提取工具項(xiàng)目三:智能中文分詞系統(tǒng)項(xiàng)目四:多算法關(guān)鍵詞提取平臺(tái)項(xiàng)目五:情感分析與文本分類(lèi)系統(tǒng)項(xiàng)目六:智能問(wèn)答或?qū)懽髦郑ㄆ谀╉?xiàng)目)評(píng)分維度:功能完整性(30%)+代碼質(zhì)量(25%)+創(chuàng)新性(20%)+文檔完善度(15%)+演示效果(10%)課堂表現(xiàn)(10%)出勤考核:出勤率、遲到早退情況參與度評(píng)價(jià):課堂討論發(fā)言次數(shù)和質(zhì)量互動(dòng)表現(xiàn):提問(wèn)質(zhì)量、回答問(wèn)題準(zhǔn)確性協(xié)作能力:小組合作中的貢獻(xiàn)度和配合度期末考核(50%)理論考試(30%):采用開(kāi)卷考試形式,允許查閱資料和使用工具基礎(chǔ)理論(30%):概念理解、算法原理、方法對(duì)比技術(shù)應(yīng)用(40%):代碼分析、算法設(shè)計(jì)、問(wèn)題解決綜合分析(30%):案例分析、系統(tǒng)設(shè)計(jì)、創(chuàng)新應(yīng)用項(xiàng)目答辯(20%):期末項(xiàng)目展示:系統(tǒng)演示、功能介紹、技術(shù)說(shuō)明技術(shù)問(wèn)答:算法原理、實(shí)現(xiàn)細(xì)節(jié)、優(yōu)化方案創(chuàng)新評(píng)價(jià):技術(shù)創(chuàng)新點(diǎn)、應(yīng)用價(jià)值、發(fā)展前景特色評(píng)價(jià)機(jī)制成長(zhǎng)檔案記錄:跟蹤學(xué)生整個(gè)學(xué)習(xí)過(guò)程,記錄技能提升軌跡同伴互評(píng)機(jī)制:學(xué)生互相評(píng)價(jià)項(xiàng)目和代碼,培養(yǎng)協(xié)作精神企業(yè)導(dǎo)師評(píng)價(jià):邀請(qǐng)行業(yè)專家參與項(xiàng)目評(píng)審,提供專業(yè)建議創(chuàng)新加分政策:鼓勵(lì)學(xué)生參與競(jìng)賽、發(fā)表論文、開(kāi)源貢獻(xiàn)等補(bǔ)救機(jī)制:為學(xué)習(xí)困難學(xué)生提供額外輔導(dǎo)和補(bǔ)考機(jī)會(huì)《Python中文自然語(yǔ)言處理基礎(chǔ)與實(shí)戰(zhàn)》教學(xué)日歷課程性質(zhì):專業(yè)選修課總學(xué)時(shí):64學(xué)時(shí)學(xué)分:4學(xué)分教材:肖剛,張良均.Python中文自然語(yǔ)言處理入門(mén)與實(shí)戰(zhàn)(第二版).北京:人民郵電出版社.2025第一階段:基礎(chǔ)入門(mén)(第1-4周,16學(xué)時(shí))課次學(xué)時(shí)課型授課內(nèi)容作業(yè)要求評(píng)估方式12理論第1章緒論

?NLP概述與發(fā)展歷程

?中文NLP特點(diǎn)與挑戰(zhàn)

?開(kāi)發(fā)環(huán)境介紹完成課后習(xí)題1-5題

調(diào)研3個(gè)NLP應(yīng)用實(shí)例課堂測(cè)試22理實(shí)環(huán)境配置實(shí)戰(zhàn)

?Anaconda安裝與配置

?Python環(huán)境設(shè)置

?詞云圖制作入門(mén)生成3個(gè)不同主題的詞云圖

提交環(huán)境配置截圖實(shí)驗(yàn)報(bào)告32理論第2章語(yǔ)料庫(kù)基礎(chǔ)

?語(yǔ)料庫(kù)概念與分類(lèi)

?語(yǔ)料庫(kù)構(gòu)建原則

?常用中文語(yǔ)料庫(kù)介紹完成課后習(xí)題1-5題

調(diào)研并比較2個(gè)開(kāi)源語(yǔ)料庫(kù)課堂討論42理實(shí)+實(shí)踐語(yǔ)料獲取實(shí)踐

?網(wǎng)絡(luò)爬蟲(chóng)基礎(chǔ)

?語(yǔ)料清洗方法

?在線語(yǔ)料獲取爬取指定網(wǎng)站文本數(shù)據(jù)

形成標(biāo)準(zhǔn)格式語(yǔ)料代碼審查52實(shí)踐語(yǔ)料庫(kù)構(gòu)建項(xiàng)目

?電影評(píng)論語(yǔ)料分析

?語(yǔ)料標(biāo)注與管理

?數(shù)據(jù)質(zhì)量評(píng)估項(xiàng)目一:構(gòu)建新聞?wù)Z料庫(kù)

(≥100篇,含分類(lèi)標(biāo)簽)項(xiàng)目展示62理論第3章正則表達(dá)式

?正則表達(dá)式語(yǔ)法規(guī)則

?Pythonre模塊詳解

?常用模式與技巧完成課后習(xí)題1-8題

總結(jié)10個(gè)常用正則模式在線測(cè)試72理實(shí)+實(shí)踐正則實(shí)踐應(yīng)用

?文本清洗與預(yù)處理

?信息提取技術(shù)

?模式匹配優(yōu)化設(shè)計(jì)8個(gè)驗(yàn)證模式

(郵箱、電話、身份證等)代碼測(cè)試82實(shí)踐信息提取綜合實(shí)戰(zhàn)

?簡(jiǎn)歷信息提取器

?文本格式化處理

?提取準(zhǔn)確率評(píng)估項(xiàng)目二:開(kāi)發(fā)信息提取工具

支持多種數(shù)據(jù)格式功能演示第二階段:核心技術(shù)(第5-10周,24學(xué)時(shí))課次學(xué)時(shí)課型授課內(nèi)容作業(yè)要求評(píng)估方式92理論第4章中文分詞基礎(chǔ)

?中文分詞原理與難點(diǎn)

?基于規(guī)則的分詞方法

?基于統(tǒng)計(jì)的分詞算法完成課后理論題

分析3種分詞方法優(yōu)缺點(diǎn)期中測(cè)試102理實(shí)+實(shí)踐分詞算法實(shí)現(xiàn)

?HMM模型原理與實(shí)現(xiàn)

?維特比算法詳解

?分詞效果評(píng)估實(shí)現(xiàn)簡(jiǎn)單HMM分詞器

對(duì)比不同算法效果算法實(shí)現(xiàn)112實(shí)踐jieba分詞深入應(yīng)用

?jieba庫(kù)高級(jí)功能

?自定義詞典構(gòu)建

?分詞系統(tǒng)優(yōu)化項(xiàng)目三:多算法分詞工具

支持用戶詞典擴(kuò)展系統(tǒng)測(cè)試122理論第5章詞性標(biāo)注與NER

?詞性標(biāo)注體系與方法

?命名實(shí)體識(shí)別原理

?CRF模型基礎(chǔ)完成課后習(xí)題

整理中文詞性標(biāo)注規(guī)范課堂討論132理實(shí)+實(shí)踐標(biāo)注技術(shù)實(shí)踐

?jieba詞性標(biāo)注應(yīng)用

?HMM標(biāo)注實(shí)現(xiàn)

?標(biāo)注準(zhǔn)確率評(píng)估實(shí)現(xiàn)HMM詞性標(biāo)注器

評(píng)估標(biāo)注效果實(shí)驗(yàn)報(bào)告142實(shí)踐NER系統(tǒng)構(gòu)建

?CRF特征工程

?命名實(shí)體識(shí)別實(shí)踐

?實(shí)體鏈接技術(shù)擴(kuò)展CRF特征集

提升NERF1值≥85%性能評(píng)估152理論第6章關(guān)鍵詞提取

?TF-IDF算法原理

?TextRank圖模型

?評(píng)估指標(biāo)與方法完成課后習(xí)題1-5題

對(duì)比分析兩種算法差異理論考核162理實(shí)+實(shí)踐統(tǒng)計(jì)方法實(shí)踐

?TF-IDF算法實(shí)現(xiàn)

?LSA與LDA主題模型

?語(yǔ)義關(guān)鍵詞提取實(shí)現(xiàn)TF-IDF提取器

比較LSA和LDA效果算法對(duì)比172實(shí)踐圖模型算法應(yīng)用

?TextRank算法實(shí)現(xiàn)

?圖構(gòu)建策略優(yōu)化

?關(guān)鍵詞質(zhì)量評(píng)估項(xiàng)目四:多算法關(guān)鍵詞提取

支持不同領(lǐng)域文本項(xiàng)目答辯182理論第7章文本向量化

?詞向量模型發(fā)展歷程

?Word2Vec原理詳解

?CBOWvsSkip-Gram完成課后理論與實(shí)踐題

分析兩種模型結(jié)構(gòu)差異概念理解192理實(shí)+實(shí)踐詞向量模型訓(xùn)練

?Word2Vec模型訓(xùn)練

?詞向量質(zhì)量評(píng)估

?詞匯相似度計(jì)算訓(xùn)練領(lǐng)域詞向量模型

驗(yàn)證詞向量質(zhì)量模型評(píng)估202實(shí)踐文檔向量化實(shí)現(xiàn)

?Doc2Vec模型應(yīng)用

?DMvsDBOW比較

?文本相似度計(jì)算實(shí)現(xiàn)文檔相似度系統(tǒng)

對(duì)比不同向量化方法系統(tǒng)演示第三階段:高級(jí)應(yīng)用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論