




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
課題第18課需求分析與數(shù)據(jù)預(yù)處理課時(shí)2課時(shí)(90min)教學(xué)目標(biāo)知識(shí)技能目標(biāo):(1)能夠?qū)Π咐M(jìn)行需求分析(2)能對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、分析和可視化操作(3)練習(xí)使用Pandas預(yù)處理重復(fù)值、缺失值、異常值和時(shí)間信息等素質(zhì)目標(biāo):了解中國(guó)豐富的旅游資源,增強(qiáng)熱愛(ài)祖國(guó)大好河山的情感教學(xué)重難點(diǎn)教學(xué)重點(diǎn):對(duì)案例進(jìn)行需求分析教學(xué)難點(diǎn):對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、分析和可視化操作教學(xué)方法案例分析法、問(wèn)答法、討論法、講授法教學(xué)用具電腦、投影儀、多媒體課件、教材、文旌課堂APP教學(xué)設(shè)計(jì)第1節(jié)課:→→傳授新知(28min)→課堂實(shí)踐(10min)第2節(jié)課:→傳授新知(20min)→課堂實(shí)踐(12min)→課堂小結(jié)(3min)→作業(yè)布置(2min)教學(xué)過(guò)程主要教學(xué)內(nèi)容及步驟設(shè)計(jì)意圖第一節(jié)課考勤
(2min)【教師】使用文旌課堂APP進(jìn)行簽到【學(xué)生】按照老師要求簽到培養(yǎng)學(xué)生的組織紀(jì)律性,掌握學(xué)生的出勤情況問(wèn)題導(dǎo)入(5min)【教師】提出問(wèn)題我們已經(jīng)學(xué)習(xí)了python數(shù)據(jù)處理的相關(guān)知識(shí),那么關(guān)于旅游網(wǎng)站中精華游記如何處理呢?【學(xué)生】思考、舉手回答通過(guò)提問(wèn)的方法,了解學(xué)生對(duì)案例的了解程度,進(jìn)而引出新知傳授新知
(28min)【教師】總結(jié)學(xué)生的回答,并引入新知,講解案例需求分析的相關(guān)知識(shí)6.1需求分析6.1.1目標(biāo)分析?【教師】提出問(wèn)題本案例的目標(biāo)是什么??【學(xué)生】聆聽(tīng)、思考、主動(dòng)回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知本案例的目標(biāo)是根據(jù)某旅游網(wǎng)站中精華游記的信息,包括出發(fā)時(shí)間、旅行天數(shù)、人均消費(fèi)、旅行標(biāo)簽、閱覽數(shù)和途徑地點(diǎn)等,分析旅游的旺季和淡季、最能接受的旅游天數(shù)和人均消費(fèi)、旅游方式、熱門(mén)地區(qū)等。6.1.2數(shù)據(jù)源?【教師】多媒體出示“旅游網(wǎng)站精華游記數(shù)據(jù).xlsx”文件的內(nèi)容圖片(詳見(jiàn)教材),并詳細(xì)講解各部分表示的內(nèi)容數(shù)據(jù)源為通過(guò)網(wǎng)絡(luò)爬蟲(chóng)爬取的某旅游網(wǎng)站精華游記的數(shù)據(jù),保存在“旅游網(wǎng)站精華游記數(shù)據(jù).xlsx”文件中。6.2數(shù)據(jù)預(yù)處理6.2.1數(shù)據(jù)解析?【教師】提出問(wèn)題數(shù)據(jù)解析的步驟有哪些??【學(xué)生】聆聽(tīng)、思考、主動(dòng)回答問(wèn)題?【教師】總結(jié)學(xué)生的回答,并講解新知(1)導(dǎo)入“旅游網(wǎng)站精華游記數(shù)據(jù).xlsx”文件中的數(shù)據(jù)。(2)定義dealPlace()函數(shù)用于篩選途經(jīng)地點(diǎn)中的中文地名,以及dealView()函數(shù)用于統(tǒng)一閱覽數(shù)中的數(shù)值格式。(3)使用str.split()函數(shù)以默認(rèn)的空格分割出發(fā)日期字符串,并設(shè)置其expand參數(shù)為T(mén)rue返回列表,獲取第一個(gè)元素,即日期信息。(4)使用str.slice()函數(shù)切片獲取天數(shù)和人均消費(fèi)字符串的元素,即天數(shù)和人均消費(fèi)的數(shù)值,并將天數(shù)的數(shù)據(jù)類(lèi)型轉(zhuǎn)換為整型。(5)使用lambda表達(dá)式調(diào)用dealPlace()函數(shù),并使用str.replace()函數(shù)將途經(jīng)地點(diǎn)字符串中“途經(jīng):”替換為空字符、將“>”替換為“、”。(6)使用lambda表達(dá)式調(diào)用dealView()函數(shù),并將閱覽數(shù)的數(shù)據(jù)類(lèi)型轉(zhuǎn)換為整型。(7)輸出解析后的數(shù)據(jù)。?【教師】按照教材步驟進(jìn)行程序演示:importpandasaspddf=pd.read_excel('旅游網(wǎng)站精華游記數(shù)據(jù).xlsx')defdealPlace(place): #篩選途經(jīng)地點(diǎn)中的中文地名s=''iftype(place)==str:forcinplace:ifnot(((c>='a')and(c<='z'))or((c>='A')and(c<='Z'))):s=s+celse:s=placereturnsdefdealView(view): #統(tǒng)一閱覽數(shù)中的數(shù)值格式num=viewiftype(num)==str:if'萬(wàn)'innum:if'.'innum:num=num.replace('.','').replace('萬(wàn)','000')else:num=num.replace('萬(wàn)','0000')returnnum(詳見(jiàn)教材)?【學(xué)生】觀察、記錄、理解?【學(xué)生】教師演示完成后,學(xué)生按照教材提示和教師演示進(jìn)行實(shí)際操作,并對(duì)比程序運(yùn)行結(jié)果(詳見(jiàn)教材)?【教師】巡視課堂記錄,對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)?【教師】提出學(xué)習(xí)任務(wù):對(duì)比程序結(jié)果,進(jìn)行結(jié)果分析。?【學(xué)生】觀察、記錄、理解、分析?【教師】總結(jié)學(xué)生的分析結(jié)果?【教師】講解apply()函數(shù)的用途?【學(xué)生】聆聽(tīng)、思考6.2.2重復(fù)值處理?【教師】按照教材進(jìn)行問(wèn)題分析并按照步驟進(jìn)行處理缺失值程序演示:旅游網(wǎng)站中會(huì)存在相同的游記,此時(shí),須對(duì)數(shù)據(jù)中的重復(fù)值進(jìn)行處理。此處,根據(jù)標(biāo)題檢查數(shù)據(jù)是否存在重復(fù)值,除包含重復(fù)值的第一行外,其他包含重復(fù)值的行標(biāo)記為T(mén)rue,并輸出標(biāo)記為T(mén)rue的行索引;然后,刪除重復(fù)值,并輸出刪除前、后數(shù)據(jù)的行數(shù)。實(shí)現(xiàn)代碼如下。df1=df.duplicated(subset=['標(biāo)題'])print('除包含重復(fù)值的第一行外,其他包含重復(fù)值標(biāo)記為T(mén)rue的行:\n',df1[df1==True])print('刪除重復(fù)值前數(shù)據(jù)的行數(shù):',len(df))df.drop_duplicates(subset=['標(biāo)題'],inplace=True,ignore_index=True)print('刪除重復(fù)值后數(shù)據(jù)的行數(shù):',len(df))(詳見(jiàn)教材)?【學(xué)生】觀察、記錄、理解?【學(xué)生】教師演示完成后,學(xué)生按照教材提示和教師演示進(jìn)行實(shí)際操作,并對(duì)比程序運(yùn)行結(jié)果(詳見(jiàn)教材)?【教師】巡視課堂記錄,對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)【學(xué)生】聆聽(tīng)、思考、理解、記憶通過(guò)教師講解、課堂討論、多媒體演示等方式,使學(xué)生了解案例的需求分析,數(shù)據(jù)解析,重復(fù)值處理等知識(shí)課堂實(shí)踐
(10min)【教師】提出問(wèn)題根據(jù)學(xué)過(guò)的知識(shí)及重復(fù)值的處理辦法,請(qǐng)同學(xué)討論嘗試進(jìn)行缺失值處理【學(xué)生】聆聽(tīng)、思考、討論、編寫(xiě)程序【教師】檢查并總結(jié)學(xué)生程序編寫(xiě)6.2.3缺失值處理當(dāng)每條游記信息中缺失的信息大于2時(shí),可以認(rèn)為該游記失去參考價(jià)值,需要?jiǎng)h除。此處,將數(shù)據(jù)轉(zhuǎn)置后統(tǒng)計(jì)每列的缺失值個(gè)數(shù),并輸出缺失值大于2的行索引及其個(gè)數(shù);然后,刪除缺失值個(gè)數(shù)大于2(即非缺失值個(gè)數(shù)小于5)的行,并輸出刪除前、后數(shù)據(jù)的行數(shù)。實(shí)現(xiàn)代碼如下。df2=df.T.isnull().sum()print('缺失值個(gè)數(shù)大于2的行:\n',df2[df2>2])print('刪除缺失值前數(shù)據(jù)的行數(shù):',len(df))df.dropna(how='all',thresh=5,inplace=True)print('刪除缺失值后數(shù)據(jù)的行數(shù):',len(df))通過(guò)課堂討論,加深學(xué)生對(duì)處理數(shù)據(jù)缺失值的理解第二節(jié)課問(wèn)題導(dǎo)入(8min)【教師】提出問(wèn)題我們已經(jīng)學(xué)習(xí)了數(shù)據(jù)重復(fù)值,缺失值預(yù)處理方式,那么異常值要如何處理呢?【學(xué)生】聆聽(tīng)、思考、回答問(wèn)題通過(guò)提問(wèn)的方法,引導(dǎo)學(xué)生主動(dòng)思考,激發(fā)學(xué)生的學(xué)習(xí)興趣傳授新知(20min)【教師】總結(jié)學(xué)生的回答,并引入新知,講解數(shù)據(jù)預(yù)處理的相關(guān)知識(shí)6.2.4異常值處理?【教師】按照教材進(jìn)行問(wèn)題分析并按照步驟進(jìn)行處理異常值程序演示:此次數(shù)據(jù)分析的目的是為上班族制訂旅行計(jì)劃提供參考數(shù)據(jù),而上班族往往沒(méi)有長(zhǎng)假期,因此可以將天數(shù)過(guò)長(zhǎng)(如大于15)的數(shù)據(jù)看作異常值,需要?jiǎng)h除。此處,使用布爾型索引選取天數(shù)大于15的行,并輸出選取數(shù)據(jù)的行數(shù)及前10行;然后,刪除包含異常值的行,并輸出刪除前、后數(shù)據(jù)的行數(shù)。實(shí)現(xiàn)代碼如下。val=df['天數(shù)'][(df['天數(shù)']>15)]print('天數(shù)大于15的異常值個(gè)數(shù):',val.count())print('天數(shù)大于15的異常值前10行:\n',val.head(10))print('刪除異常值前數(shù)據(jù)的行數(shù):',len(df))df.drop(val.index,inplace=True)print('刪除異常值后數(shù)據(jù)的行數(shù):',len(df))(詳見(jiàn)教材)?【學(xué)生】觀察、記錄、理解?【學(xué)生】教師演示完成后,學(xué)生按照教材提示和教師演示進(jìn)行實(shí)際操作,并對(duì)比程序運(yùn)行結(jié)果(詳見(jiàn)教材)?【教師】巡視課堂記錄,對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)?【教師】提出學(xué)習(xí)任務(wù):對(duì)比程序結(jié)果,進(jìn)行結(jié)果分析。?【學(xué)生】觀察、記錄、理解、分析?【教師】總結(jié)學(xué)生的分析結(jié)果從結(jié)果可以看出,天數(shù)大于15的數(shù)據(jù)有56個(gè),且存在大于300的數(shù)據(jù),顯然與普遍情況不符。6.2.5時(shí)間信息處理?【教師】按照教材進(jìn)行問(wèn)題分析并按照步驟進(jìn)行處理時(shí)間信息處理程序演示:由于需要按月分析數(shù)據(jù),因此須提取日期中的月份信息。此處,將出發(fā)日期轉(zhuǎn)換成時(shí)間型數(shù)據(jù),通過(guò)其屬性提取月份信息,并將其添加到列末;然后,輸出出發(fā)日期和月份的前20行。實(shí)現(xiàn)代碼如下。df['月份']=pd.to_datetime(df['出發(fā)日期']).dt.monthprint(df[['出發(fā)日期','月份']].head(20))(詳見(jiàn)教材)?【學(xué)生】觀察、記錄、理解?【學(xué)生】教師演示完成后,學(xué)生按照教材提示和教師演示進(jìn)行實(shí)際操作,并對(duì)比程序運(yùn)行結(jié)果(詳見(jiàn)教材)?【教師】巡視課堂記錄,對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)【學(xué)生】聆聽(tīng)、思考、理解、記錄通過(guò)教師講解和課堂練習(xí),使學(xué)生了解異常值,時(shí)間信息處理,預(yù)處理數(shù)據(jù)保存等的相關(guān)知識(shí)課堂討論(12min)【教師】提出問(wèn)題,請(qǐng)同學(xué)們分小組討論預(yù)處理的數(shù)據(jù)要如何保存呢?聆聽(tīng)、結(jié)組、思考、討論【教師】聆聽(tīng)并總結(jié)學(xué)生的討論結(jié)果【教師】按照教材進(jìn)行問(wèn)題分析并按照步驟進(jìn)行預(yù)處理數(shù)據(jù)保存演示:6.2.6預(yù)處理數(shù)據(jù)保存為方便后續(xù)分析,將預(yù)處理后的數(shù)據(jù)保存到“旅游網(wǎng)站精華游記數(shù)據(jù)_預(yù)處理.xlsx”文件中,實(shí)現(xiàn)代碼如下。df.to_excel('旅游網(wǎng)站精華游記數(shù)據(jù)_預(yù)處理.xlsx',index=False)程序運(yùn)行后,將生成“旅游網(wǎng)站精華游記數(shù)據(jù)_預(yù)處理.xlsx”文件,其內(nèi)容如圖所示。通過(guò)課堂討論,使學(xué)生能夠了解更多關(guān)于數(shù)據(jù)預(yù)處理的知識(shí)課堂小結(jié)
(3min)【教師】簡(jiǎn)要總結(jié)本節(jié)課的要點(diǎn)本節(jié)課學(xué)習(xí)了需求分析與數(shù)據(jù)預(yù)處理的相關(guān)知識(shí),包括數(shù)據(jù)解析,缺失值,重復(fù)值,異常值,時(shí)間信息處理及預(yù)處理信息保存等相關(guān)內(nèi)容,希望大家在課下多加練習(xí),鞏固所學(xué)知識(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 用戶協(xié)議設(shè)計(jì)方案(3篇)
- 交警酒后整治措施方案(3篇)
- 辦事紀(jì)律制度建設(shè)方案(3篇)
- 2025年國(guó)際禁毒日禁毒知識(shí)競(jìng)賽題庫(kù)及答案(380題)
- 吉林法官管理辦法
- 名詞解釋管理辦法
- 呆賬提取管理辦法
- 品質(zhì)管理辦法責(zé)罰
- 商丘土地管理辦法
- 商務(wù)中心管理辦法
- 養(yǎng)老服務(wù)投標(biāo)文件(技術(shù)方案)
- 寧夏中衛(wèi)人文介紹
- 湖南省英語(yǔ)高考試題與參考答案(2025年)
- 個(gè)人對(duì)公司借款協(xié)議范本
- 行政執(zhí)法資格證法律知識(shí)考試復(fù)習(xí)題及答案
- 廣西壯族自治區(qū)2025年普通高校招生考生報(bào)名登記表(樣表)
- 統(tǒng)編版語(yǔ)文三年級(jí)上冊(cè)第6單元大單元教學(xué)設(shè)計(jì)
- 精神分裂癥合并糖尿病患者護(hù)理查房課件
- GB/T 44230-2024政務(wù)信息系統(tǒng)基本要求
- 宮腔鏡技術(shù)診斷子宮內(nèi)膜癌的臨床應(yīng)用
- 電氣設(shè)計(jì)筆記:電纜熱穩(wěn)定校驗(yàn)計(jì)算表
評(píng)論
0/150
提交評(píng)論