Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)- 教案 第6章 財(cái)務(wù)數(shù)據(jù)挖掘_第1頁(yè)
Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)- 教案 第6章 財(cái)務(wù)數(shù)據(jù)挖掘_第2頁(yè)
Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)- 教案 第6章 財(cái)務(wù)數(shù)據(jù)挖掘_第3頁(yè)
Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)- 教案 第6章 財(cái)務(wù)數(shù)據(jù)挖掘_第4頁(yè)
Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)- 教案 第6章 財(cái)務(wù)數(shù)據(jù)挖掘_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

課次/學(xué)時(shí):第1次課/2學(xué)時(shí)

本次課題目(內(nèi)容):

線(xiàn)性回歸模型原理與財(cái)務(wù)預(yù)測(cè)實(shí)戰(zhàn)(一元/多元線(xiàn)性回歸)

學(xué)習(xí)目標(biāo):理解一元/多元線(xiàn)性回歸數(shù)學(xué)模型及參數(shù)意義(斜率/截距)。掌握回歸模型評(píng)估指標(biāo)(R方/MAPE)的業(yè)務(wù)解讀方法。運(yùn)用LinearRegression完成上市公司營(yíng)收預(yù)測(cè)建模全流程。教學(xué)重點(diǎn)、難點(diǎn):重點(diǎn):最小二乘法原理、train_test_split數(shù)據(jù)集劃分、metrics.r2_score評(píng)估。難點(diǎn):多重共線(xiàn)性識(shí)別(如資產(chǎn)總計(jì)/負(fù)債合計(jì)高度相關(guān))、MAPE誤差解讀(<10%為優(yōu)秀)。

教學(xué)資源:

上市公司營(yíng)收數(shù)據(jù)集(營(yíng)業(yè)成本/資產(chǎn)總計(jì)等11字段)、JupyterNotebook代碼模板、特征相關(guān)性熱力圖案例。

課堂教學(xué)創(chuàng)新點(diǎn):財(cái)務(wù)診斷視角:解讀回歸系數(shù)(如"營(yíng)業(yè)成本系數(shù)1.22→每投入1元成本創(chuàng)收1.22元營(yíng)收")。陷阱預(yù)警:演示未標(biāo)準(zhǔn)化數(shù)據(jù)導(dǎo)致系數(shù)失真(資產(chǎn)總計(jì)系數(shù)-9636的誤導(dǎo)性)。

教學(xué)過(guò)程設(shè)計(jì):原理剖析(30分鐘)一元回歸公式推導(dǎo):最小二乘法動(dòng)畫(huà)演示:誤差平方和最小化過(guò)程關(guān)鍵指標(biāo)解讀:R方=0.99→模型解釋99%波動(dòng)MAPE=0.21→平均預(yù)測(cè)誤差21%一元回歸實(shí)戰(zhàn)(40分鐘)數(shù)據(jù)可視化:plt.scatter繪制營(yíng)業(yè)成本-營(yíng)收散點(diǎn)圖(圖6-1)模型訓(xùn)練與診斷:Pythonlm=LinearRegression()

lm.fit(X_train,y_train)#X=營(yíng)業(yè)成本

print('斜率:',lm.coef_[0])#輸出1.2248業(yè)務(wù)結(jié)論:成本與營(yíng)收強(qiáng)線(xiàn)性相關(guān)(R方>0.99)多元回歸進(jìn)階(30分鐘)特征工程陷阱:展示未標(biāo)準(zhǔn)化時(shí)資產(chǎn)總計(jì)系數(shù)失真(-9636)解決方案:Pythonscaler=StandardScaler()#數(shù)據(jù)標(biāo)準(zhǔn)化

X_scaled=scaler.fit_transform(X)優(yōu)化后結(jié)果:營(yíng)業(yè)成本系數(shù)1.076(業(yè)務(wù)合理)課程總結(jié)與答疑:

強(qiáng)調(diào)財(cái)務(wù)建模鐵律:先驗(yàn)證特征相關(guān)性(熱力圖),再標(biāo)準(zhǔn)化數(shù)據(jù),最后解讀系數(shù)經(jīng)濟(jì)含義。

教學(xué)反思:

課次/學(xué)時(shí):第2次課/2學(xué)時(shí)

本次課題目(內(nèi)容):

邏輯回歸原理及信用風(fēng)險(xiǎn)預(yù)測(cè)實(shí)戰(zhàn)

學(xué)習(xí)目標(biāo):理解Sigmoid函數(shù)與概率映射機(jī)制掌握混淆矩陣指標(biāo)(準(zhǔn)確率/召回率)在風(fēng)控場(chǎng)景的應(yīng)用。完成個(gè)人信用風(fēng)險(xiǎn)預(yù)測(cè)模型(特征:收入/負(fù)債/歷史逾期等)。教學(xué)重點(diǎn)、難點(diǎn):重點(diǎn):LogisticRegression模型訓(xùn)練、predict_proba()概率輸出、classification_report評(píng)估。難點(diǎn):召回率與精確率的權(quán)衡(風(fēng)控側(cè)重召回率→減少漏判高風(fēng)險(xiǎn)客戶(hù))。教學(xué)資源:

個(gè)人信用數(shù)據(jù)集(20個(gè)特征/5萬(wàn)樣本)、閾值調(diào)整動(dòng)態(tài)可視化工具。

課堂教學(xué)創(chuàng)新點(diǎn):銀行業(yè)務(wù)還原:設(shè)定不同閾值(0.3/0.5/0.7)演示通過(guò)率與壞賬率變化。倫理討論:分組辯論"是否應(yīng)拒絕40%逾期概率的低收入群體"。教學(xué)過(guò)程設(shè)計(jì):原理精講(25分鐘)Sigmoid函數(shù)演示:1/(1+e^(-z))將線(xiàn)性輸出映射為[0,1]概率決策邊界:概率>0.5判定為違約(可調(diào)整)風(fēng)控核心指標(biāo):召回率=抓出壞人/全部壞人→避免漏判(目標(biāo)>85%)精確率=真壞人/判為壞人→減少誤傷模型開(kāi)發(fā)(35分鐘)特征工程:獨(dú)熱編碼處理職業(yè)類(lèi)型,標(biāo)準(zhǔn)化連續(xù)變量訓(xùn)練與評(píng)估:Pythonfromsklearn.linear_modelimportLogisticRegression

lr=LogisticRegression()

lr.fit(X_train,y_train)

print(classification_report(y_test,lr.predict(X_test)))輸出示例:召回率0.88→每100個(gè)壞人識(shí)別出88個(gè)閾值調(diào)優(yōu)實(shí)戰(zhàn)(30分鐘)業(yè)務(wù)場(chǎng)景模擬:閾值=0.3:召回率92%→壞賬少但拒絕大量好客戶(hù)閾值=0.7:召回率65%→壞賬多但客戶(hù)體驗(yàn)好代碼實(shí)現(xiàn):Pythony_proba=lr.predict_proba(X_test)[:,1]#違約概率

y_pred=(y_proba>0.4).astype(int)#調(diào)整閾值課程總結(jié)與答疑:

強(qiáng)調(diào)邏輯回歸本質(zhì)是分類(lèi)模型,財(cái)務(wù)場(chǎng)景中需按業(yè)務(wù)目標(biāo)(風(fēng)控/營(yíng)銷(xiāo))動(dòng)態(tài)調(diào)整閾值。

教學(xué)反思:

課次/學(xué)時(shí):第3次課/2學(xué)時(shí)

本次課題目(內(nèi)容):

K均值聚類(lèi)原理與企業(yè)盈利能力分級(jí)實(shí)戰(zhàn)

學(xué)習(xí)目標(biāo):掌握K均值算法流程(初始化→分配→更新→迭代)。運(yùn)用肘部法則(KElbowVisualizer)確定最佳K值。完成上市公司盈利能力聚類(lèi)分級(jí)(ROE/凈利率/營(yíng)收增速)。教學(xué)重點(diǎn)、難點(diǎn):重點(diǎn):輪廓系數(shù)解讀(>0.5說(shuō)明聚類(lèi)合理)、聚類(lèi)中心業(yè)務(wù)標(biāo)簽定義。難點(diǎn):特征權(quán)重分配(如ROE比營(yíng)收增速更重要)、高維數(shù)據(jù)降維(PCA)。教學(xué)資源:

上市公司財(cái)務(wù)指標(biāo)數(shù)據(jù)集(3年ROE/凈利率/營(yíng)收增速)、聚類(lèi)結(jié)果雷達(dá)圖模板。

課堂教學(xué)創(chuàng)新點(diǎn):投資策略生成:定義聚類(lèi)中心為"現(xiàn)金牛/成長(zhǎng)型/風(fēng)險(xiǎn)型"企業(yè)可視化創(chuàng)新:用雷達(dá)圖對(duì)比三類(lèi)企業(yè)盈利特征(圖10-3)教學(xué)過(guò)程設(shè)計(jì):算法解析(30分鐘)K均值動(dòng)畫(huà)演示:質(zhì)點(diǎn)移動(dòng)與樣本重分配過(guò)程關(guān)鍵概念:肘部法則:尋找SSE下降拐點(diǎn)(K=3處斜率突變)輪廓系數(shù):計(jì)算樣本與同類(lèi)/異類(lèi)距離比(公式演示)盈利能力聚類(lèi)(40分鐘)數(shù)據(jù)預(yù)處理:Pythonfromsklearn.preprocessingimportStandardScaler

scaler=StandardScaler()

X_scaled=scaler.fit_transform(df[['ROE','凈利率','營(yíng)收增速']])確定K值:Pythonfromyellowbrick.clusterimportKElbowVisualizer

visualizer=KElbowVisualizer(KMeans(),k=(2,10))

visualizer.fit(X_scaled)#顯示肘點(diǎn)K=3業(yè)務(wù)解讀聚類(lèi)中心:類(lèi)別ROE凈利率增速標(biāo)簽022.3%15.8%5.2%現(xiàn)金牛18.1%3.4%32.7%成長(zhǎng)型2-3.2%-1.5%-8.4%風(fēng)險(xiǎn)型報(bào)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論