




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。財(cái)務(wù)數(shù)據(jù)可視化Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)第五章公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。目錄CONTENTSMatplotlib繪圖基礎(chǔ)5.1Matplotlib常用圖形繪制5.2seaborn可視化進(jìn)階5.3公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。5.1Matplotlib繪圖基礎(chǔ)5.1Matplotlib繪圖基礎(chǔ)步驟1
創(chuàng)建畫布與創(chuàng)建子圖。5.1.1Matplotlib繪圖基本流程函數(shù)函數(shù)作用plt.title()在當(dāng)前圖形中添加標(biāo)題,可以指定標(biāo)題的名稱、位置、顏色、字號等參數(shù)plt.xlabel()在當(dāng)前圖形中添加x軸名稱,可以指定位置、顏色、字號等參數(shù)plt.ylabel()在當(dāng)前圖形中添加y軸名稱,可以指定位置、顏色、字號等參數(shù)plt.xlim()指定當(dāng)前圖形x軸的范圍,只能指定一個數(shù)值區(qū)間,無法使用字符串標(biāo)識plt.ylim()指定當(dāng)前圖形y軸的范圍,只能指定一個數(shù)值區(qū)間,無法使用字符串標(biāo)識plt.xticks()指定x軸刻度位置和標(biāo)簽plt.yticks()指定y軸刻度位置和標(biāo)簽plt.legend()指定當(dāng)前圖形的圖例,可以指定圖例的大小、位置、標(biāo)簽步驟2
繪制圖形。在使用Matplotlib繪制圖形時(shí),可以靈活地設(shè)置坐標(biāo)軸和添加各種標(biāo)簽。設(shè)置坐標(biāo)軸和添加各種標(biāo)簽與繪制圖形是并列的,沒有先后順序,可以先繪制圖形,也可以先添加各種標(biāo)簽,但是添加圖例一定要在繪制圖形之后。5.1Matplotlib繪圖基礎(chǔ)5.1.1Matplotlib繪圖基本流程5.1Matplotlib繪圖基礎(chǔ)步驟3
顯示或保存圖形。5.1.1Matplotlib繪圖基本流程函數(shù)函數(shù)作用plt.show()在本機(jī)顯示圖形plt.savefig()保存繪制的圖形,可以指定圖形的分辨率、邊緣的顏色等參數(shù)5.1Matplotlib繪圖基礎(chǔ)5.1.2中文字體配置#指定字體為SimHei(黑體)matplotlib.rcParams['font.sans-serif']=['SimHei']#設(shè)置負(fù)號不使用Unicode字符matplotlib.rcParams['axes.unicode_minus']=False5.1Matplotlib繪圖基礎(chǔ)5.1.3坐標(biāo)軸刻度標(biāo)注使用plt.xticks(ticks)和plt.yticks(ticks)來設(shè)置坐標(biāo)軸的刻度位置;通過plt.xlim(xmin,xmax)和plt.ylim(ymin,ymax)來調(diào)整坐標(biāo)軸的顯示范圍,從而控制刻度顯示的位置;通過傳遞一個包含刻度標(biāo)簽的列表給plt.xticks()和plt.yticks()來設(shè)置刻度標(biāo)簽;使用plt.xticks()和plt.yticks()函數(shù)的rotation旋轉(zhuǎn)坐標(biāo)軸的刻度標(biāo)簽公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。5.2Matplotlib常用圖形繪制5.2Matplotlib常用圖形繪制5.2.1折線圖簡單曲線圖展示數(shù)據(jù)隨時(shí)間或其他連續(xù)變量的變化趨勢。使用plt.plot()函數(shù),指定x軸和y軸數(shù)據(jù),可繪制簡單曲線圖,如營業(yè)總收入隨時(shí)間的變化曲線,直觀呈現(xiàn)數(shù)據(jù)變化趨勢。多線圖用于展示不同年份的營業(yè)總收入隨季度的變化情況。篩選數(shù)據(jù)集不同年份的行,取“報(bào)告期”列數(shù)據(jù)作為x軸值,“營業(yè)總收入”列數(shù)據(jù)作為y軸值,繪制多個折線圖,每個年份用不同標(biāo)記和線型表示,便于比較不同年份的變化趨勢。5.2Matplotlib常用圖形繪制5.2.2柱形圖通過將多個數(shù)據(jù)系列在垂直方向上疊加,展示不同部分如何共同構(gòu)成一個整體??捎糜谡故久磕旮骷径葼I業(yè)總收入在年度中的占比及變化情況,直觀呈現(xiàn)各部分對總體的貢獻(xiàn)度。展示多個數(shù)據(jù)系列在同一圖表中的變化情況。通過pandas的pivot()方法將數(shù)據(jù)從長格式轉(zhuǎn)換為寬格式,繪制不同年份的營業(yè)總收入柱形圖,便于比較不同年份的季度數(shù)據(jù)差異。簡單柱形圖比較不同類別或時(shí)間點(diǎn)的數(shù)據(jù)大小。使用plt.bar()函數(shù),繪制簡單柱形圖,如2023年各季度的營業(yè)總收入柱形圖,直觀展示各季度數(shù)據(jù)差異。復(fù)式柱形圖堆疊柱形圖5.2Matplotlib常用圖形繪制5.2.3直方圖直方圖現(xiàn)定量數(shù)據(jù)分布狀況,通過矩形的高度展示數(shù)據(jù)的頻數(shù)或頻率密度。使用plt.hist()函數(shù),可繪制營業(yè)總收入的直方圖,直觀呈現(xiàn)數(shù)據(jù)的集中趨勢和離散程度。5.2Matplotlib常用圖形繪制5.2.4散點(diǎn)圖通過在二維坐標(biāo)系中繪制點(diǎn),展示兩個定量變量之間的關(guān)系。使用plt.scatter()函數(shù),可繪制營業(yè)總收入與凈利潤的散點(diǎn)圖,判斷兩者是否存在某種關(guān)聯(lián)。變量關(guān)系分析5.2Matplotlib常用圖形繪制5.2.5餅圖通過將一個圓分成若干扇形,展示不同部分占整體的比例關(guān)系。使用plt.pie()函數(shù),可繪制2023年各季度營業(yè)總收入的餅圖,直觀呈現(xiàn)各季度占比情況。比例關(guān)系展示公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。5.3seaborn可視化進(jìn)階5.3seaborn可視化進(jìn)階5.3.1箱線圖
數(shù)據(jù)分布特征分組箱線圖由數(shù)據(jù)的上邊緣、上四分位數(shù)、中位數(shù)、下四分位數(shù)、下邊緣及異常值繪制而成,主要用于展示數(shù)據(jù)分布的特征、分布是否對稱及是否存在離群點(diǎn)??杀容^多組數(shù)據(jù)的分布特征。通過sns.boxplot()函數(shù),可繪制不同年份的季度營業(yè)總收入分組箱線圖,直觀比較各年份數(shù)據(jù)的差異。5.3seaborn可視化進(jìn)階5.3.2熱力圖相關(guān)性展示通過顏色的深淺展示數(shù)據(jù)矩陣中數(shù)值的大小或密度,常用于展示數(shù)據(jù)集中變量之間的相關(guān)性。使用sns.heatmap()函數(shù),可繪制營業(yè)總收入與凈利潤的相關(guān)系數(shù)熱力圖。5.3seaborn可視化進(jìn)階5.3.3組合圖顯示多個變量之間的關(guān)系,特別適用于數(shù)據(jù)集包含3個及以上變量時(shí)。通過sns.pairplot()函數(shù),可繪制散點(diǎn)矩陣圖,直觀展示變量之間的關(guān)系。分簇散點(diǎn)圖通過將數(shù)據(jù)點(diǎn)分成不同簇,展示不同變量之間的關(guān)系。使用sns.swarmplot()函數(shù),可繪制分簇散點(diǎn)圖,通過不同顏色表示不同類別。散點(diǎn)矩陣圖聯(lián)合分布圖用于展示兩個變量之間的聯(lián)合分布情況。通過sns.jointplot()函數(shù),可繪制聯(lián)合分布圖,同時(shí)顯示散點(diǎn)圖和密度圖,幫助理解變量之間的關(guān)系。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。謝謝第五章Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。財(cái)務(wù)數(shù)據(jù)挖掘Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)第六章公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。目錄CONTENTS線性回歸6.1邏輯回歸6.2K均值聚類6.3數(shù)據(jù)挖掘定義從大量數(shù)據(jù)中提取有用信息的過程,旨在發(fā)現(xiàn)數(shù)據(jù)中的模式、關(guān)系和趨勢,為決策提供支持。數(shù)據(jù)挖掘應(yīng)用領(lǐng)域廣泛應(yīng)用于金融、市場營銷、醫(yī)療、電信等行業(yè),幫助企業(yè)和機(jī)構(gòu)優(yōu)化運(yùn)營、提升效率、降低成本。數(shù)據(jù)挖掘概述基于已標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練的算法,目標(biāo)是預(yù)測新數(shù)據(jù)的標(biāo)簽,常見算法包括線性回歸、邏輯回歸等。處理未標(biāo)記數(shù)據(jù),旨在發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu)和模式,如聚類分析和降維技術(shù)。結(jié)合了監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),利用少量標(biāo)記數(shù)據(jù)和大量未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練,適用于數(shù)據(jù)標(biāo)記成本較高的場景。監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)數(shù)據(jù)挖掘概述公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。6.1線性回歸6.1線性回歸6.1.1一元線性回歸一元線性回歸模型描述一個自變量與一個因變量之間的線性關(guān)系,形式為
6.1線性回歸6.1.2多元線性回歸當(dāng)輸出變量受到p個因素的影響,而我們不確定哪個因素起主導(dǎo)作用時(shí),可以將p個因素同時(shí)納入模型中建立多元線性回歸模型來研究。多元線性回歸模型如下:
6.1線性回歸6.1.2多元線性回歸回歸模型的性能度量R方MSE和RMSEMAE和MAPE衡量模型對數(shù)據(jù)的擬合程度,值越接近1表示模型擬合效果越好。MAE和MAPE分別衡量模型預(yù)測誤差的絕對值和百分比誤差,適用于評估模型的預(yù)測精度。MSE和RMSE衡量模型預(yù)測誤差的大小,值越小表示模型預(yù)測越準(zhǔn)確。6.1線性回歸6.1.3線性回歸模型案例實(shí)踐【案例6-1】上市公司營業(yè)收入預(yù)測
現(xiàn)有上市公司的營業(yè)成本、資產(chǎn)總計(jì)、負(fù)債合計(jì)與營業(yè)收入等數(shù)據(jù),請分析營業(yè)成本與營業(yè)收入之間的關(guān)系,并基于營業(yè)成本建立營業(yè)收入模型;分析其他變量與營業(yè)收入之間的關(guān)系,并建立營業(yè)收入的預(yù)測模型。6.1線性回歸6.1.3線性回歸模型案例實(shí)踐(1)基于營業(yè)成本的營業(yè)收入模型步驟1數(shù)據(jù)讀入與概況查看。步驟
2數(shù)據(jù)可視化。通過繪制散點(diǎn)圖可以觀察營業(yè)成本與營業(yè)收入的關(guān)系。步驟3以7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試集,以便在訓(xùn)練集上進(jìn)行模型訓(xùn)練,在測試集上進(jìn)行模型性能評價(jià)。步驟4創(chuàng)建線性回歸模型,在訓(xùn)練集上進(jìn)行模型訓(xùn)練,并輸出模型參數(shù)。步驟5將散點(diǎn)圖與模型的擬合直線繪制在一張圖中。步驟6模型預(yù)測。6.1線性回歸6.1.3線性回歸模型案例實(shí)踐(2)營業(yè)收入的多元線性回歸模型步驟1數(shù)據(jù)讀入與概況查看。步驟2數(shù)據(jù)集劃分。首先將數(shù)據(jù)分為特征和標(biāo)簽,并對特征進(jìn)行標(biāo)準(zhǔn)化處理,然后以7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。步驟
3模型創(chuàng)建與訓(xùn)練。創(chuàng)建模型,在訓(xùn)練集上進(jìn)行模型訓(xùn)練,并輸出模型參數(shù)。步驟4模型性能度量。計(jì)算模型在訓(xùn)練集及測試集上的性能度量。、步驟5模型預(yù)測。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。6.2邏輯回歸6.2邏輯回歸6.2.1邏輯回歸模型邏輯回歸模型,其數(shù)學(xué)表達(dá)式如下:
6.2邏輯回歸6.2.1邏輯回歸模型邏輯回歸性能度量衡量模型分類正確的樣本比例,是最常用的性能指標(biāo)之一。準(zhǔn)確率衡量模型預(yù)測為正的樣本中實(shí)際為正的比例,召回率衡量實(shí)際為正的樣本中預(yù)測為正的比例。精確率和召回率是精確率和召回率的調(diào)和平均值,綜合衡量模型的準(zhǔn)確性和全面性。F1分?jǐn)?shù)ROC曲線和AUC值用于評估模型的整體性能,AUC值越接近1表示模型性能越好。ROC曲線和AUC6.2邏輯回歸6.2.2邏輯回歸模型案例實(shí)踐【案例6-2】客戶流失
在當(dāng)今競爭激烈的市場環(huán)境中,企業(yè)之間的競爭已經(jīng)從產(chǎn)品和服務(wù)的競爭轉(zhuǎn)向了客戶資源的爭奪??蛻羰瞧髽I(yè)持續(xù)發(fā)展的基石,因此,理解和把握客戶的需求,以及預(yù)防和減少客戶流失尤其重要。本案例通過收集和分析客戶的個人信息、交易記錄、使用習(xí)慣等關(guān)鍵數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)技術(shù)構(gòu)建客戶流失預(yù)測模型。這一模型可以幫助企業(yè)準(zhǔn)確識別出那些流失風(fēng)險(xiǎn)較高的客戶。6.2邏輯回歸6.2.2邏輯回歸模型案例實(shí)踐步驟1數(shù)據(jù)讀入與概況查看。步驟2數(shù)據(jù)編碼與標(biāo)準(zhǔn)化。步驟3數(shù)據(jù)集劃分。首先將數(shù)據(jù)分為特征和標(biāo)簽,并對特征進(jìn)行標(biāo)準(zhǔn)化處理,然后以7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。步驟4模型創(chuàng)建、訓(xùn)練與回歸系數(shù)輸出。步驟5模型性能度量。步驟6變量重要性度量。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。6.3K均值聚類6.3K均值聚類6.3.1K均值聚類的基本原理(1)K均值聚類對“親疏”程度的測度①
歐氏距離(EuclideanDistance)②
切比雪夫距離(ChebyshevDistance)③
絕對距離(AbsoluteDistance)6.3K均值聚類6.3.1K均值聚類的基本原理(1)K均值聚類對“親疏”程度的測度④
閔可夫斯基距離(MinkowskiDistance)⑤
余弦距離(CosineDistance)6.3K均值聚類6.3.1K均值聚類的基本原理(2)K均值聚類過程步驟
1指定聚類數(shù)目K。步驟2確定K個類的初始類中心。步驟3根據(jù)最近原則進(jìn)行聚類。步驟4重新確定K個類的中心。步驟
5判斷是否已經(jīng)滿足終止聚類算法的條件,如果未滿足,則返回步驟3,不斷重復(fù)上述過程,直到滿足終止條件。6.3K均值聚類6.3.2K均值聚類案例實(shí)踐【案例6-3】城市發(fā)展指標(biāo)聚類分析
隨著我國城市化進(jìn)程的不斷推進(jìn),城市發(fā)展呈現(xiàn)出多樣化和復(fù)雜化的特點(diǎn)。在這一背景下,對主要城市進(jìn)行綜合評估和比較分析變得越來越重要。本案例對我國主要城市的多項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行聚類分析,以便我們更好地理解城市發(fā)展的現(xiàn)狀和趨勢,發(fā)現(xiàn)城市間的關(guān)聯(lián)性和差異性,為政府和企業(yè)提供科學(xué)決策依據(jù),推動城市的可持續(xù)發(fā)展。6.3K均值聚類6.3.2K均值聚類案例實(shí)踐步驟1數(shù)據(jù)讀入與概況查看。步驟2對數(shù)據(jù)進(jìn)行0-1標(biāo)準(zhǔn)化處理。步驟3最佳K值確定。計(jì)算不同聚類數(shù)目下的輪廓系數(shù),并繪制圖表來幫助我們確定數(shù)據(jù)集的最佳聚類數(shù)目K,從而進(jìn)行有效的聚類分析??紤]到城市分類過多或過少都不合適,我們設(shè)置K在3和10之間取值。步驟4通過KMeans類創(chuàng)建了一個聚類模型。步驟5聚類結(jié)果展示。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。謝謝第六章Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。會計(jì)文本分析與詞云圖繪制Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)第七章公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。目錄CONTENTS文本分析基礎(chǔ)7.1會計(jì)文本預(yù)處理7.2關(guān)鍵詞提取與詞頻統(tǒng)計(jì)7.3詞云圖繪制7.4公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。7.1文本分析文本分析應(yīng)用于社交媒體分析、輿情監(jiān)測、推薦系統(tǒng)、信息檢索和自然語言處理等領(lǐng)域。在會計(jì)領(lǐng)域,用于分析財(cái)務(wù)報(bào)告、審計(jì)意見和公司公告等文本資料。文本分析定義文本分析是跨學(xué)科技術(shù),結(jié)合計(jì)算機(jī)科學(xué)、自然語言處理、信息檢索和數(shù)據(jù)分析,從文本數(shù)據(jù)中提取有價(jià)值信息,輔助決策和研究。文本分析的應(yīng)用7.1文本分析基礎(chǔ)7.1.1文本分析的概念7.1文本分析基礎(chǔ)7.1.2文本分析的基本步驟詞云圖是將文本數(shù)據(jù)中出現(xiàn)頻率較高的詞語以不同大小顯示的視覺化工具,通過美觀的布局和色彩搭配,增強(qiáng)信息的吸引力和易讀性。詞云圖繪制明確分析目標(biāo),確定所需文本數(shù)據(jù)類型,如年報(bào)、新聞稿、社交媒體帖子等。數(shù)據(jù)收集可手動或使用網(wǎng)絡(luò)爬蟲自動化完成。數(shù)據(jù)收集關(guān)鍵詞提取識別文檔中重要詞語或短語,揭示文檔主旨;詞頻統(tǒng)計(jì)計(jì)算詞語出現(xiàn)次數(shù),作為特征提取的一部分,有助于識別文本中的常見主題和模式。關(guān)鍵詞提取和詞頻統(tǒng)計(jì)包括標(biāo)準(zhǔn)化文本格式、分詞、去除停用詞、詞干提取或詞形還原等,將原始文本轉(zhuǎn)換為干凈、結(jié)構(gòu)化的數(shù)據(jù)集。數(shù)據(jù)預(yù)處理公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。7.2會計(jì)文本預(yù)處理7.2會計(jì)文本預(yù)處理7.2.1中文分詞將句子中所有可能詞語掃描出來,可能出現(xiàn)冗余,適用于需要全面覆蓋詞語的場景。精確模式j(luò)ieba的默認(rèn)分詞模式,盡可能準(zhǔn)確地將句子切分成合理詞語,適用于對分詞準(zhǔn)確性要求高的場景。全模式搜索引擎模式在精確模式基礎(chǔ)上對長詞再次切分,提高召回率,適合搜索引擎分詞。7.2會計(jì)文本預(yù)處理7.2.1中文分詞paddle模式基于深度學(xué)習(xí)的分詞模式,利用百度飛槳框架加速分詞過程,提供更精準(zhǔn)的分詞效果。HMM模式利用統(tǒng)計(jì)方法對詞語出現(xiàn)概率建模,用于識別新詞或歧義詞。7.2會計(jì)文本預(yù)處理7.2.2建立詞典創(chuàng)建自定義詞典文件,每行一個詞語,可包含詞頻和詞性,提高特定領(lǐng)域文檔的分詞準(zhǔn)確度。使用jieba.load_userdict()函數(shù)加載自定義詞典并分詞,適應(yīng)特定分詞需求。在程序運(yùn)行時(shí),使用jieba.add_word()動態(tài)添加新詞,靈活調(diào)整分詞結(jié)果。創(chuàng)建自定義詞典加載自定義詞典動態(tài)添加詞語準(zhǔn)備停用詞列表,可自行定制或使用現(xiàn)成停用詞庫,過濾無關(guān)緊要的詞語。準(zhǔn)備停用詞列表使用Python讀取停用詞文件,加載停用詞列表。加載停用詞列表分詞后使用列表推導(dǎo)式或循環(huán)結(jié)構(gòu)過濾停用詞,突出文本中的關(guān)鍵信息。分詞并過濾停用詞使用stopwords.update()方法臨時(shí)添加額外的停用詞,靈活調(diào)整停用詞列表。臨時(shí)添加停用詞7.2會計(jì)文本預(yù)處理7.2.2去除停用詞公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。7.3關(guān)鍵詞提取與詞頻統(tǒng)計(jì)7.3關(guān)鍵詞提取與詞頻統(tǒng)計(jì)7.3.1關(guān)鍵詞提取TF-IDF算法TF-IDF是常用加權(quán)技術(shù),反映詞語在文檔中的重要程度,由TF(詞頻)和IDF(反文檔頻率)組成,jieba提供基于TF-IDF的關(guān)鍵詞提取功能。TextRank算法TextRank是基于圖的排序算法,應(yīng)用于關(guān)鍵詞提取和文本摘要,通過迭代計(jì)算節(jié)點(diǎn)權(quán)重得到穩(wěn)定排名,jieba提供基于TextRank的關(guān)鍵詞提取功能。SnowNLPSnowNLP是處理中文文本的Python庫,提供多種自然語言處理功能,包括關(guān)鍵詞提取,通過SnowNLP提取文本中的關(guān)鍵詞。7.3關(guān)鍵詞提取與詞頻統(tǒng)計(jì)7.3.1關(guān)鍵詞提取使用Python的Counter統(tǒng)計(jì)詞頻,確定文本中各個詞語出現(xiàn)的頻率,揭示文本中的關(guān)鍵信息。統(tǒng)計(jì)詞頻分析詞頻結(jié)果,提取高頻詞語作為關(guān)鍵詞,用于文本分析和信息檢索。分析詞頻結(jié)果公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。7.4詞云圖繪制7.4詞云圖繪制7.4.1基礎(chǔ)詞云圖繪制準(zhǔn)備文本數(shù)據(jù)準(zhǔn)備已分詞的文本數(shù)據(jù),加載自定義詞典,去除停用詞,統(tǒng)計(jì)詞頻。創(chuàng)建WordCloud對象使用wordcloud庫創(chuàng)建WordCloud對象,設(shè)置字體路徑、圖像尺寸、背景顏色等參數(shù)。生成并顯示詞云圖根據(jù)詞頻數(shù)據(jù)生成詞云圖,使用Matplotlib顯示詞云圖,不顯示坐標(biāo)軸。7.4詞云圖繪制7.4.1基礎(chǔ)詞云圖繪制加載背景圖片加載圖片作為背景,用于生成具有特定形狀的詞云圖。01創(chuàng)建自定義WordCloud對象指定中文字體路徑、圖像尺寸、背景、輪廓寬度及輪廓顏色等參數(shù),創(chuàng)建自定義WordCloud對象。02生成詞云圖根據(jù)詞頻統(tǒng)計(jì)字典生成詞云圖,使用背景圖片的顏色重新著色詞云圖。03顯示并保存詞云圖使用Matplotlib顯示詞云圖,保存詞云圖為圖片文件。04公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。謝謝第七章Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。上市公司財(cái)務(wù)數(shù)據(jù)獲取與財(cái)務(wù)狀況分析Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)第八章公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。目錄CONTENTS財(cái)務(wù)數(shù)據(jù)概述8.1數(shù)據(jù)獲取與預(yù)處理8.2財(cái)務(wù)狀況分析8.38.4案例報(bào)告公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。8.1財(cái)務(wù)數(shù)據(jù)概述8.1財(cái)務(wù)數(shù)據(jù)概述財(cái)務(wù)數(shù)據(jù)的基本概念作為企業(yè)經(jīng)營活動的量化表現(xiàn),是評估企業(yè)經(jīng)濟(jì)狀況、預(yù)測未來發(fā)展趨勢的重要依據(jù)。涵蓋了企業(yè)在一定時(shí)期(如年度、季度、月度等)內(nèi)的財(cái)務(wù)活動信息,包括但不限于收入、支出、利潤、資產(chǎn)、負(fù)債等關(guān)鍵指標(biāo)。2.財(cái)務(wù)數(shù)據(jù)的分類按報(bào)表類型分類按經(jīng)濟(jì)性質(zhì)分類按時(shí)間維度分類公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。8.2數(shù)據(jù)獲取與預(yù)處理8.2數(shù)據(jù)獲取與預(yù)處理獲取數(shù)據(jù)刪除列生成列重命名轉(zhuǎn)換數(shù)據(jù)類型百分比顯示轉(zhuǎn)換單位保留兩位小數(shù)描述性統(tǒng)計(jì)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。8.3財(cái)務(wù)狀況分析8.3財(cái)務(wù)狀況分析8.3.1盈利能力分析德邦物流的盈利能力雖然整體有波動但呈增長趨勢。對上市公司進(jìn)行盈利能力分析是評估企業(yè)在一定時(shí)期內(nèi)獲取利潤的能力的重要財(cái)務(wù)分析手段。8.3財(cái)務(wù)狀況分析8.3.2營運(yùn)能力分析德邦物流在營運(yùn)能力方面表現(xiàn)出了一些積極的方面,尤其是在存貨周轉(zhuǎn)率方面表現(xiàn)突出。然而,應(yīng)收賬款周轉(zhuǎn)率的下降和流動資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率的降低,需要公司關(guān)注并采取措施以提高資產(chǎn)的使用效率。8.3財(cái)務(wù)狀況分析8.3.3成長能力分析德邦物流在資產(chǎn)擴(kuò)張和資本實(shí)力增強(qiáng)方面表現(xiàn)出了一定的靈活性,但在盈利面存在較大的不確定性。從整體來看,德邦物流在經(jīng)歷了一段時(shí)間的調(diào)整后,其成長能力正在逐步恢復(fù)并呈現(xiàn)出穩(wěn)定增長的趨勢。8.3財(cái)務(wù)狀況分析8.3.3償債能力分析德邦物流的償債能力在2019—2023年來存在一定的波動。雖然短期償債能力在2021年有所下降,但隨后在2022年得到恢復(fù)并在2023年有所提升。同時(shí),企業(yè)負(fù)債規(guī)模一直在調(diào)整中,資產(chǎn)結(jié)構(gòu)相對穩(wěn)定,負(fù)債水平適中。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。8.4案例報(bào)告8.4案例報(bào)告—上市公司財(cái)務(wù)數(shù)據(jù)獲取與財(cái)務(wù)狀況分析報(bào)告框架如下:1.背景介紹本案例以德邦物流2019—2023年的主要財(cái)務(wù)指標(biāo)為基礎(chǔ),對其財(cái)務(wù)狀況進(jìn)行分析2.數(shù)據(jù)說明從BaoStock中獲取了德邦物流2019—2023年的相關(guān)指標(biāo)數(shù)據(jù),其中盈利能力指標(biāo)8個、營運(yùn)能力指標(biāo)6個、成長能力指標(biāo)5個、償債能力指標(biāo)6個,共計(jì)25個指標(biāo)對數(shù)據(jù)進(jìn)行了整合、轉(zhuǎn)換等預(yù)處理3.財(cái)務(wù)狀況分析盈利能力分析營運(yùn)能力分析成長能力分析償債能力分析5.總結(jié)與建議總結(jié)建議公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。謝謝第四章Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。某行業(yè)財(cái)務(wù)數(shù)據(jù)可視化與對比分析Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)第9章公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。目錄CONTENTS行業(yè)財(cái)務(wù)分析概述9.1數(shù)據(jù)獲取與預(yù)處理9.2財(cái)務(wù)狀況對比分析9.39.4案例報(bào)告公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。9.1行業(yè)財(cái)務(wù)分析概述9.1行業(yè)財(cái)務(wù)分析概述行業(yè)財(cái)務(wù)分析是對一個特定行業(yè)的財(cái)務(wù)情況進(jìn)行詳細(xì)研究和評估的過程。評估這些企業(yè)在行業(yè)中的財(cái)務(wù)表現(xiàn)和競爭力揭示各企業(yè)在行業(yè)中的相對位置識別可改進(jìn)的領(lǐng)域?yàn)槠鋺?zhàn)略規(guī)劃和決策提供數(shù)據(jù)支持幫助投資者、企業(yè)決策者以及其他利益相關(guān)方了解行業(yè)內(nèi)企業(yè)的相對優(yōu)勢和劣勢,做出更為明智的決策。行業(yè)財(cái)務(wù)分析主要包括盈利能力、營運(yùn)能力、成長能力和償債能力4個方面。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。9.2數(shù)據(jù)獲取與預(yù)處理9.2數(shù)據(jù)獲取與預(yù)處理獲取數(shù)據(jù)處理缺失值轉(zhuǎn)換數(shù)據(jù)類型描述性統(tǒng)計(jì)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。9.3財(cái)務(wù)狀況對比分析9.3財(cái)務(wù)狀況對比分析9.3.1盈利能力對比分析繪制箱線圖來對比分析企業(yè)2014—2023年的凈利潤情況繪制折線圖,比較3家白酒企業(yè)的凈資產(chǎn)收益率變化趨勢9.3財(cái)務(wù)狀況對比分析9.3.1盈利能力對比分析繪制銷售凈利率和銷售毛利率的折線圖,對比分析3家企業(yè)的盈利能力。9.3財(cái)務(wù)狀況對比分析9.3.2營運(yùn)能力對比分析通過4個指標(biāo)存貨周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)率、流動資產(chǎn)周轉(zhuǎn)率和總資產(chǎn)周轉(zhuǎn)率的折線圖來對3家企業(yè)的營運(yùn)能力進(jìn)行對比分析。9.3財(cái)務(wù)狀況對比分析9.3.3成長能力對比分析通過凈資產(chǎn)同比增長率、總資產(chǎn)同比增長率、凈利潤同比增長率和基本每股收益同比增長率這4個指標(biāo)的折線圖來對3家企業(yè)的成長能力進(jìn)行對比分析9.3財(cái)務(wù)狀況對比分析9.3.4償債能力對比分析—短期償債能力流動比率、速動比率和現(xiàn)金比率是分析企業(yè)短期償債能力的主要指標(biāo)。通過繪制折線圖分析3家企業(yè)的變化趨勢并進(jìn)行對比。
9.3財(cái)務(wù)狀況對比分析9.3.4償債能力對比分析—長期償債能力總負(fù)債同比增長率、資產(chǎn)負(fù)債率和權(quán)益乘數(shù)是評估企業(yè)長期償債能力的3個重要指標(biāo)。通過繪制對比分析長期償債能力公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。9.4案例報(bào)告9.4案例報(bào)告—白酒行業(yè)財(cái)務(wù)數(shù)據(jù)可視化與對比分析報(bào)告框架如下:1.背景介紹選取2014—2023年這10年間的財(cái)務(wù)數(shù)據(jù),對貴州茅臺、五糧液和山西汾酒3家白酒企業(yè)財(cái)務(wù)數(shù)據(jù)進(jìn)行分析2.數(shù)據(jù)獲取與預(yù)處理通過BaoStock獲取貴州茅臺、五糧液和山西汾酒這三大白酒企業(yè)2014—2023年的四大主要財(cái)務(wù)指標(biāo)數(shù)據(jù)對數(shù)據(jù)進(jìn)行整合、缺失值處理、數(shù)據(jù)類型轉(zhuǎn)換等預(yù)處理3.財(cái)務(wù)狀況對比分析盈利能力對比分析營運(yùn)能力對比分析成長能力對比分析償債能力對比分析5.總結(jié)與建議公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。謝謝第四章Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取?;贙均值聚類的上市公司盈利能力分析Python財(cái)務(wù)數(shù)據(jù)分析與應(yīng)用(微課版)第10章公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。目錄CONTENTS盈利能力概述10.1數(shù)據(jù)處理10.2盈利能力指標(biāo)的描述性統(tǒng)計(jì)與可視化10.310.4基于盈利能力指標(biāo)的K均值聚類與評價(jià)10.5案例報(bào)告10.1盈利能力概述10.1盈利能力概述1.投資者視角:投資決策的核心依據(jù)揭示公司?當(dāng)前財(cái)務(wù)狀況?與?未來盈利潛力?,輔助判斷公司是否具備「持續(xù)收益能力」;評估?財(cái)務(wù)風(fēng)險(xiǎn)?(如償債能力)與?市場競爭力?,為「股息支付、債務(wù)償還」能力提供參考;基于盈利能力指標(biāo),支撐投資者做出?理性投資決策?。2.公司管理層視角:戰(zhàn)略與資源優(yōu)化的抓手制定?業(yè)務(wù)戰(zhàn)略?、優(yōu)化?資源配置?,強(qiáng)化市場競爭力;通過盈利能力分析結(jié)果,制定?激勵機(jī)制?,讓員工與管理層目標(biāo)與「提升盈利能力」高度綁定,推動持續(xù)改進(jìn)與成長。3.市場信心視角:股價(jià)與市值的“強(qiáng)心劑”強(qiáng)勁盈利表現(xiàn)?吸引投資者?,直接帶動?股價(jià)上漲?與?市值提升?,強(qiáng)化市場信心與公司形象。4.監(jiān)管機(jī)構(gòu)視角:合規(guī)與投資者保護(hù)的抓手盈利能力分析是監(jiān)管上市公司?財(cái)務(wù)報(bào)告合規(guī)性?的關(guān)鍵手段,助力保護(hù)投資者利益。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。10.2數(shù)據(jù)處理10.2數(shù)據(jù)處理數(shù)據(jù)獲取數(shù)據(jù)清洗異常值處理數(shù)據(jù)篩選數(shù)據(jù)標(biāo)準(zhǔn)化這里定義超出該指標(biāo)均值8倍及以上的值為異常值。異常值可根據(jù)實(shí)際情況和經(jīng)驗(yàn)決定數(shù)據(jù)極大極小標(biāo)準(zhǔn)化(也稱為最小-最大縮放,Min-MaxScaling)是一種常見的數(shù)據(jù)預(yù)處理技術(shù),用于將數(shù)據(jù)線性轉(zhuǎn)換到特定范圍(通常是[0,1])。其核心思想是利用數(shù)據(jù)集的最小值和最大值進(jìn)行縮放。公眾號:陳西設(shè)計(jì)之家。微信搜索即可。更多免費(fèi)原創(chuàng)PPT模板以及教程設(shè)計(jì)作品源文件可以在公眾號內(nèi)無條件獲取。10.3盈利能力指標(biāo)的描述性統(tǒng)計(jì)與可視化分析10.3盈利能力指標(biāo)的描述性統(tǒng)計(jì)與可視化分析10.3.1盈利能力指標(biāo)的描述性統(tǒng)計(jì)通過describe()查看描述性統(tǒng)計(jì)結(jié)果標(biāo)準(zhǔn)化后各個指標(biāo)的最小值均為0,最大值均為1。10.3盈利能力指標(biāo)的描述性統(tǒng)計(jì)與可視化分析10.3.2盈利能力指標(biāo)的可視化分析指標(biāo)間有明顯的線性趨勢如第二個指標(biāo)“F050102B”(資產(chǎn)報(bào)酬率)和第三個指標(biāo)“F050202B”(總資產(chǎn)凈利潤率)有非常明顯的正相關(guān)關(guān)系。步驟1繪制指標(biāo)的散點(diǎn)矩陣圖
10.3盈利能力指標(biāo)的描述性統(tǒng)計(jì)與可視化分析10.3.2盈利能力指標(biāo)的可視化分析步驟2繪制相關(guān)系數(shù)熱力圖進(jìn)一步驗(yàn)證了指標(biāo)間存在較強(qiáng)的線性關(guān)系如“F050102B”和“F050202B”的相關(guān)系數(shù)高達(dá)0.965410.3盈利能力指標(biāo)的描
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年保健食品考試題及答案
- 2025年教師禁毒談心談話記錄范文大全
- 2025年二級建造師考試題庫及答案
- 2025年臨床婦產(chǎn)考試模擬題(含參考答案)
- 《土木工程測量》課件-前言 3S技術(shù)簡介及發(fā)展趨勢
- 創(chuàng)造宣言友誼的課件
- 創(chuàng)建和諧班級課件
- 金華小升初卷子數(shù)學(xué)試卷
- 遼寧省中職升學(xué)數(shù)學(xué)試卷
- 臨川三年級數(shù)學(xué)試卷
- HYT 215-2017 近岸海域海洋生物多樣性評價(jià)技術(shù)指南
- 校企共建實(shí)訓(xùn)室合作方案
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗(yàn)收規(guī)范
- 預(yù)應(yīng)力筋用錨具、夾具和連接器應(yīng)用技術(shù)規(guī)程JGJ85-2010
- 消化道出血的PBL教學(xué)查房
- 酒吧語言溝通技巧培訓(xùn)課件
- JC/T 170-2012 E玻璃纖維布行業(yè)標(biāo)準(zhǔn)
- 電力行業(yè)溝通技巧精講
- 土耳其語語法課件
- 中藥灌腸技術(shù)技術(shù)操作規(guī)范流程圖
- 風(fēng)電項(xiàng)目施工工藝及流程介紹
評論
0/150
提交評論