怎樣對數(shù)據(jù)進行分析,選擇并做出最能展現(xiàn)問題的圖表?_第1頁
怎樣對數(shù)據(jù)進行分析,選擇并做出最能展現(xiàn)問題的圖表?_第2頁
怎樣對數(shù)據(jù)進行分析,選擇并做出最能展現(xiàn)問題的圖表?_第3頁
怎樣對數(shù)據(jù)進行分析,選擇并做出最能展現(xiàn)問題的圖表?_第4頁
怎樣對數(shù)據(jù)進行分析,選擇并做出最能展現(xiàn)問題的圖表?_第5頁
免費預(yù)覽已結(jié)束,剩余21頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、怎樣對數(shù)據(jù)進行分析,選擇并做由最能展現(xiàn)問題的圖表?互聯(lián)網(wǎng)與不斷出現(xiàn)的便捷工具,讓所有人都可以無須具備數(shù)據(jù)或相關(guān)專長, 就可 以簡單、低成本地將數(shù)據(jù)做成直觀的可視化圖、表。這當然是積極的變化,但也助長了一種本能傾向,即讓數(shù)據(jù)可視化成為了一種匯 報時的必備 流程”,開始無目的地進行可視化,結(jié)果做出的圖表差強人意,比如 機械地把電子表格單元轉(zhuǎn)換為圖表,只能提供支離破碎的信息,或者無效卻擾亂 視聽影響決策的信息,進而無法傳達出完整的理念。正如演講和溝通專家南希 杜瓦特(Nancy Duarte)所說:不要讓聽眾感覺你在 展示一張圖表,而要回顧人的行為,描述曲線變化背后的事件。不是來看我們的三季度財報”

2、,而是來看我們?yōu)槭裁礇]完成目標“今天我們就來說說如何在 呈現(xiàn)可視化數(shù)據(jù)的時候匹配正確的圖表。、數(shù)據(jù)分析目的有兩種:陳述與探索人類大腦對視覺信息的處理優(yōu)于對文本的處理, 因此,用眼睛看的數(shù)據(jù)是更清晰 有效地傳達與溝通信息的一種方式, 核心是有效地傳遞信息。那么使用圖表、圖 形和設(shè)計元素把數(shù)據(jù)進行可視化,可以幫你更容易的解釋數(shù)據(jù)模式、趨勢、統(tǒng)計 規(guī)律和數(shù)據(jù)相關(guān)性,而這些 信息背后的信息”在其他呈現(xiàn)方式下可能難以被發(fā) 現(xiàn)。依據(jù)需要傳達的性質(zhì)和目的,我們將數(shù)據(jù)可視化劃分為陳述型和探索型。 前者一 般是在正式場合向他人傳達信息,比如你想利用手中的大量數(shù)據(jù),報告每季度銷 售情況;后者是當我們想知道為什么最

3、近銷售表現(xiàn)不佳, 于是,探索是因為季節(jié) 性波動或者是促銷力度不夠?(本圖表使用Data Analytics數(shù)據(jù)可視化軟件制作, 原數(shù)據(jù)已做脫敏處理,下同)DATA聞時501t*4*It *A*f?Mk 5陰22.557ffiHAXVnJBILiiilMilMiJV VtllHi P SfiWlri lt|! 11卜124時2芻EM仔實際上,以探索為目標的可視化又可分為兩種, 第一種是上文例子中提到的利用 數(shù)據(jù),用圖表來證實或否定你的假設(shè);第二種是如果對銷售業(yè)績下滑的原因毫無 頭緒,提不出任何假設(shè)呢?就要 仔細分析數(shù)據(jù),尋找其中的規(guī)律、趨勢和異常例如,對比銷售業(yè)績和銷售員負責區(qū)域面積, 有何不同

4、?不同地區(qū)的季節(jié)性波動 有何異同?天氣對銷售造成哪些影響?這種開放性探索能帶來新發(fā)現(xiàn)。開放性數(shù)據(jù)可視化探索,將有助于解答宏觀的戰(zhàn)略問題,如收入為何下降、效率如何提升、 客戶與公司應(yīng)如何互動等。、探索型數(shù)據(jù)可視化探索型數(shù)據(jù)可視化分為兩類:一是假設(shè)檢驗,一是從數(shù)據(jù)中尋找規(guī)律、趨勢和異 常。前者的目標很明確,后者則相對發(fā)散。數(shù)據(jù)體量越大、復(fù)雜度越高、未知因 素越多,探索工作的開放性就越高。1 .假設(shè)檢驗在這類數(shù)據(jù)可視化探索中,你要回答下面兩個問題中的一個:我設(shè)想的情況是否 屬實?如何用不同方式傳達這一信息?在進行求證時,數(shù)據(jù)范圍相對可控,所使用圖表類型較為常規(guī);當然,若想以新 穎方式呈現(xiàn)信息,也可嘗

5、試較少見的圖表。求證型圖表一般不用于正式場合;你 要先自己找到正式展示所需的圖表。 因此,你的時間不應(yīng)花在設(shè)計上,而應(yīng)快速 嘗試不同模板,找到最好的數(shù)據(jù)視覺化方案。2 .開放性探索更多時候,針對數(shù)據(jù)的開放性探索是數(shù)據(jù)科學家和商業(yè)智能分析師的領(lǐng)地,不過新出現(xiàn)的工具例如 DataHunter旗下的Data Analytics軟件讓所有人都可以參 與進來。由于缺少明確目標,開放探索型圖表包含的數(shù)據(jù)范圍較廣, 個別情況下 可能會容納多組數(shù)據(jù),或建立自動更新數(shù)據(jù)的動態(tài)系統(tǒng), 也可用于統(tǒng)計建模。開 放性探索很值得嘗試,因為它經(jīng)常帶來獨一無二的洞見。Data Analytics輕級身舐?lián)梢暬馕銎脚_三、陳

6、述型數(shù)據(jù)可視化我們?nèi)粘9ぷ髦薪佑|最多的是陳述型數(shù)據(jù)可視化,主要涉及常用圖表,一般可在展示中直接使用。這些簡單圖表包括線狀圖、柱狀圖、餅狀圖和散點圖等。這里的可視化需要做到“簡潔 ”。一幅圖表應(yīng)該用有限幾個變量,清晰傳達一個信息。比如目標很明確,為聽眾確認并介紹背景信息。此類圖表常用于正式展示,對清晰度和邏輯性要求也很高。正式展示通常時間有限, 如果圖表設(shè)計不理想,介紹人就必須停下來解釋,而圖表中的信息本應(yīng)一目了然。 這并不是說陳述性圖表不應(yīng)引發(fā)討論,但討論應(yīng)針對圖表傳達的理念,而非圖表本身。接下來數(shù)獵哥按照構(gòu)成分析、對比分析、分布分析、關(guān)系分析, 4個方面,為大家介紹幾種常見的數(shù)據(jù)可視化圖表。

7、四、常見可視化圖表之一:構(gòu)成分析1 .餅圖/環(huán)形圖餅圖經(jīng)常表示一組數(shù)據(jù)的占比,需要數(shù)值維度。如圖,各扇形面積代表各類型裝 修材料銷售額的大小,整體為裝修材料總銷售額。右側(cè)環(huán)形圖為餅圖的變種,中 心區(qū)域可展示數(shù)據(jù)或者文本信息。餅圖也是有缺陷的,例如30%ffi 35%在餅圖上憑肉眼是難以分辨出區(qū)別的。 當類 別過多,也不適宜在餅圖上表達。因此在使用餅圖時我們需要順時針降序排列, 同時維度取值在10個以內(nèi)。2 .玫瑰圖玫瑰圖是餅圖的變種,用來對比不同類別的數(shù)值大小,在數(shù)值相差不大的時候使 用。如圖,廣東省、江蘇省、山東省的 GDP數(shù)額差別不是太大,如果只是使用 常規(guī)餅圖,難以對比三者的大小,使用玫

8、瑰圖則很顯然廣東省數(shù)值江蘇省山 東省 3 .旭日圖旭日圖也是餅圖的變種,表現(xiàn)整體在各個維度上的構(gòu)成,以及維度與維度之間的 從屬關(guān)系。如圖,可以清楚看到整體的銷售額在三大類產(chǎn)品的分布, 而每類產(chǎn)品 的各品牌銷售額區(qū)別也可以直接對比,同時也可以看到每類產(chǎn)品的品牌分布。手機小米4.儀表盤模仿汽車儀表盤,采用絕對值與相對值結(jié)合的方式,展現(xiàn)某個指標的完成情況, 在項目進度,計劃完成度較常見。只適合展現(xiàn)數(shù)據(jù)的累計情況,不適用于數(shù)據(jù)的 分布特征等,同時一般超過100%后不太好表現(xiàn)。5 .矩形樹圖當我們想表達過多類型的數(shù)據(jù)時, 可以使用矩形樹圖,它展現(xiàn)同一層級的不同分 類的占比情況,還可以同一個分類下子級的占

9、比情況,每個矩形代表一個聚合類, 顏色的深淺和面積的大小代表這個聚合類的大小。如圖,比如電子商務(wù)、產(chǎn)品銷售等涉及大量商品品類的分析等。局限是不適合展現(xiàn)不同層級的數(shù)據(jù),比如組織架構(gòu)圖,每個分類不適合放在一起 看占比情況。且當以面積表示大小,當數(shù)值相近時人眼難以辨別,當然可通過填 充數(shù)值彌補。6 .瀑布圖采用絕對值與相對值結(jié)合的方式,展示各成分構(gòu)成情況,更多的用于核心指標的 分解,適合展示數(shù)據(jù)累積變化過程,局限是各類數(shù)據(jù)差別太大則難以比較。如圖核心指標為凈利潤,可以看到核心指標由收入和成本計算得出,而收入方面 營業(yè)收入占據(jù)主要,支出方面營業(yè)成本占據(jù)主要。我們可以提升營業(yè)收入或降低 營業(yè)成本來提升公

10、司凈利潤。 第 1 L五、常見可視化圖表之二:對比分析1 .柱狀圖/多指標柱狀圖柱狀圖是一種應(yīng)用得很廣泛的圖形, 它表征分類型變量與數(shù)值型變量的關(guān)系, 常 用于多個維度的比較和變化。柱形圖至少需要一個數(shù)值型維度,通常文本維度/ 時間維度通常作為X軸,數(shù)值型維度作為Y軸。一般需要排序,如果分類型變量是有序的,按照它本身的順序排列即可,如果分 類型變量無序,那么則根據(jù)數(shù)值型變量的大小進行排序, 使柱狀圖的高度單調(diào)變 化。如左圖,各類型裝修材料的銷售數(shù)量對比,右圖為各類型裝修材料的銷售額 及銷售成本對比。2 .條形圖/多指標條形圖類似柱狀圖,只不過兩根軸對調(diào)了一下。因為有大量空白位置標示每個類別的名

11、 稱,所以適用于類別名稱過長的情況,但分類過多則無法展示數(shù)據(jù)特點。3 .象形圖以形象化的圖片數(shù)量代表維度數(shù)值的大下, 多用于具體實物的對比。如圖,其中 將辦公用品、技術(shù)產(chǎn)品和家居產(chǎn)品用形象化圖形來代表其維度, 讓觀眾者很容易 了解到這組數(shù)據(jù)的維度表示。-M*. iL IP i i11. iLmii / ffirurorururor丹丹丹-n&nSnn 4 .堆積柱圖/堆積條圖用來比較同類別各變量和不同類別變量總和差異。 需要注意的是堆積柱內(nèi)各項問 具有相同性質(zhì)的維度劃分,最好不要是不同的度量。如圖,柱與柱之間表示各區(qū) 域訂單數(shù)量對比,華南訂單數(shù)量可以看到是由三個產(chǎn)品訂單數(shù)量組成。 可同時對 比

12、三個類別產(chǎn)品在各區(qū)域訂單數(shù)量。5 i5 .折線圖折線圖是用來觀察數(shù)據(jù)的趨勢,主要展示數(shù)據(jù)隨時間或有序類別的波動情況的趨 勢變化。對比時使用,常見時間維度對比。如果是無序類別則無法展示數(shù)據(jù)特點。6 .面積圖用面積展示數(shù)值大小,展示數(shù)量隨時間變化的趨勢。多用于時間維度的對比,其 中堆積面積圖中堆積部分需要是具有相同性質(zhì)的維度劃分。7 .雷達圖雷達圖將多個分類的數(shù)據(jù)量映射到坐標軸上, 對比某項目不同屬性的特點,適用 于了解同類別的不同屬性的綜合情況,以及比較不同類別的相同屬性差異。它在 商務(wù)、財務(wù)領(lǐng)域應(yīng)用較大,常見于經(jīng)營狀況,財務(wù)健康程度。比如對企業(yè)財務(wù)進 行分析,劃分出六大類:銷售、市場、研發(fā)、客

13、服、技術(shù)、管理。通過雷達圖繪 制出預(yù)算和實際開銷的維度對比, 會很清晰。另外在游戲中也應(yīng)用廣泛,如圖游 戲人物的各項數(shù)值對比。而娼曷耳e?者庫安單轆M逆器期徨這里需要注意雷達圖的數(shù)據(jù)必須進行標準化處理,同時指標是正向且可以比較 的,也就是指標代表越好,且當指標差異較大時,需要進行標準化,消除單位影 響。另外雷達圖是靜態(tài)數(shù)據(jù),不可能有時間維度,同時能表達的靜態(tài)數(shù)據(jù)信息有 限,線條不宜超過5條,指標不宜超過8個。8 .對比條圖兩個項目在各個維度的對比時使用。 如圖展示了廣東省、江蘇省、山東省和浙江 省在2015年與2016年的GDP對比,可以看到四省對比,廣東省 GDP較高,而 2015年與201

14、6年GDP對比,則2016年增長明顯。9 .子彈圖對比條形圖的變種,多用于對比實際與目標之間的差距。 如圖表現(xiàn)的是各樂行裝 修材料的銷售額完成度,且均存在深度灰色以內(nèi),表現(xiàn)不理想。表現(xiàn)極差喪現(xiàn)較差低于預(yù)期超出預(yù)期10 .雙軸圖以左右兩個Y軸的形式,展示同一維度下不同指標的情況。兩個坐標軸的圖表類 型選擇需要區(qū)分開。Ma11 .帕累托圖雙軸圖變種,用來分析原因,確定產(chǎn)生問題的主要原因。如圖可以看到,特殊節(jié) 日和行業(yè)旺季是此次數(shù)據(jù)異常的最重要原因, 兩項占比達到了 56%,可加強此階 段的促銷,幫助銷量增長。 6I12 .漏斗圖漏斗圖是流程轉(zhuǎn)化分析,適用于關(guān)鍵業(yè)務(wù)環(huán)節(jié)數(shù)據(jù)比較,將各環(huán)節(jié)串聯(lián)起來構(gòu)成

15、 漏斗,量化流程內(nèi)環(huán)節(jié),追蹤各環(huán)節(jié)轉(zhuǎn)化率。轉(zhuǎn)化是漏斗圖主要表達的信息。例 如在網(wǎng)站的用戶行為分析中,如圖,反映了報告瀏覽人數(shù)中,有5%的用戶下載了此報告。在實際工作中,各種業(yè)務(wù)流程均可構(gòu)建漏斗。13.詞云詞云主要展現(xiàn)文本信息,對出現(xiàn)頻率較高的 關(guān)鍵詞”予以視覺上的突出,常用于 對比文本出現(xiàn)頻次。如用戶畫像標簽,搜索關(guān)鍵詞頻次、新聞關(guān)鍵詞頻次。如圖 為各類型裝修材料的搜索次數(shù),可以看到國產(chǎn)強化的搜索次數(shù)較高,可加大此類 關(guān)鍵詞的搜索營銷。帛規(guī) 非實木地熱 出A字拼 拼花國產(chǎn)強化混搭實木地熱腳線進口強化六、常見可視化圖表之三:分布1.散點圖/氣泡圖/四象限圖散點圖在報表中不常用到,但是數(shù)據(jù)分析中比

16、較常見。散點圖通過坐標軸來揭示 數(shù)據(jù)間的關(guān)系,發(fā)掘變量與變量之間的關(guān)聯(lián),當存在大量數(shù)據(jù)點,結(jié)果更精準, 比如回歸分析。當數(shù)據(jù)量小的時候會比較混亂。 氣泡圖是散點圖的變種,它使用 氣泡代替散點圖的數(shù)值點,面積大小代表數(shù)值大小。如圖使用銷售額和利潤來定位不同類別產(chǎn)品, 位于右上角的產(chǎn)品為銷售額高、利 潤也高的明星產(chǎn)品;左下角的銷售額、利潤都不高的產(chǎn)品,為滯銷品。2地圖一切和空間屬性有關(guān)的分析都可以用到地理圖。 比如各地區(qū)銷量,或者某商業(yè)區(qū) 域店鋪密集度等。一般用顏色深淺或氣泡大小來展示區(qū)域范圍的數(shù)值大小。 比如 人口密度、各地區(qū)銷量,或者某商業(yè)區(qū)域店鋪密集度等。4.熱力圖3.箱線圖箱線圖(Boxp

17、lot)也稱箱須圖(Box-whisker Plot),它是用一組數(shù)據(jù)中的最小值、 第一四分位數(shù)、中位數(shù)、第三四分位數(shù)和最大值來反映數(shù)據(jù)分布的中心位置和散 布范圍,可以粗略地看出數(shù)據(jù)是否具有對稱性。 通過將多組數(shù)據(jù)的箱線圖畫在同 一坐標上,則可以清晰地顯示各組數(shù)據(jù)的分布差異,為發(fā)現(xiàn)問題、改進流程提供線索。假如你是一位互聯(lián)網(wǎng)電商分析師, 你想知道某商品每天的賣出情況:該商品被用戶最多購買了幾個,大部分用戶購買了幾個,用戶最少購買了幾個。箱線 圖就能很清晰的表示出上面的幾個指標以及變化。另外企業(yè)產(chǎn)品質(zhì)量管理、人事測評、探索性數(shù)據(jù)分析等統(tǒng)計分析活動也經(jīng)常會被 應(yīng)用到,如圖,可以發(fā)現(xiàn),華北地區(qū)出現(xiàn)超出

18、范圍的異常值,可通過結(jié)合業(yè)務(wù)場 景分析異常原因。熱力圖可以用于對比兩個維度的數(shù)值大小, 用顏色深淺代表數(shù)值的大小。熱力圖 在網(wǎng)頁分析、業(yè)務(wù)數(shù)據(jù)分析等其他領(lǐng)域也有較為廣泛的應(yīng)用。 如圖展示了不同區(qū) 域在不同時間的訂單數(shù)量。七、常見可視化圖表之四:關(guān)系分析1 .?;鶊D?;鶊D是一種特定類型的流程圖,圖中延伸的分支寬度對應(yīng)數(shù)據(jù)流量的大小, 它 常表示信息的變化和流動狀態(tài)。常用于能源、材料成分、金融等數(shù)據(jù)的可視化分 析,還有網(wǎng)站用戶行為路徑的分析。如圖,可以看到用戶在登錄后的行為,以及 下一步行為。AM2 .關(guān)系樹圖表現(xiàn)各個維度之間的關(guān)系,多用于組織架構(gòu)分析,如圖可以表現(xiàn)不同類型產(chǎn)品的 組合方式。Wf.鼻孑A*-MA 4嚏-j .4shM3 .關(guān)系圖 表現(xiàn)各個維度之間的關(guān)系,及各關(guān)系間的關(guān)系強弱。比如社交關(guān)系鏈、品牌傳播、 或者某種信息的流動。如圖展示不同類型產(chǎn)品的銷售額貢獻情況, 如辦公產(chǎn)品的 銷售額由哪些產(chǎn)品貢獻。八、小結(jié)數(shù)據(jù)可視化是借助圖形化手段,更清晰有效地傳達與溝通信息的一種方式, 在傳 達信息這個目的之下,我們就要正確地進行選擇,首先需要依據(jù)數(shù)據(jù)類型和目的 選擇正確的圖表類型。當我們做數(shù)據(jù)可視化時,可以先對現(xiàn)有的數(shù)據(jù)進行分析,得出自己的初步結(jié)論, 明確要表達的信息和主題(即,你通過圖表要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論