




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)1認(rèn)知數(shù)據(jù)整理任務(wù)導(dǎo)入請(qǐng)對(duì)上述數(shù)據(jù)進(jìn)行整理,并說(shuō)出某電商平臺(tái)60個(gè)店鋪銷售方面有哪些數(shù)據(jù)特征?!?shù)據(jù)整理的概念和意義(一)數(shù)據(jù)整理的概念數(shù)據(jù)整理:是指根據(jù)數(shù)據(jù)采集與處理的目的和任務(wù),對(duì)數(shù)據(jù)采集、觀察、實(shí)驗(yàn)等研究活動(dòng)中所采集到的資料進(jìn)行檢驗(yàn)、歸類編碼和數(shù)字編碼,使之條理化、系統(tǒng)化,從而以集中、簡(jiǎn)明的方式反映所研究數(shù)據(jù)采集對(duì)象特征的工作過(guò)程?!?、數(shù)據(jù)整理的概念和意義為什么要進(jìn)行數(shù)據(jù)整理?數(shù)據(jù)采集所取得的原始資料或二手資料是反映數(shù)據(jù)采集對(duì)象各個(gè)單位的資料,這些資料往往是不系統(tǒng)的、分散的,可能有一定的局限性,因此,必須進(jìn)行相應(yīng)的整理。
例如,從某網(wǎng)店平臺(tái)上采集到的購(gòu)買者資料,只能說(shuō)明每一個(gè)人的個(gè)別情況,諸如每個(gè)人的姓名、性別、文化程度、職業(yè)、愛(ài)好等,難以構(gòu)建職業(yè)、性別等與購(gòu)買商品之間的關(guān)系。因此,必須通過(guò)對(duì)大量購(gòu)買者的資料進(jìn)行整理、分組、匯總等加工處理,才能得到數(shù)據(jù)采集對(duì)象的綜合特征資料,從而了解數(shù)據(jù)采集對(duì)象的職業(yè)、性別、年齡等對(duì)購(gòu)買行為的影響,實(shí)現(xiàn)對(duì)購(gòu)買者全面系統(tǒng)的認(rèn)識(shí)?!?、數(shù)據(jù)整理的概念和意義(二)數(shù)據(jù)整理的意義1.能夠挖掘數(shù)據(jù)的特征,提高數(shù)據(jù)信息的質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)系統(tǒng)化、有序化。2.數(shù)據(jù)整理是檢驗(yàn)數(shù)據(jù)質(zhì)量的關(guān)鍵環(huán)節(jié),也為后續(xù)的數(shù)據(jù)分析提供必要的數(shù)據(jù)形式。二、數(shù)據(jù)整理的步驟(一)設(shè)計(jì)數(shù)據(jù)整理方案數(shù)據(jù)整理方案的主要內(nèi)容一般包括:確定匯總的核心指標(biāo)與綜合數(shù)據(jù)處理表,確定數(shù)據(jù)分組方案,選擇資料匯總形式,確定資料審查的內(nèi)容與方法,以及對(duì)整理各工作環(huán)節(jié)做出時(shí)間安排和先后順序安排等。(二)對(duì)原始資料或次級(jí)資料進(jìn)行審核資料的審核是數(shù)據(jù)處理工作的第一步,為了保證數(shù)據(jù)資料的質(zhì)量,在對(duì)原始資料或次級(jí)資料進(jìn)行匯總之前,必須對(duì)其進(jìn)行審核,以便發(fā)現(xiàn)向題及時(shí)糾正,只有經(jīng)過(guò)認(rèn)真審核后的資料才能進(jìn)行匯總。二、數(shù)據(jù)整理的步驟(三)對(duì)原始資料進(jìn)行分組和匯總根據(jù)數(shù)據(jù)整理的要求,采用科學(xué)的方法對(duì)原始資料進(jìn)行數(shù)據(jù)分組,在此基礎(chǔ)上進(jìn)行匯總,計(jì)算出各組的數(shù)據(jù)采集對(duì)象單位數(shù)和合計(jì)數(shù),匯總出各組的指標(biāo)數(shù)值和綜合指標(biāo)數(shù)值。(四)編制數(shù)據(jù)分組表或繪制數(shù)據(jù)透視圖數(shù)據(jù)整理的結(jié)果,必須用一定的方式呈現(xiàn)出來(lái)。數(shù)據(jù)分組表和數(shù)據(jù)透視圖是表現(xiàn)數(shù)據(jù)的兩種主要方式。通過(guò)數(shù)據(jù)分組表或透視圖表現(xiàn)數(shù)據(jù),能夠簡(jiǎn)潔、清晰的反映數(shù)據(jù)特征,便于數(shù)據(jù)運(yùn)用。三、數(shù)據(jù)的審核(一)數(shù)據(jù)審核的內(nèi)容1.數(shù)據(jù)的真實(shí)性審核資料的真實(shí)性審核主要是審核資料來(lái)源的客觀性問(wèn)題,數(shù)據(jù)資料來(lái)源必須是客觀的。數(shù)據(jù)準(zhǔn)確性審核的方法主要是邏輯審核和計(jì)算審核,把那些違背常理的、前后矛盾的資料舍去,對(duì)于不準(zhǔn)確或有疑問(wèn)的數(shù)據(jù),要仔細(xì)核對(duì),并加以糾正。三、數(shù)據(jù)的審核(一)數(shù)據(jù)審核的內(nèi)容2.資料的準(zhǔn)確性審核準(zhǔn)確的審核要著重檢查那些含糊不清的、籠籠統(tǒng)統(tǒng)的以及互相矛盾的資料。3.數(shù)據(jù)的及時(shí)性審核對(duì)數(shù)據(jù)及時(shí)性的審核就是檢查數(shù)據(jù)是否符合時(shí)效性的要求。4.數(shù)據(jù)的完整性審核對(duì)數(shù)據(jù)完整性的審核,主要是看被采集單位有無(wú)遺漏,各項(xiàng)數(shù)值的填寫(xiě)是否齊全,項(xiàng)目是否完備等。對(duì)于有漏報(bào)的項(xiàng)目應(yīng)補(bǔ)齊,否則影響整個(gè)數(shù)據(jù)整理工作的進(jìn)行,進(jìn)而影響整個(gè)數(shù)據(jù)處理工作。三、數(shù)據(jù)的審核(二)審核應(yīng)注意的問(wèn)題在審核中,如發(fā)現(xiàn)問(wèn)題可以分不同的情況予以處理:1.對(duì)于在數(shù)據(jù)采集中已發(fā)現(xiàn)并經(jīng)過(guò)認(rèn)真核實(shí)后確認(rèn)的錯(cuò)誤,可以由采集者代為更正。2.對(duì)于資料中可疑之處或有錯(cuò)誤與出入的地方,應(yīng)進(jìn)行補(bǔ)充調(diào)查。3.無(wú)法進(jìn)行補(bǔ)充采集的應(yīng)堅(jiān)決剔除那些有錯(cuò)誤的資料,以保證資料的真實(shí)準(zhǔn)確。三、數(shù)據(jù)的審核(三)初級(jí)數(shù)據(jù)存在的問(wèn)題通過(guò)各種渠道采集來(lái)的數(shù)據(jù),常常出現(xiàn)缺失、異常、冗余、不一致的現(xiàn)象,并不能直接為數(shù)據(jù)分析所用。此外,一些成熟的數(shù)據(jù)分析模型對(duì)處理的數(shù)據(jù)有要求,比如一定的數(shù)據(jù)類型、統(tǒng)一的數(shù)據(jù)量綱以及數(shù)據(jù)冗余性要求、屬性的相關(guān)性要求等。因此,必須對(duì)原始數(shù)據(jù)進(jìn)行處理才能進(jìn)行分析。具體來(lái)說(shuō),原始數(shù)據(jù)主要存在以下幾個(gè)問(wèn)題:三、數(shù)據(jù)的審核(三)初級(jí)數(shù)據(jù)存在的問(wèn)題1.重復(fù)數(shù)據(jù)。重復(fù)數(shù)據(jù)是指在數(shù)據(jù)表中唯一標(biāo)識(shí)記錄的字段出現(xiàn)多次的數(shù)據(jù)。2.缺失數(shù)據(jù)。缺失數(shù)據(jù)是指在實(shí)踐過(guò)程中因沒(méi)有能夠獲取觀測(cè)對(duì)象的相關(guān)信息而不完整的數(shù)據(jù)。例如,在抽樣數(shù)據(jù)采集中,被數(shù)據(jù)采集對(duì)象拒絕提供相關(guān)信息;又如某些實(shí)驗(yàn)中,因各種原因沒(méi)能獲取實(shí)驗(yàn)數(shù)據(jù),或者數(shù)據(jù)錄入、存儲(chǔ)過(guò)程中的人為失誤和系統(tǒng)軟硬件問(wèn)題,都有可能造成數(shù)據(jù)缺失。缺失數(shù)據(jù)會(huì)影響分析結(jié)果的可信度,甚至使分析結(jié)果出現(xiàn)嚴(yán)重偏差。三、數(shù)據(jù)的審核(三)初級(jí)數(shù)據(jù)存在的問(wèn)題3.異常值。異常值是指所獲得的數(shù)據(jù)中與平均值的偏差超過(guò)兩倍標(biāo)準(zhǔn)差的數(shù)據(jù),也稱為離群點(diǎn)。例如,錄入數(shù)據(jù)時(shí)誤將90錄入為900,那么當(dāng)數(shù)據(jù)均為100左右的數(shù)據(jù)時(shí),900就會(huì)被識(shí)別為異常值。異常值的存在會(huì)嚴(yán)重影響數(shù)據(jù)分析的結(jié)果,例如使平均值偏高或偏低,使方差增大,影響數(shù)據(jù)模型的擬合優(yōu)度等。此外,若異常值不是錯(cuò)誤數(shù)據(jù),就應(yīng)是數(shù)據(jù)分析人員關(guān)注的焦點(diǎn)。三、數(shù)據(jù)的審核(三)初級(jí)數(shù)據(jù)存在的問(wèn)題5.不一致數(shù)。不一致數(shù)據(jù)一般表現(xiàn)為以下三個(gè)方面:一是人工或機(jī)械原因?qū)е碌匿浫脲e(cuò)誤或數(shù)據(jù)規(guī)范不同。例如將數(shù)據(jù)集中的“客單價(jià)”錄入為“-150”;又如變量名“用戶編碼”下,某數(shù)據(jù)的規(guī)范是“3位/數(shù)字”,在另一數(shù)據(jù)集中則要求“5位/字母+數(shù)字”。二是變量單位或者量綱不匹配。例如,某數(shù)據(jù)集中的商品價(jià)格以“元”為單位,另一數(shù)據(jù)集中卻為“萬(wàn)元”。三是數(shù)據(jù)特征不適應(yīng)特定數(shù)據(jù)分析模型的需求或變量過(guò)多,分析難度較大。例如,手機(jī)系統(tǒng)為Andriod和iOS兩種,但回歸分析模型中要求數(shù)據(jù)是數(shù)值型的,可以將其轉(zhuǎn)換名義變量(0/1變量)再進(jìn)行處理。項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)2認(rèn)知數(shù)據(jù)清洗一、數(shù)據(jù)清洗概述數(shù)據(jù)清洗是指對(duì)數(shù)據(jù)進(jìn)行重新審查和校驗(yàn)的過(guò)程中,發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤,按照一定的規(guī)則把錯(cuò)誤或沖突的數(shù)據(jù)洗掉,包括檢查數(shù)據(jù)一致性,處理無(wú)效值、缺失值和冗余值等,數(shù)據(jù)清理一般是由計(jì)算機(jī)而不是人工完成。二、數(shù)據(jù)清洗的方法缺失數(shù)據(jù)一般在數(shù)據(jù)表中表現(xiàn)為空白單元格或錯(cuò)誤標(biāo)識(shí)符(#div/0!)。檢測(cè)方法:在Excel軟件中可單擊“開(kāi)始”選項(xiàng)卡的“編輯”功能區(qū),通過(guò)“定位”→“定位條件”→“空值”→“確定”(或者使用【Ctrl+G】組合鍵),將缺失數(shù)據(jù)一次性選定。(一)缺失數(shù)據(jù)的清洗符號(hào)產(chǎn)生原因解決方法#DIV/0!①公式中的除數(shù)使用了指向空白單元格或包含零值的單元格的引用②輸入的公式中包含明顯的除數(shù)零①修改單元格引用,或在用作除數(shù)的單元格中輸入不為零的值②將零改為非零值二、數(shù)據(jù)清洗的方法(一)缺失數(shù)據(jù)的清洗處理方法:①忽略缺失值:將有缺失數(shù)據(jù)的記錄保留,僅在相應(yīng)的分析中做必要的排除。當(dāng)調(diào)查的樣本量比較大,缺失數(shù)據(jù)的數(shù)量又不是很多,而且變量之間也不存在高度相關(guān)的情況下,采用這種方式處理缺失數(shù)據(jù)比較可行。②刪除缺失值:將有缺失數(shù)據(jù)的記錄刪除,刪除記錄會(huì)導(dǎo)致樣本量減少,所以此方法不適于小樣本量的數(shù)據(jù)集。③填充缺失值:如果可以推斷出正確數(shù)值,則填充為邏輯正確值如果無(wú)法推斷出正確數(shù)值,則可以填充“未知”,或者用樣本統(tǒng)計(jì)量代替缺失數(shù)據(jù),最典型的做法是使用變量的平均值替代。替代后由于該變量的平均值會(huì)保持不變,因此其他的統(tǒng)計(jì)量(如標(biāo)準(zhǔn)差和相關(guān)系數(shù)等)也不會(huì)受很大的影響。二、數(shù)據(jù)清洗的方法(一)缺失數(shù)據(jù)的清洗練習(xí)題:整理某店鋪9月的銷售數(shù)據(jù),其中9月25日的支付金額和客單價(jià)數(shù)據(jù)缺失??紤]到每天的客單價(jià)相對(duì)穩(wěn)定,因此可以用平均客單價(jià)代替缺失數(shù)據(jù)。步驟1:選中D列,在Excel窗口下方的狀態(tài)欄中可以看到平均值為152.7。
步驟2:在D7單元格中輸入152.7,然后選擇B7單元格,在編輯欄中輸入公式"=C7*D7"按【Enter】鍵確認(rèn),得出支付金額數(shù)據(jù)。二、數(shù)據(jù)清洗的方法二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗為了保證數(shù)據(jù)的一致性,我們需要對(duì)重復(fù)數(shù)據(jù)進(jìn)行處理。在完成重復(fù)數(shù)據(jù)的查找后,即可刪除重復(fù)數(shù)據(jù)。實(shí)體重復(fù)字段重復(fù)所有字段完全重復(fù)某一個(gè)或多個(gè)不該重復(fù)的字段重復(fù),如Name字段重復(fù)重復(fù)數(shù)據(jù)
的類型二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗選擇“開(kāi)始”|“條件格式”|“突出顯示單元格規(guī)則”|“重復(fù)值”命令把重復(fù)的數(shù)據(jù)及其所在單元格標(biāo)為不同顏色以便識(shí)別條件格式法重復(fù)數(shù)據(jù)的查找高級(jí)篩選法函數(shù)法數(shù)據(jù)透視表法利用Excel的“高級(jí)篩選”功能,選擇不重復(fù)的記錄選擇不重復(fù)的記錄該函數(shù)的語(yǔ)法規(guī)則:COUNTIF(range,criteria)range:計(jì)算其中非空單元格數(shù)目的區(qū)域criteria:以數(shù)字、表達(dá)式或文本形式定義的條件利用COUNTIF函數(shù)對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別拖動(dòng)選擇相應(yīng)字段,設(shè)置“計(jì)數(shù)”匯總,其中出現(xiàn)兩次及以上的數(shù)據(jù)就屬于重復(fù)項(xiàng)統(tǒng)計(jì)各數(shù)據(jù)出現(xiàn)的頻次二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗通過(guò)按鈕刪除重復(fù)項(xiàng)通過(guò)排序刪除重復(fù)項(xiàng)通過(guò)篩選刪除重復(fù)項(xiàng)單擊“數(shù)據(jù)”選項(xiàng)卡下的“刪除重復(fù)項(xiàng)”按鈕,將顯示有多少重復(fù)值被刪除,有多少唯一值被保留在利用COUNTIF函數(shù)對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別的基礎(chǔ)上,對(duì)有重復(fù)標(biāo)記的列進(jìn)行降序排列,刪除數(shù)值大于1的項(xiàng)在利用COUNTIF函數(shù)對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別的基礎(chǔ)上,對(duì)有重復(fù)標(biāo)記的列進(jìn)行篩選,篩選出數(shù)值不等于1的項(xiàng)刪除重復(fù)數(shù)據(jù)的方法二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗練習(xí)題:利用第三方采集工具從京東商城采集關(guān)于玻璃杯的商品數(shù)據(jù),其中包含了多條重復(fù)的數(shù)據(jù),請(qǐng)用不同方法對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別,并刪除重復(fù)數(shù)據(jù)。二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗練習(xí)題:COUNTIF函數(shù)法:1.在“京東價(jià)”左側(cè)插入一列,標(biāo)題設(shè)為“第幾次出現(xiàn)”2.在C2單元格輸入公式“=COUNTIF($B$2:B2,B2)”,該公式用于對(duì)“商品ID”進(jìn)行計(jì)數(shù)3.篩選出大于1的數(shù)據(jù),即為重復(fù)數(shù)據(jù)(也可排序找出重復(fù)數(shù)據(jù),但順序會(huì)亂)二、數(shù)據(jù)清洗的方法實(shí)操練習(xí):在采集某商品的庫(kù)存數(shù)據(jù)時(shí),由于部分SKU(商品最小存貨單位)的期初庫(kù)存和期末庫(kù)存數(shù)據(jù)無(wú)法采集,導(dǎo)致對(duì)應(yīng)的庫(kù)存周轉(zhuǎn)率結(jié)果錯(cuò)誤,同時(shí)考慮到這些數(shù)據(jù)無(wú)法手動(dòng)修改。因此,這里僅需要對(duì)表格中的錯(cuò)誤信息進(jìn)行處理,即對(duì)于數(shù)據(jù)不完整的SKU,其庫(kù)存周轉(zhuǎn)率用“/”號(hào)來(lái)表示,最后再對(duì)整個(gè)表格的數(shù)據(jù)進(jìn)行去重檢查與處理。1選擇單元格區(qū)域、設(shè)置公式2修改錯(cuò)誤、刪除重復(fù)數(shù)據(jù)二、數(shù)據(jù)清洗的方法3擴(kuò)展選定區(qū)域、設(shè)置檢查項(xiàng)4提示已經(jīng)刪除了重復(fù)數(shù)據(jù)專家點(diǎn)撥:
IFERROR
函數(shù)的語(yǔ)法格式為"
IFERROR
(
Value
,
Value
_
If
_
Error
)",該函數(shù)可用于捕獲和處理公式中的錯(cuò)誤。如果公式的計(jì)算結(jié)果為錯(cuò)誤值,則
IFERROR
函數(shù)將返回參數(shù)"
Value
_
If
_
Error
"所設(shè)置的值,否則將返回參數(shù)"
Value
"的值。二、數(shù)據(jù)清洗的方法二、數(shù)據(jù)清洗的方法(三)錯(cuò)誤數(shù)據(jù)的清洗錯(cuò)誤原因查找方法清洗方法手工錄入錯(cuò)誤條件格式標(biāo)注錯(cuò)誤值錯(cuò)誤數(shù)據(jù)清洗輸入不符合要求其他原因COUNTIF函數(shù)糾正錯(cuò)誤二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:(1)被調(diào)查者輸入的信息不符合要求在進(jìn)行問(wèn)卷調(diào)查時(shí),多項(xiàng)選擇題最多可選3項(xiàng),但被調(diào)查者選擇了4項(xiàng)或4項(xiàng)以上。對(duì)于這種情況,我們可以結(jié)合COUNTIF函數(shù),根據(jù)指定的條件利用IF函數(shù)來(lái)判斷其真假,然后根據(jù)邏輯計(jì)算的真假值(TRUE或FALSE)返回相應(yīng)的內(nèi)容。以客戶滿意度調(diào)查中的多項(xiàng)選擇題為例,介紹如何找出不符合要求的數(shù)據(jù)。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法1-使用COUNTIF函數(shù)完成檢驗(yàn)步驟1:針對(duì)"題目1"設(shè)置了
A
、
B
、
C
、
D
、
E
、
F
、
G
共7個(gè)選項(xiàng),這7個(gè)選項(xiàng)共有4條相關(guān)記錄,這4條記錄分別代表了4個(gè)客戶對(duì)"題目1"的回答,可以看出"客戶2"選擇了4項(xiàng),不符合最多可選3項(xiàng)的要求。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法1-使用COUNTIF函數(shù)完成檢驗(yàn)步驟2:選擇I3單元格,在編輯欄中輸入公式=COUNTIF(B3:H3,“<>0),該公式用于判斷被調(diào)查者是否選擇了3項(xiàng)以上。步驟3:選中檢驗(yàn)列,“條件格式”-“突出顯示單元格規(guī)則”-“大于”-3,對(duì)所有大于3的單元格突出顯示二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法2-使用COUNTIF和IF函數(shù)完成檢驗(yàn)步驟1:針對(duì)"題目1"設(shè)置了
A
、
B
、
C
、
D
、
E
、
F
、
G
共7個(gè)選項(xiàng),這7個(gè)選項(xiàng)共有4條相關(guān)記錄,這4條記錄分別代表了4個(gè)客戶對(duì)"題目1"的回答,可以看出"客戶2"選擇了4項(xiàng),不符合最多可選3項(xiàng)的要求。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法2-使用COUNTIF和IF函數(shù)完成檢驗(yàn)步驟2:選擇J3單元格,在編輯欄中輸入公式"=IF(COUNTIF(B3:H3,“<>0”)>3,"錯(cuò)誤","正確")",該公式用于判斷被調(diào)查者是否選擇了3項(xiàng)以上。如果超過(guò)3項(xiàng),表達(dá)式即為T(mén)RUE,返回"錯(cuò)誤";否則為
FALSE
,返回"正確"。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:(2)手工錄入錯(cuò)誤在手動(dòng)錄入的調(diào)查問(wèn)卷中,出現(xiàn)了0和1之外的數(shù)據(jù)。對(duì)于這種情況,我們可以采用條件格式,利用OR函數(shù)標(biāo)記錯(cuò)誤。該函數(shù)的語(yǔ)法規(guī)則為:OR(logicall,logical2,…)。在其參數(shù)組中,任何一個(gè)參數(shù)邏輯值為T(mén)RUE即返回TRUE;所有參數(shù)的邏輯值為FALSE才返回FALSE。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:(2)手工錄入錯(cuò)誤步驟1:在手動(dòng)錄入調(diào)查問(wèn)卷時(shí),錄入除0和1之外的數(shù)據(jù),從表中可以看出,單元格中出現(xiàn)了3、2、3這樣的數(shù)字。步驟2:選中B3:H6單元格區(qū)域,在“開(kāi)始”選項(xiàng)卡下單擊“條件格式”下拉按鈕,在彈出的下拉列表中選擇“新建規(guī)則”選項(xiàng),彈出“新建格式規(guī)則”對(duì)話框,選擇“使用公式確定要設(shè)置格式的單元格”選項(xiàng),然后輸入公式“=OR(B3=1,B3=0)=FALSE“,表示既不為1也不為0的單元格會(huì)被標(biāo)記出來(lái)。步驟3:?jiǎn)螕簟案袷健卑粹o,在彈出的“設(shè)置單元格格式”對(duì)話框中選擇“填充”選項(xiàng)卡,此時(shí)錯(cuò)誤數(shù)據(jù)被自動(dòng)標(biāo)記出來(lái)。二、數(shù)據(jù)清洗的方法二、數(shù)據(jù)清洗的方法2.格式錯(cuò)誤數(shù)據(jù)的清洗數(shù)據(jù)格式問(wèn)題主要有以下幾類:(一)時(shí)間、日期、數(shù)值、半全角等顯示格式不一致。直接將數(shù)據(jù)轉(zhuǎn)換為一類格式即可,該問(wèn)題一般出現(xiàn)在多個(gè)數(shù)據(jù)源整合的情況下。(二)內(nèi)容中有不該存在的字符。如在身高字段下有些變量帶單位,有些沒(méi)有,這時(shí)去除不需要的字符即可。(三)數(shù)據(jù)格式不滿足要求。在不同的計(jì)算方式下對(duì)數(shù)據(jù)格式要求不同,可根據(jù)分析要求進(jìn)行格式調(diào)整。二、數(shù)據(jù)清洗的方法練習(xí):某企業(yè)采集了競(jìng)爭(zhēng)對(duì)手的相關(guān)數(shù)據(jù),發(fā)現(xiàn)一級(jí)類目下的數(shù)據(jù)表達(dá)格式未統(tǒng)一,且客單價(jià)與銷售額的格式也不相同,需要進(jìn)行整理,其具體操作如下。1輸入查找與替換的內(nèi)容2確認(rèn)替換一級(jí)類目統(tǒng)一替換為:女裝/女士精品二、數(shù)據(jù)清洗的方法4選擇多個(gè)單元格區(qū)域5設(shè)置數(shù)據(jù)類型3查找與替換其他數(shù)據(jù)二、數(shù)據(jù)清洗的方法(四)異常數(shù)據(jù)的清洗檢測(cè)方法:(1)定義法:檢測(cè)數(shù)據(jù)與平均值的偏差,與檢測(cè)數(shù)據(jù)兩倍標(biāo)準(zhǔn)差比較大小(2)箱形圖:由數(shù)據(jù)的上邊緣、上四分位數(shù)、中位數(shù)、下四分位數(shù)和下邊緣組成的圖形,其中上邊緣和下邊緣線所代表的就是臨界值,超過(guò)上下邊界的離群點(diǎn)則為需要關(guān)注的異常值。操作要求:在excel表格中檢測(cè)“消費(fèi)次數(shù)”的異常值。運(yùn)用函數(shù):AVERAGE(平均值函數(shù))、ABS(絕對(duì)值函數(shù))、STDEV.S(標(biāo)準(zhǔn)差函數(shù))二、數(shù)據(jù)清洗的方法(四)異常數(shù)據(jù)的清洗處理方法:①參考后續(xù)的數(shù)據(jù)分析模型,選擇刪除或者保留異常值。②用一個(gè)樣本統(tǒng)計(jì)量去代替異常值,比如平均值、中位數(shù)、眾數(shù)等。③分箱法,即通過(guò)考察相鄰數(shù)據(jù)的取值對(duì)異常值進(jìn)行平滑處理,可視為一種局部平滑方法。首先將異常值所在指標(biāo)下的所有數(shù)據(jù)按照大小排序,并適當(dāng)分組(也稱作分“箱”),然后用組內(nèi)數(shù)據(jù)的平均值、中位數(shù)或邊界值來(lái)代替異常值。分組時(shí),如果每個(gè)“箱”的數(shù)據(jù)個(gè)數(shù)相同就為等深分箱;如果每個(gè)“箱”內(nèi)數(shù)據(jù)值的區(qū)間范圍是一個(gè)常量就為等寬分箱。三、數(shù)據(jù)加工數(shù)據(jù)加工是指對(duì)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、計(jì)算等操作,使經(jīng)過(guò)加工后的數(shù)據(jù)成為簡(jiǎn)潔、規(guī)范、清晰的樣本數(shù)據(jù)。一般情況下,當(dāng)數(shù)據(jù)經(jīng)過(guò)清洗之后仍然不能滿足用戶的分析需求時(shí),就需要利用數(shù)據(jù)加工對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的處理,形成分析所需要的一系列新的字段。數(shù)據(jù)加工環(huán)節(jié)直接影響數(shù)據(jù)質(zhì)量的價(jià)值性、可用性和準(zhǔn)確性。因此在進(jìn)行數(shù)據(jù)加工時(shí),要根據(jù)數(shù)據(jù)特點(diǎn)合理選擇數(shù)據(jù)加工方法,以實(shí)現(xiàn)數(shù)據(jù)質(zhì)量的最優(yōu)化。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取數(shù)據(jù)抽取就是對(duì)數(shù)據(jù)庫(kù)中現(xiàn)有字段進(jìn)行整合加工,使能夠形成分析所需要的數(shù)據(jù)。1.從某個(gè)字段中抽取部分?jǐn)?shù)據(jù)字段拆分就是為了截取某一字段中的部分信息,將該字段拆分成兩個(gè)或多個(gè)字段。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取Excel的“快速填充”功能一般來(lái)說(shuō),沒(méi)有規(guī)律的數(shù)據(jù)都需要手動(dòng)輸入,但對(duì)于一些相同或有規(guī)律的數(shù)據(jù),如員工編號(hào)、部門(mén)名稱等,則可通過(guò)填充的方式快速輸入。三、數(shù)據(jù)加工三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取2.從不同的數(shù)據(jù)表中抽取多個(gè)字段VLOOKUP函數(shù)打開(kāi)素材文件“2數(shù)據(jù)抽取-素材”,其中包括兩個(gè)表,第一個(gè)表為近期店鋪方可排名前10的商品表,包括商品標(biāo)題、商品ID、商品貨號(hào)等屬性,第二個(gè)表為店鋪商品信息表,記錄了店鋪中所有商品的信息,運(yùn)營(yíng)者需要為這些商品添加相應(yīng)的商品貨號(hào)。三、數(shù)據(jù)加工三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取練習(xí):字段拆分打開(kāi)素材文件“3數(shù)據(jù)抽取-素材”,已知某公司實(shí)習(xí)員工的信息表,將員工的出生年月日字段拆分成年、月、日三個(gè)字段;三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取練習(xí):字段拆分分隔符號(hào)根據(jù)實(shí)際情況選擇或輸入三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取練習(xí):字段拆分請(qǐng)大家嘗試用YEAR、MONTH、DAY、MID、LEFT、RIGHT等函數(shù)抽取信息;用VLOOKUP函數(shù)將考核得分抽取到基本信息表中。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取3.字段合并字段合并就是將若干字段合并成為一個(gè)新的字段,或者將字段值與文字、數(shù)字等組合形成新的字段。字段合并可以利用CONCATENATE函數(shù)或者“&”(邏輯與)運(yùn)算符。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取3.字段合并請(qǐng)將基本信息表中員工的工號(hào)和姓名字段合并,合并成“**的工號(hào)是**”,例如“周慧的工號(hào)是1801201”。(1)利用&運(yùn)算符合并三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取3.字段合并(2)利用CONCATENATE函數(shù)合并三、數(shù)據(jù)加工(二)數(shù)據(jù)轉(zhuǎn)換由于不同來(lái)源的數(shù)據(jù)可能存在不同的結(jié)構(gòu),數(shù)據(jù)轉(zhuǎn)化主要是將數(shù)據(jù)轉(zhuǎn)換成規(guī)范、清晰、易于分析的結(jié)構(gòu)。數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)行列轉(zhuǎn)換、數(shù)據(jù)類型轉(zhuǎn)換、數(shù)據(jù)排序和數(shù)據(jù)分組。三、數(shù)據(jù)加工1.數(shù)據(jù)行列轉(zhuǎn)換在進(jìn)行數(shù)據(jù)報(bào)表分析時(shí),常常要從不同的維度觀察數(shù)據(jù)。例如,從時(shí)間的維度查看匯總數(shù)據(jù),從地區(qū)的維度觀察匯總數(shù)據(jù),這樣需要對(duì)行列數(shù)據(jù)進(jìn)行轉(zhuǎn)換(又稱轉(zhuǎn)置)。
例如,下圖的數(shù)據(jù)轉(zhuǎn)換,可以將原數(shù)據(jù)復(fù)制,然后利用"選擇性粘貼"對(duì)話框中的"轉(zhuǎn)置"選項(xiàng)完成這個(gè)操作。三、數(shù)據(jù)加工2.數(shù)據(jù)類型轉(zhuǎn)換(1)數(shù)值轉(zhuǎn)字符在Excel中輸入數(shù)據(jù)的時(shí)候,會(huì)默認(rèn)使用數(shù)值型數(shù)據(jù);若是數(shù)字太長(zhǎng),會(huì)變成用科學(xué)記數(shù)法表示的數(shù),不利于查看數(shù)據(jù)。我們可以利用“數(shù)據(jù)”選項(xiàng)卡中的“分列”功能進(jìn)行轉(zhuǎn)換。步驟:1)選擇要轉(zhuǎn)換的數(shù)字所在的單元格,隨后單擊“分列”按鈕,在“文本分列向?qū)А睂?duì)話框中,使用默認(rèn)設(shè)置,連續(xù)單擊“下一步”按鈕;2)進(jìn)入“文本分列向?qū)А钡?步,選中“列數(shù)據(jù)格式”欄中的“文本”單選項(xiàng),單擊“完成”按鈕即可完成設(shè)置;3)設(shè)置完成后,返回Excel數(shù)據(jù)表,數(shù)據(jù)前有小三角符號(hào),代表已轉(zhuǎn)換成功。三、數(shù)據(jù)加工2.數(shù)據(jù)類型轉(zhuǎn)換(2)字符轉(zhuǎn)數(shù)字在進(jìn)行數(shù)據(jù)統(tǒng)計(jì)時(shí),有時(shí)獲取的原始數(shù)據(jù)是以文本字符形式展現(xiàn)的,雖然這不影響數(shù)據(jù)展現(xiàn),但無(wú)法進(jìn)行計(jì)算。直接選中要轉(zhuǎn)換的數(shù)據(jù)列,單擊數(shù)據(jù)列前出現(xiàn)的提醒符號(hào),在給出的選項(xiàng)中選擇“轉(zhuǎn)換為數(shù)字”選項(xiàng),即可將文本字符轉(zhuǎn)換為數(shù)值。三、數(shù)據(jù)加工(三)數(shù)據(jù)排序數(shù)據(jù)排序是指將數(shù)據(jù)按照方便我們處理分析的順序進(jìn)行有規(guī)則的排列,如按照分?jǐn)?shù)降序排序、按照日期升序排序等。(1)添加條件將數(shù)據(jù)按照“訪客數(shù)”和“下單買家數(shù)”兩個(gè)字段進(jìn)行排序,均為降序排序。(2)自定義排序?qū)?shù)據(jù)根據(jù)流量來(lái)源進(jìn)行排序。1)選擇“文件”菜單中的“選項(xiàng)”命令,彈出“Excel選項(xiàng)”對(duì)話框,切換到“高級(jí)”選項(xiàng)卡,單擊“編輯自定義列表”按鈕;2)在彈出的“自定義序列”對(duì)話框中輸入序列(即按照我們希望該字段排列的順序輸入),單擊“添加”按鈕,將其添加到自定義序列中,單擊“確定”按鈕完成添加三、數(shù)據(jù)加工三、數(shù)據(jù)加工(四)數(shù)據(jù)分組數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別,分組后的數(shù)據(jù)稱為分組數(shù)據(jù)。在Excel中我們可以通過(guò)VLOOKUP函數(shù)快速實(shí)現(xiàn)數(shù)據(jù)分組。我們想將員工的“考核得分”按照分組要求顯示考核等級(jí)。三、數(shù)據(jù)加工(四)數(shù)據(jù)分組(1)在數(shù)據(jù)表中的空白位置新建數(shù)據(jù)分組標(biāo)準(zhǔn),如上圖所示;(2)在C2單元格中輸入公式“=VLOOKUP(B2,$G$1:$H$5,2,1)”,三、數(shù)據(jù)加工(五)數(shù)據(jù)計(jì)算(1)常規(guī)計(jì)算:包括對(duì)數(shù)據(jù)值進(jìn)行加、減、乘、除的簡(jiǎn)單運(yùn)算以及運(yùn)用函數(shù)求均值、方差等統(tǒng)計(jì)分析指標(biāo)的復(fù)雜運(yùn)算。1)打開(kāi)素材文件“數(shù)據(jù)計(jì)算”,求成交轉(zhuǎn)化率指標(biāo),設(shè)置單元格格式為百分比并保留兩位小數(shù);2)計(jì)算牛仔褲2019年的平均銷量三、數(shù)據(jù)加工(五)數(shù)據(jù)計(jì)算(2)日期計(jì)算1)日期的加減:打開(kāi)素材文件“數(shù)據(jù)計(jì)算”,已給出了用戶首次下單時(shí)間和最近下單時(shí)間,計(jì)算用戶的購(gòu)買間隔時(shí)長(zhǎng)。2)日期函數(shù)常用的日期函數(shù)中,“YEAR()”表示計(jì)算年份,“MONTH()”表示計(jì)算月份,"TODAY()”表示計(jì)算當(dāng)前日期,“WEEKNUM()”表示計(jì)算日期是本年的第幾周等。打開(kāi)素材文件,已知商品的上架日期,請(qǐng)計(jì)算商品的上架天數(shù)。三、數(shù)據(jù)加工1輸入函數(shù)2計(jì)算銷售總額計(jì)算、排列、篩選并匯總銷售數(shù)據(jù)【實(shí)戰(zhàn)操作】某企業(yè)采集并整理了上半年各銷售部門(mén)的銷售數(shù)據(jù),為了便于后期進(jìn)行數(shù)據(jù)分析,現(xiàn)在還需要進(jìn)行計(jì)算、排列、篩選、匯總等加工處理,其具體操作如下。1.打開(kāi)素材文件“銷售匯總-素材.xlsx”,計(jì)算銷售總額;三、數(shù)據(jù)加工3排列數(shù)據(jù)、篩選數(shù)據(jù)4設(shè)置篩選條件、篩選結(jié)果
2.按銷售總額從高到低的順序進(jìn)行排序;3.篩選出所有銷售總額大于50000的數(shù)據(jù);三、數(shù)據(jù)加工5排序數(shù)據(jù)、設(shè)置分類匯總6設(shè)置分類匯總、匯總結(jié)果4.按銷售部門(mén)編號(hào)從小到大的順序排列各銷售人員上半年的銷售總額數(shù)據(jù);5.利用分類匯總功能,匯總出各銷售部門(mén)上半年的銷售總額數(shù)據(jù)。項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)3認(rèn)知數(shù)據(jù)篩選一、數(shù)據(jù)篩選概述數(shù)據(jù)篩選:也叫數(shù)據(jù)挖掘、數(shù)據(jù)加工,是一種把海量數(shù)據(jù)進(jìn)行多維度的探索和挖掘,以達(dá)到選出有用的信息的過(guò)程。特點(diǎn):具有全面性、客觀性、高效性,是信息決策技術(shù)中的一類應(yīng)用工具。其主要目的是從海量的數(shù)據(jù)中提取重要的信息,一般采用統(tǒng)計(jì)學(xué)和人工智能相結(jié)合的模式,經(jīng)過(guò)數(shù)據(jù)篩選處理,生成有用的信息、數(shù)據(jù)。二、常用數(shù)據(jù)篩選工具在Excel中,我們可以使用篩選功能、高級(jí)篩選、數(shù)據(jù)透視表來(lái)篩選數(shù)據(jù)。篩選功能可以幫助我們更加精確的篩選數(shù)據(jù),提高數(shù)據(jù)分析的準(zhǔn)確性。數(shù)據(jù)透視表可以幫助我們更加準(zhǔn)確的了解數(shù)據(jù)的分布情況和趨勢(shì),從而更好的進(jìn)行數(shù)據(jù)分析與決策。(一)excel軟件二、常用數(shù)據(jù)篩選工具SQL是一種常用的數(shù)據(jù)庫(kù)查詢語(yǔ)言,它可以幫助我們從數(shù)據(jù)庫(kù)中篩選出需要的數(shù)據(jù)。首先需要連接到數(shù)據(jù)庫(kù),然后使用SELECT語(yǔ)句進(jìn)行查詢。SELECT語(yǔ)句可以根據(jù)條件篩選數(shù)據(jù),比如按照某一列的數(shù)值大小、文本內(nèi)容、日期等進(jìn)行篩選。SQL查詢可以幫助我們從大量的數(shù)據(jù)中快速地找到需要的信息,提高數(shù)據(jù)分析的效率。(二)SQL查詢二、常用數(shù)據(jù)篩選工具Python是一種常用的編程語(yǔ)言,它可以幫助我們對(duì)數(shù)據(jù)進(jìn)行篩選和分析。首先需要導(dǎo)入需要的庫(kù),比如pandas庫(kù),然后讀取數(shù)據(jù)文件。在Python中,我們可以使用條件語(yǔ)句和邏輯運(yùn)算符進(jìn)行數(shù)據(jù)篩選,比如按照某一列的數(shù)值大小、文本內(nèi)容、日期等進(jìn)行篩選。Python篩選可以幫助我們更加靈活地對(duì)數(shù)據(jù)進(jìn)行處理,提高數(shù)據(jù)分析的靈活性和準(zhǔn)確性。(三)Python軟件篩選三、數(shù)據(jù)篩選實(shí)例打開(kāi)時(shí)間篩選表的素材文件,將在2026年1月1日之前的日期字體設(shè)置為紫色,加粗,添加刪除線,背景填充為黃色。將在2026年1月1日之后的日期字體設(shè)置為黃色,加粗,背景填充為紅色。項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)4數(shù)據(jù)分組認(rèn)知任務(wù)導(dǎo)入:為準(zhǔn)確了解工人的勞動(dòng)效率,某企業(yè)生產(chǎn)管理部門(mén)對(duì)機(jī)加工車間30名工人完成勞動(dòng)定額的情況進(jìn)行數(shù)據(jù)采集,得到如下原始資料(%):97829584938692102100103105100103108107108106109113114109117125115122119118116129115該企業(yè)生產(chǎn)管理部門(mén)經(jīng)理要求該部門(mén)工作人員盡快對(duì)該資料進(jìn)行整理,以便提供給公司管理層為制定新的生產(chǎn)定額提供參考。任務(wù)要求:1.請(qǐng)你根據(jù)上述數(shù)據(jù)資料幫助該企業(yè)生產(chǎn)部門(mén)工作人員,整理一下機(jī)加工車間30名工人完成勞動(dòng)定額的情況,以便更好的反映工人生產(chǎn)定額完成情況的分布狀況及其構(gòu)成。2.通過(guò)以上數(shù)據(jù)整理工作的流程,簡(jiǎn)述一下數(shù)據(jù)分組是什么?數(shù)據(jù)分組最關(guān)鍵問(wèn)題是什么?一、數(shù)據(jù)分組的概念及作用數(shù)據(jù)分組是在數(shù)據(jù)采集對(duì)象內(nèi)部進(jìn)行的一種特定分類,是根據(jù)數(shù)據(jù)處理的目的,將數(shù)據(jù)按照一定的數(shù)據(jù)處理需求區(qū)分為若干個(gè)組成部分的數(shù)據(jù)處理方法。(一)數(shù)據(jù)分組的概念一、數(shù)據(jù)分組的概念及作用1.可以揭示社會(huì)經(jīng)濟(jì)數(shù)據(jù)資料的特點(diǎn)及規(guī)律性(二)數(shù)據(jù)分組的作用通過(guò)數(shù)據(jù)采集得到的資料,往往是大量零散的、不系統(tǒng)的第一手?jǐn)?shù)據(jù),僅僅通過(guò)這些散亂的資料,難以看出數(shù)據(jù)采集對(duì)象的特點(diǎn)和基本情況,所以需要進(jìn)行分組。經(jīng)過(guò)數(shù)據(jù)分組之后,就可以觀察出數(shù)據(jù)具有的一些特點(diǎn),進(jìn)而研究數(shù)據(jù)采集對(duì)象具有的規(guī)律性。一、數(shù)據(jù)分組的概念及作用2.可以區(qū)分?jǐn)?shù)據(jù)采集對(duì)象的類型(二)數(shù)據(jù)分組的作用例如,消費(fèi)者按照購(gòu)物習(xí)慣可分為傳統(tǒng)型購(gòu)物人群和網(wǎng)店型購(gòu)物人群等類型,網(wǎng)店購(gòu)物人群可還以按照性別、職業(yè)和年齡等來(lái)區(qū)分,傳統(tǒng)型購(gòu)物人群也可按照年齡、地域等來(lái)分類;當(dāng)然,還可以按照城鎮(zhèn)購(gòu)物人群和農(nóng)村居民購(gòu)物人群等來(lái)區(qū)分消費(fèi)者類型。一、數(shù)據(jù)分組的概念及作用3.可以分析數(shù)據(jù)采集對(duì)象內(nèi)部構(gòu)成和結(jié)構(gòu)特征(二)數(shù)據(jù)分組的作用把被研究現(xiàn)象按某一標(biāo)志分組后,計(jì)算出各組在數(shù)據(jù)采集對(duì)象中的比重,就可以說(shuō)明經(jīng)濟(jì)現(xiàn)象的內(nèi)部結(jié)構(gòu),例如網(wǎng)購(gòu)群體中老、中、青購(gòu)物者構(gòu)成情況,西瓜視頻、抖音等視媒體愛(ài)好者結(jié)構(gòu)等,都反映出不同的購(gòu)物人群對(duì)網(wǎng)購(gòu)及自媒體的態(tài)度。一、數(shù)據(jù)分組的概念及作用4.可以揭示現(xiàn)象之間的依存關(guān)系(二)數(shù)據(jù)分組的作用數(shù)據(jù)采集對(duì)象都不是孤立存在的,而是相互聯(lián)系、相互依存、相互制約的。例如,網(wǎng)絡(luò)時(shí)代消費(fèi)者中,年齡與購(gòu)物習(xí)慣存在著一定的關(guān)系,一般來(lái)說(shuō),青年購(gòu)物者往往喜歡網(wǎng)購(gòu),而老年人則喜歡實(shí)體店消費(fèi);廣告投入和銷售額存在一定的依存關(guān)系,一般來(lái)說(shuō),廣告投入越多,銷售額也比較高。再如商品銷售額和流通費(fèi)用率之間也存在著一定的依存關(guān)系,一般來(lái)說(shuō),銷售額越高,流通費(fèi)用率越低(見(jiàn)表3-3-1)。一、數(shù)據(jù)分組的概念及作用可以看出,商品流通費(fèi)用率與商品銷售額之間存在的依存關(guān)系是?(二)數(shù)據(jù)分組的作用二、數(shù)據(jù)分組的方法數(shù)據(jù)分組的關(guān)鍵問(wèn)題在于選擇分組標(biāo)志和劃分各組界限,而選擇分組標(biāo)志則是數(shù)據(jù)分組的核心問(wèn)題。二、數(shù)據(jù)分組的方法1.根據(jù)數(shù)據(jù)處理的目的與任務(wù)選擇分組標(biāo)志(一)選擇分組標(biāo)志例如,以愛(ài)好網(wǎng)購(gòu)的消費(fèi)者為數(shù)據(jù)采集對(duì)象進(jìn)行研究時(shí),這個(gè)研究對(duì)象就有很多標(biāo)志,如年齡,性別、職業(yè)、收入等。如果數(shù)據(jù)分析的目的是要分析不同年齡段人群在數(shù)據(jù)采集對(duì)象中的構(gòu)成,那么就要選擇年齡作為分組標(biāo)志;如果要研究職業(yè)、收入對(duì)網(wǎng)購(gòu)的影響,則可以選擇職業(yè)、收入等作為分組標(biāo)志。二、數(shù)據(jù)分組的方法2.要從眾多標(biāo)志中選擇最能反映被研究對(duì)象本質(zhì)特征的標(biāo)志作為分組標(biāo)志(一)選擇分組標(biāo)志在選擇分組標(biāo)志時(shí),可能遇到既可以使用這種標(biāo)志,又可以使用另一種標(biāo)志的情況,這就需要根據(jù)被研究對(duì)象的特征,選擇最主要的、最能反映事物本質(zhì)特征的標(biāo)志進(jìn)行分組。例如,研究某城市居民生活水平狀況時(shí),既可用居民的個(gè)人收入水平作為分組標(biāo)志,也可以用居民家庭成員人均收入水平作為分組標(biāo)志。思考:哪個(gè)分組標(biāo)志更能反映其生活水平的高低?二、數(shù)據(jù)分組的方法3.根據(jù)現(xiàn)象所處的歷史條件或經(jīng)濟(jì)條件來(lái)選擇數(shù)據(jù)分組標(biāo)志(一)選擇分組標(biāo)志數(shù)據(jù)采集對(duì)象是隨著時(shí)間、地點(diǎn)等條件的變化而變化的。例如,在研究公司發(fā)展水平高低時(shí),需要對(duì)企業(yè)按年產(chǎn)量或年產(chǎn)值進(jìn)行分組。一般來(lái)說(shuō),反映公司發(fā)展水平高低的標(biāo)志主要有年產(chǎn)值、年產(chǎn)量、固定資產(chǎn)、年利潤(rùn)額、資本利潤(rùn)率等。在生產(chǎn)力水平較低的情況下,用年產(chǎn)值的多少來(lái)表示企業(yè)規(guī)模的大小比較適當(dāng);而在技術(shù)更新的歷史時(shí)期或技術(shù)裝備比較先進(jìn)的情況下,有的企業(yè)由于采用了機(jī)械化生產(chǎn),雖然年產(chǎn)值可能很大,但發(fā)展水平并不一定很高。因此,年產(chǎn)值已不能準(zhǔn)確地說(shuō)明公司發(fā)展水平的高低,這時(shí)使用年利潤(rùn)額或資本利潤(rùn)率等作為反映公司發(fā)展水平的分組標(biāo)志更為恰當(dāng)。二、數(shù)據(jù)分組的方法1.按品質(zhì)標(biāo)志分組(屬性差異)(二)數(shù)據(jù)分組的種類例如,網(wǎng)民按性別、民族、文化程度等標(biāo)志進(jìn)行分組。按品質(zhì)標(biāo)志分組的結(jié)果形成品質(zhì)數(shù)列,如下表為某縣區(qū)200家企業(yè)類型分組表。二、數(shù)據(jù)分組的方法2.按數(shù)量標(biāo)志分組(數(shù)量差異)(二)數(shù)據(jù)分組的種類例如,消費(fèi)者按年齡分組,職工按工資水平分組等。按數(shù)量標(biāo)志分組的過(guò)程中,根據(jù)變量值取值范圍不同,分組的形式可以分為單項(xiàng)式分組和組距式分組。二、數(shù)據(jù)分組的方法(二)數(shù)據(jù)分組的種類單項(xiàng)式分組:即每一組只包含一個(gè)變量值,這種分組形式只適用于離散變量,而且只能在離散變量的變動(dòng)范圍較小、變量值個(gè)數(shù)較少時(shí)使用,如,按某工廠機(jī)械加工車間工人日產(chǎn)量劃分工人生產(chǎn)情況(見(jiàn)下表)。單項(xiàng)式分組(要點(diǎn))
用一個(gè)變量值作為一組適合于變量值較少的離散變量二、數(shù)據(jù)分組的方法工人日產(chǎn)量分組表(二)數(shù)據(jù)分組的種類二、數(shù)據(jù)分組的方法(二)數(shù)據(jù)分組的種類二、數(shù)據(jù)分組的方法(二)數(shù)據(jù)分組的種類組距式分組:即在變量值變異幅度較大時(shí),將變量值取值范圍人為地劃分為若干個(gè)區(qū)間,變量在同一區(qū)間內(nèi)取值的現(xiàn)象歸為一組,區(qū)間的距離即稱為組距,如商店按銷售額分組等。組距分組(要點(diǎn))用變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量和變量值較多的離散變量二、數(shù)據(jù)分組的方法(二)數(shù)據(jù)分組的種類二、數(shù)據(jù)分組的方法(二)數(shù)據(jù)分組的種類二、數(shù)據(jù)分組的方法(三)數(shù)據(jù)分組體系所謂數(shù)據(jù)分組體系,就是根據(jù)數(shù)據(jù)采集與處理的要求,通過(guò)對(duì)同一數(shù)據(jù)采集對(duì)象進(jìn)行不同分組,形成的系列相互聯(lián)系、相互補(bǔ)充的組的整體。數(shù)據(jù)分組體系有平行分組體系與復(fù)合分組體系之分。二、數(shù)據(jù)分組的方法(三)數(shù)據(jù)分組體系平行分組:平行分組是選擇兩個(gè)或兩個(gè)以上的標(biāo)志對(duì)總體進(jìn)行一次次簡(jiǎn)單分組后所形成的體系。在平行分組中,各個(gè)分組是并列的,每個(gè)分組都是基于一個(gè)特定的標(biāo)志或?qū)傩赃M(jìn)行的。這種分組方式適用于當(dāng)各個(gè)分組之間沒(méi)有直接的邏輯或?qū)哟侮P(guān)系,或者當(dāng)需要同時(shí)考慮多個(gè)標(biāo)志時(shí)。二、數(shù)據(jù)分組的方法(三)數(shù)據(jù)分組體系復(fù)合分組:復(fù)合分組是將總體按照一個(gè)主要的標(biāo)志進(jìn)行初步分組,然后在每個(gè)初步分組的基礎(chǔ)上,再根據(jù)一個(gè)或多個(gè)其他標(biāo)志進(jìn)行更細(xì)致的分組。復(fù)合分組形成了一個(gè)分組的層次結(jié)構(gòu),其中每個(gè)較高級(jí)別的分組可以進(jìn)一步細(xì)分為更具體的子組。這種分組方式適用于當(dāng)需要對(duì)總體進(jìn)行更深入的細(xì)分,以揭示不同子組之間的差異時(shí)。二、數(shù)據(jù)分組的方法(三)數(shù)據(jù)分組體系二、數(shù)據(jù)分組的方法(三)數(shù)據(jù)分組體系項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)5數(shù)據(jù)匯總認(rèn)知任務(wù)導(dǎo)入:一家評(píng)估機(jī)構(gòu)為數(shù)據(jù)采集不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了數(shù)據(jù)采集。采集人員在某天對(duì)照50名顧客購(gòu)買飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。下面的資料是某超市對(duì)購(gòu)買飲料進(jìn)行記錄的原始數(shù)據(jù)。任務(wù)要求:1.匯總某日每種飲料的銷售情況;2.分析飲料銷售情況有何特征?一、數(shù)據(jù)匯總的概念數(shù)據(jù)匯總,它是在數(shù)據(jù)分組的基礎(chǔ)上,把數(shù)據(jù)采集單位各方面的特征值分別進(jìn)行綜合和加總,最終得到數(shù)據(jù)指標(biāo)的工作過(guò)程。(一)數(shù)據(jù)匯總的概念二、數(shù)據(jù)匯總的內(nèi)容(一)數(shù)據(jù)采集單位數(shù)匯總也是頻數(shù)的匯總,即匯總各組和采集對(duì)象總體的單位數(shù)。(二)數(shù)據(jù)采集單位特征值匯總也即是相關(guān)標(biāo)志值匯總,是將數(shù)據(jù)采集單位的某一數(shù)量特征值絕對(duì)數(shù)進(jìn)行加總,最終合計(jì)為數(shù)據(jù)采集對(duì)象總體的某一數(shù)量特征值的總和。三、數(shù)據(jù)匯總的組織形式(一)逐級(jí)匯總逐級(jí)匯總就是按一定的統(tǒng)計(jì)管理體制,自下而上地對(duì)數(shù)據(jù)采集資料進(jìn)行逐級(jí)匯總。(二)集中匯總對(duì)各級(jí)都需要的基本資料實(shí)行逐級(jí)匯總,對(duì)數(shù)據(jù)采集所得的其他資料則實(shí)行集中匯總。(三)綜合匯總集中匯總就是將全部數(shù)據(jù)采集資料集中到組織數(shù)據(jù)采集的最高一級(jí)機(jī)關(guān)進(jìn)行一次性匯總。三、數(shù)據(jù)匯總的組織形式各種匯總形式對(duì)照表四、利用“分類匯總”進(jìn)行數(shù)據(jù)匯總Excel是常用的數(shù)據(jù)處理分析軟件,能夠?qū)?shù)據(jù)進(jìn)行分類匯總和計(jì)算。下面以某天貓書(shū)店某日的圖書(shū)銷售情況資料為例來(lái)介紹Excel中分類匯總的操作流程。某天貓書(shū)店某日?qǐng)D書(shū)銷售情況四、利用“分類匯總”進(jìn)行數(shù)據(jù)匯總匯總?cè)蝿?wù):按“購(gòu)買者籍貫”匯總商品總價(jià)。第一步,鼠標(biāo)點(diǎn)擊表格內(nèi)“購(gòu)買者省籍貫”的任一單元格,對(duì)數(shù)據(jù)進(jìn)行升序排列;第二步,選擇“數(shù)據(jù)”菜單中“分類匯總”命令,打開(kāi)“分類匯總”對(duì)話框;第三步,在“分類匯總”對(duì)話框中,選擇“購(gòu)買者籍貫”為分類字段,匯總方式選擇“求和”選項(xiàng),在“選定匯總項(xiàng)”中選中“商品總價(jià)(元)”復(fù)選框;第四步,可以將上述的結(jié)果創(chuàng)建一個(gè)圖表,該圖表僅使用了包含分類匯總的列表中的可見(jiàn)數(shù)據(jù)。分類匯總中的匯總方式有求和、計(jì)數(shù)、平均值、最大值、最小值、乘積、數(shù)值計(jì)數(shù)、標(biāo)準(zhǔn)差、方差,可通過(guò)第三步選定不同的匯總方式來(lái)進(jìn)行不同的分類匯總。五、利用數(shù)據(jù)透視表進(jìn)行數(shù)據(jù)匯總針對(duì)上述案例,請(qǐng)大家嘗試用數(shù)據(jù)透視表完成基于“購(gòu)買者籍貫”的商品總價(jià)的匯總。實(shí)操練習(xí)請(qǐng)大家完成某日每種飲料的銷售匯總?cè)蝿?wù)。項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)6頻數(shù)分配及分布類型任務(wù)導(dǎo)入:某淘寶店家每天的銷售額(元)數(shù)據(jù)采集,采集50天銷售額構(gòu)成樣本,樣本資料如下:任務(wù)要求:1.簡(jiǎn)述編制頻數(shù)分布的步驟。2.利用Excel對(duì)上述某淘寶店日銷售額數(shù)據(jù)進(jìn)行數(shù)據(jù)分組,并編制頻數(shù)分布。一、頻數(shù)分配的概念在數(shù)據(jù)分組的基礎(chǔ)上,將數(shù)據(jù)采集對(duì)象的所有單位按組歸類整理,并按一定順序排列,形成數(shù)據(jù)采集單位在各組間的分布,稱為頻數(shù)分布。(一)頻數(shù)分布的概念分布在各組的數(shù)據(jù)采集對(duì)象單位數(shù)叫次數(shù),也稱頻數(shù)。各組頻數(shù)之和為總頻數(shù)。各組頻數(shù)與總頻數(shù)之比稱為頻率(或稱為比重、比率)。各組頻數(shù)與頻率可以反映各組標(biāo)志值水平對(duì)數(shù)據(jù)采集對(duì)象標(biāo)志值水平的影響程度。一、頻數(shù)分配的概念將各組的名稱與相應(yīng)的頻數(shù)或頻率,按一定順序排列起來(lái)形成的數(shù)列稱為頻數(shù)分布數(shù)列,簡(jiǎn)稱頻數(shù)數(shù)列或分布數(shù)列。(一)頻數(shù)分布的概念頻數(shù)分布數(shù)列可以反映數(shù)據(jù)采集對(duì)象單位在各組間的分布狀態(tài)和分布特征,是進(jìn)一步分析數(shù)據(jù)采集對(duì)象平均水平和差異程度的基礎(chǔ)。一、頻數(shù)分配的概念1.品質(zhì)分配數(shù)列(二)頻數(shù)數(shù)列的種類按照品質(zhì)數(shù)據(jù)分組而形成的分布數(shù)列稱為品質(zhì)分布數(shù)列,簡(jiǎn)稱品質(zhì)數(shù)列。某零食網(wǎng)店一段時(shí)間購(gòu)物者性別狀況分組表一、頻數(shù)分配的概念2.變量數(shù)列(二)頻數(shù)數(shù)列的種類按照數(shù)值數(shù)據(jù)分組而形成的分配數(shù)列稱為變量數(shù)列。變量數(shù)量又可分為單項(xiàng)式變量數(shù)列與組距式變量數(shù)列。某地區(qū)餐飲業(yè)按照營(yíng)業(yè)額分組二、頻數(shù)分布的Excel處理Excel上主要利用FREQUENCY函數(shù)生成頻數(shù)分布數(shù)列,F(xiàn)REQUENCY函數(shù)計(jì)算數(shù)值在某個(gè)區(qū)域內(nèi)的出現(xiàn)頻率,然后返回一個(gè)垂直數(shù)組。語(yǔ)法:FREQUENCY(數(shù)據(jù)源,分段點(diǎn))呈現(xiàn):以分組區(qū)間點(diǎn)為間隔,數(shù)據(jù)源中所有數(shù)據(jù)在各段出現(xiàn)的頻數(shù)。注意:1.分組區(qū)間點(diǎn)必須設(shè)置為每一數(shù)據(jù)區(qū)域中最大的數(shù)值(重疊組限應(yīng)設(shè)置為該區(qū)域的實(shí)際上限);2.最后一組(最大組)可不設(shè)置分組區(qū)間點(diǎn),系統(tǒng)會(huì)自動(dòng)查找最后一個(gè)分組區(qū)間點(diǎn)大的數(shù)據(jù)的個(gè)數(shù)作為返回?cái)?shù)據(jù)組中的最后一個(gè)元素,以至于返回?cái)?shù)據(jù)中的元素個(gè)數(shù)比分組區(qū)間點(diǎn)的個(gè)數(shù)要多一個(gè)。二、頻數(shù)分布的Excel處理下面我們以任務(wù)導(dǎo)入的案例某淘寶店每天的銷售額為例來(lái)對(duì)數(shù)據(jù)進(jìn)行分組并編制頻數(shù)分布數(shù)列。第一步,新建“頻數(shù)分布.xls”工作簿,建立“某天貓店日銷售額”工作表,并在A1:B51區(qū)域輸入原始數(shù)據(jù)為數(shù)據(jù)源,如圖所示。二、頻數(shù)分布的Excel處理第二步,在單元格C1中輸入“按日銷售額分組(元)”,在單元格D1中輸入“分組區(qū)間”,在單元格E1中輸入“天數(shù)(日)”,如圖所示。二、頻數(shù)分布的Excel處理第三步,在單元格C2:C6區(qū)域中輸入“3000元以下”、“3000~4000”、“4000~5000”、“5000~6000”、“6000元以上”;作為分組結(jié)果,在D2:D6區(qū)域中依次輸入相應(yīng)組的實(shí)際上限(即各組的最高銷售額):“2999”、“3999”“4999”“5999”,這些數(shù)據(jù)將作為數(shù)據(jù)的分組區(qū)間在函數(shù)中運(yùn)用。輸入后如圖所示。二、頻數(shù)分布的Excel處理第四步,選中E2:E6區(qū)域,然后選擇“公式”菜單欄中的“插入函數(shù)”按鈕,或者單擊編輯欄左側(cè)的“插入函數(shù)”工具按鈕fx,彈出“插入函數(shù)”對(duì)話框,如圖所示。二、頻數(shù)分布的Excel處理第五步,在“選擇函數(shù)”下拉表中選擇“統(tǒng)計(jì)”選項(xiàng),然后在“選擇函數(shù)”列表框中選擇FREQUENCY函數(shù),如圖所示,單擊“確定”按鈕,此時(shí)會(huì)彈出“函數(shù)參數(shù)”對(duì)話框,如圖所示。二、頻數(shù)分布的Excel處理第六步,在Data_array欄中填寫(xiě)觀測(cè)值所在區(qū)域“B2:B52”,在Bins_array中填寫(xiě)分組端點(diǎn)所在區(qū)域“D2:D5”,如圖所示.二、頻數(shù)分布的Excel處理第七步,在按住Ctrl+Shift的同時(shí)按Enter,即得Frequency計(jì)算在完成上述兩項(xiàng)步驟后的頻數(shù),如圖所示。三、頻數(shù)分布的類型(一)鐘型分布鐘型分布的特征是“兩頭小、中間大”,即靠近中間的變量值分布的頻數(shù)多,靠近兩邊的變量值分布的頻數(shù)少,其曲線圖像一個(gè)古鐘,如圖所示。一般來(lái)說(shuō),根據(jù)數(shù)據(jù)采集對(duì)象性質(zhì)的不同,數(shù)據(jù)采集對(duì)象的頻數(shù)分布主要有三種類型:鐘型分布、U型分布和J型分布。三、頻數(shù)分布的類型(一)鐘型分布鐘型分布又可分為對(duì)稱分布與偏態(tài)分布。其中,對(duì)稱分布的特征是中間變量值分布的次數(shù)最多,以標(biāo)志變量中心為對(duì)稱軸,兩側(cè)變量值分布的次數(shù)隨著與中間變量值距離的增大而漸次減少,并且圍繞中心變量值兩側(cè)呈對(duì)稱分布,這種分布在統(tǒng)計(jì)學(xué)中稱為正態(tài)分布。三、頻數(shù)分布的類型(二)U型分布U型分布的特征與鐘型分布恰恰相反,靠近中間的變量值分布的次數(shù)少,靠近兩端的變量值分布的次數(shù)多,形成“兩頭大,中間小”的U型分布,如人口死亡現(xiàn)象按年齡分布、機(jī)器設(shè)備磨損現(xiàn)象按使用時(shí)間分布就表現(xiàn)為U型分布。三、頻數(shù)分布的類型(三)J型分布在數(shù)據(jù)采集對(duì)象中,也有一些統(tǒng)計(jì)總體分布曲線呈J型。其中正J分布的特征是次數(shù)隨變量值的增大而增多,如投資按利潤(rùn)率大小的分布;反J分布的特征是次數(shù)隨變量值的增大而減少,如人口總體按年齡大小的分布。補(bǔ)充內(nèi)容
數(shù)據(jù)的排序、篩選與分類匯總目錄CONTENTS4.1數(shù)據(jù)的排序4.2數(shù)據(jù)的篩選4.3數(shù)據(jù)的分類匯總4.4提高與技巧4.1.1簡(jiǎn)單排序138簡(jiǎn)單排序可以快速對(duì)二維表格中的數(shù)據(jù)記錄重新進(jìn)行排列。下面將通過(guò)簡(jiǎn)單排序的方法來(lái)排列“網(wǎng)店客戶資料管理.xlsx”工作簿中數(shù)據(jù),其具體操作如下。1.選擇排序方式2.查看排序效果4.1.1簡(jiǎn)單排序139簡(jiǎn)單排序可以快速對(duì)二維表格中的數(shù)據(jù)記錄重新進(jìn)行排列。下面將通過(guò)簡(jiǎn)單排序的方法來(lái)排列“網(wǎng)店客戶資料管理.xlsx”工作簿中數(shù)據(jù),其具體操作如下。1.以“客戶類型”為依據(jù)進(jìn)行升序排列2.以“客戶姓名”為依據(jù)進(jìn)行降序排列注意:由于客戶類型中的數(shù)據(jù)是文本型,將按首字的拼音進(jìn)行升序排序,如果首字是英文,將以英文優(yōu)先。4.1.1簡(jiǎn)單排序1403.設(shè)置排序方式4.查看排序后的效果要想在Excel中成功對(duì)數(shù)據(jù)進(jìn)行排序,首先要保證排列的區(qū)域是二維表格。也就是說(shuō),如果數(shù)據(jù)存放在不連續(xù)的單元格,或單元格區(qū)域的結(jié)構(gòu)不是二維表格的結(jié)構(gòu),均無(wú)法實(shí)現(xiàn)排序操作。同樣,后面將要介紹的篩選和分類匯總等操作也是如此。提示4.1.2單一字段排序1411.套用表格樣式單一字段排序表面上與簡(jiǎn)單排序類似,但實(shí)際上這種排序方法可以人為設(shè)置排序依據(jù),而不僅僅只以數(shù)值為依據(jù)進(jìn)行排序。下面將在“網(wǎng)店客戶資料管理.xlsx”工作簿中按單元格的顏色進(jìn)行排序,其具體操作如下。套用表格格式——淺色——玫瑰色:表樣式淺色172.確定數(shù)據(jù)來(lái)源4.1.2單一字段排序1423.轉(zhuǎn)換表格樣式區(qū)域4.確認(rèn)轉(zhuǎn)換設(shè)置4.1.2單一字段排序1435.進(jìn)行數(shù)據(jù)排序6.設(shè)置排序關(guān)鍵字和依據(jù)4.1.2單一字段排序1447.設(shè)置排列次序8.查看排序效果4.1.3多重字段排序145在一些數(shù)據(jù)字段較多的表格中,可以同時(shí)對(duì)多個(gè)字段進(jìn)行排序,此時(shí)若第一個(gè)關(guān)鍵字的數(shù)據(jù)相同,則按第二個(gè)關(guān)鍵字的數(shù)據(jù)進(jìn)行排序,從而可以更精確地控制數(shù)據(jù)記錄的排列次序。下面將在“網(wǎng)店客戶資料管理.xlsx”工作簿中對(duì)數(shù)據(jù)記錄進(jìn)行多重字段排序,其具體操作如下。1.進(jìn)行數(shù)據(jù)排序2.設(shè)置主要關(guān)鍵字選中A1:K25單元格區(qū)域4.1.3多重字段排序1463.設(shè)置次要關(guān)鍵字4.設(shè)置次要關(guān)鍵字4.1.3多重字段排序1475.應(yīng)用多重字段排序的效果4.1.4自定義排序148Excel中的排序方式可滿足大多數(shù)用戶的需要,對(duì)于一些有特殊要求的排序可進(jìn)行自定義設(shè)置,如按照職務(wù)、部門(mén)等進(jìn)行排序時(shí),便可指定職務(wù)和部門(mén)的排列順序。下面將在“網(wǎng)店客戶資料管理.xlsx”工作簿中對(duì)賣家評(píng)價(jià)進(jìn)行自定義排序,其具體操作如下。1.設(shè)置字段和次序選中A1:K25單元格區(qū)域客戶評(píng)價(jià)4.1.4自定義排序1492.自定義排序方式3.確認(rèn)排序方式4.1.4自定義排序1505.自定義排序效果如果需要對(duì)表格中的數(shù)據(jù)經(jīng)常使用同一種方式進(jìn)行排序,那么可以將自定義的排序方式添加到“排序”對(duì)話框的“次序”下拉列表框中,下次使用時(shí)直接調(diào)用即可。提示目錄CONTENTS4.1數(shù)據(jù)的排序4.2數(shù)據(jù)的篩選4.3數(shù)據(jù)的分類匯總4.4提高與技巧4.2.1自動(dòng)篩選152自動(dòng)篩選一般用于簡(jiǎn)單的條件篩選。當(dāng)使用自動(dòng)篩選功能時(shí),在工作表的表頭將出現(xiàn)黑色三角形按鈕,單擊該三角形按鈕,在打開(kāi)的下拉列表中,選擇相應(yīng)的選項(xiàng)即可。下面將在“網(wǎng)店客戶資料管理.xlsx”工作簿中使用預(yù)設(shè)的篩選條件來(lái)篩選數(shù)據(jù),其具體操作如下。1.進(jìn)入篩選狀態(tài)2.選擇篩選條件要求:篩選出成交額大于150、跟進(jìn)人員為周雪梅的數(shù)據(jù)4.2.1自動(dòng)篩選1533.設(shè)置篩選條件4.設(shè)置篩選條件4.2.1自動(dòng)篩選1545.顯示篩選結(jié)果4.2.2自定義篩選155如果Excel預(yù)設(shè)的條件不能滿足篩選目的的需要,則可以自定義篩選條件來(lái)篩選數(shù)據(jù)。下面將在“網(wǎng)店客戶資料管理.xlsx”工作簿中通過(guò)自定義篩選條件來(lái)篩選需要的數(shù)據(jù),其具體操作如下。1.清除篩選狀態(tài)2.自定義篩選4.2.2自定義篩選1563.設(shè)置篩選條件4.查看篩選結(jié)果練習(xí)1:篩選出成交額150-300的數(shù)據(jù)練習(xí)2:篩選出手機(jī)號(hào)碼158開(kāi)頭的數(shù)據(jù)4.2.3高級(jí)篩選157當(dāng)自定義篩選仍然不能滿足對(duì)篩選數(shù)據(jù)的需要時(shí),Excel還提供了高級(jí)篩選功能,使用此功能便可以篩選出任何所需要的數(shù)據(jù)結(jié)果。下面將在“網(wǎng)店客戶資料管理.xlsx”工作簿中使用高級(jí)篩選功能來(lái)篩選數(shù)據(jù),其具體操作如下。1.清除字段的篩選條件2.輸入篩選條件4.2.3高級(jí)篩選1583.設(shè)置高級(jí)篩選條件4.查看篩選結(jié)果目錄CONTENTS4.1數(shù)據(jù)的排序4.2數(shù)據(jù)的篩選4.3數(shù)據(jù)的分類匯總4.4提高與技巧4.3數(shù)據(jù)的分類匯總160數(shù)據(jù)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 少數(shù)民族語(yǔ)言保護(hù)傳承承諾書(shū)6篇
- 2025金華蘭溪市市屬國(guó)企招聘32人考前自測(cè)高頻考點(diǎn)模擬試題及一套答案詳解
- 2025福建廈門(mén)鼓浪灣大酒店有限公司(第二批)招聘5人模擬試卷有答案詳解
- 2025北京昌平區(qū)統(tǒng)計(jì)局招聘經(jīng)濟(jì)運(yùn)行監(jiān)測(cè)工作專班助統(tǒng)員1人考前自測(cè)高頻考點(diǎn)模擬試題及參考答案詳解
- 2025-2026學(xué)年湖南湖湘名校聯(lián)盟新高二上學(xué)期入學(xué)考試英語(yǔ)試卷(解析版)
- 遼寧省沈陽(yáng)市某中學(xué)2025-2026學(xué)年高一上學(xué)期開(kāi)學(xué)地理試題(學(xué)生版)
- 2025年上海市金融穩(wěn)定發(fā)展研究中心公開(kāi)招聘工作人員模擬試卷及答案詳解(網(wǎng)校專用)
- 家庭健康防護(hù)承諾函9篇范文
- 企業(yè)合規(guī)運(yùn)營(yíng)責(zé)任承諾書(shū)(4篇)
- 遵規(guī)守時(shí)踐行承諾書(shū)5篇
- 3.1 列代數(shù)式表示數(shù)量關(guān)系(第 1 課時(shí))說(shuō)課稿人教版七年級(jí)數(shù)學(xué)上冊(cè)
- 托班服務(wù)協(xié)議書(shū)標(biāo)準(zhǔn)版5篇
- 安全應(yīng)急預(yù)案編制培訓(xùn)課件
- 青少年社會(huì)化實(shí)踐教育模式研究
- 智能測(cè)繪課件
- 2025至2030中國(guó)乳房重建和隆胸行業(yè)發(fā)展趨勢(shì)分析與未來(lái)投資戰(zhàn)略咨詢研究報(bào)告
- 2025年70周歲以上老年人換長(zhǎng)久駕照三力測(cè)試題庫(kù)(含答案)
- AMZ123《2025上半年跨境電商行業(yè)報(bào)告》
- 數(shù)據(jù)賦能打造精準(zhǔn)教學(xué)新模式
- 家庭教育指導(dǎo)服務(wù)行業(yè):2025年家庭教育市場(chǎng)消費(fèi)者行為分析報(bào)告
- 蘇州加裝電梯協(xié)議書(shū)范本
評(píng)論
0/150
提交評(píng)論