




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基于遺傳算法優(yōu)化的二手車價格評價模型的構建分析案例概述目錄TOC\o"1-3"\h\u31490基于遺傳算法優(yōu)化的二手車價格評價模型的構建分析案例概述 1254521.1實驗數據 1101231.1.1數據獲取 132661.1.2數據分布情況 128971.2數據預處理 3318001.3數據處理可行性進行分析 5159281.3.1數據處理 5273401.3.2輸出結果與結果分析 61.1實驗數據1.1.1數據獲取本文的二手車交易數據選自瓜子二手車網絡交易平臺,數據獲取方法為Python爬蟲。瓜子二手車作為二手車交易行業(yè)的標志性企業(yè),其網站上的二手車交易信息和其它二手車交易網站的信息相比,更加的全面。按照先對影響車輛價格的因子進行分析,再結合瓜子二手車交易平臺上提供的成交實例的相關信息,爬取網站內的己售賣二手車數據5160條,數據類型包括車輛名稱、原始報價、行駛里程、車齡、汽車所在地、檔位、排量等。圖1.1部分二手車交易實例原始數據1.1.2數據分布情況對數據進行如下處理,剔除無效數據:(1)刪去包含空白字段的條目,(2)刪去二手車原報價格高于成交價格的條目(與網站進行確認,為錯誤數據,(3)刪去異常數值數據(示例:長安CS75成交價格為8800萬),最終得到有效數據4871條,數據分布情況如下圖所示:圖5.2分車輛類型樣本分布圖5.3分注冊年份樣本數量分布圖5.4分城市樣本數量分布從轎車型號和分類情況來看,轎車有3141條,suv型號有1172條,mpv型號有239條,商用汽車型號有91條,跑車型號有237條;從其注冊年份的角度來看,包含了從2000年一直到2021年的不同年齡;從車源地和路徑上來看,基本滿足了此次細分地區(qū)的需求,并且依照中國汽車流通協(xié)會4月公報,東部和沿海地區(qū)的省份占有絕大多數的車源。從整個總體上看,爬取到的數據目前初步符合要求。但此步驟僅為對數據的初步處理,并未進行數據清洗,當前數據不能直接用于研究預測。1.2數據預處理對有效數據進行了如下的處理:指標層的類別屬性,通過對列變量YearofRegistration、Kilometer、Brand、Model、Gearbox、AutoEmissions、VehicleType、DesignatedArea、OriginalOffer、Turbocharger的探索。結果顯示數據類型有:1)數值型數據,例如Price、YearofRegistration等;2)文本型數據,例如Brand,Model等;3)邏輯性數據,例如Turbocharger是Boolean變量,儲存簡單的yes/no設置。在數據預處理時,將文本類數據和邏輯類數據轉化為數值型數據,即將字符串賦予數值變量邏輯型。表4-1為部分原始數據,表4-2為對應的預處理數據。分類原則如下:2)車牌地址車輛歸屬地采取行政區(qū)劃分方式,分為七大區(qū)域:華北為1,東北為2,華東為3,華中為4,華南為5,西南為6,西北為7。表4-1部分原始數據字段名稱12345Price257.681.38.585YearofRegistration2019/012018/012010/092012/042015/12Kilometer5.42.79109.5BrandJeep奧迪寶駿寶馬奔馳Gearbox手自一體自動手動手自一體手動AutoEmissions1.8432.82.3VehicleTypeSUV轎車SUV轎車SUVDesignatedArea河南內蒙古遼寧廣東安徽OriginalOffer637.681.38.5007.7Turbocharger是否否是否表4-2部分預處理數據字段名稱12345Price257.681.38.585YearofRegistration20192018201020122015/Kilometer5.42.79109.5Brand42122Gearbox32131AutoEmissions1.8432.82.3VehicleType21212DesignatedArea47253OriginalOffer637.681.38.5007.7Turbocharger100101.3數據處理可行性進行分析數據可行性分析采用多元線性回歸模型,對二手車交易數據進行回歸擬合分析。在我國現(xiàn)代理論統(tǒng)計學中,線性回歸擬合復合分析法主要指的就它是一種比較線性化的擬合分析模型,用來精確描述線性回歸擬合解釋因子中的變量函數Y與一個或者幾個線性解釋因子變量之間的相互作用。例如,當我們僅僅只有一個元素可以正確解釋的元素變量,就可能會轉化成一元素是線性的或回歸式的分析。例如,當其中具有多個元素可以數值解釋的線性變量,則可以成為對多元素的線性變量回歸的數值分析。在目前線性變量回歸函數分析中,需要從大量數據中充分借鑒到并利用目前線性回歸預測的各種函數模型進行綜合估算,以便對目前未知的線性參數模型進行準確地綜合描述。該類矢量模型又被稱為線性化矢量模型。與所有各種不同形式的多元回歸函數分析一樣,線性多元回歸主要研究關注的領域是關于給定Y和X的一個條件聯(lián)合概率函數分布Y,而非Y和給定X的條件聯(lián)合概率分布,這些研究領域都可以屬于線性多元化回歸分析。線性回歸分析法是第一種由謹慎地進行研究和數學驗證而得到的回歸分析,并被廣泛地應用到實際的應用中。這就是由于對未知參數的線性關系進行研究遠遠高于對非線性關系進行研究。由于線性關系得到了擬合,而且更容易和準確。線性回歸分析法具有許多實踐和應用,主要按其應用范圍分為兩類。第一類,當目標觀察到的是進行預測、估計或者降低誤差時,線性回歸法就可以將其運用成基于X和Y的觀察到數據集,用于構造擬合的預測模型。在我們建立了這樣一個模型之后,當我們給出了一組x值,就可以直接使用一個擬合模型方法來進行預測得y值的輸出。第二類,在給定的變量x和可能包括Y和X的幾個不同變量X1,X2,Xp,可以通過線性回歸分析方法來進行量化分析Xp和X與Y之間的冗余相關度系數,來判斷Xp和X與Y之間的冗余相關度,并確認Xp的那些自身包含了所有關于X和Y的冗余信息。線性回歸模型一般是利用最小二次乘法來實現(xiàn)擬合的。同時,也許我們還可以考慮使用其他的方法來對這些因素進行擬合,例如最小絕對偏差法、嶺回歸等。1.3.1數據處理計算多元線性回歸模型所用的數據與其他人工神經網絡所用的數據相同,也是通過采用從瓜子中搜索爬取出來的4871條關于二手車貿易的數據,其中主要包括了車輛品牌、汽車類型、汽車報價、行駛里程、注冊年份、所在地、變速器類型、排量和是否具有渦輪增壓器。但是由于采用多元線性回歸的方法處理多分類變量時,無法只能僅僅簡單地使用某個系數值來準確地解釋兩種變量之間的相互關系和變動,因此被引入了啞變量。啞變量指的是在所有做回歸分析的模型中,替換成多分類變量的變量或者是數值化的表達式。在傳統(tǒng)的回歸分析中,因變量不但直接受到了數量類變量(包括收入,產出,價格等)的影響,還直接受到了多分類變量(包括性別,宗教,地理領土區(qū)域等)的影響。對于一些被認為觀察值0的虛擬獨立變量(也可以簡稱為虛擬解釋變量)將直接造成該變量的系數并不會直接影響因變量,而且只有當虛擬的值取得閾值1時,其系數才能直接影響得到因變量。即例如汽車型號類別、牌照車源地區(qū)這樣的多分類變量,這些多分類變量中的各個取值可以被設置成一個多分類變量,用0或者1來說明是否選擇了這個取值。1.3.2輸出結果與結果分析分析使用SPSS軟件,將10個變量輸入模型模型,運行結果如下:圖1.5SPSS擬合有效因變量系數表得到二手車價格多元線性模型:price=0.246origina對模型進行誤差評估,指標數值見表4-3表4-3多元線性擬合誤差均方誤差均方根誤差誤差率62.72647.9221.55%擬合結果證明,采用傳統(tǒng)的線性擬合方式得到的誤差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北初中綜合試卷及答案
- 2025年新疆協(xié)警考試試題及答案
- 2025年開縣進城考試試題及答案
- 如皋單招考試試題及答案
- 2025年色彩結構考試試題及答案
- 2025年數量關系真題題庫及答案
- 2025年建筑測量自考試題及答案
- 化學實驗基礎知識綜合應用試題
- 2025年高三物理上學期“場與路”綜合測試卷
- 2025年高考物理熱光原部分專項復習試題
- 自媒體招生培訓
- 中國骨關節(jié)炎診療指南(2024版)解讀
- 鏡架購銷合同模板
- 第二屆“強國杯”技術技能大賽-工業(yè)大數據管理與分析賽項考試題庫(含答案)
- 徐州市城市軌道交通1號線一期工程電動客車運營、修理及維護手冊
- 制作并觀察植物細胞臨時裝片教學設計(五篇模版)
- 信息推廣服務合同范例
- 《大氣的組成和垂直分層》
- GB/T 2423.17-2024環(huán)境試驗第2部分:試驗方法試驗Ka:鹽霧
- 第一次月考試卷(月考)-2024-2025學年三年級上冊數學人教版
- SMP-05-004-00 受托方化驗室監(jiān)督管理規(guī)程
評論
0/150
提交評論