




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Spark并行計算
2了解Spark的擴(kuò)展知識首先定義一個名為points的緩存RDD,這是在文本文件上執(zhí)行map轉(zhuǎn)換之后得到的,即將每個文本行解析為一個Point對象。然后在points上反復(fù)執(zhí)行map和reduce操作,每次迭代時通過對當(dāng)前w的函數(shù)進(jìn)行求和來計算梯度。7.1小節(jié)我們將看到這種在內(nèi)存中緩存points的方式,比每次迭代都從磁盤文件裝載數(shù)據(jù)并進(jìn)行解析要快得多。已經(jīng)在Spark中實現(xiàn)的迭代式機(jī)器學(xué)習(xí)算法還有:kmeans(像邏輯回歸一樣每次迭代時執(zhí)行一對map和reduce操作),期望最大化算法(EM,兩個不同的map/reduce步驟交替執(zhí)行),交替最小二乘矩陣分解和協(xié)同過濾算法。Chu等人提出迭代式MapReduce也可以用來實現(xiàn)常用的學(xué)習(xí)算法。
3
通過指定參數(shù)打開SparkshellMaster我們也可以指定參數(shù)打開交互式SparkShell,SparkShell是一個修改版的ScalaShell。通過交互式Shell可以幫助我們理解架構(gòu)。#./bin/spark-shell--masterlocal[N]--master:指定master節(jié)點的URL,我們也可以使用local參數(shù)去使用單線程模式執(zhí)行本地的SparkShell,或者使用local[N]去執(zhí)行N個本地線程的SparkShell。例如,我們使用兩個線程打開本地的SparkShell:#./bin/spark-shell--masterlocal[2]執(zhí)行后,我們可以看到修改版的ScalaShell,如圖:
4
通過指定參數(shù)打開PythonShellMaster和ScalaShell一樣,我們也可以指定參數(shù)運行一個PythonShell,例如,我們運行一個3個線程的PythonShell,命令如下:#./bin/pyspark--masterlocal[3]運行結(jié)果如圖:
5
通過Python去運行圓周率Master我們同樣可以通過Python去運行圓周率的例子:#./bin/spark-submitexamples/src/main/python/pi.py10如圖:
6
Scala安裝與配置Master配置spark-env.sh#cdspark-1.5.2/conf/修改spark-env.sh文件#cpspark-env.sh.templatespark-env.sh編輯spark-env.sh添加以下內(nèi)容:exportJAVA_HOME=/usr/java/jdk1.7.0_67/exportSPARK_MASTER_IP=192.168.200.129exportSPARK_WORKER_MEMORY=1gexportHADOOP_CONF_DIR=/opt/hadoop_resources/hadoop-2.7.0/etc/hadoop修改slaves文件在master節(jié)點進(jìn)行配置#
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合作店合同范本xy
- 代辦牛羊屠宰合同范本
- 拆除游樂設(shè)施合同范本
- 稻米加工合同范本
- 跨境鞋子轉(zhuǎn)讓合同范本
- 裝修別墅合同范本
- 化糞池清運合同范本
- 個人卡車轉(zhuǎn)讓合同范本
- 裝修簽安全合同范本
- 工程牌匾質(zhì)保合同范本
- 2025年發(fā)展對象考試題庫附含答案
- 2025年兵團(tuán)基層兩委正職定向考錄公務(wù)員試題(附答案)
- 2025年新專長針灸考試題及答案
- 高三生物一輪復(fù)習(xí)課件微專題5電子傳遞鏈化學(xué)滲透假說及逆境脅迫
- DBJ50-T-306-2024 建設(shè)工程檔案編制驗收標(biāo)準(zhǔn)
- 2025四川雅安滎經(jīng)縣國潤排水有限責(zé)任公司招聘5人筆試歷年參考題庫附帶答案詳解
- 2025中國銀行新疆區(qū)分行社會招聘筆試備考試題及答案解析
- 污水采樣培訓(xùn)課件
- 藥品醫(yī)療器械試題及答案
- 子宮內(nèi)膜類器官構(gòu)建與臨床轉(zhuǎn)化專家共識解讀 2
- 幼師培訓(xùn):如何上好一節(jié)課
評論
0/150
提交評論