Spark并行計算 說課一等獎_第1頁
Spark并行計算 說課一等獎_第2頁
Spark并行計算 說課一等獎_第3頁
Spark并行計算 說課一等獎_第4頁
Spark并行計算 說課一等獎_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Spark并行計算

2了解Spark的擴(kuò)展知識首先定義一個名為points的緩存RDD,這是在文本文件上執(zhí)行map轉(zhuǎn)換之后得到的,即將每個文本行解析為一個Point對象。然后在points上反復(fù)執(zhí)行map和reduce操作,每次迭代時通過對當(dāng)前w的函數(shù)進(jìn)行求和來計算梯度。7.1小節(jié)我們將看到這種在內(nèi)存中緩存points的方式,比每次迭代都從磁盤文件裝載數(shù)據(jù)并進(jìn)行解析要快得多。已經(jīng)在Spark中實現(xiàn)的迭代式機(jī)器學(xué)習(xí)算法還有:kmeans(像邏輯回歸一樣每次迭代時執(zhí)行一對map和reduce操作),期望最大化算法(EM,兩個不同的map/reduce步驟交替執(zhí)行),交替最小二乘矩陣分解和協(xié)同過濾算法。Chu等人提出迭代式MapReduce也可以用來實現(xiàn)常用的學(xué)習(xí)算法。

3

通過指定參數(shù)打開SparkshellMaster我們也可以指定參數(shù)打開交互式SparkShell,SparkShell是一個修改版的ScalaShell。通過交互式Shell可以幫助我們理解架構(gòu)。#./bin/spark-shell--masterlocal[N]--master:指定master節(jié)點的URL,我們也可以使用local參數(shù)去使用單線程模式執(zhí)行本地的SparkShell,或者使用local[N]去執(zhí)行N個本地線程的SparkShell。例如,我們使用兩個線程打開本地的SparkShell:#./bin/spark-shell--masterlocal[2]執(zhí)行后,我們可以看到修改版的ScalaShell,如圖:

4

通過指定參數(shù)打開PythonShellMaster和ScalaShell一樣,我們也可以指定參數(shù)運行一個PythonShell,例如,我們運行一個3個線程的PythonShell,命令如下:#./bin/pyspark--masterlocal[3]運行結(jié)果如圖:

5

通過Python去運行圓周率Master我們同樣可以通過Python去運行圓周率的例子:#./bin/spark-submitexamples/src/main/python/pi.py10如圖:

6

Scala安裝與配置Master配置spark-env.sh#cdspark-1.5.2/conf/修改spark-env.sh文件#cpspark-env.sh.templatespark-env.sh編輯spark-env.sh添加以下內(nèi)容:exportJAVA_HOME=/usr/java/jdk1.7.0_67/exportSPARK_MASTER_IP=192.168.200.129exportSPARK_WORKER_MEMORY=1gexportHADOOP_CONF_DIR=/opt/hadoop_resources/hadoop-2.7.0/etc/hadoop修改slaves文件在master節(jié)點進(jìn)行配置#

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論