Python爬蟲基礎(chǔ)初探selenium_第1頁
Python爬蟲基礎(chǔ)初探selenium_第2頁
Python爬蟲基礎(chǔ)初探selenium_第3頁
Python爬蟲基礎(chǔ)初探selenium_第4頁
Python爬蟲基礎(chǔ)初探selenium_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第Python爬蟲基礎(chǔ)初探selenium目錄Seleniumselenium的用途selenium是優(yōu)缺點

1.Selenium工作原理1.1Selenium配置1.2瀏覽器驅(qū)動1.3使用Selenium2快速入門Python爬蟲、數(shù)據(jù)分析、網(wǎng)站開發(fā)等案例教程視頻免費在線觀看

/523606542

Selenium

Selenium是一個Web的自動化測試工具,最初是為網(wǎng)站自動化測試而開發(fā)的,就像玩游戲用的按鍵精靈,可以按指定的命令自動操作。

Selenium測試工具直接操控瀏覽器中,就像真正的用戶在操作一樣。Selenium可以根據(jù)的指令,讓瀏覽器自動加載頁面,獲取需要的數(shù)據(jù),甚至頁面截屏,或者判斷網(wǎng)站上某些動作是否發(fā)生等。

selenium的用途

(1)、selenium可以驅(qū)動瀏覽器自動執(zhí)行自定義好的邏輯代碼,也就是可以通過代碼完全模擬成人類使用瀏覽器自動訪問目標站點并操作,那我們也可以拿它來做爬蟲。

(2)、selenium本質(zhì)上是通過驅(qū)動瀏覽器,完全模擬瀏覽器的操作,比如跳轉(zhuǎn)、輸入、點擊、下拉等...進而拿到網(wǎng)頁渲染之后的結(jié)果,可支持多種瀏覽器

selenium是優(yōu)缺點

(1)優(yōu)點

優(yōu)點就是可以幫我們避開一系列復(fù)雜的通信流程,例如在我們之前學(xué)習(xí)的requests模塊,那么requests模塊在模擬請求的時候是不是需要把素有的通信流程都分析完成后才能通過請求,然后返回響應(yīng)。假如目標站點有一系列復(fù)雜的通信流程,例如的登錄時的滑動驗證等...那么你使用requests模塊的時候是不是就特別麻煩了。不過你也不需要擔(dān)心,因為網(wǎng)站的反爬策略越高,那么用戶的體驗效果就越差,所以網(wǎng)站都需要在用戶的淫威之下降低安全策略。

再看一點requests請求庫能不能執(zhí)行js?是不是不能呀!那么如果你的網(wǎng)站需要發(fā)送ajax請求,異步獲取數(shù)據(jù)渲染到頁面上,是不是就需要使用js發(fā)送請求了。那瀏覽器的特點是什么?是不是可以直接訪問目標站點,然后獲取對方的數(shù)據(jù),從而渲染到頁面上。那這些就是使用selenium的好處!

(2)缺點

使用selenium本質(zhì)上是驅(qū)動瀏覽器對目標站點發(fā)送請求,那瀏覽器在訪問目標站點的時候,是不是都需要把靜態(tài)資源都加載完畢。html、css、js這些文件是不是都要等待它加載完成。是不是速度特別慢。那用它的壞處就是效率極低!所以我們一般用它來做登錄驗證。

1.Selenium工作原理

如圖所示,通過Python來控制Selenium,然后讓Selenium控制瀏覽器,操縱瀏覽器,這樣就實現(xiàn)了使用Python間接的操控瀏覽器。

1.1Selenium配置

Selenium支持多種瀏覽器,最常見的就是火狐和谷歌瀏覽器。首先在電腦上下載瀏覽器,瀏覽器版本不宜過新。

火狐:截圖如下

谷歌:截圖如下

1.2瀏覽器驅(qū)動

Selenium具體怎么就能操縱瀏覽器呢這要歸功于瀏覽器驅(qū)動,Selenium可以通過API接口實現(xiàn)和瀏覽器驅(qū)動的交互,進而實現(xiàn)和瀏覽器的交互。所以要配置瀏覽器驅(qū)動。

火狐驅(qū)動下載地址:

/mirrors/geckodriver/

谷歌驅(qū)動下載地址:

/mirrors/chromedriver/

配置瀏覽器驅(qū)動:

將下載好的瀏覽器驅(qū)動解壓,將解壓出的exe文件放到Python的安裝目錄下,也就是和python.exe同目錄即可。

1.3使用Selenium

安裝selenium模塊,python借助這個模塊驅(qū)動瀏覽器,使用如下命令行安裝這個模塊即可

pipinstallselenium

2快速入門

#打開百度首頁

fromseleniumimportwebdriver

driver=webdriver.chrome()

url='https://www.baidu.com/'

driver.get(url)

#打開get就類似與在瀏覽器地址欄里面放入網(wǎng)址

driver.g

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論