乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

<output id="e9wm2"></output>

<s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

搜索

分享

QQ空間 QQ好友新浪微博微信

一文入門Python Selenium動態(tài)爬蟲——從了解房價開始

鷹兔牛熊眼 2019-01-24

展開全文

作者介紹：timber ，在一家電子商務(外貿(mào))公司任職運維，平常工作時我覺得敲命令的樣子也很帥 ---Python，Changed me！

個人博客地址：

https://blog.csdn.net/weixin_42946604

本文首發(fā)于：

https://blog.csdn.net/weixin_42946604

前言

我這里用到了的python+selenium來抓取鏈家房數(shù)據(jù)，因爲很多時候分析參數(shù)，頭疼啊，能分析的還好。有些網(wǎng)頁就很變態(tài)哦，參數(shù)都是經(jīng)過加密的。

selenium自動化優(yōu)點(我去找了一下度娘…哈哈)，完全可以模擬人工操作網(wǎng)頁，而且相對其他爬蟲不用寫請求頭(偷懶)，例如直接request的，聽說更容易被封(403)，我只是聽說！

最后希望更大家互勉互力，一同進步！現(xiàn)在跟大家分享一下python selenium的小知識…

整體流程

1、安裝selenium

命令行：pip install selenium 敲回車

2、下載chromedriver插件，對應自己的版本，鏈接在此：

http://chromedriver.storage./index.html

直接放在Python的Scripts目錄下就可以不能配置變量了，而且也不用聲明路徑

（后面會說到）

3、安裝pyquery 一樣的用到pip安裝敲回車

命令行：pip install pyquery

4、安裝pymysql

命令行：pip install pymysql 同上

5、以上安裝完成后，開始我們的騷操作了。

網(wǎng)頁分析

我們不用聲明請求頭還有分析一些參數(shù)了，只要我們拿到URL，指哪爬哪！
此次抓取的數(shù)據(jù)如下：

那這些數(shù)據(jù)的提取正題就來了！
打開開發(fā)者工具，google瀏覽器直接挫F12

發(fā)現(xiàn)每個小區(qū)的售房信息都在ul下的li標簽里面。直接上代碼

第一步拿到html結(jié)構(gòu)，然后用pyquery解析遍歷li標簽，我使用了items()方法

提取小區(qū)名稱，找到a標簽的class

提取房類的文本，span標簽下面

其他的TEXT文本都是這樣的方法提取
提醒的一點就是

我們這里判斷一下ul的class，防止有時候網(wǎng)絡加載的問題，導致發(fā)生錯誤。

模擬滾動，點擊下一步操作

我們沒跳轉(zhuǎn)一頁就滾動一下滾動條，這個有好處的哦有時候很多異步加載的，例如一下ajax加載的就是很好的例子了，查看評論的時候很多是這樣的！我們來看一下

這也是個方法，根據(jù)個人不同來定義，我這里以800來滾動。
然后就是點擊下一頁的動作，網(wǎng)頁有下一頁的

代碼實現(xiàn) 直接上圖

一些其他的小動作，可以自己添加哦！

數(shù)據(jù)存儲

我這里用mysql存放數(shù)據(jù)，上圖

我提前把數(shù)據(jù)表建好了的，表名為lianjie_data，數(shù)據(jù)庫名是lianjie，這里根據(jù)個人情況。
你可以寫一個data_save的方法，我這里簡單粗暴點從上到下直接寫完了。
好了運行程序

數(shù)據(jù)展示

是不是完完全全模擬人工操作呢，其實我沒加太多動作嘻嘻
源碼后續(xù)放出來，也會寫一些更多的小知識更大家分享

千山萬水總是情，點個「好看」行不行。

◆ ◆ ◆ ◆ ◆

本站是提供個人知識管理的網(wǎng)絡存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息，謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：鷹兔牛熊眼 > 《python》

舉報/認領(lǐng)

0條評論

請遵守用戶評論公約

類似文章 更多

鷹兔牛熊眼

關(guān)注對話

TA的最新館藏

[轉(zhuǎn)] 口袋支點買入法（上）
電氣設(shè)備板塊接力，領(lǐng)導股領(lǐng)先板塊上漲
2024年第10周周總結(jié) 模仿佼佼者買股票
[轉(zhuǎn)] 陶博士中期信號研究
[內(nèi)部組]牛市股的選股公式優(yōu)化
中期買入信號最好的位置在哪？（2022年10月6日）

喜歡該文的人也喜歡更多

熱門閱讀換一換

<object id="ya1g3"><button id="ya1g3"></button></object>