乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

       東西二王 2019-05-21
      程序員書庫(ID:OpenSourceTop) 整編 綜合自:https://github.com/lanbing510/DouBanSpider

      程序員在提升自己的道路,大多還是會選擇閱讀編程書籍這一途徑,但找到一本好書就沒那么容易了。

      通過查看各大銷售網(wǎng)站的銷量數(shù)據(jù)和評價,以及豆瓣評分和評價人數(shù),可以幫助我們更快的挖掘出經(jīng)典的計算機(jī)書籍,還有那些被人們忽視的好書。

      最近猿哥在GitHub上發(fā)現(xiàn)了一個網(wǎng)站,是中國科學(xué)院自動化研究所的一大神(lanbing510)用Python寫的一個爬蟲,他在16年的時候就爬下了豆瓣所有的讀書數(shù)據(jù)并做了個WebApp接口方來挖掘查找和閱讀好書。怪我知道的太晚

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

      后來lanbing510再次爬了一遍豆瓣讀書的數(shù)據(jù),總共更新了3232088本圖書信息,共2138386KB,并將其開源

      為什么說它很好用呢?猿哥演示一遍你就知道了:

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

      可以看出這網(wǎng)站的界面非常簡潔,沒有花里花哨的內(nèi)容,只有干貨,你可以直接通過關(guān)鍵字、分?jǐn)?shù)、和評價人數(shù)這三個選項進(jìn)行搜索,比如我們可以搜索關(guān)鍵字:編程;分?jǐn)?shù):9.0;評價人數(shù):100人以上

      查找結(jié)果的顯示方式有按照分?jǐn)?shù)排序和人數(shù)排序兩種,按照分?jǐn)?shù)排序的截圖如下:

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

      按照評價人數(shù)排序的截圖如下:

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

      除了以上演示的操作,這個網(wǎng)站并實(shí)現(xiàn)了以下功能:

      • 可以爬下豆瓣讀書標(biāo)簽下的所有圖書

      • 按評分排名依次存儲

      • 存儲到Excel中,可方便大家篩選搜羅,比如篩選評價人數(shù)>1000的高分書籍;可依據(jù)不同的主題存儲到Excel不同的Sheet

      • 采用User Agent偽裝為瀏覽器進(jìn)行爬取,并加入隨機(jī)延時來更好的模仿瀏覽器行為,避免爬蟲被封

      也就是說你不僅可以在網(wǎng)站上搜索,還能通過下載各類目下的Excel書單文件,直接在Excel中搜索

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

      效果截圖如下:

      秒搜編程好書 就用這個Python寫的爬蟲網(wǎng)站

      最后附上網(wǎng)站地址:http://sobook.

      GitHub地址:https://github.com/lanbing510/DouBanSpider

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多