乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      GitHub上的數(shù)據(jù)分析庫(kù)

       KyunraWang 2018-05-27



      預(yù)計(jì)閱讀時(shí)長(zhǎng):7分鐘


      首先介紹一下GitHub:GitHub是一個(gè)通過Git進(jìn)行版本控制的軟件源代碼托管服務(wù)托管平臺(tái),于2008年4月正式上線,截止上個(gè)月已經(jīng)成立十周年。目前,GitHub上有超過兩千七百萬用戶以及超過八千萬代碼庫(kù),是一個(gè)大家學(xué)習(xí)、分享和創(chuàng)建軟件的社區(qū)。 

      在GitHub,用戶可以十分輕易地找到海量的開源代碼并下載到本地或添加到自己的GitHub項(xiàng)目庫(kù)中。項(xiàng)目庫(kù)涉及的題材種類豐富,譬如比特幣和眾多區(qū)塊鏈項(xiàng)目代碼庫(kù)也托管在GitHub。

      除了軟件開發(fā)方面的代碼庫(kù),機(jī)器學(xué)習(xí)也是GitHub 上的熱門話題,在machine learning的話題下有近一萬七千個(gè)開源項(xiàng)目庫(kù)(傳送門:https://github.com/topics/machine-learning),從谷歌的tensorflow,到機(jī)器學(xué)習(xí)方面的scikit-learn再到微軟的Cognitive Toolkit (CNTK),眾多廣受好評(píng)的項(xiàng)目,都可以找到。

      下面開始本次數(shù)據(jù)分析相關(guān)的項(xiàng)目庫(kù)的介紹:


        1  圖像處理庫(kù)

      想要遮擋住合影中意外闖入的不慎闖入的陌生人?想要消除桌子上意外多出的水杯?在圖像處理庫(kù)這方面隨緣推薦person-blocker項(xiàng)目庫(kù)幫您實(shí)現(xiàn)這項(xiàng)功能。

      person-blocker于2018年3月份發(fā)布,是基于python的圖像處理代碼庫(kù)。person-blocker庫(kù)可以自動(dòng)識(shí)別圖像中物體進(jìn)行識(shí)別并遮擋,該功能的實(shí)現(xiàn)是基于Mask_RCNN庫(kù)對(duì)于常見物體進(jìn)行識(shí)別區(qū)分,預(yù)訓(xùn)練模型則使用了Microsoft COCO: Common Objects inContext數(shù)據(jù)集。下圖中的實(shí)例代碼實(shí)現(xiàn)了遮擋斑馬群旁邊的長(zhǎng)頸鹿的功能。

      除了長(zhǎng)頸鹿,還有80種元素(例如,人物、鳥類、電腦、等等)也可以用這可庫(kù)進(jìn)行識(shí)別和遮擋,而且代碼運(yùn)行過程中不需要使用圖形處理器(GPU),需要修圖的用戶考慮一下喲~

      地址:https://github.com/minimaxir/person-blocker


        2  數(shù)據(jù)集庫(kù)

      想要做好數(shù)據(jù)分析,高質(zhì)量的數(shù)據(jù)集也是必不可少的,緊貼時(shí)事又干凈清晰的數(shù)據(jù)集,在GitHub各種項(xiàng)目庫(kù)中也有不少,您值得擁有。本次數(shù)據(jù)集方面推薦的項(xiàng)目庫(kù)是 fivethirtyeight。

      fivethirtyeight項(xiàng)目庫(kù)由FiveThirtyEight網(wǎng)站提供(傳送門:http://)。FiveThirtyEight,又稱538,是一個(gè)專注于發(fā)布輿情調(diào)查、政治、經(jīng)濟(jì)和體育等相關(guān)題材博客的網(wǎng)站,曾先后被ESPN和ABCNews收購(gòu)。網(wǎng)站于2008年由 Nate Silver創(chuàng)辦,命名靈感來自于美國(guó)大選中的選舉團(tuán)成員數(shù)目,網(wǎng)站初期用于發(fā)布美國(guó)總統(tǒng)選舉的投票結(jié)果預(yù)測(cè),后逐漸增加體育、經(jīng)濟(jì)生活等板塊的數(shù)據(jù)分析類博客。創(chuàng)辦人Nate Silver成功預(yù)測(cè)了2008年的美國(guó)總統(tǒng)選舉中50個(gè)州的49個(gè)州的投票結(jié)果,在2009年被時(shí)代(Time)雜志列全球最有影響的100個(gè)人之一。

      目前,除了總統(tǒng)選舉結(jié)果預(yù)測(cè)項(xiàng)目,538網(wǎng)站上還有MLB,NBA等各大賽事的結(jié)果預(yù)測(cè)的項(xiàng)目,和諸多時(shí)事數(shù)據(jù)分析。點(diǎn)擊下圖看示例。

      (圖源:https://projects./)

      (圖源:https://projects./soccer-predictions/)

      在GitHub上的FiveThirtyEight中,可以找到FiveThirtyEight網(wǎng)站里的博客以及項(xiàng)目中使用的數(shù)據(jù)和部分?jǐn)?shù)據(jù)分析代碼。數(shù)據(jù)庫(kù)里的數(shù)據(jù)都是整理清洗好的,著重推薦給愛好時(shí)事,但苦于缺少數(shù)據(jù)來源的用戶。此外,希望練習(xí)一下自己數(shù)據(jù)可視化展示能力的用戶,這個(gè)庫(kù)不要錯(cuò)過喲。

      地址:https://github.com/fivethirtyeight/data


        3  數(shù)據(jù)分析學(xué)習(xí)資源庫(kù)

      Coursera、Stack Overflow、慕課網(wǎng)……隨著互聯(lián)網(wǎng)的發(fā)展及推廣,各種開源在線學(xué)習(xí)資源層出不窮,GitHub上同樣也有很多數(shù)據(jù)分析方面的學(xué)習(xí)資源可供大家參考。

      數(shù)據(jù)分析學(xué)習(xí)資源庫(kù)方面本次主要推薦兩個(gè)庫(kù):data-science-ipython-notebooks(主要包含使用python進(jìn)行數(shù)據(jù)分析的代碼示例和解釋說明)和The OpenSource Data Science Masters(數(shù)據(jù)科學(xué)相關(guān)知識(shí)的整合資源庫(kù))。

      data-science-ipython-notebooks是由Donne Martin發(fā)布的數(shù)據(jù)科學(xué)代碼庫(kù),該庫(kù)以Jupyter Notebook(過去稱為IPython Notebook)形式發(fā)布,用戶可以清晰看到各種數(shù)據(jù)分析庫(kù)所涉及的代碼的應(yīng)用實(shí)例,目前獲得點(diǎn)贊數(shù)目超過一萬二千次。下圖中的示例展示了如何利用pandas對(duì)數(shù)據(jù)進(jìn)行選擇的代碼,代碼輸入和輸出結(jié)果以IPython Notebook形式呈現(xiàn),方便閱讀。

      (圖源:https://github.com/donnemartin/data-science-ipython-notebooks/blob/master/pandas/03.02-Data-Indexing-and-Selection.ipynb)

      data-science-ipython-notebooks庫(kù)中涉及的數(shù)據(jù)分析題材廣泛,從數(shù)據(jù)處理方面的pandas,到機(jī)器學(xué)習(xí)方面的scikit-learn,深度學(xué)習(xí)方面的TensorFlow,Theano, Caffe, Keras也在持續(xù)更新。這個(gè)庫(kù)很適合常用python進(jìn)行數(shù)據(jù)分析處理的用戶去了解代碼功能。地址:https://github.com/donnemartin/data-science-ipython-notebooks

       

      The Open Source DataScience Masters由數(shù)據(jù)科學(xué)家Clare Corthell維護(hù)的開源教學(xué)資源庫(kù),是一個(gè)比較全面地整合了數(shù)據(jù)科學(xué)方面各種學(xué)習(xí)資源的項(xiàng)目庫(kù)。該庫(kù)包含機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘方向的從入門到精通、從理論到操作技術(shù)所需的各種技能包以及相應(yīng)的資源(例如在線課程、書籍、編程資料,等等)。下圖中為在數(shù)據(jù)科學(xué)方面較為必須的數(shù)學(xué)技能列表(例如線性代數(shù)、線性規(guī)劃、矩陣運(yùn)算,等等),以及相應(yīng)的線上課程學(xué)習(xí)資源和書籍推薦。

      這個(gè)庫(kù)推薦給想要比較系統(tǒng)的學(xué)習(xí)數(shù)據(jù)科學(xué)理論知識(shí)或者需要查找某些特別知識(shí)點(diǎn)的用戶。地址:https://github.com/datasciencemasters/go

       

      以上就是本次要分享的項(xiàng)目庫(kù),祝各位讀者探索愉快!

       





        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多