每個人都有自己的學(xué)習(xí)方式。書籍對于一個人的吸引力是任何其他學(xué)習(xí)媒介所不能給予的。不過,關(guān)于數(shù)據(jù)科學(xué)的書籍多之又多,從何選擇?從何開始?有哪些書適合學(xué)習(xí)一種特定的技術(shù)或者領(lǐng)域?本文列出了按照不同領(lǐng)域劃分的27本必讀的書籍。 統(tǒng)計學(xué)類書籍 1. Statistics in Plain English 作者:Timothy C. Urdan 這本書完全是為小白寫的,通俗易懂。寫作風(fēng)格和提供的解釋都與書名相對應(yīng)——Statistics in Plain English。你可以把他們推薦給沒有任何技術(shù)背景的人。 2. Think Stats: Probability and Statistics for Programmers 作者:Allen B. Downey 你會發(fā)現(xiàn)這本書出現(xiàn)在眾多數(shù)據(jù)科學(xué)書籍清單里。這本書里的資源很豐富,在這本書里有很多數(shù)據(jù)文件、代碼和解決方案等。對于有Python基礎(chǔ)的人來講,這些都非常實用,這些計算機(jī)語言被用于驗證真實世界的案例。 3. Introduction to Statistical Learning 作者: Gareth James, Daniela Witten, Trevor Hastie和Robert Tibshirani 這本書非常經(jīng)典,涵蓋了基本的統(tǒng)計學(xué)知識和機(jī)器學(xué)習(xí)技術(shù)。關(guān)于這本書最好的部分是每一個概念都在R語言中用案例進(jìn)行解釋。所以,一旦你掌握編程,你就可以對每一個概念進(jìn)行檢驗。還有比多次實踐更能檢驗概念的方法嗎? 概率類書籍 1. Probability: For the Enthusiastic Beginner 作者:David Morin 對于初學(xué)者來說,這本書是一個理想的選擇。這本書是面向大學(xué)生的,所以如果想要學(xué)習(xí)概率,你絕對會很喜歡這本書的寫作方式。這本書涵蓋了所有的基本概念——組合學(xué)、概率規(guī)則、貝葉斯定理、期望值、方差、概率密度、共同分布、大數(shù)定律、中心極限定理、相關(guān)性和回歸。 2. Introduction to Probability 作者:J. Laurie Snell和Charles Miller Grinstead 這本是也是一本入門級別的書,涵蓋了基本的概率概念。與上一本書一樣,這本書是面向大學(xué)生的綜合性的書。如果想要從頭開始學(xué)習(xí)概率,這本書就是最好的選擇,它面向從未涉及過這個領(lǐng)域的人。 3. An Introduction to Probability Theory and its Applications 作者:William Feller 正如封面所描述的,這本書是關(guān)于概率理論的理論和實踐應(yīng)用的指南。如果你想深入了解概率,強(qiáng)烈推薦你讀這本書。這本書或許不太適合初學(xué)者,因為它的內(nèi)容非常綜合。如果你學(xué)習(xí)概率只是為了進(jìn)行到數(shù)據(jù)科學(xué)的領(lǐng)域,那么你可以讀推薦的以上兩本書。 機(jī)器學(xué)習(xí)類書籍 1. The Hundred-Page Machine Learning Book 作者:Andriy Burkov Andriy Burkov在100多頁的內(nèi)容里將諸多復(fù)雜的內(nèi)容介紹清楚了。這本書寫得非常好,通俗易懂,連意見領(lǐng)袖Peter Norvig也對它進(jìn)行了推薦。無論你是初學(xué)者還是已經(jīng)有基礎(chǔ)的人,每一位數(shù)據(jù)科學(xué)家都應(yīng)該讀一讀這本書。 2. Machine Learning 作者:Tom Mitchell 在所有宣傳之前,Tom Mitchell關(guān)于機(jī)器學(xué)習(xí)的書是理解各種技術(shù)和算法背后的數(shù)學(xué)的首選文本。在看這本書之前建議你先學(xué)習(xí)數(shù)學(xué)。但是,你不需要人工智能或統(tǒng)計數(shù)據(jù)的任何背景來理解這些概念。 3. Elements of Statistical Learning 作者:Trevor Hastie, Robert Tibshirani和Jerome Friedman 這本書非常經(jīng)典,是由Hastie 和Tibsharani寫的。它是對Introduction to Statistical Learning一書的承接。雖然這本書有一些重疊,但這本書的內(nèi)容更加高級,主要是關(guān)于機(jī)器學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)、矩陣分解、譜聚類等主題的。 深度學(xué)習(xí)類書籍 1. Deep Learning 作者: Ian Goodfellow, Yoshua Bengio和Aaron Courville Deep Learning一書被廣泛認(rèn)為是初學(xué)者的最佳資源。它分為三個部分:應(yīng)用數(shù)學(xué)和機(jī)器學(xué)習(xí)基礎(chǔ),現(xiàn)代實踐深度學(xué)習(xí)框架和深度學(xué)習(xí)研究。它是迄今為止深度學(xué)習(xí)社區(qū)中被引用最多的書籍。把它放在床邊,經(jīng)常翻閱——無論何時開始深度學(xué)習(xí)之旅,這本書都值得一讀。 2. Deep Learning with Python 作者:Francois Chollet 學(xué)習(xí)深度學(xué)習(xí)(或機(jī)器學(xué)習(xí))的一種非??岬姆椒ㄊ峭ㄟ^理論進(jìn)行編程,這就是Francois Chollet在Deep Learning with Python一書中所遵循的方法。概念都是通過流行的Keras庫來進(jìn)行將解釋的,F(xiàn)rancois是Keras的創(chuàng)造者,所以誰更好地教你這個話題?建議在推特上關(guān)注Francois——我們可以向他學(xué)習(xí)很多東西。 3. Neural Networks and Deep Learning 作者:Michael Nielsen 這是一本免費的在線書籍,旨在了解支持深度學(xué)習(xí)的核心組件——神經(jīng)網(wǎng)絡(luò)。 它提供了一種實用的教學(xué)方法,并從初學(xué)者的角度審視深度學(xué)習(xí)主題。你不會在本書中學(xué)習(xí)任何編程語言——它是一本關(guān)于神經(jīng)網(wǎng)絡(luò)背后隱含見解的老式教科書。 自然語言處理類書籍 1. Natural Language Processing with Python 作者:Steven Bird, Ewan Klein和Edward Loper 你將獲得原本不具備的Python概念,并使用NLTK庫(Natural Language Toolkit)瀏覽自然語言處理的世界。雖然這不是你學(xué)習(xí)自然語言處理的唯一資源,但它提供了相當(dāng)不錯的主題介紹。 2. Foundations of Statistical Natural Language Processing 作者:Christopher Manning和Hinrich Schutze 這本書出版于大約二十多年前,但內(nèi)容非常經(jīng)典。它是自然語言處理子領(lǐng)域的全面指南,如文本分類、詞性標(biāo)注、概率分析以及其他各種事物。作者對數(shù)學(xué)和語言基礎(chǔ)進(jìn)行了嚴(yán)謹(jǐn)?shù)拿枋觥_@本書的內(nèi)容非常詳細(xì)。 3. Speech and Language Processing 作者:Daniel Jurafsky和James H. Martin 本書的重點是自然語言和言語范圍內(nèi)的實際應(yīng)用和科學(xué)評價。閱讀這本書主要是為了擴(kuò)展視野,也可以看一下語音識別。這是一個現(xiàn)在蓬勃發(fā)展的研究領(lǐng)域,每天都有大量的應(yīng)用程序出現(xiàn)。Jurafsky和Martin撰寫了一本關(guān)于自然語言處理和計算語言學(xué)的深入研究。 計算機(jī)視覺類書籍 1. Computer Vision: Algorithms and Applications 作者:Richard Szeliski 本書介紹了一些常見的計算機(jī)視覺技術(shù),尤其是用于分析和解釋圖像的技術(shù)。這本書已經(jīng)出版了九年,但Richard Szeliski所示的例子和方法也適用于今天。這是一個全面的文本,采用科學(xué)的方法來解決基本的視覺挑戰(zhàn)。 2. Programming Computer Vision with Python 作者:Jan Erik Solem 在深入研究這本很棒的書之前,請訪問網(wǎng)站http:///下載數(shù)據(jù)集,代碼筆記本并復(fù)制提到的GitHub存儲庫。它們是計算機(jī)視覺介紹的絕佳伴侶。正如作者所述,“當(dāng)你運用Python時,你將學(xué)習(xí)物體識別、三維重建、立體成像、增強(qiáng)現(xiàn)實和其他計算機(jī)視覺應(yīng)用技術(shù)?!?/p> 3. Computer Vision: Models, Learning, and Inference 作者:Dr. Simon J.D. Prince 本書從頭開始向我們介紹概率的概念,并由此拓展。雖然這里介紹的一些框架已經(jīng)出現(xiàn)了更多高級版本,但本書仍然與當(dāng)前背景相關(guān)。本書已經(jīng)引入了70多種算法,通過350多個插圖進(jìn)行了精美的補(bǔ)充。 人工智能類書籍 1. Artificial Intelligence: A Modern Approach 作者:Stuart Russell和Peter Norvig 這本書是由Stuart Russell和Peter Norvig所寫的。這本書在人工智能學(xué)習(xí)領(lǐng)域非常有影響力。100多個國家的1300多所大學(xué)都將這本書列入其課程中。這本書非常具有深度,有1100多頁,涉及到的人工智能領(lǐng)域的內(nèi)容也很豐富,包括語言識別、自動駕駛、機(jī)器翻譯、視覺學(xué)習(xí)等其他內(nèi)容。這本書可以被視為人工智能領(lǐng)域的圣經(jīng)。 2. Artificial Intelligence for Humans 作者:Jeff Heaton 人工智能背后有哪些基礎(chǔ)算法?這本書在222頁的篇幅中探究了很多深度技術(shù)。這是關(guān)于人工智能背后技術(shù)的一系列書籍的第1卷(維度、距離度量、聚類、誤差計算、爬山、Nelder Mead和線性回歸)。還有一個附帶的站點,其中包含書中引用的示例和包含代碼的GitHub存儲庫。 3. The Master Algorithm 作者:Pedro Domingos 如果你想看關(guān)于人工智能的技術(shù)書籍,這本書就不是最佳選擇了。但是,它是關(guān)于機(jī)器學(xué)習(xí)如何重塑商業(yè)、政治、科學(xué)和戰(zhàn)爭的精辟文本。這是一本深思熟慮且發(fā)人深省的書,介紹了人工智能現(xiàn)在的位置,以及它最終可能會在哪些領(lǐng)域取代人類,我們是否會找到能夠從數(shù)據(jù)中驅(qū)動所有知識的單一算法(或“主算法”)。 工具和語言類書籍 Python類書籍 1. Fluent Python: Clear, Concise, and Effective Programming 作者:Luciano Ramalho 正如你對編程書籍所期待的那樣,這是一本指南,能夠幫助你理解Python是如何運作的,如何寫出漂亮有效的Python代碼。Luciano Ramalho還列舉出了很有使用的資源庫,在一些數(shù)據(jù)科學(xué)項目中非常實用。這本書有794頁,內(nèi)容非常豐富。 2. Programming Python: Powerful Object-Oriented Programming |
|