神譯局是36氪旗下編譯團隊,關(guān)注科技、商業(yè)、職場、生活等領(lǐng)域,重點介紹國外的新技術(shù)、新觀點、新風(fēng)向。
編者按:為方便對數(shù)據(jù)科學(xué)(DATA SCIENCE)感興趣的愛好者和實操者的學(xué)習(xí),本文作者分享了 8 類關(guān)于數(shù)據(jù)科學(xué)的書籍,包括統(tǒng)計/概率論類、機器學(xué)習(xí)類、數(shù)據(jù)可視化與分析類、深度學(xué)習(xí)類、自然語言處理(NLP)類、計算機視覺類、人工智能類和工具/語言類。在分享書籍的同時,作者還提出以下忠告:在數(shù)據(jù)科學(xué)領(lǐng)域有多種成功的途徑,而我們要選擇的途徑應(yīng)該是足夠簡單,足以幫助我們快速上手的。
我們之所以在選擇學(xué)習(xí)方法上不知所措,往往是因為我們接觸的信息量太大了。與其花更多的時間思考如何獲得研究數(shù)據(jù)科學(xué)的技能,不如根據(jù)實際需要,從分享的書中挑選一本,然后開始學(xué)習(xí)。關(guān)鍵是要始終如一地采取行動,堅持閱讀。閱讀的目的是,學(xué)習(xí)和發(fā)現(xiàn)隱藏于書中的真實思想。對數(shù)據(jù)科學(xué)感興趣的朋友們,如果你還沒選好學(xué)習(xí)材料,就請閱讀作者推薦的這些頂級書籍吧。本文來自編譯,希望對您有幫助。因篇幅原因,本篇文章分三部分刊出,此為第一部分:
我們從某人的聲音中不能找到的東西,很可能會在他(她)的作品中發(fā)現(xiàn)?!獰o名氏
在知識爆炸的今天,關(guān)于數(shù)據(jù)科學(xué)的學(xué)習(xí)資源太多了,這會讓我們在選擇時無從下手吧?不要緊,以下是最新的數(shù)據(jù)科學(xué)必讀書籍集錦。
圖1. 眾多學(xué)習(xí)書源
我在網(wǎng)上自學(xué)時,總是更傾向于選擇視頻教程或講座。因為我發(fā)現(xiàn)這種選擇使學(xué)習(xí)變得更簡單,不那么麻煩(和大多數(shù)人的選擇一樣)。
我一直都覺得在網(wǎng)絡(luò)上自學(xué)時選擇視頻教程或講座更加簡便易行,直到幾年前我偶然讀到了一本關(guān)于統(tǒng)計學(xué)的書,才讓我改變了對看書學(xué)習(xí)的看法(從“無聊”到“神奇而有趣”)。我要向這本書的作者和出版商致敬。
在挑選關(guān)于數(shù)據(jù)科學(xué)的頂級書籍之前,我事先做了廣泛的研究。今天,我將這些書籍分享給所有有抱負(fù)的數(shù)據(jù)愛好者和實踐者。大家在讀了這些書之后,一定會讓自己陷入深深的思考之中。
讓我們開始看看這個書單吧……
我按這些書所涉及的領(lǐng)域?qū)⑺鼈儎澐譃橐韵?8 類來詳細(xì)介紹,以方便大家選擇:
*統(tǒng)計/概率論類書籍
*機器學(xué)習(xí)類書籍
*數(shù)據(jù)可視化和分析類書籍
*深度學(xué)習(xí)類書籍
*自然語言處理(NLP)類書籍
*計算機視覺類書籍
*人工智能類書籍
*工具/語言類書籍
作者:加雷斯·詹姆斯,丹妮拉·維滕,特來沃爾·黑斯蒂,羅伯特·蒂施萊尼(Gareth James, Daniela Witten, Trevor Hastie,Robert Tibshirani).
一直以來,這本書都是經(jīng)典書籍。它涵蓋了基本的統(tǒng)計學(xué)知識以及機器學(xué)習(xí)技術(shù)。這本書吸睛的地方在于,每一個概念都用 R 語言做案例分析。所以,我們一旦掌握了編程的技巧,在讀這本書時,就會快速回憶起每一個概念及其在程序中的操作方法。
圖2. 《統(tǒng)計學(xué)學(xué)習(xí)概論》
作者:艾倫·B·唐尼(Allen B. Downey)
這本書在眾多數(shù)據(jù)科學(xué)書籍中是首選書籍。它提供了大量的資源。尤其是對于有一定 Python 基礎(chǔ)知識的人,它特別實用,可以用來做數(shù)據(jù)分析。
圖3. 《思考統(tǒng)計:程序員的概率論和統(tǒng)計學(xué)》
作者:大衛(wèi)·斯皮格爾霍爾特(David Spiegelhalter)
這本書最大的亮點是采用了淺顯易懂的案例來講解理論。這本書不僅層層剖析了特定的問題,還給問題提供了具有漸進(jìn)性和一致性的統(tǒng)計解決方案。簡而言之,它使統(tǒng)計學(xué)的學(xué)習(xí)變得簡單了!
圖4. 《統(tǒng)計學(xué)的藝術(shù):從數(shù)據(jù)中學(xué)習(xí)》
作者:大衛(wèi)·莫蘭(David Morin)
圖5. 《概率論:狂熱初學(xué)者入門》
這是一本概率論初學(xué)者的理想讀物。它涵蓋了所有的基礎(chǔ)知識,包括組合學(xué),概率規(guī)則,貝葉斯定理,期望值,方差,概率密度,公共分布,大數(shù)定律,中心極限定理,相關(guān)性,回歸分析等等。
圖6. 《概率論入門》
作者:J·勞里·斯奈爾,查爾斯·米勒·格林斯特德(J. Laurie Snell,Charles Miller Grinstead)
這又是一本介紹概率概念的書籍。和《概率論:狂熱初學(xué)者入門》一樣,這本書是為研究生而寫的綜合教材。
作者:查爾斯·韋蘭(Charles Wheelan)
統(tǒng)計學(xué)有時候是一個令人生畏的話題。在這本書中,作者以一種風(fēng)趣而簡潔的方式闡明了關(guān)鍵概念,如推理、相關(guān)性和回歸分析等。
圖7. 《赤裸裸的統(tǒng)計——從數(shù)據(jù)中剝離恐懼》
圖8. 《百頁機器學(xué)習(xí)書》
作者:安德烈·博爾科夫(Andriy Burkov)
我真心喜歡這本書。在讀到它之前,我閱讀了大量的試圖從不同角度和不同層面講授機器學(xué)習(xí)的書籍。我絞盡腦汁地想從這些書中找到一個方法,希望它能夠簡潔地概括難以理解的話題和難以理解的方程式??墒牵钡阶x了安德里·布爾科夫用大約 100 多頁的篇幅寫出來的這本書,我才找到了這個方法。這本書文筆優(yōu)美,易于理解,已經(jīng)得到了許多人的認(rèn)可。
作者:戴維·西倫(Davy Cielen)等
出版商:曼寧(Manning)
圖9. 《數(shù)據(jù)科學(xué)介紹》
我喜歡這本書有一個特殊的原因,那就是,這些書不僅包含了我們常見的關(guān)于數(shù)據(jù)科學(xué)的主題,它還包括了數(shù)據(jù)科學(xué)整個領(lǐng)域的其他方面。我強烈推薦閱讀這本書,它會或多或少地會讓我們熟悉數(shù)據(jù)科學(xué)的全貌。
作者:喬爾·格魯斯(Joel Grus)
出版商:奧萊利(O’Reilly)
圖10. 《從頭開始的數(shù)據(jù)科學(xué)》
這本書的第二版已經(jīng)發(fā)布了,因為它囊括了各種基本原理。也是因此,它已經(jīng)成為一本倍受歡迎的書。這相當(dāng)于是一個完整的一攬子交易,讀了一本就等于讀了很多本,十分推薦本書。
作者:杰克·范德普拉斯(Jake VanderPlas)
出版商:奧萊利
圖11. 《Python數(shù)據(jù)科學(xué)手冊》
這本書最適合那些剛開始做數(shù)據(jù)分析或數(shù)據(jù)科學(xué)的人閱讀,這正是他們所需要的那本能夠參見所有技術(shù)的書。本書能夠強化你對 python 的掌握程度,并可促進(jìn)你在數(shù)據(jù)科學(xué)上的工作。
作者:艾米麗·羅賓遜,杰奎琳·諾里斯(Emily Robinson,Jacqueline Nolis)
出版商:曼寧
圖12. 《在數(shù)據(jù)科學(xué)領(lǐng)域建立職業(yè)生涯》
這本書于2020年出版,主要陳述了與學(xué)習(xí)數(shù)據(jù)科學(xué)相關(guān)的技術(shù)內(nèi)容。我們必讀這本書的原因是,它教我們?nèi)绾卧跀?shù)據(jù)科學(xué)行業(yè)工作。
作者:羅杰·D·彭,伊麗莎白·松井(Roger D. Peng, Elizabeth Matsui)
這本書不僅對數(shù)據(jù)分析工作流程做了完美的概述,還清楚地闡述了一個觀點——盡管存在許多工具、復(fù)雜的一步步的信息迭代過程,數(shù)據(jù)分析從根本上講依然是一門藝術(shù)。
圖13. 《數(shù)據(jù)科學(xué)的藝術(shù)——給任何與數(shù)據(jù)打交道的人的指南》
作者:克勞斯·沃克(Claus O. Wilke)
本書采用舉出正面和反面例子加以對比的方式,介紹了數(shù)據(jù)可視化的基本原則。它可以幫助我們理解有效的可視化背后的基本原理,并教會我們設(shè)計更有意義的模塊來傳達(dá)正確的信息。
圖14. 《數(shù)據(jù)可視化的基礎(chǔ)——信息豐富且引人注目的數(shù)字制作入門》
作者:朱莉·斯蒂爾,諾亞·伊林斯基(Julie Steele, Noah Iliinsky)
網(wǎng)站:奧萊利媒體|亞馬遜(O "Reilly Media| Amazon)
圖15. 《美麗的可視化,通過專家的眼睛看數(shù)據(jù)》
“可視化”是讓數(shù)據(jù)說話的一種新方式,通過顏色等視覺指標(biāo)達(dá)到溝通的目的,并通過一定的研究方法將數(shù)據(jù)和視覺指標(biāo)整合在一起。
這本書講述了一些著名的可視化設(shè)計和開發(fā)產(chǎn)品。
作者:安迪·克里貝爾(Andy Kriebel)
此書是周一改頭換面(MakeOverMonday)項目的擴展,在這個項目中,數(shù)據(jù)可視化社區(qū)的成員可以分享他們對現(xiàn)有圖表和數(shù)據(jù)的改進(jìn)。它強調(diào),雖然在設(shè)計可視化中存在可變性,但有一些關(guān)鍵技術(shù)可以遵循,以確保自己的圖表是有作用和有意義的。
圖16. 《周一改頭換面——每次用一張圖表改進(jìn)我們可視化和分析數(shù)據(jù)的方式》
作者:科爾·努斯鮑默·克納菲奇(Cole Nussbaumer Knaflic)
對于任何一個想要更好地以清晰、簡潔和圖形化的方式呈現(xiàn)信息的人來說,這是一本必讀的書。這本書教給我們數(shù)據(jù)可視化的基礎(chǔ)知識,以及如何有效地使用數(shù)據(jù),并舉出了大量現(xiàn)實的例子。
圖17. 《用數(shù)據(jù)講故事——商務(wù)專業(yè)人士的數(shù)據(jù)可視化指南》
作者:喬納森·施瓦比什(Jonathan Schwabish)
此書包括三個部分。第一部分簡要介紹了數(shù)據(jù)可視化的最佳實操方式。第二部分是本書的主要部分,講述了圖表類型。施瓦比什深入研究了不同類型的圖表,這些圖表遠(yuǎn)遠(yuǎn)超出了直線和條形的標(biāo)準(zhǔn)。
圖18. 《更好的數(shù)據(jù)可視化:學(xué)者、研究人員和書蟲的學(xué)習(xí)指南》
相關(guān)閱讀:學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(中)
學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(下)
譯者:甜湯
關(guān)鍵詞: 機器學(xué)習(xí) 數(shù)據(jù)分析 改頭換面