99国内免费在线_无码 有码 日韩 人妻_国产成_人_综合_亚洲_漂亮人妻被强中文字幕久久_手机看片福利永久国产影集

學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(上)

來源:36氪時間:2022-05-14 09:31:34

神譯局是36氪旗下編譯團隊,關(guān)注科技、商業(yè)、職場、生活等領(lǐng)域,重點介紹國外的新技術(shù)、新觀點、新風(fēng)向。

編者按:為方便對數(shù)據(jù)科學(xué)(DATA SCIENCE)感興趣的愛好者和實操者的學(xué)習(xí),本文作者分享了 8 類關(guān)于數(shù)據(jù)科學(xué)的書籍,包括統(tǒng)計/概率論類、機器學(xué)習(xí)類、數(shù)據(jù)可視化與分析類、深度學(xué)習(xí)類、自然語言處理(NLP)類、計算機視覺類、人工智能類和工具/語言類。在分享書籍的同時,作者還提出以下忠告:在數(shù)據(jù)科學(xué)領(lǐng)域有多種成功的途徑,而我們要選擇的途徑應(yīng)該是足夠簡單,足以幫助我們快速上手的。

我們之所以在選擇學(xué)習(xí)方法上不知所措,往往是因為我們接觸的信息量太大了。與其花更多的時間思考如何獲得研究數(shù)據(jù)科學(xué)的技能,不如根據(jù)實際需要,從分享的書中挑選一本,然后開始學(xué)習(xí)。關(guān)鍵是要始終如一地采取行動,堅持閱讀。閱讀的目的是,學(xué)習(xí)和發(fā)現(xiàn)隱藏于書中的真實思想。對數(shù)據(jù)科學(xué)感興趣的朋友們,如果你還沒選好學(xué)習(xí)材料,就請閱讀作者推薦的這些頂級書籍吧。本文來自編譯,希望對您有幫助。因篇幅原因,本篇文章分三部分刊出,此為第一部分:

我們從某人的聲音中不能找到的東西,很可能會在他(她)的作品中發(fā)現(xiàn)?!獰o名氏

在知識爆炸的今天,關(guān)于數(shù)據(jù)科學(xué)的學(xué)習(xí)資源太多了,這會讓我們在選擇時無從下手吧?不要緊,以下是最新的數(shù)據(jù)科學(xué)必讀書籍集錦。

圖1. 眾多學(xué)習(xí)書源

我在網(wǎng)上自學(xué)時,總是更傾向于選擇視頻教程或講座。因為我發(fā)現(xiàn)這種選擇使學(xué)習(xí)變得更簡單,不那么麻煩(和大多數(shù)人的選擇一樣)。

我一直都覺得在網(wǎng)絡(luò)上自學(xué)時選擇視頻教程或講座更加簡便易行,直到幾年前我偶然讀到了一本關(guān)于統(tǒng)計學(xué)的書,才讓我改變了對看書學(xué)習(xí)的看法(從“無聊”到“神奇而有趣”)。我要向這本書的作者和出版商致敬。

在挑選關(guān)于數(shù)據(jù)科學(xué)的頂級書籍之前,我事先做了廣泛的研究。今天,我將這些書籍分享給所有有抱負(fù)的數(shù)據(jù)愛好者和實踐者。大家在讀了這些書之后,一定會讓自己陷入深深的思考之中。

讓我們開始看看這個書單吧……

我按這些書所涉及的領(lǐng)域?qū)⑺鼈儎澐譃橐韵?8 類來詳細(xì)介紹,以方便大家選擇:

*統(tǒng)計/概率論類書籍

*機器學(xué)習(xí)類書籍

*數(shù)據(jù)可視化和分析類書籍

*深度學(xué)習(xí)類書籍

*自然語言處理(NLP)類書籍

*計算機視覺類書籍

*人工智能類書籍

*工具/語言類書籍

1.統(tǒng)計/概率論類書籍

(1)《統(tǒng)計學(xué)學(xué)習(xí)概論》(Introduction to Statistical Learning)

作者:加雷斯·詹姆斯,丹妮拉·維滕,特來沃爾·黑斯蒂,羅伯特·蒂施萊尼(Gareth James, Daniela Witten, Trevor Hastie,Robert Tibshirani).

一直以來,這本書都是經(jīng)典書籍。它涵蓋了基本的統(tǒng)計學(xué)知識以及機器學(xué)習(xí)技術(shù)。這本書吸睛的地方在于,每一個概念都用 R 語言做案例分析。所以,我們一旦掌握了編程的技巧,在讀這本書時,就會快速回憶起每一個概念及其在程序中的操作方法。

圖2. 《統(tǒng)計學(xué)學(xué)習(xí)概論》

(2)《思考統(tǒng)計:程序員的概率論和統(tǒng)計學(xué)》(Think Stats: Probability and Statistics for Programmers)

作者:艾倫·B·唐尼(Allen B. Downey)

這本書在眾多數(shù)據(jù)科學(xué)書籍中是首選書籍。它提供了大量的資源。尤其是對于有一定 Python 基礎(chǔ)知識的人,它特別實用,可以用來做數(shù)據(jù)分析。

圖3. 《思考統(tǒng)計:程序員的概率論和統(tǒng)計學(xué)》

(3)《統(tǒng)計學(xué)的藝術(shù):從數(shù)據(jù)中學(xué)習(xí)》(The Art of Statistics: Learning from Data)

作者:大衛(wèi)·斯皮格爾霍爾特(David Spiegelhalter)

這本書最大的亮點是采用了淺顯易懂的案例來講解理論。這本書不僅層層剖析了特定的問題,還給問題提供了具有漸進(jìn)性和一致性的統(tǒng)計解決方案。簡而言之,它使統(tǒng)計學(xué)的學(xué)習(xí)變得簡單了!

圖4. 《統(tǒng)計學(xué)的藝術(shù):從數(shù)據(jù)中學(xué)習(xí)》

(4)《概率論:狂熱初學(xué)者入門》(Probability: For the Enthusiastic Beginner)

作者:大衛(wèi)·莫蘭(David Morin)

圖5. 《概率論:狂熱初學(xué)者入門》

這是一本概率論初學(xué)者的理想讀物。它涵蓋了所有的基礎(chǔ)知識,包括組合學(xué),概率規(guī)則,貝葉斯定理,期望值,方差,概率密度,公共分布,大數(shù)定律,中心極限定理,相關(guān)性,回歸分析等等。

(5)《概率論入門》(Introduction to Probability)

圖6. 《概率論入門》

作者:J·勞里·斯奈爾,查爾斯·米勒·格林斯特德(J. Laurie Snell,Charles Miller Grinstead)

這又是一本介紹概率概念的書籍。和《概率論:狂熱初學(xué)者入門》一樣,這本書是為研究生而寫的綜合教材。

(6)《赤裸裸的統(tǒng)計——從數(shù)據(jù)中剝離恐懼》(Naked Statistics — Stripping the Dread from the Data)

作者:查爾斯·韋蘭(Charles Wheelan)

統(tǒng)計學(xué)有時候是一個令人生畏的話題。在這本書中,作者以一種風(fēng)趣而簡潔的方式闡明了關(guān)鍵概念,如推理、相關(guān)性和回歸分析等。

圖7. 《赤裸裸的統(tǒng)計——從數(shù)據(jù)中剝離恐懼》

2.機器學(xué)習(xí)類書籍

(1)《百頁機器學(xué)習(xí)書》(The Hundred-Page Machine Learning Book)

圖8. 《百頁機器學(xué)習(xí)書》

作者:安德烈·博爾科夫(Andriy Burkov)

我真心喜歡這本書。在讀到它之前,我閱讀了大量的試圖從不同角度和不同層面講授機器學(xué)習(xí)的書籍。我絞盡腦汁地想從這些書中找到一個方法,希望它能夠簡潔地概括難以理解的話題和難以理解的方程式??墒牵钡阶x了安德里·布爾科夫用大約 100 多頁的篇幅寫出來的這本書,我才找到了這個方法。這本書文筆優(yōu)美,易于理解,已經(jīng)得到了許多人的認(rèn)可。

(2)《數(shù)據(jù)科學(xué)介紹》(Introducing Data Science)

作者:戴維·西倫(Davy Cielen)等

出版商:曼寧(Manning)

圖9. 《數(shù)據(jù)科學(xué)介紹》

我喜歡這本書有一個特殊的原因,那就是,這些書不僅包含了我們常見的關(guān)于數(shù)據(jù)科學(xué)的主題,它還包括了數(shù)據(jù)科學(xué)整個領(lǐng)域的其他方面。我強烈推薦閱讀這本書,它會或多或少地會讓我們熟悉數(shù)據(jù)科學(xué)的全貌。

(3)《從頭開始的數(shù)據(jù)科學(xué)》(Data Science from Scratch)

作者:喬爾·格魯斯(Joel Grus)

出版商:奧萊利(O’Reilly)

圖10. 《從頭開始的數(shù)據(jù)科學(xué)》

這本書的第二版已經(jīng)發(fā)布了,因為它囊括了各種基本原理。也是因此,它已經(jīng)成為一本倍受歡迎的書。這相當(dāng)于是一個完整的一攬子交易,讀了一本就等于讀了很多本,十分推薦本書。

(4)《Python數(shù)據(jù)科學(xué)手冊》(Python Data Science Handbook)

作者:杰克·范德普拉斯(Jake VanderPlas)

出版商:奧萊利

圖11. 《Python數(shù)據(jù)科學(xué)手冊》

這本書最適合那些剛開始做數(shù)據(jù)分析或數(shù)據(jù)科學(xué)的人閱讀,這正是他們所需要的那本能夠參見所有技術(shù)的書。本書能夠強化你對 python 的掌握程度,并可促進(jìn)你在數(shù)據(jù)科學(xué)上的工作。

(5)《在數(shù)據(jù)科學(xué)領(lǐng)域建立職業(yè)生涯》(Build a Career in Data Science)

作者:艾米麗·羅賓遜,杰奎琳·諾里斯(Emily Robinson,Jacqueline Nolis)

出版商:曼寧

圖12. 《在數(shù)據(jù)科學(xué)領(lǐng)域建立職業(yè)生涯》

這本書于2020年出版,主要陳述了與學(xué)習(xí)數(shù)據(jù)科學(xué)相關(guān)的技術(shù)內(nèi)容。我們必讀這本書的原因是,它教我們?nèi)绾卧跀?shù)據(jù)科學(xué)行業(yè)工作。

(6)《數(shù)據(jù)科學(xué)的藝術(shù)——給任何與數(shù)據(jù)打交道的人的指南》(The Art of Data Science — A Guide for Anyone Who Works With Data)

作者:羅杰·D·彭,伊麗莎白·松井(Roger D. Peng, Elizabeth Matsui)

這本書不僅對數(shù)據(jù)分析工作流程做了完美的概述,還清楚地闡述了一個觀點——盡管存在許多工具、復(fù)雜的一步步的信息迭代過程,數(shù)據(jù)分析從根本上講依然是一門藝術(shù)。

圖13. 《數(shù)據(jù)科學(xué)的藝術(shù)——給任何與數(shù)據(jù)打交道的人的指南》

3.數(shù)據(jù)可視化與分析類書籍

(1)《數(shù)據(jù)可視化的基礎(chǔ)——信息豐富且引人注目的數(shù)字制作入門》(Fundamentals of Data Visualization — A Primer on Making Informative and Compelling Figures)

作者:克勞斯·沃克(Claus O. Wilke)

本書采用舉出正面和反面例子加以對比的方式,介紹了數(shù)據(jù)可視化的基本原則。它可以幫助我們理解有效的可視化背后的基本原理,并教會我們設(shè)計更有意義的模塊來傳達(dá)正確的信息。

圖14. 《數(shù)據(jù)可視化的基礎(chǔ)——信息豐富且引人注目的數(shù)字制作入門》

(2)《美麗的可視化,通過專家的眼睛看數(shù)據(jù)》(Beautiful Visualization, Looking at Data Through the Eyes of Experts)

作者:朱莉·斯蒂爾,諾亞·伊林斯基(Julie Steele, Noah Iliinsky)

網(wǎng)站:奧萊利媒體|亞馬遜(O "Reilly Media| Amazon)

圖15. 《美麗的可視化,通過專家的眼睛看數(shù)據(jù)》

“可視化”是讓數(shù)據(jù)說話的一種新方式,通過顏色等視覺指標(biāo)達(dá)到溝通的目的,并通過一定的研究方法將數(shù)據(jù)和視覺指標(biāo)整合在一起。

這本書講述了一些著名的可視化設(shè)計和開發(fā)產(chǎn)品。

(3)《周一改頭換面——每次用一張圖表改進(jìn)我們可視化和分析數(shù)據(jù)的方式》(MakeoverMonday — Improving How We Visualize and Analyze Data, One Chart at a Time)

作者:安迪·克里貝爾(Andy Kriebel)

此書是周一改頭換面(MakeOverMonday)項目的擴展,在這個項目中,數(shù)據(jù)可視化社區(qū)的成員可以分享他們對現(xiàn)有圖表和數(shù)據(jù)的改進(jìn)。它強調(diào),雖然在設(shè)計可視化中存在可變性,但有一些關(guān)鍵技術(shù)可以遵循,以確保自己的圖表是有作用和有意義的。

圖16. 《周一改頭換面——每次用一張圖表改進(jìn)我們可視化和分析數(shù)據(jù)的方式》

(4)《用數(shù)據(jù)講故事——商務(wù)專業(yè)人士的數(shù)據(jù)可視化指南》(Storytelling with Data — A Data Visualization Guide for Business Professionals)

作者:科爾·努斯鮑默·克納菲奇(Cole Nussbaumer Knaflic)

對于任何一個想要更好地以清晰、簡潔和圖形化的方式呈現(xiàn)信息的人來說,這是一本必讀的書。這本書教給我們數(shù)據(jù)可視化的基礎(chǔ)知識,以及如何有效地使用數(shù)據(jù),并舉出了大量現(xiàn)實的例子。

圖17. 《用數(shù)據(jù)講故事——商務(wù)專業(yè)人士的數(shù)據(jù)可視化指南》

(5)《更好的數(shù)據(jù)可視化:學(xué)者、研究人員和書蟲的學(xué)習(xí)指南》(BETTER DATA VISUALIZATIONS: A Guide for Scholars, Researchers, and Wonks》

作者:喬納森·施瓦比什(Jonathan Schwabish)

此書包括三個部分。第一部分簡要介紹了數(shù)據(jù)可視化的最佳實操方式。第二部分是本書的主要部分,講述了圖表類型。施瓦比什深入研究了不同類型的圖表,這些圖表遠(yuǎn)遠(yuǎn)超出了直線和條形的標(biāo)準(zhǔn)。

圖18. 《更好的數(shù)據(jù)可視化:學(xué)者、研究人員和書蟲的學(xué)習(xí)指南》

相關(guān)閱讀:學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(中)

學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(下)

譯者:甜湯

關(guān)鍵詞: 機器學(xué)習(xí) 數(shù)據(jù)分析 改頭換面

責(zé)任編輯:FD31
上一篇:
下一篇: