神譯局是36氪旗下編譯團(tuán)隊(duì),關(guān)注科技、商業(yè)、職場、生活等領(lǐng)域,重點(diǎn)介紹國外的新技術(shù)、新觀點(diǎn)、新風(fēng)向。
編者按:為方便對數(shù)據(jù)科學(xué)(DATA SCIENCE)感興趣的愛好者和實(shí)操者的學(xué)習(xí),本文作者分享了 8 類關(guān)于數(shù)據(jù)科學(xué)的書籍,包括統(tǒng)計(jì)/概率論類、機(jī)器學(xué)習(xí)類、數(shù)據(jù)可視化與分析類、深度學(xué)習(xí)類、自然語言處理(NLP)類、計(jì)算機(jī)視覺類、人工智能類和工具/語言類。在分享書籍的同時,作者還提出以下忠告:在數(shù)據(jù)科學(xué)領(lǐng)域有多種成功的途徑,而我們要選擇的途徑應(yīng)該是足夠簡單,足以幫助我們快速上手的。
我們之所以在選擇學(xué)習(xí)方法上不知所措,往往是因?yàn)槲覀兘佑|的信息量太大了。與其花更多的時間思考如何獲得研究數(shù)據(jù)科學(xué)的技能,不如根據(jù)實(shí)際需要,從分享的書中挑選一本,然后開始學(xué)習(xí)。關(guān)鍵是要始終如一地采取行動,堅(jiān)持閱讀。閱讀的目的是,學(xué)習(xí)和發(fā)現(xiàn)隱藏于書中的真實(shí)思想。對數(shù)據(jù)科學(xué)感興趣的朋友們,如果你還沒選好學(xué)習(xí)材料,就請閱讀作者推薦的這些頂級書籍吧。本文來自編譯,希望對您有幫助。因篇幅原因,本篇文章分三部分刊出,此為第三部分:
相關(guān)閱讀:學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(上)
學(xué)習(xí)數(shù)據(jù)科學(xué)的8類必讀書籍(中)
作者:邁克爾·海特(Michael Heydt)
《學(xué)習(xí)Pandas》也是一本適合初學(xué)者的書(Pandas,是python+data+analysis 的組合縮寫,是 python 中基于 numpy 和 matplotlib 的第三方數(shù)據(jù)分析庫),它為我們提供了在 Pandas 的幫助下做數(shù)據(jù)分析所需的技術(shù)知識。這本書最大的優(yōu)點(diǎn)之一就是,它只關(guān)注 Pandas,而不包括其他 100 個庫,因此可以讓讀者免于其他內(nèi)容的干擾。這本書稱自己是學(xué)習(xí) Pandas 的最好的書籍之一。
圖33. 《學(xué)習(xí)Pandas——使Python數(shù)據(jù)發(fā)現(xiàn)和分析變得容易》
作者:馬特·哈里森(Matt Harrison)
簡單、準(zhǔn)確、通俗是形容這本書最貼切的詞匯。它也被譽(yù)為學(xué)習(xí) Pandas 的最好的書籍之一。本書全面地描述了 Pandas DataFrame 以及在 DataFrames 的幫助下執(zhí)行的各種活動。
圖34. 《學(xué)習(xí)Pandas庫》
作者:西奧多·佩特羅(Theodore Petrou)
此書算得上是完美的參考書。它囊括了 Pandas 的 95 種以上的功能,展示了這個庫的強(qiáng)大,讀者將能夠以前所未有的方式分析數(shù)據(jù)。
圖35. 《Pandas操作指南》
作者:丹尼爾·Y·陳(Daniel Y. Chen)
這是一本為完全沒有編程知識的初學(xué)者而寫的書,能讓讀者振奮。因?yàn)樗膬?nèi)容能指導(dǎo)讀者,引導(dǎo)大家的思維,讓讀者確切地了解到,需要怎樣用 Python 和 Pandas 開始數(shù)據(jù)分析。正如書名所說的那樣,這本書適合所有人,其普適性使它成為學(xué)習(xí) Pandas 的最佳書籍之一。
圖36. 《面向所有人的Pandas:Python數(shù)據(jù)分析》
作者:柯蒂斯·米勒(Curtis Miller)
這本關(guān)于 Pandas 的書有點(diǎn)難以理解,建議讀者在閱讀這本書之前先對 Pandas 和 NumPy 做一些了解。本書不太適合初學(xué)者,雖然有點(diǎn)難理解,但絲毫不妨礙它成為學(xué)習(xí) Pandas 最好的書之一。
圖37. 《使用NumPy和Pandas做數(shù)據(jù)分析》
作者:大衛(wèi)·托馬斯,安德魯·亨特(David Thomas ,Andrew Hunt)
這是一本不會過時的書,它研究了軟件開發(fā)獨(dú)立于任何特定的語言、框架或方法學(xué)的本質(zhì)。它不僅討論了使代碼保持普遍適用性和易于重復(fù)利用的技術(shù),還探討了關(guān)于個人責(zé)任和職業(yè)發(fā)展的內(nèi)容。
圖38. 《實(shí)用主義程序員——你的精通之旅》
作者:羅伯特·C·馬?。≧obert C. Martin)
這本書講述了編寫干凈代碼的原則和最佳操作,并舉出幾個案例研究來加以說明。對于在協(xié)作環(huán)境中工作的數(shù)據(jù)專業(yè)人員來說,編寫干凈的代碼很重要,它是一項(xiàng)可以讓我們和自己的團(tuán)隊(duì)生產(chǎn)出更好的數(shù)據(jù)產(chǎn)品的基本技能。
圖39. 《干凈代碼——一本敏捷軟件工藝手冊》
作者:盧西亞諾·拉馬霍(Luciano Ramalho)
可以用來學(xué)習(xí) Python 的資源有很多,但是,還沒有哪項(xiàng)資源能像一本教科書一樣教你編程。此書是一本實(shí)用的指南,正像我們對一本編碼書所期望的那樣,它能幫助我們理解 Python 如何工作,以及如何編寫出色而有效的 Python 代碼。這本書的篇幅長達(dá) 794 頁,完全物有所值,值得我們購買。
圖40. 《流利的Python:清晰、簡潔和有效的編程》
作者:馬克·魯茨(Mark Lutz)
別急,這是另一本 Python 書?!如果我們認(rèn)為,自己已經(jīng)從前面介紹的書中學(xué)到了關(guān)于 Python 的所有知識,那么就請?jiān)俸煤孟胍幌?。Python 是一門龐大的編程語言,在這本書里,還有很多我們不知道的東西要講。在我們掌握了《流利的 Python:清晰、簡潔和有效的編程》一書中的基本知識之后,嘗試下閱讀馬克·魯茨的這本書。此書包含關(guān)于各種主題的深入教程:數(shù)據(jù)庫、網(wǎng)絡(luò)、文本處理、GUIs 等。教程中還包含了大量的例子。這是一本編程人的必讀書。
圖41. 《Python編程:強(qiáng)大的面向?qū)ο缶幊獭?/p>
作者:薩米爾·馬達(dá)萬(Samir Madhavan)
到目前為止,我們已經(jīng)介紹過的兩本學(xué)習(xí) Python 的書都是從編程的角度來學(xué)習(xí) Python 的。現(xiàn)在該從數(shù)據(jù)科學(xué)的角度來學(xué)習(xí) Python 了。薩米爾·馬達(dá)萬在《掌握 Python 數(shù)據(jù)科學(xué)》這本精彩的書中回答了以下問題:哪些數(shù)據(jù)科學(xué)庫是常用的,如何使用?如何在 Python 中創(chuàng)建數(shù)據(jù)可視化和挖掘模式?如何編寫高級數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)技術(shù)的代碼來構(gòu)建模型?
圖42. 《掌握Python數(shù)據(jù)科學(xué)》
作者:加勒特·格羅蒙,哈德利·韋翰(Garrett Grolemund,Hadley Wickham)
任何一個聽說過一點(diǎn)兒 R 編程的人都會接觸到哈德利·韋翰的作品。他用 R 語言寫的作品是無與倫比的。關(guān)于他的作品,我有說不完的話。這是一本通過 R 語言編程來學(xué)習(xí)數(shù)據(jù)科學(xué)的完美書籍。
圖43. 《R語言數(shù)據(jù)科學(xué)》
作者:賈里德·P·蘭德(Jared P. Lander)
如果我們沒有技術(shù)背景和統(tǒng)計(jì)學(xué)背景,那么對于我們來說,這是一本很棒的入門書。
圖44. 《為每個人創(chuàng)建的R語言》
作者:保羅·提托(Paul Teetor)
《R 語言操作指南》這本書,是對數(shù)據(jù)科學(xué)書籍閱讀清單的絕佳補(bǔ)充。它包含了 200 多個實(shí)用的食譜,可以幫助我們使用 R 語言分析和操作數(shù)據(jù)。
圖45. 《R語言操作指南》
我寫這篇文章的主要目的是為廣大讀者推薦最好的數(shù)據(jù)科學(xué)書籍。我對每一本建議的書籍都做了簡要的總結(jié),以確保讀者可以根據(jù)自己的需求、興趣和未來愿望進(jìn)行選擇。
當(dāng)有人試圖迷惑我們的時候,請記住以下這些忠告:
在數(shù)據(jù)科學(xué)領(lǐng)域有多種成功的途徑,而我們要選擇的途徑應(yīng)該是足夠簡單,足以幫助我們采取行動的。我們之所以不知道如何開始學(xué)習(xí),是因?yàn)槲覀兘邮盏男畔⒘刻罅恕Ec其花更多的時間思考和計(jì)劃如何獲得數(shù)據(jù)科學(xué)這項(xiàng)技能,不如根據(jù)自己當(dāng)前的實(shí)際需要,從上面介紹的書中挑選一本,然后開始學(xué)習(xí)。關(guān)鍵是要始終如一地采取行動,堅(jiān)持閱讀。
閱讀的目的是,學(xué)習(xí)和發(fā)現(xiàn)隱藏于這些偉大的作家和實(shí)踐者腦中的真實(shí)思想。
祝大家學(xué)習(xí)快樂!
圖46. 開始閱讀這些書
譯者:甜湯
關(guān)鍵詞: 數(shù)據(jù)分析 操作指南 開始學(xué)習(xí)