【小編心得】轉行數據科學路上看過的一些書總結推薦

機器學習算法與Python學習2018-10-04 18:03:46

作者:王大偉

Python愛好者社區唯一小編

博客:https://ask.hellobi.com/blog/wangdawei


前言


這些書的看書週期大概有一年半吧


一年半前決定轉行數據科學


之前寫過一篇:

回顧與展望轉行數據科學路上的點點滴滴(2016-2018)


深知轉行學習的痛苦,入門踩過很多坑,所以寫了Python入門連載,還錄製了免費視頻,有興趣學習的朋友可以看看哈:

https://edu.hellobi.com/course/234



當然轉行不能只是説説而已,還是要下功夫的,於是買了很多書,也被送了很多書,下面談談我這一年半看過的相關的書:


SQL


SQL學習指南



個人推薦指數:★ ★ ★

SQL是學數據分析挖掘必須會的,這本書因為之前買的,就看的這個,個人感覺,初學者會在多表連接和查詢那裏糾結很久,當然,我SQL學的並不是很好,還需多多加強,可惜的一點是,這本書的數據好像並沒有提供,所以我沒辦法實操一下。



Python


Python基礎教程



個人推薦指數:★

書的內容是用Python2寫的,不太適合初學者學習,因為Python2不久將不在維護,還是學Python3好,在京東等商城銷量很高,但是不建議作為入門書籍,因為第六章就開始寫到參數魔法,新手會很難理解,入門書應當是生動有趣易理解的,這也是我寫Python從零開始入門連載的原因之一。

聽説已經出的第三版是Python3寫的



像計算機科學家一樣思考Python



個人推薦指數:★

這本書銷量很高,看的時候印象最深的就是遞歸的思想,如果你已經看過我的Python入門基礎課,可以不看這本,這本書相對多出來的知識點問我在Python進階文章前幾篇已經寫出來了。這本書不適合作為入門書,原因是每個點講的不全面。



Head First Python




個人推薦指數:★ ★ ★ ★

這本書是我最開始接觸Python看的幾本書之一,書中大量插畫,使用Python解決一些實際問題,初學者可以不按照本書內容敲代碼,看懂即可,因為本書代碼量太大,可能讓初學者從入門到放棄。



Python程序設計基礎



個人推薦指數:★ ★ ★

這本書推薦給喜歡應試教育的朋友,作為入門書也是很合適的,基於Python3寫的,再説Python已經加入全國計算機二級考試,這本書作為教材也是很OK的。



流暢的Python



個人推薦指數:★ ★ ★ ★

這本書是奉獻給那些想將Python寫的更優雅的朋友,深度剖析Python的深層內容,細細品讀,每章都有極大收穫,當然,書很厚,我還沒看完。



網絡爬蟲


精通Python網絡爬蟲



個人推薦指數:★ ★ ★

我學網絡爬蟲是看的韋瑋老師視頻,通俗易懂,很棒!之後韋瑋老師這本書出版之後,就看了一遍,書中對網絡爬蟲原理,urllib庫,正則表達式,scrapy講得比較透徹,推薦大家額外看看BeautifulSoup,xpath等給力解析庫,本書使用Fiddler抓包分析,但我更推薦谷歌瀏覽器的開發者模式。



數據分析


深入淺出數據分析



個人推薦指數:★ ★ ★ ★

這本書適合作為學數據分析的入門書,書中大量插圖,生動形象,深入淺出,每章都是為了解決特定問題而反覆思考迭代。



機器學習


白話大數據與機器學習



個人推薦指數:★ ★ ★ ★

推薦這本書入門機器學習,不要糾結書中的代碼,看每種機器學習的舉例介紹,通俗易懂,書中很多漫畫插圖,算法原理推導基本不深,特別是隱馬爾可夫部分講的很棒,作為入門機器學習的書非常棒!



機器學習



個人推薦指數:★ ★ ★ ★

周志華老師的機器學習,應當算是國內機器學習書籍銷量最高了吧,除去國外書籍,這是你學機器學習必看的經典書籍(因為我所瞭解的國外有好幾本經典的機器學習書籍)。這本書從西瓜數據開始,到西瓜數據結束,每個算法點到即止(不代表深度不夠,這裏指的是篇幅上不廢話)。對我幫助最大的是本書第二章的模型評估選擇,講的非常成體系。當然,書上的理論推導很難,有興趣可以看看一些學習筆記。



機器學習基礎教程



個人推薦指數:★ ★

這本書是理論書,從線性迴歸開始,將最小二乘法和極大似然法實現全都詳細推導一遍,酣暢淋漓,之後的貝葉斯方法和貝葉斯推理,理論性太強,看的讓人想撕書,不過通俗易懂,再之後的分類聚類降維寫的沒什麼特色。數學好的同學可以挑戰看看。



集體智慧編程



個人推薦指數:★ ★

這本書Python代碼是2版本,書比較老(經典)了,這本書我看了一部分就放棄了,原因是書中的數據提供的網站很多都失效了,不過這本書的思想還是不錯的,以後還會回來看看的。



機器學習實戰




個人推薦指數:★ ★ ★  ★ ★ 

這本書非常給力,基本不用sklearn等別人造好的輪子,基本都是自己定義函數實現功能,對你從底層瞭解機器學習代碼實現非常有幫助,註釋不夠多,你可能不明白某段代碼的含義,你可以使用print函數輸出看看,然後加以理解,遇到沒見過的方法,可以百度它的作用,因為書比較老,所以有些方法已經改動過或者不用,你百度最新替代的方法試試。



Python機器學習及實踐



個人推薦指數:★ ★ ★

整本書180頁,不到兩天就能擼完,書中提供的代碼是Python2,自己稍作修改改成3運行一遍,有Python基礎就跳過第一章,第二章將常見機器學習算法的實現,主要有用的是sklearn,通過看完這章,你就知道了用sklearn做機器學習的步驟:導入數據,數據預處理,訓練數據訓練模型,測試數據預測,模型性能評估。第三章是本書兩點,講到了特徵提升、模型正則化、模型檢驗、超參數搜索優化。本書在模型的欠擬合和過擬合部分闡述的很好,之後講到了一些流行的庫,包括NLTK、Word2Vec、XGBoost、Tensorflow,涉及自然語言處理,深度學習。全本書原理一筆帶過,最後一章講到鼓勵參加Kaggle比賽,並拿出了三個案例講解。本書適合學完sklearn基礎的朋友想用sklearn實現完整機器學習項目,缺點是書中模型基本使用的都是默認參數。



統計學習方法



個人推薦指數:★ ★ ★ ★ ★ 

想學數據挖掘或者機器學習不可避免要接觸數學相關理論,儘管你可以只用sklearn等做機器學習,但不懂底層理論,是無法做深入的,而這本書,就是給你打好機器學習基礎的書,先修內容大學數學三件套(高等數學、線性代數、概率論與數理統計),如果你不是數學基礎特別好,看這本書的時候會像我一樣看不懂一些公式推導,莫慌,百度一下別人的學習筆記或者技術博客,慢慢鑽研,本書適合看多次,每次都有新的收穫,書本身不厚,230頁,建議邊看邊將感悟推導公司等寫在旁邊,方便下次看。



數據挖掘


數據挖掘導論



個人推薦指數:★ ★ ★

説是導論,大家不要以為他很簡單就能看懂,還是有難度的,第一章簡介,第二章詳談了數據這一概念,你會接觸很多沒聽過的專業術語,分類算法講的不多,SVM中對核函數的引入講解的特別傳神,本書花了大量筆墨在關聯分析和聚類分析,這兩處挖得很深,本書最後講到異常檢測,書中全是理論,沒講代碼實現。



數據結構算法


大話數據結構



個人推薦指數:★ ★ ★  ★ 

如果你還是在校學生,並且想通過校招找一份數據分析挖掘或者機器學習崗位,那必然會面對數據結構算法問題,如果你和我一樣非科班出身,剛接觸數據結構算法一定會很懵逼,那我推薦你這本書,書中大量插畫,幫助理解,上課式情景教學,非常棒,幫你打開數據結構算法大門,讓你破門而入!



總結


除了看這些書之外,我之前報名了2017年天善的SVIP,這次又來學習天善的2018 SVIP 課程,因為看書難免有枯燥時候,有個老師指路是非常好的~


想報名瞭解可以戳這裏,和我一起學習:https://www.hellobi.com/svip

或者點擊閲讀原文可瞭解更多詳情&報名學習


看視頻過程中,能快速掌握核心的技術,至於想拓展,可以翻翻工具書或者看官方文檔


學無止境,不斷看書總結提升非常有必要,還有很多書等着我看,以後繼續給大家分享~


買書如山倒,讀書如抽絲,別隻有三分鐘熱度,學習是一件持久戰,哦不,是持久快樂的過程


買書可以經常去京東、噹噹看看,好像是年中大促會有5折之類優惠哦,平時也經常有優惠,最近噹噹有100-40買書優惠(我要去領盒飯了)。


學習使我快樂!


讚賞作者


附上一個2018天善SVIP的課程目錄

點擊閲讀原文可以瞭解課程詳情

Python愛好者社區歷史文章大合集

Python愛好者社區歷史文章列表(每週append更新一次)

福利:文末掃碼立刻關注公眾號,“Python愛好者社區”開始學習Python課程

關注後在公眾號內回覆課程即可獲取

小編的Python入門視頻課程!!!

崔老師爬蟲實戰案例免費學習視頻。

丘老師數據科學入門指導免費學習視頻。

陳老師數據分析報告製作免費學習視頻。

玩轉大數據分析!Spark2.X+Python 精華實戰課程免費學習視頻。

丘老師Python網絡爬蟲實戰免費學習視頻。


點擊“閲讀原文”立即開始學習吧

閲讀原文