最新版《機器學習數學基礎》發佈,417頁PDF免費下載

大數據2019-09-19 01:18:28

導讀:由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰寫的《機器學習數學基礎》“Mathematics for Machine Learning” 最新版417頁pdf版本已經放出,作者表示撰寫這本書旨在激勵人們學習數學概念。


這本書並不打算涵蓋前沿的機器學習技術,因為已經有很多書這樣做了。相反,作者的目標是通過該書提供閲讀其他書籍所需的數學基礎。


這本書分為兩部分:數學基礎知識和使用數學基礎知識進行機器學習算法示例。值得初學者收藏和學習!


來源:專知(ID:Quan_Zhuanzhi)




01 前言(Foreword)


隨着機器學習變得越來越普遍,它的軟件包也越來越容易使用。一些低級的技術細節被抽象出來,並對實踐者隱藏起來,這是很自然的,也是可取的。然而,這帶來了一些風險,即實踐者不知道設計決策,因此不知道機器學習算法的侷限性。


有興趣瞭解機器學習算法背後機制的實踐者需要具備如下的先驗知識:


  • 編程語言和數據分析工具

  • 大規模計算和相關框架

  • 數學和統計學知識,以及機器學習是如何基於這些知識構建的


在大學裏,關於機器學習的入門課程往往會在課程的早期部分涉及到以上這些先驗知識。由於歷史原因,機器學習的課程傾向於在計算機科學系進行授課。在計算機科學系,學生通常在前兩個知識領域受到的訓練比較多,但在數學和統計學方面的訓練較少。


目前的一些機器學習教科書試圖加入一到兩章的內容來介紹數學背景知識,但是這些介紹要麼在書的開頭,要麼作為附錄。本書將機器學習中的數學基礎知識放在首位,並且信息相對集中。


  • 為什麼要寫一本關於機器學習的書?


機器學習建立在數學語言的基礎上,用來表達直觀上顯而易見但卻難以形式化的概念。一旦正確地形式化,我們就可以使用數學工具來得出我們設計選擇的結果。這使我們能夠深入瞭解我們正在解決的任務以及智能的本質。


全球數學系學生普遍抱怨的一個問題是,數學所涵蓋的主題似乎與實際問題沒有太多關聯。我們認為機器學習是人們學習數學的一個明顯而直接的動機。


作者希望這本書可以成為一本指導機器學習大量數學基礎的指南。作者通過直接指出數學概念在基本機器學習問題中的有用性來激發對數學概念的需求。為了使書簡短,許多細節和更先進的概念都被省略了。書中介紹了一些基本概念,以及這些概念如何適用於機器學習的大背景,讀者可以找到大量的資源進行進一步研究。


對於有數學背景的讀者,這本書提供了一個簡短但精確的機器學習入門介紹。書中只提供四個代表性的經典的機器學習算法示例。作者關注的是模型本身背後的數學概念,目的是闡明它們的抽象美。


作者希望所有的讀者都能對機器學習的基本問題有更深入的瞭解,並將機器學習的實際問題與數學模型的基本選擇聯繫起來。


  • 誰是目標受眾


隨着機器學習在社會中的廣泛應用,作者相信每個人都應該對它的基本原理有一些瞭解。這本書是用學術數學的風格來寫的,這使讀者能夠精確地瞭解機器學習背後的概念。作者鼓勵不熟悉這種簡潔的風格的讀者堅持閲讀下去,並牢記每個主題的目標。作者在整篇文章中都有標記和評論,希望這些評論能對讀者提供一些有用的指導。


此外,本書假定讀者具備高中數學和物理中常用的數學知識。例如,導數和積分,以及二維或三維的幾何向量。因此,本書的目標受眾包括普通大學生、夜校生和機器學習在線課程的學習者等等。



02 目錄


Part I: 數據基礎

  1. Introduction and Motivation

  2. Linear Algebra

  3. Analytic Geometry

  4. Matrix Decompositions

  5. Vector Calculus

  6. Probability and Distribution

  7. Continuous Optimization


Part II: 機器學習問題

  1. When Models Meet Data

  2. Linear Regression

  3. Dimensionality Reduction with Principal Component Analysis

  4. Density Estimation with Gaussian Mixture Models

  5. Classification with Support Vector Machines




03 簡介(Introduction)


本書分為兩部分,第一部分是數學基礎的講解,第二部分是將第一部分的數學概念應用於基本的機器學習問題中,從而形成“機器學習四大支柱”,如下圖所示:




這本書的第一部分描述了關於機器學習系統的三個主要組成部分的數學概念和數學基礎:數據、模型和學習。在本書中,作者假設數據已經被適當地轉換成適合於閲讀的數字表示形式,並被轉換成計算機程序。


在這本書中,作者認為數據是向量。模型是現實世界的簡化版本,它捕獲與任務相關的現實世界的各個方面。模型的用户需要理解模型沒有捕捉到什麼,從而理解模型的侷限性。


概括起來就是,作者使用領域知識將數據表示為向量。並選擇一個合適的模型,要麼使用概率方法,要麼使用優化方法。採用數值優化的方法,對過去的數據進行學習,目的是它在看不見的數據上表現良好。


本書第二部分介紹了上圖所示的機器學習四大支柱,如下表所示。表中的每一行區分了相關變量是連續的還是非連續的類別的問題。作者解釋瞭如何將本書第一部分介紹的數學概念應用於機器學習算法的設計中。


在第8章中,作者以數學的方式重述了機器學習的三個組成部分(數據、模型和學習)。此外,作者還提供了一些建立實驗設置的指南,以防止對機器學習系統過於樂觀的評估。



此外,作者在第一部分提供了一些練習,這些練習大部分可以用筆和紙來完成。在第二部分中,作者提供了一些編程教程(jupyter記事本)來探索在本書中討論的機器學習算法的一些特性。


PDF下載鏈接:

https://mml-book.github.io/book/mml-book.pdf


全書配套網站:

https://mml-book.com


部分內容預覽:




有話要説👇


Q: 你的數學基礎怎麼樣?

歡迎留言與大家分享


猜你想看👇


  • 解讀人工智能、大數據和雲計算的關係,大佬們賭AI竟都輸了?

  • 身高2m,體重2kg,這樣的數據“看上去很好”?

  • 數據分析必備:掌握這個R語言基礎包1%的功能,你就很牛了

  • 包教包會,7段代碼帶你玩轉Python條件語句


更多精彩👇


在公眾號對話框輸入以下關鍵詞

查看更多優質內容!


PPT | 報告 | 讀書 | 書單 | 乾貨 

大數據 | 揭祕 | Python | 可視化

AI | 人工智能 | 5G | 區塊鏈

機器學習 | 深度學習 | 神經網絡

合夥人 1024 | 段子 | 數學 | 高考


據統計,99%的大咖都完成了這個神操作

👇



覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯繫:[email protected]

更多精彩,請在後台點擊“歷史文章”查看

https://hk.wxwenku.com/d/201392485