谷歌發佈 tf.Transform;微軟劍橋推出 DeepCoder | AI 研習社週刊

雷鋒網2017-02-26 08:53:51

對於 AI 來説,本週可謂喜訊不斷。首先是谷歌發佈了全新的 tf.Transform 組件,大大簡化了" style="font-size: 15px; color: rgb(79, 79, 79); text-decoration: none;">機器學習中的預處理問題;同時,從去年秋天開始傳聞的 GPU 雲端加速服務也終於在谷歌雲平台實現了;另外,微軟公司聯合劍橋大學在最近發佈的一篇論文中闡述了一個名為 DeepCoder 的機器學習系統,據介紹,該系統擁有基礎編程能力,可以幫助不會寫代碼的人制作簡易程序。最後,我們推薦幾個本週內雷鋒網出品的 “高能” 開發者,祝各位週末愉快。


谷歌發佈全新 TensorFlow 庫 “tf.Transform”

在實際的機器學習開發中,開發者通常需要對數據集進行大量的耗時費力的預處理過程,以適應各種不同標準的機器學習模型(例如神經網絡)。

針對這一難題,谷歌於 22 日通過開發者博客正式發佈了一個基於 TensorFlow 的全新功能組件 —— tf.Transform。它允許用户在大規模數據處理框架中定義預處理流水線(preprocessing pipelines),同時用户還可以將這些流水線導出,並將其作為 TensorFlow 計算圖(TensorFlow graph)的一部分。

除了便於數據的預處理之外,tf.Transform 還允許用户計算其數據集的統計概要(summary statistics)。對於每個機器學習項目的開發者而言,深刻理解其數據都非常重要,因為任何對底層數據做出的錯誤假設都可能會產生一些微妙的錯誤。通過更簡單和高效地計算數據的統計概要,tf.Transform 可以幫助開發者更好地檢查他們關於原始數據和預處理數據的假設。

詳情:http://www.leiphone.com/news/201702/Yi4oU1mSwKLc8Rad.html

微軟劍橋聯合推出 DeepCoder

微軟和劍橋大學的研究員近日發佈了一篇介紹 “會編程的機器學習系統——DeepCoder” 的論文。論文中描述的 DeepCoder 系統可以解決編程比賽所涉及到的基礎編程題目,為不會編程的人提供了製作簡易程序的可能。

據介紹, DeepCoder 可以在一秒鐘之內寫出能夠跑通的程序,而且隨着該系統引入更多的編程數據進行學習之後,它的編程能速度也會越來越快。但是,DeepCoder 也存在自身的不足之處,那就是 DeepCoder 只能自動生成五行左右代的代碼程序。

詳情:http://geek.csdn.net/news/detail/159111 

DeepCoder 論文地址:https://openreview.net/pdf?id=ByldLrqlx 

萬眾期待,Google 雲計算平台終於支持雲端 GPU 加速服務

在萬眾期待中,Google 雲計算平台日前推出了支持雲端 GPU 加速服務的公開測試版,第一款支持的 GPU 型號是 NVIDIA 的 Tesla K80,使 Google 雲平台的性能獲得了巨大提升。現在,用户可以在谷歌雲平台的三個地區玩轉基於 NVIDIA GPU 的虛擬機,包括美東 1 區(us-east1),東亞 1 區(asia-east1)和西歐 1 區(europe-west1)。據介紹,目前用户最多可以在自定義的 Google 雲計端虛擬機上連接將 8 個 GPU(4 塊 K80 的板子),並且只支持使用 gcloud 的命令行工具,但從下週起就可以雲終端 UI 界面來創建虛擬機了。

詳情:http://www.leiphone.com/news/201702/g1uGf9LG24pYNP8J.html 

今日頭條的引擎是怎麼樣工作的?

近日,今日頭條算數中心執行總監劉志毅在日前於深圳北京大學匯豐商學院舉行的 “數據之美” 論壇上進行技術分享。分享中,劉志毅詳細介紹了今日頭條是如何做到,向每個讀者推送不一樣的、據稱是符合讀者每個人不同興趣的內容的技術過程。

詳情:http://www.leiphone.com/news/201702/sWMJ4caPj5dxigGz.html 

百度將 Ring Allreduce 算法引入深度學習

Ring Allreduce 本是 HPC (高性能計算)領域的一項技術。日前,百度硅谷 AI 實驗室已成功將其移植到深度學習平台,藉此來加速 GPU 之間的數據傳輸速率。目前,在 GPU 並行計算中,它們之間的通信瓶頸是制約深度學習模型訓練速度的主要障礙之一。百度宣佈,Ring Allreduce 算法的引入將移除該瓶頸,大幅提升多 GPU 和分佈式計算環境下的深度學習模型運算效率。雷鋒網 (公眾號:雷鋒網) 獲得消息,該技術已被百度成功應用於語音識別

該算法以庫和 Tensorflow 補丁的形式向開發者開源,分別為 baidu-allreduce 和 tensorflow-allreduce,已在 GitHub 上線。

詳情:http://www.leiphone.com/news/201702/QaSmvdQNbiY4CxBy.html 

開源地址 1:https://github.com/baidu-research/baidu-allreduce 

開源地址 2:https://github.com/baidu-research/tensorflow-allreduce 

百度博客(英文):http://research.baidu.com/bringing-hpc-techniques-deep-learning/ 

下面送上三個本週內 AI 研習社發佈的對開發者有益的資源合集。

資源 1:機器學習算法大彙總

資源 1 是國外大神總結的機器學習算法大合集,圖中幾乎包含了機器學習領域所有的常見算法。其中不但簡單介紹了每一種算法的大概含義,還整理了它們的常見應用和優缺點,各位開發者絕對不可錯過。

原圖:http://pan.baidu.com/s/1kVFhQqb 

詳情:https://static.coggle.it/diagram/WHeBqDIrJRk-kDDY 

資源 2:2017 開發者需要關注的 AI 會議

資源 2 是 2017 年內與開發者密切相關的 17 場重磅的數據科學和 AI 相關的重大學術會議,其中包括 AAAI 2017、DeveloperWeek 和 Domino 數據科學峯會在內的三場大會已經過去了,但還剩下 14 場沒開始的會議都有哪些呢?各位不妨瞭解下吧。

詳情:http://www.leiphone.com/news/201702/BmtqOlEk9kW7X3i8.html 

資源 3:AI 領域含金量最高的開源數據庫合集

資源 3 是幾位機器學習專家總結的 AI 領域含金量最高的開源數據庫合集,從計算機視覺,自然語言文本和語音,以及網絡和地理空間數據等幾乎無所不有,總有一款適合你,各位開發者不妨試試吧。

詳情:http://www.leiphone.com/news/201702/Can849ZwMlp66QBR.html


點擊關鍵詞可查看相關歷史文章


● ● 

近期熱門



今日頭條的引擎是怎麼樣工作的?

暗網買信用卡紀實:親測盜刷無門檻

棄獨播,總裁、COO 也將離職,樂視體育沒錢了?

李開復:不接受 AI + 概念就會被顛覆,非常血腥

花旗報告:2016 全球 FinTech 變革全景揭祕

5G 比 4G 強在哪?看完這篇文章你就明白了

業內專家:工業機器人四大家族的技術哪家強?

格靈深瞳 CEO 趙勇: 成功背後的遠見與堅持


● ● 

李飛飛 | 樂視疑雲 | 亞馬遜貝佐斯

車和家 Nvidia | 法拉第未來 | 哈蘇

小程序 | 扎克伯格開發筆記 | 共享單車

GoPro | 春運刷票原理 | AI 美顏

物聯網年終盤點 | AI 醫療影像公司盤點

商用性愛機器人 | 淘寶 Buy+ | 張小龍內部演講

小米 MIX 小米 VR | 華為麒麟 960

錘子 M1/M1L | 龍芯 3A3000 三星 Note 7

大疆 “御”Mavic | Google Home

國產多線激光雷達 | 谷歌 Daydream VR 頭盔


閲讀原文

TAGS: