微軟人工智能要逆天,動動嘴就能生成圖片

軟一典Edison2018-02-01 00:55:30

學霸們認真起來,真的比藝術家還騷。今天要和大家説的就是微軟一羣學霸搞出來的最新人工智能研究。

在你的概念裏什麼是人工智能?雖然我們每天都説現在是 AI 時代,但人工智能的發展真的是道阻且長。人工智能可以給我們生活所帶來的改變,絕不僅只是每天早上給你預報一下天氣。

看到上面這張圖,你可能會覺得這個圖片像素一般,丟失了很多細節。

但你能信這是人工智能生成的嗎。。。而且是僅需要的通過文字的描述,比如“這隻鳥是紅色和白色的,嘴巴很短”人工智能就可以幫你繪製出這個圖像。

這是微軟的一個人工智能項目—— AttnGAN ,用户只需要在系統中輸入一個句子,系統就能夠根據你的描述創作這張圖片。AttnGAN 簡直是我等“繪畫能力欠費者”的福音。

而它是由一羣在微軟總部的華人研發團隊開發,帶領整個項目組何曉東(音)説:4 年前,沒有人相信這件事情可以成功。想要實現通過語言描述讓人工智能繪製影像,這需要在文字和圖像方面深厚的積累。

5 年來,曉東的團隊一直在探索計算機視覺和自然語言處理技術,並且研究這兩項技術之間如何能夠交叉應用。

最開始,曉東和同事們先把精力放在,讓人工智能給照片自動搭配文字開始,有點像給圖片加圖注。為此,團隊開發了一個叫 CaptionBot 的人工智能。

這件事情雖然不容易,但人工智能通過大量的學習之後,可以分析圖片中的內容,然後配合相應的文字,算是有跡可循。

隨後他們更進一步,在 2015 年開始訓練人工智能學習人類的方式觀看圖像。通過計算機視覺,讓人工智能在辨別圖像的時候,可以滿足人們提出的問題。

比如上面針對上面這張圖,你可以的問:“自行車籃裏面的是什麼東西?”人工智能在通過推理之後,可以告訴你,自行車籃裏坐着的是狗。

的成果非常有用,在實際生活中,如果配合相關的產品,就能夠告訴為盲人提供更加全面的環境識別。通過語音的方式告訴盲人,周圍的環境是什麼樣的。

先上一個視頻,炫一下這項成果。


經過多年的積累,團隊成員決定搞一個大新聞。

讓人工智能根據文字描述,繪製圖像。雖然看上去就像是前面那些研究的相反方向,但實際上要實現這樣的目標並不容易。

(水面上有一輛雙層大巴)

比如你希望人工智能繪製一隻“黃色翅膀,在樹上的鳥”雖然人工智能可以“讀懂”文字,也可以從龐大的數據庫中找到相應位置的圖片。

但在描述中,有一部分的信息是缺失的:“什麼樣的鳥能站在樹上,鳥和樹之外的環境是什麼樣?樹是什麼顏色?”

這部分就涉及到我們經常説的“常識”,我們平時通過不斷學習和在生活的中總結,知道缺失的這部分信息是什麼,但是人工智能並不知道。

(吃披薩的女孩)

於是項目組在研發的過程中,讓人工智能通過機器學習開始的學習這些常識,從而可以理解那些並不在文字描述中的細節內容。但現在團隊對 AttnGAN 仍在不斷的優化中,畢竟有時候 AttnGAN 還是搞不清楚的人臉上這些器官的位置。

目前 AttnGAN 仍舊需要大量的學習“常識”,才能夠在面對簡單描述和複雜圖案的情況下,交出讓人滿意的畫面。

不過,AttnGAN 繼續優化下去,或許就會成為設計師們的最有利助手。當面對客户某些如“把 Logo 放大的同時縮小一點”、“幫我加上五彩斑斕的黑試試看”的需求時,就直接讓人工智能幫你解決這些的問題。

閲讀原文

TAGS:人工智能微軟可以