如果“奇葩説”上出現一位機器人辯手 | YiMagazine

第一財經週刊2019-07-11 15:31:49


能戰勝人類的機器人辯手暫時還不會出現,但相比下圍棋,還未戰勝人類的它,其應用場景或許會有趣和廣闊得多。


 記者 | 鄧舒夏

 編輯 | 倪   妮


如果你想查詢時間、天氣、航班信息,甚至買哪支股票,向AI“求助”已經不是一件稀奇的事了,但是,如果是“現在是不是跳槽的好時候?”這種更抽象的問題呢?


這類問題一般不會有唯一的正確答案,甚至截然相反的兩種回答都有各自的合理性,但就是這類涉及兩難決策的問題,如今AI也能勝任,它會像“奇葩説”裏的那些辯手一樣,為你權衡各項選擇之中的利弊。


如何培養一名AI辯手


Project Debater(以下簡稱Debater)是IBM研發的首個能與人類複雜辯論的AI系統,它在2011年僅僅存在於一個幻燈片中,等待項目被批准就花去了約一年的時間。2018年Debater首次與人類辯手對戰,對手是曾獲以色列國家辯論冠軍的Noa Ovadia。今年2月11日,它又與歐洲辯論冠軍Harish Natarajan展開較量。


Debator與Noa Ovadia的辯論


“辯論”這種人機溝通方式,比簡單的功能性問答對邏輯性要求更高,這也意味着機器對人的“思維模擬”又上了一個台階。


至今,IBM共發表了超過30篇論文,描述其如何設計和培訓Debater。研究員將支持Debater辯論的技能分為三大能力:數據驅動的辯論文稿的生成和表達能力,口語理解能力以及模擬人類困境。


第一個能力意味着,當提供給Debater一個有爭議的主題的簡短描述後,它能通過閲讀、理解大量的語料,根據設定的發言時間來創作辯論文稿,並清晰且有針對性地表達出來。


比如Debater和Natarajan的那場辯論的議題是“我們是否應該補貼學前教育”,Debater首先要內部檢索“補貼學前教育”的詞條,理解它的含義,再擴展到其他的話題。


它甚至還會適時地展現幽默感。剛見到對手Natarajan時,Debater説:“嗨,聽説你是世界辯論賽的冠軍,打敗過很多人類辯手,但我相信你還沒有與像我這樣的機器對戰過,歡迎來到未來!


Debater與人類“對手”Harish Natarajan。


在Project Debater團隊開發的20個基準數據集中,包含19276個維基百科概念,5000個帶有情感註釋的習語,3000個帶有註釋的句子,有關55個主題的2394個標籤,以及由專業辯手錄製的60篇演講。而最主要的語料庫來自於一個IBM獲得授權的提供商,那裏有很多雜誌上的文章和信息。


在最近這場辯論中,辯論雙方需要先在“隔絕互聯網”的環境中準備15分鐘,Debater的立場是支持補貼,隨後雙方各有4分鐘的時間表達自己對話題的看法。


在這一階段,Debater分別從資金、貧困、學前教育的好處三方面予以陳述,期間引用了統計局1960年和2013年的統計摘要、澳大利亞總理Gough Whitlam的講話、心理科學雜誌的文章、疾病控制和預防中心報告等事實資料,並告知觀眾這些信息對決策的重要性。在談到貧困時,它還打趣地説:“當然,我一個機器人,確實沒法親自體會貧困,也不會抱怨生活水平低下”。


而在最後2分鐘的總結環節裏,Debater引用了英國作家Benjamin Disraeli的一句名言:權力的唯一作用是造福人類(Power has only one duty ——to secure the social welfare of the people)。


口語理解能力則使得Debater可以理解對方數分鐘的發言,而不是一問一答的短句,這其中包括體會對方的觀點、情緒,察覺其中的事實和邏輯漏洞等。這也是對AI挑戰最大的環節,其難點在於辨別語言的細微差別,以及找到對方發言的表達重點,而不是抓住一些無足輕重的小錯誤反駁,並且反駁的效果是鞏固自己的觀點。此外,Project Debater還需要確保不重複自己在早期已經聲明過的觀點。


第三個能力是模擬人類困境。IBM創建了獨特的知識圖譜以幫助Debater模擬人類的困境——畢竟你不能像討論如何安置物品那樣去思考人類世界,同時要遵循辯論的“遊戲規則”。這其中包括數十種深度學習和機器學習模型,而很多基礎AI模型十分複雜,它們有自己的訓練計劃和不同的配置方式,因此這一過程是相當耗時的。IBM在深度神經網絡的訓練中採用一部分“弱監督”的方式,以降低人工標記的成本。


“我們的團隊有五個專業辯手,我們給他們一個題目,然後把辯論錄下來,導入Debater當中,讓它模仿人類困境,以及知道辯論過程中的邏輯步驟。”IBM研究院人工智能技術副總裁Aya Soffer説道。


在路上的AI辯手


由於辯論雙方只有Debater和Natarajan,陳述觀點後的環節,並不是雙方你來我往的交鋒,而只是各自在4分鐘的時間裏陳述自己對對方觀點的“反駁”。


事實上,在“反駁”環節,Debater繼續引用豐富的數據,這很像一位百科全書式的“學霸”——如果真的有一個人一口氣引用那麼多數據,顯然會受到“掉書袋”的指責。


 “我們需要讓Debater知道什麼樣的論點論據是比較好的,並沒有教授它具體的領域,這可能也是Debater有點侷限性的地方。”Soffer説道。


Debater還曾錯誤理解Natarajan的意思,以為後者持有“學前教育是有害的”觀點,但實際是,Natarajan説的是“過早的學前教育,會讓兒童的心理產生挫敗感,這樣反而是有害的。


這也説明,上下文語義的理解對於機器來説並不容易,比如在一句“有些人認為如果補貼學前質量會降低教育質量,但是研究結果卻表明恰恰相反”中,讓機器辨別這是支持補貼還是反對補貼,就需要不斷地練習。


此外,Debater還並不具備觀察觀眾反饋的視覺和聽覺能力。在現場辯論中,辯手通常會根據觀眾的反應調整自己的表達方式,畢竟,最終的勝負由觀眾決定——這場辯論的觀眾統計數據顯示,Natarajan獲勝。而在去年6月與Ovadia的“處女秀”辯論中,Debater取得了一勝一負的成績。 


2019年2月Debater與人類辯手圍繞“政府是否應該資助學前教育”展開辯論。


除了辯論,Debater還能幹點啥?


值得注意的是,雖然輸了最近這場辯論,但觀眾支持的比例從開場前的79%比13%轉變為62%比30%,也就是説有17%的觀眾從支持Natarajan的觀點轉變為支持Debater。而在“誰更豐富了你的知識”統計中,有60%的現場觀眾將票投給Debater。此前的那場辯論,現場觀眾反饋同樣如此:人類辯手整體的表達更好,但AI辯手傳遞信息量的豐富度則優於人類。


這也符合IBM研究員對Debater的期待——在海量的信息中,找到那些能幫助人們做出無偏頗決策的信息。事實上,Debater也並不以戰勝人類為目的。


“人有自己的主觀意見,看了一個東西后會根據自己的立場解讀,但機器不會,它從大量信息中看到很多重複的意見,所以它提出來的意見不會是特別瘋狂的。”Aya Soffer説道。


這樣的定位或許會打消一部分人對於“AI將代替人們思考”的顧慮,畢竟,Debater更多擔任信息索引和觀點啟發的角色(它也可以根據一個人對不同因素考慮的權重來提出意見),最終做出決策的還是人類本身。


有人將Debater形容為進入了自然語言處理的“神祕山谷”。這個説法的含義是,當機器人更準確地描繪人類的外表和生理時,它可以穿過“不可思議”的山谷被誤認為是人類。



相比會下棋的機器人,還未完勝人類的Debater的應用場景其實要有趣得多,比如雖然還代替不了律師來説,但Debater可以幫助他們尋找相關案件和主張,模擬法庭辯論;它還可以擔任金融分析師的顧問,尋找金融事實以支持或反對某個投資選擇;Debater也能幫助政府或企業決策拓展思路,提供基於事實、沒有人為偏見的觀點;而對於學生來説,Debater可以鍛鍊他們的批判性思維和溝通技巧,甚至幫他們改論文。


“我們與金融機構也有一個概念驗證的項目,它們本身有很多術語和專業詞彙,和傳統爭議性話題的辯論是不一樣的,所以我們讓Debater瞭解更多的金融領域的情況,比如錄入金融分析師報告,教它理解數據表格。”Aya Soffer説道。現在,Debater還有一個“Project Debater speech by Crowd”功能,可以根據網友對一個話題提出的觀點關鍵詞,來發表一個演講。不過Debater目前只有英文版。


同時,Debater也在媒體界尋找自己的角色。它可以根據文章下的讀者評論,總結出不同的觀點,再根據這些觀點生成一篇新的文章。


而在消費和營銷領域,它似乎也能發揮作用。比如如果一位商家持有一台懂邏輯的AI機器人,你可能會發現自己更無法抗拒買買買的衝動了——我們因此會喪失掉部分決策的獨立性?才怪,AI只是幫我們想出了更多“剁手”的理由罷了!


本文版權歸第一財經所有,

未經許可不得轉載或翻譯。



https://hk.wxwenku.com/d/201116969