完了!AI在辯論賽中已戰(zhàn)勝最強人類
故事要從很久很久以前說起……
本文引用地址:http://www.ex-cimer.com/article/201809/391783.htm我們都知道古希臘人非常擅長辯論,既有含著石頭苦練說話的演講大師德摩斯梯尼,也有百科全書式的人物亞里士多德,更有被譽為“西方孔子”的蘇格拉底,那時,思想就是在辯論中產生的。將人工智能引入辯論這一探討開放性問題的領域非常有趣,受到該靈感的啟發(fā),IBM以色列海法實驗室的科學家建議設計一個能夠與人類辯論的人工智能系統(tǒng)。2012年,ProjectDebater項目正式立項。
IBM海法研究院ProjectDebater首席研究員NoamSlonim博士(左)和他的同事ProjectDebater全球經(jīng)理RanitAharonov博士(右)向我們介紹說:“我們在開始這個項目的時候,想的是如果我們確定ProjectDebater能做什么事情,或者說我們非常確定它不能做什么事情,對它能不能實現(xiàn)既定的目標都有百分之百的信心了,這個東西就沒勁了。我們想的是語言理解一直都AI領域的重點,也是IBM所關注的一個重點。而且在這個方面的研究實際上是不夠的,所以我們希望能夠通過ProjectDebater進一步推進在促進AI發(fā)展的語言理解領域的研究?!?/p>
6年后,ProjectDebater首次和世人見面。
人機首次跨“物種”辯論,AI成功逆襲了?
2018年年中,在IBM美國舊金山的WatsonWest辦公室里,首個能與人類進行復雜辯論的AI機器人ProjectDebater分別對陣以色列國際辯論協(xié)會主席DanZafrir和2016年以色列國家辯論冠軍NoaOvadia,就“是否應當資助太空探索”、“是否增加遠程醫(yī)療的使用”兩大議題展開了激烈的辯論。比賽的規(guī)則是1v1,人機雙方各有4分鐘陳述自己的觀點、4分鐘反駁對方的觀點,以及2分鐘進行總結陳詞。隨后,將根據(jù)在場觀眾的投票數(shù)而判斷輸贏。
2012年:以色列海法的一個IBM科學家小組開啟了ProjectDebater的生命歷程,并展開了第一次測試辯論。就像牙牙學語的寶貝一樣,開始總是很吃力的。在“體育是否應該作為必修課”這樣的話題上,甚至會引用“多個論文表示蜥蜴不會從運動中獲得益處”這樣的論據(jù):
2013年:科學家已經(jīng)開始設想將來ProjectDebater要與真人進行辯論,因此邀請了一位紐約的女配音演員為ProjectDebater配音,賦予了它人類的聲音;
2014年:IBM在第25屆國際計算語言學會議上發(fā)表了該項目的首篇研究論文;
2016年:ProjectDebater第一次帶著它全新的人類語音,進行實時辯論。ProjectDebater表現(xiàn)很好,但是還會出現(xiàn)不少錯誤;同年,除了使用維基百科資料以外,項目組還為ProjectDebater添加了來自新聞報道中數(shù)十億的語句,讓它獲得了更多的論據(jù)素材,也因此能就更廣泛的話題進行辯論;
2017年:ProjectDebater取得了標志性的突破——它第一次成功說服人類同意了它的觀點!同年,在2017年自然語言處理頂級會議的第4期論辯挖掘研討會上,來自海法和都柏林的IBM科學家發(fā)表了新成果,形成共計30余篇論文和10余個公開的數(shù)據(jù)集。
2018年:ProjectDebater首次公開與人類專業(yè)辯手進行辯論,一鳴驚人!
在長期積累下,IBM研究院ProjectDebater團隊成員,在各個研究領域發(fā)表了30多篇論文,其中最突出的就是提出計算辯論(ComputationalArgumentation)這一迅速崛起的領域。期間提出的多個突破性的算法、工具、流程、框架等研究成果,推動了包括獨特的自然語言處理(NLP)、機器學習和推理技術等多個關鍵技術的進步。研究ProjectDebater過程中取得的技術研究成果,對于其他應用類似技術的人工智能場景會有極大的推動作用。而這些技術的應用,對于ProjectDebater能夠跨不同領域和數(shù)據(jù)集進行學習,從而產生新的知識和理解起了關鍵作用。
在這些尖端技術的武裝下,ProjectDebater被IBM研究員團隊賦予了3大核心能力:包括數(shù)據(jù)驅動的演講內容撰寫和表達能力,在演講中識別人類口語中的關鍵聲明概念和觀點的聽力理解能力,以及通過模擬人類困境來提出制定原則性論點據(jù)輔助人類決策的能力,這無疑是人工智能的一次突破性的。
也就是說,ProjectDebater具有非常強大的數(shù)據(jù)處理能力,拿到辯題后,它會迅速掃描其龐大的語料庫文檔中與主題相關的數(shù)百萬篇新聞和論文等材料,找出與辯題相關性最高的觀點,通過算法剔除多余且重復的信息,提取出一個最具說服力的觀點加以闡述。
只要包含上億篇主流報紙、雜志文章的語料庫中有大量的相關內容,ProjectDebater可以針對不同話題進行辯論,提出獨具一格的觀點。而針對具體的行業(yè)或細分的領域,比如金融、法律和公共政策等等,我們的科學家都可以向ProjectDebater添加語料庫文檔,不斷豐富ProjectDebater的“知識面”。
換句話說,只要有足夠的語料庫,ProjectDebater就有能力針對任何一個話題提出見解。雖然,目前距離真正掌握人類語言還有一定距離,但這將是人工智能發(fā)展的下一座里程碑——真正掌握語言,幫助人類更好地做出關鍵決策!
即使不能夠徹底替代人類,但可以確信的是機器可以幫助人類更好地做決策。
和任何發(fā)展初期的新技術一樣,ProjectDebater還只是邁出了第一小步而已,但沒有什么能夠阻擋技術的發(fā)展,因為我們堅信它的價值——辯論豐富了決策制定的過程,可以幫助我們權衡新想法、新理念的利弊。人類辯論不只是為了說服他人認可我們的觀點,也是為了理解和學習彼此的觀點,拓展我們的思維,打破刻板觀念。未來,相信機器可以幫助人類更好地權衡利弊,推翻偏見,做出更多“無偏頗”的決策。
AI將如何輔助人類做出更“無偏頗”的決策?
得益于ProjectDebater龐大的語料庫,可為決策提供更多有價值的信息,這些信息對于制定決策往往起到關鍵作用。因為人做決定時,或多或少都會受到自身經(jīng)驗的束縛,難免先入為主,有失偏頗。而機器則可更全面地收集信息,更中立地分析問題,為決策者提供更多維度的意見參考。未來ProjectDebater的應用潛力不可限量,尤其是商業(yè)價值,潛在用途可能且不限于以下領域:
金融顧問:訓練ProjectDebater來找出金融事實,用以支持或反對金融分析師所思考的金融投資選擇。
律師:通過ProjectDebater的匯總技術,律師可以借助ProjectDebater來尋找相關案件和主張,或借助ProjectDebater模擬法庭辯論來分析優(yōu)勢和劣勢。
公共事務決策:通過ProjectDebater公正的優(yōu)/缺點分析和對人類困境的模擬,可以就需要進行決策的問題,提供基于事實、沒有人為偏見的觀點。
學生助手:通過ProjectDebater幫助各個年齡段的學生改進他們的批判性思維和溝通技巧,或幫助他們找出更多信息以改進報告和論文。
CEO和高管:高層領導常常因擁有強烈的“直覺本能”而感到自豪,但是他們也必須避免所謂的“錨定偏見”。錨定偏見是指,我們在潛意識中有著兩三個會不太客觀地影響決策的事實時,就會將不適合這些觀點的有價值信息排除在外不予考慮。ProjectDebater可以拓寬高層領導的思路,在關鍵決策中納入他們可能沒有考慮到的新觀點。
或許,辯論僅僅是AI的一個開始。讓AI系統(tǒng)地掌握人類語言,幫助人類在各個領域做出更好的決策,才是AI科學家一直想突破的下一個邊界。未來,AI可能做到像人一樣具備真正的邏輯推理能力,當我們在各個領域面臨復雜問題難以決策時,AI可以幫助人類做出更好的決策。
IBM海法研究院AITech副總裁AyaSoffer博士近日在回答中國記者提問時說:“關于AI的下一步,就是智慧上越來越接近人類。我覺得ProjectDebater是一個很好的例子,它展示了我們是如何教授機器,只要有充足的時間、充分的數(shù)據(jù)和算法就可以充分前進?!?/p>
不僅如此,為了讓ProjectDebater的表述更加自然,科學家們還教會了它“抖包袱”。例如:“今天有許多利害攸關的事情,對我來說尤其如此,但我不能熱血沸騰,因為我沒有血液”,“剛剛你的語速已經(jīng)達到了驚人的每分鐘218個字,你沒有必要這么著急!”
那ProjectDebater是怎么學會講段子的呢?項目組的科學家說,就像人們講笑話一樣,也是先聽到了好笑的段子記下來,然后下次再講給別人聽。科學家們依法炮制,給了ProjectDebater很多幽默的素材,并教它在適當?shù)臅r機“抖包袱”,從而調節(jié)辯論的氣氛。不過,就像人一樣,Debater有時候也會在不合時宜的時候開玩笑。
評論