陳根:通用AI正在到來,人類下一步是什么?
雖然過去人們對通用人工智能(AGI)總有各種抽象的想法,但如今,隨著圖像生成、代碼生成、自然語言處理等AI生成技術的發(fā)展,通用人工智能似乎已經(jīng)走到了一個重要的十字路口。生成式AI是技術底座之上的場景革新,涵蓋了圖文創(chuàng)作、代碼生成、游戲、廣告、藝術平面設計等應用。
本文引用地址:http://www.ex-cimer.com/article/202302/442963.htm可以看到的是,以多模態(tài)預訓練大模型、生成式AI為代表的AI技術已經(jīng)來到規(guī)?;耙?、爆發(fā)前的奇點。一方面,人類對AGI的想象開始具象;另一方面,對AGI前途無量感到震驚的科學家們,則開始著手探討并如何塑造 AGI 的未來。
從狹義AI到通用AI
到目前為止,我們所接觸的AI產(chǎn)品大都還是狹義AI。
簡單來說,狹義AI就是一種被編程來執(zhí)行單一任務的人工智能——無論是檢查天氣、下棋,還是分析原始數(shù)據(jù)以撰寫新聞報道。狹義AI系統(tǒng)可以實時處理任務,但它們從特定的數(shù)據(jù)集中提取信息。因此,這些系統(tǒng)不會在它們設計要執(zhí)行的單個任務之外執(zhí)行。
Google assistant、Google Translate、Siri等自然語言處理工具都是狹義AI的產(chǎn)品。雖然它們能夠與我們交互并處理人類語言,但這些機器遠沒有達到人類的智能水平。比如,當我們與Siri交談時,Siri并不能靈活地來響應我們的查詢。相反,Siri所能做的,就是處理人類語言,將其輸入搜索引擎,然后返回給我們。
通用AI則是指在不特別編碼知識與應用區(qū)域的情況下,應對多種甚至泛化問題的人工智能技術。雖然從直覺上看,狹義AI與通用AI是同一類東西,只是一種不太成熟和復雜的實現(xiàn),但事實并非如此。
狹義AI就像是計算機發(fā)展的初期,人們最早設計電子計算機是為了代替人類計算者完成特定的任務。而艾倫·圖靈等數(shù)學家則認為,我們應該制造通用計算機,我們可以對其編程,從而完成所有任務。
于是,曾經(jīng)在一段過渡時期,人們制造了各種各樣的計算機,包括為特定任務設計的計算機、模擬計算機、只能通過改變線路來改變用途的計算機,還有一些使用十進制而非二進制工作的計算機?,F(xiàn)在,幾乎所有的計算機都滿足圖靈設想的通用形式,我們稱其為“通用圖靈機”。只要使用正確的軟件,現(xiàn)在的計算機幾乎可以執(zhí)行任何任務。
市場的力量決定了通用計算機才是正確的發(fā)展方向。如今,即便使用定制化的解決方案,如專用芯片,可以更快、更節(jié)能地完成特定任務,但更多時候,人們還是更喜歡使用低成本、便捷的通用計算機。現(xiàn)在,AI也將出現(xiàn)類似的轉變——通用AI將成為主流,它們與人類更類似,能夠?qū)缀跛袞|西進行學習。
當然,通用AI并非全知全能。與任何其他智能存在一樣,根據(jù)它所要解決的問題,它需要學習不同的知識內(nèi)容。比如,負責尋找致癌基因的AI算法不需要識別面部的能力;而當同一個算法被要求在一大群人中找出十幾張臉時,它就不需要了解任何有關基因互作的知識。通用人工智能的實現(xiàn)僅僅意味著單個算法可以做多件事情,而并不意味著它可以同時做所有的事情。
值得一提的是,通用AI又與強人工智能不同。強人工智能(strong artificial intelligence)是約翰·希爾勒在提出“中文屋實驗”時設定的人工智能級別。這個等級的人工智能,不僅要具備人類的某些能力,還要有知覺,有自我意識,可以獨立思考并解決問題。雖然兩個概念似乎都對應著人工智能解決問題的能力,但通用AI更像是無所不能的計算機,而強人工智能則超越了技術的屬性成為類似穿著鋼鐵俠戰(zhàn)甲的人類。
如何實現(xiàn)通用人工智能?
自人工智能誕生以來,科學家們就在努力實現(xiàn)通用AI,實現(xiàn)通用AI具體可以分為兩個路徑。
第一條路就是讓計算機在某些具體任務上超過人類,如下圍棋、檢測醫(yī)學圖像中的癌細胞。如果能夠讓計算機在執(zhí)行一些困難任務時的表現(xiàn)超過人類,那么最終就會發(fā)現(xiàn)如何讓計算機在所有任務中都比人類強。通過這種方式來實現(xiàn)通用AI,AI系統(tǒng)的工作原理以及計算機是否靈活就無關緊要了。
唯一重要的是,這樣的人工智能計算機在執(zhí)行特定任務時比其他人工智能計算機更強,并最終超越最強的人類。如果最強的計算機圍棋棋手在世界上僅僅位列第二名,那么它也不會登上媒體頭條,它甚至可能會被視為失敗者。但是,擊敗世界上頂尖的人類棋手就會被視為一個重要的進步。
第二條路,是重點關注AI的靈活性。通過這種方式,人工智能就不必具備比人類更強的性能。科學家的目標就變成了創(chuàng)造可以做各種事情并且可以將從某個任務中學到的東西應用于另一個任務的機器。
比如,當前發(fā)展如火如荼的AI 生成就遵循了這樣的路徑。過去一年,有關AI生成技術上的進展主要包括三個方面。一個是圖像生成,即以DALL-E 2、Stable Diffusion為代表的擴散模型;一個是NLP(自然語言處理),即基于GPT-3.5的ChatGPT;還有一個就是代碼生成,比如基于CodeX的Copilot。
以近日大火的ChatGPT為例,這款當今最火爆的AI語言模型,由美國人工智能實驗室OpenAI于去年11月底發(fā)布,并迅速火遍全球。不同于過去那些智能語音助手的傻瓜回答,這次ChatGPT卻出乎意料的聰明:它可以用來創(chuàng)作故事、撰寫新聞、回答客觀問題、聊天、寫代碼和查找代碼問題等。外媒評論甚至稱,ChatGPT會成為科技行業(yè)的下一個顛覆者。
事實也確實如此,基于龐大的數(shù)據(jù)集,ChatGPT得以擁有更好的語言理解能力,這意味著它可以更像一個通用的任務助理,能夠和不同行業(yè)結合,衍生出很多應用的場景??梢哉f,ChatGPT已經(jīng)為通用AI打開了一扇大門。
并且,ChatGPT引入了人類監(jiān)督員,專門“教”AI如何更好地回答人類問題。AI的回答符合人類評價標準時,就給AI打高分,否則就給AI打低分。這使得AI能夠按照人類價值觀優(yōu)化數(shù)據(jù)和參數(shù)。也就是說,互聯(lián)網(wǎng)中,只要涉及文本生成和對話的,都能夠被ChatGPT“洗一遍”,這使得ChatGPT能得到一個接近于自然人類語言對話的效果。
以自動駕駛為例,目前的自動駕駛與人的交互還是比較機械的,比如前面有一輛車,按照規(guī)則,它有可能會無法正確判斷什么時候該繞行。而ChatGPT等人工智能的迭代,未來可能會讓機器更接近人的思維模式,學習人的駕駛行為,帶領自動駕駛進入“2.0時代”。
另外,“ChatGPT+”更是打開了想象力大門。有用戶把 ChatGPT + Stable Diffusion(AI文生圖工具) 結合使用。即先要求 ChatGPT 生成隨機的藝術 prompt,然后把 prompt 作為 Stable Diffusion 的輸入,生成一副藝術性很強的畫作。還有人提出“ChatGPT+WebGPT”, WebGPT為高階版網(wǎng)頁爬蟲,從互聯(lián)網(wǎng)上摘取信息來回答問題,并提供相應出處?!癈hatGPT+WebGPT”產(chǎn)生的結果信息可以實時更新,對于事實真假的判斷更為準確。
針對ChatGPT在解答數(shù)學題方面的拉垮表現(xiàn),計算機科學家、Wolfram 語言之父 Stephen Wolfram 發(fā)文表示,正在將ChatGPT與自己的 Wolfram | Alpha 知識引擎結合起來用,因為后者具有強大的結構化計算能力,可以實現(xiàn)完美互補?!癈hatGPT+”效應的出現(xiàn),似乎更進一步推動了通用AI走向我們。
接下去的路應該怎么走?
雖然AI生成的快速發(fā)展讓人們看到了通用AI的希望,但實際上,當前的AI生成依然不是根本性的突破。
今天的AI生成之所以能如此靈活,就在于其龐大的訓練數(shù)據(jù)集。也就是說,如果沒有根本性的新創(chuàng)新,通用AI就可能會從更大規(guī)模的模型中產(chǎn)生。ChatGPT就是將海量的數(shù)據(jù)結合表達能力很強的Transformer模型結合,從而對自然語言進行了一個非常深度的建模。盡管ChatGPT的相關數(shù)據(jù)并未被公開,但它的上一代GPT-3的整個神經(jīng)網(wǎng)絡就已經(jīng)有1750億個參數(shù)了。
雖然越來越大的模型確實讓通用AI性能很強,比如圖像生成等任務都需要借助大模型,但龐大的模型也帶來了一些問題。
首先,世界上可能沒有足夠的數(shù)據(jù)量來支持規(guī)模最大化。來自紐約大學和蘇黎世聯(lián)邦理工大學的研究人員William Merrill、Alex Warstadt和Tal Linzen最近提出了一個證明,稱“目前的神經(jīng)語言模型不太適合在沒有大量數(shù)據(jù)的情況下提取自然語言的語義”。盡管這個證明中包含了太多的前置假設,但是如果這個假設接近正確的話,那么在規(guī)模上可能很快就會出現(xiàn)麻煩。
其次,世界上可能沒有足夠的可用計算資源支撐規(guī)模最大化。要知道,計算從來都是一件費電的事情。Miguel Solano認為,要想達到當前的超級基準,例如BIG-bench,將會需要消耗2022年全美國電力消耗的四分之一還多。而BIG-bench還只是一個眾包的基準數(shù)據(jù)集,旨在探索大型語言模型并推斷其未來的能力,其中包含200多個任務。
以AI生成為代表的通用AI除了面對發(fā)展中技術的問題,還需要回應倫理的挑戰(zhàn)。隨著自動化的發(fā)展,人工智能將接管更多工作,人們的擔憂是,人與機器地位的轉換可能會在我們毫無防備的情況下突然發(fā)生。實際上,我們已經(jīng)走在將人類工作讓渡給人工智能的道路上了,而我們需要解決的問題是:在一個處處受到人工智能協(xié)助的世界中,我們接下去的路應該怎么走?
顯然,為了讓人類的受益最大化,并促進自由、平等、透明和財富的分享,我們需要決定如何有效運用基于人工智能的各種技術。
一方面,我們不得不重視AI技術進步給社會帶來的影響。ChatGPT、AlphaFold等工具出來后,人們發(fā)現(xiàn),最先感受到AI沖擊的反而是創(chuàng)造性的工作,而這些涉及創(chuàng)造力、知識探索的行業(yè),又是人文領域的核心,是人類最擔心被機器化的部分。一直以來,AI在這些領域的重大突破都伴隨著廣泛的倫理爭議。
世界復雜性科學研究中心、美國圣塔菲研究所教授梅勒妮·米切爾近日在接受媒體采訪時就談到,過于盲目采用這些技術,將我們的交流和創(chuàng)意自動化,可能會導致人類失去對機器的控制,“機器人會給機器人寫電子郵件,而機器人會回復其他機器人”。米切爾說,“我們作為人的特質(zhì)從我們的信息中被卷走了?!?/span>
另一方面,過分強調(diào)人工智能對人類生存的威脅,會把人們的注意力從那些更緊迫的問題上分散出去,也可能會助長那些反對能造福社會技術的聲音、扼殺技術創(chuàng)新。實際上,AI的“思考模式”與人類的思考模式完全不同。20年后,基于深度學習的機器及其“后代”也許會在很多任務上擊敗人類,但在很多任務上,人類會比機器更擅長。
基于此,在未來,更可能出現(xiàn)的情況,或許是我們?nèi)祟惻c尋求人類與AI的良性共生,而不是糾結于基于深度學習的AI能否成為或者何時成為通用人工智能的問題。通用AI的出現(xiàn),或許也向人們展示了這樣一個道理——不只有人類才是智能的黃金標桿。
評論