OpenAI,正在open AI
當(dāng)OpenAI首席技術(shù)官米拉·穆拉提發(fā)布桌面版本的ChatGPT和新的旗艦?zāi)P汀狦PT-4o,OpenAI的發(fā)展,進(jìn)入到了一個(gè)真正意義上的奇點(diǎn)時(shí)刻。
本文引用地址:http://www.ex-cimer.com/article/202405/458752.htmOpenAI的短短26分鐘的發(fā)布會(huì),卻依然引發(fā)了不少波瀾。
無論是ChatGPT-4o的完全免費(fèi),抑或是推出PC桌面版的ChatGPT,無一不為我們顯示出OpenAI的領(lǐng)先。
然而,如果僅僅只是一味地尬吹OpenAI的領(lǐng)先,必然是沒有太多裨益的。
原因在于,OpenAI的確在很多方面具備著相對領(lǐng)先的優(yōu)勢,這樣一種領(lǐng)先,并不僅僅只是體現(xiàn)在它與谷歌的差距上,同樣還體現(xiàn)在它與中國AI玩家們的差距上。
透過OpenAI的發(fā)布會(huì),我們需要更多地看到的是,時(shí)下的AI行業(yè),正在發(fā)生著的深刻變化,并由此來找到適合當(dāng)下發(fā)展趨勢的新機(jī)會(huì)。
如果一定要找到OpenAI的這場短短發(fā)布會(huì)帶給我們的啟示的話,我更加愿意將其看成是AI正走在互聯(lián)網(wǎng)道路上的一種直接體現(xiàn)。
以此為開端,AI將會(huì)真正從一個(gè)局限于實(shí)驗(yàn)室里的存在,成為一個(gè)被越來越多的大眾所認(rèn)識、所使用、所接受的存在。
如果我們將ChatGPT-4o之前的OpenAI,看成是一個(gè)布道者的話,那么,ChatGPT-4o之后的OpenAI,則更像是一個(gè)實(shí)踐者。
一句話,OpenAI正在open AI。
未來,我們將會(huì)看到越來越多的場景和行業(yè)當(dāng)中,開始出現(xiàn)AI的影子,我們將會(huì)看到越來越多的玩家們,開始加入到普及與落地AI的過程當(dāng)中。
認(rèn)識到這一點(diǎn),我們或許才能更好地把握OpenAI這樣一個(gè)短短26分鐘的發(fā)布會(huì),帶給我們的更深層次的意義。
一
OpenAI這樣一個(gè)發(fā)布會(huì)扔出的「王炸」,其實(shí)就是推出了ChatGPT-4o這樣一個(gè)完全免費(fèi)的應(yīng)用。
從表面上來看,OpenAI之所以會(huì)進(jìn)行完全免費(fèi),其中一個(gè)很重要的原因在于,它的用戶的增長業(yè)已進(jìn)入到瓶頸期,為了拓展更多的用戶,OpenAI便開始通過免費(fèi)的方式來獲得新的用戶。
自去年ChatGPT推出后,在2023年5月達(dá)到流量峰值,網(wǎng)絡(luò)訪問量達(dá)到18億次,但之后流量出現(xiàn)下滑情況。2024年3月,ChatGPT的訪問量依然穩(wěn)定在了18億次,不再有明顯增長。
當(dāng)OpenAI通過ChatGPT-4o完全免費(fèi)進(jìn)一步降低使用門檻,首先起到立竿見影效果的,便是用戶量的增長。
對于業(yè)已陷入到用戶增長瓶頸期的OpenAI來講,無疑是一個(gè)非常不錯(cuò)的嘗試。
如果我們將ChatGPT-4o的完全免費(fèi),看成是OpenAI為了提升用戶量所做的一次嘗試的話,那么,ChatGPT-4o此次將更多的場景應(yīng)用到端側(cè)模式以及代碼生成能力的場景應(yīng)用,則是將OpenAI的用戶量的增長拓展到了更為廣闊的領(lǐng)域之中。
這其實(shí)是和互聯(lián)網(wǎng)行業(yè)的發(fā)展,有著異曲同工之處的。
我們都知道,早在互聯(lián)網(wǎng)尚未風(fēng)靡的時(shí)候,人們對于互聯(lián)網(wǎng)的使用,并不是像現(xiàn)在這樣普及,甚至在很多情況下,人們對于互聯(lián)網(wǎng)的使用,如同現(xiàn)在人們對于AI的使用一樣,必須要付費(fèi)。
很顯然,通過付費(fèi)的方式,很難讓互聯(lián)網(wǎng)釋放出更大的發(fā)展?jié)撃埽茈y成就一個(gè)叫做「互聯(lián)網(wǎng)」的時(shí)代的。
于是,為了讓互聯(lián)網(wǎng)釋放出更大的發(fā)展?jié)撃埽瑸榱俗尰ヂ?lián)網(wǎng)真正成就一個(gè)時(shí)代,必然需要做的,便是將以往收費(fèi)的互聯(lián)網(wǎng)服務(wù)進(jìn)行免費(fèi),并且真正用這樣一種方式來實(shí)現(xiàn)互聯(lián)網(wǎng)的最大限度的普及。在此基礎(chǔ)上,我們再去尋找「互聯(lián)網(wǎng)+」的商業(yè)模式。
可以說,免費(fèi),真正讓互聯(lián)網(wǎng)成為了一種「基礎(chǔ)設(shè)施」,而免費(fèi)同樣促進(jìn)了「互聯(lián)網(wǎng)+」模式的不斷成熟和完善。
對標(biāo)到AI的身上,其實(shí)同樣如此。
毋庸置疑的是,OpenAI通過ChatGPT讓我們看到了AI的強(qiáng)大,讓我們看到了對于效率提升的積極影響。
然而,在很多時(shí)候,人們對于AI的感知依然是在收費(fèi)的情況下完成的,依然是受到收費(fèi)的掣肘的。
在這樣一種情況下,AI很難成為一種基礎(chǔ)設(shè)施,更加難以釋放出新的更大的發(fā)展?jié)撃艿摹?/p>
因此,如果一定要找到AI走在互聯(lián)網(wǎng)上道路上的具體表現(xiàn)的話,完全免費(fèi),并以此來促成AI最大限度的普及,并以此來孕育出更多新的商業(yè)模式,無疑是最直接的表現(xiàn)。
當(dāng)OpenAI撕開了免費(fèi)的口子,我們或許還將會(huì)在未來看到更多玩家加入其中,從而真正將人們帶入到人人皆可使用AI,萬物皆可AI的全新發(fā)展階段。
二
除了ChatGPT-4o的完全免費(fèi)之外,OpenAI在發(fā)布會(huì)上更多地為我們展示的是,GPT-4o的模型能力、基準(zhǔn)測試、模型安全性和局限性。
模型能力上,在GPT-4o之前,ChatGPT語音模式對話的平均延遲為 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。
如今借助 GPT-4o,OpenAI跨文本、視覺和音頻端到端地訓(xùn)練了一個(gè)新模型,這意味著所有輸入和輸出都由同一神經(jīng)網(wǎng)絡(luò)處理。
傳統(tǒng)基準(zhǔn)測試層面上,GPT-4o 在文本、推理和編碼智能方面實(shí)現(xiàn)了 GPT-4 Turbo 級別的性能,同時(shí)在多語言、音頻和視覺功能上均處于高位。
在5次MMLU(常識問題) 上,GPT-4o創(chuàng)下了87.2%的新高分,遠(yuǎn)超谷歌Gemini Pro 1.5、Ultra 1.0,以及自己的GPT-4T和GPT-4等。
模型安全性和局限性上,GPT-4o 通過過濾訓(xùn)練數(shù)據(jù)和通過訓(xùn)練后細(xì)化模型行為等技術(shù),在跨模式設(shè)計(jì)中內(nèi)置了安全性。以及創(chuàng)建了新的安全系統(tǒng),為語音輸出提供防護(hù)。
根據(jù)對網(wǎng)絡(luò)安全、CBRN、說服力和模型自主性的評估表明,GPT-4o 在這些類別中的任何類別中的得分都不高于中等風(fēng)險(xiǎn),而且團(tuán)隊(duì)繼續(xù)降低發(fā)現(xiàn)的新風(fēng)險(xiǎn)。
如果要找到ChatGPT-4o這些特征為我們傳遞出來的信息的話,說到底,就是為了讓更多的用戶可以更加快速、更加安全、更加高效地使用ChatGPT-4o。
簡單來講,OpenAI在ChatGPT-4o上的這些進(jìn)化,正是為了其產(chǎn)品更好地進(jìn)行商業(yè)化。
透過這一點(diǎn),我們同樣可以看出,AI的發(fā)展,正走在互聯(lián)網(wǎng)的道路上。
我們都知道,在互聯(lián)網(wǎng)時(shí)代,我們經(jīng)歷了DOS系統(tǒng),Windows系統(tǒng)以及后來的iOS系統(tǒng)、安卓系統(tǒng)等操作系統(tǒng)。
如果對這些操作系統(tǒng)進(jìn)行總結(jié)和定義的話,說到底,它們進(jìn)行不斷地升級的一個(gè)終極目的,就是為了讓互聯(lián)網(wǎng)可以更好地商業(yè)化,可以讓互聯(lián)網(wǎng)更好地與商業(yè)場景結(jié)合在一起。
當(dāng)互聯(lián)網(wǎng)有了這樣的進(jìn)化,我們才看到了衍生于互聯(lián)網(wǎng)的門戶網(wǎng)站、「互聯(lián)網(wǎng)+」應(yīng)用以及移動(dòng)互聯(lián)網(wǎng)時(shí)代所誕生出來的各式各樣的應(yīng)用。
可以說,互聯(lián)網(wǎng)的不斷的迭代和升級所帶來的一個(gè)最為直接的結(jié)果,便是互聯(lián)網(wǎng)的商業(yè)化的普及。
對于AI來講,其實(shí),同樣是在遵循這樣一種發(fā)展脈絡(luò)。
說到底,AI最終還會(huì)要落腳在商業(yè)化上,才能夠真正將自身的發(fā)展?jié)撃茚尫诺阶畲蟆?/p>
否則,所謂的AI,依然僅僅只是一個(gè)講給資本市場聽的美好的故事,當(dāng)資本的熱情不再,特別是當(dāng)AI的發(fā)展真正需要自我造血的時(shí)候,它的發(fā)展,依然還是會(huì)面臨這樣那樣的問題。
無論是百度的李彥宏,還是360的周鴻祎,乃至是金沙江創(chuàng)投的朱嘯虎,其實(shí)都在不同的場合表達(dá)過對于AI的這樣一種看法。
說到底,他們所表達(dá)的觀點(diǎn),其實(shí)都是一個(gè)中心思想。
這樣一個(gè)中心思想,其實(shí)就是讓AI更多地聚焦場景和應(yīng)用,更多聚焦在商業(yè)化上,而不僅僅只是一個(gè)停留在實(shí)驗(yàn)室里,并不僅僅只是局限于有限場景之中的小眾存在。
透過ChatGPT-4o的發(fā)布,我們可以看出,OpenAI在探索和實(shí)踐商業(yè)化的方式和方法,以此為開端,我們將會(huì)看到更多有關(guān)AI沿著互聯(lián)網(wǎng)的道路發(fā)展的新跡象的出現(xiàn)。
三
回顧互聯(lián)網(wǎng)的發(fā)展,不難看出,互聯(lián)網(wǎng)之所以會(huì)獲得如此大的發(fā)展,之所以會(huì)成為人們的一種生活方式,其中一個(gè)很重要的原因在于,互聯(lián)網(wǎng)得到了最大限度的普及。
時(shí)至今日,互聯(lián)網(wǎng),業(yè)已成為了幾乎所有人的生活方式。
以直播、短視頻為主導(dǎo)的全新時(shí)代的來臨,更是將互聯(lián)網(wǎng)的普及率,帶入到了一個(gè)全新的高度。
對于AI來講,欲要獲得新的發(fā)展,欲要成為一種全新的生活方式,必然需要重新演繹以往互聯(lián)網(wǎng)所走過的道路,必然讓以往互聯(lián)網(wǎng)所做的普及的動(dòng)作,重新在自己的身上得到演繹。
如果我們要尋找OpenAI這樣一場發(fā)布會(huì)提供給我們的新啟示的話,它不斷地讓AI進(jìn)行普及,不斷地將AI成為一個(gè)被B端和C端都能夠接受的存在,或許才是值得關(guān)注的另外一個(gè)方面。
當(dāng)OpenAI以ChatGPT的聊天機(jī)器人出現(xiàn)在人們的面前,它僅僅只是在聊天這樣一個(gè)場景下存在,它僅僅只是解決的是較為簡單的邏輯推理的能力。
時(shí)至今日,ChatGPT早已不再是簡單意義上的聊天機(jī)器人,它不僅可以聊天對話、文生圖片,還能文生視頻,甚至還可以像人的反應(yīng)速度一樣與人們進(jìn)行交互。
OpenAI表示,GPT-4o(“o”代表“omni”)是邁向更自然的人機(jī)交互的一步——它接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像的任意組合輸出。
GPT-4o可以在短至 232 毫秒的時(shí)間內(nèi)響應(yīng)音頻輸入,平均為 320 毫秒,與人類的響應(yīng)時(shí)間相似。
它在英語文本和代碼上的性能與 GPT-4 Turbo 的性能相匹配,在非英語文本上的性能顯著提高,同時(shí) API 的速度也更快,成本降低了 50%。與現(xiàn)有模型相比,GPT-4o 在視覺和音頻理解方面尤其出色。
說到底,OpenAI其實(shí)就是通過不斷地提升ChatGPT的交互能力來提升人與AI溝通和交流的門檻,不斷地讓OpenAI的產(chǎn)品更好地進(jìn)行普及。
如果將OpenAI在交互上的提升與互聯(lián)網(wǎng)以往的發(fā)展脈絡(luò)進(jìn)行總結(jié)和定義的話,它們共同的終極目的,其實(shí)就是為了讓AI可以更好地普及,并且真正讓AI成為一種全新的生活方式。
因此,如果我們要找到OpenAI的發(fā)布會(huì)給我們的新啟示的話,不斷地讓AI普及,不斷地沿著互聯(lián)網(wǎng)的方向前進(jìn),無疑是另外一個(gè)最值得我們關(guān)注的方面。
正如OpenAI CEO奧特曼在發(fā)布會(huì)后的博客里所說的那樣:
「我為我們能在ChatGPT中免費(fèi)提供世界上最先進(jìn)的模型感到非常自豪,這一切都沒有廣告或其他干擾。最初,OpenAI的設(shè)想是開發(fā)AI技術(shù),并利用它為全球帶來益處。然而,現(xiàn)實(shí)是我們開發(fā)了AI技術(shù),而其他人則利用這些技術(shù)創(chuàng)造了令全世界受益的杰出成果。作為一家企業(yè),我們有很多服務(wù)是需要收費(fèi)的,但不妨礙我們支持向全球數(shù)十億用戶提供免費(fèi)的頂尖AI服務(wù)。」
「新推出的語音(及視頻)模式是我使用過的最佳計(jì)算界面。它給人一種電影中AI的感覺,讓人不禁驚嘆這竟是真的。達(dá)到與人類相似的響應(yīng)速度和表達(dá)能力,標(biāo)志著一個(gè)重大的轉(zhuǎn)變。最初的ChatGPT已經(jīng)展示了語言界面的潛力;而這一新技術(shù)則在體驗(yàn)上有了質(zhì)的飛躍。它反應(yīng)迅速、智能、有趣、自然且實(shí)用。以前,我與計(jì)算機(jī)對話從未感覺如此自然;但現(xiàn)在,我終于有了這種感覺。隨著我們逐步增加個(gè)性化選項(xiàng)、獲取個(gè)人信息的權(quán)限、代表用戶執(zhí)行操作的能力等功能,我真的可以預(yù)見到一個(gè)激動(dòng)人心的未來:我們能夠利用計(jì)算機(jī)完成以往無法想象的更多事務(wù)?!?/p>
結(jié)語
如果一定要尋找OpenAI這樣一場短短26分鐘的發(fā)布會(huì)傳遞出來的信息的話,OpenAI正走在互聯(lián)網(wǎng)的道路上,無疑是再清晰不過的了。
可以說,通過這樣一場發(fā)布會(huì),OpenAI完成了從AI布道者向?qū)嵺`者的完美轉(zhuǎn)身。
對于AI來講,其實(shí)是需要這樣一場免費(fèi)化、普適化和商業(yè)化的。
至此,OpenAI開始o(jì)pen AI。
原因在于,只有經(jīng)歷了這樣一場普及和商業(yè)化,AI的發(fā)展,才不僅僅只是一個(gè)停留在實(shí)驗(yàn)室里的存在,才不僅僅只是一個(gè)小眾化的存在,而是成為了一個(gè)類似互聯(lián)網(wǎng)的,可以與萬千場景,千行百業(yè)都實(shí)現(xiàn)了深度融合的存在。
以此為開端,ChatGPT才能真正成為英偉達(dá)CEO黃仁勛口中的「iPhone時(shí)刻」,而GPT-4o,無疑是OpenAI的奇點(diǎn)時(shí)刻。
評論