<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計算 > 市場分析 > 全球AI競賽,美國的優(yōu)勢不止英偉達

          全球AI競賽,美國的優(yōu)勢不止英偉達

          作者: 時間:2024-07-09 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 收藏

          人工智能的全球市場競爭中,「主權(quán)人工智能」開始成為越來越重要的議題。

          本文引用地址:http://www.ex-cimer.com/article/202407/460802.htm

          關(guān)于這個話題的大多數(shù)討論都集中在以下幾個核心問題:

          • 世界各國都希望盡快成為萬億美元人工智能市場,并讓人工智能成為本國經(jīng)濟增長的關(guān)鍵引擎

          • 各個國家、地區(qū)都想要建立反映當(dāng)?shù)卣Z言、政治和文化的本土人工智能系統(tǒng)

          • 各個國家、地區(qū)都認為技術(shù)獨立是一種應(yīng)對當(dāng)前緊張的世界政治格局的正確選擇

          這種「技術(shù)主權(quán)」的焦慮,主要來自人們已經(jīng)深刻認識到技術(shù)落要面對的代價。

          美國科技的領(lǐng)先帶來的福利越來越清晰。20 世紀(jì) 80 年代和 90 年代,微軟和英特爾等美國科技巨頭主宰了 PC 時代,遠遠超過了亞洲和歐洲的競爭對手。在接下來的幾十年里,隨著硅谷涌現(xiàn)出一波又一波世界級公司,互聯(lián)網(wǎng)搜索、社交媒體、電子商務(wù)、移動和云計算等領(lǐng)域也出現(xiàn)了同樣的循環(huán)。

          2022 年 11 月 30 日,美國公司 Open 發(fā)布了給予大型語言模型(LLM)的 ChatGPT。隨后,公眾對 技術(shù)的關(guān)注熱情被迅速點燃。彼時,ChatGPT 成為歷史上增長最快的消費軟件應(yīng)用程序,也掀起了全球 投資熱潮。英國半導(dǎo)體公司 Arm 和 Amadeus Capital Partners 的聯(lián)合創(chuàng)始人赫爾曼·豪澤 (Hermann Hauser) 表示:「我們非常擔(dān)心美國會再次遙遙領(lǐng)先」。豪澤曾撰寫大量關(guān)于歐洲建立技術(shù)主權(quán)必要性的文章。

          如何掌握人工智能的主權(quán)?

          面對美國再次領(lǐng)先,全世界都在準(zhǔn)備 AI 的「糧草」。IDC 數(shù)據(jù)顯示,2022 年全球人工智能 IT 總投資規(guī)模為 1,324.9 億美元,并有望在 2027 年增至 5,124.2 億美元,年復(fù)合增長率為 31.1%。在生成式 AI 市場上,IDC 預(yù)測,全球生成式 AI 市場年復(fù)合增長率或達 85.7%。2027 年,45% 的企業(yè)將掌握并使用生成式 AI 來共同開發(fā)數(shù)字產(chǎn)品和服務(wù),全球生成式 AI 市場規(guī)模將接近 1500 億美元。

          作為 AI 的載體,數(shù)據(jù)中心的建設(shè)如火如荼地進行中。

          日本政府投資 725 億日元,幫助 KDDI、軟銀和 Sakura 等多家日本公司為 AI 應(yīng)用建立本地云數(shù)據(jù)中心。印度政府宣布了一項 12.5 億美元的計劃,名為「IndiaAI Mission」。通過該計劃,印度將在全國范圍內(nèi)為創(chuàng)新者、初創(chuàng)企業(yè)、學(xué)生和教育機構(gòu)提供便捷的計算能力。

          這樣的競賽讓英偉達芯片供不應(yīng)求。當(dāng)?shù)貢r間 6 月 18 日,英偉達盤中股價上漲 3.2%,推升該公司市值達到 3.33 萬億美元,市值超越微軟。Arm 創(chuàng)始人的擔(dān)心似乎正在成真。

          英偉達產(chǎn)品在 AI 領(lǐng)域的廣泛使用成為美國 AI 行業(yè)發(fā)展的重要優(yōu)勢。即使全球都在進行 AI 投資,美國 AI 投資規(guī)模依舊領(lǐng)先于非美國地區(qū)的投融資規(guī)模。

          數(shù)據(jù)來源:PitchBook

          當(dāng)然,英偉達只是美國人工智能,特別是大語言模型產(chǎn)業(yè)優(yōu)勢的一部分。基于英語數(shù)據(jù)庫的模型訓(xùn)練,讓其他語言的用戶在進入 LLM 市場時,面對天然的壁壘。

          外國大型語言模型在處理當(dāng)?shù)卣Z言新詞時往往面臨理解上的困難。以中文為例,盡管 ChatGPT 等模型能夠識別包括中文在內(nèi)的多種語言,但由于其訓(xùn)練數(shù)據(jù)主要基于英文文本,因此在處理非英語語言時,可能會遭遇語言結(jié)構(gòu)、語法等方面的挑戰(zhàn),從而影響其輸出效果。近日,一篇論文指出,相較于直接使用非英文語言作為提示詞,將非英文語言先翻譯成英文再進行處理的輸出效果更佳。

          此外,值得注意的是,中文與英文在訓(xùn)練與推理方面存在顯著的「不公平性」。由于中文語言的復(fù)雜性,AI 模型在運用中文數(shù)據(jù)進行準(zhǔn)確訓(xùn)練和推理時可能會遭遇挑戰(zhàn),并且增加了中文模型應(yīng)用和維護的難度。同時,對于開發(fā)大模型的公司來說,構(gòu)建中文大模型由于需要額外的資源,或許就得承擔(dān)更大的成本。

          具體而言,中文的 token 數(shù)通常比英文多出兩倍以上,這主要源于中文詞匯的豐富含義和靈活的語言組成。中文詞匯常常具有深厚的文化內(nèi)涵和豐富的語境意義,這極大地增加了語言的歧義性和處理難度。相比之下,英語的語法結(jié)構(gòu)相對簡單,這在一定程度上使得英語在某些自然語言處理任務(wù)中相較于中文更易于被理解和處理。而 token 數(shù)量就是成本,畢竟使用 OpenAI 的 GPT-4 模型 API,每輸入 1 千 token 至少要花費 0.03 美元。

          針對上述觀點,有工程師指出,中文與英文在模型訓(xùn)練的基本原理上并無本質(zhì)區(qū)別。兩者均是將語句拆解為獨立的單詞,隨后將這些單詞納入向量數(shù)據(jù)庫,并通過神經(jīng)網(wǎng)絡(luò)進行深度學(xué)習(xí)。實際上,OpenAI 在初創(chuàng)時期亦曾面臨效果不佳的困境,最終之所以能夠取得顯著成效,主要得益于數(shù)據(jù)量的不斷積累與擴充。

          因此,無論是哪種語言的大模型,其訓(xùn)練的核心原理均保持一致,并不會因語言差異而導(dǎo)致訓(xùn)練難度的顯著變化。美國在大語言模型領(lǐng)域并未展現(xiàn)出特別的優(yōu)勢,其之所以表現(xiàn)更為出色,主要得益于龐大的數(shù)據(jù)量。相比之下,中國在語料豐富性方面具備一定優(yōu)勢。然而,由于中文處理過程中涉及的 token 數(shù)量相對較多,這也導(dǎo)致了模型在運行過程中所需的內(nèi)存和計算資源相應(yīng)增加,進而使得成本有所上升。目前,國內(nèi)通義千問在相關(guān)領(lǐng)域表現(xiàn)優(yōu)異,這同樣得益于其擁有大量的數(shù)據(jù)支持。

          盡管數(shù)據(jù)量是最重要的因素,全球各地也都在圍繞本國語言去發(fā)展大語言模型。

          非英語大模型的進擊

          HyperClova X 背后的另一個重要動機是追求更低的計算成本。使用 LLM 的費用通常取決于它們被要求處理的數(shù)據(jù)量,它們將這些數(shù)據(jù)分解成為標(biāo)記的單詞或字符塊。標(biāo)記越多,成本就越高。

          韓國互聯(lián)網(wǎng)巨頭 Naver 正積極研發(fā)其自有的大型語言模型——HyperClova X,并計劃將其廣泛應(yīng)用于旗下各類服務(wù)中。此模型的引入,預(yù)計將深刻影響這個高度數(shù)字化的國家內(nèi),Naver 眾多應(yīng)用程序的運行與體驗。Naver 的業(yè)務(wù)范疇廣泛,涵蓋了電子商務(wù)、搜索引擎、出行服務(wù)等多個領(lǐng)域。

          為確保 HyperClova X 的輸出內(nèi)容能夠充分契合韓國國內(nèi)受眾的文化背景,Naver 特別組建了一支專業(yè)的安全專家團隊。Naver 研究主管 Kang Min Yoo 指出,韓國社會擁有豐富的新詞文化,這些新詞往往令外國大型語言模型難以捉摸。同時,韓國民眾在對待政府調(diào)控房價等社會問題上的態(tài)度,相較于美國民眾,顯得更為支持。因此,HyperClova X 在回應(yīng)相關(guān)問題時,能夠比非韓國模型更準(zhǔn)確地反映這些社會價值觀。

          Kang Min Yoo 表示,大型語言模型在處理問題時,往往會根據(jù)上下文和地理位置的不同,得出不同的答案。這也是 HyperClova X 在研發(fā)過程中需要重點考慮的因素之一。

          當(dāng)然,追求更低的計算成本也是推動 HyperClova X 研發(fā)的重要動力之一。在使用大型語言模型時,費用通常與所需處理的數(shù)據(jù)量成正比。而數(shù)據(jù)量的多少,又直接決定了模型需要處理的標(biāo)記數(shù)量。因此,減少標(biāo)記數(shù)量,降低計算成本,成為 HyperClova X 研發(fā)過程中的一項重要任務(wù)。

          Naver 宣稱,其模型相較于 OpenAI 的 GPT-3 含有 6,500 倍之多的韓語數(shù)據(jù),從而能夠?qū)㈨n語查詢分解為更少的標(biāo)記,進而實現(xiàn)成本的有效降低。據(jù)對西方大型語言模型 LLM 的獨立分析顯示,處理非英語語言的查詢通常需要比英語更多的標(biāo)記。

          在印度,有著類似的故事上演。人工智能初創(chuàng)公司 Sarvam AI 的創(chuàng)始人維韋克·拉加萬(Vivek Raghavan)正在致力于構(gòu)建印地語專用的模型 OpenHathi,以提升其在印地語環(huán)境中的運行效率。盡管印地語是全球使用最為廣泛的語言之一,但拉加萬指出,印地語在 Common Crawl 這一網(wǎng)絡(luò)數(shù)據(jù)存儲庫中所占的數(shù)據(jù)比例僅為約 0.17%。而 Common Crawl 正是許多全球最大型的人工智能公司用于訓(xùn)練其模型的重要資源。

          本地 AI 模型降低成本的有效性已引起了知名投資者的廣泛關(guān)注。硅谷著名風(fēng)險投資家 Vinod Khosla 透露,他通常不會投資于與 OpenAI 及其他行業(yè)領(lǐng)先者直接競爭的公司,因為他認為新創(chuàng)公司難以在競爭中占得先機。然而,他卻為 Sarvam AI 和日本初創(chuàng)公司 Sakana AI 破例,對這兩家公司進行了投資。談及印度語言,Khosla 表示,基于英語的人工智能系統(tǒng)在處理印度語言時的效率往往比專門針對這些語言構(gòu)建的模型低三到五倍。他強調(diào)在印度,降低成本至關(guān)重要,使用模型的每分鐘成本必須達到最低。

          歐洲的 AI 布局

          在激烈的競爭中,歐洲企業(yè)值得注意。要知道,如果溯源到人工智能的歷史,歐洲才是這一技術(shù)的發(fā)源地。英裔加拿大人 Geoffrey Hinton 和法國出生的 Yann LeCun,兩人被稱為「人工智能教父」。

          非美國地區(qū) AI 投資規(guī)模前十案例

          根據(jù)上表所呈現(xiàn)的數(shù)據(jù),歐洲在人工智能領(lǐng)域的投資規(guī)模明顯領(lǐng)先于其他地區(qū)。此外,在過去的十年中,歐洲的監(jiān)管機構(gòu)著手制定更為嚴(yán)謹且嚴(yán)格的基礎(chǔ)規(guī)則,旨在讓科技巨頭公司遵從其指導(dǎo)原則。歐盟及其成員國,包括德國和英國在內(nèi),已經(jīng)通過了多項隱私法規(guī),比如 2016 年實施的《通用數(shù)據(jù)保護條例》,旨在嚴(yán)懲濫用消費者個人數(shù)據(jù)的互聯(lián)網(wǎng)公司。

          最近,歐盟更是頒布了《數(shù)字市場法案》,以遏制科技領(lǐng)域的「守門人」通過不正當(dāng)手段打壓規(guī)模較小的競爭對手。

          歐洲人工智能的初創(chuàng)企業(yè)日益增多,并逐漸吸引了硅谷投資者的關(guān)注。法國版的 OpenAI——Mistral,迄今為止已籌集了超過 10 億美元的資金,其中包括本周早些時候宣布的一輪融資,其估值據(jù)報道已達到 62 億美元。此外,法國人工智能公司 H(原名 Holistic)也從前谷歌首席執(zhí)行官埃里克·施密特以及 LVMH 首席執(zhí)行官伯納德·阿諾等業(yè)界知名人士處籌集了 2.2 億美元的資金。

          但又如近現(xiàn)代西方政治、經(jīng)濟的變化一樣,美國卻再次「反超」了歐洲。這或許與歐洲文化有關(guān)。歐洲的商業(yè)文化更加側(cè)重于謹慎而非單純的增長,這種傾向可能在一定程度上導(dǎo)致歐洲在突破性技術(shù)領(lǐng)域的成功案例相較于美國有所減少。歐洲歷來不乏杰出的大學(xué)與卓越的人才,然而,這些優(yōu)秀的人才和學(xué)術(shù)資源在商業(yè)化方面并未得到充分有效地利用。

          國內(nèi)方面,不久前商湯科技發(fā)布了首個粵語大模型 Sensechat??梢园l(fā)現(xiàn) LLM 的競爭已經(jīng)從硬件到軟件全面鋪開。在這場 AI 主權(quán)的競爭中,美國正在承受來自全世界的追趕。



          關(guān)鍵詞: AI

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();