Rebellions尋求成為首家大規(guī)模生產(chǎn)人工智能芯片以支持語(yǔ)言模型的韓國(guó)初創(chuàng)企業(yè)
在位于首爾南部的一座辦公大樓里,一打芯片并排放在架子上,每個(gè)芯片旁邊都有自己的電風(fēng)扇來(lái)降溫。
這些名為ATOM的芯片是韓國(guó)初創(chuàng)企業(yè)Rebellions開(kāi)發(fā)的最新神經(jīng)處理單元(NPU),目標(biāo)是擁有多達(dá)70億個(gè)參數(shù)的人工智能模型。它們的性能正在進(jìn)行測(cè)試,并與同一樓層上另一個(gè)房間里的幾個(gè)Nvidia的A100 GPU進(jìn)行比較。
作為下一代人工智能芯片,NPU是針對(duì)同時(shí)進(jìn)行矩陣運(yùn)算進(jìn)行優(yōu)化的處理器,意味著它們?cè)谏疃葘W(xué)習(xí)方面比通用中央處理單元(CPU)和圖形處理單元(GPU)更進(jìn)一步。
2020年由五名韓國(guó)工程師共同創(chuàng)立的無(wú)晶圓廠人工智能芯片初創(chuàng)企業(yè)Rebellions被認(rèn)為是與Nvidia在該領(lǐng)域匹敵或競(jìng)爭(zhēng)的最佳希望。
Rebellions首席執(zhí)行官兼聯(lián)合創(chuàng)始人樸成炫(Park Sung-hyun)在本周早些時(shí)候接受《韓國(guó)時(shí)報(bào)》采訪時(shí)表示,ATOM將于2024年上半年利用三星的5納米技術(shù)進(jìn)行大規(guī)模生產(chǎn),這將是韓國(guó)芯片工業(yè)的重要里程碑,因?yàn)锳TOM將是第一個(gè)在大規(guī)模生產(chǎn)水平上支持語(yǔ)言模型的國(guó)產(chǎn)芯片。
“我們?cè)?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/AI">AI推理方面比Nvidia的GPU更節(jié)能,”樸成炫說(shuō)道,指的是通過(guò)訓(xùn)練后的人工智能模型運(yùn)行實(shí)時(shí)數(shù)據(jù)以進(jìn)行預(yù)測(cè)或解決任務(wù)的過(guò)程。他補(bǔ)充說(shuō),ATOM在語(yǔ)言模型推理基準(zhǔn)測(cè)試中的延遲只有Nvidia A2的一半,功耗效率是Nvidia A100的五倍。
從視覺(jué)上看,ATOM芯片只需要風(fēng)扇降溫,而Nvidia芯片需要在空調(diào)環(huán)境中運(yùn)行——這意味著更多的功耗和更高的運(yùn)營(yíng)成本。
Rebellions的崛起正值全球半導(dǎo)體行業(yè)為AI芯片展開(kāi)激烈競(jìng)爭(zhēng)之際,這受到了openAI的ChatGPT的普及以及對(duì)Nvidia GPU的需求不斷增長(zhǎng)的推動(dòng)。
韓國(guó)以其在內(nèi)存芯片制造業(yè)中的地位而聞名,正準(zhǔn)備在這個(gè)蓬勃發(fā)展的市場(chǎng)上獲得牢固的立足點(diǎn)。例如,三星電子正在與臺(tái)積電競(jìng)爭(zhēng)AI芯片制造業(yè)的主導(dǎo)地位,而韓國(guó)政府則旨在到2030年將國(guó)內(nèi)數(shù)據(jù)中心中本地開(kāi)發(fā)的AI芯片份額增加到80%。
Rebellions已經(jīng)獲得了韓國(guó)科技行業(yè)幾個(gè)最大公司的支持,包括三星、KT和Kakao。
今年1月,Rebellions完成了由KT領(lǐng)投的最新一輪融資,總額達(dá)到1.24億美元,迄今為止,KT在這家初創(chuàng)企業(yè)上已經(jīng)投資了超過(guò)5000萬(wàn)美元。這將Rebellions的估值提高到6.5億美元,成為韓國(guó)資金最多的芯片初創(chuàng)企業(yè)。
樸表示,進(jìn)入大規(guī)模生產(chǎn)將對(duì)公司的收入產(chǎn)生重大推動(dòng),經(jīng)過(guò)多年的原型階段。根據(jù)樸的說(shuō)法,KT,韓國(guó)第二大電信運(yùn)營(yíng)商和韓國(guó)最大的數(shù)據(jù)中心公司,將成為Rebellions在開(kāi)始大規(guī)模生產(chǎn)ATOM后的首個(gè)客戶。樸認(rèn)為,電信公司是AI芯片最理想的客戶。
“AI行業(yè)的未來(lái)將成為基礎(chǔ)設(shè)施游戲。電信公司愿意向建立數(shù)據(jù)中心投入大量資金,”他說(shuō)道。
樸成炫還希望與韓國(guó)最大的數(shù)據(jù)中心公司的合作伙伴關(guān)系將成為其全球擴(kuò)張的參考,尤其是在美國(guó)市場(chǎng)。樸成炫表示,該公司已與一些美國(guó)主要的超大規(guī)模云服務(wù)提供商進(jìn)行了談判,例如IBM。
樸成炫于2014年從麻省理工學(xué)院獲得電氣工程和計(jì)算機(jī)科學(xué)博士學(xué)位,曾在美國(guó)芯片行業(yè)工作了六年,曾在三星的美國(guó)研究部門(mén)、英特爾和SpaceX工作過(guò)。
盡管在美國(guó)芯片行業(yè)有著豐富的經(jīng)驗(yàn),但樸成炫認(rèn)為在韓國(guó)創(chuàng)辦半導(dǎo)體公司有更好的機(jī)會(huì)?!霸诎雽?dǎo)體硬件生態(tài)系統(tǒng)中,亞洲將是下一個(gè)大事件,”他說(shuō)道?!绊n國(guó)和臺(tái)灣正在迎頭趕上?!?/p>
樸成炫于2020年回到祖國(guó),并與另一位在美國(guó)具有行業(yè)背景的韓國(guó)人工智能芯片專(zhuān)家吳進(jìn)旭(Oh Jin-wook)以及其他聯(lián)合創(chuàng)始人一起創(chuàng)立了Rebellions。
對(duì)于樸成炫來(lái)說(shuō),這不是一個(gè)容易的決定,因?yàn)楫?dāng)時(shí)他在美國(guó)的行業(yè)網(wǎng)絡(luò)大部分在美國(guó)。Rebellions最初的團(tuán)隊(duì)成員包括來(lái)自IBM、英特爾和蘋(píng)果以及三星美國(guó)的人物。
現(xiàn)在,它擁有大約120名員工,其中近100名是工程師。隨著團(tuán)隊(duì)的擴(kuò)大,它吸引了本地背景的專(zhuān)家,其中來(lái)自韓國(guó)大型半導(dǎo)體公司的員工占據(jù)了近70%,根據(jù)樸的說(shuō)法。
Rebellions在2021年推出了名為ION的第一款產(chǎn)品,使用臺(tái)積電制造的芯片,針對(duì)金融行業(yè)的AI任務(wù)。然后,該公司決定重新將重點(diǎn)放在AI模型的芯片上,因?yàn)榕c金融公司相比,數(shù)據(jù)中心公司的需求更高。
三星,韓國(guó)最大的芯片制造商,是Rebellions的ATOM的制造合作伙伴。去年10月,這兩家公司加深了他們的合作關(guān)系,宣布計(jì)劃在ATOM之后共同開(kāi)發(fā)REBEL,這是該初創(chuàng)企業(yè)的下一代NPU,用于更大參數(shù)規(guī)模的LLMs,并與Nvidia的頂級(jí)GPU H200進(jìn)行比較。
樸成炫對(duì)REBEL寄予更大的希望,該芯片預(yù)計(jì)將在今年下半年完成開(kāi)發(fā)并開(kāi)始大規(guī)模生產(chǎn),采用三星的4納米制造工藝。
隨著生成式人工智能市場(chǎng)的不斷擴(kuò)大,樸成炫預(yù)計(jì)推理芯片的需求將成為一個(gè)關(guān)鍵增長(zhǎng)點(diǎn)。
“AI訓(xùn)練流量取決于開(kāi)發(fā)人員的數(shù)量,而AI推理流量隨著最終用戶的數(shù)量增加而增加,”樸成炫說(shuō)道?!澳壳埃?xùn)練和推理市場(chǎng)幾乎占據(jù)一半,但未來(lái)推理流量將大幅增加?!?/p>
在兩年半的時(shí)間里,樸成炫看到了該公司在韓國(guó)LLM市場(chǎng)中的份額增長(zhǎng)了30%,在推理任務(wù)方面占據(jù)了“至少3到5%”的份額。根據(jù)分析師的估計(jì),目前,據(jù)估計(jì),Nvidia在全球AI芯片市場(chǎng)的份額高達(dá)90%。
評(píng)論