芯動(dòng)力戰(zhàn)略布局邊緣計(jì)算,重磅發(fā)布全球首款基于可重構(gòu)架構(gòu)的GPGPU芯片
近年來(lái),隨著智慧城市、自動(dòng)駕駛、工業(yè)互聯(lián)網(wǎng)等應(yīng)用的廣泛推廣,終端設(shè)備所產(chǎn)生的數(shù)據(jù)量呈爆炸式增長(zhǎng),使得集中式云計(jì)算在帶寬負(fù)載、網(wǎng)絡(luò)延時(shí)和數(shù)據(jù)管理成本等方面愈加捉襟見(jiàn)肘,由此催生了邊緣計(jì)算價(jià)值的進(jìn)一步突顯。如今,自動(dòng)駕駛、工業(yè)自動(dòng)化、智慧醫(yī)療和物聯(lián)網(wǎng)等各行業(yè)對(duì)邊緣計(jì)算的需求呈現(xiàn)了大規(guī)模增長(zhǎng)態(tài)勢(shì)。
本文引用地址:http://www.ex-cimer.com/article/202304/445715.htm隨著邊緣計(jì)算應(yīng)用范圍的不斷擴(kuò)展,數(shù)據(jù)量也持續(xù)增長(zhǎng),于是各行業(yè)對(duì)計(jì)算量級(jí)和實(shí)時(shí)性提出了更高的要求;而芯片作為算力實(shí)現(xiàn)的核心,則成為了整個(gè)行業(yè)迫切的需求,市場(chǎng)對(duì)于芯片的需求也不再只是單一的算力和功耗,更加強(qiáng)調(diào)芯片的通用性、可編程和可擴(kuò)展性,以此來(lái)滿(mǎn)足不同場(chǎng)景下的應(yīng)用需求。各大芯片廠(chǎng)商也需要不斷創(chuàng)新,研發(fā)更加通用、高性能和高能效的芯片。
逆勢(shì)而上,加快國(guó)產(chǎn)替代
在通用計(jì)算芯片這個(gè)成熟市場(chǎng),強(qiáng)勢(shì)的英偉達(dá)、AMD、英特爾三分天下,令后來(lái)者難以立足,我國(guó)芯片企業(yè)想要撕開(kāi)一道口子,必須另辟蹊徑;或從架構(gòu)、制造工藝、新型材料、新的器件結(jié)構(gòu)等都要進(jìn)行創(chuàng)新。
在技術(shù)路線(xiàn)方面,成熟的GPU架構(gòu)已經(jīng)存在長(zhǎng)達(dá)幾十年之久,形成了比較完整的生態(tài)系統(tǒng)。國(guó)內(nèi)雖有多種GPU架構(gòu),但卻缺乏全球競(jìng)爭(zhēng)力的自主GPU架構(gòu);我國(guó)目前GPU產(chǎn)業(yè)發(fā)展呈現(xiàn)兩種趨勢(shì):一是追逐傳統(tǒng)GPU架構(gòu),它的成熟度較高,但是屬于跟隨路線(xiàn),作為市場(chǎng)的后來(lái)者,技術(shù)上不成熟,性能上不先進(jìn)是很難切入市場(chǎng);二是采用自主研發(fā)的新型架構(gòu),攻堅(jiān)難度大,但是有取勝的可能性。
智能互聯(lián)世界,GPU架構(gòu)格局或有變化。
珠海市芯動(dòng)力科技有限公司(簡(jiǎn)稱(chēng)芯動(dòng)力)創(chuàng)始人指出,為了滿(mǎn)足高效的并行計(jì)算,可以采用脈動(dòng)陣列的方式來(lái)處理,同時(shí)繼承廣為人們所接受的CUDA語(yǔ)言,這樣可以同時(shí)滿(mǎn)足高算力的需求,也不影響用戶(hù)的使用習(xí)慣。
經(jīng)過(guò)十余年的探索,芯動(dòng)力研究了并行計(jì)算的本質(zhì),發(fā)現(xiàn)了一種更加適合并行計(jì)算的處理器架構(gòu),能夠在不改變程序的基礎(chǔ)上更有效的執(zhí)行CUDA語(yǔ)言的程序。并且在2017年成功研發(fā)出可重構(gòu)并行處理器(RPP)架構(gòu)。芯動(dòng)力開(kāi)始向GPU領(lǐng)域進(jìn)軍。
RPP架構(gòu)主打并行計(jì)算,并且借助于獨(dú)有的底層硬件架構(gòu),成功地實(shí)現(xiàn)了對(duì)CUDA語(yǔ)言的支撐。不僅如此,芯動(dòng)力還擁有自主開(kāi)發(fā)的工具鏈,包括獨(dú)立的SIMT指令集和后端編譯器,使得其能夠在cuDNN和TensorRT上實(shí)現(xiàn)API的兼容,同時(shí)也支持廣泛的人工智能框架,如TensorFlow和Pytorch等。
芯動(dòng)力團(tuán)隊(duì)認(rèn)為,通過(guò)工具鏈的開(kāi)發(fā),RPP能夠?qū)τ贏I推理的性能進(jìn)行深度優(yōu)化,從而在高性能計(jì)算領(lǐng)域中實(shí)現(xiàn)了最廣泛使用編程語(yǔ)言的支持。這種兼容不僅從底層的軟件兼容性方面體現(xiàn),同時(shí)也可以提升用戶(hù)的使用體驗(yàn),滿(mǎn)足用戶(hù)在調(diào)用形式、使用感知等方面的需求。做這種生態(tài)是因?yàn)橛^察到CUDA語(yǔ)言體系里,開(kāi)放體系比較完整,第三方開(kāi)發(fā)的軟件都是以源代碼的形式開(kāi)放給社區(qū),而不像CPU的生態(tài)領(lǐng)域里存在大量的二進(jìn)制代碼,因此,支持CUDA語(yǔ)言就能夠廣泛的支持GPGPU的生態(tài)。
并且,以RPP架構(gòu)為基礎(chǔ)面向邊緣市場(chǎng)設(shè)計(jì)的第一代芯片RPP-R8已經(jīng)一次性流片成功,芯動(dòng)力正式開(kāi)啟踏入GPGPU領(lǐng)域的市場(chǎng)。
據(jù)悉,RPP-R8芯片是一款具備高算力與低功耗的通用型GPGPU芯片,每顆芯片內(nèi)含有1024個(gè)計(jì)算核,與傳統(tǒng)的GPU架構(gòu)相比,在同樣的算力占用更小的芯片面積,實(shí)現(xiàn)了低功耗和高能效的有效平衡。RPP-R8除了具備專(zhuān)用芯片所沒(méi)有的通用編程性,面積效率比可達(dá)到同類(lèi)產(chǎn)品的7~10倍,能效比也超過(guò)3倍,可滿(mǎn)足高效并行計(jì)算及AI計(jì)算應(yīng)用。
GPGPU是GPU未來(lái)的重要趨勢(shì)之一,也是國(guó)產(chǎn)的一次機(jī)會(huì)。
據(jù)IDC預(yù)測(cè),到2024年,全球邊緣計(jì)算市場(chǎng)(包括軟件、硬件和服務(wù))將達(dá)到2506億美元,年增長(zhǎng)率為15.9%。其中,中國(guó)邊緣計(jì)算服務(wù)器市場(chǎng)將達(dá)到855,334臺(tái),硬件價(jià)值預(yù)期55億美元。芯動(dòng)力研發(fā)上市的RPP-R8芯片具備低時(shí)延、高算力、低功耗、高能效、編程靈活等諸多優(yōu)勢(shì),非常適用在邊緣計(jì)算場(chǎng)景,通過(guò)市場(chǎng)的反饋,軟件商可以更快的部署,基本一天就可以完成遷移。
RPP-R8的應(yīng)用從本質(zhì)上可有效幫助企業(yè)降低開(kāi)發(fā)成本和產(chǎn)品周期,加速產(chǎn)品迭代與擴(kuò)展。目前這款芯片應(yīng)用場(chǎng)景已覆蓋工業(yè)自動(dòng)化、智能駕駛、泛安防、物流檢測(cè)、內(nèi)容過(guò)濾、信號(hào)處理等多領(lǐng)域,未來(lái)將跨入更廣闊的市場(chǎng)。
當(dāng)前,算力已成為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,隨著信息化、數(shù)字化和智能化進(jìn)一步加快,新一輪的算力革命正在加速啟動(dòng)。芯動(dòng)力作為一家專(zhuān)注于研發(fā)新一代可編程通用并行計(jì)算芯片的企業(yè),在珠海、深圳、西安、美國(guó)都設(shè)立了研發(fā)中心,專(zhuān)注攻關(guān)核心關(guān)鍵技術(shù),加快國(guó)產(chǎn)替代,使得算力在技術(shù)層面不斷突破技術(shù)壁壘。
在目前算力增長(zhǎng)的時(shí)代,很多芯片廠(chǎng)商依賴(lài)于先進(jìn)的工藝來(lái)實(shí)現(xiàn)芯片的高算力, 在中國(guó)半導(dǎo)體工藝被嚴(yán)重卡脖子的時(shí)代,架構(gòu)的創(chuàng)新顯得尤為重要,以架構(gòu)的創(chuàng)新來(lái)替代先進(jìn)工藝所帶來(lái)的算力提升是芯動(dòng)力一直發(fā)展的方向。
評(píng)論