先進(jìn)汽車GPU的高速和高效開發(fā)將加速智能駕駛的更廣泛普及
根據(jù)工業(yè)和信息化部裝備一司發(fā)布的消息:2025年1月,中國汽車產(chǎn)銷分別完成245萬輛和242.3萬輛,產(chǎn)量同比增長1.7%,銷量同比下降0.6%。其中,新能源汽車產(chǎn)銷分別完成101.5萬輛和94.4萬輛,同比分別增長29%和29.4%,新能源汽車新車銷量達(dá)到汽車新車總銷量的38.9%;乘用車產(chǎn)銷分別完成215.1萬輛和213.3萬輛,同比分別增長3.3%和0.8%。中國汽車工業(yè)在繼續(xù)保持全球產(chǎn)量第一的同時,也在加速電氣化進(jìn)程,同時也在不斷推進(jìn)智能化。圖形處理器(GPU)已經(jīng)成為智能駕駛和新一代座艙中,被用以實現(xiàn)先進(jìn)駕駛輔助(ADAS)或者自動駕駛(AD),或者處理更多的屏顯、實現(xiàn)人機(jī)互動和汽車與環(huán)境互動的核心處理器件之一,基于GPU開發(fā)的智駕芯片和智能座艙芯片具有廣闊的前景。
本文引用地址:http://www.ex-cimer.com/article/202502/467194.htm作為世界第四大芯片IP公司,Imagination在全球汽車GPU IP市場一直處于領(lǐng)先地位,并專為汽車市場開發(fā)了XS系列GPU,該系列最新的DXS是一款可擴(kuò)展、靈活的GPU IP,專為處理駕駛艙、信息娛樂和高級駕駛輔助系統(tǒng)中的圖形和計算工作負(fù)載而打造。該處理器不僅以單核1.5TFLOPS的處理能力在計算性能方面引領(lǐng)行業(yè)同儕,而且還引入多項創(chuàng)新實現(xiàn)了分布式安全性,消除了芯片設(shè)計公司以往為實現(xiàn)ASIL-B等級功能安全而產(chǎn)生的額外開銷。目前,采用這種創(chuàng)新的、低成本的分布式安全機(jī)制DXS GPU已通過了ASIL-B汽車功能安全性認(rèn)證。?
除了上面提到的算力和分布式安全等硬件方面的創(chuàng)新,Imagination還為DXS系列GPU配置了全面的計算庫和工具鏈,以期望提升開發(fā)效率和充分釋放DXS GPU的性能方面,從而進(jìn)一步加速智能駕駛芯片的設(shè)計和普及。
深度優(yōu)化的全新底層計算庫提升開發(fā)效率
Imagination提供的一系列底層計算庫都經(jīng)過深度軟件調(diào)優(yōu)。全新計算庫和人工智能工具包,可幫助軟件開發(fā)人員實現(xiàn)高達(dá)80%的GPU利用率。這也將加速常見計算工作負(fù)載的處理,如計算機(jī)視覺和ADAS系統(tǒng)感知數(shù)據(jù)的預(yù)處理和后處理。這一套與DXS GPU硬件同時完成開發(fā)的計算庫包括:
傅里葉變換加速庫(imgFFT)
傅里葉變換加速庫(imgFFT)在智能駕駛領(lǐng)域是處理傳感器數(shù)據(jù)的得力助手。智能汽車搭載的雷達(dá)、攝像頭等傳感器會生成海量數(shù)據(jù),imgFFT能快速將時域數(shù)據(jù)轉(zhuǎn)換到頻域。例如,毫米波雷達(dá)不斷發(fā)射和接收電磁波,產(chǎn)生的時域信號經(jīng) imgFFT 處理后,車輛可清晰分辨出周邊物體的速度、距離等信息。在圖像識別方面,攝像頭拍攝的圖像數(shù)據(jù),通過 imgFFT頻域數(shù)據(jù)分析提取,可突出圖像中的邊緣、紋理等關(guān)鍵特征,使圖像識別算法能更精準(zhǔn)地識別道路標(biāo)志、車道線以及其他車輛,幫助車輛提前做出反應(yīng),極大地提升了自動駕駛系統(tǒng)的環(huán)境感知能力和安全性。
線性代數(shù)庫(imgBLAS)
線性代數(shù)庫(imgBLAS)為智能駕駛中的復(fù)雜運(yùn)算提供了高效支持。在路徑規(guī)劃算法里,imgBLAS的矩陣運(yùn)算能力發(fā)揮著關(guān)鍵作用。當(dāng)車輛規(guī)劃行駛路線時,要綜合考慮地圖數(shù)據(jù)、實時路況、自身位置等信息,這些都以矩陣形式呈現(xiàn)。借助 imgBLAS的矩陣乘法、加法等優(yōu)化函數(shù),車輛能快速計算出不同路徑的成本和可行性,找到最優(yōu)行駛路徑。在機(jī)器學(xué)習(xí)模型訓(xùn)練中,imgBLAS同樣不可或缺。像訓(xùn)練用于預(yù)測交通流量的模型時,涉及大量數(shù)據(jù)的矩陣運(yùn)算,imgBLAS能大幅提升運(yùn)算速度,縮短模型訓(xùn)練時間,使模型更快適應(yīng)路況變化,為自動駕駛決策提供更準(zhǔn)確的依據(jù)。
神經(jīng)網(wǎng)絡(luò)庫(imgNN)
神經(jīng)網(wǎng)絡(luò)庫(imgNN)是推動自動駕駛技術(shù)智能化的核心力量。在自動駕駛系統(tǒng)的深度學(xué)習(xí)模型中,imgNN為模型的訓(xùn)練和推理提供了有力支持。在訓(xùn)練階段,imgNN優(yōu)化了模型參數(shù)更新的計算過程,加速了模型的收斂速度,使模型能夠更快地學(xué)習(xí)到圖像中各類物體的特征。在實際駕駛中,模型進(jìn)入推理階段,imgNN能夠高效處理攝像頭傳來的圖像數(shù)據(jù),迅速識別出車輛、行人、障礙物等目標(biāo),并準(zhǔn)確判斷其位置和運(yùn)動狀態(tài),幫助車輛及時做出制動、避讓等決策,使得自動駕駛系統(tǒng)的反應(yīng)更加靈敏、決策更加精確,有力地推動了自動駕駛技術(shù)從理論走向?qū)嶋H應(yīng)用。
Imagination還將其開發(fā)庫與oneAPI Toolkit、TensorGraph Reference Kit進(jìn)行對接和優(yōu)化,無論開發(fā)者在何種架構(gòu)、平臺上開發(fā),或是使用開源框架,都能無縫使用這些庫,極大地提升了開發(fā)環(huán)境選擇的靈活性。
Imagination的創(chuàng)新生態(tài)系統(tǒng)構(gòu)建
Imagination致力于解決GPU開發(fā)的局限性問題,為開發(fā)者們提供了一套全面且極具創(chuàng)新性的解決方案。Imagination構(gòu)建了領(lǐng)域?qū)<液献骰锇榈纳鷳B(tài)系統(tǒng),與UXL基金會緊密合作,通過開源持續(xù)推動oneAPI標(biāo)準(zhǔn)的發(fā)展,為開發(fā)者開辟了一條清晰且便捷的道路,以便實現(xiàn)軟件的可移植性,并有效利用異構(gòu)硬件。這一方案不僅打破了硬件廠商的壁壘,還極大地提升了開發(fā)效率,讓開發(fā)者能夠?qū)W⒂谒惴▋?yōu)化和應(yīng)用創(chuàng)新,從而在激烈的技術(shù)競爭中占據(jù)優(yōu)勢。
UXL 基金會,即 Unified Acceleration Foundation,是在當(dāng)前全球 GPU 開發(fā)格局下應(yīng)運(yùn)而生的重要組織,其愿景是打破少數(shù)廠商利用其軟件平臺與 GPU 硬件構(gòu)建的封閉生態(tài)系統(tǒng)帶來的限制,使全球開發(fā)者可以不依賴某一特定軟件平臺進(jìn)行 AI 和其他應(yīng)用程序開發(fā),從而使其他硬件廠商的 GPU 在軟件開發(fā)后解決適配上面臨的諸多困難。在此背景下,高通、谷歌、英特爾、Imagination Technologies和三星等科技巨頭聯(lián)合成立了 UXL 基金會。
UXL 基金會的目標(biāo)是構(gòu)建一個開源項目,打造一套能驅(qū)動多種GPU等加速器芯片的軟件和工具,使開發(fā)者的代碼能在任何機(jī)器上運(yùn)行,而無需考慮具體使用何種芯片和硬件,以此推動建立開放標(biāo)準(zhǔn)的生態(tài)系統(tǒng),打破硬件與軟件之間的壁壘,統(tǒng)一異構(gòu)計算生態(tài)。UXL基金會致力于軟件開發(fā)移植和成果復(fù)用,通過構(gòu)建開源項目和制定統(tǒng)一標(biāo)準(zhǔn)簡化開發(fā)流程。它基于oneAPI來提供跨平臺編程接口和工具,如oneDPL、oneDNN等,以促進(jìn)軟件快速移植和開發(fā)效率。
因此,Imagination積極參與發(fā)起UXL 基金會,并為此提供了諸多技術(shù)貢獻(xiàn),還積極支持開放社區(qū)與協(xié)作機(jī)制,推動全球的開發(fā)者可以在社區(qū)中共享代碼、分享經(jīng)驗和交流創(chuàng)新成果。目前,Imagination及其客戶和合作伙伴通過oneAPI,攜手解決了軟件開發(fā)移植過程中遇到的許多問題,不僅有效地支持了開發(fā)者去提升開發(fā)效率,還可加速軟件移植和實現(xiàn)無形資產(chǎn)的全面復(fù)用。
全面的工具加速開發(fā)項目應(yīng)用落地
Imagination的PVRTune工具為開發(fā)者提供了精確的性能分析支持。該工具專門針對包括新推出的DXS GPU在內(nèi)的PowerVR器件進(jìn)行硬件級別的性能深度剖析。利用PVRTune,開發(fā)者能夠?qū)崟r監(jiān)控GPU負(fù)載、內(nèi)存帶寬等關(guān)鍵性能指標(biāo)。在識別問題后,能夠迅速定位性能瓶頸,優(yōu)化代碼結(jié)構(gòu),從而顯著提升應(yīng)用的運(yùn)行效率。PVRTune還支持多線程調(diào)試,協(xié)助開發(fā)者均衡各線程負(fù)載,預(yù)防資源沖突。通過其直觀的可視化界面,開發(fā)者可以清晰地查看性能數(shù)據(jù),并精確調(diào)整參數(shù),進(jìn)一步優(yōu)化應(yīng)用性能,確保即便在復(fù)雜場景中也能保持高效運(yùn)行。
此外,Imagination也致力于為開發(fā)者們提供參考計算和AI工具包,助力客戶在實際應(yīng)用中充分利用計算庫。該參考計算和AI工具包已在客戶和合作伙伴的項目開發(fā)中實現(xiàn)了許多成功范例。例如,澎峰科技基于Imagination的計算庫構(gòu)建AI解決方案,借助參考工具包,在Imagination GPU上運(yùn)行各類人工智能應(yīng)用,其中大語言推理引擎PerfXLM相較于CPU方案,性能提升高達(dá)100%,且移植耗時極短。
DXS GPU將Imagination的綜合優(yōu)勢全面帶入智能汽車領(lǐng)域
目前,已有領(lǐng)先汽車芯片企業(yè)購買了Imagination的DXS系列汽車GPU IP的授權(quán),預(yù)計在不久的將來,業(yè)界將看到采用DXS GPU IP開發(fā)的高算力、具有功能安全性的智駕芯片。這些智駕芯片除了充分發(fā)揮Imagination獨(dú)特的PowerVR GPU架構(gòu)、在行業(yè)內(nèi)領(lǐng)先的HyperLane硬件隔離技術(shù)等創(chuàng)新,也為最終應(yīng)用的開發(fā)者提供了從生態(tài)系統(tǒng)、底層庫、性能分析工具到參考工具包的全方位支持,有效解決了傳統(tǒng)開發(fā)環(huán)境的局限性問題。從而推動開發(fā)者發(fā)揮GPU技術(shù)在更靈活、更通用和生命周期更長等方面的優(yōu)勢,助力智駕芯片開發(fā)者快速實現(xiàn)高質(zhì)量創(chuàng)新。
評論