Imagination推出B系列GPU IP,力挺本土芯片的圖形渲染和AI創(chuàng)新
2020年10月,半導(dǎo)體知識產(chǎn)權(quán)(IP)供應(yīng)商Imagination Technologies在京舉辦了IMG B系列圖形處理器(GPU)新技術(shù)暨IP新產(chǎn)品發(fā)布會。B系列革命性地采用了多核技術(shù),它們支持更高性能,同時(shí)芯片面積比前代產(chǎn)品更小。借助其原生的可擴(kuò)展性,B系列是諸多應(yīng)用市場的終極解決方案,包括Imagination傳統(tǒng)的市場——移動設(shè)備、汽車、數(shù)字電視等,以及新的桌面PC、數(shù)據(jù)中心等。
本文引用地址:http://www.ex-cimer.com/article/202010/419732.htm多核是否會成為GPU的未來趨勢?B系列IP對標(biāo)市面上現(xiàn)有的哪些GPU芯片?為何B系列會專門推出一個(gè)型號面向汽車領(lǐng)域?本土企業(yè)用IP有何挑戰(zhàn)?為此,電子產(chǎn)品世界等媒體采訪了Imagination的相關(guān)領(lǐng)導(dǎo)。線上是英國總部的首席營銷官David Harold,技術(shù)產(chǎn)品高級總監(jiān)Kristof Beets, 線下是副總裁兼中國區(qū)總經(jīng)理劉國軍,中國區(qū)戰(zhàn)略市場與生態(tài)高級總監(jiān)時(shí)昕等。
圖 Imagination首席營銷官David Harold、技術(shù)產(chǎn)品高級總監(jiān)Kristof Beets,副總裁兼中國區(qū)總經(jīng)理劉國軍,中國區(qū)戰(zhàn)略市場與生態(tài)高級總監(jiān)時(shí)昕
1 GPU多核是否是趨勢
此次發(fā)布的B系列的一個(gè)亮點(diǎn)是增加了多核技術(shù),那么,多核技術(shù)架構(gòu)是不是會成為未來主流的一種技術(shù)趨勢?原有的單核的產(chǎn)品是否會逐漸被多核替代?
我們應(yīng)該在單核和多核之間達(dá)到一種平衡。單核模塊對細(xì)節(jié)的優(yōu)化是非常高效的。但是如果把單核做得過大,對布局、設(shè)計(jì)和擴(kuò)展就比較難做的。多核能帶來更好的擴(kuò)展效果、設(shè)計(jì)和布局。這就是為什么在多核方面有很多的模塊,以應(yīng)對不同的市場。BXT有4款產(chǎn)品,應(yīng)對到不同的專業(yè)市場。
另一方面,市面上GPU的工作負(fù)載也有很大的改變,越來越多樣化,有圖形渲染的需求,有計(jì)算的需求,有更大更小的需求,這就帶來了GPU的布局和架構(gòu)變化的需求。多核架構(gòu)能更好地實(shí)現(xiàn)最優(yōu)化,以滿足不同GPU工作負(fù)載的布局。而單核/單片平臺對大工作負(fù)載是有效的,但對于小工作負(fù)載的效率很低。因此,Imagination的靈活多變的動態(tài)的多核架構(gòu),可以把大的工作負(fù)載來細(xì)分,切分成不同的小的工作負(fù)載,并且同時(shí)進(jìn)行操作。這對多樣性和靈活度來說都是有好處的。
同時(shí)從單核、多核趨勢角度來看,GPU的這種多核趨勢是和CPU之前的向多核發(fā)展的趨勢是類似的。所以此次發(fā)布的B系列是多核架構(gòu),它更加靈活,而且更加具有動態(tài)性,所以不僅僅能帶來更好的渲染/性能,同時(shí)降低了功耗,還有可以滿足chiplet(小芯片)需求。
圖 B系列從左至右,分別面向低、中、高和汽車應(yīng)用
2 Chiplet的趨勢
chiplet在GPU行業(yè)里是個(gè)主流趨勢,無論是英偉達(dá)還是AMD都在進(jìn)入這個(gè)領(lǐng)域。所以imagination非常合理、也非常有必要地要賦能客戶實(shí)現(xiàn)chiplet能力。
chiplet的出現(xiàn)是因?yàn)楝F(xiàn)在處理器的成本非常高。與傳統(tǒng)的1個(gè)處理器來負(fù)責(zé)1個(gè)性能點(diǎn)的做法不同,chiplet架構(gòu)由不同的組件構(gòu)成,然后在獨(dú)立的軟件上進(jìn)行設(shè)計(jì)和執(zhí)行。因此,不同的chiplet可以用不同的工藝節(jié)點(diǎn)來制造,甚至可以由不同的供應(yīng)商來提供,這樣可以減少設(shè)計(jì)時(shí)間和成本。
但是chiplet有個(gè)問題:在裸片之間信號的傳輸可能會受限制,所以Imagination的多核架構(gòu)和去中心化措施堪稱完美的解決方案,解決了大量的信息集中到單一模塊上的這種問題。這種去中心化的多核架構(gòu)很好地符合了chiplet的趨勢。從客戶那里獲得的反饋是性能有大幅提升,也不存在裸片之間的信號傳輸問題。
圖 BXT系列GPU是1個(gè)4核部件
3 與主流GPU芯片的對標(biāo)
B系列GPU IP面向桌面級和數(shù)據(jù)中心,對標(biāo)的是友商的哪款GPU芯片?
實(shí)際上很難直接去對標(biāo),因?yàn)镮P和芯片有不同的評測方式。要等采用了IP的芯片出來之后才能去跑分。目前來看,一個(gè)量化指標(biāo)是TFLOPS(每秒萬億次計(jì)算)。IMG B系列可提供高達(dá) 6 TFLOPS的計(jì)算能力,并通過多核技術(shù),支持更高性能。
另一個(gè)指標(biāo)是每瓦性能表現(xiàn)。PC等桌面高端顯卡高峰時(shí)的功耗達(dá)到幾百瓦,這是可接受的,但有些應(yīng)用,例如數(shù)據(jù)中心很難接受,因其自然散熱條件不能充分散熱,只能通過被動方式散熱,例如會把頻率降低,從而使功耗低一些。在這樣的場景下,Imagination的優(yōu)勢可以體現(xiàn)出來,因?yàn)镮magination的GPU IP傳統(tǒng)上是為移動產(chǎn)品應(yīng)用的,基本上就是幾瓦,這樣來看B系列在功耗上更有優(yōu)勢。
從圖形角度來看,Imagination不能像市面上的GPU芯片公司一樣直接比TFLOPS,因?yàn)檫@不準(zhǔn)確,僅供參考,因?yàn)檫€要有結(jié)合的場景。但至少Imagination有信心:做桌面級的處理是沒有問題的,B系列也能達(dá)到TFLOPS。
目前,在桌面GPU和云端平臺上,已經(jīng)有5家中國客戶在與Imagination接洽。
4 汽車電子的獨(dú)特需求
B系列的上代——A系列不是按照應(yīng)用劃分,而是性能。B系列有專門面向汽車應(yīng)用的子系列BXS。為什么要把汽車部分單獨(dú)提出來?這和A系列運(yùn)用于汽車的產(chǎn)品之間的區(qū)別是什么?
Imagination有多年和汽車行業(yè)伙伴的合作經(jīng)驗(yàn),也了解到汽車行業(yè)的工作特點(diǎn),所以才將之前幾代的GPU IP進(jìn)行了調(diào)整,來更加適合汽車行業(yè)。
首先,性能方面。消費(fèi)產(chǎn)品用內(nèi)核市場與汽車行業(yè)是完全不同的,消費(fèi)行業(yè)的流程是:內(nèi)核會有一個(gè)內(nèi)存的請求,然后進(jìn)入到SoC,之后再進(jìn)入到DDR,再回去。
但是汽車行業(yè)不同。汽車業(yè)SoC的很多操作是要實(shí)時(shí)進(jìn)行的,這就對內(nèi)存控制等優(yōu)先級要求很高,要求低延遲,比消費(fèi)產(chǎn)品市場有2倍的提升。Imagination設(shè)計(jì)的GPU架構(gòu)允許這樣的延遲的提升。
另外,汽車行業(yè)的圖像渲染要求和游戲、消費(fèi)類行業(yè)也不太一樣。在汽車行業(yè),自動駕駛所需要的圖像渲染的能力更加簡單直接,所以BXS從幾何渲染的角度進(jìn)行了微調(diào)。
再有,要確保GPU IP能完全滿足ISO26262標(biāo)準(zhǔn)(如下圖)。
此外,BXS做了很多小的架構(gòu)方面的改進(jìn),來確保GPU能進(jìn)行自我檢測。為此,融入了很多GPU的自然冗余,以確保計(jì)算結(jié)果是正確的;同時(shí)能將一些誤判不回饋給系統(tǒng)。
最后,Imagination有RISC-V固件,還有基于CRC的動態(tài)數(shù)據(jù)的完全性保護(hù),例如Imagination在工具包里有很多工具來保證自動駕駛過程中的功能安全性。
在這個(gè)過程中,包括硬件的設(shè)計(jì),駕駛軟件的設(shè)計(jì),以及內(nèi)部的安全管理信息的開發(fā),以及和汽車行業(yè)伙伴的合作,使Imagination了解在汽車自動駕駛的過程中真正的工作負(fù)擔(dān)是什么,并了解從圖像渲染和計(jì)算算法方面是從什么角度來切入,這樣,通過微調(diào)才能真正實(shí)現(xiàn)滿足市場的所有需求。
但是相比之下,很多競品只將一個(gè)消費(fèi)類產(chǎn)品的移動端內(nèi)核重新封裝,然后復(fù)制到汽車行業(yè),并不是一個(gè)真正的汽車行業(yè)的自動駕駛級別的解決方案。
而Imagination從根本上來實(shí)現(xiàn)內(nèi)核的改變,從安全性和驗(yàn)證角度,將內(nèi)核進(jìn)行重新的改變,完全適應(yīng)汽車行業(yè)和自動駕駛和ADAS(高級輔助駕駛系統(tǒng))的需求。這才能為客戶提供最好的汽車行業(yè)的GPU IP內(nèi)核。
值得一提的,Imagination汽車行業(yè)的GPU團(tuán)隊(duì)并不是從Imagination整體的GPU團(tuán)隊(duì)中分離出來的一個(gè)小團(tuán)隊(duì),而是一個(gè)獨(dú)立團(tuán)隊(duì),與其他行業(yè)GPU IP團(tuán)隊(duì)并行工作。
那么,Imagination如何滿足無人駕駛產(chǎn)業(yè)的需求?
到目前為止,很多無人駕駛的測試平臺是通過桌面GPU的算法實(shí)現(xiàn)的,這種算法是浮點(diǎn)運(yùn)算能力和神經(jīng)網(wǎng)絡(luò)計(jì)算能力。自動駕駛汽車要真正成熟,需要有異構(gòu)的計(jì)算平臺,即GPU+NNA的并行計(jì)算能力。Imagination的多核架構(gòu)可以滿足功能安全性,為自動駕駛市場提供功能安全性和靈活性的解決方案。
具體地,從功能安全性的角度,Imagination可以提供硬件級的保證。在汽車驗(yàn)證過程中,Imagination的方案可以在核內(nèi)進(jìn)行。例如在異構(gòu)平臺上,即把GPU和神經(jīng)網(wǎng)絡(luò)加速器(NNA)整合到同一平臺上(如下圖),通過GPU的動態(tài)性能控制和多任務(wù)機(jī)制以及GPU和神經(jīng)網(wǎng)絡(luò)加速器(NNA)之間的協(xié)同工作機(jī)制,可以輕松地同步應(yīng)對圖形處理和AI計(jì)算任務(wù);再發(fā)展到自動駕駛,對算力有超高需求時(shí),Imagination的多核NNA就可以充分發(fā)揮作用。
另外對于汽車行業(yè),性能也是非常重要的。自動駕駛汽車在行駛過程中會產(chǎn)生大量的熱,算法平臺需要在一定的性能下滿足功耗的降低,而Imagination的架構(gòu)在性能的優(yōu)化和功耗降低方面能滿足自動駕駛汽車行業(yè)的需求。
最后,Imagination在汽車行業(yè)有很多的合作伙伴,有的已有10~15年的合作經(jīng)驗(yàn),這些終端用戶無論是汽車主機(jī)廠還是汽車供應(yīng)鏈上其他的用戶,給了Imagination使用反饋,使Imagination能在汽車行業(yè)給出理想的解決方案。
5 下一代GPU IP的挑戰(zhàn)
在下一系列的產(chǎn)品中,就是C系列,如果性能持續(xù)保持或超過現(xiàn)在的增長速率,需要突破的關(guān)鍵技術(shù)大概會有哪些?
正如很多大型IT企業(yè)所提到的,就是工藝節(jié)點(diǎn)的問題。目前為止,在有限的空間里,晶體管的密度越來越高了,以滿足在有限的空間里實(shí)現(xiàn)我們想要實(shí)現(xiàn)的性能,無論是7 nm、5 nm還是3 nm。但是還有一些其他的挑戰(zhàn)。例如在有限的空間和帶寬內(nèi)提升性能,同時(shí)降低功耗。另外帶寬也是一個(gè)問題,在過去幾代的手機(jī)端已經(jīng)看到在功耗限制下,手機(jī)的性能提升也不那么明顯了,Imagination此次發(fā)布的B系列,在這方面有自己的建樹,Imagination在人工智能和光線追蹤這2個(gè)領(lǐng)域的技術(shù),也能為未來大規(guī)模提升性能模塊有一定的幫助。
6 中國市場如何降低專利風(fēng)險(xiǎn)
中美貿(mào)易摩擦導(dǎo)致中國公司在芯片領(lǐng)域有較大的風(fēng)險(xiǎn),貴公司如何幫助中國公司規(guī)避風(fēng)險(xiǎn)?
中國的很多客戶在此前對美國技術(shù)有過分的依賴,但在中美貿(mào)易摩擦中無法進(jìn)口美國的技術(shù),而且美國對中國大量的技術(shù)出口的意愿也受到打擊。因此,中國企業(yè)要避免對美國技術(shù)的過分依賴,同時(shí)更快地發(fā)展中國本土的半導(dǎo)體產(chǎn)業(yè)。
Imagination是少數(shù)擁有圖形處理基本專利公司之一,另一方面也是唯一一家非美國的擁有基本GPU IP的公司,所以可以非常合理地進(jìn)入到中國,與中國的合作伙伴進(jìn)行密切的合作。
7 是否成功取決于生態(tài)
Imagination的GPU IP可用于中國哪些市場?
這和生態(tài)系統(tǒng)有很大的關(guān)系。Imagination的客戶是芯片的設(shè)計(jì)者,以及客戶的客戶,取決于它們在某一個(gè)應(yīng)用市場。特別是AI,Imagination有異構(gòu)計(jì)算平臺來進(jìn)入AI邊緣或云端的計(jì)算,前提是云端或桌面AI級計(jì)算的應(yīng)用要能起來。所以每個(gè)垂直應(yīng)用的市場都需要一個(gè)完整生態(tài)的建立。
Imagination現(xiàn)在對生態(tài)的建立,特別是在中國的生態(tài)建立是非常重視的,公司目前在不斷地在招募新員工。
8 中國的芯片設(shè)計(jì)水平和歐美的比較
Imagination的IP在歐美的關(guān)系就是直接買賣。但中國公司或從業(yè)人員跟國外的不一樣,成熟度有差距,包括做SoC或大芯片,生態(tài)/軟硬件,以及設(shè)計(jì)高手等。
盡管國內(nèi)少數(shù)公司的設(shè)計(jì)高手的水平已經(jīng)超過國外的,但是大部分公司的團(tuán)隊(duì)成熟度還是跟歐美有差距。因此他們對EDA工具和IP提供商的依賴度很高。所以Imagination在中國的技術(shù)支持的方式和力量都不一樣,需要大量的現(xiàn)場支持,這還是針對常規(guī)的公司。國內(nèi)還有很多初創(chuàng)公司,很多人沒有production(生產(chǎn))的經(jīng)驗(yàn),所以要求Imagination的支持方式完全與歐美不一樣。歐美哪怕一個(gè)小的團(tuán)隊(duì),設(shè)計(jì)能力和做事的成熟度也比國內(nèi)一些團(tuán)隊(duì)的成熟度高——但這不一定是說歐美公司就比國內(nèi)的厲害。因?yàn)橐患夜臼欠癯晒?,還涉及到第二點(diǎn)——企業(yè)的商業(yè)文化。國內(nèi)工程師可以做到996(員工上班時(shí)間從早上9點(diǎn)開始,到晚上9點(diǎn)下班,每周工作6天。),英國是絕對不可能的,美國也是極個(gè)別的公司才能做到996。
具體地,歐美成熟的fabless(設(shè)計(jì)芯片公司)購買產(chǎn)品,他們都按照規(guī)矩和流程,例如他們需要你的支持,怎樣支持。因?yàn)樗麄冏约河蟹浅G逦脑鯓幼鯯oC項(xiàng)目的流程。
包括利潤率的要求也不一樣,歐美往往要求毛利不低于60%,歐美做的速度也有規(guī)律,他們不是看到你的這個(gè)產(chǎn)品賺錢,我也要去做這個(gè)。但中國是這樣的,如果這個(gè)賺錢,我就做,而且要快,快就變成了996。前不久還聽說了007(一天24小時(shí)待命,每周7天)。這是中國市場普遍存在的特點(diǎn),而且即使他做不到,他也一定想這么做,因?yàn)槿绻a(chǎn)品雷同,他不這么做,根本活不了。
所以在這樣的要求下,Imagination的支持或客戶用IP的方式都不一樣。但是也正因?yàn)橛羞@樣的文化,所以只要Imagination的產(chǎn)品是好的,他們確定是有價(jià)值的,他們就會采用。
中國的創(chuàng)新力也是驚人的。例如國內(nèi)某大型芯片設(shè)計(jì)公司,劉國軍副總裁一二十年前在一家美國EDA公司時(shí),就跟該公司打交道,美國人不能相信一個(gè)剛出來的設(shè)計(jì)方法,該公司居然花了不到1年的時(shí)間,使用的效果超過了Cisco。
為此,劉國軍副總裁一直跟英國、美國人講這個(gè)故事,這家國內(nèi)芯片公司當(dāng)時(shí)不去花錢買顧問服務(wù),當(dāng)時(shí)的產(chǎn)品手冊全是紙質(zhì)的,有1尺高,該公司的工程師白天黑夜地去摳那些東西,最后用出來的效果超過了預(yù)期。
所以中外的商業(yè)文化不一樣。
那么,相比歐美,中國的方式更好嗎?這很難評判。因?yàn)闅W美的流程的效率其實(shí)挺高的,他們做出來的東西基本上不太會同質(zhì)化。
但是你說這不好嗎?國內(nèi)企業(yè)就是能做出來歐美人都不敢相信的事情。
所以針對B系列,國內(nèi)企業(yè)會把Imagination的東西用起來,這沒問題;其次,這個(gè)用法跟歐美不一樣,所以Imagination的支持方式要努力適合國內(nèi)的特點(diǎn)。
評論