ARM的A/R/M設計目標:適合的處理器來執(zhí)行對應的任務
*Cortex-A73是繼今年Cortex-A72之后的ARM旗艦級的產(chǎn)品,之前旗艦級從Cortex-A15到Cortex-A57到Cortex-A72都是Austin(奧斯汀)架構,Cortex-A73是采用了和Cortex-A12、Cortex-A17一樣的Sofia(索非亞)架構,這是為什么,是否意味著Austin到了性能極限?
本文引用地址:http://www.ex-cimer.com/article/201607/294692.htm其實,ARM有很多設計中心,比如在奧斯汀、索非亞,還有劍橋,還有法國,還有其他地方很多的設計中心。處理器這塊我們確實是有一些分工的,所有的小核都是在劍橋設計的,在大核這邊,我們是由奧斯汀和索非亞兩個團隊分別設計的,他們之間有很多共享的團隊交流,所以不存在極限這一說法。
* 未來Cortex-A73在10nm的工藝下會突破3GHz嗎?
理論上是沒有問題的。但是我們現(xiàn)在看到客戶做到2G,至于客戶會不會從2G一直往上提升到3G,甚至超過3G,還是要看客戶的設計。
* 對于數(shù)據(jù)中心,ARM如何看待的?
實際上一直有在做,海思、NXP等有非常多基于Cortex-A72的產(chǎn)品出來。在數(shù)據(jù)中心這塊更多地是看計算密度。在服務器里,在流水線的升級里面,能夠放更多處理能力的核。此外,數(shù)據(jù)中心考慮更多的是功耗,在同樣的功耗范圍內(nèi)ARM有更多的核和更好的處理能力。在數(shù)據(jù)中心,現(xiàn)在可以做到48核左右。
以前在數(shù)據(jù)中心有準入門檻,或者是很困難的,主要困難在軟件即生態(tài)系統(tǒng)這部分?,F(xiàn)在ARM在服務器、軟件上的生產(chǎn)已經(jīng)非常成熟了,現(xiàn)在這個限制已經(jīng)不存在了。
* 對于數(shù)據(jù)中心,現(xiàn)在Cortex-A72比Cortex-A73更有優(yōu)勢?
答案是肯定的。因為首先Cortex-A73沒有AMBA5 CHI,不支持更多的Cluster。還有一點是Cortex-A73里面不支持ECC,ECC在服務器的標準里面,在可靠性方面也是非常重要的。
Cortex-R關注實時
Cortex-R處理器從架構上看也有非常豐富的指令集的,包括處理器浮點運算SIMD(NEON)。Cortex-R處理器現(xiàn)在只是支持AArch32,并沒有支持AArch64。Cortex-R處理器和Cortex-A處理器不一樣,并沒有極致地追求單線程性能,而是關注實時性,以及能夠執(zhí)行、完成安全性的一些特定功能。
Cortex-R處理器主要集中在代碼密度的優(yōu)化上。在Cortex-R里有很大一部分性能跟I/O以及flash相關,在這方面也是做了很多的優(yōu)化。同時,Cortex-R也支持緊耦合的緩存,這對實時性也非常有幫助。
跟Cortex-A處理器的很多應用不一樣,Cortex-R處理器側重于實時性以及安全性,更多地應用在IoT、基帶的調(diào)制解碼器、存儲、汽車以及工業(yè)控制等方面。Cortex-R的確定性執(zhí)行、實時性以及安全性的特征,都非常適合這些領域。
Cortex-R8是今年(2016年)發(fā)布的一款處理器R8(圖5),相信不久之后會看到基于Cortex-R8的基帶芯片。
跟Cortex-A系列不同的是,Cortex-R有很多針對存儲的優(yōu)化。比如TCM的,在外設接口這邊,有AXI-S和AXI-M接口以及低延遲外設接口,以及低延時的內(nèi)存接口。
Cortex-R8還支持緊耦合緩存。TCM對確定性的執(zhí)行有非常大的幫助的,也保證了實時性。
Cortex-R8可以支持到4核的,它是超標量亂序執(zhí)行的處理器,它有11階流水線,并且有浮點運算單元,支持單精度和雙精度的浮點。和Cortex-A不太一樣的是,Cortex-R集中在確定性的執(zhí)行以及實時性方面。
Cortex-M及熱門問題
跟Cortex-A和R不一樣的是,M系列主要是面向代碼密度以及低功耗的微控制器市場(如圖7),所以并沒有像Cortex-A和R那樣有豐富的指令集。所有Cortex-M系列的處理器都是面向最低功耗的,都是按序完成的流水線。Cortex-M處理器也有非常豐富的可配置性,有些處理器可選浮點運算單元。作為可選,能夠達到好的功耗以及好的面積。
Cortex-M系列的處理器可以實現(xiàn)超高的能效比,應用于超低功耗的IoT的MCU,也可以用于移動市場sensor hub這樣需要很高性能的市場。
以Cortex-M7為例,Cortex-M7甚至比Cortex-R有更豐富的接口,所有剛才指的這些都是可配置的。如果你需要,就可以把它放到那里,不需要就可以把它移掉,像一些TCM等配件。也可以根據(jù)需求做到最優(yōu)化的Cortex-M的處理器。
Cortex-M7是M系列里性能最高的處理器(如圖7),也支持緩存的TCM等。當然也可以把這些去掉,得到更好的面積和功耗。Cortex-M系列也支持比較高的安全性功能,這邊可以看到ECC就是來支持安全性功能。
一些熱點問題如下。
* Cortex-M7比Cortex-M4功能強多少?
實際上,Cortex-M7比Cortex-M4的性能有大概40%的提升。DSP是雙倍的性能提升。
* 很多MCU廠商認為今年的市場Cortex-M4會是主流,從ARM角度看,Cortex-M7什么時候會成熟?
ARM認為現(xiàn)在Cortex-M主要還是在中低端的市場,但我們看到市場會對DSP有很高的需求,當有高性能需求的時候,Cortex-M7市場會有一個比較大的增長,比如高頻音頻和視頻市場的增長。
A/R/M熱門問題
*A系列(SW managed interrupts)和R系列(Determinisitic SW managed)是屬于軟件的關聯(lián)的部分,M系列(HW managed interrupt)是面向硬件的管理,為什么會有這樣的差別?
因為Cortex-A的軟件管理意味著你在操作系統(tǒng)的層面上更好的管理,你可以管理這些終端的硬件,Cortex-M系列所有這些事情都是自動完成的。
*經(jīng)過這么多年,ARM架構一直在提升性能,降低功耗,架構的每次創(chuàng)新功能都持續(xù)的改進,未來持續(xù)的創(chuàng)新最高級別能到什么程度?可能需要幾年?這個架構會有什么新的改變?
目前還沒有看到這樣一個極限。從生產(chǎn)工廠這塊來看,在未來5年還是在不斷演進的,它的工藝目前也是從10nm到7nm不斷的演進。借助這樣的工藝條件,我們的處理器也可以有更多的空間提升它的性能,做更多的優(yōu)化。從另外一個角度來講,我們也可以看到會有一些新的功能、新的要求在里面,前面已經(jīng)講到了,在架構這方面,我們從ARMv8.0到8.1以及8.2,以及還會看到更多的架構上的演進。另外還有系統(tǒng)上的優(yōu)化,其實ARM有很多系統(tǒng)級的優(yōu)化,所以多方面綜合來看,還有很多事情可以做,我們也會一直持續(xù)地做創(chuàng)新以及優(yōu)化。
*ARM有很多產(chǎn)品,定義一個IP的時候是基于什么考慮?
一個原因是市場擴展的需求,例如以前看到了64位市場是很大;另外面向新市場,比如網(wǎng)絡市場、企業(yè)級市場。再有,從功能角度也會有一些提升,要看這個提升是較大還是較小,會據(jù)此決定是否需要新的設計。還有一個原因是在性能方面的提升,根據(jù)這個市場上的用戶體驗是否對這個性能有較大的需求,會在性能上做一些優(yōu)化。還有就是在新特性上,如果有比較多的新特征,ARM會針對新特性做新的處理器,舉個例子,面向ADAS市場,它對安全性的需求非常高,需要滿足ASL標準,為了支持更多核的方式,ARM也會有一些新的設計。
小結
ARM處理器的主要目的就是對正確的任務設計正確的處理器,在每個架構里面都有一些獨特的處理器來覆蓋這樣的一些市場。(注:本文根據(jù)ARM Tech Day上錄音整理,未經(jīng)講演者確認。該活動由ARM公司主辦,2016年6月16日,北京)
本文來源于中國科技期刊《電子產(chǎn)品世界》2016年第7期第30頁,歡迎您寫論文時引用,并注明出處。
評論