STM32 F7如何滿足嵌入式系統更高處理性能需求
意法半導體(ST)日前宣布推出業(yè)界首款基于ARM最新Cortex-M7內核的STM32 F7系列微控制器,其性能遠超ST之前的32位STM32F4微控制器,通過無縫升級路徑可將處理性能和DSP性能提高一倍。
本文引用地址:http://www.ex-cimer.com/article/201612/326949.htm“作為STM32微控制器產品家族的高端產品,STM32 F7使內存和外存的性能達到一個新的水平,給開發(fā)人員帶來新的創(chuàng)新機會,保證他們不需要再根據存儲器性能調整代碼?!盨T微控制器市場總監(jiān)Daniel Colonna表示,“而之所以能夠在業(yè)內率先推出基于Cortex-M7的產品,首先得益于ST與ARM密切的合作關系。其次,ST也與第三方客戶保持著廣泛的合作,確保他們能夠及時得到ARM最新的技術支持并推出新產品。強大的開發(fā)生態(tài)系統結合多元化的微控制器、傳感器、功率器件和通信產品組合,以及貼心的客戶技術支持服務,ST一直在延續(xù)STM32微控制器家族的優(yōu)勢。”
Cortex-M7為高性能而生
ARM嵌入式市場營銷副總裁Richard YORK表示:“智能硬件的發(fā)展勢不可擋,很多連網的智能嵌入式設備要求處理器提供更多的本地化處理功能,這對CPU的性能要求更高;此外,更多顯示、人機交互的語言識別需求也要求更高的CPU處理性能。順應這兩大趨勢,ARM推出了最新的Cortex-M7內核。”
Cortex-M7目標定位于Cortex-M系列最高性能的CPU內核,針對諸如智能控制系統的高端嵌入式應用,包括馬達控制、工業(yè)自動化、先進語音功能、圖像處理、各類連網交通工具應用以及物聯網相關應用。
相較于目前性能最高的ARM架構微控制器,Cortex-M7可提升兩倍的運算及數字信號處理性能,其性能測試結果高達5CoreMark/MHz,能夠更快速地處理音頻、影像數據及語音識別。Cortex-M7提供用于C語言的程序模型,且與現有Cortex-M系列產品二進制兼容。憑借完整的生態(tài)系統與軟件兼容性,現有Cortex-M內核能夠輕松遷移至Cortex-M7,設計人員可以重復利用各種程序代碼,降低研發(fā)及維護等成本。
Cortex-M7如何實現高性能?Richard YORK介紹,首先是采用分支預測的6級超標量流水線,因此可同時支持單精度和雙精度浮點單元;二是支持64位的AXI AMBA4互聯,可為高效內存操作提供I-cache與D-cache;三是兼顧實時性、快速的相應能力,支持12個周期的終端延遲。
值得一提的是,Cortex-M7在DSP性能方面進行了大幅優(yōu)化,甚至比熱門的DSP產品更具競爭力。Cortex-M7主要的DSP特征包括:讀取、內存與MAC的平行操作;支持SIMD與單周期MAC;單精度與雙精度浮點單元;最小循環(huán)開銷(分支預測/BTAC);以及優(yōu)化的DSP庫。Richard YORK透露,ARM在規(guī)劃Cortex-M7時,就希望能在某些應用領域用高端MCU取代DSP。Cortex-M7內核除了提供DSP的硬件部分,還配套DSP的軟件服務,ARM Keil工具鏈幫助實現支持Cortex-M7的編制和調試,同時ARM軟件界面也支持底層標準算法和接口,包括DSP優(yōu)化算法。

圖:Cortex-M7方框圖
智能系統架構提升STM32 F7處理性能
Daniel Colonna介紹,STM32 F7意在通過在Cortex-M7內核外圍集成可互連的恰當外設,打造史上智能化程度最高的STM32微控制器。具體而言,STM32 F7采用兩個獨立機制取得零等待執(zhí)行性能:內部閃存采用ST ART Accelerator訪存加速技術;為外部存儲器(或內部存儲器)提供一級高速緩存(4KB指令+4KB數據高速緩存)。AXI和先進高性能總線矩陣(Multi-AHB, Advanced High-performance Bus),內置雙通用直接訪存(DMA)控制器和以太網、通用串行總線On-the-Go高速(USB OTG HS, Universal Serial Bus On-the Go High Speed)和Chrom-ART Accelerator圖形硬件加速等設備專用DMA控制器。此外,具有大容量分布式架構SRAM:在總線矩陣上有320KB共享數據存儲容量(包括240KB +16KB)和保存實時數據的64KB緊耦合存儲器(TCM, Tightly-Coupled Memory)數據RAM存儲器;保存關鍵程序的16KB指令TCM RAM存儲器;在低功耗模式下保存數據的4KB備份SRAM存儲器。
超出人們預期的是,STM32 F7的DSP性能是STM32 F4系列的2倍多,但其能耗并未犧牲。新系列運行模式和低功耗模式(停止、待機和VBAT)的功耗與STM32 F4保在同一水平線上:工作模式能效為7 CoreMarks/mW;在低功耗模式下,當上下文和SRAM內容全都保存時,典型功耗最低120 uA,典型待機功耗為1.7uA,VBAT模式典型功耗為0.1uA。
STM32 F7系列采用ST的90nm嵌入式非易失性存儲器CMOS制造工藝,這一工藝是STM32 F4產品于2011年發(fā)布至今Cortex-M微控制器領域性能最高的制造技術,這也證明了ST正在履行“加快自己及客戶的創(chuàng)新,縮短上市時間”的承諾。隨著ST開始進軍更先進的技術節(jié)點,面向未來的系統架構有更大的空間提高微控制器的性能,據了解,ST的目標是在下一個技術節(jié)點達到2000CoreMark。
評論