破解超低功耗智能設(shè)備用MCU難題,ST新一代U5靠什么制勝?
隨著可穿戴、個(gè)人醫(yī)療、家庭自動(dòng)化和工業(yè)傳感器等智能設(shè)備的增長,對(duì)低功耗、高性能、高安全性的MCU(微控制器)的需求日益提升。今年3月,意法半導(dǎo)體(ST)在其經(jīng)典的超低功耗L系列基礎(chǔ)上,推出了新一代產(chǎn)品線——STM32U5。其在安全方面,成為首款獲得PSA和SESIP 3級(jí)認(rèn)證的MCU。
本文引用地址:http://www.ex-cimer.com/article/202110/429044.htmU5的制勝法寶是什么?不久前,ST中國區(qū)微控制器事業(yè)部市場及應(yīng)用總監(jiān)曹錦東、ST中國區(qū)微控制器產(chǎn)品市場經(jīng)理彭祖年向電子產(chǎn)品世界等媒體揭開了廬山真面目及下一步規(guī)劃。
ST中國區(qū)微控制器事業(yè)部市場及應(yīng)用總監(jiān)曹錦東(左),ST中國區(qū)微控制器產(chǎn)品市場經(jīng)理彭祖年
1 U5的3個(gè)特點(diǎn)
STM32U5的定義是一個(gè)低功耗旗艦級(jí)產(chǎn)品線,最大的3個(gè)特點(diǎn):①超低功耗。②在超低功耗平臺(tái)上提升了性能,是基于高性能和超低功耗兩者結(jié)合的集合。③增強(qiáng)了安全可靠方面的功能,適合IoT應(yīng)用。
U5是在STM32L5基礎(chǔ)上發(fā)展起來的。L5是基于L4和U5中間的產(chǎn)品線(如下圖)。L5是ST第1顆基于Cortex-M33的產(chǎn)品線,采用了特殊的工藝,可謂是U5和L4之間的橋梁——確保的一些功能應(yīng)用起來。
圖 U5在STM32中的定位
今后的新產(chǎn)品會(huì)主要基于U5拓展。經(jīng)典的低功耗系列L4不會(huì)繼續(xù)發(fā)展,因?yàn)長4是基于90 nm工藝的;L0會(huì)繼續(xù)生產(chǎn),但也沒有更多的產(chǎn)品線延伸出來。但是客戶可以放心,ST官網(wǎng)承諾所有產(chǎn)品線未來10年都可以繼續(xù)供貨。
具體地,為了研制U5產(chǎn)品線,ST內(nèi)部花了漫長的時(shí)間在研發(fā),創(chuàng)新不僅在工藝(注:達(dá)到40nm),在IP還包括整個(gè)架構(gòu)的設(shè)計(jì),使該低功耗產(chǎn)品線能夠支持到現(xiàn)在的消費(fèi)電子、可穿戴以及工業(yè)控制領(lǐng)域。
2 為何功耗更低?
U5對(duì)超低功耗和高性能有很好的結(jié)合。其節(jié)能成績單如下圖。這是在第三方EEMBC ULP Benchmark上面得到的測(cè)試結(jié)果。該測(cè)試結(jié)果不僅包含了運(yùn)行狀態(tài)下對(duì)性能的評(píng)估,同時(shí)也將芯片在各種模式下的功耗水平綜合體現(xiàn)出來。
圖 STM32U5 ULP BENCH節(jié)能成績單
這里糾正一個(gè)偏見:很多用戶可能會(huì)比較關(guān)注超低功耗產(chǎn)品的μA/MHz參數(shù),但該參數(shù)是在運(yùn)行狀態(tài)下,以及特定場景中針對(duì)CPU耗電量的評(píng)估,并不能代表系統(tǒng)整體的功耗水平。為了實(shí)現(xiàn)低功耗,我們要看什么應(yīng)用方向,該應(yīng)用方向里它需要什么外設(shè)的工作,所需要系統(tǒng)采用的功耗模式該怎么做?例如手表,佩戴后一直在采樣數(shù)據(jù),抬手時(shí)就要顯示數(shù)據(jù),但可能平常走路時(shí)沒有抬手,就沒有顯示,CPU是睡眠的。再例如,有些表計(jì)用CPU每個(gè)月只要醒幾次就可以了,但是外設(shè)也一直在做數(shù)據(jù)的采集。所以不同模式的功耗不一樣。
所以,如何參考系統(tǒng)整體功耗水平,可以將目光轉(zhuǎn)移到ULP Benchmark的評(píng)比上,它會(huì)針對(duì)不同的測(cè)試狀況,去綜合評(píng)估系統(tǒng)的運(yùn)行性能、運(yùn)行功耗、休眠狀態(tài)和喚醒時(shí)的功耗。在一些測(cè)試的項(xiàng)目中,還會(huì)包括針對(duì)芯片外設(shè)功耗的評(píng)估。與前幾代STM32 L系列超低功耗產(chǎn)品線進(jìn)行對(duì)比后,可見U5系列已經(jīng)達(dá)到了240DMIPS和651Coremark的性能評(píng)分(如下圖)。同時(shí),為了進(jìn)一步挖掘U5性能的潛力,U5上還有數(shù)學(xué)運(yùn)算加速器、ART加速器等單元,以輔助和加速整個(gè)芯片內(nèi)部運(yùn)算系統(tǒng)的效率。
其設(shè)計(jì)難點(diǎn)在于:對(duì)于STM32,從過去的L1到L0、L4、L5,①ST有最新的工藝,從過去的110nm到90nm,直到現(xiàn)在的40nm工藝,可能工藝本身也會(huì)帶來動(dòng)態(tài)功耗的節(jié)約。然而,靜態(tài)功耗卻是相反的,這是兩個(gè)相悖的數(shù)據(jù)。②外設(shè)方面也做了更精確的設(shè)計(jì),這是系統(tǒng)性的問題。
綜合以上兩點(diǎn),ST一直對(duì)低功耗產(chǎn)品、對(duì)客戶的用戶體驗(yàn)以及能不能達(dá)到他整個(gè)系統(tǒng)低功耗的性能還是很有信心的??梢钥吹剑琔5的系統(tǒng)復(fù)雜性比以往更高,要保持同樣的主頻上,功耗要更低其實(shí)是很難的挑戰(zhàn)。
1)10年余年的超低功耗歷史
此次U5的誕生將繼續(xù)延續(xù)ST超低功耗MCU產(chǎn)品路線(如下圖)。ST超低功耗產(chǎn)品線一直以來是STM32非常重要的產(chǎn)品線,是戰(zhàn)略性的產(chǎn)品線。ST自2007年發(fā)布第一款基于Cortex-M內(nèi)核的通用單片機(jī)之后,通過2年時(shí)間的打造,將Cortex-M系列的單片機(jī)擴(kuò)展到了超低功耗領(lǐng)域)。從2009年開始,ST陸續(xù)迭代推出了一代代的超低功耗的產(chǎn)品平臺(tái),其中包括入門級(jí)的STM32L0,以及基于Cortex-M4系列的L4系列產(chǎn)品。STM32L4+是一款在中國智能運(yùn)用手表市場創(chuàng)造出奇跡的一款明星級(jí)產(chǎn)品。
2)U5新的低功耗特性
● 休眠模式下仍可工作
針對(duì)低功耗,STM32U5有一個(gè)特殊的功能:低功耗后臺(tái)的自主模式。即當(dāng)芯片進(jìn)入低功耗模式時(shí),CPU是需要斷電的,但產(chǎn)品外面可能還會(huì)搭載很多的傳感器。這些傳感器的數(shù)據(jù)可能會(huì)實(shí)時(shí)地輸入到主控芯片這一側(cè)。通常情況下,該傳感器的數(shù)據(jù)傳輸是需要系統(tǒng)或CPU來進(jìn)行數(shù)據(jù)處理,但U5設(shè)置了一個(gè)獨(dú)特的外設(shè),可以將很多通用接口包括I2C、SPI、串口、ADC等外設(shè)上的數(shù)據(jù),在不喚醒CPU的情況下,搬運(yùn)至MCU內(nèi)部一塊SRAM4,約有16kB的空間。當(dāng)這些數(shù)據(jù)累計(jì)到一定數(shù)量時(shí),ST再喚醒Cortex-M33內(nèi)核進(jìn)行一次性的批處理。
這里帶來的體驗(yàn)是:不需要頻繁地喚醒CPU,只使能外設(shè),其功耗是非常低的。因?yàn)閺耐獠康膫鞲衅鳙@取數(shù)據(jù),避免了中間頻繁的喚醒。ST做了大概的測(cè)試,類似于經(jīng)典數(shù)據(jù)采集以及喚醒處理的模型,大約可將CPU喚醒的次數(shù)降為原來的1/10。所以,可以看到下圖灰色虛線框,就是節(jié)省的能耗。
圖 讓功耗降低至1/10
在芯片內(nèi)部功耗管理下面,有更多靈活的功耗模式可供客戶選擇。其中一個(gè)經(jīng)典的應(yīng)用場景是Stop模式,同時(shí)保存部分SRAM或全部SRAM中的數(shù)據(jù)。這樣的狀態(tài)下,功耗是個(gè)位數(shù)的μA級(jí)。
● U5芯片上更多省電的小技巧
可以通過內(nèi)置的SMPS降低CPU的內(nèi)核供電電壓。
在不同功耗模式下切換,也可以達(dá)到μs級(jí)的切換速度。
SRAM和Flash都可以讓用戶自己去選擇究竟可以保留多少的空間,這樣用戶可以根據(jù)自己實(shí)際應(yīng)用情況來進(jìn)一步避免不必要的能量損失。值得一提的是,內(nèi)部的Flash是雙bank設(shè)計(jì)的,可將不常用的bank在低功耗模式下把它斷電,這樣它的功耗可以節(jié)省40μA左右。但是當(dāng)指令跳轉(zhuǎn)到被斷電的Flash Bank上時(shí),系統(tǒng)是可以自動(dòng)喚醒的,只需要等待5μs的延時(shí)?;蛘呖梢园褍?nèi)部的Flash通過損失一些讀取速度的方式去讓它進(jìn)入一種低功耗的模式,大概可以減少系統(tǒng)45μA的能耗。
可見,結(jié)合多種多樣的低功耗模式的設(shè)計(jì),以及更多的省電小技巧,只要用戶能夠去玩轉(zhuǎn)STM32U5中這些小設(shè)計(jì),就可以將功耗管理做到極致。
圖 U5的超低功耗考慮因素
3 為何安全性達(dá)到L3級(jí)?
U5是第一款通過PSA和SESIP 3級(jí)認(rèn)證的MCU。
1)如何實(shí)現(xiàn)L3級(jí)?
U5設(shè)計(jì)了層層的保護(hù)。首先,它是基于Cortex-M33的內(nèi)核,天生支持TrustZone這種隔離架構(gòu)。然而,僅有內(nèi)核的隔離/ TrustZone的支持是不夠的,U5還針對(duì)內(nèi)部的存儲(chǔ)、總線以及外設(shè)做了隔離配置的設(shè)計(jì)。除了隔離之外,還增加了更多的安全加密的功能,以及全程可控的多層保護(hù)狀態(tài)機(jī)。存儲(chǔ)保護(hù)也做了全新的更新,針對(duì)內(nèi)部存儲(chǔ)防篡改,增加了OTP的空間,還有更多的主動(dòng)式防侵犯的active tamper的設(shè)計(jì)等。在這樣的完整的安全設(shè)計(jì)下,ST的Secure Boot安全啟動(dòng)也可以讓用戶的安全架構(gòu)設(shè)計(jì)能獲得穩(wěn)定的信任根。最終,U5的產(chǎn)品可以通過PSA Level3的認(rèn)證。這也是目前所有STM32產(chǎn)品中首款可以通過三級(jí)安全認(rèn)證的產(chǎn)品。
U5還可以提供安全固件加載功能。很多用戶把自己的軟件設(shè)計(jì)好之后,可能不會(huì)將生產(chǎn)環(huán)節(jié)放在自己的公司里,而是授權(quán)第三方公司,在第三方公司里實(shí)現(xiàn)PCB的貼板、固件的燒錄以及最終的組裝這樣的生產(chǎn)流程。該流程下,由于授權(quán)的第三方是不在監(jiān)控范圍下的,所以無法保證固件在遠(yuǎn)程生產(chǎn)燒錄過程中的安全性。ST通過內(nèi)部的SFI(安全固件加載)生產(chǎn)流程,可以幫助用戶在第三方的燒錄環(huán)境下,嚴(yán)格控制燒錄固件的安全和燒錄數(shù)量的控制。
2)什么樣的客戶會(huì)用到L2、L3?
L2主要針對(duì)的攻擊主要來自網(wǎng)絡(luò)的,或者產(chǎn)品聯(lián)網(wǎng)之后,通過一些軟件的方式來竊取芯片內(nèi)部的一些信息。但L3會(huì)實(shí)現(xiàn)邊界攻擊的防御(side channel attack),例如把產(chǎn)品拿到實(shí)驗(yàn)室里,針對(duì)產(chǎn)品硬件周邊,但不是破壞性的,只是在產(chǎn)品工作時(shí),通過它周邊的一些側(cè)面信息。
因?yàn)楹芏嗟膽?yīng)用是基于硬件進(jìn)行攻擊的,例如POS機(jī)等安全交易系統(tǒng)容易遭到外界的,例如大電流干擾,讓它的一些數(shù)據(jù)能夠流出來或者讓它整個(gè)系統(tǒng)有所崩潰。如果有很好的防外面硬件的攻擊,該系統(tǒng)會(huì)很安全。
在U5中, AES(高級(jí)加密標(biāo)準(zhǔn))的模塊單元可以抵御邊界攻擊。但L5中,ST沿用的還是傳統(tǒng)的、普通的AES,無法抵御邊界攻擊。
現(xiàn)在在L3之上還會(huì)有更高的安全等級(jí)要求,但需要做到更多的物理隔離,包括類似防開蓋的設(shè)計(jì)在里面。通常情況下,是Security Element才能達(dá)到的級(jí)別。
4 存儲(chǔ)容量更大,主頻更高
作為新一代旗艦產(chǎn)品,U5在高性能方面的特點(diǎn)是存儲(chǔ)容量更大,主頻更高。
1)容量更大
作為ST超低功耗系列的旗艦產(chǎn)品,U5會(huì)覆蓋到從128Kb一直到4Mb的Flash范圍。U5家族中的第一個(gè)成員STM32U575和STM32U585基本覆蓋了512Kb以上一直到2M 的Flash需求的空間。未來還會(huì)推出更大容量版本的STM32U5系列,以及更小、更精簡的低成本U5的產(chǎn)品。
U5的規(guī)劃是,下一步很快面市4Mb Flash MCU,更多的是面向可穿戴/手表類產(chǎn)品。因?yàn)樵诳纱┐鳟a(chǎn)品里,需要更多地讓客戶存儲(chǔ)其程序及數(shù)據(jù)等,因此要擴(kuò)展更多的memory。對(duì)于一些更小的memory,未來會(huì)增加IoT相關(guān)的應(yīng)用特性,因?yàn)檫@些應(yīng)用的程序量沒有那么大,成本方面需要更加有有效性。
2)主頻更高
U5達(dá)到160MHz,手表用戶需要那么高的主頻嗎?實(shí)際上,從ST現(xiàn)在接觸手表客戶的反饋來看,認(rèn)為160MHz還不夠,客戶對(duì)性能有很多的追求,因?yàn)樗麄冏非蟮氖钱嬅娴牧鲿扯群筒僮魇直頃r(shí)的順滑度。現(xiàn)在屏幕的分辨率越來越高,有些手表開始用視網(wǎng)膜屏了,其像素顆粒度需要非常精細(xì),因此單位面積下的分辨率會(huì)越來越高。
與此同時(shí),這對(duì)低功耗產(chǎn)品其實(shí)是非常大的挑戰(zhàn)。因?yàn)樾阅茉礁?,功耗自然越大。今天用戶可以自己配置CPU的速度,或者μA/MHz是指系統(tǒng),例如160MHz的能力,但如果運(yùn)行24MHz,從CPU功耗上可以直接看到一個(gè)線性的下降,可見較低主頻的更低功耗是完全沒有問題的。
可穿戴產(chǎn)品非常注重性能,傳統(tǒng)的做電表、水表的MCU,也不能滿足做手表的需求的。特別是U5下一代產(chǎn)品線,從性能上要兼顧至少兩個(gè)維度的,①圖形軟件引擎,有的MCU廠商用第三方的產(chǎn)品,但ST收購了一家能做屏顯示和接口的軟件公司——Draupner Graphics;②ST把客戶的部分性能需求通過特定的IP,以硬件的形式集成在MCU里。例如硬件顯示加速的效果,電腦叫GPU graphic引擎, U5增加了一個(gè)相關(guān)IP,以支持2.5D的加速器。
5 集成音頻數(shù)字濾波器、輕量級(jí)AI的用途
U5中的ADF(語音活動(dòng)檢測(cè))只做語音喚醒。當(dāng)芯片處于休眠狀態(tài)下,但麥克風(fēng)還是在工作的,麥克風(fēng)檢測(cè)到聲音之后傳遞到該模塊來,搬運(yùn)到STM32U5里去。當(dāng)數(shù)據(jù)達(dá)到一定數(shù)據(jù)量之后,讓CPU重新處理一次。可以用于手表/穿戴類產(chǎn)品里的語音喚醒。
圖 U5可支持的外設(shè)
但是U5做不了語音識(shí)別。語音識(shí)別要傳到云端,需要大數(shù)據(jù)支持。ST將來更多的是嵌入式端的。目標(biāo)是固定范圍之內(nèi)的,例如檢測(cè)電機(jī)控制的噪聲,根據(jù)噪聲判斷電機(jī)是否正常;還有進(jìn)行數(shù)字的識(shí)別,例如有的客戶在做讀表器,因?yàn)槔鲜降乃砗茈y改造,這時(shí),可以在上面放了一個(gè)簡單視覺芯片,把圖形數(shù)字轉(zhuǎn)換成可識(shí)別的數(shù)字,然后上傳到云端。
因此,U5等STM32系列MCU提到的AI是輕量級(jí)的AI。可能做不了學(xué)習(xí),需要預(yù)先訓(xùn)練好模型,之后可以用它來做處理。基本上它是通過服務(wù)器把模型確定好放到該MCU里來做;這部分需要通過Cube AI的工具,把程序重新轉(zhuǎn)換(因?yàn)榉?wù)器云端的AI算法、語言在MCU上不通用),這時(shí)ST的Cube AI的工具可以幫助用戶在一些音視頻系統(tǒng)預(yù)先訓(xùn)練好該模型,檢測(cè)一些文字和一些圖片。
6 未來發(fā)展方向
ST在2007年發(fā)布第1個(gè)STM32到現(xiàn)在,迄今出貨量已達(dá)20億顆。STM32一直秉承“釋放你的創(chuàng)造力”的口號(hào),來驅(qū)動(dòng)產(chǎn)品的推出,以給用戶提供更多的選擇。
回顧10多年的發(fā)展歷程,從過去STM32F系列,延展到低功耗L系列、高性能H系列,又延展到無線W系列,以及最新的G系列,即針對(duì)工業(yè)控制的主要硬件產(chǎn)品線,之后,ST發(fā)布了基于STM32的MPU,今年在L基礎(chǔ)上發(fā)布了U系列。
STM32已從高性能到低功耗以及到MPU全覆蓋。未來在無線方面還會(huì)有更多的發(fā)力,并注入AI的IP機(jī)制,讓用戶可以實(shí)現(xiàn)AI的功能或者運(yùn)用AI的算法。為此,ST在2020年及2021年的大部分收購聚焦在無線產(chǎn)品以及AI相關(guān)的方面。
評(píng)論