STM32L476 FPU 執(zhí)行效率之比較淺析
本應(yīng)用筆記基于STM32L4">STM32L476平臺,通過實際測量來評定使能FPU">FPU時浮點運算效率的情況。
2.測試工具
STM32L476 Nucleo,示波器
3.測試方法
MCU 運行頻率設(shè)置為16MHz,根據(jù)下面公式1 做N次浮點運算,分使能FPU和禁止FPU兩種情況,測試完成相同運算所需要的時間。在例程中通過翻轉(zhuǎn)IO PB13 來標(biāo)定完成運算所需要的時間。
3.1 測試代碼
根據(jù)公式1,分別定義A、B、C 三個常量,如下:
/* Private constants---------------------------------------------------------*/
#define A_CONSTANT(0.285f)
#define B_CONSTANT(0.443f)
#define C_CONSTANT(0.698f)
根據(jù)公式做對應(yīng)的運算并通過GPIOC Pin0 輸出,測定對應(yīng)消耗時間:
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_SET);
temp = A_CONSTANT*x*x +B_CONSTANT*x + C_CONSTANT;
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_RESET);
3.2 代碼分析
根據(jù)測試用的一元二次方程,經(jīng)過IAR 編譯后,匯編結(jié)果如下:
3.2.1 FPU 使能
從匯編代碼可以看出,使能FPU 的情況下,完成一元二次方程的運算只需要7 條單周期指令,總共耗時為7 個Clock 周期。通過IAR 的方針模式運行,需要的CPU cycles 為7.
3.2.2 FPU 禁止
從匯編代碼可以看出,未使能FPU 的情況下,完成該一元二次方程的運算需要執(zhí)行14 條指令,其中包括3 條兩周期指令,6 條單周期指令,5 條程序跳轉(zhuǎn)指令。通過IAR 的方針模式運行,需要的CPU cycles 為207.
4.測試數(shù)據(jù)及結(jié)論
IO完成兩次翻轉(zhuǎn)耗時6.48 uS;
使能FPU 時,除去IO 翻轉(zhuǎn)耗時,完成一次運算時間為6.52 uS(13 uS -6.48 uS),
如下圖示:
禁止FPU 時,除去IO 翻轉(zhuǎn)耗時,完成一次運算時間為87.4 uS(93.88 uS -6.48 uS),如下圖示:
小結(jié)下,根據(jù)上面相關(guān)測試數(shù)據(jù)大致可得出如下結(jié)論:
• 完成同樣的一元二次方程運算,禁止FPU時所消耗的時間約為使能FPU時消耗時間的13.4 倍左右。
評論