ARMCC和GCC編譯ARM代碼的軟浮點(diǎn)和硬浮點(diǎn)問(wèn)題

作者：時(shí)間：2016-11-10 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

本文介紹了ARM代碼編譯時(shí)的軟浮點(diǎn)(soft-float)和硬浮點(diǎn)(hard-float)的編譯以及鏈接實(shí)現(xiàn)時(shí)的不同。從VFP浮點(diǎn)單元的引入到軟浮點(diǎn)(soft-float)和硬浮點(diǎn)(hard-float)的概念，然后是在GCC和ARMCC RVCT工具鏈下的具體編譯參數(shù)。

VFP (vector floating-point)

從ARMv5開(kāi)始，就有可選的Vector Floating Point (VFP)模塊，當(dāng)然最新的如Cortex-A8,Cortex-A9和Cortex-A5可以配置成不帶VFP的模式供芯片廠商選擇。VFP經(jīng)過(guò)若干年的發(fā)展，有VFPv2 (一些ARM9/ARM11)、VFPv3-D16（只使用16個(gè)浮點(diǎn)寄存器，默認(rèn)為32個(gè)）和VFPv3+NEON (如大多數(shù)的Cortex-A8芯片)。對(duì)于包含NEON的ARM芯片，NEON一般和VFP公用寄存器。

本文引用地址：http://www.ex-cimer.com/article/201611/317415.htm

硬浮點(diǎn)Hard-float

編譯器將代碼直接編譯成發(fā)射給硬件浮點(diǎn)協(xié)處理器（浮點(diǎn)運(yùn)算單元FPU）去執(zhí)行。FPU通常有一套額外的寄存器來(lái)完成浮點(diǎn)參數(shù)傳遞和運(yùn)算。使用實(shí)際的硬件浮點(diǎn)運(yùn)算單元FPU當(dāng)然會(huì)帶來(lái)性能的提升。因?yàn)橥粋€(gè)浮點(diǎn)的函數(shù)調(diào)用需要幾個(gè)或者幾十個(gè)時(shí)鐘周期。

軟浮點(diǎn) Soft-float

編譯器把浮點(diǎn)運(yùn)算轉(zhuǎn)換成浮點(diǎn)運(yùn)算的函數(shù)調(diào)用和庫(kù)函數(shù)調(diào)用，沒(méi)有FPU的指令調(diào)用，也沒(méi)有浮點(diǎn)寄存器的參數(shù)傳遞。浮點(diǎn)參數(shù)的傳遞也是通過(guò)ARM寄存器或者堆棧完成?，F(xiàn)在的Linux系統(tǒng)默認(rèn)編譯選擇使用hard-float，即使系統(tǒng)沒(méi)有任何浮點(diǎn)處理器單元，這就會(huì)產(chǎn)生非法指令和異常。因而一般的系統(tǒng)鏡像都采用軟浮點(diǎn)以兼容沒(méi)有VFP的處理器。

armel和armhf ABI
在armel中，關(guān)于浮點(diǎn)數(shù)計(jì)算的約定有三種。以gcc為例，對(duì)應(yīng)的-mfloat-abi參數(shù)值有三個(gè)：soft,softfp,hard。soft是指所有浮點(diǎn)運(yùn)算全部在軟件層實(shí)現(xiàn)，效率當(dāng)然不高，會(huì)存在不必要的浮點(diǎn)到整數(shù)、整數(shù)到浮點(diǎn)的轉(zhuǎn)換，只適合于早期沒(méi)有浮點(diǎn)計(jì)算單元的ARM處理器；softfp是目前armel的默認(rèn)設(shè)置，它將浮點(diǎn)計(jì)算交給FPU處理，但函數(shù)參數(shù)的傳遞使用通用的整型寄存器而不是FPU寄存器；hard則使用FPU浮點(diǎn)寄存器將函數(shù)參數(shù)傳遞給FPU處理。需要注意的是，在兼容性上，soft與后兩者是兼容的，但softfp和hard兩種模式不兼容。默認(rèn)情況下，armel使用softfp，因此將hard模式的armel單獨(dú)作為一個(gè)abi，稱(chēng)之為armhf。而使用hard模式，在每次浮點(diǎn)相關(guān)函數(shù)調(diào)用時(shí)，平均能節(jié)省20個(gè)CPU周期。對(duì)ARM這樣每個(gè)周期都很重要的體系結(jié)構(gòu)來(lái)說(shuō)，這樣的提升無(wú)疑是巨大的。在完全不改變?cè)创a和配置的情況下，在一些應(yīng)用程序上，使用armhf能得到20%——25%的性能提升。對(duì)一些嚴(yán)重依賴(lài)于浮點(diǎn)運(yùn)算的程序，更是可以達(dá)到300%的性能提升。

Soft-float和hard-float的編譯選項(xiàng)

在CodeSourcery gcc的編譯參數(shù)上，使用-mfloat-abi=name來(lái)指定浮點(diǎn)運(yùn)算處理方式。-mfpu=name來(lái)指定浮點(diǎn)協(xié)處理的類(lèi)型?？蛇x類(lèi)型如fpa，fpe2，fpe3，maverick，vfp，vfpv3，vfpv3-fp16，vfpv3-d16，vfpv3-d16-fp16，vfpv3xd，vfpv3xd-fp16，neon，neon-fp16，vfpv4，vfpv4-d16，fpv4-sp-d16，neon-vfpv4等。使用-mfloat-abi=hard (等價(jià)于-mhard-float)-mfpu=vfp來(lái)選擇編譯成硬浮點(diǎn)。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實(shí)現(xiàn)，運(yùn)行時(shí)的連接器ld.so會(huì)在執(zhí)行浮點(diǎn)運(yùn)算時(shí)對(duì)于運(yùn)算單元的選擇，是直接的硬件調(diào)用還是庫(kù)函數(shù)調(diào)用，是執(zhí)行/lib還是/lib/vfp下的libm。-mfloat-abi=soft （等價(jià)于-msoft-float）直接調(diào)用軟浮點(diǎn)實(shí)現(xiàn)庫(kù)。

在ARM RVCT工具鏈下，定義fpu模式：

? --fpu softvfp
? --fpu softvfp+vfpv2
? --fpu softvfp+vfpv3
? --fpu softvfp+vfpv_fp16
? --fpu softvfp+vfpv_d16
? --fpu softvfp+vfpv_d16_fp16.

定義浮點(diǎn)運(yùn)算類(lèi)型

--fpmode ieee_full :所有單精度f(wàn)loat和雙精度double的精度都要和IEEE標(biāo)準(zhǔn)一致，具體的模式可以在運(yùn)行時(shí)動(dòng)態(tài)指定；

--fpmode ieee_fixed：舍入到最接近的實(shí)現(xiàn)的IEEE標(biāo)準(zhǔn)，不帶不精確的異常；

--fpmode ieee_no_fenv：舍入到最接近的實(shí)現(xiàn)的IEEE標(biāo)準(zhǔn)，不帶異常；

--fpmode std：非規(guī)格數(shù)flush到0、舍入到最接近的實(shí)現(xiàn)的IEEE標(biāo)準(zhǔn)，不帶異常；

--fpmode fast：更積極的優(yōu)化，可能會(huì)有一點(diǎn)精度損失。

一個(gè)浮點(diǎn)軟鏈接實(shí)現(xiàn)的匯編例子

IMPORT __softfp_cos

BL __softfp_cos

ARMCC fplib浮點(diǎn)運(yùn)算庫(kù)

__aeabi_dadd 浮點(diǎn)double類(lèi)型數(shù)據(jù)的加法，__aeabi_fdiv 單精度浮點(diǎn)除法。

附錄：常見(jiàn)的芯片和VFP配置

Partial reference of SoC and supported ISAs

Manufacturerhttp://houh-1984.blog.163.com/	SoC	architecture	VFP	SIMD	Notes
Freescale	iMX5x	armv7	VFPv3	NEON	Cortex-A8;NEONonly reliable in Tape-Out 3 or above
Nvidia	Tegra2	armv7	VFPv3 D16	none
Marvell	Dove	armv7	VFPv3 D16	iwMMXt
Texas Instruments	OMAP3xxx	armv7	VFPv3	NEON	Cortex-A8
Texas Instruments	OMAP4xxx	armv7	VFPv3	NEON	Cortex-A9
Texas Instruments	OMAP5xxx	armv7	VFPv4	NEON	Cortex-A15(ARMv7-A) +Cortex-M4(ARMv7-ME)
Qualcomm	Snapdragon	armv7	VFPv3	NEON[1]	Qualcomm "Scorpion" core
Samsung	S5PC100	armv7	VFPv3	NEON	Cortex-A8
Allwinner	A1x	armv7	VFPv3	NEON	Cortex-A8

本文介紹了ARM代碼編譯時(shí)的軟浮點(diǎn)(soft-float)和硬浮點(diǎn)(hard-float)的編譯以及鏈接實(shí)現(xiàn)時(shí)的不同。從VFP浮點(diǎn)單元的引入到軟浮點(diǎn)(soft-float)和硬浮點(diǎn)(hard-float)的概念，然后是在GCC和ARMCC RVCT工具鏈下的具體編譯參數(shù)。

新聞中心