<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          ARM C C++內(nèi)存對齊

          作者: 時(shí)間:2016-11-09 來源:網(wǎng)絡(luò) 收藏
          ARM 系列處理器是 RISC++" target="_blank">C++ (Reducded Instruction Set Computing)處理器。很多基于ARM的高效代碼的程序設(shè)計(jì)策略都源于RISC 處理器。和很多 RISC 處理器一樣,ARM 系列處理器的內(nèi)存訪問,也要求數(shù)據(jù)對齊,即存取“字(Word)”數(shù)據(jù)時(shí)要求四字節(jié)對齊,地址的bits[1:0]==0b00;存取“半字(Halfwords)”時(shí)要求兩字節(jié)對齊,地址的bit[0]==0b0;存取“字節(jié)(Byte)”數(shù)據(jù)時(shí)要求該數(shù)據(jù)按其自然尺寸邊界(Natural Size Boundary)定位。

            ARM 編譯程序通常將全局變量對齊到自然尺寸邊界上,以便通過使用 LDR和 STR 指令有效地存取這些變量。這種內(nèi)存訪問方式與多數(shù) CISC (Complex Instruction Set Computing)體系結(jié)構(gòu)不同,在CISC體系結(jié)構(gòu)下,指令直接存取未對齊的數(shù)據(jù)。因而,當(dāng)需要將代碼從CISC 體系結(jié)構(gòu)向 ARM 處理器移植時(shí),內(nèi)存訪問的地址對齊問題必須予以注意。在RISC體系結(jié)構(gòu)下,存取未對齊數(shù)據(jù)無論在代碼尺寸或是程序執(zhí)行效率上,都將付出非常大的代價(jià)。
            本文將從以下幾個(gè)方面討論在ARM體系結(jié)構(gòu)下的程序設(shè)計(jì)問題。
            未對齊的數(shù)據(jù)指針
            C和C++編程標(biāo)準(zhǔn)規(guī)定,指向某一數(shù)據(jù)類型的指針,必須和該類型的數(shù)據(jù)地址對齊方式一致,所以ARM 編譯器期望程序中的 C 指針指向存儲(chǔ)器中字對齊地址,因?yàn)檫@可使編譯器生成更高效的代碼。
            比如,如果定義一個(gè)指向 int 數(shù)據(jù)類型的指針,用該指針讀取一個(gè)字,ARM 編譯器將使用LDR 指令來完成此操作。如果讀取的地址為四的倍數(shù)(即在一個(gè)字的邊界)即能正確讀取。但是,如果該地址不是四的倍數(shù),那么,一條 LDR 指令返回一個(gè)循環(huán)移位結(jié)果,而不是執(zhí)行真正的未對齊字載入。循環(huán)移位結(jié)果取決于該地址向?qū)τ谧值倪吔绲钠屏亢拖到y(tǒng)所使用的端序(Endianness)。例如,如果代碼要求從指針指向的地址 0x8006 載入數(shù)據(jù),即要載入 0x8006、0x8007、0x8008 和 0x8009 四字節(jié)的內(nèi)容。但是,在 ARM 處理器上,這個(gè)存取操作載入了0x8004、0x8005、0x8006 和 0x8007 字節(jié)的內(nèi)容。這就是在未對齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果。
            因而,如果想將指針定義到一個(gè)指定地址(即該地址為非自然邊界對齊),那么在定義該指針時(shí),必須使用 __packed 限定符來定義指針: 例如,
            __packed int *pi; // 指針指向一個(gè)非字對其內(nèi)存地址
            使用了_packed限定符限定之后,ARM 編譯器將產(chǎn)生字節(jié)存取命令(LDRB或STRB指令)來存取內(nèi)存,這樣就不必考慮指針對齊問題。所生成的代碼是字節(jié)存取的一個(gè)序列,或者取決于編譯選項(xiàng)、跟變量對齊相關(guān)的移位和屏蔽。但這會(huì)導(dǎo)致系統(tǒng)性能和代碼密度的損失。
            值得注意的是,不能使用 __packed 限定的指針來存取存儲(chǔ)器映射的外圍寄存器,因?yàn)?ARM 編譯程序可使用多個(gè)存儲(chǔ)器存取來獲取數(shù)據(jù)。因而,可能對實(shí)際存取地址附近的位置進(jìn)行存取,而這些附近的位置可能對應(yīng)于其它外部寄存器。當(dāng)使用了位字段(Bitfield)時(shí), ARM 程序?qū)⒃L問整個(gè)結(jié)構(gòu)體,而非指定字段。

          本文引用地址:http://www.ex-cimer.com/article/201611/317642.htm

          在ARM中,通常希望字單元的地址是字對齊的(地址的低兩位為0b00),半字單元的地址是半字對齊的(地址的最低為0b0).在存儲(chǔ)訪問操作中,如果存儲(chǔ)單元的地址沒有遵守上述的對齊規(guī)則,則稱為非對齊(unaligned)的存儲(chǔ)訪問操作.

          代碼中關(guān)于對齊的隱患,很多是隱式的。比如在強(qiáng)制類型轉(zhuǎn)換的時(shí)候。例如:
          unsigned int i = 0×12345678;
          unsigned char *p=NULL;
          unsigned short *p1=NULL;
          p=&i;
          *p=0×00;
          p1=(unsigned short *)(p+1);
          *p1=0×0000;
          最后兩句代碼,從奇數(shù)邊界去訪問unsignedshort型變量,顯然不符合對齊的規(guī)定。
          在x86上,類似的操作只會(huì)影響效率,但是在MIPS或者sparc上,可能就是一個(gè)error,因?yàn)樗鼈円蟊仨氉止?jié)對齊.

          有部分摘自ARM編譯器文檔對齊部分
          對齊的使用:
          1.__align(num)
          這個(gè)用于修改最高級別對象的字節(jié)邊界。在匯編中使用LDRD或者STRD時(shí)
          就要用到此命令__align(8)進(jìn)行修飾限制。來保證數(shù)據(jù)對象是相應(yīng)對齊。
          這個(gè)修飾對象的命令最大是8個(gè)字節(jié)限制,可以讓2字節(jié)的對象進(jìn)行4字節(jié)
          對齊,但是不能讓4字節(jié)的對象2字節(jié)對齊。
          __align是存儲(chǔ)類修改,他只修飾最高級類型對象不能用于結(jié)構(gòu)或者函數(shù)對象。

          2.__packed
          __packed是進(jìn)行一字節(jié)對齊
          1.不能對packed的對象進(jìn)行對齊
          2.所有對象的讀寫訪問都進(jìn)行非對齊訪問
          3.float及包含float的結(jié)構(gòu)聯(lián)合及未用__packed的對象將不能字節(jié)對齊
          4.__packed對局部整形變量無影響
          5.強(qiáng)制由unpacked對象向packed對象轉(zhuǎn)化是未定義,整形指針可以合法定
          義為packed。
          __packed int* p; //__packed int 則沒有意義
          6.對齊或非對齊讀寫訪問帶來問題
          __packed struct STRUCT_TEST
          {
          char a;
          int b;
          char c;
          } ; //定義如下結(jié)構(gòu)此時(shí)b的起始地址一定是不對齊的
          //在棧中訪問b可能有問題,因?yàn)闂I蠑?shù)據(jù)肯定是對齊訪問[from CL]
          //將下面變量定義成全局靜態(tài)不在棧上
          static char* p;
          static struct STRUCT_TEST a;
          void Main()
          {
          __packed int* q; //此時(shí)定義成__packed來修飾當(dāng)前q指向?yàn)榉菍R的數(shù)據(jù)地址下面的訪問則可以
          p = (char*)&a;
          q = (int*)(p+1);
          *q = 0×87654321;
          /*
          得到賦值的匯編指令很清楚
          ldr r5,0×20001590 ; = #0×12345678
          [0xe1a00005] mov r0,r5
          [0xeb0000b0] bl __rt_uwrite4 //在此處調(diào)用一個(gè)寫4byte的操作函數(shù)

          [0xe5c10000] strb r0,[r1,#0] //函數(shù)進(jìn)行4次strb操作然后返回保證了數(shù)據(jù)正確的訪問
          [0xe1a02420] mov r2,r0,lsr #8
          [0xe5c12001] strb r2,[r1,#1]
          [0xe1a02820] mov r2,r0,lsr #16
          [0xe5c12002] strb r2,[r1,#2]
          [0xe1a02c20] mov r2,r0,lsr #24
          [0xe5c12003] strb r2,[r1,#3]
          [0xe1a0f00e] mov pc,r14
          */
          /*
          如果q沒有加__packed修飾則匯編出來指令是這樣直接會(huì)導(dǎo)致奇地址處訪問失敗
          [0xe59f2018] ldr r2,0×20001594 ; = #0×87654321
          [0xe5812000] str r2,[r1,#0]
          */



          關(guān)鍵詞: ARMCC++內(nèi)存對

          評論


          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();