4G空中接口通用的OFDMA和MIMO技術實現(xiàn)探討
本文將討論其中的前兩項:具體地說,首ff先是介紹如何實現(xiàn)OFDMA的核心DSP算法,然后是被LTE用來實現(xiàn)上行鏈路的新技術,最后簡要介紹用于WiMAX和LTE的MIMO(所有IP方面的內(nèi)容不在本文討論范圍內(nèi))。本文討論的前提條件是采用軟件定義的架構。
OFDM使用大量緊鄰的正交子載波。每個子載波采用傳統(tǒng)的調(diào)制方案(如正交幅度調(diào)制)進行低符號率調(diào)制,其數(shù)據(jù)速率保持與相同帶寬下的傳統(tǒng)單載波調(diào)制方案相同。增強性能的OFDMA技術允許通過給多個用戶分配特殊頻率并共享信道。
采用單載波方案的OFDM的主要優(yōu)點是無需復雜的均衡濾波器就能夠應付多種信道條件。例如,很長的銅線中產(chǎn)生的高頻衰減,窄帶干擾以及由于多徑導致的頻率選擇性衰落。由于OFDM可以看作使用許多慢速調(diào)制的窄帶信號,而不是使用一個快速調(diào)制的寬帶信號,因此信道均衡可以得到簡化。低符號率可以充分利用符號間可提供的保護間隔,從而使得處理時域擴展(time-spreading)成為可能,并能消除碼間干擾(ISI)。
在目前為止的大多數(shù)系統(tǒng)中,如WiFi、16d和16e WiMAX和LTE下行鏈路,核心算法一直是FFT。然而,LTE上行鏈路進行了革新,要求使用更復雜的離散傅里葉變換(DFT)。
所有這些系統(tǒng)不僅需要高速FFT處理,而且要求靈活性。頻增的市場壓力要求供應商發(fā)布的產(chǎn)品兼容較早的標準,但也必須具備足夠的靈活性,以便能通過簡單的軟件升級而升級到最終版本,或者是讓同一個系統(tǒng)支持不同的模式或不同的標準(如用于LTE和WiMAX的公共平臺)。
然而,也可以采用可編程平臺,這種可編程平臺可以在靈活的軟件引擎上高效地實現(xiàn)面向硬件的算法。picoChip公司的高性能PC102就是一個很好的例子,它結合了軟件開發(fā)環(huán)境的面市時間和提取優(yōu)勢以及在算法中采用并行機制帶來的性能優(yōu)勢。
FFT其實就是離散傅里葉變換(DFT)的一種高效實現(xiàn)。對于一個N點DFT來說,直接實現(xiàn)要求N2次復雜的乘法與加法運算,但作為一個提供難以置信的效率增益的完美例子,經(jīng)典的FFT只要求N 有兩種方法可以將DFT減少為一系列更簡單的運算。一種方法是執(zhí)行頻域抽取,另一種方法是執(zhí)行時域抽取。這兩種方法需要相同數(shù)量的復雜乘法和加法運算。兩者的主要區(qū)別是,時域抽取接受數(shù)字翻轉(zhuǎn)的輸入,產(chǎn)生正常順序的輸出,而頻域抽取則接受正常順序的輸入,產(chǎn)生數(shù)字翻轉(zhuǎn)的輸出。輸入和輸出運算由所謂的蝶形運算完成。每個蝶形運算都要將輸入乘上復雜的旋轉(zhuǎn)因子e-j2πn/N。 流水線FFT可以采用對串行輸入流的實時連續(xù)處理進行表征。面向硬件的方法通過盡量減少復雜乘法器的數(shù)量和所需的存儲空間來減少硅片的成本或面積。這樣可以在一定的面積上并行計算更多的單元。 FFT算法涉及到數(shù)據(jù)的暫時分離,這是由蝶形運算執(zhí)行的一項任務。由于樣值要從輸入流中的不同點處獲取,因此流水線FFT需要對數(shù)據(jù)進行緩存和重新排序。目前有許多不同的架構可以解決這個問題。本文的FFT用例采用了標準的radix-4頻域抽取算法。 FFT的picoArray實現(xiàn)方案 picoChip PC102是一款高性能的多核DSP,專門針對無線做過優(yōu)化。它在單個裸片上集成了300多個種類略有不同的處理器(或“陣列單元”):每個處理器均是自帶存儲器的傳統(tǒng)16位哈佛結構DSP,如表1所示。 picoArray編程模型使得組裝流水線結構變得非常容易,這也是實現(xiàn)FFT所用的方法。舉例來說,每個radix-4蝶形運算包括4個復雜的乘法(注意,第4個蝶形運算只包含復雜的加法),并被映射到一個獨立的處理器。每個陣列單元都是從內(nèi)部總線獲取輸入數(shù)據(jù),經(jīng)過處理后再向流水線中的下一個DSP提供輸出。由于總的吞吐量受限于最慢的陣列單元,因此理想情況下陣列單元上的每個環(huán)回都應花相同數(shù)量的周期才能實現(xiàn)最佳的性能。例如,如果每個陣列單元在8個周期內(nèi)處理每個樣值,那么最大吞吐量在160MHz時可達每秒20M個采樣。 FFT實現(xiàn)接收16+j16、左對齊、按順序輸入的數(shù)據(jù),提供16+j16、也按順序的輸出數(shù)據(jù)。在每個蝶形運算中會發(fā)生位增加現(xiàn)象,其中2個位用于加法,16個位用于復雜的乘法,這種位增加在采用就近舍入策略的40位STNA2 AE累加器中很容易管理。這種機制可以保持中間值的最佳可能精度 ,從而達到較高的輸出數(shù)據(jù)信噪比。圖1a顯示了本實現(xiàn)中的單元。 表2總結了PC102上的256點FFT的性能。表2給出了復雜采樣速率在10MSps和80MSps之間的256點FFT所要求的資源,并給出了在PC102上能以每個速率點執(zhí)行的最大FFT數(shù)量。從表中可以看出,單個10MSps FFT需要約1.5%的資源。 從圖1b可以看出如何通過整合“構建模塊”FFT來獲得更高的吞吐量--顯然并行架構是非常適合的。 雖然目前大多數(shù)標準采用OFDM(WiFi、802.16d、Flash OFDM)或OFDMA(802.16e),但LTE選用的上行鏈路發(fā)送機制是最新的SC-FDMA(單載波FDMA),也稱為DFT擴展OFDM。 與傳統(tǒng)OFDMA相比,SC-FDMA的優(yōu)點是信號具有更低的峰值/平均功率比(PAPR),因為它采用了固有的單載波結構。這在上行鏈路中尤其重要,因為在上行鏈路中更低的PAPR可以使移動終端在發(fā)送功效方面得到更大的好處,并進而延長電池使用時間。因此一些人士認為,SC-FDMA“集兩者之大成”,即單載波的低PAPR和多載波的魯棒性。當然,天下沒有免費的午餐,這些好處的代價是增加了數(shù)字處理的復雜性,如上所述。 SC-FDMA上行鏈路的實現(xiàn)如圖2所示,其中DFT位于OFDM調(diào)制器之前,這表明比標準OFDMA要多一些步驟。 眾所周知,如果變換點數(shù)可以分解成少量的數(shù)(素數(shù)),就可以高效地實現(xiàn)DFT。分解時素數(shù)越少,實現(xiàn)越簡單。當然,經(jīng)典FFT使用單個素數(shù)因子2。 LTE中的DFT預編碼器尺寸取決于為指定用戶的上行鏈路數(shù)據(jù)發(fā)送分配的子信道數(shù)量。 其中N是子載波的數(shù)量,a、b和c在 N ≤1320 條件下都大于等于0 (20MHz帶寬時)。對于指定的用戶,N范圍可以從12個音 (a,b,c=0,即單個資源模塊)到1296,總共35個不同的選擇,這些音再一起經(jīng)過調(diào)制形成單載波上行鏈路。然而,這是在手機發(fā)送器側,因為基站接收機要處理許多用戶,每個用戶從這些選項中作出選擇,針對所有可能的幀配置的總允許變換器數(shù)量是531、783、569。這種靈活性顯然增加了接收iDFT的復雜性。 用于分解iDFT的技術是“分而治之”,主要原理與大家熟悉的FFT相同,但iDFT的長列表無法被分解成單個素數(shù)因子。相反,每個音可以被分解成長度為2、3和5的三個短iDFT。這些是iDFT的“引擎”。在本例實現(xiàn)中,一些iDFT已經(jīng)被分解成素數(shù)因子(如4、8和9)以外的其他因子,以便將流水線級的最大數(shù)量減小至3,從而帶來縮短延遲的好處。 圖3顯示了LTE iDFT的邏輯結構,這種結構可用來在PC102/PC20x上實現(xiàn)20MHz的LTE eNodeB。 流水線級必須能夠?qū)崿F(xiàn)所有35種可能的iDFT功能,并動態(tài)地重新配置和避免由于不同長度iDFT同時流過而造成的任何流水線危害。最簡單的架構是重新排序+級緩沖對A、B和C都成為用來實現(xiàn)所有6個iDFT引擎的相同功能塊的實例(如果計算1點iDFT就是7臺引擎,即通過不變)。更優(yōu)化的解決方案確認只有一級需要實現(xiàn)9點引擎,另外一級需要實現(xiàn)8點引擎,第三級需要4點引擎,加上2、3和5個引擎,因為任何iDFT長度都不需要超過一個9、8或4。 使事情復雜化的因素之一是,LTE是一個帶寬可擴展的系統(tǒng)(簡言之,TDD/FDD都是1.25MHz~20MHz)。表3列出了不同模式時的不同實現(xiàn)方式。雖然與FFT相比靈活性有一定的代價(見表2),但值得注意的是,這種架構在實現(xiàn)這些配置時效率仍然特別高:即使所需的20MHz+20MHz FDD(最壞情況)資源也仍只占PC102的10%。 MIMO是指在發(fā)送機和接收機上使用多幅天線以改善通信性能,它是所有4G系統(tǒng)的一個特點。 MIMO不需要增加帶寬或發(fā)送功率就能顯著地提高數(shù)據(jù)吞吐量和鏈路距離,并具有更高的頻譜效率(每秒每赫茲帶寬可傳更多的位)和鏈路可靠性或空間分集性能(降低了衰落)。 發(fā)送(TX)端有m幅天線,接收(RX)端有n幅天線,就形成了一個mn的MIMO,此時信道的數(shù)量就等于所有組合之和:例如一個22的MIMO就有4個“信道”(1-1,1-2,2-1,2-2),性能將達到SISO系統(tǒng)中香農(nóng)極限值的兩倍。你只能從4個“信道”中發(fā)送2倍的信息,因為你需要“解開”信道矩陣才能提取信息。在實際應用中,信道不是完全獨立的(存在一定的相關性),因此優(yōu)勢有所降低。事實上有個似是而非的結論,即信道越差(更多的多徑等),MIMO的用處就越大,因為信道相關性越少。在自由空間中,由于4個信道非常相似,因此帶來的好處非常有限。 MIMO有多種不同的使用方式。拿WiMAX下行鏈路來說,它有兩種標準的MIMO模式:Matrix A和Matrix B。前者也被稱為空間時間編碼(STC),它通過兩幅發(fā)射天線以不同的形式發(fā)送相同的信號。由于發(fā)送的是相同的符號,數(shù)據(jù)速率在SISO上不會提高,但由于兩種形式(s和-s*)不同,接收機有更好的機會恢復數(shù)據(jù),因此魯棒性和范圍(針對指定的數(shù)據(jù)速率)得到了改善。為了在下行鏈路中實現(xiàn)這一技術,雖然符號率塊不受影響(發(fā)送的一個符號),但現(xiàn)在有兩個突發(fā)鏈(burst chain),它們用不同調(diào)制形式的信息饋送到兩幅天線。 Matrix B則相反,它通過發(fā)送兩個不同的符號來獲得雙倍的數(shù)據(jù)速率。在這種情況下,共有兩個突發(fā)鏈(針對兩幅天線),每個鏈處理獨立的符號;在實際應用中,它將不是簡單的復制,而是符號率部分將被設計得更加快速,然后將輸出信號交替發(fā)送給兩個TX分支。實際系統(tǒng)同時支持兩種模式,可以根據(jù)每個用戶要求選擇Matrix A或B:向條件較好的系統(tǒng)以較快的速度發(fā)送數(shù)據(jù),而使用STC能使蜂窩邊緣的系統(tǒng)受益。 這非常適合多核架構。如圖4所示,有兩個獨立的突發(fā)鏈饋送倒兩幅天線:同樣的架構被簡單地例示了兩次,這對工程師來說非常簡單。這個特殊的圖實際上稍微有些復雜,在實際應用中,許多系統(tǒng)都結合使用MIMO和多種空間技術,如波束成形、“調(diào)零”(null-steering)天線或SDMA。這個特殊設計共有8幅天線,配置為每個MIMO分支4幅,每個天線都可以獨立控制。 在接收機側,信號處理相對更加復雜:不僅因為Matrix B有更高的峰值數(shù)據(jù)速率,而且用于區(qū)分不同信號的接收機特別復雜。 本文小結 空中接口正變得越來越復雜,并且依賴于更復雜的算法才能獲得最佳的性能、效率和范圍。基于FFT的OFDMA已經(jīng)成為下一代無線的標準技術。但最新的技術,如LTE,也在尋求做出更多的改善:它們采用更復雜的技術,如SC-FDMA,并要求靈活的DFT技術。 我們可以使用軟件可編程架構來模仿面向硬件的折中所具有的優(yōu)勢和靈活性,引導系統(tǒng)制造商更早地進入需要WiMAX和LTE等算法的市場。這樣就能讓他們比競爭對手更早地推出產(chǎn)品,并仍確保與標準的兼容。事實上,一個合適的架構可以實現(xiàn)從一個公共平臺開始的所有標準(如802.16d/e和LTE,以及下一代PHS或UMB)。擴展這種架構以支持MIMO相對比較簡單。
表1:PC102處理器變化和存儲器分布(*FFT的最大數(shù)量受限于可用MEM類AE的數(shù)量)。
圖1b:FFT內(nèi)部單元;并行FFT可實現(xiàn)LTE上行鏈路要求的更高吞吐量DFT。
表2:picoArray上的OFDMA采用的256點 16+j16 FFT的資源使用。
圖2:SC-FDMA或DFT擴展OFDM。
圖3:LTE iDFT庫結構。
表3:picoArray上可擴展iDFT的資源使用。
圖4:具有兩個獨立突發(fā)鏈的MIMO下行鏈路系統(tǒng)。
評論