利用高效的編程技術發(fā)揮多內核架構優(yōu)勢
在低端嵌入式領域,單內核解決方案仍然存在。通過采用速度更快或帶寬更寬的處理器仍有可能提升系統(tǒng)的功能和性能曲線。在高端領域,多內核是必然的發(fā)展方向。這正是雙精度浮點算法經常出現并在超級計算機中長盛不衰的原因。事實上,臺式機和機架安裝系統(tǒng)(比如Nvidia的產品)正在將這種處理能力普及化。
在討論軟件和多內核架構時經常提及的另一個問題是虛擬化。并不是所有多內核平臺都支持虛擬化,但虛擬化確實能帶來更好的機會。雖然虛擬化使得硬件設計面臨更多的挑戰(zhàn),但它通常能簡化軟件和應用管理。
SMP服務器
Xeon Nehalem-EX是Intel公司提供的頂級8內核對稱多處理(SMP)平臺。像8芯片、64內核系統(tǒng)這樣的多芯片解決方案,通常采用高速QuickPath點到點互連技術將處理器和外設控制器鏈接在一起(圖1)。使用過帶HyperTransport鏈路的AMD Opteron處理器的工程師,對這種架構非常熟悉。在這兩種情況下,最簡單的配置是單個處理器通過單條高速鏈路鏈接到單個外設控制器。
除了提供分布式內存子系統(tǒng)外,Intel和AMD還實現了連貫緩沖非統(tǒng)一內存尋址(ccNUMA)技術。每個處理器芯片都有自己的內存控制器以及一級、二級和三級緩存。任何芯片都可以使用高速鏈路訪問其它任何芯片中的內存。當然,離請求者越遠的數據訪問時間越長。這些高速鏈路也被用于消費設備,但只有到I/O中心的單條鏈路是必需的。換句話說,在共享內存訪問時服務器將在處理器芯片間產生顯著的流量。芯片至芯片流量和緩存管理是高效操作的關鍵。
HT Assist是AMD最新推出的Istanbul Opteron處理器的一個重要功能,它通過優(yōu)化內存請求和響應過程來盡量減少相關事務處理的數量,進而釋放出大量帶寬用于處理其它業(yè)務(圖2)。HT Assist實際上會跟蹤數據在內核和緩存間的移動,允許請求得到具有所需數據的最近內核的服務。
最壞的情況是擁有片外存儲器空間的芯片必須從片外存儲器訪問數據;最好的情況是發(fā)現數據正好位于運行著需要這個數據的線程的芯片緩存中;中間情況是內核從相鄰芯片的緩存中獲取數據。使用虛擬化和緩存技術后系統(tǒng)將變得更加復雜,并導致數據延時更加難以確定。這在確定性嵌入式應用中可能是個問題,但在大多數服務器應用中問題并不十分明顯,因為這種情況下的速度比精細的確定性更加重要。
編程人員現在都在使用這些平臺,因為它們能大大簡化編程任務。同樣,應用程序可以使用越來越多的內核,前提是應用程序可高效地利用充足的線程。高效使用多內核系統(tǒng)并不像表面看起來那么容易。緩存大小和應用程序工作數據集中的參考位置會影響特定算法的運行效果。
AMP應用處理器
對稱處理(SMP)架構對許多嵌入式應用來說非常有用,但非對稱多處理(AMP)也有它的用武之地。AMP配置在很多地方都可以看到,從TI的OMAP(開放多媒體應用平臺)到飛思卡爾的P4080 QorIQ都有AMP的身影(圖3)。
評論