如何實現(xiàn)PCI Express的熱插拔功能
熱插拔功能的基本目的是,允許電路板和外殼進行有序地活插拔,而不影響系統(tǒng)的運行。維修或更換有故障器件時通常要這么做,因為要安排好服務器停機時間以更換或者安裝外設卡通常很難,當然也不是不可能。具有以這種方式插入或更換I/O設備的能力可避免系統(tǒng)停機或者至少可將系統(tǒng)停機時間縮到最短。該技術也可用于為系統(tǒng)的重新配置而增加新功能。膝上型電腦用戶也需要熱插拔能力來更換有I/O功能的卡,如裝在對接站的硬驅(qū)和通信口。
PCI規(guī)范2.1原來未計劃提供熱插拔應用功能,但是后來在1997年,推出了PCI熱插拔規(guī)范1.0,定義了基本的平臺、附加卡和軟件要求。不過,在解釋和執(zhí)行規(guī)范方面,卻給系統(tǒng)開發(fā)者和系統(tǒng)用戶預留了很大的靈活性。另外,未定義軟件可見寄存器組。2001年,推出了一套新規(guī)范:PCI標準熱插拔控制器(SHPC)1.0和PCI熱插拔1.1。這些規(guī)范更嚴格了用戶接口,并定義了標準寄存器組,極大地提高了熱插拔軟件開發(fā)的兼容性。
然而,由于PCI是多點共享總線,用反射波開關,所以硬件有局限性。總線不隔離而插入器件是不可能的。要解決這一問題,有兩種可能的選擇:依靠平臺實現(xiàn)可插入要求,即熱插拔,或依靠附加卡實現(xiàn)可插入的要求,即熱交換。
兩種方法都有缺點,可采用一些創(chuàng)新性的方法,如在卡插入系統(tǒng)前,對PCI引腳預加電,來避免如產(chǎn)生假信號這樣的問題,以保持數(shù)據(jù)的完整性。標準的PCI連接器引腳長度相同,因此熱交換環(huán)境下,附加卡的加電順序無法達到。為引腳?錯方案的“緊湊型PCI”定義了一組新的連接器。這樣絕大多數(shù)限制解除了,但是因為PCI是并行總線,性能成了一個瓶頸??偩€工作的頻率取決于總線負載,總線上器件越多,總線速度就越慢。最后,由于PCI總線具有共享的特點,經(jīng)受不住元件故障,這是因為總線上任何不穩(wěn)定的行為都會使總線上所有器件無法通信。
PCI Express一開始就設計為具有熱插拔功能。同樣,熱插拔寄存器也是PCIe功能的構成部分,使操作系統(tǒng)具有標準的熱插拔硬件寄存器接口,該接口可通過PCIe總線的配置接入來存取。PCI Express也通過定義基本架構水平的硬件要求的熱插拔功能,而定義了一個標準的使用模型。有了熱插拔控制的固有支持,就能使創(chuàng)新的服務器模塊形狀在加電狀態(tài)下就可插入或拔掉,不用打開機箱。
在基于PCIe的服務器系統(tǒng)中,熱插拔插槽既可由芯片組也可由開關的下游口提供。由于PCIe是點對點總線,根組件端口數(shù)有限,通常要有開關,以進行插槽擴展和創(chuàng)建。對軟件而言,這些開關表現(xiàn)為PCI-PCI橋,每個完成熱插拔插槽的口在橋結構的空間都有各自的熱插拔寄存器組。這些寄存器向軟件報告有無已定義的熱插拔機制,包含電源控制、插槽指示器以及卡插入/移去、閉鎖打開/閉合和注意按鈕摁下的標志。把中斷上行數(shù)據(jù)流發(fā)送給根組件,以此來通知軟件。通知選項是實現(xiàn)依賴型。
PCIe開關開發(fā)者采用了兩種方法提供熱插拔支持,選擇片上(圖1)或者選擇片外SHPC支持。第一種方法是把控制器邏輯和信令接口嵌入在開關中,器件和插槽功能寄存器也在開關中實現(xiàn)。在片外SHPC方案中,沒有信令接口,要求系統(tǒng)硬件設計師在電路板上加上附加電路,通過FPGA或支持I2C的I/O擴展器來模擬熱插拔控制器。這樣會增加材料成本,增大電路板空間,同時增加設計的復雜性。PLX技術PCIe開關就是一個片上SHPC方案的例子,所有需要的熱插拔狀態(tài)寄存器都集成在片上,同時也給出了熱插拔方案要求的所有信號。PLX開關支持3~8個熱插拔功能口,樣充分降低了實現(xiàn)需要SHPC功能的系統(tǒng)的成本和復雜性。
PCI Express熱插拔軟件支持功能取決于3個基本因素:固件支持、器件驅(qū)動器支持和操作系統(tǒng)支持。這3個因素都必須支持熱插拔規(guī)范,以使系統(tǒng)能完成附加卡插入和拔出。
在上電自測試(POST)期間,加電時,固件創(chuàng)建和加載某些程序和表格。這些程序和表格的實現(xiàn)在“高級配置與電源接口固件規(guī)范”中已作了定義。固件也負責配置操作系統(tǒng)的系統(tǒng)地址空間。固件將系統(tǒng)地址劃分為許多專用區(qū)域,包括用于系統(tǒng)存儲器、系統(tǒng)I/O和PCI配置空間的區(qū)域,這些都是PCI器件要求的。固件地址映射通過操作系統(tǒng)支配這些映射的使用。
當把PCIe端點插入PCIe開關插槽時,開關產(chǎn)生激活中斷,如“出現(xiàn)檢測改變的中斷”。根組件把中斷傳給總線驅(qū)動器、Windows即插即用(PnP)管理程序和Windows電源管理程序。Windows PnP管理程序依次請求PCI總線驅(qū)動器重新列舉PCI總線器件,這可能導致資源重新分配。當發(fā)現(xiàn)新設備時,給相應驅(qū)動器加載,然后初始化該設備并準備處理I/O(如圖2所示)。
所有在Windows 2000和Windows XP上的熱插拔事件,如插入、彈出和拔出都可能通過ACPI 1.0b處理。Windows XP支持一種附加對象,是在ACPI 2.0(the _HPP object)中引入的。這些操作系統(tǒng)僅限在單個總線段分配資源,在運行時不能重新分配資源((I/O和存儲器孔)。因此,橋或開關的插入要求為開關及開關后設備分配多級資源。
只有當預分配的資源足夠供給新設備時,操作系統(tǒng)才能正確啟動器件。如果要分配的資源不夠,特別是如果插入一個橋時,操作系統(tǒng)通常不能在運行時間重新配置PCI-PCI橋,以處理設備資源要求。
“固件ACPI規(guī)范3.0”通過提供支持操作系統(tǒng)能力(_OSC)方法和設備特定方法(_DSM)來解決此問題。_OSC方法是一種機制,用來定義硬件的父子依存關系,把這些關系傳送給操作系統(tǒng),而_DSM是一種可選的ACPI控制方法,能實現(xiàn)專用器件控制功能并允許OS忽略PCI設備引導配置。
Windows Vista是一種能發(fā)現(xiàn)PCI Express的OS,支持多級重平衡。多級重平衡能根據(jù)其后設備的資源要求來動態(tài)調(diào)節(jié)PCI橋窗口的大小。像_DSM這樣的方法允許平臺固件高負荷地為Windows XP和Server 2003引導配置設備,而給Windows Vista提供了忽略引導配置資源的自由,因此資源分配的靈活性更大。這樣能使操作系統(tǒng)重新定位和/或擴展PCI橋資源窗口,以適應設備要求,否則這將是不可能,這是由于引導設備要求的限制引起的。因為Windows Vista中的多級重平衡代碼不再受必須維持系統(tǒng)引導配置資源的限制,所以運行更有效。
總之,PCIe在事務處理、數(shù)據(jù)鏈接和物理層方面具有很大的彈性,加之其點對點的特性,有助于基于PCIe的設計避免單點故障。所有這些特點,加上PCIe固有的在硬件和OS級支持熱插拔的特性,所有這些都表明PCIe正在進入RAS的新紀元。
評論