SAF-TE技術(shù)在磁盤陣列背板中的實現(xiàn)
摘 要:在磁盤陣列中,一般使用背板方式連接硬盤,這樣服務(wù)器可在不關(guān)機的情況下直接更換損壞的硬盤。在背板設(shè)計中采用SAF-TE監(jiān)控技術(shù)不僅可以隨時監(jiān)控硬盤的好壞、對損壞的硬盤提供LED指示并報警,同時還可以實現(xiàn)對系統(tǒng)風(fēng)扇、溫度及電壓的實時監(jiān)控。本文將以SAF-TE控制器GEM318為例,介紹其在曙光2U服務(wù)器硬盤熱插拔背板設(shè)計中的具體應(yīng)用。
關(guān)鍵詞:SAF-TE;GEM318;I2C;PCB布線
SAF-TE控制技術(shù)
SAF-TE(SCSI Accessed Fault-Tolerant Enclosure) 是Intel公司提出的一種標準。該標準定義了一組命令,這些命令可用于設(shè)置RAID陣列和獲得陣列中磁盤的狀態(tài)信息,并在實現(xiàn)對熱插拔磁盤進行管理的同時,為用戶提供磁盤陣列的環(huán)境狀態(tài)信息。這樣就在主機、RAID控制器、存儲設(shè)備、背板、電源及其它設(shè)備間建立了有效的通信途徑。
與以往的背板相比,采用SAF-TE控制技術(shù)的熱插拔背板,具有以下優(yōu)點:可進行驅(qū)動器狀況監(jiān)控并在熱插拔底板上顯示磁盤驅(qū)動器的狀態(tài)信息。這就允許客戶快速地確認并更換一個已經(jīng)無效的或者可能有故障的磁盤驅(qū)動器。在更換了損壞的硬盤后,RAID的重建可自動進行,而無須再經(jīng)手動操作RAID控制器來完成。在硬盤的恢復(fù)過程中,不影響系統(tǒng)的服務(wù)。如果沒有SAF-TE,自動重建工作只能是在有備用磁盤存在的情況下方可完成。由于不需在陣列中放置備用磁盤,使用SAF-TE可實現(xiàn)磁盤陣列中適用磁盤數(shù)量的最大化。
電路設(shè)計
GEM318 是一款低成本、自完備的熱插拔硬盤背板管理控制器,只需簡單的外圍器件就可實現(xiàn)SAF-TE管理功能。由于其低成本和小封裝的特點,使其成為1U和2U服務(wù)器節(jié)點背板設(shè)計中首選的解決方案。
硬件電路設(shè)計
GEM318具有LVDS接口,作為SCSI的一個目標設(shè)備存在,并占一個ID號,支持SAF-TE 1.0規(guī)范。具有一個I2C接口,當工作在主方式下,可以讀取外部的溫度傳感器LM75和NVRAM AT24C01里面的組態(tài)數(shù)據(jù)。最多支持8個SCSI設(shè)備,具有8個LED控制引腳。支持兩個LM75溫度傳感器,具體設(shè)計電路如圖1所示。
硬盤插拔檢測
該背板支持6塊SCSI硬盤,所以只需將GEM318的DEV_INS5~0這6個引腳分別連接到背板上6個SCSI插槽的MATED引腳即可。該引腳正常為高電平,當某個槽中有硬盤插入時,硬盤的MATED引腳會將相應(yīng)的DEV_INS引腳電平拉低。這樣,GEM318就依此來判斷每個SCSI插槽上硬盤的插拔狀態(tài)。
當GEM318檢測到某個DEV_INS引腳出現(xiàn)由高到低的電平跳變后,會立即使能SCSI總線上的復(fù)位信號,使得SCSI設(shè)備處于復(fù)位狀態(tài)(如圖2所示)。這樣就有效的“屏蔽”了硬盤插入瞬間對SCSI總線信號的干擾,從而保證了SCSI總線信號的可靠性傳輸。
故障報警及LED指示
GEM318可以把SAF-TE命令寄存器記錄的錯誤信息及時傳遞給報警輸出引腳FAULT_IN。這樣,GEM318就可隨時把出錯信息以聲光報警的方式通知給用戶。
設(shè)計中將溫度、風(fēng)扇和電壓檢測電路的邏輯輸出,通過7411三輸入與門芯片輸出給GEM318的外部故障輸入引腳G_ALARM(低電平有效),以實現(xiàn)監(jiān)控盤陣工作環(huán)境的目的。
LED7~0輸出引腳用來驅(qū)動外部的LED,分別顯示相對應(yīng)的硬盤狀態(tài)信息。
LVDS信號接口與ID設(shè)置
GEM318支持LVDS信號接口方式,LVDS是電流驅(qū)動模式,350mV的低電壓擺幅可以提供幾百兆比特的信號傳輸率。使用差分傳輸?shù)姆绞娇梢允闺姶鸥蓴_互相抵消,消除共模噪聲,減少EMI。
GEM318有兩個ID可選:ID6或ID8。目的是為了當盤陣中一個SCSI通道的硬盤數(shù)超過8時,可采用兩個GEM318。設(shè)計時將GEM318的ID_ON1+/ID_ON1- 連到SCSI總線上的DB6+/DB6-,將GEM318的ID號設(shè)為6。
通過硬件電路跳線和NVRAM組態(tài)GEM318
GEM318具有很大的設(shè)計靈活性,可以在上電時通過讀取輸出引腳的電平狀態(tài)和NVRAM中的數(shù)據(jù)來配置GEM318的特性。
LED7~0引腳在系統(tǒng)上電時,在GEM318的RESET信號有效期間作為輸入引腳使用。要求RESET信號至少要保持5個時鐘周期。
LED7~0上電初期的引腳電平設(shè)計時由上拉或下拉電阻決定,此期間要求驅(qū)動LED顯示的供電電源LED_VDD暫停供電,以便GEM318能讀到準確的低電平信息。LED_VDD延遲上電的時間t可通過調(diào)整C31和R22的值來決定。設(shè)計電路如圖3所示,電源時序如圖4所示。
設(shè)計時NVRAM選用的是AT24C01,上電時GEM318將從AT24C01的40H存儲單元讀取信息。通過對AT24C01編程可設(shè)置以下選項:Slot的數(shù)目,每個Slot的SCSI ID號,設(shè)置溫度傳感器的數(shù)目及溫度報警上下限值等。
串行通信設(shè)計
GEM318的串行通信接口兼容I2C規(guī)范,即可工作在主方式下也可工作在從方式下。工作在主方式下時可支持多主競爭,在背板設(shè)計上預(yù)留了I2C插針,這就為外部的控制設(shè)備訪問盤陣信息提供了可能。當工作在從方式下時,GEM318有兩個從地址可選。設(shè)計時將ID_ON1接到SCSI總線上,把GEM318的從地址設(shè)為E1H。如果將ID_ON0接到總線則從地址為E3H。
PCB設(shè)計
背板要求支持320Mbps的SCSI總線傳輸速率,SCSI總線采用LVDS信號傳輸技術(shù),為保證信號的可靠傳輸,PCB布線至關(guān)重要。印制板的主要技術(shù)參數(shù)如下:
1. 尺寸是270mm X 84mm,板厚為2mm。
2. 采用六層板設(shè)計,信號從頂層到底層的布局依次為TOP層,GND層,信號1層,信號2層,信號3層和BOTTOM層。其中信號2層布12V電源,信號3層鋪5V電源。
在布線中應(yīng)注意以下幾點:
1. 優(yōu)先考慮電源和地在系統(tǒng)中的分布。
2. 使TTL信號和LVDS信號相互隔離,最好分布在不同的層。
3. 盡量多使用去耦電容。
4. 大電流回路布線盡量加粗,保持PCB地線層返回路徑盡量寬而短。
5. 對于差分布線采用手動布線功能,使差分線對離開集成芯片后盡可能地相互靠近。每對差分線的間隔要盡量小,差分對間的長度要匹配。這樣能減少反射并能確保耦合到的噪聲為共模噪聲。
6. 進行阻抗控制,通過阻抗設(shè)計軟件計算阻抗以確定差分線寬及線間距。
7. 背板上設(shè)計終結(jié)器電路,以吸收反射信號。
8. 走線時避免90洌ㄒ苑澇斐勺榪共渙?,記]∠呋?5畢嘰妗?
結(jié)語
采用SAF-TE控制技術(shù)設(shè)計的SCSI背板,已廣泛應(yīng)用在曙光的系列產(chǎn)品中。經(jīng)兩年多的實際運行,證明系統(tǒng)工作可靠,性能穩(wěn)定,保證了熱插拔硬盤的安全穩(wěn)定運行。該控制技術(shù)在產(chǎn)品中的采用,改變了傳統(tǒng)的熱插拔背板只能監(jiān)控溫度和風(fēng)扇信息,而不能與主機,硬盤控制器通信的缺陷。為服務(wù)器存儲系統(tǒng)的安全穩(wěn)定運行提供了有效的保障?!?/p>
參考文獻
1 SCSI Accessed Fault-Tolerant Enclosures Interface and Specification
2 GEM318 Guardian Enclosure Management Controller Data Sheet
3 GEM318 Guardian Management Controller Technical Manual
評論