實(shí)現(xiàn)光纖交換機(jī)的最佳管理
以下最佳實(shí)踐可以幫助存儲(chǔ)人員更好的管理光纖交換機(jī)
一旦確定產(chǎn)品供應(yīng)商,就不要輕易改變,因?yàn)槎鄠€(gè)品牌的產(chǎn)品混用很容易產(chǎn)生問(wèn)題。
光纖交換機(jī)之間能否正常通信是保證整個(gè)網(wǎng)絡(luò)穩(wěn)定的關(guān)鍵因素。在此推薦以下三家公司的產(chǎn)品:博科通信有限公司,思科信息系統(tǒng)公司,Qlogic公司。
Gartner公司的分析員Robert Passmore說(shuō): 光纖交換機(jī)之間通信是有標(biāo)準(zhǔn)的,但僅僅滿足這個(gè)標(biāo)準(zhǔn)還是遠(yuǎn)遠(yuǎn)不夠的。所有的供應(yīng)商基本上都可以做到這一點(diǎn)。
下面的經(jīng)驗(yàn)適用于所有的光纖交換環(huán)境:
計(jì)劃
做好未來(lái)三年內(nèi)存儲(chǔ)區(qū)域網(wǎng)絡(luò)的規(guī)劃。根據(jù)過(guò)去兩年內(nèi)應(yīng)用程序、物理服務(wù)器、存儲(chǔ)設(shè)備的數(shù)量來(lái)判斷將來(lái)的需求。是否會(huì)采用一些新技術(shù)例如虛擬服務(wù)器,不同的組件是否會(huì)對(duì)整個(gè)網(wǎng)絡(luò)帶來(lái)影響,這些問(wèn)題都需要考慮。Dragon Slayer咨詢公司的總裁Marc Staimer說(shuō):“將你未來(lái)三年的需求翻倍部署到你的應(yīng)用中去,雖然暫時(shí)的花費(fèi)比較多,但長(zhǎng)期看來(lái)還是非常值得的。不經(jīng)過(guò)計(jì)劃就開始部署存儲(chǔ)區(qū)域網(wǎng)絡(luò),以后的問(wèn)題會(huì)越來(lái)越多。 所以計(jì)劃的越多,以后的工作就越輕松。”
根據(jù)應(yīng)用程序的吞吐量和I/O來(lái)設(shè)計(jì)性價(jià)比更高的存儲(chǔ)區(qū)域網(wǎng)絡(luò)。前HP公司存儲(chǔ)工程師Dan Iacono說(shuō):“很多用戶不清楚他們的應(yīng)用程序的帶寬和I/O,這個(gè)問(wèn)題可以使用一些操作系統(tǒng)例如Unix,Windows自帶的工具來(lái)解決,很多存儲(chǔ)設(shè)備供應(yīng)商也會(huì)向客戶提供這種工具。然后根據(jù)吞吐量來(lái)確定使用哪種端口,以及如何設(shè)計(jì)存儲(chǔ)區(qū)域網(wǎng)絡(luò)。許多用戶都是采用中心+邊緣的方式,在邊緣使用16口或者32口的光纖交換機(jī),然后通過(guò)內(nèi)部ISL鏈接到中心一個(gè)大的交換機(jī)上。了解邊緣交換機(jī)的吞吐量可以確定ISL的數(shù)量?!?
將ISL數(shù)量降至最低,可以空閑出更多的端口,并且可以將更多資金用于存儲(chǔ)區(qū)域網(wǎng)絡(luò)內(nèi)部的部署上。
有經(jīng)驗(yàn)的公司會(huì)發(fā)現(xiàn),只需將吞吐量大的應(yīng)用程序從邊緣移動(dòng)到中心就可以解決問(wèn)題,因?yàn)檫@樣應(yīng)用程序可以更加容易的從存儲(chǔ)設(shè)備上取的數(shù)據(jù)。
不要害怕超額限制。光纖交換機(jī)大部分時(shí)間不會(huì)滿載運(yùn)行,因此額外增加一些負(fù)載通常不會(huì)影響整體的性能。Howard Goldstein協(xié)會(huì)的主席Howard Goldstein說(shuō):“大部分的存儲(chǔ)管理員在這個(gè)問(wèn)題上都過(guò)于保守,其實(shí)平時(shí)使用的帶寬只占總體帶寬的1/10”.
提前考慮電源消耗和制冷設(shè)備。供應(yīng)商通常會(huì)將產(chǎn)品盡可能的細(xì)化,但有時(shí)還是不夠。電源消耗就是一個(gè)例子。博科數(shù)據(jù)中心基礎(chǔ)架構(gòu)部的產(chǎn)品市場(chǎng)主管Mario Blandini說(shuō):“現(xiàn)在有很多的IT環(huán)境都缺少供電設(shè)備,大部分的醫(yī)院或者大學(xué)樓都建造于75年前,當(dāng)時(shí)他們接入電源時(shí),肯定不會(huì)想到在19平方英尺的地方會(huì)消耗10,000W(瓦)的電量。”
設(shè)計(jì)兩個(gè)獨(dú)立的存儲(chǔ)區(qū)域網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)冗余。SAN需要7×24小時(shí)的正常運(yùn)行。存儲(chǔ)區(qū)域網(wǎng)絡(luò)中的服務(wù)器越多,出現(xiàn)故障的機(jī)率就越大。為了避免出現(xiàn)故障,通常在服務(wù)器和存儲(chǔ)之間有兩條路徑。
如果一條路徑上任意一個(gè)部件出現(xiàn)問(wèn)題,例如HBA、光纖交換機(jī)、線纜、端口或者其他的部件,另外的一條路徑就會(huì)頂替出現(xiàn)問(wèn)題的路徑,將服務(wù)器和存儲(chǔ)鏈接起來(lái)。另外一個(gè)好處是,在SAN運(yùn)行時(shí)也可以對(duì)其進(jìn)行升級(jí)。
Staimer說(shuō):“無(wú)論你對(duì)系統(tǒng)做什么操作都會(huì)影響你的應(yīng)用程序,為了避免這一點(diǎn),我們通常是對(duì)非正在運(yùn)行的環(huán)境進(jìn)行升級(jí)。多個(gè)光纖網(wǎng)絡(luò)可以使SAN更加的安全?!?
管理——技術(shù)方面
部署路徑自動(dòng)切換軟件,可以保證一條路徑出現(xiàn)問(wèn)題時(shí),另外一條可以自動(dòng)切換,不影響正常使用。Passmore說(shuō):“一些操作系統(tǒng)提供了這樣的軟件,但功能有限,因此一些廠家也會(huì)發(fā)布各自的路徑管理軟件,雖然價(jià)格有些高,但提供的功能非常全面,還是物有所值的?!?
配置,調(diào)試和監(jiān)控硬件和性能工具。 Iacono記得有一家大的咨詢公司每天會(huì)得到6,000多條警告,但并不處理他們。有一家設(shè)備供應(yīng)商取消了當(dāng)SAN的帶寬是0MBps時(shí)發(fā)出警告的設(shè)置。這樣會(huì)引來(lái)非常大的麻煩。
通常很小的硬件問(wèn)題累計(jì)起來(lái)就會(huì)出現(xiàn)大的問(wèn)題。SAN中大約95%的問(wèn)題都會(huì)發(fā)出警告,但這樣警告并沒(méi)有引起重視。如果每天都收到很多的警告信息,你應(yīng)該重新調(diào)試你的監(jiān)控工具來(lái)取消這些警告,或者是這樣問(wèn)題真的非常嚴(yán)重,需要馬上解決。
將SAN的信息備份到硬盤上而非SAN中。SAN通常不會(huì)宕機(jī),一旦宕機(jī),將會(huì)是一場(chǎng)災(zāi)難。如果SAN的信息存儲(chǔ)在一個(gè)SAN鏈接的硬盤中,那恢復(fù)其中的數(shù)據(jù)的難度就可想而知。
Iacono說(shuō):“我敢肯定財(cái)富500強(qiáng)的公司都是這么做的?!?
很多的公司甚至不會(huì)更新文檔,通常只是使用一個(gè)Excel文檔,里面寫些目標(biāo),以后很少會(huì)更新它,因?yàn)樗麄冇X(jué)得這并不重要。如果需要做故障分析時(shí),他們都不清楚每個(gè)端口連接的是什么設(shè)備。其實(shí)每個(gè)管理員都有自己的文檔,但其中50%到70%的信息不是最新的。
管理——個(gè)人方面
雇傭?qū)I(yè)的存儲(chǔ)團(tuán)隊(duì)并嚴(yán)格管理流程。大部分的SAN宕機(jī)都是由于人為因素導(dǎo)致的。嚴(yán)格的管理流程會(huì)減少這種事情的發(fā)生。因此雇傭一個(gè)專業(yè)的存儲(chǔ)團(tuán)隊(duì)是必須的。服務(wù)器管理員會(huì)將自己的需求告知存儲(chǔ)團(tuán)隊(duì),由他們來(lái)進(jìn)行設(shè)計(jì)與安排,然后寫下整個(gè)流程的處理過(guò)程,包括在存儲(chǔ)設(shè)備和交換機(jī)上做了哪些操作等。這樣,團(tuán)隊(duì)中其他的成員就可以看到這個(gè)需求處理的進(jìn)度。
Gartner公司的Passmore說(shuō):“按照這個(gè)流程來(lái)管理SAN的公司,SAN宕機(jī)的機(jī)會(huì)會(huì)大幅降低。”
為每個(gè)管理員和第三方的咨詢?nèi)藛T設(shè)置不同的用戶名和密碼。Iacono說(shuō):“對(duì)新交換機(jī)的參數(shù)進(jìn)行了微調(diào)而沒(méi)有告訴同事,這種事情也是時(shí)有發(fā)生的?!?
當(dāng)發(fā)生這種事情后,想找到當(dāng)事人是非常麻煩的。所以要為不同的人設(shè)置不同的用戶名和密碼,下次再發(fā)生這種事時(shí),就能非常容易的知道是誰(shuí)修改過(guò)配置。
安全
在LUN掩蓋和綁定完成之后創(chuàng)建zone。當(dāng)服務(wù)器跟存儲(chǔ)設(shè)備連接時(shí),可以使用一些工具來(lái)創(chuàng)建一個(gè)帶地址的存儲(chǔ)卷,或者是一個(gè)LUN,LUN掩蓋可以將不屬于它的LUN隱藏,LUN綁定可以將LUN和一個(gè)具有唯一WWID(worldwide ID)的HBA進(jìn)行綁定。
在做完LUN掩蓋和LUN綁定之后,存儲(chǔ)管理員應(yīng)該馬上去光纖交換機(jī)上設(shè)置zone,來(lái)保證特定適配器只能和特定的端口通信。
Passmore說(shuō):“交換機(jī)通過(guò)zone增強(qiáng)了LUN掩蓋和LUN綁定的功能,這樣就可以保證存儲(chǔ)設(shè)備上的LUN可以被特定的具有WWID的適配器訪問(wèn)到?!?
使用SSH(Use Secure Shell)訪問(wèn)SAN。如果存儲(chǔ)管理員通過(guò)Telnet訪問(wèn)光纖交換機(jī), 密碼是沒(méi)有加密的,這樣增加了風(fēng)險(xiǎn)。使用SSH會(huì)對(duì)所有的操作都進(jìn)行加密,很多的人在操作系統(tǒng)上會(huì)使用SSH,但在存儲(chǔ)設(shè)備上還沒(méi)有注意這一點(diǎn)。
虛擬服務(wù)器
確保整個(gè)環(huán)境可以滿足全部應(yīng)用程序的帶寬。在原來(lái)的服務(wù)器上安裝多個(gè)虛擬機(jī)運(yùn)行多個(gè)應(yīng)用程序,整個(gè)帶寬的需求就會(huì)提升。用戶在設(shè)計(jì)SAN時(shí)就要考慮到這一點(diǎn)。一個(gè)X86的服務(wù)器至多可以達(dá)到1G/s的帶寬,而現(xiàn)在的雙核的機(jī)器則可以達(dá)到10G/s。如果你同時(shí)運(yùn)行20個(gè)應(yīng)用程序,帶寬會(huì)達(dá)到10G/s,原來(lái)的機(jī)器是肯定無(wú)法承受這么大的負(fù)載的。
確保所有運(yùn)行著虛擬機(jī)的物理服務(wù)器在同一個(gè)zone里面。使用虛擬機(jī)技術(shù),管理員可以輕松的將一個(gè)應(yīng)用程序從一個(gè)物理機(jī)器上換到另外一個(gè)物理機(jī)器上,而且不用停機(jī),但是這些物理機(jī)器需要在同一個(gè)zone里面才可訪問(wèn)到存儲(chǔ)設(shè)備?!叭绻L問(wèn)不到存儲(chǔ)設(shè)備的話,應(yīng)用程序就會(huì)宕掉?!盨taimer說(shuō)道。
采用支持NPIV的交換機(jī)和HBA卡。如果在一個(gè)物理機(jī)器上運(yùn)行著五個(gè)虛擬機(jī),NPIV可以對(duì)HBA卡生成五個(gè)不同的識(shí)別號(hào),這樣五個(gè)虛擬機(jī)就可以使用五個(gè)不同的LUN。如果使用不支持NPIV的設(shè)備,五個(gè)虛擬機(jī)只能使用一個(gè)LUN。NPIV適用于所有的新交換機(jī)和HBA卡。用戶可以聯(lián)系供應(yīng)商來(lái)對(duì)原來(lái)的硬件進(jìn)行升級(jí)以支持NPIV,NPIV在刀片服務(wù)器上的運(yùn)行原理跟在虛擬機(jī)上的運(yùn)行原理基本相同。
交換機(jī)相關(guān)文章:交換機(jī)工作原理
評(píng)論