適用于超大規(guī)模數(shù)據(jù)中心的高效 100G/400G 光端機(jī)解決方案
作者 / Rang-Chen (Ryan) Yu Molex業(yè)務(wù)發(fā)展副總裁,Molex 旗下 Oplink 公司光電子解決方案業(yè)務(wù)總經(jīng)理兼 100G Lambda MSA 聯(lián)合主席
本文引用地址:http://www.ex-cimer.com/article/201807/389571.htm摘要:介紹了適用于超大規(guī)模數(shù)據(jù)中心的高效 100G/400G 光端機(jī)解決方案。
全球網(wǎng)絡(luò)數(shù)據(jù)中心的流量在十年來一直保持高速增長(zhǎng),在可預(yù)見的未來尚無任何減弱的跡象。智能手機(jī)及其他移動(dòng)設(shè)備、社交媒體與應(yīng)用、流媒體視頻、增強(qiáng)現(xiàn)實(shí)與虛擬現(xiàn)實(shí)日益普及,正在吸引著越來越多的新用戶,每位用戶持有的設(shè)備數(shù)量保持增長(zhǎng),并且每臺(tái)設(shè)備使用的數(shù)據(jù)量也在不斷攀升,這樣,數(shù)據(jù)中心的流量就發(fā)生了顯著的提升。據(jù)分析師預(yù)測(cè),截至 2020 年,全球連接到互聯(lián)網(wǎng)的設(shè)備數(shù)量將達(dá)到 2000 億臺(tái)。近期的證據(jù)表明,逐步走向成熟的消費(fèi)電子產(chǎn)品市場(chǎng)可能只是冰山一角。云計(jì)算和機(jī)器間的部署中數(shù)據(jù)帶寬的增長(zhǎng)速度正在超過消費(fèi)者的數(shù)據(jù)通信速率,推動(dòng)著對(duì)大容量數(shù)據(jù)中心基礎(chǔ)設(shè)施的巨大需求。
數(shù)據(jù)中心和光學(xué)互連的增長(zhǎng)趨勢(shì)
在過去的十年間,AWS、微軟、谷歌和臉書之類的頂尖互聯(lián)網(wǎng)站公司一直都忙于部署規(guī)模越來越大的數(shù)據(jù)中心,滿足客戶的需求,對(duì)于其中一些企業(yè)來說,在每座建筑物中使用的計(jì)算機(jī)服務(wù)器數(shù)量現(xiàn)在甚至已經(jīng)超過了 10 萬臺(tái)。在房地產(chǎn)及電能的供應(yīng)充足而成本較低的地區(qū),這類超大規(guī)模數(shù)據(jù)中心的提供商將附近到處蔓生的數(shù)據(jù)中心的處理能力合并起來,從而充分利用起規(guī)模經(jīng)濟(jì)。根據(jù)思科的預(yù)計(jì),截至 2020 年,全部數(shù)據(jù)中心中近一半裝機(jī)的服務(wù)器都將位于超大規(guī)模數(shù)據(jù)中心之內(nèi)。這些服務(wù)器將占到 68% 的處理能力,以及超過一半(53%)的數(shù)據(jù)中心總流量。
隨著云端需要為越來越多的關(guān)鍵任務(wù)型的商業(yè)應(yīng)用及高時(shí)效性的消費(fèi)者應(yīng)用提供支持,在全球范圍內(nèi),數(shù)據(jù)中心的部署愈發(fā)要靠近人口中心。網(wǎng)絡(luò)公司建設(shè)的數(shù)據(jù)中心越來越多的采用多座建筑物,這些建筑物緊緊相鄰,通過極大的帶寬相互連接到一起。在人口較為稠密的地區(qū),跨越各個(gè)相互獨(dú)立的電網(wǎng)來建立起數(shù)據(jù)中心,可以進(jìn)一步地減少延遲、改善消費(fèi)者的體驗(yàn)。對(duì)于依靠一個(gè)單一電網(wǎng)的更大規(guī)模的數(shù)據(jù)中心來說,這一戰(zhàn)略還可以降低風(fēng)險(xiǎn)、克服局限。
在每一座超大規(guī)模數(shù)據(jù)中心建筑物的內(nèi)部,都可能有數(shù)萬臺(tái)以至數(shù)十萬臺(tái)的計(jì)算機(jī)服務(wù)器,通過不同層次的以太網(wǎng)交換機(jī)相互連接到一起,形成一種集體性的計(jì)算能力,致力于網(wǎng)絡(luò)公司自身的服務(wù)(例如,谷歌或臉書),或者出租給企業(yè)客戶(例如,亞馬遜的 AWS 或微軟的 Azur)。盡管可以通過很多種方案來實(shí)現(xiàn)計(jì)算器服務(wù)器的互連,在 2018 年,典型超大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)連接的特點(diǎn)在于采用了 DAC(直連銅纜),在 25 或 2x25 Gbps 的速度下,在數(shù)米的距離內(nèi)將服務(wù)器連接到架頂 (ToR)服務(wù)器,然后再采用大量的 100 Gbps 光學(xué)鏈路,通過規(guī)模龐大的交換結(jié)構(gòu)(通常稱為葉脊架構(gòu))實(shí)現(xiàn) ToR 交換機(jī)的互連。根據(jù)這類數(shù)據(jù)中心的具體數(shù)量,典型的光學(xué)互連覆蓋范圍最大可達(dá)到 500 米(DR),但是大型數(shù)據(jù)中心所需的距離則要長(zhǎng)達(dá) 2 公里(FR)。
當(dāng)前一代的 100 G 光端機(jī)以 4 信道的光發(fā)送機(jī)和光接收機(jī)為基礎(chǔ),分別在 25 Gbps 的速度下并行運(yùn)行,從而達(dá)到 100 Gbps 的聚合帶寬。目前共有兩種類型的 100 G 光端機(jī):對(duì)于希望部署更多的光纖并且降低每臺(tái)光端機(jī)成本的用戶,適合使用 PSM-4(并行單模-4)型的光端機(jī)。對(duì)于期望部署較少光纖的用戶,則更加適用 CWDM4(粗放型 WDM-4)型的光端機(jī)。這兩種類型的 100 G 光端機(jī)在當(dāng)今都已實(shí)現(xiàn)大批量的部署。
100G/400G 的過渡及 100G PAM-4 技術(shù)即將到來
當(dāng)前超大規(guī)模數(shù)據(jù)中心的特點(diǎn)在于互連速度過渡的速度更快,往往每三年發(fā)生一次迭代。極具創(chuàng)新性的100 G互連系統(tǒng)正在成為主流,在過去兩年間已經(jīng)得到廣泛部署,而下一次的速度過渡也正在逼近。盡管當(dāng)前正在考慮200 Gbps的速度,而業(yè)界的一致觀點(diǎn)則是400 Gbps將成為下一步自然而然的選擇。
當(dāng)前基于4x25 G的100G技術(shù)的封裝過程過于復(fù)雜,并且無法擴(kuò)展到 400 G。為了降低 100 G 的成本,并且通過經(jīng)濟(jì)的方式來支持400 G的光學(xué)元件,業(yè)界正在轉(zhuǎn)向采用一項(xiàng)新的技術(shù),采用在50 GBaud下使用PAM-4(4級(jí)脈沖幅度調(diào)制)編碼的光學(xué)元件,從而實(shí)現(xiàn)每信道 100G 的速度,然后再通過4x100 G的聚合來達(dá)到400 G的速度。制定100 G Lambda MSA(多源協(xié)議)的目的是定義這一新的行業(yè)標(biāo)準(zhǔn),并已獲得了23家企業(yè)的推廣支持,而這就代表了一個(gè)廣泛的行業(yè)生態(tài)系統(tǒng),其中包含了生產(chǎn)半導(dǎo)體集成電路、光端機(jī)模塊、網(wǎng)絡(luò)系統(tǒng)的企業(yè),以及作為最終用戶的網(wǎng)絡(luò)公司。
采用單信道100 G光學(xué)元件的巨大優(yōu)勢(shì)包括顯著減少了光學(xué)元件的數(shù)量從而降低成本,為經(jīng)濟(jì)型的400 G速度構(gòu)建起了堅(jiān)實(shí)的基礎(chǔ),并且,當(dāng)電氣接口在未來遷移到100 G的串行接口時(shí),無需再逆向操作。據(jù)估計(jì),PAM-4 100 G 在元件數(shù)量上可減少 60%,而功率要求則可降低 33%。
100 G Lambda MSA 最近還公布了一份規(guī)范的初稿,其中定義了100 G FR(2 公里)、100 G LR(10 公里)及400 G FR4(2 公里),并且還潛在地定義了400 G LR4(10 公里)。隨著數(shù)字信號(hào)處理以及高速硅光子學(xué)之類高速光電子設(shè)備技術(shù)的進(jìn)步,我們預(yù)計(jì)業(yè)界將會(huì)很快采納并實(shí)施此類技術(shù),現(xiàn)場(chǎng)的部署最早可能從 2019 年開始。
數(shù)據(jù)中心間 (DCI) 解決方案
在世界各地,超大規(guī)模數(shù)據(jù)中心都靠近人口中心部署,并且通過超高的帶寬互連起來。盡管各大洲各大洋之間部署了許多的超高速光纖鏈路,其中的大部分鏈路都連接在數(shù)據(jù)中心園區(qū)內(nèi)的各個(gè)數(shù)據(jù)中心大樓之間,或者連接在同一都市區(qū)的各個(gè)數(shù)據(jù)中心之間。這些數(shù)據(jù)中心建筑通過極高的帶寬相互連接在一起,每秒的速度可達(dá)到數(shù)十兆位的級(jí)別。
對(duì)于幾公里范圍內(nèi)互連到一起的數(shù)據(jù)中心,運(yùn)營(yíng)商可以選擇部署簡(jiǎn)單的100 G CWDM4(2 公里)或100 G LR4(10 公里)型的光端機(jī),然后再通過數(shù)百對(duì)的光纖來遷移到100 G FR/LR(使用PAM-4技術(shù))。如果光纖數(shù)量不足,并且添加更多的光纖成本過于高昂,那么運(yùn)營(yíng)商就可能選擇部署 DWDM(密集波分復(fù)用)光端機(jī)解決方案,從而達(dá)到每對(duì)光纖40x100 G的聚合帶寬。對(duì)于這類園區(qū)內(nèi)的短距離互連來說,與復(fù)雜性更高的相干傳輸技術(shù)相比,采用直接檢測(cè)的單信道100 G PAM-4要經(jīng)濟(jì)得多,是一種更具吸引力的解決方案,需要具有偏振復(fù)用/多路分解功能的振幅與相位調(diào)制/解碼功能,以及配有精密控制光學(xué)本機(jī)振蕩器的相干檢測(cè)功能。
對(duì)于 80 公里距離內(nèi)的互連數(shù)據(jù)中心,采用了先進(jìn)數(shù)字信號(hào)處理技術(shù)的100 G PAM-4 DWDM 在成本上仍然具有優(yōu)勢(shì),由于在全部 DWDM 信道上可以共享補(bǔ)償,因此在可調(diào)諧色散補(bǔ)償要求提高的情況下優(yōu)勢(shì)依然明顯。將會(huì)采用相干檢測(cè)來覆蓋超出 80 公里的傳輸距離。在數(shù)據(jù)中心過渡到400 G后,DCI 解決方案將相應(yīng)的擴(kuò)展,而4x100 G PAM-4 則仍可用于傳輸距離相對(duì)較短的DCI應(yīng)用,相干的400 G則將為其他的數(shù)據(jù)中心間連接拓展覆蓋范圍。
光端機(jī)形狀系數(shù)
對(duì)于100 G的數(shù)據(jù)中心應(yīng)用來說,業(yè)界采用了QSFP28(四分之一小形狀系數(shù)可插拔)收發(fā)模塊。由于業(yè)界正在為從100 G過渡到400 G進(jìn)行準(zhǔn)備,多種新興的 MSA 形狀系數(shù)都在參與競(jìng)爭(zhēng),希望爭(zhēng)得一席之地。其中一個(gè)領(lǐng)先的選項(xiàng)就是QSFP-DD(四分之一小形狀系數(shù)可插拔雙密度),這一選項(xiàng)衍生自QSFP28,數(shù)據(jù)的電氣連接性能高出2倍,而機(jī)械長(zhǎng)度稍長(zhǎng)一些,保留了與QSFP28的兼容性。QSFP-DD收發(fā)模塊與線纜籠改進(jìn)了熱設(shè)計(jì),支持12瓦以上的功率耗散。
另一個(gè)競(jìng)爭(zhēng)對(duì)手是OSFP(八進(jìn)制小形狀系數(shù)可插拔)光端機(jī),與QSFP-DD接口相比,這一光端機(jī)的尺寸稍大一些也稍長(zhǎng)一些。OSFP模塊的主要優(yōu)勢(shì)在于形狀系數(shù)較大,這樣可實(shí)現(xiàn)更高的功率耗散,達(dá)到16瓦。不利之處則是缺少與 QSFP28 的向下的兼容性,而且尺寸稍大,降低了面板信息點(diǎn)的密度。
第三種MSA稱為COBO(板載光學(xué)元件聯(lián)盟),定義了一種脫離開系統(tǒng)面板信息點(diǎn)而直接配置在系統(tǒng)印刷電路板上的電氣接口。這種配置的優(yōu)勢(shì)在于可以靈活的放置收發(fā)模塊,使其更加接近速度更高的開關(guān)集成電路接口,便于處理信號(hào)完整性上的問題。由于COBO收發(fā)模塊安裝在二維的印刷電路板表面,還可以為散熱器的實(shí)施提供更多的空間,從而潛在的為提高功率耗散的額定值而提供支持。
對(duì)于以快速的步伐進(jìn)行大力投入、從而跟上技術(shù)發(fā)展與服務(wù)創(chuàng)新的潮流的主要的網(wǎng)絡(luò)公司來說,超大規(guī)模數(shù)據(jù)中心正在迅速的成為一種關(guān)鍵的基礎(chǔ)設(shè)施。在世界各地的超大規(guī)模數(shù)據(jù)中心內(nèi),對(duì)速度更快的電氣與光學(xué)信號(hào)技術(shù)的開發(fā)工作將繼續(xù)加速大規(guī)模的數(shù)據(jù)聚合。100 G和400 G光學(xué)技術(shù)的最新發(fā)展可以促成廣泛而又高效的超大規(guī)模數(shù)據(jù)中心連接解決方案,為內(nèi)容日益豐富的數(shù)據(jù)密集型應(yīng)用提供大力支持。
本文來源于《電子產(chǎn)品世界》2018年第8期第27頁,歡迎您寫論文時(shí)引用,并注明出處。
評(píng)論