技術(shù)洞察 | 英飛凌CoolSiC?和CoolGaN?產(chǎn)品,升級電源和機架架構(gòu),滿足AI服務器的需求
前言
本文引用地址:http://www.ex-cimer.com/article/202501/465996.htm人工智能(AI)的迅猛發(fā)展推動了數(shù)據(jù)中心處理能力的顯著增長。如圖1所示,英飛凌預測單臺GPU的功耗將呈指數(shù)級上升,預計到2030年將達到約2000W [1] ,而AI服務器機架的峰值功耗將突破驚人的300kW。這一趨勢促使數(shù)據(jù)中心機架的AC和DC配電系統(tǒng)進行架構(gòu)升級,重在減少從電網(wǎng)到核心設(shè)備的電力轉(zhuǎn)換和配送過程中的功率損耗。
圖2(右)展示了開放計算項目(OCP)機架供電架構(gòu)的示例。每個電源架由三相輸入供電,可容納多臺PSU;每臺PSU由單相輸入供電。機架將直流電壓(例如,50V)輸出到母線,母線則連接到IT和電池架。
AI的發(fā)展趨勢要求對PSU功率進行革新,如圖2(左)所示。 接下來,我們將通過各代PSU的拓撲結(jié)構(gòu)和器件技術(shù)建議示例,來逐步介紹這些PSU的演變。
圖1 基于x86和Arm ? 架構(gòu)的服務器CPU
與GPU和TPU的電力需求對比
圖2 AI服務器PSU的功率演變(左);服務器機架架構(gòu)示例(右)。
AI服務器機架PSU的趨勢和功率演進
? 第一代AI PSU:在相同的架構(gòu)下提升功率,~5.5-8kW、50V out 、277V ac 、單相
當前的AI服務器PSU大多遵循ORv3-HPR標準 [9] 。相較于先前的ORv3 3 kW標準 [9] ,該標準的大部分要求(包括輸入和輸出電壓以及效率)保持不變,但增加了與AI服務器需求相關(guān)的更新,例如,更高的功率和峰值功率要求(稍后詳述)。此外,由于與BBU架的通信方式有所調(diào)整,輸出電壓的調(diào)節(jié)范圍變得更窄。
盡管每個電源架都通過三相輸入(400-480 V ac L-L)供電(見圖2),但每臺PSU的輸入仍為單相(230-277 V ac )。圖3展示了符合ORv3-HPR標準的第一代PSU的部署示例:PFC級可以采用兩個交錯的圖騰柱拓撲結(jié)構(gòu),其中,650V CoolSiC? MOSFET用于快臂開關(guān),600V CoolMOS? SJ MOSFET用于慢臂開關(guān)。DC-DC級可以選用650V CoolGaN?晶體管的全橋LLC,次級全橋整流器和ORing則使用80V OptiMOS? Power MOSFET。此外,示例還展示了一個中間級,也稱“延長保持時間”或“小型升壓”,其作用是減小大容量電容器的尺寸。該中間級由一個升壓轉(zhuǎn)換器組成,在線路周期掉電事件期間,通過儲能電容器放電,以調(diào)節(jié)LLC輸入電壓。在正常運行期間,升壓轉(zhuǎn)換器保持空閑狀態(tài),并通過低阻抗的600V CoolMOS? SJ MOSFET旁路。
圖3:第一代AI PSU的拓撲結(jié)構(gòu)及器件技術(shù)示例
? 第二代AI PSU:增加線路電壓,以實現(xiàn)更高的功率,~8-12kW、50Vout、277–347Vac、單相
如上所述,隨著機架功率增加到300kW以上,電源架的功率密度變得至關(guān)重要。 因此,下一代PSU的設(shè)計方向是,在單相架構(gòu)中實現(xiàn)8kW至12kW的輸出功率。 隨著每個機架的功率增加,數(shù)據(jù)中心中的機架數(shù)量在某些情況下,可能會受配電電流額定值和損耗的約束。因此,為了降低交流配電的電流和損耗,部分數(shù)據(jù)中心可能會將機架的交流配電電壓從400/480V提高到600V ac L–L(三相),同時將PSU的輸入電壓從230/277V ac 提高到347V ac (單相)。
雖然這一變化有利于數(shù)據(jù)中心的運行效率和資源利用,但會影響PSU的額定電壓和設(shè)計。在347V ac 的輸入電壓下,PFC的輸出電壓必須設(shè)定在575V dc 左右,這意味著傳統(tǒng)的650V器件的額定電壓已無法滿足要求。圖4展示了一個示例:第一代PSU使用的兩電平圖騰柱PFC被替換為400V CoolSiC? MOSFET的三電平飛電容圖騰柱PFC(3-L FCTP PFC)級。多電平功率轉(zhuǎn)換概念使得在使用較低額定電壓的開關(guān)器件的同時,支持更高的輸入電壓。憑借多電平拓撲結(jié)構(gòu)的頻率倍增效應,3-L FCTP PFC能夠帶來更高的效率和功率密度。最重要的是,CoolSiC?技術(shù)針對400V的較低擊穿電壓進行了優(yōu)化,與650V 和750V CoolSiC?參考器件相比,其FoM更為優(yōu)異(見圖5(左))。此外,圖5(右)顯示了導通電阻在整個溫度范圍內(nèi)的曲線,其中,400V CoolSiC? MOSFET的R DS(on) 100°C 僅比R DS(on) 25°C 高11%。R DS(on) 與T j 之間的這一平緩關(guān)系有助于CoolSiC? MOSFET實現(xiàn)更高的R DS(on) typ ,從而降低成本并提升開關(guān)性能。
對于DC-DC級來說,三相LLC拓撲結(jié)構(gòu)是一種理想選擇,其中,750V CoolSiC? MOSFET用于初級側(cè)開關(guān),80V OptiMOS? 5 Power MOSFET用于次級全橋整流器和ORing。由于增加了第三個半橋開關(guān)臂,該解決方案能夠提供更高的功率,有效降低輸出電流的紋波,并通過三個開關(guān)半橋之間的固有耦合實現(xiàn)自動電流分配。
圖4 第二代AI PSU的拓撲結(jié)構(gòu)和器件技術(shù)示例
圖5 400V CoolSiC?與650V和750V CoolSiC?對比,具有更優(yōu)的開關(guān)FoM和穩(wěn)定的R DS(on) 與結(jié)溫的關(guān)系:品質(zhì)因數(shù)(左),R DS(on) 與T j (右)
? 第三代AI PSU:三相架構(gòu)與400V配電,最高功率約為22kW,400Vout,480-600Vac,三相
為了進一步提高機架功率,第三代AI PSU將采用更具顛覆性的機架架構(gòu),具體如下:
PSU輸入: 從單相轉(zhuǎn)為三相,以提高功率密度,并降低成本
電源架PSU輸出電壓: 從50V提升到400V,以降低母線電流、損耗和成本
圖6展示了一個三相輸入、400V輸出的PSU部署示例,以及推薦的器件和技術(shù)。PFC級采用Vienna整流器,這是一種常用于三相PFC應用的拓撲結(jié)構(gòu)。其主要優(yōu)勢在于采用分離式總線電壓設(shè)計,因此可以使用650 V器件:通過使用雙倍數(shù)量的背靠背650V CoolSiC? MOSFET和1200V CoolSiC?二極管實現(xiàn)。PFC輸出配置為分離式電容器,每個電容器電壓為430V,并為全橋LLC轉(zhuǎn)換器供電,該轉(zhuǎn)換器在初級和次級側(cè)均使用650V CoolGaN?晶體管。兩個LLC級在初級側(cè)串聯(lián),次級側(cè)并聯(lián),以向400V母線供電。
此外,也可以將兩個背靠背的650V CoolSiC? MOSFET替換為650V CoolGaN? 雙向開關(guān)(BDS),后者是真正的常關(guān)型單片雙向開關(guān)。這意味著一個CoolGaN? BDS即可取代4個分立式電源開關(guān),以實現(xiàn)相同的RDS(on),這是因為它在R DS(on) /mm 2 方面具備更高的芯片尺寸利用率。
圖6 第三代AI PSU的拓撲結(jié)構(gòu)和器件技術(shù)示例
WBG為 AI PSU帶來的優(yōu)勢
? CoolGaN?助力實現(xiàn)高峰值功率瞬變
寬禁帶(WBG)半導體(例如,CoolGaN? [2] )能夠在更高的開關(guān)頻率下,實現(xiàn)最佳效率,使轉(zhuǎn)換器在不影響轉(zhuǎn)換效率的前提下,實現(xiàn)更高的功率密度,因此,成為AI PSU的理想選擇。
除了AI PSU的額定功率顯著增加外,GPU在運行時還會拉動更高的峰值功率,并產(chǎn)生高負載瞬變(見圖7)。因此,DC-DC級的輸出必須具有足夠的動態(tài)響應能力,同時需確保電壓的過沖和下沖保持在規(guī)定的范圍內(nèi)。通過提升開關(guān)頻率,并增加控制環(huán)路帶寬,可以提高DC-DC級的輸出動態(tài)響應能力。
圖7 AI GPU所需的AI PSU峰值功率
? 400V CoolSiC? MOSFET可在3-L飛電容圖騰柱PFC中實現(xiàn)最高效率
使用 CoolSiC? MOSFET 400V的三電平級飛跨電容圖騰柱PFC(3-L FCTP PFC)不僅能夠?qū)崿F(xiàn)更高的交流輸入電壓(見第2.2節(jié)),且相較CoolSiC? 650V和750V參考器件,其品質(zhì)因數(shù)(FoM)更佳,因此還能提供顯著的功率密度和效率優(yōu)勢。經(jīng)過優(yōu)化的電感器設(shè)計(包括尺寸、材料和繞組)和3L拓撲結(jié)構(gòu)中的R DS(on) 選擇,結(jié)合更低的開關(guān)損耗,能夠?qū)崿F(xiàn)平緩的效率曲線: 峰值效率超過99.3%,滿載效率超過99.15% (見圖8)。
圖8 效率對比:3-L FCTP PFC與2-L TP PFC
結(jié)論
了滿足數(shù)據(jù)中心對AI應用的需求,新一輪技術(shù)角逐已經(jīng)啟動,推動了機架和PSU的電力需求大幅增長。其中,AI PSU的功率需求已經(jīng)從3-5.5kW,提升到8-12kW(單相)和高達22kW(三相)。這種需求給數(shù)據(jù)中心運營商帶來了新的挑戰(zhàn),即如何優(yōu)化數(shù)據(jù)中心的空間和電力的效率和利用率。 應對這些挑戰(zhàn)需要采用新的機架架構(gòu)和AC-DC配電配置,使得基于CoolSiC?和CoolGaN?的設(shè)計處于PSU設(shè)計的前沿,致力于實現(xiàn)最佳效率和功率密度。
此外,新的寬禁帶器件在新型拓撲結(jié)構(gòu)中也展現(xiàn)了極佳的性價比,例如,在三電平飛跨電容圖騰柱PFC中采用400V CoolSiC? MOSFET,或在三相Vienna PFC中使用650V CoolGaN? BDS(詳見前文)。
總而言之,英飛凌的功率器件技術(shù)組合(硅、碳化硅和氮化鎵)和經(jīng)過優(yōu)化的柵極驅(qū)動IC產(chǎn)品組合,通過混合應用,為當前和下一代平臺及趨勢的發(fā)展提供了支持。這些組合充分利用了三種技術(shù)的優(yōu)勢,使PSU設(shè)計實現(xiàn)了最佳靈活性,并在效率、功率密度和系統(tǒng)成本之間達成平衡。此外,英飛凌還率先推出了全球首項300毫米氮化鎵功率半導體等先進技術(shù),進一步推動了文章 [10] 中所述的未來設(shè)計發(fā)展。
關(guān)于作者
Sam Abdel-Rahman擁有中佛羅里達大學電氣工程博士學位,效力英飛凌已十三年有余,現(xiàn)任高級首席系統(tǒng)架構(gòu)師,負責開發(fā)服務器/數(shù)據(jù)中心SMPS和可再生能源應用的應用路線圖。Sam在功率半導體行業(yè)擁有豐富的經(jīng)驗,專注于系統(tǒng)架構(gòu)、拓撲結(jié)構(gòu)和控制技術(shù)。
評論