光電混合計(jì)算新范式=光計(jì)算+光互聯(lián)
將數(shù)以億計(jì)的晶體管集成到指甲蓋大小的芯片上,并不斷提高其集成密度,是過去幾十年提高芯片算力的主要方法,也是引領(lǐng)業(yè)界超過半個(gè)世紀(jì)之久的摩爾定律的核心內(nèi)容。但由于人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等產(chǎn)業(yè)急速發(fā)展,數(shù)字經(jīng)濟(jì)浪潮席卷而來,作為核心生產(chǎn)力的算力需求激增,逐漸與芯片自身的物理極限產(chǎn)生矛盾,曾被視為“金科玉律”的摩爾定律正面臨失效的窘境。
本文引用地址:http://www.ex-cimer.com/article/202207/436436.htm光或?qū)⒊蔀榻鉀Q這一問題的突破口?光子具有高通量、低延遲、低能耗的優(yōu)勢,且不易受到溫度、電磁場和噪聲變化的影響。此前,光子技術(shù)常被應(yīng)用于長距離通信傳輸領(lǐng)域,光纖通信已成為各種通信網(wǎng)的主要傳輸方式。然而,光在人類社會(huì)進(jìn)步中可發(fā)揮的作用可能遠(yuǎn)比我們想象中來得更大、更重要。
曦智科技率先將目光投向光領(lǐng)域,提出開創(chuàng)性的“光電混合計(jì)算新范式”概念,試圖給集成電路產(chǎn)業(yè)提供一個(gè)區(qū)別于目前傳統(tǒng)芯片計(jì)算范式的全新“解題思路”。近期,曦智科技CTO孟懷宇博士在“DeepTech科技創(chuàng)新周先進(jìn)計(jì)算論壇”上以“計(jì)算需求大爆發(fā)下的光電混合計(jì)算新范式”為主題,對這一概念進(jìn)行了詳細(xì)介紹。
從光計(jì)算開始的新革命
所謂光計(jì)算,是指利用光的物理特性完成線性計(jì)算。孟懷宇博士以生活中常見的光計(jì)算——眼鏡為例,指出了光計(jì)算的三大優(yōu)勢。
首先是低延遲,眼鏡后的觀察者感知到眼鏡前的圖像變化所需時(shí)間等于以光速穿越這一段距離所耗的時(shí)間——幾乎微乎其微;其次是低能耗,眼鏡放置在那里本身并不消耗能量,所有能量都消耗在光信號(hào)的產(chǎn)生與吸收;最后是高通量,當(dāng)光信號(hào)發(fā)生高速變化時(shí),眼鏡后接收的信息也會(huì)發(fā)生高速變化,即眼鏡的二維傅里葉變換正在進(jìn)行高速的大通量計(jì)算。
雖然眼鏡不可編程,但它的原理為光計(jì)算的實(shí)現(xiàn)帶來了靈感。為了用光來實(shí)現(xiàn)一個(gè)可編程的真正有用的計(jì)算系統(tǒng),曦智科技創(chuàng)始人兼CEO沈亦晨博士開創(chuàng)性地提出了利用集成光子技術(shù)實(shí)現(xiàn)深度學(xué)習(xí)的全新計(jì)算架構(gòu),并于2017年創(chuàng)立曦智科技。2019年,曦智科技發(fā)布了全球首款光子芯片原型板卡,成功驗(yàn)證了以光子替代電子進(jìn)行高性能計(jì)算的開創(chuàng)性想法。2021年,在此基礎(chǔ)上,曦智科技團(tuán)隊(duì)又發(fā)布了高性能光子計(jì)算處理器PACE(Photonic Arithmetic Computing Engine,光子計(jì)算引擎),通過重復(fù)矩陣乘法和巧妙利用受控噪聲組成的緊密回環(huán)來實(shí)現(xiàn)低延遲,從而生成了伊辛問題(Ising)的高質(zhì)量解決方案。
孟懷宇博士表示:“ PACE主要利用了光計(jì)算的低延遲優(yōu)勢。其可在3納秒內(nèi)完成伊辛問題單次迭代計(jì)算,速度達(dá)到目前高端GPU的800倍以上。”
PACE與目前高端GPU性能對比
光互聯(lián),光電混合計(jì)算新范式的另一半
“光電混合計(jì)算新范式”的另一半重點(diǎn)則是解決數(shù)據(jù)互聯(lián)問題,即“內(nèi)存墻”(memory wall)問題,主要包括容量和帶寬兩部分內(nèi)容。算力爆發(fā)的今天,相應(yīng)硬件的增長速度卻望塵莫及。以AI典型模型Transformer為例,兩年時(shí)間,算法大小提升240倍的背后是硬件存儲(chǔ)容量僅提高2倍的事實(shí)。因此出現(xiàn)了內(nèi)存墻的容量瓶頸,即如何容納更大的應(yīng)用程序。
另一大挑戰(zhàn)則是帶寬瓶頸。孟懷宇博士解釋道,如果將芯片想象成一個(gè)平面方塊,則芯片算力與方塊的面積成正比,而芯片對外的帶寬與其邊長成正比。因此,當(dāng)芯片上晶體管密度越來越高時(shí),如果將芯片的邊長密度提高2倍,算力密度就將提高4倍。因此,無論是摩爾定律越往前走,還是通過新的計(jì)算范式來提高單位面積的算力,“喂飽”算力所需的帶寬就越將成為問題。在過去的20年中,硬件的算力提升了9萬倍,但DRAM帶寬及網(wǎng)絡(luò)帶寬只提升了30倍。
曦智科技給出的解決方案是一種數(shù)據(jù)互聯(lián)的新范式——光互聯(lián)。相較于電互聯(lián)的性能會(huì)隨距離增長而逐漸下降,光互聯(lián)受距離的影響則小得多。孟懷宇博士表示:“理想情況下,對超過10毫米的數(shù)據(jù)傳輸,使用光互聯(lián)更具優(yōu)勢,它能為解決帶寬瓶頸與容量瓶頸帶來更大可能,這也是曦智科技對光互聯(lián)新范式的底層邏輯。”
光互聯(lián)與電互聯(lián)對比
目前,光互聯(lián)解決方案已被應(yīng)用于數(shù)據(jù)中心中,但由于光模塊與使用光模塊的數(shù)字芯片的距離往往在1米以上,光互聯(lián)就被電互聯(lián)所限制了,從而導(dǎo)致光互聯(lián)的應(yīng)用范圍被局限于機(jī)架之間,機(jī)架內(nèi)部,甚至服務(wù)器內(nèi)部的光互聯(lián)使用非常少。為消除電互聯(lián)的瓶頸,曦智科技所倡導(dǎo)的光互聯(lián)新范式就是將光電轉(zhuǎn)換和數(shù)字芯片高度集成,形成“芯片出光”,并以此拓寬眾多計(jì)算范式的可行性。孟懷宇博士將目前數(shù)據(jù)中心的“資源池化”趨勢作為例子,他表示:“我會(huì)把這種大范圍的資源池化理解成計(jì)算資源的‘共享經(jīng)濟(jì)’。目前一個(gè)服務(wù)器要去訪問另一個(gè)服務(wù)器的資源會(huì)比較困難,因?yàn)樗鼈兊幕ヂ?lián)性較差。而光互聯(lián)就可以幫助實(shí)現(xiàn)更好的互聯(lián)性,讓大范圍的資源共享變成可能。最終通過資源池化,我們可以讓每一個(gè)計(jì)算芯片都能訪問更大的內(nèi)存,有更大的帶寬,從而解決內(nèi)存墻問題。”
光互聯(lián)讓數(shù)據(jù)中心“資源池化”變?yōu)榭赡?/span>
超大規(guī)模光電混合集成是實(shí)現(xiàn)以上一切的底層技術(shù)。對此,曦智科技也已完成了相關(guān)技術(shù)驗(yàn)證,成功將一塊集成硅光芯片和一塊電子芯片以3D封裝形式垂直堆疊,使兩塊芯片之間的距離變得最小,實(shí)現(xiàn)了比現(xiàn)有的 Transceiver高1000倍以上的集成密度。
最后,孟懷宇博士還介紹了曦智科技“光電混合晶圓級(jí)計(jì)算平臺(tái)”解決方案。如今,業(yè)界許多公司推出了“晶圓級(jí)計(jì)算平臺(tái)”的概念,即通過更大的芯片面積來實(shí)現(xiàn)更高的性能,如Cerebras公司的WSE芯片。但它們的局限也顯而易見:首先由于電不適合長距離通信,因此只能進(jìn)行最近鄰數(shù)據(jù)傳輸;其次,它們將面臨更為嚴(yán)重的“內(nèi)存墻”問題。對此,“光電混合晶圓級(jí)計(jì)算平臺(tái)”解決方案通過晶圓級(jí)片上光互聯(lián),實(shí)現(xiàn)任意互聯(lián)拓?fù)?、低延遲及低能耗。同時(shí),為了打破“內(nèi)存墻”,可設(shè)立一個(gè)遠(yuǎn)端的資源池,并通過高效率的光互聯(lián),直接接入晶圓級(jí)計(jì)算平臺(tái)內(nèi)部的光網(wǎng)絡(luò),最終實(shí)現(xiàn)所有計(jì)算資源的最優(yōu)配置。
曦智科技“光電混合晶圓級(jí)計(jì)算平臺(tái)”
自2017年成立以來,曦智科技一直致力于通過以光計(jì)算與光互聯(lián)組成的光電混合計(jì)算新范式,持續(xù)為客戶提供更具創(chuàng)造性的高效算力支撐。截止2022年3月,曦智科技累計(jì)融資超過14億人民幣,領(lǐng)跑全球光子計(jì)算賽道。其基于光互聯(lián)的最新解決方案目前正在持續(xù)研發(fā)中,將于近期以產(chǎn)品形式正式發(fā)布。
評(píng)論