AI 時(shí)代推動(dòng)存儲(chǔ)器的創(chuàng)新與發(fā)展
在物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能 (AI) 的推動(dòng)下,從交通運(yùn)輸、醫(yī)療保健到零售和娛樂等眾多行業(yè)將走上轉(zhuǎn)型之路,應(yīng)用材料公司將其統(tǒng)稱為 AI 計(jì)算時(shí)代。
本文引用地址:http://www.ex-cimer.com/article/201908/403512.htm在以前的計(jì)算時(shí)代中,大型機(jī)/小型機(jī)、PC/服務(wù)器和智能手機(jī)/平板電腦均受益于摩爾定律的進(jìn)步,伴隨著 2D 微縮,產(chǎn)品的性能、功耗和面積/成本(也稱為“PPAC”)得以同步提升。
雖然 AI 時(shí)代的各類應(yīng)用正在蓬勃發(fā)展,但摩爾定律卻放緩了腳步;因此,行業(yè)需要在 2D 微縮以外取得突破,以全新方式推動(dòng) PPAC 的提升。具體而言,我們需要新的計(jì)算架構(gòu)、新材料、新結(jié)構(gòu)(特別是節(jié)省面積的 3D 結(jié)構(gòu)),以及用于芯片堆疊和異構(gòu)設(shè)計(jì)的高級(jí)封裝。
AI 時(shí)代的架構(gòu)變化正在對(duì)邏輯和存儲(chǔ)器產(chǎn)生影響。機(jī)器學(xué)習(xí)的算法大量地使用通用邏輯中極為復(fù)雜的矩陣乘法運(yùn)算,這推動(dòng)了加速器及其存儲(chǔ)器的轉(zhuǎn)變。AI 計(jì)算包含兩種明顯不同的存儲(chǔ)器任務(wù):第一種是存儲(chǔ)計(jì)算的中間結(jié)果;第二種是存儲(chǔ)與訓(xùn)練模型相關(guān)的權(quán)重。
性能和功耗對(duì)于云計(jì)算和邊緣計(jì)算都十分重要,而存儲(chǔ)器方面的創(chuàng)新能夠?yàn)榇颂峁┲ΑR环N使用現(xiàn)有存儲(chǔ)器技術(shù)的方法是“近存儲(chǔ)器”,其中大量工作存儲(chǔ)器被壓縮并放置在物理上與邏輯存儲(chǔ)器緊密相鄰的位置,通過高速接口連接。例如,3D 堆疊和硅通孔技術(shù)正愈發(fā)受到歡迎。作為這些應(yīng)用中的“工作存儲(chǔ)器”,SRAM 和 DRAM 的一個(gè)主要缺點(diǎn)在于它們是易失性存儲(chǔ)器,需要持續(xù)供電來保存數(shù)據(jù)(如權(quán)重)。
為了降低云和邊緣的功耗,設(shè)計(jì)人員正在評(píng)估兼具高性能和非易失性的新型存儲(chǔ)器,因?yàn)樗鼈冎挥性谥鲃?dòng)讀寫時(shí)才需要使用電源。有三種方案引領(lǐng)著新型存儲(chǔ)器, 它們分別是磁性RAM (MRAM)、相變式 RAM (PCRAM) 和電阻式 RAM (ReRAM) 。
不同于使用電荷,上述三款存儲(chǔ)器利用新材料產(chǎn)生不同的電阻率狀態(tài) ,而高低電阻依次表示 1 和 0。MRAM 利用磁場(chǎng)方向的變化來控制電阻率。PCRAM 利用了從非晶態(tài)到晶態(tài)的材料排列結(jié)構(gòu)變化。ReRAM 在材料中創(chuàng)造了一條電流通路。PCRAM 和 ReRAM 均提供電阻率的中間階段,這可在每個(gè)單元中存儲(chǔ)多層的比特?cái)?shù)據(jù)。
我們來了解一下 AI 時(shí)代的計(jì)算應(yīng)用,了解它們?nèi)绾卧谖磥硭{(lán)圖中推動(dòng)創(chuàng)新。
圖 1. AI 時(shí)代推動(dòng)半導(dǎo)體創(chuàng)新的復(fù)興之路
物聯(lián)網(wǎng)邊緣應(yīng)用可被劃分為低性能/低功耗應(yīng)用,以及高性能/高功耗應(yīng)用。
例如,采用 AI 算法的安全攝像頭是一種低性能/低功耗應(yīng)用,AI 算法非常適合面部和語音識(shí)別等應(yīng)用。設(shè)計(jì)目標(biāo)是盡可能多地處理邊緣數(shù)據(jù),并且僅將重要信息傳輸?shù)皆?。由于采樣頻率較低,因此性能要求也很低。功耗(包括待機(jī)功耗)至關(guān)重要,對(duì)于電池供電設(shè)備尤為如此。
目前,業(yè)界在邊緣設(shè)備中使用 SRAM 存儲(chǔ)器。SRAM 并非理想選擇,因?yàn)槊總€(gè)存儲(chǔ)單元需要多達(dá)六個(gè)晶體管,而且源泄漏功率會(huì)很高。在存儲(chǔ)權(quán)重方面,SRAM 的能效并不突出,特別是在低頻設(shè)計(jì)中使用時(shí)。作為替代方案,MRAM 可確保將晶體管密度提高數(shù)倍,從而實(shí)現(xiàn)更高的存儲(chǔ)密度或更小的芯片尺寸。MRAM 的另一個(gè)關(guān)鍵特性在于,這種產(chǎn)品經(jīng)專門設(shè)計(jì),可以安裝到嵌入式片上系統(tǒng)產(chǎn)品 (SOC) 的后端互連層中。MRAM 可用于存儲(chǔ) SOC 的操作系統(tǒng)和應(yīng)用程序,無需使用嵌入式閃存芯片便可實(shí)現(xiàn)這一目的,從而減少了系統(tǒng)芯片的總數(shù)和成本。
高性能“近邊緣”應(yīng)用,如缺陷檢測(cè)和醫(yī)學(xué)篩檢,則需要更高的性能。MRAM 的一種變型稱作自旋軌道轉(zhuǎn)矩 MRAM (SOT-MRAM),經(jīng)證實(shí),這種產(chǎn)品在速度和功耗方面可能優(yōu)于自旋轉(zhuǎn)移力矩 MRAM (STT-MRAM)。
云計(jì)算需要盡可能高的計(jì)算性能,而訓(xùn)練時(shí)則需要將大量數(shù)據(jù)轉(zhuǎn)移到機(jī)器學(xué)習(xí)加速器附近,相應(yīng)地,需要為機(jī)器學(xué)習(xí)加速器提供較大的片上 SRAM 緩存并輔以大型片外 DRAM 陣列——這就要求使用持續(xù)的電源。用電量對(duì)云服務(wù)提供商非常重要,因?yàn)?AI 時(shí)代的數(shù)據(jù)會(huì)呈指數(shù)級(jí)增長(zhǎng),而電網(wǎng)功率有限且成本高昂。PCRAM 的功耗和成本比 DRAM 更低,而性能則比固態(tài)硬盤和機(jī)械硬盤更高,因此成為云計(jì)算架構(gòu)的首選方案。
除了上述“二進(jìn)制”的邊緣應(yīng)用、近邊緣應(yīng)用和云應(yīng)用方面具備廣闊前景外,在存儲(chǔ)內(nèi)計(jì)算的研究也在日益深入。可以想象,在存儲(chǔ)器陣列中為機(jī)器學(xué)習(xí)執(zhí)行頻繁的矩陣乘法運(yùn)算。設(shè)計(jì)人員正在探索偽交叉點(diǎn)架構(gòu),其中權(quán)重存儲(chǔ)在各個(gè)存儲(chǔ)器節(jié)點(diǎn)上。PCRAM、ReRAM 甚至鐵電場(chǎng)效應(yīng)晶體管 (FeFET) 都是優(yōu)秀的備選方案,因?yàn)樗鼈兌加忻繂卧鄬哟鎯?chǔ)的潛力。目前而言,ReRAM 看起來是最適合此類應(yīng)用的存儲(chǔ)器??梢岳脷W姆定律和基爾霍夫定律在陣列內(nèi)完成矩陣乘法運(yùn)算,而無需向芯片內(nèi)移入和移出權(quán)重。多層單元架構(gòu)能夠?qū)崿F(xiàn)全新級(jí)別的存儲(chǔ)器密度,為設(shè)計(jì)和使用更大的模型提供支持。需要對(duì)新材料進(jìn)行全面的開發(fā)和工程設(shè)計(jì),才能將這些新的模擬存儲(chǔ)器付諸現(xiàn)實(shí),目前應(yīng)用材料公司正在積極探索部分極具代表性的方案。
當(dāng)摩爾定律的指數(shù)級(jí)發(fā)展速度逐漸減緩,AI 時(shí)代將迎來數(shù)據(jù)上的指數(shù)級(jí)增長(zhǎng)。這種壓力已經(jīng)在推動(dòng)著架構(gòu)、材料、3D 結(jié)構(gòu)以及用于芯片堆疊和異構(gòu)集成的先進(jìn)封裝不斷創(chuàng)新。存儲(chǔ)器與 AI 計(jì)算引擎的關(guān)系越來越緊密,最終,存儲(chǔ)器可能成為 AI 計(jì)算引擎本身。隨著這些創(chuàng)新嶄露頭角,我們將見證性能、功耗和密度(面積/成本)的顯著提升——隨著新型存儲(chǔ)器的逐步優(yōu)化,邊緣、近邊緣和云應(yīng)用的需求最終會(huì)得到滿足。我們需要硬件上的全面復(fù)興來釋放 AI 時(shí)代的全部潛力。
評(píng)論