新的存儲(chǔ)器研究使密度躍升100倍
沿著材料工程前沿的新研究有望為計(jì)算設(shè)備帶來(lái)真正的性能改進(jìn)。以馬庫(kù)斯·海倫布蘭德德等人為首的研究小組和劍橋大學(xué)的相關(guān)人員認(rèn)為,一種基于氧化鉿層的新材料,通過(guò)電壓變化的鋇尖峰隧穿,融合了存儲(chǔ)器和處理綁定材料的特性。這意味著這些設(shè)備可以用于數(shù)據(jù)存儲(chǔ),提供 10 到 100 倍于現(xiàn)有存儲(chǔ)介質(zhì)的密度,或者它可以被用作處理單元。
本文引用地址:http://www.ex-cimer.com/article/202307/448915.htm這項(xiàng)研究發(fā)表在《科學(xué)進(jìn)展》雜志上,為我們指明了一條道路,通過(guò)這條道路,我們的計(jì)算設(shè)備可能會(huì)獲得更高的密度、性能和能源效率。事實(shí)上,基于該技術(shù)(稱(chēng)為連續(xù)范圍)的典型 USB 記憶棒可以容納比我們目前使用的 USB 記憶棒多 10 到 100 倍的信息。
正如 JEDEC 指出的那樣,RAM 的密度每四年翻一番,RAM 制造商需要數(shù)十年的時(shí)間才能最終達(dá)到與該技術(shù)今天所顯示的相同的密度水平。
該設(shè)備也是神經(jīng)形態(tài)計(jì)算隧道中的一盞燈。就像我們大腦中的神經(jīng)元一樣,這種材料(稱(chēng)為電阻開(kāi)關(guān)存儲(chǔ)器)有望同時(shí)用作存儲(chǔ)和處理介質(zhì)。這在我們當(dāng)前的半導(dǎo)體技術(shù)中根本不會(huì)發(fā)生:存儲(chǔ)單元所需的晶體管和材料設(shè)計(jì)安排與處理單元所需的晶體管和材料設(shè)計(jì)安排非常不同(主要是在耐用性方面,例如不遭受性能下降的能力),目前還沒(méi)有辦法將它們合并。
這種無(wú)法合并它們的情況意味著信息必須在處理系統(tǒng)及其各種緩存(當(dāng)考慮現(xiàn)代 CPU 時(shí))以及其外部?jī)?nèi)存池之間持續(xù)流動(dòng)。在計(jì)算中,這被稱(chēng)為馮諾依曼瓶頸,這意味著具有獨(dú)立內(nèi)存和處理能力的系統(tǒng)將從根本上受到它們之間的帶寬(通常稱(chēng)為總線)的限制。這就是為什么所有半導(dǎo)體設(shè)計(jì)公司(從 Intel 到 AMD、Nvidia 等)都設(shè)計(jì)專(zhuān)用硬件來(lái)加速這種信息交換,例如 Infinity Fabric 和 NVLink。
問(wèn)題在于這種信息交換會(huì)產(chǎn)生能源成本,而這種能源成本目前限制了可實(shí)現(xiàn)性能的上限。當(dāng)能量循環(huán)時(shí),也會(huì)存在固有的損耗,這會(huì)導(dǎo)致功耗增加(當(dāng)前硬件設(shè)計(jì)的硬性限制,也是半導(dǎo)體設(shè)計(jì)中日益重要的優(yōu)先事項(xiàng))以及熱量的增加——這是另一個(gè)硬性限制,導(dǎo)致越來(lái)越奇特的冷卻解決方案的開(kāi)發(fā),試圖讓摩爾定律暫時(shí)失效。當(dāng)然,還有可持續(xù)性因素:預(yù)計(jì)在不久的將來(lái),計(jì)算將消耗全球能源需求的 30%。
「在很大程度上,能源需求的爆炸式增長(zhǎng)是由于當(dāng)前計(jì)算機(jī)存儲(chǔ)技術(shù)的缺陷造成的,」劍橋大學(xué)材料科學(xué)與冶金系的第一作者馬庫(kù)斯·海倫布蘭德博士說(shuō)?!冈趥鹘y(tǒng)計(jì)算中,一側(cè)有內(nèi)存,另一側(cè)有處理,數(shù)據(jù)在兩者之間重新洗牌,這既需要能量又需要時(shí)間?!?/span>
正如您可能想象的那樣,合并內(nèi)存和處理的好處是相當(dāng)驚人的。雖然傳統(tǒng)存儲(chǔ)器只能具有兩種狀態(tài)(一或零),但電阻開(kāi)關(guān)存儲(chǔ)器件可以通過(guò)一系列狀態(tài)改變其電阻。這使得它能夠在更多的電壓下運(yùn)行,從而可以編碼更多的信息。在足夠高的水平上,這與 NAND 領(lǐng)域中發(fā)生的過(guò)程大致相同,每個(gè)單元位數(shù)的增加對(duì)應(yīng)于存儲(chǔ)單元設(shè)計(jì)中解鎖的更多可能電壓狀態(tài)。
區(qū)分處理和存儲(chǔ)的一種方法是,處理意味著信息正在按照其切換周期請(qǐng)求的速度進(jìn)行寫(xiě)入和重寫(xiě)(添加或減去、轉(zhuǎn)換或重組)。存儲(chǔ)意味著信息需要在較長(zhǎng)時(shí)間內(nèi)保持靜態(tài)——例如,可能因?yàn)樗?Windows 或 Linux 內(nèi)核的一部分。
為了構(gòu)建這些突觸設(shè)備,正如論文所提到的,研究團(tuán)隊(duì)必須找到一種方法來(lái)解決材料工程瓶頸,即均勻性問(wèn)題。由于氧化鉿 (HfO2) 不具有任何原子級(jí)結(jié)構(gòu),因此決定或破壞其絕緣性能的鉿和氧原子會(huì)隨機(jī)沉積。這限制了它在傳導(dǎo)電子(電力)方面的應(yīng)用;原子結(jié)構(gòu)越有序,造成的阻力就越小,速度和效率就越高。但研究小組發(fā)現(xiàn),在非結(jié)構(gòu)化氧化鉿薄膜中沉積鋇(Ba)會(huì)產(chǎn)生高度有序的鋇橋(或尖峰)。而且由于它們的原子結(jié)構(gòu)更加結(jié)構(gòu)化,這些橋可以更好地允許電子流動(dòng)。
海倫布蘭德說(shuō):「這些材料真正令人興奮的是它們可以像大腦中的突觸一樣工作:它們可以在同一個(gè)地方存儲(chǔ)和處理信息,就像我們的大腦一樣,這使得它們?cè)诳焖侔l(fā)展的人工智能和機(jī)器學(xué)習(xí)領(lǐng)域非常有前途?!?/span>
這些照片是用透射電子顯微鏡 (TEM) 拍攝的,展示了當(dāng)動(dòng)態(tài)變化的鋇尖峰穿過(guò)氧化鉿沉積時(shí),氧化鉿的沉積順序增加(無(wú)序和自然沉積,如圖 A 所示)。(來(lái)源:劍橋大學(xué)/Markus Hellbrand 等人)
但當(dāng)研究團(tuán)隊(duì)發(fā)現(xiàn)他們可以動(dòng)態(tài)改變鋇尖峰的高度,從而可以對(duì)其電導(dǎo)率進(jìn)行細(xì)粒度控制時(shí),樂(lè)趣就開(kāi)始了。他們發(fā)現(xiàn)尖峰可以以約 20 納秒的速率提供開(kāi)關(guān)能力,這意味著它們可以在該窗口內(nèi)改變其電壓狀態(tài)(從而保存不同的信息)。他們發(fā)現(xiàn)開(kāi)關(guān)耐久性 >10^4 個(gè)周期,內(nèi)存窗口 >10。這意味著雖然該材料速度很快,但它目前可以承受的最大電壓狀態(tài)變化次數(shù)約為 10,000 次循環(huán)。
它相當(dāng)于 MLC(多級(jí)單元)技術(shù)的耐用性,這自然會(huì)限制其應(yīng)用,使用這種材料作為處理介質(zhì)(其中電壓狀態(tài)快速變化,以保存計(jì)算及其中間結(jié)果的存儲(chǔ))。
粗略地計(jì)算一下,大約 20 ns 的切換導(dǎo)致工作頻率為 50 MHz(轉(zhuǎn)換為每納秒的周期數(shù))。當(dāng)系統(tǒng)全速處理不同狀態(tài)時(shí)(例如,作為 GPU 或 CPU 工作),這意味著鋇橋?qū)⒃?0,002 秒左右停止運(yùn)行(達(dá)到其耐用極限)。對(duì)于處理單元來(lái)說(shuō),它的性能似乎不夠。
就是存儲(chǔ)容量「密度高 10 到 100 倍」的 USB 記憶棒的用武之地。這些突觸設(shè)備可以訪問(wèn)比當(dāng)今最寬敞的 USB 記憶棒中最密集的 NAND 技術(shù)更多的中間電壓狀態(tài),是其 10 或 100 倍。
在鋇電橋的耐用性和開(kāi)關(guān)速度方面還有一些工作要做,但看起來(lái)該設(shè)計(jì)已經(jīng)是一個(gè)誘人的概念證明。更好的是,半導(dǎo)體行業(yè)已經(jīng)使用氧化鉿,因此需要克服的工具和物流噩夢(mèng)更少。
但這里有一個(gè)特別巧妙的產(chǎn)品可能性:想象一下,該技術(shù)已經(jīng)改進(jìn)到可以制造并可用于設(shè)計(jì) AMD 或 Nvidia GPU(目前其運(yùn)行頻率約為 2 GHz)。在某個(gè)世界中,顯卡具有重置出廠狀態(tài),完全作為內(nèi)存運(yùn)行(現(xiàn)在想象一下具有 10 TB 容量的顯卡,與我們假設(shè)的 USB 記憶棒相同)。
想象一下這樣一個(gè)世界:AMD 和 Nvidia 提供的本質(zhì)上是可編程 GPU,基于連續(xù)范圍的 GPU 芯片在最大存儲(chǔ)能力方面進(jìn)行了產(chǎn)品堆疊(記住比當(dāng)前 USB 密度高 10 到 100)。如果您是一位人工智能愛(ài)好者,試圖構(gòu)建自己的大型語(yǔ)言模型 (LLM),您可以對(duì) GPU 進(jìn)行編程,以便適量的合成設(shè)備(這些神經(jīng)形態(tài)晶體管)運(yùn)行處理功能—隨著復(fù)雜性的增加,我們無(wú)法確定模型最終會(huì)產(chǎn)生多少萬(wàn)億個(gè)參數(shù),因此內(nèi)存將變得越來(lái)越重要。
能夠決定圖形卡中的晶體管是完全用作內(nèi)存還是完全用作養(yǎng)眼放大器以將圖形設(shè)置提高到 11 個(gè),這完全取決于最終用戶;從休閑游戲玩家到高性能計(jì)算 (HPC) 安裝人員。即使這意味著我們芯片部件的壽命會(huì)明顯縮短。
總之,這是一項(xiàng)新技術(shù),不要操之過(guò)急,與所有技術(shù)一樣,當(dāng)它準(zhǔn)備就緒時(shí),它就會(huì)到來(lái)。
評(píng)論