<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > EDA/PCB > 設計應用 > 院士論壇：集成電路推動處理器的發展歷程及未來展望

院士論壇：集成電路推動處理器的發展歷程及未來展望

—— 劉明院士在“2023中國計算機大會”的講演摘錄

作者：祝凱時間：2024-03-17來源：EEPW收藏

編者按：2023年10月底，CNCC2023（2023 中國計算機大會）在沈陽召開。10 月28 日，中國科學院院士、復旦大學教授、CCF（中國計算機學會）集成電路設計專家委員會主任劉明做了“集成電路：計算機發展的基礎”報告。她介紹了三部分：集成電路如何推動微處理器的發展，AI領域專用架構如何實現計算和存儲的融合，新器件、架構、集成技術的展望。

本文引用地址：http://www.ex-cimer.com/article/202403/456414.htm

引言

集成電路（IC）和計算機相伴相生，之間的關系非常緊密。集成電路的集成度和性能的持續進步，推動了計算機算力、能效的快速提升。與此同時，計算的新應用拓展也驅動了集成電路等基礎器件的電路架構、工藝、集成技術的不斷創新。

1 IC如何推動微處理器的發展

實際上，通用計算機早于集成電路出現——20世紀40年代，基于真空電子管的通用計算機就在密碼破譯、導彈的軌跡計算以及原子彈的研制等方面發揮了重要的作用。

隨著固態器件即晶體管的發明，基于晶體管的計算機的算力急速提升，成本也大幅下降，使得計算機的應用從軍事領域拓展到商業領域。

特別值得一提的是20世紀70年代初期，英特爾只是一家100多人的小企業，因接受了日本Busicom公司的訂單委托，做一款用于計算器的處理芯片，最終英特爾完成了在單個芯片上實現了一個完整的處理器的開發，誕生了第一個商用的通用處理器。該處理器被英特爾命名為4004。4004 采用10 μm 的工藝，在12 mm² 的面積上集成了2300個晶體管，算力達60KOPS，已有RISC架構雛形。

這款芯片非常有價值，因為它開啟了英特爾新的發展時代，也使英特爾在集成電路制造領域成為一家偉大的企業。從更嚴格的意義上看，著名的摩爾定律是按照英特爾的尺寸微縮來定義的。

從上世紀70 年代的4004/10 μm到現在的5 nm技術，大概經歷了20 代的制程技術（如圖1）。如果較粗地進行劃分，可分為三個階段：早期，是物理尺寸微縮的階段，制造技術的進步主導了集成電路的發展，集成電路從小規模、中規模到大規模、超大規模。中期，發展到100 nm以下后，單純地靠尺寸微縮已無法維持集成電路的高速發展，這時依靠物理尺寸微縮和電路架構創新，來共同推動集成電路的發展，此時集成電路進入了SoC的時代。當前及未來，是集成芯片：chiplet-based integration，此部分將在第三部分探討。

圖1 集成電路微縮工藝歷史（以英特爾為例）

CPU在幾何尺寸上的微縮有效的時期也稱為Dennard微縮定理（尺寸微縮從10μm到0.13μm，功率密度保持不變）的有效時期。由于工藝制造技術的進步，使CPU的性能快速提升，CPU從4位發展到64位，還包括了高速緩存、流水線、超標量、多發射體系架構等可以在單個芯片上實現，這是一個非?？焖侔l展的時期。

在這些背后，集成電路做了哪些技術提升？首先是光刻技術的不斷進步。光刻的基本原理是把掩模板的圖形轉移到襯底上，它的分辨率由式（1）這個簡單的公式決定：

從式（1）可知，提高分辨率有三個路徑： ①減少光源的波長λ，光源的波長從早期的436 nm（汞燈G-line）到今天EUV（極紫外線光源）技術的7 nm以下；②增加鏡頭的數值孔徑ΝΑ，從早期的0.33增加到現在的1.36；③減少k₁因子。

1.1 光刻技術。在過去60 多年的發展歷程中，光刻技術從光源、鏡頭的材料與結構、圖形傳遞模式（注：傳統的傳遞方式是透射式，EUV 光刻已經采用反射式）多元化創新，特別是對于今天的步進- 掃描的光刻機，最大的單次曝光面積已達26×33=858 mm²，遇到了“面積墻”。

1.2 晶圓的尺寸不斷增大。單個晶圓上可以獲得的芯片的數量越多，越能降低單個晶體管的制造成本。例如從2英寸到12英寸，單個基層晶體管的成本下降了8個數量級。這種成本優勢在存儲器里尤為明顯。

1.3 器件的結構變遷

1）平面架構

平面器件的結構經過一代代演進，發生了非常大的變化。以集成電路的關鍵技術——平面MOSFET 為例，教科書上的溝道之間導通的原理越來越復雜，以提高驅動的能力，改善靜電，減少材料和工藝帶來的波動性，最終提高產品的性能。

隨著尺寸的微縮，邏輯門的延遲在不斷減少，到了250 nm，Al（鋁）互連+SiO₂ 絕緣介質的技術節點，互聯RC 延時已經主導了系統性能，所以就誕生了新的互聯技術：由雙大馬士革Cu+low k 介質的工藝，代替了傳統互聯。這種技術首先由IBM 推向量產。1998年，IBM 發布了首款銅互連微處理器——IBM PowerPC 750，采用0.22 μm 工藝，相較于鋁互連，工作頻率提升33%。

到了100 nm以下之后，Dennard微縮定律停滯。這是由于漏電的增加，很難保持功率密度不變。這時單純靠幾何尺寸的微縮來實現高算力的增長趨緩，所以計算機微處理器朝著多核異構以及專用架構的方向發展。此時，集成電路也進入了制造和設計協同發展的時代。

在這個階段，制造技術有哪些變革？首先是由于尺寸不斷微縮，溝道導致的載流子遷移率降低，因此應變硅技術首先得到應用，在英特爾奔騰4 處理器90 nm 工藝中量產，主頻達到3 GHz。

隨著尺寸進一步微縮，傳統的SiO₂+ 多晶硅已經行不通了，所以高介電常數（High-k）+ 金屬柵得到應用，使漏電減少10 倍。這一技術也是英特爾首先在其45 nm工藝Core2/Xeon（酷睿2/ 至強）中得到量產，隨后在更小的節點上得到廣泛應用。

2）立體架構

隨著特征尺寸進一步微縮，平面器件結構被拋棄，FinFET取代平面器件，成為主流的器件結構。這一技術也是由英特爾2012 年首先在其22 nm FinFET工藝中得到驗證量產，生產Ivy Bridge 處理器。

3）異構多核、SoC 時代

從另一個角度——架構來看，以CPU 為例，就是從單核發展到多核，并進一步采用了異構多核的架構、協處理器、GPU架構、專用處理器等來提高性能。集成電路進入了SoC的時代。

集成電路技術經過多年的發展，也遇到了天花板。

以英偉達的GPU 為例，A100 芯片的單個芯片面積已達828 mm²，接近了光刻機的面積極限858 mm²。

從另一角度來看，單個芯片的面積不斷增大，芯片的良率也在急劇下降，這也就意味著SoC 芯片的進一步發展也面臨著諸多的挑戰。

因此，從處理器角度來看，吳明院士認為大致可以分成三個階段。

早期（1971—2005），制造技術扮演了重要的角色，單個die（芯片）的密度支持了更多的性能。單個die密度從最初的2300 到了26 億個晶體管。

中期（2005—2020），設計和制造的協同扮演了重要的角色，不僅單個die 的集成度和面積在不斷增大，使得桌面P 用SoC的晶體管數量從17億到20億個，而且單die也集成了更多的功能。

當前及未來（2000—未來），要從三個維度來思考未來的芯片：設計、制造、封測的協同優化，以探索晶圓級的單芯片的可能。

2 AI驅動的計算架構變革：實現計算和存儲的融合

人工智能（AI）算法的能力取決于其網絡模型的規模，這就意味著算法對于算力的需求增長是非?？斓?，每年大概超過10 倍。但芯片能夠提供的算力增長大概一年只有1.1~1.5 倍，可見兩者有巨大的差距。

這期間在芯片架構上也做過很多改進，從CPU到FPGA到GPU，性能上對于AI 處理有很大的提升，但最終無論是GPU還是CPU，廣義上都是一個存算分離的架構，都需要讀取存儲芯片的值，然后執行計算，也就意味著都面臨著存儲墻和功耗墻這兩個巨大的挑戰。

因此現在也提出了很多新的架構：①近存計算的架構，即盡可能把處理單元放置在存儲器的附近，以最小化由數據傳輸引起的延遲，功耗的損耗；②更激進的方法是用存儲來進行計算，即存內計算（或稱存算一體計算），這樣就無需數據的搬運（如圖2）。

圖2 計算和存儲架構的融合方案

以下介紹這兩種架構這些年的發展。

2.1 近存計算

是面向特定應用領域的一種專用計算架構?，F在產業上，如華為的達芬奇，Google TPU 屬于這類架構。這類架構需要開發專用的互聯存儲的架構，并優化矩陣運算陣列，以實現大算力、高帶寬、高效率以及低功耗。

但是近存計算的核心需要依賴一個非常大的片上存儲，通常需要有100MB 以上。然而隨著尺寸的微縮，存儲密度的增加要落后于邏輯器件的增加，這意味著SRAM/DRAM的密度增加是趨于飽和的。

因此，未來要想使近存計算的能效以及算力進一步提升，除了存儲器本身的進步以外，還需要在集成架構等方面的創新，例如wafer/die-to-wafer bonding，以及3D-IC、BEOL 晶體管和存儲器的集成等技術。

與此同時，一系列具有新原理的器件也得到人們的關注。例如產業界和學術界合作的兩類產品：用阻變存儲器（RRAM）和磁存儲器（STT-MRAM）來做近存計算，也取得了非常好的性能。

2.2 存內計算

也就是利用存儲器來去進行計算。嚴格地講，今天演變的有數字和模擬的。

以模擬為例，憶阻器件基于歐姆定理完成一次乘法，基于基爾霍夫定律完成一列累加。因為這樣一個架構不需要數據的搬運，所以可以很好地提高能效。這類新器件發展非?？?，從早期（2015 年）只有在器件和陣列上的概念的演示，到現在有片上的推理以及訓練的芯片，其集成度、算力和能效都在快速地提升，未來也有望支持面向實際應用場景的認知和學習的任務（如圖3）。

圖3 存算一體的發展趨勢

2.3 微電子所在近存計算架構上的進展

劉明院士所在的中科院微電子所團隊與國內主要半導體制造商合作，在28和14 nm工藝節點實現了阻變存儲器（RRAM）大規模陣列集成，開發了工業標準化高性能嵌入式存儲IP，并聯合產業界率先實現量產導入。整體平臺和國際一流廠商相比，有相當的競爭力。

利用該工藝平臺技術，劉明院士團隊做了一些存內計算的嘗試。首先在電路上做一些工作，來優化、規避這類存儲器潛在的問題，最終實現了百萬級的規模，能效在100TOPS/W，也可以支持矩陣向量乘法與矩陣轉置等一系列操作。

圖4 集成電路未來的發展（來源：TSMC，ISSCC 2021）

3 新器件、架構、集成技術的展望

集成電路發展從1958年誕生到今天，已有60 多年的歷史，這期間，無論是在底層維度，還是架構、進一步提升集成規模上，都面臨著非常多的挑戰，但是都一步步地走過來了，所以只要人的創造力還在，集成電路的未來還是非?？善诘?。

3.1 FinFET的變遷

首先從器件角度看，22 nm時，英特爾采用了FinFET的器件；但是對于大部分的代工產品，到了14 nm才是FinFET器件。FinFET也經歷了幾代演變，主要是把Fin越做越高，寬度越來越減?。ㄈ鐖D5），以提高它的密度和性能。

圖5 器件結構的創新

但是發展到了一定的階段也遇到了瓶頸：5 nm以下技術節點，較薄Fin很難進行外延，也就意味著載流子的遷移率開始變差，所以器件結構需要進一步地演變。下一步的演進就是把Fin水平地倒下來，就成了Nanosheet結構，有著更高的密度，可以實現更好的柵控能力。

這樣的器件結構又遇到了問題，就出來了Forksheet及CFET等不同的結構。這些器件結構都可以更好地利用三維的尺度，向今天的3D NAND來學習。

集成電路在基礎器件方面的尺寸的微縮，廣義上是為了提高密度。而提高密度的同時，器件的微縮帶來了性能的下降，就要通過材料和器件結構的創新來提升性能、降低功耗。

3.2 類腦計算

從計算架構的角度看，除了傳統的馮式架構，還有近存計算和存內計算。如果向生物界學習，生物腦是怎么工作的？生物腦是功能化的網絡拓撲，是由稀疏的脈沖的表達，同時它是大規模的并行計算，編碼采用時空的信息編碼。如果參考生物的腦，類腦芯片應該能夠實現什么樣的功能？

它應該是分布式的存儲，多核心的并行，它的神經元應該是脈沖的神經元，它可以實現高通量的異步的脈沖的路由，稀疏的時空計算。如果有這樣的功能，我們就不僅僅實現了存內計算的減少數據搬運，同時由于采用了脈沖驅動的異步計算，可以進一步降低功耗，同時時空關聯的編碼機制可以降低數據的冗余，實現動態的學習（圖6）。

圖6 類腦計算

進一步來看，未來如果借鑒于生物腦的結構和信息處理的方式，我們可以進一步降低 AI芯片的功耗，提高智能化。

但是這個領域還處于早期階段，所以無論是算法、異步電路的設計、芯片的架構、工具鏈等方面還面臨著諸多挑戰。

3.3 Chiplet（芯粒）

在怎么提高規模上，我們現在靠傳統的提高密度——當然這條路還在持續，但那種增加SoC芯片面積的路似乎已經遇到了天花板，我們可以采用另外一條路徑，就是集成芯片：chiplet-based integration（圖7）。

圖7 集成芯片/Chiplet(芯粒)技術

通過這種技術，可把復雜的SoC 芯片首先分解成芯粒（chiplet），然后再采用半導體制造的技術，將不同的芯粒集成在一個硅基的interposer 上，以實現更復雜系統的集成和應用。

這種技術的優勢是可以突破封裝連線的極限；另外，現在一顆復雜的SoC芯片設計的周期是非常漫長的，也可以突破現在光刻的單die 的面積極限，最終可以實現異質的、非標的工藝的集成。

3.3.1 Chipet的歷史

最早Chiplet 概念是由Xilinx（注：2022 年被AMD收購）在2011 年提出，Xilinx V72000T 采用4 顆相同的FPGA的顆粒，實現了2.5D集成2層堆疊。到了2016年，英偉達GP100 采用了2種芯粒(GPU+DRAM×4)，共5顆die，也實現了2.5D集成2層堆疊。2019年華為昇騰910采用了3種不同的芯粒（AI+DRAM+I/O），共6顆die實現了2.5D集成，也是2 層堆疊。2021年，英特爾Ponte Vecchio是一個非常神奇的結構，采用6種芯粒（AI+SRAM+DRAM+Base+Bridge），共有47顆芯粒，實現了3D的形成，是一個真正的3 層的堆疊。

可見，經過10 年的發展，集成芯片已經成為高性能計算芯片的一種關鍵技術，并且在朝著3D 多層堆疊、更多種類的芯粒、更大集成規模的趨勢發展。

3.3.2 我國的部分研究進展

關于之前提到的存內計算，優勢是能耗非常低，但也有顯而易見的缺點——算力不夠。如果借助于集成芯片技術，是否可以維持它的低能效，同時提高它的算力？劉明院士所在的復旦大學的團隊研發的芯粒存算一體集成芯片，基于2.5D集成扇出工藝，實現了算力和芯粒數量的同步增長（如圖8）。

圖8 可擴展的存算一體集成芯片

2023 年起，國家自然科學基金委批復“集成芯片前沿技術科學基礎”重大研究計劃立項。這個項目圍繞三個科學問題：①芯粒的數學描述和組合優化理論，②大規模芯粒的并行架構和設計自動化，③芯粒尺度的多物理場耦合機制和界面理論。

4 結束語

“什么時候摩爾定律終結？”劉明院士看到過無數的回答，也自問過這個問題該怎么回答。她最喜歡的答案是Mike Mayberry（筆者注：英特爾的首席技術官、實驗室總監，原英特爾技術與生產事業部副總裁兼元器件研究總監）的回答：只要人類還有想法，就總能夠使摩爾定律持續下去。

盡管我們今天面臨了各種巨大挑戰，包括底層的器件層面，電路架構層面，以及如何提高規模這種集成度的層面。但隨著從底層器件、制造技術、架構以及基于chiplet的集成等不同維度的持續創新，摩爾定律一定能走下去。因為它本來就不是一個科學定律，只是一個經濟觀察的規律。

今天晶體管的數量是每個package（封裝）里是100B，預計2035 年增加到1T。集成電路數量的大幅提升也必將推動計算進入Zetta 時代（如圖9）。

圖9 浮點運算次數與存儲的路線圖

用Robert Noyce（注：Fairchild 和英特爾聯合創始人，商用DRAM和微處理器聯合發明人）的話來結束這次講演：不要被歷史所拖累。去做一些美妙的事情吧。

（本文來源于《EEPW》2024.3）

關鍵詞： 202403 處理器 近存計算 存內計算 劉明院士 chiplet 芯粒

評論

相關推薦

工業機器人：繼汽車電子、人工智能之后的新風口

工控自動化 202403 工業機器人 | 2024-03-13

嵌入式系統綜述之三(老站轉)

amine | 2002-05-18

嵌入式系統硬件接口設計上

視頻嵌入式 Xscale 處理器 S3C2410 | 2009-10-27

兆易創新：致力于實現MCU市場全面覆蓋

嵌入式系統 202403 兆易創新 MCU | 2024-03-12

院士論壇：集成電路推動處理器的發展歷程及未來展望

EDA/PCB 202403 處理器近存計算存內計算劉明院士 chiplet 芯粒 | 2024-03-17

基于GP4020的GPS接收機基帶處理器電路

設計方案基于 GP4020 接收機基帶處理器 | 2009-07-06

Nios II 處理器中文小冊子（altera）

資源下載 altera Nios II 處理器中文小冊子 | 2007-12-12

嵌入式系統硬件接口設計下

視頻嵌入式處理器 SPI EP9315 S3C2410 | 2009-10-27

[轉帖]IBM可編程網絡處理器

amine | 2002-05-17

為實現“雙碳”目標，我國能源系統的發展方向

202403 雙碳 IC WORLD | 2024-03-18

運放型BBE處理器

設計方案運放型處理器 | 2009-07-06

芯科科技：MCU市場趨勢前瞻，探討技術革新與戰略布局

嵌入式系統 202403 芯科科技 MCU | 2024-03-12

嵌入式處理器選型下

視頻嵌入式 ARM 處理器 MIPS PXA27x | 2009-10-27

程控開關電源用于片心邏輯―Pentium Pro處理器

設計方案程控開關電源用于片心邏輯 Pentium 處理器 | 2009-07-06

AVR處理器上嵌入式Web Server

資源下載 AVR 處理器嵌入式 Web Server | 2007-02-28

嵌入式處理器選型上

視頻嵌入式 ARM 處理器 CN896 MIPS | 2009-10-27

AI神奇魅力的源點：相似度

智能計算 202403 LLM 相似度 CLIP Transformer | 2024-03-13

最新的ARM技術以及嵌入式發展動態下

視頻 ARM Cortex RISC 處理器 | 2009-11-25

PoerPC處理器的BDM調試頭原理圖

資源下載 PoerPC 處理器 BDM 調試頭原理圖 | 2007-02-09

英飛凌科技：MCU市場變革中的策略與應對

嵌入式系統 202403 英飛凌 MCU | 2024-03-12

嵌入式系統綜述之二(老站轉)

amine | 2002-05-18

Lisatek推出嵌入式處理器設計工具（摘自www.embed.com.cn）

xiaohua | 2002-06-17

常用嵌入式系統,處理器,開發工具分類(PDF)

資源下載嵌入式系統處理器開發工具分類 | 2007-02-28

德州儀器推出用于OMAPTM無線處理器的新型開發套件

hpnet | 2002-06-03

LINUX 精華

資源下載 LINUX 安裝處理器 windwos | 2007-02-16

從“AI向好”到“AI向善”，呼喚以人為本的AI

智能計算 202403 AI向善以人為本人工智能 | 2024-03-17

對數壓縮方式數字音頻處理器(DAC76、MN5110)

設計方案對數壓縮方式數字音頻處理器 DAC76 MN511 | 2009-07-06

AI是否可以讓我們躺平？數字技術能否帶來數字文明？

智能計算 202403 數字文明人工智能 | 2024-03-17

周期低谷喜迎客戶訂單數量雙增長 DigiKey得捷期待再攀新高

國際視野 202403 DigiKey 得捷 | 2024-03-13

SRS效果處理器

設計方案效果處理器 | 2009-07-06

技術專區

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();