突破中國芯片及其應(yīng)用的極限
上周,一則外媒報(bào)道十分引人關(guān)注,根據(jù)投資銀行 Bernstein 的數(shù)據(jù),目前,全球 40% 的 Arm 服務(wù)器在中國大陸使用。40%,這個(gè)比重還是很高的,之前沒有預(yù)料到,畢竟,無論是 CPU 架構(gòu) IP 開發(fā)和所有者,還是相關(guān)處理器在數(shù)據(jù)中心的應(yīng)用,主要還是由美國和歐洲公司主導(dǎo),包括 AWS,Ampere,Google,F(xiàn)ujitsu,Microsoft 和 Nvidia 在內(nèi)的多家芯片、系統(tǒng)設(shè)備和互聯(lián)網(wǎng)企業(yè)都在開發(fā)或采用了基于 Arm 架構(gòu)的 SoC,美國的大企業(yè)正在其數(shù)據(jù)中心中擴(kuò)大 Arm 處理器的布署規(guī)模。在這種情況下,中國大陸相對少數(shù)的幾家重點(diǎn)關(guān)注 Arm 的企業(yè),如阿里巴巴,華為和飛騰等,能夠取得全球 40% 的份額,是相當(dāng)高的比例了。
本文引用地址:http://www.ex-cimer.com/article/202308/449591.htm仔細(xì)想一想,40% 雖然在意料之外,但也在情理之中,畢竟,在中國大陸,有很多事業(yè)單位和國有金融企業(yè)和機(jī)構(gòu),它們所采用的核心設(shè)備及相關(guān) CPU 的信息在媒體渠道很少能看到,不像美國的 AWS,Google,Microsoft、Meta、甲骨文等企業(yè),采購和使用的 IT 設(shè)備及相關(guān)核心芯片經(jīng)常在媒體上看到。
另外,2019 年之后,在美國的封鎖和打壓下,中國大陸系統(tǒng)設(shè)備廠商越來越難以買到英特爾和 AMD 的高性能服務(wù)器 CPU,這在客觀上也迫使中國本土企業(yè)將更多資源和精力放在了基于 Arm 架構(gòu)自研的 CPU 上,雖然 Arm 授權(quán)的 IP 也受到了美國限制,但與直接購買英特爾和 AMD 的高性能服務(wù)器 CPU 相比,基于 Arm 自研 CPU 受到的限制會小很多,且有更多的操作空間。
可以說,在美國的限制政策下,中國大陸基于 Arm 架構(gòu)的 CPU 及服務(wù)器系統(tǒng)發(fā)展達(dá)到了一個(gè)新高度,在可預(yù)見的未來幾年,在全球市場的占比還將取得新突破。
上周,還有一則本土 CPU 取得技術(shù)和市場突破的消息,龍芯中科成功流片新一代四核處理器 3A6000。
中國電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室的測試結(jié)果顯示,龍芯 3A6000 在 2.5GHz 運(yùn)行頻率下,SPEC CPU 2006 base 單線程定/浮點(diǎn)分值分別達(dá)到 43.1/54.6 分,SPEC CPU 2006 base 多線程定/浮點(diǎn)分值分別達(dá)到 155/140 分,雙 DDR4-3200 內(nèi)存通道 Stream 實(shí)測帶寬超過 42GB/s,Unixbench 實(shí)測分值超 7400 分。綜合相關(guān)測試結(jié)果,3A6000 處理器總體性能與英特爾 2020 年上市的第 10 代酷睿四核處理器相當(dāng)。
相比于上一代龍芯 3A5000 桌面 CPU,3A6000 在相同工藝下單線程性能提升 60% 以上,全芯片多線程性能成倍提升。龍芯中科正在研發(fā)的服務(wù)器 CPU 將比上一代 16 核 3C5000 和 32 核的 3D5000 服務(wù)器 CPU 性能成倍提升。
作為中國本土 CPU 研發(fā)企業(yè)中的「異類」,早些年一直不被看好的龍芯,其價(jià)值在 2019 年之后得到突出體現(xiàn),近幾年,在自研指令集架構(gòu) LoongArch 的基礎(chǔ)上,不斷推出新的、性能更高且能將功耗控制在一定水平的 CPU,雖然也有一些波折,受到非議,但大方向還是對路的,未來幾年,相信還會有新的突破出現(xiàn)。
不止龍芯,近來有消息顯示,華為很可能會在年底將其自研的 5G 手機(jī)處理器帶回市場,如果真能實(shí)現(xiàn),無疑會是一針強(qiáng)心劑,無論是對華為,還是對中國本土手機(jī)處理器市場而言,都是如此。
華為 5G 手機(jī)處理器回歸的消息帶出了另一個(gè)話題,即中國本土 10nm 以下先進(jìn)制程芯片的制造。
由于受到美國限制,華為無法獲得臺積電或其它晶圓代工廠先進(jìn)制程產(chǎn)能,致使華為高端手機(jī)市占率每況愈下。因此,要想使 5G 手機(jī),特別是高端手機(jī)復(fù)活,有先進(jìn)制程工藝產(chǎn)線支持是關(guān)鍵。
此次,如果華為年底發(fā)布的新 5G 手機(jī)能搭載自研處理器的話,說明中國本土晶圓代工廠的制程工藝水平又上了一個(gè)臺階,備受關(guān)注的晶圓代工龍頭 N+1 制程工藝(與 7nm 工藝相近)很可能實(shí)現(xiàn)了新的突破,特別是在芯片量產(chǎn)的良率方面,或許能給市場提供更穩(wěn)定的支持。
中國本土晶圓代工廠,特別是以發(fā)展先進(jìn)制程工藝為目標(biāo)的廠商,在近幾年遇到了很大困難,核心問題就是先進(jìn)制程半導(dǎo)體設(shè)備,由于受到美國限制,無論是來自美國,還是來自歐洲的半導(dǎo)體設(shè)備廠商,都很難向中國本土晶圓廠出售先進(jìn)制程設(shè)備了,使得這些晶圓廠發(fā)展先進(jìn)制程工藝產(chǎn)線的工作極為艱難,只能靠美國限制政策正式生效前的短暫時(shí)期,拿到了有限數(shù)量的先進(jìn)設(shè)備,結(jié)合原有設(shè)備,組合出新產(chǎn)線,但這樣的晶圓廠硬件水平很難量產(chǎn)出高良率的先進(jìn)芯片。在這種情況下,產(chǎn)業(yè)對中國本土先進(jìn)半導(dǎo)體設(shè)備的呼聲越來越高。
近期,有消息稱,中國本土企業(yè)研制的先進(jìn)光刻設(shè)備將在年底出貨,雖然與 ASML 的先進(jìn) EUV 和 DUV 設(shè)備相比還有不小的差距,但通過工藝技術(shù)的改進(jìn),例如采用多重曝光技術(shù),可以明顯縮小這種差距。這些對中國本土芯片制造業(yè)水平的提升是利好的。不過,總體而言,中國大陸先進(jìn)制程芯片制造的工藝水平與國際大廠相比,差距依然比較大,還需要本土半導(dǎo)體設(shè)備企業(yè)和科研院所不斷努力,爭取量產(chǎn)出更多先進(jìn)設(shè)備。
除了芯片設(shè)計(jì)和制造,中國大陸在高性能計(jì)算系統(tǒng)構(gòu)建方面也受到了限制,特別是當(dāng)下最為火爆的 AI 服務(wù)器系統(tǒng),由于無法買到英偉達(dá)最先進(jìn)的 GPU 產(chǎn)品 A100 和 H100,中國大陸相關(guān)企業(yè),如阿里、騰訊和華為,只能退而求其次,采用現(xiàn)有處理器芯片,并簡化 AI 模型和程序。
據(jù)悉,通過采用英偉達(dá)低性能版本的 A800 和 H800,騰訊推出了一款新的計(jì)算系統(tǒng),進(jìn)行 AI 模型訓(xùn)練。但是,這種方法的成本很高,因?yàn)?H800 的用量大概是 H100 的三倍,才能獲得類似的效果。
有消息稱,為了控制成本,有中國本土公司設(shè)計(jì)出了采用不同芯片類型組合訓(xùn)練 AI 大模型的方法,例如,使用英偉達(dá)的 A100、V100 和 P100,以及華為 Ascends 組合成一個(gè)系統(tǒng)。不過,這種方法的技術(shù)難度較大,且可靠性難以保證。
此外,中國本土公司還在軟件技術(shù)方面下功夫,以減少訓(xùn)練 AI 大模型的算力要求,也就是用軟件彌補(bǔ)硬件性能的不足。
突破后的效應(yīng)
可見,雖然受到種種限制,但中國本土電子半導(dǎo)體產(chǎn)業(yè)依然在前進(jìn),當(dāng)然,這種進(jìn)步的速度是緩慢且艱難的。
在看到中國電子半導(dǎo)體相關(guān)企業(yè)尋找各種應(yīng)對策略,且有一定成效之后,美國政府又坐不住了,提出了新的限制措施,主要體現(xiàn)在:有意進(jìn)一步限制 AI 芯片出口,可能針對英偉達(dá)為中國大陸特供的 A800 和 H800;加強(qiáng)對中國大陸電子半導(dǎo)體產(chǎn)業(yè)投資的限制;可能會進(jìn)一步限制中國本土成熟制程產(chǎn)線的發(fā)展。
這里特別關(guān)注一下成熟制程方面的限制。盡管美國去年 10 月出臺的規(guī)定減緩了中國大陸先進(jìn)制程芯片制造能力的發(fā)展,但基本上沒有影響 14nm 以上較為成熟制程技術(shù)的能力。成熟制程種類繁多,市場規(guī)模大,且競爭充分,是中國本土芯片制造業(yè)發(fā)展較好的選擇。
不久前,美國商務(wù)部長吉娜·雷蒙多在美國企業(yè)研究所的一次小組討論中表示:「中國投入大量資金補(bǔ)貼成熟制程芯片產(chǎn)能,這是我們需要思考并與盟友合作解決的一個(gè)問題?!拱莸钦晃桓呒壒賳T表示,雖然沒有采取行動的時(shí)間表,但正在收集相關(guān)信息。
就目前情況看,美國在成熟制程方面限制中國本土產(chǎn)業(yè)發(fā)展的顧慮較多,其中很重要的一項(xiàng)就是如果中國大陸成熟制程芯片產(chǎn)能大幅減少的話,美國需要轉(zhuǎn)移相關(guān)產(chǎn)能,且規(guī)模很大,這樣,很多美國企業(yè)需要承擔(dān)相應(yīng)成本,而美國企業(yè)并不愿意投資那些必須與接受大量政府補(bǔ)貼的中國大陸晶圓廠競爭的產(chǎn)線。據(jù)悉,美國政府正在衡量西方半導(dǎo)體公司投資此類項(xiàng)目的意愿,然后再決定采取什么行動。
與美國政府已采取或想采取的行動不同,美國半導(dǎo)體企業(yè),特別是行業(yè)排名前列的芯片大廠,都十分看重在中國大陸的發(fā)展,繼英偉達(dá)之后,英特爾于近期推出了中國特供版本 AI 芯片 Gaudi 2。而且,就在上周,AMD 也表達(dá)了推出中國專供版本 AI 芯片的意愿,該公司 CEO Lisa Su 表示,AMD 看到了中國大陸 AI 市場的銷售潛能,不排除為相關(guān)客戶開發(fā)定制化產(chǎn)品的可能。她說:「我們的計(jì)劃當(dāng)然會遵守美國的出口管制規(guī)定,但我們也確實(shí)相信,有機(jī)會為正在尋找 AI 解決方案的中國大陸客戶開發(fā)產(chǎn)品,我們會繼續(xù)努力朝那個(gè)方向走?!?/span>
Lisa Su 沒有詳細(xì)說明 AMD 的計(jì)劃,如果做的話,該公司可能會優(yōu)化一些 Instinct MI 系列加速器,例如計(jì)劃在今年第四季度推出的最新 Instinct MI300。
除了推出定制化芯片,英特爾還于近期與深圳市南山區(qū)政府合作,成立了英特爾大灣區(qū)創(chuàng)新中心,重點(diǎn)關(guān)注人工智能、芯片應(yīng)用和邊緣計(jì)算。英特爾的這一舉動似乎釋放出了一個(gè)信號,那就是不久前英特爾、英偉達(dá)和高通等美國芯片巨頭 CEO 與白宮高層進(jìn)行了閉門會談,表達(dá)不愿意失去中國大陸市場的態(tài)度和決心,或許,會談期間,芯片大廠與美國政府達(dá)成了某種妥協(xié)或默契,使得像英特爾這樣的美國芯片巨頭敢于在當(dāng)前的形勢下做出與深圳市深化合作的決定。當(dāng)然,這樣的合作肯定不是在幾天時(shí)間內(nèi)想出并執(zhí)行的,相信已經(jīng)籌備了一段時(shí)間,但最終決定執(zhí)行,還是要將美國政府的態(tài)度和未來政策作為重要參考要素的。
面對美國政府不斷變化的限制措施,以及美國芯片廠商多個(gè)版本的專供芯片,未來,中國本土設(shè)計(jì)和制造中高端芯片的決心是否會隨著國際供應(yīng)鏈的松動而發(fā)生變化呢?
我們要看到,中國專供版芯片只是臨時(shí)解決方案,并不能從根本上解決問題,對于那些美國芯片廠商來說,開發(fā)定制化芯片來應(yīng)對美國政府出口限制政策是對研發(fā)資源的巨大浪費(fèi),對于中國本土產(chǎn)業(yè)來說,這樣的專供芯片具有很強(qiáng)的不確定性,長遠(yuǎn)來看,依然是在被美國牽著鼻子走。
因此,即使中國大陸企業(yè)會購買這些專供版芯片,也不能完全依賴美國供應(yīng),更不能放棄自己的產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)建設(shè),中國必須發(fā)展本土的高端芯片制造業(yè)。
未來的極限在哪里?
據(jù)統(tǒng)計(jì),今年 6 月,中國大陸芯片產(chǎn)量達(dá)到 321.5 億個(gè),同比增長 5.7%,而前 5 個(gè)月芯片進(jìn)口量同比下降約 20%。來自海關(guān)總署的消息顯示,今年前 7 個(gè)月,中國大陸進(jìn)口集成電路 2701.7 億個(gè),同比減少 16.8%,價(jià)值 1.32 萬億元,同比下降 16.2%。
可以看出,中國本土芯片產(chǎn)量在持續(xù)增長,進(jìn)口在減少,總體來看,芯片自給率有所提高。不過,必須看到,本土生產(chǎn)的多為中低端產(chǎn)品,而進(jìn)口的則以中高端產(chǎn)品為主。
在可預(yù)見的未來一段時(shí)期內(nèi),伴隨著美國不斷變化的限制政策,中國大陸需要在芯片設(shè)計(jì)、制造,以及系統(tǒng)集成方面不斷取得突破,才能爭取主動權(quán),不陷入被動泥潭。
芯片設(shè)計(jì)方面,在沒有最先進(jìn) EDA 工具和國際先進(jìn)設(shè)計(jì)經(jīng)驗(yàn)輔助的情況下,中國本土企業(yè)能否設(shè)計(jì)出與國際高水準(zhǔn)保持同步的芯片?相信這一點(diǎn)實(shí)現(xiàn)起來,難度比芯片制造要小很多。目前,中國本土多家芯片設(shè)計(jì)企業(yè)都已具備先進(jìn)制程芯片設(shè)計(jì)能力和經(jīng)驗(yàn),雖然與高通和英偉達(dá)等大廠依然存在差距,但已不存在代差,且距離還在縮小。以 CPU 為例,中國大陸企業(yè)設(shè)計(jì)的產(chǎn)品很難拿到臺積電 7nm 及更先進(jìn)制程產(chǎn)能,目前,中國本土量產(chǎn) CPU 能獲得的最先進(jìn)制程工藝是 12nm,在這種情況下,以設(shè)計(jì)能力提升 CPU 性能見長的企業(yè)就凸顯了出來,如龍芯,即便被美國列入實(shí)體清單,無法拿到相關(guān)產(chǎn)業(yè)資源,其 CPU 依然能夠迭代前行,且性能在不斷提升。
芯片制造方面,任務(wù)最為艱巨,在目前的國際供應(yīng)鏈發(fā)展態(tài)勢下,要想制造出高水準(zhǔn)的芯片,不僅要提升晶圓廠的工藝水平,還需要相關(guān)設(shè)備廠的跟進(jìn),并要深度參與晶圓廠工藝產(chǎn)線建設(shè),此外,芯片設(shè)計(jì)與制造的融會貫通顯得尤為重要,這就是為什么我們不能放棄發(fā)展中國本土 IDM 的一個(gè)重要原因。只有做好以上工作,才能實(shí)現(xiàn)過去幾年經(jīng)常說的:用 14nm 制程工藝產(chǎn)線制造出相當(dāng)于 7nm 性能、功耗表現(xiàn)的芯片。
在芯片應(yīng)用和系統(tǒng)集成方面,特別是高性能計(jì)算數(shù)據(jù)中心和云端,在越來越難獲得國際大廠高端芯片的情況下,如何彌補(bǔ)因單一芯片算力不足而形成的系統(tǒng)性能缺失?前文提到了一些本土廠商的應(yīng)對策略,但那些方法大都很難持久,且不適合大規(guī)模應(yīng)用,必須在芯片層級有所突破才行。
評論