談?wù)勌厮估男酒瑢嵙?/h1>
最近特斯拉再次成為了焦點。一方面,CEO馬斯克在推特的一舉一動引發(fā)話題;另一方面特斯拉公司陷入各種困境:上海工廠停產(chǎn)計劃延期、大量訂單被取消、股市表現(xiàn)崩盤......
本文引用地址:http://www.ex-cimer.com/article/202301/442346.htm山雨欲來風(fēng)滿樓,內(nèi)憂外患之中的特斯拉身上的光環(huán)似乎正在變?nèi)?。盡管存在許多挑戰(zhàn),特斯拉自研芯片的進度卻并沒有太受影響。近日供應(yīng)鏈消息顯示,特斯拉將使用4納米制程打造其下一代自動駕駛芯片,這一訂單可能會讓特斯拉成為第七大客戶。特斯拉在自研芯片上的努力,對于其他車企來說又能學(xué)到什么?
特斯拉的造芯之路
2021年在全球車企因缺芯大幅減產(chǎn)的時候,2021年特斯拉美國和中國的工廠開工率一直保持著9成左右,數(shù)據(jù)顯示2021年特斯拉全球交付量超過93萬,同比增長了87%。在各大車廠都因為缺芯發(fā)愁時,“特斯拉為何不缺芯”成為了各個車廠研究的課題。
究其原因,一方面,特斯拉在新冠疫情擴大的情況下也并未下調(diào)產(chǎn)量計劃,這對其從零部件廠商手中獲得穩(wěn)定采購發(fā)揮了有益作用。另一方面,特斯拉針對缺貨的半導(dǎo)體,通過改寫軟件為這些產(chǎn)品找到了替代品,由此減少了半導(dǎo)體缺貨對生產(chǎn)帶來的影響。由此可見,掌握芯片核心技術(shù),是特斯拉的競爭力之一。
特斯拉的造芯之路經(jīng)歷了從買到造的過程。特斯拉的智能駕駛功能經(jīng)歷了從 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升級,其硬件系統(tǒng)也從 Hardware 1.0 逐步升級至 Hardware 3.0。
在 HW 1.0 時代,特斯拉采用了來自 Mobileye 的 EyeQ 系列芯片。進入 HW 2.0 時代,特斯拉找到了英偉達作為 Mobileye 的替代,采用定制版的英偉達 Drive PX2 自動駕駛計算平臺(由 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構(gòu) GPU 芯片構(gòu)成)。后來又升級為 HW 2.5,增加了一顆 Tegra Parker 芯片。但馬斯克認為無論是Mobileye還是Nvidia,都無法滿足特斯拉對于性能、研發(fā)進度、成本、功率方面的要求。自此,特斯拉走上了自研芯片之路。
2016年,前AMD 首席架構(gòu)師Jim Keller加入特斯拉,任職Autopilot硬件工程師總裁。自此,特斯拉開啟了自研芯片之路。
特斯拉的自研芯片
特斯拉的自研芯片F(xiàn)SD用于HW 3.0 完全自動駕駛計算平臺中。2018 年 12 月,特斯拉開始使用新的硬件和軟件堆棧對員工汽車進行改造。2019 年 3 月,特斯拉開始在其 Model S 和 Model X 汽車中批量出貨 FSD 芯片和計算機。特斯拉 Model 3 的量產(chǎn)發(fā)貨于 2019 年 4 月開始。
FSD芯片采用三星的14納米工藝。包含 3 個四核Cortex-A72集群,總共 12 個 2.2 GHz 的 CPU,一個 1 GHz 的 Mali G71 MP12 GPU,2個2 GHz 的神經(jīng)處理單元,以及各種其他硬件加速器。FSD的圖像處理器能夠提供0.6TFLOPS計算能力,運行頻率為1GHz;2個神經(jīng)網(wǎng)絡(luò)處理器運行在2.2GHz頻率下能提供72TOPS的處理能力。
為了提升神經(jīng)網(wǎng)絡(luò)處理器的內(nèi)存存取速度以提升計算能力,每顆FSD芯片內(nèi)部還集成了32MB高速緩存。HW 3.0的圖像處理速度提升了21倍,成本降低了20%,代價僅僅是功耗從 57w 增加到了 72w。
安全系統(tǒng)方面FSD包含一個雙核鎖步CPU,該CPU對汽車執(zhí)行器進行最后決策,該CPU確定FSD控制器上的兩個FSD芯片生成的兩個策略是否匹配,以及是否可以安全地驅(qū)動執(zhí)行器。在相機接口方面,F(xiàn)SD芯片具有一個攝像頭串行接口,該接口能夠進行每秒高達25億像素的處理。
在視頻編碼器方面,F(xiàn)SD芯片集成了H.265(HEVC)視頻編碼器,可用于各種應(yīng)用,例如備用攝像頭的顯示,行車記錄儀和云剪輯記錄等。在圖像信號處理器方面,F(xiàn)DS芯片集成了內(nèi)部帶有24bit流水線的信號處理器(ISP),該流水線旨在處理特斯拉汽車上配備的八個HDR傳感器,并能夠每秒處理十億像素。而且具有降噪能力。
在神經(jīng)處理單元方面,F(xiàn)SD芯片集成了兩個定制的NPU,每個NPU都封裝了32MB的SRAM,用于存儲臨時數(shù)據(jù),從而減少數(shù)據(jù)存入主存儲器。
每個周期,NPU從SRAM讀取256字節(jié)的激活數(shù)據(jù)和另外128字節(jié)的權(quán)重數(shù)據(jù)到MAC陣列中。每個NPU擁有96x96 MAC,另外在精度方面,乘法為8x8bit,加法為32bit,兩種數(shù)據(jù)類型的選擇很大程度上取決于他們降功耗的努力。在2GHz的工作頻率下,每個NPU的算力為36.86TOPS,F(xiàn)SD芯片峰值算力為73.7TOPS。在點積運算之后,數(shù)據(jù)轉(zhuǎn)移到激活硬件,最后寫入緩存,以匯總結(jié)果。FSD支持許多激活功能,包括ReLU、SiLU和TanH。每個周期,將128字節(jié)的數(shù)據(jù)寫回SRAM。所有操作同時且連續(xù)地進行,重復(fù)直到完成整個計算。
特斯拉將一些硬件簡化,雖然這會增加軟件的復(fù)雜性,但這樣可以降低芯片的成本。
只有深入了解軟硬件之間的相互作用是什么,才能清楚到底應(yīng)該用什么樣的芯片去支持什么樣的算法。FSD芯片徹底奠定了特斯拉在自動駕駛領(lǐng)域的領(lǐng)先地位。通過自研芯片特斯拉讓硬件能與自家的軟件算法更加契合,獲得更好的兼容性和匹配度,提升產(chǎn)品核心競爭力。
特斯拉除了在自動駕駛芯片上有成果,更是在2022年推出了Dojo處理器芯片。該芯片由臺積電制造,采用7納米制造工藝,擁有500億個晶體管,芯片面積為645mm2,小于英偉達的A100(826 mm2)和AMD Arcturus(750 mm2)。據(jù)Dojo項目負責(zé)人Ganesh Venkataramanan介紹,特斯拉Dojo是史上最快的AI訓(xùn)練計算機。相比于業(yè)內(nèi)其他芯片,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空間節(jié)省5倍。而使得Dojo完成訓(xùn)練AI算法的重任,就是特斯拉自研神經(jīng)網(wǎng)絡(luò)訓(xùn)練芯片——D1芯片。
一家車企,不但攻克了自動駕駛芯片,還攻克了AI芯片。這樣的車企在現(xiàn)階段只有特斯拉一家,這是特斯拉在同行中芯片研發(fā)實力最好的體現(xiàn)。
特斯拉的特別之處
人們總把特斯拉與蘋果相提并論,特斯拉高度的定制化,是市場將特斯拉視作另一個蘋果的重要原因。與蘋果一樣,特斯拉經(jīng)歷了買芯片到完全自主研發(fā)的過程。蘋果從過去產(chǎn)品高度依賴英特爾的芯片,到現(xiàn)在M系產(chǎn)品性能完全不輸英特爾。特斯拉也是從依靠英特爾、英偉達到自研核心芯片。
同蘋果一樣,特斯拉是的大客戶。根據(jù)預(yù)測特斯拉或?qū)⒃?022年成為第七大客戶;此外,據(jù)產(chǎn)業(yè)內(nèi)消息,特斯拉Hardware 4.0 將由代工并在美國生產(chǎn),未來特斯拉在對于或許會更加重要。業(yè)界以特斯拉生產(chǎn)計劃預(yù)估,特斯拉明年生產(chǎn)規(guī)模將有望從300萬輛起跳。如果特斯拉最新自動駕駛芯片在 2023 年開始量產(chǎn),并且在 2024 年開始大批量上車的話,那么特斯拉的仍然會處于全球最領(lǐng)先的水平。
話說回來,車企造芯并不是什么新鮮事。雖然中國造車新勢力都宣稱要開啟自研自動駕駛芯片之路,但特斯拉是首先拿出成果,實現(xiàn)自動駕駛芯片量產(chǎn)的車企。還有一批車企,更多的是通過合作、投資其他公司的方式布局芯片賽道;并且他們選擇了門檻相對較低的MCU、IGBT等芯片。在沒有新的車企發(fā)布自研芯片之前,特斯拉仍將在同行中一騎絕塵。畢竟這么多年,也沒有幾個手機廠超越了蘋果。
離不開中國市場的特斯拉
中國市場是新能源汽車最大的市場,作為電動汽車銷量最高的車企,特斯拉離不開中國市場。為了降低成本,特斯拉也在中國投資了多個企業(yè)。特斯拉在中國山東濟南成立合資企業(yè),注冊資本額為1.5 億美元。顯示特斯拉除了正在利用臺積電龐大的產(chǎn)能,為自己的車用與超級運算的芯片提供重要來源之外,也在車用芯片的設(shè)計上積極布局。
根據(jù)上圖,特斯拉帶動了相當(dāng)一部分中國的供應(yīng)商的業(yè)務(wù)。對于中國供應(yīng)商來說,特斯拉來了,為了跟成本更低的中國品牌競爭,肯定要大規(guī)模國產(chǎn),這導(dǎo)致供應(yīng)鏈必然更傾向于中國本地廠商或者將原供應(yīng)商引入中國。不管怎么樣,特斯拉對應(yīng)的供應(yīng)鏈、產(chǎn)業(yè)鏈要在中國落地生根。這也就帶動了中國的新能源汽車供應(yīng)鏈。
總的來看,雖然面臨著多事之冬,特斯拉的芯片實力仍在。如果說特斯拉在芯片領(lǐng)域存在競爭,那么最大的對手并非其他車企,而是來自英偉達與高通。就在特斯拉自研芯片發(fā)布后,英偉達推出了最新的Orin 芯片,單芯片算力還是計算平臺算力達到了250TFLOP;2020 年初,高通發(fā)布了 Snapdragon Ride 自動駕駛計算平臺,其算力和能效比都碾壓了特斯拉 HW 3.0;2022年英偉達公布Thor芯片,單顆芯片算力達到2000TFLOPS,將于2025量產(chǎn),這一芯片更是將汽車芯片算力帶到了新時代。
隨著汽車算力競賽開啟,特斯拉還能領(lǐng)先多久?或許正在推特忙碌的馬斯克,并不知道答案。
最近特斯拉再次成為了焦點。一方面,CEO馬斯克在推特的一舉一動引發(fā)話題;另一方面特斯拉公司陷入各種困境:上海工廠停產(chǎn)計劃延期、大量訂單被取消、股市表現(xiàn)崩盤......
本文引用地址:http://www.ex-cimer.com/article/202301/442346.htm山雨欲來風(fēng)滿樓,內(nèi)憂外患之中的特斯拉身上的光環(huán)似乎正在變?nèi)?。盡管存在許多挑戰(zhàn),特斯拉自研芯片的進度卻并沒有太受影響。近日供應(yīng)鏈消息顯示,特斯拉將使用4納米制程打造其下一代自動駕駛芯片,這一訂單可能會讓特斯拉成為第七大客戶。特斯拉在自研芯片上的努力,對于其他車企來說又能學(xué)到什么?
特斯拉的造芯之路
2021年在全球車企因缺芯大幅減產(chǎn)的時候,2021年特斯拉美國和中國的工廠開工率一直保持著9成左右,數(shù)據(jù)顯示2021年特斯拉全球交付量超過93萬,同比增長了87%。在各大車廠都因為缺芯發(fā)愁時,“特斯拉為何不缺芯”成為了各個車廠研究的課題。
究其原因,一方面,特斯拉在新冠疫情擴大的情況下也并未下調(diào)產(chǎn)量計劃,這對其從零部件廠商手中獲得穩(wěn)定采購發(fā)揮了有益作用。另一方面,特斯拉針對缺貨的半導(dǎo)體,通過改寫軟件為這些產(chǎn)品找到了替代品,由此減少了半導(dǎo)體缺貨對生產(chǎn)帶來的影響。由此可見,掌握芯片核心技術(shù),是特斯拉的競爭力之一。
特斯拉的造芯之路經(jīng)歷了從買到造的過程。特斯拉的智能駕駛功能經(jīng)歷了從 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升級,其硬件系統(tǒng)也從 Hardware 1.0 逐步升級至 Hardware 3.0。
在 HW 1.0 時代,特斯拉采用了來自 Mobileye 的 EyeQ 系列芯片。進入 HW 2.0 時代,特斯拉找到了英偉達作為 Mobileye 的替代,采用定制版的英偉達 Drive PX2 自動駕駛計算平臺(由 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構(gòu) GPU 芯片構(gòu)成)。后來又升級為 HW 2.5,增加了一顆 Tegra Parker 芯片。但馬斯克認為無論是Mobileye還是Nvidia,都無法滿足特斯拉對于性能、研發(fā)進度、成本、功率方面的要求。自此,特斯拉走上了自研芯片之路。
2016年,前AMD 首席架構(gòu)師Jim Keller加入特斯拉,任職Autopilot硬件工程師總裁。自此,特斯拉開啟了自研芯片之路。
特斯拉的自研芯片
特斯拉的自研芯片F(xiàn)SD用于HW 3.0 完全自動駕駛計算平臺中。2018 年 12 月,特斯拉開始使用新的硬件和軟件堆棧對員工汽車進行改造。2019 年 3 月,特斯拉開始在其 Model S 和 Model X 汽車中批量出貨 FSD 芯片和計算機。特斯拉 Model 3 的量產(chǎn)發(fā)貨于 2019 年 4 月開始。
FSD芯片采用三星的14納米工藝。包含 3 個四核Cortex-A72集群,總共 12 個 2.2 GHz 的 CPU,一個 1 GHz 的 Mali G71 MP12 GPU,2個2 GHz 的神經(jīng)處理單元,以及各種其他硬件加速器。FSD的圖像處理器能夠提供0.6TFLOPS計算能力,運行頻率為1GHz;2個神經(jīng)網(wǎng)絡(luò)處理器運行在2.2GHz頻率下能提供72TOPS的處理能力。
為了提升神經(jīng)網(wǎng)絡(luò)處理器的內(nèi)存存取速度以提升計算能力,每顆FSD芯片內(nèi)部還集成了32MB高速緩存。HW 3.0的圖像處理速度提升了21倍,成本降低了20%,代價僅僅是功耗從 57w 增加到了 72w。
安全系統(tǒng)方面FSD包含一個雙核鎖步CPU,該CPU對汽車執(zhí)行器進行最后決策,該CPU確定FSD控制器上的兩個FSD芯片生成的兩個策略是否匹配,以及是否可以安全地驅(qū)動執(zhí)行器。在相機接口方面,F(xiàn)SD芯片具有一個攝像頭串行接口,該接口能夠進行每秒高達25億像素的處理。
在視頻編碼器方面,F(xiàn)SD芯片集成了H.265(HEVC)視頻編碼器,可用于各種應(yīng)用,例如備用攝像頭的顯示,行車記錄儀和云剪輯記錄等。在圖像信號處理器方面,F(xiàn)DS芯片集成了內(nèi)部帶有24bit流水線的信號處理器(ISP),該流水線旨在處理特斯拉汽車上配備的八個HDR傳感器,并能夠每秒處理十億像素。而且具有降噪能力。
在神經(jīng)處理單元方面,F(xiàn)SD芯片集成了兩個定制的NPU,每個NPU都封裝了32MB的SRAM,用于存儲臨時數(shù)據(jù),從而減少數(shù)據(jù)存入主存儲器。
每個周期,NPU從SRAM讀取256字節(jié)的激活數(shù)據(jù)和另外128字節(jié)的權(quán)重數(shù)據(jù)到MAC陣列中。每個NPU擁有96x96 MAC,另外在精度方面,乘法為8x8bit,加法為32bit,兩種數(shù)據(jù)類型的選擇很大程度上取決于他們降功耗的努力。在2GHz的工作頻率下,每個NPU的算力為36.86TOPS,F(xiàn)SD芯片峰值算力為73.7TOPS。在點積運算之后,數(shù)據(jù)轉(zhuǎn)移到激活硬件,最后寫入緩存,以匯總結(jié)果。FSD支持許多激活功能,包括ReLU、SiLU和TanH。每個周期,將128字節(jié)的數(shù)據(jù)寫回SRAM。所有操作同時且連續(xù)地進行,重復(fù)直到完成整個計算。
特斯拉將一些硬件簡化,雖然這會增加軟件的復(fù)雜性,但這樣可以降低芯片的成本。
只有深入了解軟硬件之間的相互作用是什么,才能清楚到底應(yīng)該用什么樣的芯片去支持什么樣的算法。FSD芯片徹底奠定了特斯拉在自動駕駛領(lǐng)域的領(lǐng)先地位。通過自研芯片特斯拉讓硬件能與自家的軟件算法更加契合,獲得更好的兼容性和匹配度,提升產(chǎn)品核心競爭力。
特斯拉除了在自動駕駛芯片上有成果,更是在2022年推出了Dojo處理器芯片。該芯片由臺積電制造,采用7納米制造工藝,擁有500億個晶體管,芯片面積為645mm2,小于英偉達的A100(826 mm2)和AMD Arcturus(750 mm2)。據(jù)Dojo項目負責(zé)人Ganesh Venkataramanan介紹,特斯拉Dojo是史上最快的AI訓(xùn)練計算機。相比于業(yè)內(nèi)其他芯片,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空間節(jié)省5倍。而使得Dojo完成訓(xùn)練AI算法的重任,就是特斯拉自研神經(jīng)網(wǎng)絡(luò)訓(xùn)練芯片——D1芯片。
一家車企,不但攻克了自動駕駛芯片,還攻克了AI芯片。這樣的車企在現(xiàn)階段只有特斯拉一家,這是特斯拉在同行中芯片研發(fā)實力最好的體現(xiàn)。
特斯拉的特別之處
人們總把特斯拉與蘋果相提并論,特斯拉高度的定制化,是市場將特斯拉視作另一個蘋果的重要原因。與蘋果一樣,特斯拉經(jīng)歷了買芯片到完全自主研發(fā)的過程。蘋果從過去產(chǎn)品高度依賴英特爾的芯片,到現(xiàn)在M系產(chǎn)品性能完全不輸英特爾。特斯拉也是從依靠英特爾、英偉達到自研核心芯片。
同蘋果一樣,特斯拉是的大客戶。根據(jù)預(yù)測特斯拉或?qū)⒃?022年成為第七大客戶;此外,據(jù)產(chǎn)業(yè)內(nèi)消息,特斯拉Hardware 4.0 將由代工并在美國生產(chǎn),未來特斯拉在對于或許會更加重要。業(yè)界以特斯拉生產(chǎn)計劃預(yù)估,特斯拉明年生產(chǎn)規(guī)模將有望從300萬輛起跳。如果特斯拉最新自動駕駛芯片在 2023 年開始量產(chǎn),并且在 2024 年開始大批量上車的話,那么特斯拉的仍然會處于全球最領(lǐng)先的水平。
話說回來,車企造芯并不是什么新鮮事。雖然中國造車新勢力都宣稱要開啟自研自動駕駛芯片之路,但特斯拉是首先拿出成果,實現(xiàn)自動駕駛芯片量產(chǎn)的車企。還有一批車企,更多的是通過合作、投資其他公司的方式布局芯片賽道;并且他們選擇了門檻相對較低的MCU、IGBT等芯片。在沒有新的車企發(fā)布自研芯片之前,特斯拉仍將在同行中一騎絕塵。畢竟這么多年,也沒有幾個手機廠超越了蘋果。
離不開中國市場的特斯拉
中國市場是新能源汽車最大的市場,作為電動汽車銷量最高的車企,特斯拉離不開中國市場。為了降低成本,特斯拉也在中國投資了多個企業(yè)。特斯拉在中國山東濟南成立合資企業(yè),注冊資本額為1.5 億美元。顯示特斯拉除了正在利用臺積電龐大的產(chǎn)能,為自己的車用與超級運算的芯片提供重要來源之外,也在車用芯片的設(shè)計上積極布局。
根據(jù)上圖,特斯拉帶動了相當(dāng)一部分中國的供應(yīng)商的業(yè)務(wù)。對于中國供應(yīng)商來說,特斯拉來了,為了跟成本更低的中國品牌競爭,肯定要大規(guī)模國產(chǎn),這導(dǎo)致供應(yīng)鏈必然更傾向于中國本地廠商或者將原供應(yīng)商引入中國。不管怎么樣,特斯拉對應(yīng)的供應(yīng)鏈、產(chǎn)業(yè)鏈要在中國落地生根。這也就帶動了中國的新能源汽車供應(yīng)鏈。
總的來看,雖然面臨著多事之冬,特斯拉的芯片實力仍在。如果說特斯拉在芯片領(lǐng)域存在競爭,那么最大的對手并非其他車企,而是來自英偉達與高通。就在特斯拉自研芯片發(fā)布后,英偉達推出了最新的Orin 芯片,單芯片算力還是計算平臺算力達到了250TFLOP;2020 年初,高通發(fā)布了 Snapdragon Ride 自動駕駛計算平臺,其算力和能效比都碾壓了特斯拉 HW 3.0;2022年英偉達公布Thor芯片,單顆芯片算力達到2000TFLOPS,將于2025量產(chǎn),這一芯片更是將汽車芯片算力帶到了新時代。
隨著汽車算力競賽開啟,特斯拉還能領(lǐng)先多久?或許正在推特忙碌的馬斯克,并不知道答案。
評論