2021年上市的人工智能芯片
隨著人工智能和深度學(xué)習(xí)領(lǐng)域的新發(fā)展,計(jì)算需求也在穩(wěn)步增長。任何現(xiàn)代人工智能技術(shù)的成功都依賴于計(jì)算,其規(guī)模即使在幾年前也是難以想象的。因此,更先進(jìn)的芯片和硬件正在開發(fā)和發(fā)布,以匹配復(fù)雜神經(jīng)網(wǎng)絡(luò)的處理能力。它們提供計(jì)算能力的能力取決于一個(gè)可以包裝的晶體管的最大數(shù)量; 一些晶體管也是為了有效地執(zhí)行現(xiàn)代人工智能系統(tǒng)所要求的特定計(jì)算而量身定做的。本文將介紹一些在2021年憑借超凡技術(shù)在市場上嶄露頭角的頂級人工智能芯片。
本文引用地址:http://www.ex-cimer.com/article/202203/432235.htm英特爾 Loihi 2
Loihi 2是英特爾的第二代神經(jīng)形態(tài)研究芯片,其架構(gòu)支持最新類型的神經(jīng)啟發(fā)算法和應(yīng)用程序,同時(shí)提供高達(dá)10倍的處理速度和15倍的資源密度,每個(gè)芯片有100萬個(gè)神經(jīng)元,并提高了能源效率。與過去的工藝技術(shù)相比,使用極紫外輻射光刻技術(shù)簡化了版圖設(shè)計(jì)規(guī)則,使英特爾能夠快速開發(fā) Loihi 2。此外,Loihi 2芯片支持以太網(wǎng)接口,由于與一系列基于事件的視覺傳感器的無膠集成增加了支持,以及 Loihi 2芯片更大的網(wǎng)狀網(wǎng)絡(luò)。這種功能強(qiáng)大的芯片打開了一扇大門,新的神經(jīng)網(wǎng)絡(luò)模型,可以通過深度學(xué)習(xí)訓(xùn)練。
Google Tensor
由 Google Research 聯(lián)合設(shè)計(jì)的 Google Tensor 被認(rèn)為是 Google 機(jī)器學(xué)習(xí)的一個(gè)里程碑,它提供了最先進(jìn)的人工智能-機(jī)器學(xué)習(xí)模型所需要的驚人支持,例如動(dòng)作模式、面部無模糊、視頻語音增強(qiáng)、將 HDRnet 應(yīng)用于視頻。谷歌張量經(jīng)過精心設(shè)計(jì),以提供正確的計(jì)算性能、效率和安全水平。新的芯片可以運(yùn)行更先進(jìn)的,國家的最先進(jìn)的機(jī)器學(xué)習(xí)模型在更低的能源消耗水平。還支持計(jì)算攝影和未來視頻功能。它還有一個(gè)張量安全核心(Tensor security core) ,這是一個(gè)新的基于 cpu 的子系統(tǒng),由 Google 提供,用于未來幾代專用的安全芯片。
Ambarella CV52S
Amberella 的 CV52S 是其 AI 視覺系統(tǒng)芯片組合的擴(kuò)展。該 CV52S 在一個(gè)單一的低功耗設(shè)計(jì)中提供指數(shù)平滑的4 k 圖像處理、視頻編碼/解碼和 CVflow 計(jì)算機(jī)視覺處理。采用先進(jìn)的5nm 制程技術(shù),CV52S 使4kp60視頻記錄的功率消耗低于3w,先進(jìn)的 AI 處理速度為30 fps。此外,該芯片的 CVflow 結(jié)構(gòu)提供了深層神經(jīng)網(wǎng)絡(luò)(DNN)多處理,這是下一代智能攝像機(jī)的要求。CVflow 引擎具有高效并行運(yùn)行多個(gè)神經(jīng)網(wǎng)絡(luò)的能力,同時(shí)加速了傳統(tǒng)的計(jì)算機(jī)視覺算法,并提供了強(qiáng)大的計(jì)算機(jī)視覺加速能力。
Atlazo AZ-N1
今年1月發(fā)布的 Atlazo az-n1包括其高效的人工智能和機(jī)器學(xué)習(xí)處理器 Axon i,目標(biāo)是處理音頻、聲音、生物特征識別和其他傳感器信號,與目前市場上的其他解決方案相比,該處理器的功耗不到其他解決方案的一小部分。該處理器支持一系列 AI/ML 網(wǎng)絡(luò),包括 DNN、 LSTM 和 GRNN 以及流行的特征提取技術(shù)如 MFCC。一個(gè) Axon i 處理器可以執(zhí)行超過130個(gè)推論。Az-n1將用于多種產(chǎn)品的開發(fā),包括智能耳塞、助聽器和健康監(jiān)測設(shè)備。
Mythic m1076模擬矩陣處理器
該 m1076神話 AMP 可以提供高達(dá)25頂端人工智能高端應(yīng)用程序在一個(gè)單一芯片。該芯片集成了76個(gè) AMP 塊,并存儲了多達(dá)80m 的重量參數(shù),在沒有任何外部存儲器的情況下執(zhí)行矩陣乘法操作,這使得 m1076能夠提供桌面 GPU 的人工智能計(jì)算性能,同時(shí)消耗高達(dá)1/10的功耗,所有這些都集中在一個(gè)單獨(dú)的芯片上。使用這種功能強(qiáng)大的芯片,可以很容易地以更高的分辨率和更低的延遲執(zhí)行 AI-ML 模型,從而獲得更好的結(jié)果。
英偉達(dá) A100
英偉達(dá) a100是芯片制造商的旗艦數(shù)據(jù)中心 GPU,用于推理和培訓(xùn)。該芯片于去年首次推出,目前仍然在人工智能性能的多項(xiàng)基準(zhǔn)測試中占據(jù)主導(dǎo)地位。最近,a100在最新的 MLPerf 基準(zhǔn)中打破了16個(gè) AI 性能記錄,NVIDIA 聲稱這使 GPU 成為當(dāng)今市場上最快的商用產(chǎn)品培訓(xùn)性能。NVIDIA a100的張量核心與張量浮點(diǎn)數(shù)(TF32)提供了高達(dá)20倍的性能超過以前發(fā)布的 NVIDIA 伏特零代碼更改和額外的2x 提升自動(dòng)混合精度和 FP16。因此,像 BERT 這樣的培訓(xùn)工作量可以大規(guī)模解決,在一分鐘之內(nèi)解決2,048個(gè) A100 gpu,這是解決方案的世界紀(jì)錄。
總結(jié)
今天的尖端人工智能系統(tǒng)不僅需要特定于人工智能的芯片,還需要最先進(jìn)的技術(shù)。此外,所需的速度動(dòng)態(tài)性和成本效率的必要性,使得沒有最先進(jìn)的人工智能芯片,幾乎不可能開發(fā)和部署尖端的人工智能算法。這種人工智能技術(shù)的發(fā)展和應(yīng)用,反過來又增加了全球穩(wěn)定性,似乎對人工智能的未來大有裨益。
評論