<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 770億晶體管的中國(guó)第一算力通用GPU芯片!壁仞科技BR100亮相海外

          770億晶體管的中國(guó)第一算力通用GPU芯片!壁仞科技BR100亮相海外

          作者: 時(shí)間:2022-09-19 來源:快科技 收藏

          8月9日,國(guó)內(nèi)科技創(chuàng)新企業(yè)(Birentech)正式發(fā)布了BR100系列通用計(jì)算GPU,號(hào)稱算力國(guó)內(nèi)第一,多向指標(biāo)媲美甚至超越國(guó)際旗艦產(chǎn)品。

          本文引用地址:http://www.ex-cimer.com/article/202209/438306.htm



          當(dāng)?shù)貢r(shí)間8月22日,第34屆Hot Chips芯片大會(huì)首日演講,NVIDIA Hopper、AMD Instinct MI200、Intel Ponte Vecchio三大巨頭的通用GPU紛紛秀出肌肉,而與之并肩亮相的,就是BR100。



          會(huì)上,聯(lián)合創(chuàng)始人、CTO洪洲與壁仞科技聯(lián)合創(chuàng)始人、總裁徐凌杰進(jìn)行了題為“Biren BR100 : Accelerating Datacenter Scale AI Computing”的主題演講,為來自全球的專業(yè)聽眾介紹了BR100芯片的特點(diǎn)與原創(chuàng)芯片架構(gòu)的細(xì)節(jié)。



          根據(jù)介紹,作為主要用于加速數(shù)據(jù)中心規(guī)模通用計(jì)算的芯片,BR100具有極高的算力密度,單卡16位浮點(diǎn)算力達(dá)到PFLOPS級(jí)別,并具備高速片上與片外互連帶寬。



          BR100采用7nm制程工藝、Chiplet小芯片設(shè)計(jì)和CoWoS 2.5D封裝技術(shù),以O(shè)AM模組形態(tài)部署,能夠在通用UBB主板上形成8卡點(diǎn)對(duì)點(diǎn)全互連拓?fù)洹?/p>



          為了支持強(qiáng)大的算力,BR100配備了超過300MB的片上高速緩存,用于數(shù)據(jù)的暫存和重用,以及64GB的HBM2E高速內(nèi)存。



          它的核心計(jì)算單元由大量通用流式處理器組成,具備通用計(jì)算和2.5D GEMM架構(gòu)的專用張量加速算力。



          在原創(chuàng)架構(gòu)層面,壁仞科技按照深度學(xué)習(xí)等通用負(fù)載的計(jì)算特點(diǎn),提供一系列針對(duì)數(shù)據(jù)流的增強(qiáng)特性,包括特殊的C-Warp協(xié)同并發(fā)模式、張量數(shù)據(jù)存取加速器TDA、NUMA/UMA訪存模式、近存儲(chǔ)計(jì)算等。這些特性是BR100能夠在算力和能效比上達(dá)到全球領(lǐng)先水準(zhǔn)的關(guān)鍵。



          此外,壁仞科技還介紹了一種新的TF32+數(shù)據(jù)類型,具備比TF32數(shù)據(jù)類型更高的精度。



          在軟件方面,壁仞科技還介紹了BIRENSUPATM軟件棧,其核心編程模型具有C/C++編程接口和運(yùn)行時(shí)API,風(fēng)格與主流的開發(fā)語言和編程范式類似。



          它能夠使開發(fā)者在BR100上非常容易地進(jìn)行編程開發(fā),同時(shí)大幅降低代碼遷移工作量,實(shí)現(xiàn)從主流編程環(huán)境向BIRENSUPA平臺(tái)的無縫遷移。



          資料顯示,壁仞科技BR100集成了多達(dá)770億晶體管,規(guī)模上堪比人類大腦神經(jīng)細(xì)胞,已經(jīng)非常接近800億個(gè)晶體管的NVIDIA GH100計(jì)算核心,而且BR100系列芯片一次就點(diǎn)亮成功了!



          性能方面,INT8整數(shù)計(jì)算2048 Tops(每秒2048萬億次)、BF16浮點(diǎn)計(jì)算1024 TFlops(每秒1024萬億次)、TF32+浮點(diǎn)計(jì)算512 TFlops(每秒512萬億次)、FP32雙精度浮點(diǎn)256 TFlops(每秒256萬億次)。



          此外,它的外部IO帶寬達(dá)2.3TB/s,支持64路編碼、512路解碼,還支持PCIe 5.0、CXL互連協(xié)議。





          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();