崛起的中國芯 國產(chǎn)龍芯水平究竟如何?
在美國禁售芯片事件之后,龍芯作為“接班人”受到極大關注,對于國產(chǎn)芯龍芯的性能究竟如何,不少朋友產(chǎn)生了一些質(zhì)疑,此前我們已經(jīng)針對龍芯性能進行了部分測試。本篇旨在解答大家的疑惑,并幫助外界更好的了解龍芯的真實現(xiàn)狀。
本文引用地址:http://www.ex-cimer.com/article/273152.htm很多讀者提到上篇文章并沒有提及龍芯3B的浮點計算表現(xiàn);只比較整數(shù)測試項目,忽略浮點方面的SPEC_fp測試集是對號稱特別加強浮點性能的龍芯3B的不公。那么這里就介紹一下龍芯3B的浮點運算實際水平。
目前最新的龍芯3B-1500有8個核心,工作在1.2GHZ,1GHZ下理論雙精度浮點運算能力128G Flops。作為對比,i7-4770的理論浮點性能是256G Flops,而早期的i7-980X只有80G Flops。
但需要注意的是上述數(shù)據(jù)均為理論值。真實的浮點運算應用中它們的表現(xiàn)又是如何呢?計算所公布了龍芯3B 1.2GHZ運行SPEC_fp 2000浮點測試集的成績,該測試集考察處理器單線程浮點運算能力,我們來和兩款較老的CPU對比一下(ARM芯片很難找到這方面成績故不參與對比):
不幸的是,這里龍芯的差距更大了。單核心性能連i7-2600的十分之一都不到,實在凄慘。2009年古老的Core i5-760都遠遠勝過現(xiàn)在的龍芯3B。
為什么龍芯的理論數(shù)據(jù)會和實際表現(xiàn)有如此大的差異呢?我們要知道,處理器的理論浮點運算速度并不能直接反映實際表現(xiàn)。實際程序運行的快慢還與很多因素有關,其中非常重要的一項指標就是內(nèi)存和緩存性能。內(nèi)存性能不足,就算理論性能再高也是無濟于事的。
那么龍芯的內(nèi)存性能又是怎樣的呢?遺憾的是龍芯3B-1500雖然使用了雙通道DDR3 1066內(nèi)存,但由于訪存部分設計水平不佳等原因,實測帶寬只有理論值的10%左右-也就是2GB/s的水平。我們對比一下龍芯3B和主流CPU的內(nèi)存帶寬:
其實一些高速SSD的讀寫性能都要比龍芯的內(nèi)存更強,實在是諷刺。
SPEC CPU 2000測試集中龍芯的孱弱表現(xiàn)很大程度是因為帶寬拖了后腿。我們再看一項服務器常見的基準測試UnixBench 5.1.3中龍芯的表現(xiàn):
同樣不忍直視。在這項為多核心優(yōu)化的項目中8核心的龍芯3B還不如頻率相近的雙核賽揚。8核心的Atom C2750與四核心的XeonE3更是將龍芯遠遠甩開。服務器應用對內(nèi)存帶寬的要求較高,龍芯的帶寬瓶頸更為明顯。
現(xiàn)實是殘酷的:2008年,籌劃中的曙光千萬億次超級計算機本來準備使用龍芯3B為主要處理器,成為第一臺國產(chǎn)千萬億次超算;然而后來龍芯3B屢屢推遲發(fā)布,到2012年早期版本的3B小規(guī)模量產(chǎn)時,曙光項目組發(fā)現(xiàn)這些3B空有美好的理論參數(shù),實際表現(xiàn)太差,因此只采購了原計劃的30%的數(shù)量用于測試和研究。2013年新加坡曾計劃使用龍芯3B建造一臺超算系統(tǒng),后來也沒了下文。2014年計算所龍芯項目組組長胡偉武公開承認過去數(shù)年來龍芯的發(fā)展策略失敗,間接宣告了龍芯3B將成為歷史。
計算所宣稱下一代龍芯CPU的訪存性能將比現(xiàn)在提升10-20倍,屆時龍芯的帶寬瓶頸將得到極大緩解。倘若目標達成,未來的龍芯趕上AMD現(xiàn)在的水平還是很有希望的。不過CPU性能問題解決后,MIPS指令集的龍芯還將面臨軟件生態(tài)薄弱、周邊硬件支持不足等困境??傊?,龍芯在成為世界主流CPU企業(yè)之前還有很長的路要走。
c語言相關文章:c語言教程
評論