基于TalusVortexFX的32/28納米節(jié)點設(shè)計方案
如worst-case和best-casePVT等特定系列條件就是我們俗稱的“角點”。在32/28納米技術(shù)節(jié)點,晶粒間與晶粒內(nèi)PVT差異十分明顯,解決大量模式和角點的工作是必不可少的。而且,前文提過的低功耗設(shè)計技術(shù)還會讓這一問題進一步復(fù)雜化。例如:在多電源多電壓(MSMV)技術(shù)情況下,可能一個電壓島的電壓值為其允許電壓范圍內(nèi)最低電壓,另一個電壓島的電壓值為其允許電壓范圍內(nèi)最高電壓,而其余電壓島的電壓值則會在這兩者之間。又如:有的芯片具有不同操作模式、擁有的一個或多個電路模塊位于在電源切斷的晶粒中心都將導(dǎo)致所需分析的角點情況顯著增加。
目前工具的問題在于:實現(xiàn)期間,芯片必須可在MMMC前景下進行優(yōu)化。許多現(xiàn)有系統(tǒng)通過先考量已假設(shè)的worst-case情景、然后對別的條件進行優(yōu)化的方式來著手處理優(yōu)化問題。遺憾的是,這可能導(dǎo)致過度悲觀主義,造成次優(yōu)性能。甚至更糟的是,如果這些關(guān)于哪些是worst-case情景的假設(shè)是錯誤的,那么結(jié)果可能是得到完全不管用的芯片。Talus1.2內(nèi)置有自帶MMMC處理功能,這意味著優(yōu)化過程不會漏掉任何情景。此外,Talus1.2的高速度和大容量還意味著,它能夠考慮到的不只是較小子集的實現(xiàn)情景,而是這款工具需要處理的整個系列的簽核情景。因此,Talus1.2可提供更好的性能和更短的實現(xiàn)周期。
以DistributedSmartSync技術(shù)增強TalusVortex的性能
前文所提及的物理實現(xiàn)流程每個步驟都是屬于計算密集型問題。而且為了解決伴隨技術(shù)節(jié)點而增加的復(fù)雜性,每個節(jié)點必須執(zhí)行的計算量也在提高。此外,當器件中所集成的功能越來越多時,設(shè)計的規(guī)模和復(fù)雜性會隨著每個節(jié)點而提高,物理實現(xiàn)相關(guān)的計算需求也會相應(yīng)增加。
再有一個因素就是:功能模塊的尺寸(為實現(xiàn)模塊功能所需的單元數(shù)量)也會隨著每項功能中包裝進越來越多特性而不斷增加。一些物理實現(xiàn)團隊偏愛層次化方案,而另外一些團隊則更喜歡使用“扁平化”方案,因為他們感覺在使用層次化方案時放棄了太多東西。
如果工具具有處理更大型電路模塊的能力,那么生產(chǎn)率就可得到即時的提升。例如:定義和微調(diào)層次化模塊間約束是極為耗時的資源密集型工作。如果這些工具具有處理更大型電路模塊的能力,那么就不需要定義子模塊間約束,因為不會有任何子模塊存在。這會大大提高生產(chǎn)率。
問題在于:多數(shù)布局布線解決方案都局限于只能處理幾百萬個單元。這常迫使物理實現(xiàn)工程師由于工具的局限性而不得不人工將電路模塊進行分割。而這也對工程師生產(chǎn)率造成了影響。
除非通過某些方式進行增強,不然的話即便目前最先進的Talus1.2布局布線解決方案的實際容量也只在200萬到500萬個單元之間,所提供的生產(chǎn)率為每天100-150萬單元。結(jié)果會造成一種由容量驅(qū)動的生產(chǎn)率差距。為了處理32/28納米節(jié)點設(shè)計,實現(xiàn)包括1000萬以上個單元的扁平電路模塊是必不可少的,如圖7所示(另見側(cè)邊欄)。
圖7.物理實現(xiàn)工具對扁平容量需求永不滿足。
在過去,一直是通過提供多線程功能來增強物理實現(xiàn)工具的容量和性能。在有些情況下,這些功能是被“生搬硬套”到的傳統(tǒng)工具上,效果有限。相較之下,Talus1.2中所有工具均完全內(nèi)置有自帶的多線程功能。
前文已說過,多線程對工具的作用十分有限;基于阿姆達爾定律(Amdahl’slaw)等計算機科學(xué)定律,(伴隨在其核心運行的每個線程)線程的數(shù)量越來越多所起到的效果卻越來越小。簡單來說,就是告訴我們,任何程序的加速均會受到并行數(shù)量的限制(也就是說,程序的最長序列片斷關(guān)系到程序的其它部分),如圖8所示。
圖8.阿姆達爾定律反映了多線程的局限性。
對于被用來創(chuàng)建ASIC/ASSP/SoC器件的物理實現(xiàn)工具來說,這些工具的并行部分約占到了50%到75%。就如我們從圖8中所看到的“甜蜜點(sweetspot)”,而在best-case情景下,使用8-10個處理核心,只可獲得約3倍的加速。
幸運的是,通過將物理實現(xiàn)任務(wù)分發(fā)到多臺機器上就可以克服阿姆達爾定律所定義的局限性。如圖9所示,采用全新DistributedSmartSync(分布式智能同步)技術(shù)的TalusVortexFX提供了與貫穿物理實現(xiàn)流程所有步驟(時鐘樹綜合除外,這種方法對它起不了什么作用)的智能同步技術(shù)相結(jié)合的獨特分布式管理。微捷碼將這款最新解決方案稱為TalusVortexFX,它以DistributedSmartSync技術(shù)增強了Talus1.2。
技術(shù)增強的TalusVortexFX流程的高級視圖
評論