論eASIC如何實(shí)現(xiàn)ASIC價(jià)值重歸
前言
在市場(chǎng)需求的驅(qū)動(dòng)下,為了提高速度、減少功耗、降低成本,半導(dǎo)體工藝遵循著摩爾定律,已經(jīng)跨入深亞微米DSM時(shí)代。從180nm、130nm、90nm、65nm,再細(xì)到45nm。32nm、22nm似乎就在不遠(yuǎn)的將來(lái)。若再往下縮減,晶體管的尺寸就接近單個(gè)原子,而原子無(wú)法縮減。為了追求尺寸更小、密度更高的器件而繼續(xù)微縮的代價(jià)將非常高昂,已經(jīng)意義不大了。而在另一方面,隨著半導(dǎo)體工藝的升級(jí)細(xì)化,ASIC設(shè)計(jì)的路也越走越艱難,越走越窄。Gartner研究中心多年來(lái)的市場(chǎng)跟蹤研究結(jié)果表明,ASIC設(shè)計(jì)項(xiàng)目數(shù)量的總體趨勢(shì)已經(jīng)無(wú)疑被認(rèn)為是向下的。最新技術(shù)的ASIC設(shè)計(jì)費(fèi)用已經(jīng)上升到一個(gè)很高點(diǎn),以致許多中小規(guī)模的公司用不起而只能采用FPGA。不過(guò),正在研發(fā)的各種降低ASIC設(shè)計(jì)費(fèi)用的新方法有助于將ASIC的優(yōu)點(diǎn)回歸業(yè)界。 以eASIC為代表的結(jié)構(gòu)化ASIC廠家率先找到了一種做得起ASIC的途徑。eASIC獨(dú)特的過(guò)孔層布線定制專(zhuān)利技術(shù)使用戶(hù)能夠在短時(shí)間內(nèi)開(kāi)發(fā)出高性能、低成本的ASIC和SoC。本文綜述深亞微米ASIC設(shè)計(jì)趨勢(shì)衰退的若干主要原因,分析兩種替代ASIC的器件FPGA和結(jié)構(gòu)化ASIC的長(zhǎng)短處,介紹eASIC公司的新一代 45nm結(jié)構(gòu)化ASIC中的技術(shù)。闡明了深亞微米時(shí)代eASIC結(jié)構(gòu)化ASIC的路越走越寬。
深亞微米ASIC設(shè)計(jì)趨勢(shì)走向衰退
設(shè)計(jì)一款芯片通常需要考慮以下因素:一是產(chǎn)品的性能,包括速度、芯片大小、功耗和可靠性;二是產(chǎn)品成本因素,選擇什么工藝、采用什么技術(shù)來(lái)實(shí)現(xiàn),包括生產(chǎn)制造成本、NRE費(fèi)用和研發(fā)成本;第三是市場(chǎng)因素,上市時(shí)間,從概念到實(shí)現(xiàn)的整個(gè)周期時(shí)間。在半導(dǎo)體工藝不斷升級(jí)帶來(lái)了規(guī)模的擴(kuò)大、速度的提升、芯片價(jià)格下降的同時(shí),卻遇到一系列難以逾越的障礙:設(shè)計(jì)流程復(fù)雜、生產(chǎn)良率降低、設(shè)計(jì)周期太長(zhǎng),研發(fā)制造費(fèi)用劇增等等。阻止了摩爾規(guī)律的延續(xù)。
高昂的NRE費(fèi)用、封裝測(cè)試費(fèi)用令人望而生畏。90nm芯片的開(kāi)模費(fèi)至少是80萬(wàn)美元,65nm芯片的開(kāi)模費(fèi)高達(dá)200萬(wàn)美元,而45nm芯片的開(kāi)模費(fèi)則達(dá)到800萬(wàn)美元以上。工藝細(xì)化帶來(lái)的一個(gè)挑戰(zhàn)是芯片設(shè)計(jì)技術(shù)日益復(fù)雜,對(duì)EDA設(shè)計(jì)工具的要求也越來(lái)越高。面對(duì)幾百萬(wàn)上千萬(wàn)的門(mén)級(jí)規(guī)模、幾百兆上千兆赫茲時(shí)鐘頻率的高密度設(shè)計(jì),設(shè)計(jì)工程師必須考慮更多的不確定因素,自然更容易產(chǎn)生更多的設(shè)計(jì)反復(fù),導(dǎo)致設(shè)計(jì)周期越來(lái)越長(zhǎng)。
在傳統(tǒng)的ASIC流程中,設(shè)計(jì)師通常只負(fù)責(zé)描述IC的邏輯功能,定義各種物理實(shí)現(xiàn)的約束條件:如時(shí)序、I/O連接、功能分割、時(shí)鐘以及信號(hào)完整性和功率完整性。晶圓廠負(fù)責(zé)開(kāi)發(fā)一個(gè)實(shí)現(xiàn)以下部分的平臺(tái):?jiǎn)卧獛?kù)、I/O單元、嵌入式存儲(chǔ)單元、硅片制造、封裝、封裝元件的測(cè)試,并將這些經(jīng)過(guò)測(cè)試的元件提交給設(shè)計(jì)工程師。然而,進(jìn)入DSM之后,硅片的特征結(jié)構(gòu)遠(yuǎn)遠(yuǎn)要小于光刻工藝的激光波長(zhǎng),常規(guī)的設(shè)計(jì)規(guī)則已經(jīng)不能適應(yīng)生產(chǎn)工藝的要求。以往,設(shè)計(jì)師要面對(duì)的設(shè)計(jì)問(wèn)題通常是STA時(shí)序收斂、IP驗(yàn)證、IP適用性、DFT可測(cè)試設(shè)計(jì)。如今,設(shè)計(jì)工程師在設(shè)計(jì)驗(yàn)證時(shí)經(jīng)常發(fā)現(xiàn),串?dāng)_、開(kāi)關(guān)功耗以及定時(shí)收斂等問(wèn)題更加難以捉摸。信號(hào)的完整性、工藝可變性非常棘手。即使?jié)M足了設(shè)計(jì)規(guī)則,設(shè)計(jì)出來(lái)的產(chǎn)品往往無(wú)法確保能生產(chǎn)出來(lái)。造成生產(chǎn)良率上不去的根本原因就在于設(shè)計(jì)的東西往往無(wú)法制造。因此,設(shè)計(jì)工程師需要在設(shè)計(jì)的時(shí)候考慮對(duì)于可制造性的支持。而要做到這點(diǎn),需要與晶圓廠的密切配合,了解制造工藝、制造規(guī)則以及參考參數(shù)。這就是所謂的可制造性設(shè)計(jì)DFM(Design For Manufacturing)。DFM包括參數(shù)良率、系統(tǒng)良率、隨機(jī)良率、可靠性、測(cè)試和診斷的六大設(shè)計(jì)。這些設(shè)計(jì)都與晶圓廠的缺陷度、設(shè)計(jì)測(cè)試的有效性有著密切的關(guān)系,因而要求設(shè)計(jì)工程師、工藝工程師、設(shè)備工程師與掩模制造工程師通力合作,方能共同完成DFM任務(wù)。DFM要求整個(gè)半導(dǎo)體產(chǎn)業(yè)鏈的高度合作。而到目前為止,設(shè)計(jì)界和制造界一直被視作相互獨(dú)立的兩個(gè)不同的實(shí)體。大多數(shù)設(shè)計(jì)工程師仍然被隔離在制造工藝的復(fù)雜性之外,僅使用由代工廠提供的“設(shè)計(jì)規(guī)則”和“推薦使用的規(guī)則”來(lái)完成設(shè)計(jì)的DRC。 [next]
所有這些工具成本、人工成本、時(shí)間成本、制造成本的猛增也就意味著設(shè)計(jì)的風(fēng)險(xiǎn)猛增。粗略估計(jì),工藝每升一級(jí),芯片的開(kāi)發(fā)成本至少要翻番,甚至更多。在現(xiàn)階段,設(shè)計(jì)一款45nm的芯片要耗資上億美元。據(jù)報(bào)道,目前只有AMD、Altera、IBM、Intel、Freescale、Samsung、Sony、NEC、Matsushita、Renesas、Qualcomm、Toshiba、TI、eASIC等十幾家廠商發(fā)布了40/45 nm產(chǎn)品,未來(lái)采用32nm甚至22nm的廠商只會(huì)越來(lái)越少。
FPGA難以抑制泄漏功耗
在ASIC的替代品中,可編程邏輯器件FPGA堪稱(chēng)平民與貴族。說(shuō)它是平民,是因?yàn)椴恍枰谀?,不產(chǎn)生NRE費(fèi)用,入門(mén)門(mén)檻低,F(xiàn)PGA深受廣大設(shè)計(jì)者的歡迎。由于具有高度的靈活性,相對(duì)簡(jiǎn)單的EDA工具和設(shè)計(jì)流程,用戶(hù)可以方便將FPGA器件編程為自己所需要功能的芯片。因此,F(xiàn)PGA占據(jù)了很多ASIC的領(lǐng)域,特別是在諸如通信、儀器、工業(yè)、軍工、航天等許多具有中小批量、多品種特點(diǎn)的市場(chǎng),取得了驕人的業(yè)績(jī)。說(shuō)它是貴族,是因?yàn)镕PGA用硅片面積來(lái)?yè)Q取靈活性的,天生不足表現(xiàn)為資源利用率低、價(jià)格昂貴。FPGA中80%的硅片面積被用作布線路由,要多繞許多路徑,要過(guò)許多用晶體管搭建的開(kāi)關(guān)。將基于SRAM的查找表LUT邏輯單元組成邏輯電路所需要的邏輯層數(shù)比ASIC多。因此,速度遠(yuǎn)遠(yuǎn)落后ASIC。即使到了65nm,F(xiàn)PGA在性能上也只能相當(dāng)于180nm的ASIC,而成本上與180nm的ASIC芯片并沒(méi)有優(yōu)勢(shì)。
盡管如此,F(xiàn)PGA在技術(shù)上近20年來(lái)發(fā)展迅速,向密度更高、速度更快發(fā)展,向低成本、低價(jià)格的片上系統(tǒng)方向發(fā)展,試圖拉近與ASIC的距離。Xilinx 已經(jīng)發(fā)布了65nm Virtex-5和Spartan 3。 Altera也發(fā)布了65nm Stratix III, 最近又發(fā)布了40-nm Stratix IV。為了適應(yīng)多方面應(yīng)用的需求,F(xiàn)PGA也在不斷改良架構(gòu),包括減少邏輯層次,改進(jìn)構(gòu)造塊之間的信號(hào)互連等。還嵌入了處理器、乘法器、收發(fā)器等一些標(biāo)準(zhǔn)單元的硬IP Core。
不過(guò),F(xiàn)PGA碰到了一個(gè)難以克服的頑疾--堵不住的泄漏電流、壓不低的靜態(tài)功耗。半導(dǎo)體工藝不斷細(xì)化的一個(gè)顯著好處是芯片的動(dòng)態(tài)功耗不斷下降。因?yàn)榭梢圆捎酶偷墓ぷ麟妷海送飧〉某叽缬兄跍p小芯片內(nèi)部分布電容。但在另一方面,由于晶體管體積的縮小,包括門(mén)極(柵極)泄漏電流以及源-漏泄漏電流在內(nèi)的靜態(tài)泄漏卻在逐漸增加,因此帶來(lái)的功耗成了一大頑疾。門(mén)極泄漏就是電子穿過(guò)阻止其運(yùn)動(dòng)的絕緣層產(chǎn)生的泄漏電流。而在晶體管處于關(guān)斷狀態(tài)時(shí),仍會(huì)有少量電子從源極向漏極流動(dòng),這就是源-漏泄漏。早在2004年,Intel發(fā)現(xiàn)因靜態(tài)泄漏導(dǎo)致的功耗已占到芯片總功耗的25%。進(jìn)入65nm之后,隨著管子體積的縮小,標(biāo)準(zhǔn)薄氧化層晶體管的靜態(tài)泄漏急劇增大。為了同時(shí)實(shí)現(xiàn)高密度和低漏電流,業(yè)界各方面都在不懈努力研究各種減少泄漏電流的方法。一種稱(chēng)為三重門(mén)極氧化層(triple-oxide)技術(shù)的工藝通過(guò)有選擇地增加門(mén)極氧化層厚度來(lái)減少泄漏電流,同時(shí)又不犧牲性能。盡管這三重門(mén)極氧化層仍很薄,但這些晶體管的確展現(xiàn)出比標(biāo)準(zhǔn)薄氧化層晶體管更低的漏電流。Intel公司則推出了針對(duì)45nm技術(shù)的HK+MG晶體管。所謂HK(High-K)就是采用相對(duì)二氧化硅而言具有很高絕緣常數(shù)的材料,它可在晶體管的門(mén)極和通道間產(chǎn)生一個(gè)強(qiáng)大的場(chǎng)效應(yīng),并呈現(xiàn)出很高的電子絕緣特性。采用金屬門(mén)MG (Metal Gate)還能增強(qiáng)門(mén)的場(chǎng)效應(yīng)。因此,HK+MG組合有助于顯著減少漏電流,增加門(mén)電容和驅(qū)動(dòng)電流。
雖然技術(shù)上設(shè)法減少了泄漏電流,但是由于FPGA的基本邏輯單元顆粒是基于SRAM的查找表LUT,還需要用大量的開(kāi)關(guān)晶體管。有同樣功能的FPGA芯片的晶體管數(shù)量遠(yuǎn)遠(yuǎn)多于ASIC芯片,因而功耗會(huì)遠(yuǎn)遠(yuǎn)大于ASIC芯片,這樣必定增加了系統(tǒng)的熱負(fù)荷。
還需要指出的一點(diǎn)是,在設(shè)計(jì)流程方面人們往往認(rèn)為ASIC的后端設(shè)計(jì)有著非常長(zhǎng)的時(shí)間和復(fù)雜度,也容易出問(wèn)題。事實(shí)上,進(jìn)入DSM階段之后FPGA的后端的復(fù)雜度也并非想象的那么容易。如果同樣的設(shè)計(jì)在ASIC的后端實(shí)現(xiàn)中很困難,那么在FPGA中情況有可能更加惡化。因?yàn)橥瑯庸δ艿倪壿嬰娐酚成湓贔PGA中的邏輯層數(shù)會(huì)比映射在ASIC中的邏輯層數(shù)增加很多,導(dǎo)致時(shí)序收斂更加困難。 [next]
為了克服FPGA的功耗大、價(jià)格高的缺點(diǎn),F(xiàn)PGA廠商也都推出了自己的結(jié)構(gòu)化ASIC技術(shù),比如Altera的HardCopy。HardCopy是通過(guò)重新映射,把原來(lái)的FPGA邏輯用結(jié)構(gòu)化的ASIC方式實(shí)現(xiàn)。這種方案能夠比FPGA明顯地降低芯片的尺寸。但是帶來(lái)的后果是時(shí)序有變化。這種方案由于需要掩模,從而也有NRE的問(wèn)題。此外,HardCopy只能針對(duì)少數(shù)幾種型號(hào)的FPGA,不適用其全系列器件。
eASIC 實(shí)現(xiàn)ASIC價(jià)值重歸
為了減少標(biāo)準(zhǔn)單元ASIC設(shè)計(jì)的高昂的前期投入,簡(jiǎn)化設(shè)計(jì)流程,規(guī)避市場(chǎng)風(fēng)險(xiǎn),結(jié)構(gòu)化ASIC應(yīng)運(yùn)而生。它們?cè)噲D在標(biāo)準(zhǔn)單元ASIC和FPGA之外中找到另外一條定做芯片的途徑。結(jié)構(gòu)化ASIC是半成品,要做成客戶(hù)定制的芯片仍然需要掩模,只不過(guò)掩模層數(shù)少一些??偟膩?lái)說(shuō),結(jié)構(gòu)化ASIC能夠節(jié)省一半的NRE費(fèi)用和設(shè)計(jì)時(shí)間,芯片的性能和功耗接近標(biāo)準(zhǔn)單元ASIC。但芯片價(jià)格的約是標(biāo)準(zhǔn)單元的1.5 ~2倍,因?yàn)槠涿芏却蠹s只有標(biāo)準(zhǔn)單元ASIC的50%~75%左右。結(jié)構(gòu)化ASIC的市場(chǎng)定位決定了其在ASIC與FPGA的夾縫中求生?;蛟S是因?yàn)榘雽?dǎo)體工藝升級(jí)換代太快了的緣故,大多數(shù)結(jié)構(gòu)化ASIC的優(yōu)勢(shì)還沒(méi)有來(lái)得及完全發(fā)揮出來(lái),就被新工藝淘汰出局。直到在90nm之前,大多數(shù)結(jié)構(gòu)化ASIC在商業(yè)運(yùn)作上都沒(méi)有FPGA成功??蛻?hù)要么更喜歡便宜的標(biāo)準(zhǔn)單元ASIC,要么更喜歡沒(méi)有風(fēng)險(xiǎn)的隨時(shí)都可重新編程的器件FPGA。除非把做ASIC的NRE降到微不足道,還要讓設(shè)計(jì)工程師避開(kāi)復(fù)雜的后端設(shè)計(jì)的困擾,否則難以扭轉(zhuǎn)結(jié)構(gòu)化ASIC尷尬的局面。eASIC公司率先做到了這一點(diǎn)。
eASIC在2006年推出90nm的結(jié)構(gòu)化ASIC產(chǎn)品Nextreme。與其他結(jié)構(gòu)化ASIC不同之處在于,只要用單一過(guò)孔層就可實(shí)現(xiàn)各種設(shè)計(jì)電路的定制。對(duì)所有的設(shè)計(jì)而言,從硅片到每層金屬層都是通用的,唯一不同的是一層過(guò)孔Via6。 由于這一過(guò)孔層可直接用激光束打造,實(shí)現(xiàn)無(wú)掩模定制樣片,處理時(shí)間快了10倍。因而無(wú)需NRE費(fèi)用,樣片時(shí)間縮短到4周。量產(chǎn)時(shí)也只要一層過(guò)孔掩模,所發(fā)生的費(fèi)用很容易被消化。金屬布線標(biāo)準(zhǔn)化和過(guò)孔可編程定制是eASIC在結(jié)構(gòu)化ASIC上的獨(dú)門(mén)突破性技術(shù)。在短短1年半時(shí)間內(nèi),eASIC 就完成了120多個(gè)項(xiàng)目設(shè)計(jì)。令人驚訝的是,在90nm Nextreme ASIC產(chǎn)品快速成功的基礎(chǔ)上,eASIC跳過(guò)了65nm直接奔向45nm,2008年8月4日發(fā)布了其45nm產(chǎn)品Nextreme-2,站在了業(yè)界的前列。
在45nm結(jié)構(gòu)化ASIC產(chǎn)品Nextreme-2系列中,eASIC基本保持了第二代產(chǎn)品中的全金屬布線,單一過(guò)孔編程定制的體系,只是將這一定制過(guò)孔層從第6層調(diào)整到了第4層。但在架構(gòu)上、基本邏輯單元eCell的顆粒結(jié)構(gòu)上和周邊的資源配置上做了重大改進(jìn)。
eASIC改良了查找表(LUT)的結(jié)構(gòu)以進(jìn)一步提供速度、降低功耗。摒棄了原有基于SRAM的查找表LUT結(jié)構(gòu),改用可編程過(guò)孔Via接地或者接Vcc來(lái)替代SRAM的輸出。此外,還省去了LUT第一級(jí)的開(kāi)關(guān)晶體管,如圖所示。因此省掉了大量的晶體管。大大降低了靜態(tài)泄漏,提高了開(kāi)關(guān)速度,使效率達(dá)到了最高。在同樣的工藝水平中, 泄漏可以減少12%,速度提高17%,面積減少40%。與前一代90nm產(chǎn)品相比,靜態(tài)泄漏減少了50%,動(dòng)態(tài)功耗降低70%,延遲縮短了45%。此外,通過(guò)過(guò)孔編程,切斷芯片內(nèi)部閑置的單元和存儲(chǔ)器的供電,還采取時(shí)鐘選通控制睡眠模式、動(dòng)態(tài)功率管理。Nextreme-2系列采用特許半導(dǎo)體的45nm低功耗工藝生產(chǎn)制造,其邏輯組織架構(gòu)能夠提供高達(dá)700 MHz的性能。與最新工藝的FPGA相比,由于結(jié)合了三重氧化層晶體管、45nm 低功耗工藝和 eASIC 專(zhuān)利的功率管理結(jié)構(gòu), Nextreme-2的功耗可以降低80%以上。
Nextreme-2系列還嵌入了硬IP Core,包含多達(dá)56條 MGIO (多G比特輸入輸出口)。每條IO都能工作在6.5Gbps,總計(jì)提供364Gbps帶寬。在高性能網(wǎng)絡(luò)應(yīng)用中,如交換機(jī)、路由器、流量管理、城域網(wǎng)傳輸設(shè)備和移動(dòng)回程設(shè)備, 由于具備 MGIO (多G比特輸入輸出口),Nextreme-2 將成為 FPGAs 和 ASICs之外最佳的選擇。Nextreme-2主要特征如下:
規(guī)模多達(dá)2千萬(wàn)門(mén) ;
真雙口RAM數(shù)量多達(dá) 30Mb;
2.4 TeraMACs 乘法累加器 DSP性能;
多達(dá)56條6.5Gbps收發(fā)器以及 1.25Gbps LVDS;
簡(jiǎn)單的設(shè)計(jì)工具和設(shè)計(jì)流程 ;
6周即可出硅片;
沒(méi)有最小定貨量要求。
如前所述,對(duì)所有的設(shè)計(jì)而言,Nextreme和Nextreme-2從硅片到每層金屬都是通用的,唯一不同的是一層過(guò)孔。封裝也是預(yù)先確定好的。從前端設(shè)計(jì)、后端設(shè)計(jì)一直到芯片制造, eASIC的Nextreme和Nextreme-2平臺(tái)是在成熟的EDA平臺(tái)上采用最嚴(yán)格的設(shè)計(jì)規(guī)則開(kāi)發(fā)出來(lái)的。因此設(shè)計(jì)工程師完全不必?fù)?dān)心后端的問(wèn)題,諸如可制造性設(shè)計(jì)DFM、可測(cè)試性設(shè)計(jì)DFT、光學(xué)鄰近效應(yīng)修正OPC、生產(chǎn)良率控制等都由eASIC負(fù)責(zé)處理。eASIC提供了一個(gè)經(jīng)過(guò)嚴(yán)格驗(yàn)證和測(cè)試的平臺(tái)。迄今為止,客戶(hù)記錄一直是一次成功。
結(jié)束語(yǔ)
為了市場(chǎng)需求而創(chuàng)新的才有意義。eASIC掃平了深亞微米ASIC設(shè)計(jì)復(fù)雜、費(fèi)用高昂等障礙,降低了ASIC門(mén)檻,同時(shí)解決了FPGA難以克服的靜態(tài)泄漏和高功耗。以其高性能、低功耗、低費(fèi)用和快速上市時(shí)間等特點(diǎn),標(biāo)志著一個(gè)ASIC新紀(jì)元的開(kāi)始。在深亞微米ASIC的競(jìng)技場(chǎng)上,eASIC已經(jīng)展現(xiàn)出其巨大的潛力,路越走越寬。我們有理由相信,eASIC正在逆轉(zhuǎn)衰退的ASIC設(shè)計(jì)趨勢(shì)。
評(píng)論