微處理器大師的IC設(shè)計(jì)經(jīng)驗(yàn)
4、那么Tensilica是如何來克服在功耗上的挑戰(zhàn)的?和競(jìng)爭(zhēng)對(duì)手比起來又有何區(qū)別?
Chris Rowen :舉個(gè)例子。Tensilica贊同為特定的任務(wù)去優(yōu)化處理器。優(yōu)化流水線(Pipeline),優(yōu)化接口,優(yōu)化設(shè)計(jì)層面,然后把多個(gè)內(nèi)核放在一起,以建 立一個(gè)多核系統(tǒng)。這種優(yōu)化的能力將產(chǎn)生巨大的影響。我會(huì)在今天下午的會(huì)上談到這個(gè)稱作Turbo解碼器的專用(Specialized)處理器。Turbo是一種特殊的算法,可以從嘈雜的噪聲中提取有用信息,在一個(gè)工作循環(huán)(cycle)內(nèi),這個(gè)解碼器可以執(zhí)行大約3萬次,哦對(duì)的沒錯(cuò)3萬次RISK指令。是的,通用的壓縮(Compression)處理器只能執(zhí)行一次指令,而這個(gè)專用處理器可以執(zhí)行3萬次。當(dāng)然這是一個(gè)極端的例子,只是想表 明當(dāng)你知道你的問題在哪里,你就可以做出很多令人難以置信的事情。并行,并因此難以置信的高效率。
同樣的原則可以適用于各個(gè)層面,適用于各種其他門類的專用DSP、無線接收器,適用于基帶和音頻的通用DSP,也適用于客戶意欲進(jìn)行視頻處理或其他圖形壓縮、安全操作、網(wǎng)絡(luò)協(xié)議處理,以及廣泛應(yīng)用于射頻的深嵌入式控制(Deeply Embedded Control)。
Tensilica特別集中精力于那些能夠?qū)iT優(yōu)化的能力,以及真正方便使用多核的能力。而因此,我們從那些傳統(tǒng)的CPU老家伙們中區(qū)別了出來。譬 如Intel、ARM、MIPS,或者其他什么人。他們都面臨一個(gè)相同的物理問題,摩爾定律在給了他們更多的晶體管之后,卻沒有給他們更好的功率控制,對(duì)不對(duì)?
他們很少去考慮并行的問題。而與之相反,我們?cè)趹?yīng)用層面非常努力地工作,以期尋找到解決方案。在云計(jì)算那段,我們確實(shí)可以將任務(wù)分割成很多子任務(wù), 但是當(dāng)我在這里玩游戲(Chris又一次拿起手里iPhone開始演示),我真的被限制了。你看,一個(gè)手指只能玩一樣?xùn)|西哈。因此在應(yīng)用處理器的層面,你 真的無法得到啥好處。MIPS、ARM,甚至還有Intel,都面對(duì)著這樣一個(gè)無法在當(dāng)前硅科技下有效完成多任務(wù)的問題。而那是我們擅長(zhǎng)的。
我們看到這個(gè)市場(chǎng)在迅速增長(zhǎng),去年的出貨量增長(zhǎng)了大約70%。然后我們會(huì)試圖進(jìn)入所有的DPP(Data-Plane Processor)領(lǐng)域,包括DSP、音頻視頻、安全,以及深嵌入式控制,這其實(shí)和應(yīng)用處理器的范疇離得很遠(yuǎn)。所以啊,我們常常會(huì)發(fā)現(xiàn)自己和MIPS、ARM或Intel出現(xiàn)在同一塊芯片上。你知道吧,其實(shí)我們就是工廠的工人啊(Chris突然哈哈大笑)!因?yàn)橛羞@么多不同的處理器,在Date-Plane里又有這么多不同的任務(wù),那些小而高效的處理器會(huì)有很多機(jī)會(huì),很多接口(Socket)。
這種對(duì)于應(yīng)用處理器或者接口的互補(bǔ)性,甚至于可以讓應(yīng)用處理器在執(zhí)行類似于信號(hào)處理這種實(shí)時(shí)任務(wù)的時(shí)候,也完全關(guān)閉?;蛘弑热缍嗝襟w應(yīng)用,應(yīng)用處理 器當(dāng)然可以去做,但是如果我們優(yōu)化專用音頻DSP的話,將獲得4到5倍的效率。尺寸更小,單位時(shí)間內(nèi)的吞吐量卻更大。而且可以用如此多的音視頻處理器夠你 選擇。所以幾乎任何時(shí)刻,系統(tǒng)設(shè)計(jì)師或者SoC設(shè)計(jì)師都可以通過區(qū)別應(yīng)用場(chǎng)景的方式,來決定卸載(Off Load)哪個(gè)處理器。
這也是為什么我認(rèn)為我們可以在音頻方面取得這么大的成功。當(dāng)你正在設(shè)計(jì)一個(gè)手機(jī),或者閱讀顯示器,或者機(jī)頂盒,或者數(shù)字電視,或者數(shù)碼相機(jī),你會(huì) 說,啊,這里有一種場(chǎng)景需要我做大量音頻的工作。于是,把那種卸載很自然地就被設(shè)計(jì)到到基本構(gòu)架里去了。
而且,我們可以為應(yīng)用層面的處理器自動(dòng)生成軟硬件,尤其是基于音頻和基帶的非常全面的軟件庫(kù)(Software Libraries)。因此,不管是老手還是菜鳥,在我們的店鋪里都能找到他們所有需要的軟硬件解決方案,以幫助他們最快地進(jìn)入市場(chǎng)。集成音頻、集成基 帶,或者其他各種功能。
5、那么Tensilica有什么具體的應(yīng)用嗎?
Chris Rowen :今天下午,我將討論一下移動(dòng)電話。這是一個(gè)巨大的市場(chǎng),一個(gè)可以滿足之前所說帶寬需求的市場(chǎng)。特別是從當(dāng)前正從3G向4G升級(jí),大家都聚焦在LTE身 上。不僅因?yàn)長(zhǎng)TE看上去很像是最后標(biāo)準(zhǔn)的勝者,也因?yàn)樗浅O馱iMax。我們已經(jīng)能夠提供參考設(shè)計(jì),幫助客戶建立他們自己定義的多核LTE手機(jī),在市 場(chǎng)中搶得先機(jī)。這只是一個(gè)我們進(jìn)入領(lǐng)域的實(shí)例。
我們也在做一個(gè)很類似的數(shù)字電視解調(diào)器。因?yàn)橛腥讼M葹橐苿?dòng)應(yīng)用又為起居室設(shè)計(jì)一種通用的數(shù)字電視接收器。這里有個(gè)很大的問題,就是全世界在視頻 領(lǐng)域有好多不同的標(biāo)準(zhǔn)和概念,而每個(gè)人都真心希望擁有一塊可以解決一切的視頻芯片。我們準(zhǔn)備來設(shè)計(jì)一塊。其實(shí)應(yīng)用一樣的原理,就是找些DSP和專用核,優(yōu) 化最密集的任務(wù),并充分利用我們最重要的能力——生成處理器的功率效率非常小,以及和世上最穩(wěn)定的通用DSP一樣易于編程的軟件工具。昨天晚上客戶還和我 們說,DSP如此招人待見的最主要原因就是可編程。譬如TI的那些DSP。我們同樣在努力使編譯器更強(qiáng)大,使程序模型簡(jiǎn)單,使程序員更不操心。我們還微處 理器的流水線設(shè)計(jì)上增強(qiáng)了視覺效果。這種架構(gòu)下要還能生成不正確的代碼,也怪難的。
因此,我們擁有一個(gè)非常高效的處理器。但是效率(Efficiency)這個(gè)詞值得商榷。傳統(tǒng)意義上而言,效率就是指最少的門數(shù)、最小的功耗,巴拉 巴拉。但效率也是將產(chǎn)品推向市場(chǎng)的時(shí)間。需要多少工程師才能部署好這個(gè)系統(tǒng)?每行代碼的成本是多少?每個(gè)工程師小時(shí)(Engineer Hour)所能帶來的收入?除了硅片層面的效率以外,這些同樣是測(cè)量效率的重要參數(shù)。我認(rèn)為我們?cè)谶@兩面都推動(dòng)得很好。剛才討論的那種架構(gòu),也特別適合在 大量出貨的領(lǐng)域。移動(dòng)設(shè)備、客廳設(shè)備、數(shù)碼相機(jī),這些都是我們做得非常好的地方。這幾個(gè)領(lǐng)域四大廠商中的三位,十大廠商中的六個(gè)都是我們的客戶。
我們主要是在DPP方面擁有很強(qiáng)的知識(shí)積累,但同樣的影響也已經(jīng)開始在云計(jì)算上面出現(xiàn)。當(dāng)然,現(xiàn)在云計(jì)算的變化還比較慢,部分原因是它并非對(duì)功耗如 此敏感,但我認(rèn)為整體上還是會(huì)有影響的。
其他領(lǐng)域使用這種結(jié)構(gòu)?#e#6、您會(huì)在很多其他領(lǐng)域譬如數(shù)字電視和有線通信,使用這種結(jié)構(gòu)?
評(píng)論