如何利用芯片數(shù)據(jù)提高生產(chǎn)力?
半導(dǎo)體生態(tài)系統(tǒng)正爭先恐后地更有效地使用數(shù)據(jù),以提高設(shè)計團隊的生產(chǎn)力、提高晶圓廠的產(chǎn)量,并最終提高現(xiàn)場系統(tǒng)的可靠性。
本文引用地址:http://www.ex-cimer.com/article/202302/443795.htm數(shù)據(jù)收集、分析和利用是所有這些工作以及更多工作的核心??梢栽趶脑O(shè)計到制造流程中的每個點收集數(shù)據(jù)并進入現(xiàn)場,并且可以將其循環(huán)回當(dāng)前和未來的設(shè)計中以防止代價高昂的故障,或者向前推進以防止軟件和硬件之間不必要的交互。
「當(dāng)我們查看現(xiàn)場數(shù)據(jù)以及新代工廠/晶圓廠啟動過程中發(fā)生的事情時,我們已經(jīng)看到他們?nèi)绾卧诿總€芯片上創(chuàng)建大量數(shù)據(jù)以確定如何提高產(chǎn)量」, Cadence 數(shù)字與簽核集團產(chǎn)品管理副總裁 Kam Kittrell 說。「這一直是一個大數(shù)據(jù)問題,其中涉及很多深奧的事情——如何提高產(chǎn)量和可制造性設(shè)計。它正在獲取大數(shù)據(jù),對其進行分析,研究如何調(diào)整正在發(fā)生的事情,以便在未來獲得更好的收益。這正是流程節(jié)點開發(fā)。但現(xiàn)在它向下游走得越來越遠,因為我們希望能夠進行系統(tǒng)級測試,因為超大規(guī)模公司正在將非常復(fù)雜的云系統(tǒng)與數(shù)千臺計算機放在一起,并使用這些完全相同的計算機構(gòu)建數(shù)千個站點?!?/span>
讓系統(tǒng)、軟件和硬件的組合協(xié)同工作是一個巨大的挑戰(zhàn),從測試芯片收集現(xiàn)場數(shù)據(jù)并將其反饋到設(shè)計到制造流程中可以顯著提高生產(chǎn)芯片和系統(tǒng)的產(chǎn)量。「如果他們了解了有關(guān)芯片的一些信息,他們就可以在下游進行測試,看看是否會立即出現(xiàn)故障,」Kittrell 說?!改悴幌朐谠浦刑幚砜蛻舻挠行лd荷,然后看到它失敗了,然后你發(fā)現(xiàn)了一些你可以從芯片測試中知道的東西?!?/span>
其他人同意?!高@里正在發(fā)生的大趨勢是產(chǎn)品的復(fù)雜性,」是德科技新市場高級經(jīng)理兼數(shù)字孿生項目經(jīng)理 Chris Mueth 說。「這是最大的驅(qū)動力。你可以說有一些監(jiān)管標(biāo)準(zhǔn)和小型化正在進行,但這實際上都是關(guān)于復(fù)雜性的,而且它只會變得越來越糟,因為消費者想要更多的功能在他們的手中。開發(fā)人員將繼續(xù)向產(chǎn)品中添加越來越多的功能?!?/span>
想想 15 年前的 2.5G 移動芯片?!甘謾C中的 PA 芯片可能有 100 項要求,」Mueth 說?!脯F(xiàn)在它是一款多功能 5G 芯片,可以滿足 2000 項要求。它可能有多個波段。它必須在多種電壓下以多種工作模式運行,并且所有這些都必須進行管理和驗證。我們聽說過芯片制造商錯過驗證需求的故事,只有在它已經(jīng)在手機芯片中時才發(fā)現(xiàn)它?!?/span>
而這只是故事的一部分。所有這些都需要在可能影響整個系統(tǒng)的變化的背景下進行查看,因此需要端到端地收集和分析數(shù)據(jù)。
英飛凌軟件和生態(tài)系統(tǒng)副總裁 Rob Conant 表示:如果你是一家生產(chǎn)聯(lián)網(wǎng)設(shè)備的傳統(tǒng)公司,你會進行用戶研究和焦點小組討論的連接安全系統(tǒng)業(yè)務(wù)部門。「你用它來告知你未來的產(chǎn)品方向。在物聯(lián)網(wǎng)領(lǐng)域,他們真的沒有全心全意地進入那個模型。這是對這些產(chǎn)品的事后補充。但是,其他產(chǎn)品的構(gòu)建以連接性為核心。家庭安全系統(tǒng)就是一個很好的例子。它有一個非常具體的價值主張和一個非常具體的客戶,一個有形的客戶可交付成果。連通性是該可交付成果的核心。對于提供這些服務(wù)和解決方案的公司而言,重要的不是包裝在他們相機上的吸引力。這是關(guān)于他們能夠以多經(jīng)濟和多有意義的方式提供特定的客戶價值,因此他們更加積極地使用數(shù)據(jù)來了解他們的產(chǎn)品如何運作,他們的客戶如何使用這些產(chǎn)品,以及這些產(chǎn)品如何與客戶價值聯(lián)系起來。這種客戶成功的想法在某種程度上存在于消費類硬件中。如果你把它深入到半導(dǎo)體公司本身,這個想法就會滲透到像 Infineon 和其他公司這樣的較低級別的組件供應(yīng)商中,但它并不是本地的。它是我們銷售產(chǎn)品的附加組件。」
更好的自動化
有效地利用數(shù)據(jù)可以為設(shè)計團隊帶來豐厚的回報。設(shè)計復(fù)雜性增加與人才短缺之間的鴻溝越來越大,而數(shù)據(jù)是縮小這一差距的重要因素。
「任何 EDA 公司都會在設(shè)計和測試上花費大量時間,但由于正在發(fā)生的大趨勢,數(shù)據(jù)管理領(lǐng)域出現(xiàn)了一個新興領(lǐng)域來處理如何管理所有需求,」Mueth 說?!肝以趺粗肋@些要求是否得到滿足?模擬或測試設(shè)備以確保其滿足要求的標(biāo)準(zhǔn)是什么?你有需求管理本身嗎?我如何知道芯片中的 IP 在我制造時是正確的 IP?我使用的工具和版本的可追溯性如何?當(dāng)您進行驗證時,所有這些都很重要。正如你想象的那樣,我正在那里處理大量的數(shù)據(jù)?!?/span>
反過來,這些數(shù)據(jù)可用于改進仿真和驗證,并可縮短調(diào)試過程。
「在仿真領(lǐng)域,工程團隊正在執(zhí)行三項主要任務(wù),」 Imperas 首席執(zhí)行官 Simon Davidmann 說?!敢粋€是構(gòu)建可以運行的軟件。他們試圖啟動并運行軟件,并擁有他們想要了解的某些數(shù)據(jù)。二是另一個極端,工程師們正在圍繞 RISC-V 進行驗證。然后是另一群正在尋求提高性能的人。所有這些人都需要不同類型的數(shù)據(jù)。」
但是工程團隊需要了解他們收集數(shù)據(jù)的目的以及他們需要什么類型的數(shù)據(jù)。
「這是'什么'和'為什么'?!冈趺醋觥箤τ谖覀児こ處焷碚f顯然是必需的,因為例如在我們的建模方面,我們是速度很快,」Davidmann 說?!肝覀儾幌朐谀P椭屑尤肴魏螘p慢我們速度的東西。如果你想開始分析模型中發(fā)生的事情,它會減慢它的速度。所以我們非常關(guān)心人們想要什么數(shù)據(jù),因為它會對性能產(chǎn)生影響。然后,當(dāng)一個工程團隊想要添加數(shù)據(jù)分析時,從我們的角度來看,有幾種類型的數(shù)據(jù)是有用的。首先,他們必須確定他們想要將其用于什么用途以及他們想要的粒度。有些人正在嘗試調(diào)整軟件并需要非常具體的數(shù)據(jù),例如逐周期數(shù)據(jù)?;蛘撸绻腥嗽噲D驗證某事,他們將需要與硬件事件等相關(guān)的完全不同的數(shù)據(jù)。一旦他們獲得了數(shù)據(jù),就會有不同的抽象。例如,如果我們正在幫助工程團隊移植 Linux,他們不想查看 RTL 中的事件。他們甚至不想查看寄存器值。他們想看函數(shù)的抽象?;蛘?,他們想查看操作系統(tǒng)中作業(yè)調(diào)度程序的抽象。這就是所有可以收集的數(shù)據(jù)。然后,他們可以對其進行分析,看看它的性能如何,或者他們探索了操作系統(tǒng)的哪些部分。」
確保設(shè)備滿足要求是一項巨大的挑戰(zhàn),這就是為什么估計有三分之二(或更多)的芯片開發(fā)用于驗證?!高@里的壓力有很多不同的方式,」Mueth 說?!钙渲幸徊糠种皇嵌x我需要的需求,并定義如何模擬或測試這些需求。然后,需要流程定義以及自動化構(gòu)建,因為您可能不會手動完成所有這些工作。您想以自動化方式進行。然后你必須確定如何收集數(shù)據(jù)、減少數(shù)據(jù)并理解數(shù)據(jù)?!?/span>
更有效地利用數(shù)據(jù)
數(shù)據(jù)可能會因任務(wù)配置文件的不同而有很大差異,這對于汽車芯片而言與 5G 電話芯片大不相同,并且它可能會根據(jù)其在流程中的使用方式和位置而有所不同。
「今天我們問我們的客戶,'你是否了解你的個人資料的實際情況?' 答案或多或少是『不』,這與 HPC 的情況相同,」Synopsys 汽車硅生命周期解決方案產(chǎn)品經(jīng)理 Pawini Mahajan 說。因此,我們試圖通過硅生命周期管理 (SLM) 做的是在架構(gòu)級別的設(shè)計生命周期早期插入監(jiān)視器,并在整個生產(chǎn)生命周期中收集數(shù)據(jù),包括在斜坡階段、生產(chǎn)階段、制造階段。我們甚至可以在設(shè)備到達現(xiàn)場之前不斷收集數(shù)據(jù)。所有這些數(shù)據(jù)都是我們在整個生命周期中收集的,我們將這些數(shù)據(jù)作為反饋循環(huán)提供給設(shè)計工程師,以進一步改進下一代設(shè)計。但是我們對現(xiàn)場數(shù)據(jù)所做的工作也可以用于任務(wù)概況。例如,您可以監(jiān)控任務(wù)概況,或老化和退化。所有這些數(shù)據(jù)都在收集和填充。
這些數(shù)據(jù)如何被分割和分析取決于它的用途。其中大部分是使用用戶為自己的目的創(chuàng)建的內(nèi)部工具完成的。在某些情況下,數(shù)據(jù)不完整是因為數(shù)據(jù)收集受到合同義務(wù)的阻礙。
「這是一個非常破碎和脫節(jié)的區(qū)域,」馬哈詹說?!该考野雽?dǎo)體公司、一級供應(yīng)商或 OEM,取決于他們在生命周期中所處的位置,都有自己的解決方案。一些半導(dǎo)體公司可能擁有自己版本的過程、電壓和溫度監(jiān)視器,用于從其芯片中收集數(shù)據(jù)。但是,一旦該芯片進入汽車,目前可能還沒有一種指標(biāo)可以通過 OEM 的數(shù)據(jù)湖提取該數(shù)據(jù),因為這些合同中不存在某些交互?!?/span>
在設(shè)計流程中,最重要的是提高生產(chǎn)力。數(shù)據(jù)很重要,但往往沒有得到應(yīng)有的有效利用。
Synopsys DesignDash 產(chǎn)品經(jīng)理 Mark Richards 表示:「隨著設(shè)計規(guī)模的不斷擴大,挑戰(zhàn)變得如此困難,以至于他們沒有時間進行他們想要進行的多輪優(yōu)化?!?「這主要是關(guān)于在他們擁有的時間窗口內(nèi)完成它,所以無論 PPA 是什么,無論他們最終采用何種治療方法,他們最終都會采用。隨著這些設(shè)計變得越來越大,迭代時間越來越長,他們試圖做的只是以某種方式提高生產(chǎn)力。數(shù)據(jù)是達到目的的一種手段,他們將采取目前可以找到的最佳手段來實現(xiàn)這一目標(biāo)?!?/span>
如果收集和分析了正確的數(shù)據(jù),它可以用來顯著改進優(yōu)化。理查茲說:「如果我們能夠開始以一種他們可以有效吸收它的方式向用戶展示它,那將有助于推動并提高生產(chǎn)力?!?「我們?nèi)绾卫盟羞@些引擎,使用引擎蓋下的方法能夠以比從日志文件中獲得的更細粒度的級別讀取引擎?然后我們可以開始合并該數(shù)據(jù),并嘗試在其中找到模式。如果我們可以提取這些模式,我們就可以開始將它們視為因果關(guān)系、相關(guān)性或介于兩者之間。這有助于工程師更有效地完成工作,這正是他們最終想要達到的目標(biāo)?!?/span>
一旦芯片制造并通過測試,它就可以用于硬件/軟件啟動?!讣僭O(shè)硅質(zhì)量好并且是已知的好芯片,你想(取決于應(yīng)用程序)添加第一級軟件,例如軟件內(nèi)核,然后對其進行測試,」高級主管 Vivek Chickermane 說。Siemens Digital Industries Software 的 Tessent 嵌入式分析研發(fā).「然后你把它放在下一個層次上,這可能是操作系統(tǒng)微服務(wù),然后是完整的操作系統(tǒng),也許還會添加一些應(yīng)用程序。您構(gòu)建軟件堆棧,并在實驗室中進行盡可能多的測試。在那里,工程師們真的很想在現(xiàn)場部署之前識別和調(diào)試問題,他們緊緊關(guān)注幾個問題。例如,如果系統(tǒng)是單芯片,它可能會使用以前從未使用過且從未在硅片中得到驗證的 IP。您顯然想驗證這一點。下一個級別是添加內(nèi)核或操作系統(tǒng)等。我們可能不確定其生態(tài)系統(tǒng)有多強大。編譯器、內(nèi)核服務(wù)、微服務(wù)有多好?你想確保所有這些都運作良好。然后你想檢查軟件是否會按預(yù)期運行,
一旦設(shè)計團隊達到調(diào)試目標(biāo)并且硬件/軟件協(xié)同設(shè)計被認(rèn)為是好的,他們就可以從實驗室轉(zhuǎn)移到現(xiàn)場。這帶來了一系列完全不同的挑戰(zhàn)。
「該領(lǐng)域存在很多不確定性和不可預(yù)測性,因為您無法始終確保將要在該領(lǐng)域使用的所有軟件以前都曾嘗試過,」奇克曼說。「假設(shè)你買了一部手機,現(xiàn)在你要添加一個稍后開發(fā)的應(yīng)用程序。芯片供應(yīng)商尚未測試該應(yīng)用程序?,F(xiàn)在想象一下,這是一個很大的系統(tǒng),里面有各種需求復(fù)雜的應(yīng)用。這是一組完全不同的問題。在現(xiàn)場,挑戰(zhàn)是如何構(gòu)建一個非??煽亢涂深A(yù)測的系統(tǒng),尤其是當(dāng)您有很多動態(tài)組件時?我如何從不太可靠和不太可預(yù)測的組件構(gòu)建它?可靠性與設(shè)計不當(dāng)?shù)墓锜o關(guān)。就是硅還沒有被 100% 證明。您可能有 95% 的信心發(fā)布它。所以仍然存在不確定性,這在該領(lǐng)域受到了壓力?!?/span>
有效使用數(shù)據(jù)對于縮小差距至關(guān)重要,無論是涉及匯總數(shù)據(jù)還是監(jiān)控數(shù)據(jù)。
「有了聚合數(shù)據(jù),我可能想運行一個應(yīng)用程序,看看有多少緩存未命中或發(fā)生了多少浮點運算,」他說?!甘‰娔J绞欠駟?,啟動了多少次?該系統(tǒng)是根據(jù)該聚合數(shù)據(jù)設(shè)計的,因為許多指標(biāo)(如電池壽命或 CPU 利用率)都依賴于它。該數(shù)據(jù)來自性能計數(shù)器。另一方面,監(jiān)測數(shù)據(jù)更加全面。性能計數(shù)器提供聚合數(shù)據(jù),而監(jiān)視器提供時間敏感數(shù)據(jù),因此有時間差。假設(shè)您決定每 100 微秒收集一次數(shù)據(jù),因此每 100 微秒就是一個時間差。例如,我們的用戶想要所謂的指令跟蹤。他們想知道當(dāng)時正在執(zhí)行什么指令。如果它是總線監(jiān)視器,那么它會查看總線上發(fā)生的事務(wù)。CPU 正在與內(nèi)存通信嗎?是在和網(wǎng)絡(luò)對話嗎?是在和 I/O 對話嗎?」
數(shù)據(jù)的力量
擁有數(shù)據(jù)是一回事。以可以在設(shè)計中產(chǎn)生重大差異的方式應(yīng)用它是一個巨大的飛躍,這會轉(zhuǎn)化為消費者的價值。
「如果你看看像 Apple 這樣的公司,他們擁有大量關(guān)于蜂窩連接的信息,」Infineon 的 Conant 說?!阜涓C連接在哪里工作?它在哪里不起作用?為什么它有效?為什么它在不同的地方不起作用?客戶如何使用該產(chǎn)品?功耗如何根據(jù) MCU 的使用方式而變化?他們?yōu)樵撌謾C設(shè)計自己的核心或編寫自己的核心芯片組的能力在很大程度上取決于他們擁有的數(shù)據(jù)的豐富性,這些數(shù)據(jù)提供了對使用模型的洞察力。」
真正的價值來自于對不同用例的深入理解,以及利用數(shù)據(jù)為這些用例構(gòu)建產(chǎn)品的能力?!溉绻憧纯词褂盟麄兊男酒氖謾C的性能,那是非常好的,因為他們對使用模型有深刻的理解,」科南特說?!高@些芯片的設(shè)計是由這些數(shù)據(jù)和對它的深刻理解驅(qū)動的。這是半導(dǎo)體公司需要追求的目標(biāo)——深入了解其產(chǎn)品的使用模型。但今天,他們往往敬而遠之。」
評論