工程師工具箱內的秘密武器:AI與模擬的交集
隨著科技復雜度逐漸增加,工程師開始尋求新方法來開發(fā)更有效的AI模型,本文將探索AI與仿真的結合如何幫助工程師解決時間、模型可靠度、數據質量等諸多挑戰(zhàn)。
隨著現今科技復雜度的增加,人工智能(artificial intelligence;AI)的能力和涉及范圍也不斷在擴大。因此,工程師在被交付任務要將AI整合于系統(tǒng)之中時將面臨新的挑戰(zhàn)。這些復雜性的一部分,源自于使用在模型訓練的數據幾乎可決定AI模型效果的認知?如果數據不足、不夠精確、或者存在偏差,模型的計算結果就會受到影響。
以較高的層級來說,AI與模擬有三種主要的合流方法。
一、與解決資料不足的挑戰(zhàn)有關,因為仿真模型可以被使用來合成可能難以收集、或收集成本昂貴的資料。
二、將AI模型作為計算起來復雜且昂貴的高度逼真模擬的近似值,也被稱為降級建模(reduced-order modelling)。
三、在如控制、訊號處理、嵌入式視覺等應用的嵌入式系統(tǒng)上使用AI模型,仿真已成為這類系統(tǒng)設計流程當中關鍵的一環(huán)。
工程師開始找到新的方法來開發(fā)更有效的AI模型,本文將探索仿真與AI的結合可如何幫助工程師解決時間、模型可靠度、數據質量等挑戰(zhàn)。
挑戰(zhàn)1 使用于訓練和檢驗AI模型的數據
收集真實世界數據和建立良好、干凈且經過分類的數據的過程相當艱難,還需要耗費大量時間。工程師也必須留意大部分AI模型屬于靜態(tài)的事實(模型是使用固定的參數值來執(zhí)行),雖然模型持續(xù)地暴露在新的數據下,但這些資料卻不見得會被納入訓練數據集之中。
如果沒有健全的數據來協(xié)助訓練模型,項目失敗的可能性便提高,因此數據準備成為AI工作流程中一項至關重要的步驟?!覆缓玫摹箶祿赡茏尮こ處熁ㄙM好幾個小時嘗試找出模型未正常運作的原因,而且還不保證能夠得到具有實質意義的結果。
仿真可以協(xié)助工程師克服這些挑戰(zhàn)。在最近幾年,以資料為中心的AI將AI社群的焦點轉向訓練數據的重要性。與其將一項項目全部的時間投注在煩惱AI模型的架構和參數,證據顯示把時間花在改善訓練數據,通??梢詾槟P途_度帶來更大的改善。
使用仿真來擴充現有的訓練數據有許多好處,包括:
計算模擬通常比物理實驗的成本降低許多
工程師對于環(huán)境能夠完全的掌控,并且可以模擬在現實世界中難以建立或太危險的場景
模擬提供了一條途徑來窺探難以透過設置實驗來測量的內部狀態(tài),這在為AI模型特定情況下的表現不佳進行除錯時有很大的用處
當模型的表現高度取決于訓練數據的質量,工程師可以透過幾種流程迭代來改善結果,包含仿真數據、更新AI模型、觀察在哪一些條件下模型預測結果不佳,并且為那些條件收集更多仿真資料等。
透過Simulink和Simscape等商用工具,工程師可以產生反映了真實世界情境的仿真數據。Simulink 和 MATLAB 的結合,使得工程師能夠以和進行AI模型建立的相同環(huán)境來仿真他們的資料,這代表他們可以將更多的流程自動化,而不必擔心工具鏈的切換。
挑戰(zhàn)2 透過AI取得復雜系統(tǒng)的近似值
在設計像是控制液壓閥的算法等需與實體物理系統(tǒng)互動的算法時,以仿真為基礎的系統(tǒng)模型是促成算法的快速設計迭代的要件。
在控制領域,這類通稱為「受控體模型(plant model)」的模型,在無線領域可能被稱作「信道模型」,在強化學習(reinforcement learning)領域被稱為「環(huán)境模型」。不論是哪一種稱呼,其中的概念是共通的:建立一個以仿真為基礎的模型,它可以提供必要的精確性,再次建立和算法互動的物理系統(tǒng)。
這種方法有一個難題,就是要達到工程師一直以來依據第一原理建立的高度逼真模型的「必要的精確性」。若是在復雜的系統(tǒng),可能會需要花費相當可觀的時間,來建立和模擬以達到如此的精確性。執(zhí)行冗長的模擬,也有可能會壓縮到設計迭代的次數,意味著沒有充裕的時間來評估其他或許更合適的設計替代方案。
AI在此時出現了,工程師可以采用他們已經建立好的高度逼真物理系統(tǒng)模型,并且透過AI模型(一個降級模型)來取得近似值。在其他的情況,他們可能只需要從實驗數據訓練AI模型,完全略過建立以物理為基礎的模型。
這么做的好處是,降級模型計算起來比第一原理模型經濟許多,代表工程師可以執(zhí)行更多的設計空間探索。而且若是真的已經有現成的以物理為基礎的模型,工程師還可以在流程的后期隨時使用該模型來檢驗以AI模型進行判定的設計。
比如神經微分方程(Neural Ordinary Differential Equations)等近期AI領域的進展,即結合了AI訓練技巧與嵌入了以物理原理為基礎的模型。當工程師希望保留物理系統(tǒng)的特定部分,又希望以更接近數據中心的方法所取得的近似值,來組成系統(tǒng)的其余部分時,這類模型就可以給予很大的幫助。
挑戰(zhàn)3 AI于算法開發(fā)
開發(fā)如控制系統(tǒng)等應用的工程師在設計算法時,對于仿真的依賴程度越來越高。有許多情況下,這些工程師開發(fā)虛擬的傳感器、以及試圖計算無法直接透過傳感器量測來取得數值的觀測器。使用的方法有好幾種,包含線性模型(linear models)和卡爾曼濾波器(Kalman filters)。
但是這些方法在真實世界系統(tǒng)捕捉非線性行為的能力展現相當有限,工程師因此轉而采取以AI為基礎的方法,以更靈活地建立這些復雜的模型。他們使用測量或仿真而來的數據,訓練一個能夠從已觀測到的狀態(tài)預測尚未觀察到的狀態(tài)的AI模型,然后再將該AI模型與系統(tǒng)整合。
在這個案例,AI模型屬于控制算法的一部分,之后會被放在實際硬件上執(zhí)行。這個硬件的性能/內存可能有某種程度的限制,通常需要使用 C/C++ 等較低階的語言來進行編程。這些要求可能會限制某些應用所適合的機器學習模型種類時的選擇,因此工程師可能需要嘗試多種模型,并且比較準確度和實際運行在裝置上的表現來做權衡。
在這項領域研究的最前端,可透過強化學習使這種方式再更進一步。強化學習所學習的不只是估計器,而是學習整個控制策略。在像是機器人和自主系統(tǒng)等一些具有挑戰(zhàn)性的應用中,強化學習是一項已被證明認可的強大技術,但建立這樣的模型需要有一個精確的環(huán)境模型,這類的環(huán)境模型、以及運行大量仿真的計算能力,可能并不容易從現有資源取得。
除了虛擬的傳感器和強化學習,AI算法使用在嵌入式視覺、音頻和訊號處理、以及無線通信應用的情況也愈來愈多。舉例來說,在配備自動駕駛功能的車輛中,AI算法可以偵測路面上的車道標線來幫助車子維持在車道中間位置。
在助聽裝置,AI算法可以協(xié)助加強說話聲音并且抑制噪聲。在無線通信應用,AI算法可以運用數字預失真(digital predistortion)來抵銷功率放大器的非線性效應。在這所有的應用,AI算法只擔當了大型系統(tǒng)之中的一部分。模擬會被使用在整合測試來確保整體設計符合標準。
將AI帶入模擬的未來
一般來說,當增加了模型規(guī)模和復雜性來因應更復雜的應用,AI與仿真將成為工程 師口袋中更不可或缺的工具。使用如Simulink和MATLAB等商用工具,可賦予工程師優(yōu)化其工作流程的能力,并且透過與產生合成數據、降級建模等技巧來縮短他們的開發(fā)時間,并且將AI算法嵌入到控制、訊號處理、嵌入式視覺、無線通信等應用。
這些方法具備了強大能力,在硬件階段之前,就透過精確且可負擔的方式來開發(fā)、測試和檢驗模型,因此,使用需求將會再持續(xù)增長。
(本文由鈦思科技提供;作者Seth DeLand為MathWorks 數據分析產品營銷經理)
評論