邁向決策式AI:提供反事實(shí)的建議
1 認(rèn)識反事實(shí)思考
計算機(jī)科學(xué)界諾貝爾獎「圖靈獎」得主Judea Pearl(珀?duì)? 在他的開創(chuàng)性著作《The Book of Why》一書里,提到了「因果關(guān)系階梯」(Ladder of Causality)的概念。他指出了這個階梯上的三個梯級——聯(lián)想(Association)、干預(yù)(Intervention) 和反事實(shí)(Counterfactuals)。其中,最頂級的是反事實(shí)梯級,位于這梯級的思考者可以想象(Imaging) 不存在的世界并推斷觀察到的現(xiàn)象,并試圖去了解事件的起因來深刻理解問題緣由。因而他們能夠考慮在第1 層或第2 層級所無法想象到的一些場景( 圖-1)。
圖-1 因果關(guān)系階梯
近年來,許多專家用心研究反事實(shí)推理對人們決策(Decision-making)的影響,其提倡決策者應(yīng)該根據(jù)反事實(shí)來評估可能采取的替代性方案或行動。其中的反事實(shí)推理意味著思考過去或未來事件的替代可能性。當(dāng)一個人修改先前的事實(shí)事件,然后評估該變化的后果時,就會出現(xiàn)反事實(shí)思考了。例如,人們常常會透過想象某些因素可能會有所不同來反思車禍的結(jié)果,便能為已經(jīng)發(fā)生的生活事件創(chuàng)造可能的替代方案,于是出現(xiàn)反事實(shí)思考:「如果我沒有分心聽歌,而無意中超速,就不會發(fā)生車禍?!?/p>
2 讓AI來參與反事實(shí)推理
反事實(shí)思考使人們能夠探索最初可能沒有考慮過的< 替代性> 路徑和解決方案。換句話說,參與反事實(shí)推理可以透過鼓勵個人考慮< 替代方案> 來激發(fā)創(chuàng)意,幫助人們以不同的方式看待事物,從而帶來創(chuàng)造性的發(fā)現(xiàn)。因而人們能根據(jù)預(yù)期結(jié)果調(diào)整自己的行動來增強(qiáng)未來規(guī)劃,從而獲得更成功的行動方案和效果。
于是,也可以讓AI 來探索創(chuàng)造性的< 替代方案>,并與人類協(xié)作參與反事實(shí)推理,將能幫助人們以不同的方式看待事物,從而帶來創(chuàng)造性的發(fā)現(xiàn)。使得人們能根據(jù)預(yù)期結(jié)果調(diào)整自己的行動來增強(qiáng)未來規(guī)劃,從而獲得更成功的行動方案和效果。人們基于AI 提供的替代性方案,就可以深入了解新的可能性和創(chuàng)新方法,透過擴(kuò)大考慮的解決方案的范圍來幫助解決問題。它促使個人跳出框框思考并評估不同的結(jié)果,因而可以找出最初可能并不明顯的新穎解決方案。
3 訓(xùn)練AI模型,來提供替代方案
茲以食譜的創(chuàng)新與推薦為例,來說明AI 模型的規(guī)劃與訓(xùn)練流程。透過這項(xiàng)< 反事實(shí)推理> 流程,不僅能說明發(fā)現(xiàn)新的食材組合,還能模擬用戶的偏好變化對推薦結(jié)果的影響,從而為個性化推薦和食材創(chuàng)新提供強(qiáng)有力的支持。例如,透過GCN 模型可以仿真“如果用戶偏好發(fā)生變化,食材組合會如何變化”的反事實(shí)思考步驟。并能推測出使用者未嘗試過但可能感興趣的食材組合,從而生成更具創(chuàng)意和吸引力的食譜。這種方式不僅能推薦使用者偏好的食材,還能引導(dǎo)用戶嘗試新的搭配,促進(jìn)食譜的創(chuàng)新和多樣化。
階段一、訓(xùn)練GCN模型獲取食材嵌入
訓(xùn)練GCN 模型獲取原始的食材嵌入(Ingredient embedding),通過食材圖譜(Graph) 的關(guān)系學(xué)習(xí)每個食材的特征表示。例如,有6 種食材( 蔥、蛋、鹽、糖、蒜和胡椒),以及其關(guān)系( 圖-2),可以使用圖結(jié)構(gòu)來表示之。
圖-2 食材圖譜
接著,就讓GCN模型來從食材圖譜的關(guān)系中,學(xué)習(xí)每個食材的潛藏空間向量表示,這通稱為:食材嵌入。于是,就撰寫Python程序代碼來實(shí)踐GCN,執(zhí)行時輸出食材嵌入,如下:
這些嵌入將為后續(xù)的推薦和反事實(shí)生成提供關(guān)鍵特征。
階段二、訓(xùn)練另一個GCN模型,獲取反事實(shí)連結(jié)
基于用戶喜愛的食材關(guān)系,構(gòu)建推薦GCN,生成新的< 用戶- 食材> 的潛在連結(jié),又稱為:反事實(shí)連結(jié)(Counterfactual Links),簡稱為:CF_Links。這利用GCN 來推薦新連結(jié)( 即CF Links),這一步可仿真用戶對新食材組合的潛在偏好,是推薦系統(tǒng)的核心。這種方式將用戶行為與食材特征結(jié)合起來,通過生成新的連結(jié),能夠發(fā)現(xiàn)潛在的< 用戶- 食材> 關(guān)系,成為反事實(shí)分析的基礎(chǔ)。例如,有4 位用戶(User),其喜愛食材(Item)的關(guān)系( 圖-3),可以使用圖譜結(jié)構(gòu)來表示之。
圖-3 <用戶-食材>圖譜
接著,就來建立另一個GCN模型來從< 用戶- 食材> 圖譜的關(guān)系中,展開學(xué)習(xí)并推測出用戶可能感興趣的新食材組合,然后把這項(xiàng)新食材推薦給該用戶。于是,就撰寫Python程序代碼來實(shí)踐GCN,并生成CF_Links,如下:
這程序生成了CF_Links表,從表中可以看出來,針對User-0探索出兩條新連結(jié):[0, 2] 和[0, 3]。在從兩條之間挑出一條比較緊密的關(guān)聯(lián)( 即[0, 2]),于是就推薦食材-2 給他。同樣地,針對User-1 探索出一條新連結(jié):[1, 0]。于是就推薦食材-0 給她。這些CF_Links表示用戶對食材的反事實(shí)偏好( 即用戶對不同食材的潛在興趣),就能為用戶推薦最相關(guān)的食材組合( 圖-4)。
圖-4 基于CF_Links來推薦
這樣就生成了個性化推薦清單。例如,為用戶推薦他們可能感興趣的食材創(chuàng)新組合。
階段三、訓(xùn)練另一個GCN模型,構(gòu)建反事實(shí)的食材圖譜
本階段的任務(wù)是:利用反事實(shí)鏈接(CF_Links) 為目標(biāo),來訓(xùn)練一個反事實(shí)GCN模型,生成新的食材嵌入,來構(gòu)建反事實(shí)的食材圖譜。這三階段流程不僅能說明發(fā)現(xiàn)新的食材組合,還能發(fā)揮反事實(shí)思考,想象用戶偏好變化對推薦結(jié)果的影響,從而為個性化推薦和食材創(chuàng)新提供極大助力。于是,就撰寫Python 程序代碼來實(shí)踐反事實(shí)GCN 模型,并生成食材之間的CF_Links,如下:
這程序生成了新的連結(jié):食材-4與食材-5。其表示食材與食材的反事實(shí)連結(jié)( 圖-5)。
圖-5 食材的反事實(shí)連結(jié)
這程序生成了新的連結(jié):食材-4 與食材-5。就能逐步生成食材創(chuàng)新組合,而創(chuàng)造新食譜。例如:原來的食譜X = { 食材-2, 食材-5}。就有可能把食材-4 添加到原來食譜X 里了。
4 結(jié)束語:邁向決策式AI
當(dāng)食材-4 與食材-5 之間的相似度,除了考慮它們與用戶之間的喜愛度之外,還能考慮這兩種食材之間的口味相似度,就有可能建議以食材-5 來替換食譜X里食材-4 了,就成為用戶選擇食譜X 時的替代決策方案。例如針對上述圖-3 里的每一條連結(jié),都提出一個替代性方案。如下:
除了飲食決策之外,上述的GCN模型也可應(yīng)用于其他領(lǐng)域,例如在醫(yī)藥方面的文章:《基于藥物相互作用的慢性病決策支持系統(tǒng)》(Decision Support System for Chronic Diseases Based on Drug-Drug Interactions), 也有很精采的應(yīng)用和效果。這篇文章提出了DSSDDI 決策支持系統(tǒng),其基于藥物之間的相互作用來支持醫(yī)生開藥決策。
(本文來源于《EEPW》202411)
評論