<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 設(shè)計應(yīng)用 > 拿企業(yè)知識圖(KG)來訓(xùn)練模型

拿企業(yè)知識圖(KG)來訓(xùn)練模型

作者：高煥堂時間：2024-05-13 來源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

本文引用地址：http://www.ex-cimer.com/article/202405/458682.htm

1 前言

在上一期里，親自動手訓(xùn)練了注意力(Attention) 機(jī)制。由于Attention機(jī)制是當(dāng)今大語言模型(LLM)的核心。于是，可以拿各種知識或數(shù)據(jù)來訓(xùn)練Attention機(jī)制。例如，在人人享用LLM的生成( 創(chuàng)作) 能力之余，如何化解其過多幻覺(Hallucination)的問題也很受關(guān)注。于是，本期就拿企業(yè)知識圖(Knowledge Graph，KG)的知識來讓Attention 機(jī)制學(xué)習(xí)。也作為LLM 與KG 完美結(jié)合的基礎(chǔ)。

2 LLM與KG的結(jié)合

在LLM帶動的大模型風(fēng)潮下，各企業(yè)的致勝策略有那些呢? 大模型可比喻為野獸( 如野貓)，于是致勝之道即是：蓄牧。也就是：馴服野獸。企業(yè)人士可以發(fā)咒語(Prompt)來力求能馴服、駕馭野獸?？墒?，僅僅透過語言(文句)溝通，經(jīng)常力道有限、效率不佳。例如，在AI繪圖大模型(如Stable Diffusion )，盡管您用了LoRA、ControlNet等，且努力發(fā)咒語，其生成作品，其不滿意的也常十之八九。于是有些人士，就建立企業(yè)自用的繪圖Decoder 模型( 如GAN 模型) 來幫忙。簡而言之，世界級大模型擅長于“畫龍”，但貧于“點睛”，因而常畫出龍身鳳眼或龍身蛇眼等創(chuàng)作。于是，企業(yè)人士就可以訓(xùn)練企業(yè)自己的Decoder 模型去做好關(guān)鍵性的“點睛”任務(wù)。

為什么需要自用的Decoder模型去點睛，而不是由人去點睛呢？理由是：人與大模型之前主要依賴語句( 咒語) 溝通，效果不佳。而Decoder與大模型可直接傳遞作品，高效互動、協(xié)作。于是，在繪圖、影音領(lǐng)域，GAN很適合做為Decoder，來幫Diffusion大模型做<點睛>的協(xié)作任務(wù)。而在語言文辭( 如QA)領(lǐng)域，基于知識圖(Knowledge Graph，簡稱KG) 的模型很適合當(dāng)做Decoder，來幫忙LLM 大模型做<點睛> 的協(xié)作任務(wù)，如圖1 所示。

圖1

引自：https://arxiv.org/pdf/2306.08302

LLM與KG的結(jié)合，有助于降低LLM的幻覺風(fēng)險。LLM的幻覺現(xiàn)象源于：缺乏準(zhǔn)確性(accuracy)、缺乏可解釋性(explainability)和缺乏可控性(governance)。

此時，企業(yè)知識圖是實體(Entity)相互關(guān)聯(lián)的集合，其將企業(yè)專家的經(jīng)驗直覺、相關(guān)數(shù)據(jù)與其涵意(Semantics)和上下文(Context)連結(jié)起來，就更易于理解和共享，非常有助于彌補(bǔ)上述的LLM三項缺點。LLM與KG由很多種結(jié)合方式，如圖2所示。

圖2

引自：https://medium.com/@sradhakrishnan_37036/navigating-aisreality-the-role-of-kgs-and-llms-in-fact-checking-c93f1abfb214

LLM天生非常善解文句和人意，它使用語意搜尋從KG中檢索相關(guān)信息，讓人人能直接提問(Prompt) 來獲得符合企業(yè)實況的回復(fù)。因而讓LLM 產(chǎn)生更精確、準(zhǔn)確且與上下文相符合的輸出，也防止了偏見和幻覺。

3 復(fù)習(xí)知識圖(KG)

一個圖(Graph)是一組節(jié)點(Nodes)，它們表示系統(tǒng)中的實體(Entities)的集合。然后，透過邊(Edge)的連接來表示這些節(jié)點之間的關(guān)系( 即實體之間的關(guān)系。節(jié)點可以代表任何形式的個體，例如人、企業(yè)、城市、機(jī)場等等，如圖3所示。

圖3

引自：https://www.nvidia.com/en-us/glossary/networkx/

這是有關(guān)于飛機(jī)場的KG，其中的兩個節(jié)點分別表示洛杉磯機(jī)場(LAX)，以及圣荷西機(jī)場(SJC)。而其邊代表航班( 如Flight 123)。

4 “KG + Attention”訓(xùn)練范例

茲以KG 來建立海峽兩岸的機(jī)場及航班數(shù)據(jù)，其中有兩種節(jié)點：機(jī)場和城市，如圖4所示。

圖4

于是，就可以拿這KG 里真實知識，來訓(xùn)練一個Attention機(jī)制( 模型)，來掌握這項關(guān)系。就能與LLM協(xié)作，來掌握之真實的知識，例如：虹橋機(jī)場位于上海。也能獲知上海有兩個主要機(jī)場：虹橋機(jī)場和浦東機(jī)場。

茲撰寫下述程序碼：

# att_airport.py

import torch

import torch.nn as nn

nodes=[‘松山機(jī)場’,’虹橋機(jī)場’,’浦東機(jī)場’,’

小港機(jī)場’,’臺北’,’上?！?’高雄’]

nx={w : i for i, w in enumerate(nodes)}

xn={nx[w]: w for w in nx}

#定義模型

class SelfAttention(nn.Module):

def __init__(self, d):

super().__init__()

self.W_q = nn.Linear(d, 16)

self.W_k = nn.Linear(d, 16)

self.W_v = nn.Linear(d, d)

def forward(self, q, k, v):

Q, K, V = self.W_q(q), self.W_k(k), self.W_

v(v)

scores = torch.matmul(Q, K.transpose(-2, -1))

A = torch.softmax(scores, dim=-1)

return torch.matmul(A, V)

# 初始化模型、損失函數(shù)和優(yōu)化器

model = SelfAttention(len(nodes))

opt = torch.optim.Adam(model.parameters(),

lr=0.001)

loss_fn = nn.MSELoss()

dx = torch.tensor([nx[‘ 臺北’], nx[‘ 上海’],

nx[‘高雄’], nx[‘上?！痌])

dt = torch.tensor([nx[‘松山機(jī)場’], nx[‘虹橋機(jī)場’],

nx[‘小港機(jī)場’], nx[‘浦東機(jī)場’]])

X = nn.functional.one_hot(dx, len(nodes)).float()

T = nn.functional.one_hot(dt, len(nodes)).float()

# 訓(xùn)練模型

print(‘n 開始訓(xùn)練...’)

for ep in range(3001):

opt.zero_grad()

loss = loss_fn(model(X,X,X), T)

loss.backward()

opt.step()

if(ep%1000==0): print(f’ep={ep}, Loss: {loss.

item():.4f}’)

# 預(yù)測

tx = torch.tensor([nx[‘臺北’], nx[‘上海’]])

h = nn.functional.one_hot(tx, len(nodes)).float()

probs = model(h, h, h)

print(‘n----- 預(yù)測 -----’)

for i in range(2):

for j in range(7):

if(probs[i][j] > 0.25):

print(xn[tx.detach().numpy()[i]]+ ‘ 有:’,

nodes[j])

#END

這建立一個SelfAttention 模型，讓它學(xué)習(xí)“城市”與“機(jī)場”實體之間的對應(yīng)關(guān)系。現(xiàn)在就來執(zhí)行這個程序，展開訓(xùn)練3000 回合。訓(xùn)練完畢，就可以輸入“城市”名稱，由這模型回答其所有的< 機(jī)場> 名稱，如下：

以上基于簡單KG 來舉例說明 KG 與Attention 機(jī)制的結(jié)合?？梢詮臋C(jī)場找城市，也可以從城市找機(jī)場。

5 結(jié)束語

LLM因基于歸納法及統(tǒng)計自回歸算法，其天生具有創(chuàng)意和幻覺特質(zhì)。而KG 含有專家的智慧，也表達(dá)企業(yè)的真實(Facts )，很適合拿來訓(xùn)練Attention或Transformer模型，以便過濾LLM所生成的作品，降低幻覺。于是，LLM畫龍、企業(yè)KG來點睛，兩者天作之合。

（本文來源于《EEPW》2024.5）

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 202405 企業(yè)知識圖 高煥堂

評論

相關(guān)推薦

英特爾：以邊緣智能帶動AI應(yīng)用在各個行業(yè)落地

智能計算 202405 英特爾邊緣智能 | 2024-05-12

芯科科技：深度解讀邊緣智能，引領(lǐng)未來物聯(lián)網(wǎng)關(guān)鍵領(lǐng)域增長

物聯(lián)網(wǎng)與傳感器 202405 芯科科技邊緣智能 | 2024-05-13

拿企業(yè)知識圖(KG)來訓(xùn)練模型

智能計算 202405 企業(yè)知識圖高煥堂 | 2024-05-13

STM32揭示2024年嵌入式系統(tǒng)三大趨勢

嵌入式系統(tǒng) 202405 STM32 嵌入式系統(tǒng) | 2024-05-15

安全低功耗藍(lán)牙連接技術(shù)在汽車中的應(yīng)用

手機(jī)與無線通信 202405 低功耗藍(lán)牙 MCU | 2024-05-15

瑞薩：領(lǐng)跑未來數(shù)據(jù)處理與實時應(yīng)用新紀(jì)元

嵌入式系統(tǒng) 202405 瑞薩數(shù)據(jù)處理 | 2024-05-12

利用ConcurrentConnect?天線分集技術(shù)擴(kuò)大通信范圍

手機(jī)與無線通信 202405 ConcurrentConnect 天線分集技術(shù) Qorvo | 2024-05-15

意法半導(dǎo)體：聚焦工業(yè)4.0以及先進(jìn)邊緣人工智能

工控自動化 202405 意法半導(dǎo)體工業(yè)4.0 邊緣人工智能 | 2024-05-12

本土人形機(jī)器人企業(yè)如何熬到爆發(fā)的那一天？

202405 人形機(jī)器人 | 2024-05-13

創(chuàng)新存儲如何滿足“既要、又要、還要”的苛刻設(shè)計需求

網(wǎng)絡(luò)與存儲 202405 存儲兆易創(chuàng)新 | 2024-05-15

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();