<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 用工具彌補(bǔ)AI短板，讓AI答案更精準(zhǔn)

用工具彌補(bǔ)AI短板，讓AI答案更精準(zhǔn)

作者：Becks 時(shí)間：2024-07-18 來源：貿(mào)澤電子

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

ChatGPT和GPT-4等大型語言模型 (LLM) 已成為提高工作效率和更好地理解各種主題不可或缺的工具。從教育到軟件開發(fā)，再到內(nèi)容寫作，LLM在眾多領(lǐng)域嶄露頭角，它們在提煉和生成供人類使用的信息方面有著近乎神奇的能力。不過，盡管LLM的能力令人印象深刻，但它們在提供準(zhǔn)確答案或執(zhí)行需要精確知識(shí)的特定任務(wù)時(shí)，卻常常比較吃力。

本文引用地址：http://www.ex-cimer.com/article/202407/461150.htm

例如，對(duì)于復(fù)雜的數(shù)學(xué)問題或者晦澀難懂的題目，往往會(huì)給出錯(cuò)誤或不夠充分的答案。出現(xiàn)這些局限性的主要原因是，LLM通常是使用過時(shí)的數(shù)據(jù)進(jìn)行訓(xùn)練，以預(yù)測句子中下一個(gè)在統(tǒng)計(jì)上最有可能出現(xiàn)的單詞，而不是通過推理找出正確答案。

為了克服這些挑戰(zhàn)并提高LLM的準(zhǔn)確性，研究人員和開發(fā)人員正在創(chuàng)建工具，并更新了模型與工具互動(dòng)的方式，以建立人工智能 (AI) 驅(qū)動(dòng)的代理，使其能夠與世界互動(dòng)，獲取更豐富的信息和專業(yè)知識(shí)。

01 在沒有幫助的情況下使用AI

LLM回答各種問題的能力近乎神奇。事實(shí)上，由于它們非常好用，人們已經(jīng)越來越多地將其融入日常生活，以提高工作效率和加深對(duì)題目的理解；LLM將這些互動(dòng)視為傳統(tǒng)搜索引擎更加簡潔明了的濃縮版。

LLM正在進(jìn)入教育領(lǐng)域，學(xué)生可以用它們更好地解釋概念；LLM也在涉足軟件開發(fā)領(lǐng)域，程序員可以用它們編寫和理解代碼片段。許多內(nèi)容創(chuàng)作者和專業(yè)寫作人士也在使用它們來完成摘要、文檔寫作和頭腦風(fēng)暴等任務(wù)。

然而，底層AI在這其中的幾種應(yīng)用中卻舉步維艱，原因通常在于回答問題或完成特定的任務(wù)需要非常精確的知識(shí)。一些常見的例子包括，LLM無法給出數(shù)學(xué)問題的正確答案，或者對(duì)于一些非常冷門的問題，比如家鄉(xiāng)小鎮(zhèn)的歷史或一些鮮為人知的名人，給出的多個(gè)答案往往大相徑庭。

正如前面所說，之所以會(huì)出現(xiàn)這些錯(cuò)誤，是因?yàn)長LM是使用互聯(lián)網(wǎng)的大范圍數(shù)據(jù)進(jìn)行訓(xùn)練的，其目的是生成詞鏈中下一個(gè)在統(tǒng)計(jì)上最有可能出現(xiàn)的詞（圖1）。

基本上，它們已經(jīng)記住了這些信息，但記憶方式極為粗糙 — AI的知識(shí)更像是許多主題的粗略近似。在訓(xùn)練模型的所有數(shù)據(jù)中，某項(xiàng)信息的代表性越低，模型正確再現(xiàn)該信息的可能性就越小。例如，這些LLM在看過許多文本數(shù)據(jù)點(diǎn)（如 1+1 = 2）后，會(huì)學(xué)習(xí)加法或減法的模糊表示，通常能用統(tǒng)計(jì)上可能的響應(yīng)給出正確答案。

但是，對(duì)于像649 152這樣更復(fù)雜的輸入（它們以前可能從未見過），給出的答案往往是錯(cuò)誤的，原因可能是訓(xùn)練所使用的數(shù)據(jù)早于所需的答案，或所需的信息來自不為公眾所知的來源（如網(wǎng)站數(shù)據(jù)庫）。答案不準(zhǔn)的例子可能包括酒店或航班的價(jià)格不準(zhǔn)確，或者是給出了一年前正確但現(xiàn)在不正確的答案。為了規(guī)避這些限制，讓AI能夠在各式各樣的應(yīng)用中做出更準(zhǔn)確的響應(yīng)，我們正在設(shè)計(jì)一些工具，讓LLM能夠與周圍的世界互動(dòng)，以獲取更豐富的信息和更對(duì)口的專業(yè)知識(shí)。

圖片.png

圖1：LLM本身被訓(xùn)練成預(yù)測下一個(gè)在統(tǒng)計(jì)上最有可能出現(xiàn)的單詞 — 由于擁有大量的訓(xùn)練數(shù)據(jù)，它們在這項(xiàng)任務(wù)中取得了成功。（圖源：作者）

02 確定工具

在LLM的世界里，工具是外部應(yīng)用，模型以特定的方式與之交互，從而得出或驗(yàn)證特定的答案。最初的工具包括計(jì)算器、代碼運(yùn)行器和搜索引擎，但隨著應(yīng)用編程接口 (API) 插件、數(shù)據(jù)庫和矢量存儲(chǔ)連接等新工具的加入，以及圖像到文本提取器等其他機(jī)器學(xué)習(xí)程序的出現(xiàn)，這些工具的數(shù)量與日俱增。

前面提到的失敗案例（如模型無法正確計(jì)算公式或?qū)溟T問題回答錯(cuò)誤）可以分別通過計(jì)算器或搜索引擎等工具來解決。為了正確回答問題，模型將利用可訪問的工具，而不是完全依賴于它所學(xué)到的知識(shí)。當(dāng)模型需要做一些計(jì)算、運(yùn)行一些代碼來保證準(zhǔn)確性，利用用戶數(shù)據(jù)回答問題，或響應(yīng)用戶通常利用網(wǎng)站提出的請(qǐng)求時(shí)，就會(huì)用到這些工具。

雖然這些工具看似簡單，人類很容易理解并知道如何與之交互，但無論界面如何，AI模型都需要用代碼封裝現(xiàn)有工具（如計(jì)算器或網(wǎng)站API）并使之交互。特別是，工具需要受軟件約束，其輸入和輸出可通過代碼完成（圖2）。

例如，可以使用網(wǎng)站的API來代替用戶界面，這樣無需點(diǎn)擊按鈕或選中復(fù)選框，就能確保純文本輸入被發(fā)送到工具。工具信息的另一個(gè)重要部分是關(guān)于何時(shí)使用工具的說明，這一點(diǎn)很重要，因?yàn)樗梢宰屇Ｐ土私夤ぞ叩挠猛?，以及有關(guān)何時(shí)不能使用該工具的具體說明。如果工具被過度使用，后者可能會(huì)有幫助。

圖片.png

圖2：AI工具看起來就像軟件功能，具有基于代碼的輸入、輸出和使用說明。（圖源：作者）

傳感器與云以及分析軟件配合使工作人員能夠了解生產(chǎn)過程狀況，并簡化查找設(shè)備存在的潛在問題，使得工作和流程更加高效，同時(shí)提高了制造產(chǎn)品的整體質(zhì)量和可靠性。

例如，在制藥過程中，無線傳感器可以通過監(jiān)測溫度、濕度等參數(shù)確保生產(chǎn)過程。此外，傳感器還可以通過監(jiān)測設(shè)備的運(yùn)行狀態(tài)，及時(shí)發(fā)現(xiàn)設(shè)備故障，從而提高生產(chǎn)效率。借助智能傳感器，讀取測量屬性，提升工廠智能化水平。在嚴(yán)苛環(huán)境和條件下進(jìn)行精確測量能夠?qū)鞲屑夹g(shù)的應(yīng)用范圍擴(kuò)大到多種工業(yè)設(shè)備。

03 教AI使用工具

僅僅將面向人類的現(xiàn)有工具改寫或包裝成適合AI使用的工具是不夠的。還要更新LLM用來決定何時(shí)與工具交互的提示流。這一過程將模型變成一個(gè)代理，它知道如何通過結(jié)合輸入、提示指令和可使用的工具來生成正確的答案。

與LLM的典型交互方式是編寫一條供模型執(zhí)行的特定指令，通常會(huì)舉例說明對(duì)于特定類型的輸入，響應(yīng)應(yīng)該是什么樣的。開發(fā)這些指令的過程被稱為“提示工程”。在教AI使用工具時(shí)，將擴(kuò)展“提示工程”以包含模型為完成任務(wù)而應(yīng)做出的一連串決定。

使用像LangChain這樣的軟件庫（在Python、JavaScript和其他編程語言中提供），用戶可以將LLM（例如GPT-4）、一套工具（如計(jì)算器、代碼編譯器）與代理結(jié)構(gòu)結(jié)合起來，構(gòu)建可以使用工具的AI應(yīng)用。更重要的是，它允許增加內(nèi)存和響應(yīng)鏈功能，從而實(shí)現(xiàn)更強(qiáng)大的能力。

例如，要回答“我們?nèi)ツ甑氖杖氤凿N售量是多少？”這樣的問題，就需要這種支持鏈?zhǔn)竭壿嫛⑹褂枚喾N工具的代理。

首先，除法計(jì)算需要一個(gè)計(jì)算器，還需要一個(gè)查詢程序與公司的數(shù)據(jù)庫進(jìn)行交互。其次，由于這是一個(gè)多步驟的問題，因此在提示代理時(shí)，必須觀察它需要采取哪些步驟，比如查詢?nèi)ツ甑氖杖牒弯N售量。根據(jù)這些觀察結(jié)果，代理的內(nèi)部提示將決定一項(xiàng)行動(dòng) — 例如，“使用查詢工具搜索答案”。然后根據(jù)需要多次重復(fù)這一過程，直至獲得最終答案。

在這個(gè)案例中，有關(guān)去年收入和銷售量的信息會(huì)觸發(fā)代理的觀察，即應(yīng)該將二者相除來找到答案。而這反過來又會(huì)觸發(fā)將二者輸入計(jì)算器工具這個(gè)操作。由于沒有更多的步驟發(fā)生，代理將認(rèn)為它已經(jīng)得到了最終答案，并將其提供給用戶（圖3）。將這一系列觀察、操作和響應(yīng)串聯(lián)在一起，意味著LLM驅(qū)動(dòng)的代理可以完成比單獨(dú)使用LLM更為復(fù)雜的任務(wù)。

圖片.png

圖3：具有特定提示流的代理能讓LLM與工具進(jìn)行交互。（圖源：作者）

04 結(jié)語

雖然ChatGPT和GPT-4等LLM徹底改變了檢索和生成信息的過程，但對(duì)于需要精確知識(shí)的任務(wù)來說，它們?nèi)杂幸欢ǖ木窒扌浴?/p>

不過，研究人員和開發(fā)人員通過將工具納入LLM生態(tài)系統(tǒng)找到了解決方案。這些工具包括計(jì)算器、搜索引擎、API和數(shù)據(jù)庫連接等，允許LLM與外部應(yīng)用交互并獲取更豐富的信息。利用這些工具，LLM可以克服自身的局限性，為各種應(yīng)用提供更準(zhǔn)確的回復(fù)。

要教會(huì)LLM有效地使用工具，就要更新它們的提示流，將它們變成智能代理。這將提示模型就何時(shí)與工具互動(dòng)做出明智的決定，并將它們的輸入、提示指令和對(duì)工具的訪問相結(jié)合，生成正確的答案。

未來，隨著LLM的不斷發(fā)展及其工具功能的擴(kuò)展，會(huì)有更多令人印象深刻的應(yīng)用和進(jìn)步。通過挖掘LLM驅(qū)動(dòng)的、可訪問各種工具的代理的潛力，我們可以在提高生產(chǎn)力、解決問題和探索知識(shí)等方面解鎖新的可能。LLM與工具之間的協(xié)同作用正在為人類與AI之間更智能、更高效的互動(dòng)鋪平道路。

來源：貿(mào)澤電子

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 語言模型 LLM AI

評(píng)論

相關(guān)推薦

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

AI當(dāng)靠山軟件大廠SAP裁員擴(kuò)大至上萬

智能計(jì)算 AI 軟件 SAP 裁員 | 2024-07-24

HBM4持續(xù)加速：AI時(shí)代競爭新焦點(diǎn)

網(wǎng)絡(luò)與存儲(chǔ) HBM AI 內(nèi)存 | 2024-07-25

國際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

CSR8670CSR8675智能語音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計(jì)算 OpenAI ChatGPT AI | 2024-07-25

WTC-AI太陽能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

WTC-AI型太陽能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();