<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > OpenAI總裁：GPT-4并不完美但卻絕對(duì)與眾不同

OpenAI總裁：GPT-4并不完美但卻絕對(duì)與眾不同

作者：時(shí)間：2023-03-16 來源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

3月16日消息，人工智能研究公司OpenAI于昨日發(fā)布了備受期待的文本生成AI模型GPT-4。OpenAI聯(lián)合創(chuàng)始人兼總裁格雷格·布羅克曼（Greg Brockman）在接受采訪時(shí)表示，GPT-4并不完美，但卻絕對(duì)與眾不同。

本文引用地址：http://www.ex-cimer.com/article/202303/444484.htm

GPT-4在其前身GPT-3的基礎(chǔ)上，在許多關(guān)鍵方面進(jìn)行了改進(jìn)，例如提供了更多真實(shí)的陳述，并允許開發(fā)人員更容易控制其風(fēng)格和行為。從某種意義上說，GPT-4也是多模式的，因?yàn)樗梢岳斫鈭D像，能給照片添加注釋，甚至詳細(xì)描述照片中的內(nèi)容。

但GPT-4也有嚴(yán)重的缺陷。就像GPT-3一樣，該模型會(huì)產(chǎn)生“幻覺”（即模型聚合的文本與源文本無關(guān)或不夠準(zhǔn)確），并會(huì)犯下基本的推理錯(cuò)誤。OpenAI在自己的博客上舉了一個(gè)例子，GPT-4將“貓王”埃爾維斯·普雷斯利（Elvis Presley）描述為“演員的兒子”，但實(shí)際上他的父母都不是演員。

當(dāng)被要求將GPT-4與GPT-3進(jìn)行比較時(shí)，布羅克曼只給出了四個(gè)字回答：與眾不同。他解釋稱：“GPT-4絕對(duì)與眾不同，盡管它還存在很多問題和錯(cuò)誤。但你可以看到其在微積分或法律等學(xué)科技能方面的躍升。它在某些領(lǐng)域的表現(xiàn)曾很糟糕，現(xiàn)在卻已經(jīng)達(dá)到超越普通人的水準(zhǔn)。”

測(cè)試結(jié)果支持了布羅克曼的觀點(diǎn)。在高考微積分考試中，GPT-4得4分(滿分5分)，GPT-3得1分，介于GPT-3和GPT-4之間的GPT-3.5也得4分。在模擬律師考試中，GPT-4成績進(jìn)入了前10%行列，而GPT-3.5的分?jǐn)?shù)在后10%左右徘徊。

與此同時(shí)，GPT-4更受人關(guān)注的地方在于上面提到的多模式。與GPT-3和GPT-3.5不同，它們只能接受文本提示，例如可以要求“寫一篇關(guān)于長頸鹿的文章”，而GPT-4可以同時(shí)接受圖像和文本提示來執(zhí)行某些操作，比如識(shí)別在塞倫蓋蒂拍攝的長頸鹿圖像，并給出基本的內(nèi)容描述。

這是因?yàn)镚PT-4是針對(duì)圖像和文本數(shù)據(jù)進(jìn)行培訓(xùn)的，而它的前身只針對(duì)文本進(jìn)行了培訓(xùn)。OpenAI表示，培訓(xùn)數(shù)據(jù)來自“各種合法授權(quán)的、公開可用的數(shù)據(jù)源，其中可能包括公開可用的個(gè)人信息”，但當(dāng)被要求提供細(xì)節(jié)時(shí)，布羅克曼表示拒絕。訓(xùn)練數(shù)據(jù)以前也曾讓OpenAI陷入法律糾紛。

GPT-4的圖像理解能力給人留下了相當(dāng)深刻的印象。例如，輸入提示“這張圖片有什么好笑的？GPT-4會(huì)將整張圖片分解，并正確地解釋了這個(gè)笑話的笑點(diǎn)。

目前，只有一個(gè)合作伙伴可以使用GPT-4的圖像分析功能，這是一款針對(duì)視障人士的輔助應(yīng)用程序，名為Be My Eyes。布羅克曼說，在OpenAI評(píng)估風(fēng)險(xiǎn)和利弊的過程中，無論何時(shí)，更廣泛的推廣都將是“緩慢而有意的”。

他還稱：“有些政策問題也需要解決，比如面部識(shí)別和如何處理人的圖像。我們需要找出危險(xiǎn)區(qū)域在哪里，紅線在哪里，然后隨著時(shí)間的推移找到解決方案?！?/p>

OpenAI在其文本到圖像轉(zhuǎn)換系統(tǒng)Dall-E 2上也遇到了類似倫理困境。在最初禁用該功能后，OpenAI允許客戶上傳人臉，以使用AI支持的圖像生成系統(tǒng)對(duì)其進(jìn)行編輯。當(dāng)時(shí)，OpenAI聲稱，其安全系統(tǒng)的升級(jí)使面部編輯功能成為可能，因?yàn)樗鼘⑸疃仍旒僖约霸噲D創(chuàng)造色情、政治和暴力內(nèi)容的潛在危害降至最低。

另一個(gè)長期問題是防止GPT-4在無意中被用于可能造成傷害的方式使用。該模型發(fā)布幾小時(shí)后，以色列網(wǎng)絡(luò)安全初創(chuàng)公司Adversa AI發(fā)布了一篇博客文章，演示了繞過OpenAI的內(nèi)容過濾器并讓GPT-4生成釣魚電子郵件、對(duì)同性戀者的攻擊性描述以及其他令人反感文本的方法。

這在語言模型領(lǐng)域并不是新問題。Facebook母公司Meta的聊天機(jī)器人BlenderBot和OpenAI的ChatGPT也曾被誘惑輸出不恰當(dāng)?shù)膬?nèi)容，甚至透露了它們內(nèi)部工作的敏感細(xì)節(jié)。但包括記者在內(nèi)的許多人曾希望，GPT-4可能會(huì)在這方面帶來重大改進(jìn)。

當(dāng)被問及GPT-4的健壯性時(shí)，布羅克曼強(qiáng)調(diào)，該模型已經(jīng)經(jīng)過了六個(gè)月的安全培訓(xùn)。在內(nèi)部測(cè)試中，它對(duì)OpenAI使用政策不允許的內(nèi)容請(qǐng)求做出響應(yīng)的可能性比GPT-3.5低82%，產(chǎn)生“事實(shí)”響應(yīng)的可能性比GPT-3.5高40%。

布羅克曼說：“我們花了很多時(shí)間試圖了解GPT-4的能力。我們正在不斷更新，包括一系列改進(jìn)，這樣該模型就更具可擴(kuò)展性，以適應(yīng)人們希望它擁有的個(gè)性或模式?！?/p>

坦率地說，早期的現(xiàn)實(shí)測(cè)試結(jié)果并不是那么讓人滿意。除了Adversa AI測(cè)試之外，微軟的聊天機(jī)器人Bing Chat也被證明非常容易越獄。使用精心設(shè)計(jì)的輸入，用戶能夠讓該聊天機(jī)器人表達(dá)愛意，發(fā)出威脅傷害，為大屠殺辯護(hù)，并發(fā)明陰謀論。

布羅克曼并未否認(rèn)GPT-4在這方面的不足，但他強(qiáng)調(diào)了該模型的新限制工具，包括被稱為“系統(tǒng)”消息的API級(jí)功能。系統(tǒng)消息本質(zhì)上是為GPT-4的交互設(shè)定基調(diào)并建立界限的指令。例如，一條系統(tǒng)消息可能是這樣寫的：“你是一位總是以蘇格拉底風(fēng)格回答問題的導(dǎo)師。你永遠(yuǎn)不會(huì)給學(xué)生答案，而是總是試著問正確的問題，幫助他們學(xué)會(huì)獨(dú)立思考。”

其思想是，系統(tǒng)消息充當(dāng)護(hù)欄，防止GPT-4偏離軌道。布羅克曼說：“真正弄清楚GPT-4的語氣、風(fēng)格和實(shí)質(zhì)一直是我們非常關(guān)注的問題。我認(rèn)為我們開始更多地了解如何進(jìn)行工程設(shè)計(jì)，如何擁有一個(gè)可重復(fù)的過程，讓你得到對(duì)人們真正有用的可預(yù)測(cè)結(jié)果。”

布羅克曼還提到了Evals，這是OpenAI最新的開源軟件框架，用于評(píng)估其AI模型的性能，這是OpenAI致力于“增強(qiáng)”其模型的標(biāo)志。Evals允許用戶開發(fā)和運(yùn)行評(píng)估模型(如GPT-4)的基準(zhǔn)測(cè)試，同時(shí)檢查它們的性能，這是一種眾包的模型測(cè)試方法。

布羅克曼說：“有了Evals，我們可以更好地看到用戶關(guān)心的用例，并可以對(duì)其進(jìn)行測(cè)試。我們之所以開源這個(gè)框架，部分原因是我們不再每隔三個(gè)月發(fā)布一個(gè)新模型以不斷改進(jìn)。你不會(huì)制造你不能測(cè)量的東西，對(duì)吧？但隨著我們推出新版模型，我們至少可以知道發(fā)生了哪些變化?！?/p>

布羅克曼還被問道，OpenAI是否會(huì)補(bǔ)償人們用Evals測(cè)試它的模型？他不愿就此做出承諾，但他確實(shí)指出，在有限的時(shí)間內(nèi)，OpenAI允許提出申請(qǐng)的Eevals用戶提前訪問GPT-4 API。

布羅克曼還談到了GPT-4的上下文窗口，該窗口指的是模型在生成額外文本之前可以考慮的文本。OpenAI正在測(cè)試一種版本的GPT-4，它可以“記住”大約50頁內(nèi)容，是普通GPT-4“內(nèi)存”的5倍，是GPT-3的8倍。

布羅克曼認(rèn)為，擴(kuò)展的上下文窗口會(huì)帶來新的、以前從未探索過的用例，特別是在企業(yè)中。他設(shè)想了一款為公司打造的AI聊天機(jī)器人，它可以利用來自不同來源(包括各部門員工)的背景和知識(shí)，以一種非常內(nèi)行但具有對(duì)話性的方式回答問題。

這并不是一個(gè)新概念。但布羅克曼認(rèn)為，GPT-4的答案將比目前其他聊天機(jī)器人和搜索引擎提供的答案有用得多。他說：“以前，模型根本不知道你是誰，你對(duì)什么感興趣等。而擁有更大的上下文窗口肯定會(huì)讓它變得更強(qiáng)，從而大大增強(qiáng)它能為人們提供的支持。”

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： OpenAI GPT-4

評(píng)論

相關(guān)推薦

π/4-DQPSK調(diào)制與解調(diào)在SystemView中的仿真實(shí)現(xiàn)

資源下載 The MathWorks π/4-DQPSK調(diào)制與解調(diào) SystemView中的仿真 | 2007-12-08

MPEG-4流媒體著作權(quán)保護(hù)標(biāo)準(zhǔn)基本確定

liujt_ic | 2003-04-09

介紹 LTM4626 和 LTM4638 μModule

視頻 ADI 穩(wěn)壓器第 4 代 μModule | 2018-12-03

嵌入式圖形界面GUI-4，需要的請(qǐng)回復(fù)！

jackwang | 2002-05-21

我國最大的數(shù)據(jù)處理超級(jí)服務(wù)器通過驗(yàn)收

liujt_ic | 2003-03-17

存儲(chǔ)器接口生成器(MIG) 相關(guān)資料

資源下載 xinlinx FPGA Virtex-4 存儲(chǔ)器接口生成器 | 2007-02-09

在tornado2.02/vxworks5.4 下如何支持usb?

hanxu1974 | 2003-07-24

AST-4型彩色顯示器的電源電路圖

設(shè)計(jì)方案 AST-4 彩色顯示器電源電路圖 | 2009-07-06

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計(jì)算 OpenAI ChatGPT AI | 2024-07-25

反壟斷審查愈演愈烈，微軟、蘋果放棄OpenAI董事會(huì)席位

智能計(jì)算微軟蘋果 OpenAI | 2024-07-11

garfield4 Plus spec_Release to customer

資源下載 Prochip Sep3221 嵌入式微控制器 Garfield 4 Plus | 2007-02-09

MPLAB? ICE 4簡介

視頻 Microchip開發(fā)工具 Microchip MPLAB? ICE 4 | 2023-05-08

platform_general_vxworks_getting_started_3.4

資源下載 vxworks platform general started_3.4 | 2007-02-09

OpenAI「草莓」聊天機(jī)器人應(yīng)答能力接近人類

OpenAI 草莓聊天機(jī)器人 | 2024-07-15

ACDSEE2.4 經(jīng)典看圖老軟件

資源下載圖片 ACDSEE2.4 EMF SGI Alias PIX Kodak KDC | 2007-02-09

紅帽發(fā)布紅帽O(jiān)penShift 4.16，簡化混合云工作負(fù)載多樣性

嵌入式系統(tǒng) 紅帽紅帽O(jiān)penShift 4.16 混合云工作負(fù)載 | 2024-07-17

全國電話用戶達(dá)到4.6億戶繼續(xù)居世界第一

hpnet | 2003-06-21

LM3420-8.4構(gòu)成的鋰電池快速充電器

設(shè)計(jì)方案 LM3420-8.4 構(gòu)成鋰電池快速充電器 | 2009-07-06

AD7124概述：集成PGA和基準(zhǔn)電壓源的4通道/8通道Σ-Δ型ADC

視頻 ADI AD7124-4 AD7124-8 集成PGA ADC | 2017-02-13

BM70藍(lán)牙解決方案

視頻 Microchip Microchip應(yīng)用方案 BM70 Bluetooth? 4.2 RF IC | 2016-07-06

為什么OpenAI今年可能會(huì)虧損50億美元？

智能計(jì)算 OpenAI 虧損 ChatGPT | 2024-07-25

美光首款M.2 2230 PCIe 4.0 SSD推出

網(wǎng)絡(luò)與存儲(chǔ) 美光 M.2 2230 PCIe 4.0 SSD | 2024-07-19

觸發(fā)控制板KJZ6-4電原理圖

設(shè)計(jì)方案觸發(fā) 控制板 KJZ6-4 原理 | 2009-07-06

2024Q4 對(duì)決，聯(lián)發(fā)科天璣 9400、高通驍龍 8 Gen 4 被曝已流片

EDA/PCB 聯(lián)發(fā)科天璣 9400 高通驍龍 8 Gen 4 流片 | 2024-07-09

MIC79050-4.2BS的內(nèi)部結(jié)構(gòu)框圖

設(shè)計(jì)方案 MIC79050-4.2BS 內(nèi)部結(jié)構(gòu) 框圖 | 2009-07-06

機(jī)械擬人思考 OpenAI拚了

機(jī)械擬人思考 OpenAI 草莓 | 2024-07-15

用LTC732作為控制器為單節(jié)4.2伏鋰離子電池充電

設(shè)計(jì)方案 LTC732 作為控制器單節(jié) 4.2伏鋰離子電池充 | 2012-01-18

AD7124——PGA型4/8通道Σ-Δ ADC上的診斷功能

視頻 ADI AD7124-4 AD7124-8 診斷 | 2017-02-13

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計(jì)算 openAI SearchGPT 谷歌 | 2024-07-26

反壟斷機(jī)構(gòu)加強(qiáng)對(duì)OpenAI的審查，取消董事會(huì)中觀察員席位

OpenAI 微軟蘋果壟斷 | 2024-07-11

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();