<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 科技公司史上第一次：Meta開源GPT3參數(shù)大小的AI模型

科技公司史上第一次：Meta開源GPT3參數(shù)大小的AI模型

作者：時間：2022-05-07 來源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　在生成文本段落、模擬人類對話及解決數(shù)學(xué)問題表現(xiàn)驚人的大型語言模型，顯然是這幾年AI發(fā)展最熱門的領(lǐng)域之一。但這樣的大型語言模型不僅能夠自行生成有害內(nèi)容，還可以將這樣的內(nèi)容通過在其上構(gòu)建的下游應(yīng)用程序傳播開來。

本文引用地址：http://www.ex-cimer.com/article/202205/433816.htm

　　理論上，更多人的參與對問題的解決應(yīng)該會有所幫助。然而，由于語言模型的訓(xùn)練需要大量的數(shù)據(jù)和計算能力，迄今為止，它們?nèi)匀恢皇谴笮涂萍脊镜奶赜许椖?。而在更廣泛的群體如學(xué)界，以及擔(dān)心人工智能濫用的倫理學(xué)家和社會科學(xué)家中，只有旁觀的選項。

　　“我相信建立信任的唯一方法是極度透明?！?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/Meta">Meta AI的常務(wù)董事喬爾·皮諾（Joelle Pineau）說。當(dāng)?shù)貢r間5月3日，Meta AI開放了擁有1750億參數(shù)的大語言模型OPT-175B（Open Pretrained Transformer，OPT）。

對于大型科技公司來說，這是一個前所未有的舉動。即使是在大語言模型歷史上，這也是第一次毫無保留，把預(yù)訓(xùn)練模型、訓(xùn)練代碼以及使用代碼全部公開。

　　“我們中的很多人都是大學(xué)的研究人員，”皮諾說，“我們知道大學(xué)和行業(yè)在建立這些模式的能力方面存在明顯的差距。讓研究人員共同討論這一技術(shù)的好處是顯而易見的?！彼Ｍ渌四茏屑?xì)研究他們的工作，對其進(jìn)行拆解分析，或者在此基礎(chǔ)上構(gòu)建。她認(rèn)為，當(dāng)更多的人參與進(jìn)來時，突破就會更快實現(xiàn)。

　　OPT語言模型中約有1750億個參數(shù)（這些參數(shù)是神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中可以被調(diào)整的參數(shù)），與OpenAI開創(chuàng)性的神經(jīng)網(wǎng)絡(luò)GPT-3規(guī)?；鞠嗤?，同時具有付費服務(wù)GPT-3的非凡能力和不可避免的缺陷。

　　皮諾不諱言，“這是經(jīng)過精心設(shè)計的”，該團(tuán)隊在建立OPT時就考慮在語言任務(wù)的準(zhǔn)確性和有害性方面與GPT-3相匹配。OPT是為了給研究人員提供一個類似的語言模型來進(jìn)行研究。

　　OpenAI拒絕了對Meta的聲明發(fā)表評論。

　　OpenAI的母公司谷歌正在探索在其搜索產(chǎn)品中使用大型語言模型，但也因為缺乏透明度而受到批評。谷歌在這方面受到諸多爭議，其曾在人工智能倫理研究員Timnit Gebru想要發(fā)表一篇有關(guān)谷歌在當(dāng)時的語言系統(tǒng)可能會從網(wǎng)站上學(xué)習(xí)包含偏見和仇恨言論的論文后辭退他，最近又解雇一位對已發(fā)表研究提出異議的員工。

　　那么，Meta為什么要這樣做呢？畢竟Meta也是一家很少提及臉書和Instagram背后算法工作原理的科技公司，還曾以讓其內(nèi)部研究團(tuán)隊隱瞞對其不利的問題而聞名。

　　《麻省理工科技評論》認(rèn)為，Meta采取不同方法的一個重要原因是皮諾本人，她多年來一直在推動人工智能研發(fā)過程中的透明度。

　　在核心學(xué)術(shù)會議發(fā)表研究的方式上，皮諾要求研究人員必須將包括代碼和有關(guān)如何進(jìn)行實驗的詳細(xì)信息與結(jié)果一起提交。她自2017年加入Meta（當(dāng)時的Facebook）以來，一直在其人工智能實驗室倡導(dǎo)這種文化。

　　“Meta對開放科學(xué)的承諾是我在這里的原因，”皮諾說，“我不會因為其他條件來到這里工作?！?/p>

　　除了代碼外，Meta也公布了開發(fā)日志。日志包含團(tuán)隊成員對于數(shù)據(jù)訓(xùn)練的每日更新：如何將其添加到模型中，以及何時、哪些有效、哪些無效。在100多頁的筆記中，研究人員記錄了從2021年10月到2022年1月不間斷運行的三個月訓(xùn)練過程中的每個錯誤、崩潰和重啟。

　　斯坦福大學(xué)基礎(chǔ)模型研究中心主任Percy Liang將大模型的開放程度總結(jié)成4個層次：

　　第一層論文開放，證明一些設(shè)想的可行性，并提供構(gòu)建思路；第二層API開放，允許研究人員探索和評估現(xiàn)有模型的能力（如推理能力）和限制（如偏見）；第三層模型權(quán)重開放和訓(xùn)練數(shù)據(jù)開放，允許研究人員逐步改進(jìn)現(xiàn)有模型，開發(fā)更深入的可解釋性技術(shù)和更有效的微調(diào)方法，讓研究人員更好地理解訓(xùn)練數(shù)據(jù)在模型行為中的作用；第四層計算能力開放，允許研究人員嘗試新的體系結(jié)構(gòu)、訓(xùn)練目標(biāo)和過程、進(jìn)行數(shù)據(jù)融合，并在不同的領(lǐng)域開發(fā)全新的模型。

　　“更高層次的開放能讓研究者專注于更深的問題，也同時會帶來更多風(fēng)險?！盤ercy Liang明確指出這一點。

　　Meta此次以這樣的程度開源其大型語言模型是一個非常大膽的舉措，可能會產(chǎn)生當(dāng)下想象不到的風(fēng)險。這也是OpenAI對于不發(fā)布GPT-3的前身GPT-2給出的原因。

　　“我不能告訴你，這種模型不會產(chǎn)生其他可怕的風(fēng)險?！逼ぶZ駁斥了“僅僅是因為它太危險”，所以不應(yīng)該發(fā)布模型的想法。她說道，“我理解這些模型的弱點，但這不是一種研究心態(tài)。”

　　據(jù)《麻省理工科技評論》，曾在被谷歌因“違反了其行為準(zhǔn)則”辭退的人工智能倫理研究員瑪格麗特·米切爾（Margaret Mitchell）認(rèn)為，OPT的發(fā)布是一個積極的舉措。但她認(rèn)為透明度是有限度的。她提問道，“語言模型是否經(jīng)過了足夠嚴(yán)格的測試？可預(yù)見的好處是否超過了其可預(yù)見的危害？在這個過程中如何避免錯誤信息的產(chǎn)生，或種族主義和厭惡女性的語言？“

　　華盛頓大學(xué)的計算語言學(xué)家艾米麗·M·本德（Emily M.Bender）曾在谷歌中心與米切爾共同合作過相關(guān)研究，她也擔(dān)心著如何處理潛在的危害。“降低任何機(jī)器學(xué)習(xí)技術(shù)風(fēng)險的真正關(guān)鍵是要在特定用例中進(jìn)行評估和探索，例如這個系統(tǒng)是用來做什么的？誰將使用它？系統(tǒng)輸出將如何呈現(xiàn)給他們？”

　　對于皮諾來說，這些擔(dān)憂應(yīng)該通過更多的公開討論來解決，而不是減少溝通?！笆澜绺鞯氐娜藗儗τ谑裁礃拥膶υ捠呛线m的有不同的看法，而人工智能是對話的一部分，”皮諾并不是希望語言模型能說出令每個人都同意的話，“但我們該如何應(yīng)對呢？那就是在討論過程中多去聽卻他人的聲音”。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： Meta AI

評論

相關(guān)推薦

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

META-DX1系列：具有MACsec和FlexE的太比特級以太網(wǎng)PHY

視頻 Microchip META-DX1系列 MACsec FlexE 太比特級以太網(wǎng)PHY | 2019-07-18

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

SST 89C54 89C58的中文資料

資源下載 Meta Tech Technical Training SST 89C54 89C58 | 2007-03-27

英特爾AI解決方案為最新Meta Llama 3.1模型提供加速

智能計算英特爾 AI解決方案 Meta Llama 3.1 | 2024-07-25

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

WTC-AI太陽能熱水器電路圖

設(shè)計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

WTC-AI型太陽能熱水器電路圖

設(shè)計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

AI當(dāng)靠山軟件大廠SAP裁員擴(kuò)大至上萬

智能計算 AI 軟件 SAP 裁員 | 2024-07-24

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達(dá) GPU | 2024-07-26

iPhone 16將不會預(yù)裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

HBM4持續(xù)加速：AI時代競爭新焦點

網(wǎng)絡(luò)與存儲 HBM AI 內(nèi)存 | 2024-07-25

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

AI驅(qū)動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

面向VxWorks的嵌入式軟件集成開發(fā)環(huán)境研究

資源下載 CA算法 C&S Crawler Meta URL VxWorks WDB Scintilla BSP | 2009-02-16

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

SST89C54_SST89C58 單片機(jī)

資源下載 Meta Tech 單片機(jī) SST89C54 SST89C58 | 2007-03-20

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();