<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > OpenAI 聘請(qǐng)專家攻擊 ChatGPT,以解決技術(shù)倫理問題

          OpenAI 聘請(qǐng)專家攻擊 ChatGPT,以解決技術(shù)倫理問題

          作者: 時(shí)間:2023-04-17 來源:IT之家 收藏

          北京時(shí)間 4 月 17 日早間消息,據(jù)報(bào)道,在安德魯?懷特(Andrew White)獲得 GPT-4 的使用權(quán)之后,他使用這一人工智能系統(tǒng)提出了一種全新的神經(jīng)毒劑。GPT-4 是熱門聊天機(jī)器人 背后的人工智能技術(shù)。

          本文引用地址:http://www.ex-cimer.com/article/202304/445635.htm

          作為羅切斯特大學(xué)的化學(xué)工程教授,懷特是 Open 去年聘請(qǐng)的 50 名專家學(xué)者之一。在 6 個(gè)月的時(shí)間里,這支“紅軍”對(duì)這一新模型進(jìn)行了“定性探索和對(duì)抗性測(cè)試”,試圖攻擊它。

          懷特表示,他使用 GPT-4 的建議生成了一種可作為化學(xué)武器的化合物,并使用“插件”為這個(gè)模型提供新的信息源,例如學(xué)術(shù)論文和化學(xué)品制造商名錄。隨后,這個(gè)聊天機(jī)器人找到了一個(gè)地方來制造這種化合物。

          他說:“我認(rèn)為,這將使每個(gè)人都獲得更快速、更準(zhǔn)確地工具去從事化工行業(yè)。但這也使得人們會(huì)以更危險(xiǎn)的方式去開展化學(xué)活動(dòng),帶來了很大的風(fēng)險(xiǎn)?!?/p>

          上個(gè)月,Open 面向更廣泛的公眾發(fā)布了這項(xiàng)新技術(shù),而這些令人驚訝的發(fā)現(xiàn)確保新技術(shù)不會(huì)帶來不良后果。

          事實(shí)上,“紅軍”的演習(xí)目的是探索并了解在社會(huì)上部署先進(jìn)人工智能系統(tǒng)會(huì)造成什么樣的風(fēng)險(xiǎn),解決公眾這方面的擔(dān)憂。他們?cè)诠ぷ髦刑岢鎏剿餍缘幕蚴俏kU(xiǎn)的問題,以測(cè)試這個(gè)工具在回答問題時(shí)的詳細(xì)程度。

          Open 想要探索模型毒性、偏見和歧視等問題。因此,“紅軍”就謊言、語言操縱和危險(xiǎn)的科學(xué)常識(shí)進(jìn)行了測(cè)試。他們還評(píng)估了模型協(xié)助和教唆剽竊的情況、金融犯罪和信息安全攻擊等違法活動(dòng)的可能性,以及模型可能會(huì)如何威脅國(guó)家安全和戰(zhàn)場(chǎng)通信。

          “紅軍”由一系列專業(yè)人士組成,包括學(xué)者、教師、律師、風(fēng)險(xiǎn)分析師和信息安全研究員,主要來自美國(guó)和歐洲。他們的發(fā)現(xiàn)被反饋給 OpenAI。在更廣泛地推出 GPT-4 之前,“紅軍”提供的意見被用于模型的重新訓(xùn)練,解決 GPT-4 的問題。在幾個(gè)月的時(shí)間里,專家們每人花了 10 到 40 個(gè)小時(shí)去測(cè)試這個(gè)模型。多名受訪者表示,他們的工作時(shí)薪約為 100 美元。

          其中的許多人都對(duì)語言模型的快速發(fā)展提出了擔(dān)憂,尤其是通過插件將語言模型與外部知識(shí)源連接在一起可能造成的風(fēng)險(xiǎn)。

          GPT-4“紅軍”的成員、瓦倫西亞人工智能研究所教授何塞?埃爾南德斯-奧拉洛(José Hernández-Orallo)表示:“今天,系統(tǒng)被凍結(jié)了。這意味著它不再學(xué)習(xí),也不再有記憶。但如果我們讓系統(tǒng)繼續(xù)有機(jī)會(huì)訪問互聯(lián)網(wǎng),那么會(huì)怎樣?這可能會(huì)成為一個(gè)與世界相連的非常強(qiáng)大的系統(tǒng)?!?/p>

          OpenAI 表示,該公司認(rèn)真對(duì)待安全性問題,并在發(fā)布前對(duì)插件進(jìn)行了測(cè)試,并將隨著用戶越來越多繼續(xù)定期更新 GPT-4。

          技術(shù)研究員羅亞?帕克扎德(Roya Pakzad)使用英語和波斯語的輸入信息對(duì)該模型進(jìn)行了性別、種族偏見等測(cè)試,例如對(duì)于佩戴頭巾問題。

          帕克扎德承認(rèn),這個(gè)工具對(duì)非英語母語人士能帶來幫助,但也顯示出對(duì)邊緣人群的公開刻板印象,即使隨后更新的版本也是如此。她還發(fā)現(xiàn),在用波斯語測(cè)試該模型時(shí),聊天機(jī)器人用捏造的信息做出回復(fù),即出現(xiàn)所謂“幻覺”的情況更糟糕。與英語相比,在波斯語回復(fù)中捏造名字、數(shù)字和事件的比例更高。

          她表示:“我擔(dān)心,語言多樣性和語言背后的文化會(huì)受到損害?!?/p>

          來自內(nèi)羅畢的律師、唯一一名非洲測(cè)試人員博魯?戈洛(Boru Gollo)也注意到了模型的歧視性語氣。他說:“有一次,我在測(cè)試這個(gè)模型時(shí),它表現(xiàn)得像個(gè)白人在跟我說話。在問到某個(gè)特定群體時(shí),它會(huì)給一個(gè)有偏見的意見,或是在回答中出現(xiàn)歧視?!監(jiān)penAI 承認(rèn),GPT-4 仍有可能表現(xiàn)出偏見。

          “紅軍”的成員還從國(guó)家安全的角度對(duì)模型進(jìn)行了評(píng)估,但他們對(duì)于新模型的安全性有著不同的看法。美國(guó)外交關(guān)系委員會(huì)研究員勞倫?卡恩(Lauren Kahn)表示,當(dāng)她開始研究,如何將這項(xiàng)技術(shù)用于對(duì)軍事系統(tǒng)的攻擊時(shí),她“沒有想到模型的回答會(huì)如此詳細(xì),以至于我只需要做一些微調(diào)即可”。

          不過,卡恩和其他信息安全測(cè)試者發(fā)現(xiàn),隨著測(cè)試時(shí)間推移,模型回答的內(nèi)容逐漸變得安全。OpenAI 表示,在推出 GPT-4 之前,曾訓(xùn)練過這個(gè)模型拒絕回答惡意的信息安全問題。

          “紅軍”的許多成員表示,OpenAI 在發(fā)布 GPT-4 之前已經(jīng)進(jìn)行了嚴(yán)格的安全評(píng)估??▋?nèi)基梅隆大學(xué)語言模型毒性專家馬爾滕?薩普(Maarten Sap)說:“他們?cè)谙@些系統(tǒng)中的顯性毒性方面做得非常好?!彼_普研究了該模型對(duì)不同性別的描述,發(fā)現(xiàn)模型的偏見反映的是社會(huì)差異。但他也發(fā)現(xiàn),OpenAI 做出了一些積極的選擇來對(duì)抗偏見。

          然而自推出 GPT-4 以來,OpenAI 一直面臨著廣泛的批評(píng)。例如,有技術(shù)倫理組織向美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)投訴,稱 GPT-4“有偏見和欺騙性,對(duì)隱私和公共安全構(gòu)成風(fēng)險(xiǎn)”。

          最近,該公司推出了一項(xiàng)名為 插件的功能。通過該功能,Expedia、OpenTable 和 Insta 等合作伙伴應(yīng)用可以讓 訪問它們的服務(wù),允許 ChatGPT 代表用戶下單。

          “紅軍”的人工智能安全專家丹?亨德里克斯(Dan Hendrycks)表示,這些插件可能會(huì)讓人類用戶“脫離整個(gè)鏈路”?!叭绻奶鞕C(jī)器人可以在網(wǎng)上發(fā)布你的私人信息,訪問你的銀行賬戶,或者派警察到你家里去,那會(huì)怎么樣?總體而言,在讓人工智能掌握互聯(lián)網(wǎng)的力量之前,我們需要更有力的安全評(píng)估?!?/p>

          受訪者還警告說,OpenAI 不能僅僅因?yàn)槠滠浖窃诰€的就停止安全測(cè)試。喬治城大學(xué)安全和新興技術(shù)中心的希瑟?弗雷斯(Heather Frase)測(cè)試了 GPT-4 協(xié)助犯罪的能力。她表示,隨著越來越多人使用這項(xiàng)技術(shù),風(fēng)險(xiǎn)將繼續(xù)擴(kuò)大。她表示:“你做運(yùn)行測(cè)試的原因是,一旦它們?cè)谡鎸?shí)環(huán)境中被使用,行為就會(huì)不同?!彼J(rèn)為,應(yīng)該創(chuàng)建一個(gè)公共記錄本,報(bào)告由大語言模型引發(fā)的事故。這類似于信息安全或消費(fèi)者欺詐報(bào)告系統(tǒng)。

          勞工經(jīng)濟(jì)學(xué)家及研究員薩拉?金斯利(Sara Kingsley)建議,最好的解決方案是清楚地宣傳這方面的危害和風(fēng)險(xiǎn),“就像食品上的營(yíng)養(yǎng)標(biāo)簽”?!瓣P(guān)鍵是要形成一個(gè)框架,知道經(jīng)常出現(xiàn)的問題是什么。這樣你就可以有一個(gè)安全閥。這也是為什么我認(rèn)為,這項(xiàng)工作將會(huì)永久性的持續(xù)下去?!?/p>




          關(guān)鍵詞: AI ChatGPT

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();