<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 重磅！類人速度超快語音響應！OpenAI推出新旗艦模型GPT-4o，圖文音頻手機AI搞定

重磅！類人速度超快語音響應！OpenAI推出新旗艦模型GPT-4o，圖文音頻手機AI搞定

作者：時間：2024-05-14 來源：每日經(jīng)濟新聞

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

北京時間周二凌晨1點，自年初“文生視頻模型”Sora后許久未給市場帶來驚喜的OpenAI舉行春季發(fā)布會。公司首席技術官米拉·穆拉蒂（Mira Murati）向外界展現(xiàn)了多項與ChatGPT有關的更新。簡要來說，OpenAI的發(fā)布會主要干了兩件事情：發(fā)布最新GPT-4o多模態(tài)大模型，相較于GPT-4 Trubo速度更快、價格也更便宜。

本文引用地址：http://www.ex-cimer.com/article/202405/458687.htm

第二件事情就是宣布，ChatGPT的免費用戶也能用上最新發(fā)布的GPT-4o模型（更新前只能使用GPT-3.5），來進行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問應用商店等操作。這也意味著GPT應用商店的開發(fā)者，將面對海量的新增用戶。

當然，付費用戶將會獲得更高的消息限制（OpenAI說至少是5倍）。當免費用戶用完消息數(shù)量后，ChatGPT將自動切換到GPT-3.5。

另外，OpenAI將在未來1個月左右向Plus用戶推出基于GPT-4o改進的語音體驗，目前GPT-4o的API并不包含語音功能。蘋果電腦用戶將迎來一款為macOS設計的ChatGPT桌面應用，用戶可以通過快捷鍵“拍攝”桌面并向ChatGP提問，OpenAI表示，Windows版本將在今年晚些時候推出。

值得一提的是，米拉·穆拉蒂在一次直播活動中表示：“這是我們第一次在易用性方面真正向前邁出了一大步。”

OpenAI由微軟支持，目前投資者對其估值已超過800億美元。該公司成立于2015年，目前正面臨在生成式AI市場保持領先地位的壓力，同時需要想方設法實現(xiàn)盈利，因為其在處理器和基礎設施建設上投入了大量資金，以構建和訓練其模型。

實時口譯、讀取用戶情緒等

米拉·穆拉蒂強調(diào)了GPT-4o在實時語音和音頻功能方面必要的安全性，稱OpenAI將繼續(xù)部署迭代，帶來所有的功能。

在演示中，OpenAI研究主管Mark Chen掏出手機打開ChatGPT，用語音模式Voice Mode現(xiàn)場演示，向GPT-4o支持的ChatGPT征詢建議。GPT的聲音聽起來像一位美國女性，當它聽到Chen過度呼氣時，它似乎從中察覺到了他的緊張。然后說“Mark，你不是吸塵器”，告訴Chen要放松呼吸。如果有些大變化，用戶可以中斷GPT，GPT-4o的延遲通常應該不會超過兩三秒。

圖片來源：視頻截圖

圖片來源：視頻截圖

　　另一項演示中，OpenAI的后訓練團隊負責人Barret Zoph在白板上寫了一個方程式3x+1=4，ChatGPT給他提示，引導他完成每一步解答，識別他的書寫結果，幫助他解出了X的值。這個過程中，GPT充當了實時的數(shù)學老師。GPT能夠識別數(shù)學符號，甚至是一個心形。

圖片來源：視頻截圖

圖片來源：視頻截圖

　　應社交媒體X的用戶請求，米拉·穆拉蒂現(xiàn)場對ChatGPT說起了意大利語。GPT則將她的話翻譯成英語，轉告Zoph和Chen。聽完米拉·穆拉蒂說的意大利語，GPT翻譯為英文告訴Chen：“Mark，她（米拉·穆拉蒂）想知道鯨魚會不會說話，它們會告訴我們什么？”

圖片來源：視頻截圖

圖片來源：視頻截圖

　　OpenAI稱，GPT-4o還可以檢測人的情緒。在演示中，Zoph將手機舉到自己面前正對著臉，要求ChatGPT告訴他自己長什么樣子。最初，GPT參考了他之前分享的一張照片，將他識別為“木質表面”。經(jīng)過第二次嘗試，GPT給出了更好的答案。

　　GPT注意到了Zoph臉上的微笑，對他說：“看起來你感覺非常快樂，喜笑顏開?！庇性u論稱，這個演示顯示，ChatGPT可以讀取人類的情緒，但讀取還有一點困難。

圖片來源：視頻截圖

圖片來源：視頻截圖

　　OpenAI的高管表示，GPT-4o可以與代碼庫交互，并展示了它根據(jù)一些數(shù)據(jù)分析圖表，根據(jù)看到的內(nèi)容對一張全球氣溫圖得出一些結論。OpenAI稱，基于GPT-4o的ChatGPT文本和圖像輸入功能將于本周一上線，語音和視頻選項將在未來幾周內(nèi)推出。

　　據(jù)外媒援引PitchBook的數(shù)據(jù)，2023年，近700筆生成式AI交易共投入創(chuàng)紀錄的291億美元，較上一年增長逾260%。據(jù)預測，該市場將在未來十年內(nèi)突破1萬億美元收入大關。業(yè)內(nèi)一些人對于未經(jīng)測試的新服務如此迅速地推向市場表示擔憂，而學術界和倫理學家則對這項技術傳播偏見的傾向感到憂慮。

　　ChatGPT自2022年11月推出以來，便打破了當時最快增長消費類應用的歷史記錄，如今每周活躍用戶已接近1億。OpenAI表示，超過92%的《財富》500強企業(yè)都在使用該平臺。

圖片來源：CNBC報道截圖

圖片來源：CNBC報道截圖

　　在周一的活動上，穆拉蒂表示，OpenAI希望“消除科技中的一些神秘感”。她還說，“未來幾周，我們將向所有人推出這些功能?！?/p>

　　在直播活動結束時，穆拉蒂感謝了英偉達首席執(zhí)行官黃仁勛及其公司提供的必要圖形處理單元（GPU），這些GPU為OpenAI的技術提供了動力。她說，“我只想感謝出色的OpenAI團隊，同時也要感謝黃仁勛和英偉達團隊為我們帶來最先進的GPU，讓今天的演示成為可能。”

最快232毫秒響應音頻輸入

　　OpenAI官網(wǎng)介紹，GPT-4o中的o代表意為全能的前綴omni，稱它向更自然的人機交互邁進了一步，因為它接受文本、音頻和圖像的任意組合作為輸入內(nèi)容，并生成文本、音頻和圖像的任意組合輸出內(nèi)容。

圖片來源：OpenAI官網(wǎng)截圖

圖片來源：OpenAI官網(wǎng)截圖

　　除了API的速度更快、成本大幅下降，OpenAI還提到，GPT-4o可以在最快232毫秒的時間內(nèi)響應音頻輸入，平均響應時間為320毫秒，這與人類在對話中的響應時間相似。它在英語文本和代碼方面的性能與GPT-4 Turbo的性能一致，并且在非英語文本方面的性能有了顯著提高。

　　OpenAI介紹，與現(xiàn)有模型相比，GPT-4o在視覺和音頻理解方面尤其出色。以前GPT-3.5和GPT-4用戶以語音模式Voice Mode與ChatGPT對話的平均延遲時間為2.8秒和5.4秒，因為OpenAI用了三個獨立的模型實現(xiàn)這類對話：一個模型將音頻轉錄為文本，一個模型接收并輸出文本，再有一個模型將該文本轉換回音頻。這個過程意味著，GPT丟失了大量信息，它無法直接觀察音調(diào)、多個說話者或背景噪音，也無法輸出笑聲、歌唱或表達情感。

　　而GPT-4o的語音對話是OpenAI跨文本、視覺和音頻端到端訓練一個新模型的產(chǎn)物，這意味著所有輸入和輸出都由同一神經(jīng)網(wǎng)絡處理。OpenAI稱，GPT-4o是其第一個結合所有這些模式的模型，因此仍然只是淺嘗輒止地探索該模型的功能及其局限性。

　　上周曾有消息稱，OpenAI將發(fā)布基于AI的搜索產(chǎn)品，但上周五OpenAI的CEO Sam Altman否認了該消息，稱本周一演示的既不是GPT-5，也不是搜索引擎。這意味著OpenAI再一次沒有像市場爆料的時間線那樣推出AI搜索。此后有媒體稱，OpenAI的新產(chǎn)品可能是一個具備視覺和聽覺功能的全新多模態(tài)AI模型，且具有比目前聊天機器人更好的邏輯推理能力。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： openAI chatGPT-4o AI

評論

相關推薦

HBM4持續(xù)加速：AI時代競爭新焦點

網(wǎng)絡與存儲 HBM AI 內(nèi)存 | 2024-07-25

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術 | 2023-04-25

釋說芯語16：硬科技：構建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

海聯(lián)達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

iPhone 16將不會預裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

消息稱 OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計算 openAI SearchGPT 谷歌 | 2024-07-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

蘋果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

焦點

推薦視頻

技術專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();