<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 又被AI騙了！73%的人無法分辨“真假”音效

又被AI騙了！73%的人無法分辨“真假”音效

作者：時(shí)間：2020-08-12 來源：DeepTech深科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

　　又一次，AI 欺騙了人類。

本文引用地址：http://www.ex-cimer.com/article/202008/416983.htm

　　在一次試驗(yàn)中，AI 讓 73% 的人相信 AI 合成音效是真實(shí)的。這一最新研究成果有望應(yīng)用于電影、電視劇等影視制作工作中。

　　想象一下，假如你正在看一部恐怖片：女主戰(zhàn)戰(zhàn)兢兢地走在黑暗的地下室中，背景音樂十分恐怖，同時(shí)一些看不見的邪惡生物也在黑暗中蠕動(dòng)，然后突然一聲巨響，一個(gè)物體被撞倒了…… 如果沒有這種令人緊張又恰到好處的音效，只通過眼睛看到的場(chǎng)景很難讓人產(chǎn)生這種恐懼感。

　　通常，這些音效是由錄音室中的 Foley 藝術(shù)家錄制的，他們會(huì)使用特定的物體來產(chǎn)生特殊的聲音。比如，如果導(dǎo)演想要在視頻中加入玻璃破碎的聲音，可能需要 Foley 藝術(shù)家打碎很多塊玻璃，直到聲音與視頻片段匹配起來。（DeepTech 注：Foley，即擬聲音效，用于增強(qiáng)電影的聽覺體驗(yàn)，是日常聲音效果的再現(xiàn)，后期制作中會(huì)添加到電影、視頻和其他媒體中，以提高音頻質(zhì)量。這些再現(xiàn)的聲音以音效藝術(shù)家 Jack Foley 的名字命名，可以是從衣服和腳步聲，到吱吱作響的門和碎玻璃的任何聲音。）

圖 | 一位早期 Foley 藝術(shù)家（右二）在現(xiàn)場(chǎng)為廣播節(jié)目添加音效，他手中的效果板可以模擬電話鈴響和關(guān)門的效果（來源：維基百科）

圖 | 一位早期 Foley 藝術(shù)家（右二）在現(xiàn)場(chǎng)為廣播節(jié)目添加音效，他手中的效果板可以模擬電話鈴響和關(guān)門的效果（來源：維基百科）

　　如今，為解決這一問題，來自美國得克薩斯大學(xué)圣安東尼奧分校的研究人員創(chuàng)建了一個(gè)基于機(jī)器學(xué)習(xí)的自動(dòng)程序，它可以確定一個(gè)視頻剪輯中正在發(fā)生的動(dòng)作，并據(jù)此創(chuàng)建逼真的音效，而且已經(jīng)讓大多數(shù)人相信假的聲音效果是真實(shí)的。

　　相關(guān)研究成果以論文的形式發(fā)表在由 IEEE 計(jì)算機(jī)協(xié)會(huì)、IEEE 通信協(xié)會(huì)等出版的科學(xué)期刊《IEEE 多媒體匯刊》（IEEE Transactions on Multimedia）上。

（來源：論文）

（來源：論文）

　　對(duì)于此項(xiàng)工作，論文通訊作者、得克薩斯大學(xué)圣安東尼奧分校教授杰夫 · 普雷沃斯特（Jeff Prevost）表示，“自 20 世紀(jì) 30 年代以來，在電影和電視劇的后期制作中，通過使用 Foley 藝術(shù)為特定場(chǎng)景添加音效，一直是一個(gè)比較復(fù)雜的事情。如果沒有逼真的 Foley 音效，電影就會(huì)顯得空洞、不真實(shí)，但是 Foley 音效合成增加了電影和電視劇的創(chuàng)作周期和成本?！?/p>

　　在普雷沃斯特和他的博士生桑奇塔 · 高斯（Sanchita Ghose）創(chuàng)建的多層機(jī)器學(xué)習(xí)程序中，他們針對(duì)包括識(shí)別視頻中的動(dòng)作和確定合適的聲音這一步，分別創(chuàng)建了兩種不同的模型，來檢驗(yàn)音效的合成效果。

　　第一種模型，可以從快速移動(dòng)的動(dòng)作剪輯的幀中提取圖像特征（比如，顏色和運(yùn)動(dòng)），以確定適當(dāng)?shù)穆曇粜Ч坏诙N模型，分析一個(gè)物體在不同幀中的時(shí)間關(guān)系，通過使用關(guān)系推理來比較不同時(shí)間段的不同幀，這一模型可以預(yù)測(cè)在視頻中發(fā)生了什么動(dòng)作。

　　在最后一步中，通過合成聲音來匹配模型預(yù)測(cè)的活動(dòng)或運(yùn)動(dòng)。目前，他們?yōu)?nbsp;1000 個(gè)電影片段創(chuàng)建了聲音，并捕捉了一些常見的動(dòng)作，比如下雨、奔騰的馬和滴答作響的鐘表。

圖 | 涉及應(yīng)用場(chǎng)景（來源：論文）

圖 | 涉及應(yīng)用場(chǎng)景（來源：論文）

　　結(jié)果顯示，他們的模型最適合用在時(shí)間不需要與視頻完全一致的場(chǎng)景（比如，下雨聲和火的噼啪聲）中，但當(dāng)視頻中包含隨時(shí)間變化的隨機(jī)動(dòng)作（比如，打字、雷暴）時(shí)，表現(xiàn)得就不太好。

　　此外，他們也對(duì)當(dāng)?shù)氐?nbsp;57 位大學(xué)生進(jìn)行了調(diào)查，看他們是否可以分辨出哪些電影片段中包含了原始音效。在評(píng)估第一個(gè)模型時(shí)，73% 的學(xué)生選擇了合成音效作為原始音效，在評(píng)估第二個(gè)模型時(shí)，這一數(shù)字為 66%?？梢?，這兩個(gè) AI 模型已經(jīng)騙過了大多數(shù)人。

　　但是，普雷沃斯特表示，該方法還存在一個(gè)明顯的不足，必須要求分類的主體出現(xiàn)在整個(gè)視頻幀序列中，而且依賴于具有有限 Foley 類別的數(shù)據(jù)集。

　　對(duì)此，普雷沃斯特認(rèn)為，這些不足將會(huì)在未來的研究中得以解決。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI 合成音效 模型

評(píng)論

相關(guān)推薦

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

手電筒控制模型電動(dòng)機(jī)電路

設(shè)計(jì)方案手電筒控制模型電動(dòng)機(jī) | 2009-07-06

Meta發(fā)布“前沿級(jí)”開源AI模型扎克伯格：不怕競爭者使用

智能計(jì)算 Meta 開源 AI 模型扎克伯格 | 2024-07-24

PWM放大器模型和波形

設(shè)計(jì)方案放大器模型波形 | 2009-07-06

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

手電筒控制模型電動(dòng)機(jī)電路

設(shè)計(jì)方案手電筒控制模型電動(dòng)機(jī) | 2009-07-06

HBM4持續(xù)加速：AI時(shí)代競爭新焦點(diǎn)

網(wǎng)絡(luò)與存儲(chǔ) HBM AI 內(nèi)存 | 2024-07-25

實(shí)驗(yàn)24洗衣機(jī)模型

資源下載洗衣機(jī) 模型 | 2007-04-20

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計(jì)算 OpenAI ChatGPT AI | 2024-07-25

[原創(chuàng)]使用UML工具創(chuàng)建計(jì)數(shù)器的例子(2)模型仿真

newcore | 2004-03-16

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

[轉(zhuǎn)帖]I-Logix: 模型驅(qū)動(dòng)開發(fā)理應(yīng)有測(cè)試的一席之地

newcore | 2004-03-14

ARM發(fā)布全新快速虛擬原型模型，加快軟件開發(fā)

yongzhe | 2005-10-19

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

大嘴業(yè)話-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

H.264的碼率控制策略

Naiqa | 2005-10-10

IGBT的VCR(壓控電阻)等效電路模型

設(shè)計(jì)方案壓控電阻等效電路模型 | 2009-07-06

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

AI 芯片：一場(chǎng)燒錢的瘋狂競賽

智能計(jì)算 AI 芯片 | 2024-07-24

國際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

手電筒控制模型電動(dòng)機(jī)電路

設(shè)計(jì)方案手電筒控制模型電動(dòng)機(jī) | 2009-07-06

AI當(dāng)靠山軟件大廠SAP裁員擴(kuò)大至上萬

智能計(jì)算 AI 軟件 SAP 裁員 | 2024-07-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

ARM發(fā)布全新快速虛擬原型模型，加快軟件開發(fā)(zz)

twentyone | 2005-06-20

BodeCAD(Linear)

資源下載 BodeCAD 放大器仿真 Spice 模型 | 2007-02-09

功率變換器建模技術(shù)綜述+

資源下載模型等效電路傳輸線功率因素校正離散 | 2007-02-16

小鵬汽車開啟 AI 天璣 XOS 5.2 全球嘗鮮招募：大陸 Max 車型開通 XNGP 無限版智駕

汽車電子小鵬 AI 智能駕駛輔助駕駛 | 2024-07-22

基于模型的設(shè)計(jì)迎接當(dāng)今嵌入式系統(tǒng)設(shè)計(jì)面臨的不斷增加的挑戰(zhàn)

資源下載嵌入式系統(tǒng)設(shè)計(jì) 模型 | 2007-09-15

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();