開(kāi)發(fā)深度學(xué)習(xí) 谷歌運(yùn)用AI獨(dú)立音軌
在未來(lái)AI會(huì)需要更多的硬件來(lái)支持,谷歌認(rèn)為人工智能的領(lǐng)域還只是一個(gè)初期階段,它帶來(lái)的只是智能硬件設(shè)備上的一個(gè)核心算法,通過(guò)智能設(shè)備上的核心AI在進(jìn)一步的提升該技術(shù),并且改善硬件設(shè)備上的一個(gè)核心點(diǎn),讓這項(xiàng)技術(shù)通過(guò)AI做的更加完善。
本文引用地址:http://www.ex-cimer.com/article/201804/378555.htm
谷歌目前在開(kāi)發(fā)一種深度學(xué)習(xí)算法,這項(xiàng)算法可以提升音頻的環(huán)境范圍,想象一下,在非常嘈雜的環(huán)境中如果能聽(tīng)到音頻是一件非常不容易的事情,但通過(guò)AI算法它可以解決這樣的問(wèn)題。
此外,這樣的解決方法,主要用于識(shí)別一個(gè)獨(dú)立系統(tǒng),谷歌打算通過(guò)這個(gè)AI系統(tǒng)獨(dú)立出來(lái)一個(gè)音軌,這也就是說(shuō)可以分某一個(gè)人的聲音,谷歌公司內(nèi)部團(tuán)隊(duì)可以區(qū)分某一個(gè)人的聲音。
據(jù)了解,這項(xiàng)技術(shù)可以使用于單軌視頻,在通過(guò)算法分離出視頻中不同人的音頻內(nèi)容,也可以讓用戶手動(dòng)選取視頻中的人臉,專門收聽(tīng)此人的聲音。尤其是在多個(gè)聲源中可以成功過(guò)濾掉其他聲音,只保留一個(gè)核心的聲音。但問(wèn)題還是存在的,在實(shí)驗(yàn)效果的時(shí)候表現(xiàn)的并不是非常理想,可能AI技術(shù)上還有一些殘留,目前AI上可以做到保留一個(gè)核心,并去掉其他聲音來(lái)解決嘈雜的環(huán)境音,日后還會(huì)慢慢加強(qiáng),未來(lái)若將此項(xiàng)技術(shù)運(yùn)用到監(jiān)聽(tīng)和間諜工作當(dāng)中那將是很大的問(wèn)題。
評(píng)論