<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 手機(jī)與無線通信 > 業(yè)界動(dòng)態(tài) > IBM 語音識(shí)別新方向:仿生蝙蝠耳能用聲納精準(zhǔn)“聆聽”

          IBM 語音識(shí)別新方向:仿生蝙蝠耳能用聲納精準(zhǔn)“聆聽”

          作者: 時(shí)間:2016-12-28 來源:雷鋒網(wǎng) 收藏

            蝙蝠使用生物聲吶,為夜晚在叢林中飛行導(dǎo)航。他們的超聲波脈沖,可以比人造聲吶裝置更精確地對(duì)聲音進(jìn)行定位。為復(fù)制、駕馭這種能力, 學(xué)院獎(jiǎng)獲得者 Rolf Müller 教授協(xié)同他在弗吉尼亞理工學(xué)院(Virginia Tech)的團(tuán)隊(duì),設(shè)計(jì)了一種人造蝙蝠耳。

          本文引用地址:http://www.ex-cimer.com/article/201612/342194.htm

             

          IBM 語音識(shí)別新方向:仿生蝙蝠耳能用聲納精準(zhǔn)“聆聽”

           

            Rolf Müller 的研究引起了  的注意。 專家韓金萍(音譯)的神經(jīng)計(jì)算團(tuán)隊(duì),和 IBM Watson 語音專家崔曉東(音譯)和他的同事, 看到了 Müller 教授人造“動(dòng)態(tài)外耳”(dynamic peripheral,蝙蝠可轉(zhuǎn)動(dòng)的外耳使它們的生物聲吶更加準(zhǔn)確)的潛力 ,并希望借此提高人類語音理解的能力。他們把 Müller 的博士生 Anupam Gupta 納入團(tuán)隊(duì),一同他們探索人造蝙蝠仿生耳在語音處理的應(yīng)用。

            他們發(fā)現(xiàn),這些仿生耳不僅是很有效的聲吶裝置,對(duì)同樣能起到作用。

             

          IBM 語音識(shí)別新方向:仿生蝙蝠耳能用聲納精準(zhǔn)“聆聽”

           

            模仿菊頭蝠的人造耳

            研究團(tuán)隊(duì)根據(jù)蝙蝠改變耳朵形狀的能力,仿制了一個(gè)動(dòng)態(tài)接收系統(tǒng)。它能提高自動(dòng)系統(tǒng)(ASR)的精確度,還能更準(zhǔn)確地對(duì)談話者定位。韓金萍將在他們的論文《受菊頭蝠啟發(fā)的接收動(dòng)力學(xué)把動(dòng)態(tài)特點(diǎn)加入語音信號(hào)》,及本周美國聲學(xué)協(xié)會(huì)第 172 屆會(huì)議上展示了這一發(fā)現(xiàn)。

            這些動(dòng)態(tài)系統(tǒng)有潛力發(fā)展成讓使用者“像蝙蝠那樣聆聽”的語音接收設(shè)備。這會(huì)改進(jìn)現(xiàn)有的助聽器和指向性傳聲器。并可應(yīng)用于任何需要對(duì)聲音來源進(jìn)行定位、理解的場景。

            設(shè)想你身處一個(gè)忙碌、吵鬧的集市。聽清楚你旁邊的人在說什么都可能是一項(xiàng)挑戰(zhàn)。有了這項(xiàng)技術(shù),同伴的聲音就能被一個(gè)可變形的助聽器識(shí)別,然后翻譯成你能聽懂的話。它還可以過濾掉鬧市的雜音,和其他人嗡嗡的說話聲。

            仿生蝙蝠耳的生物聲吶算法

            蝙蝠的超聲波具有 10 – 200 kHz 的頻率,而人耳只能識(shí)別 20 Hz – 20 kHz 的聲音。因此對(duì)我們來說它聲調(diào)太高,大多數(shù)是聽不到的。為了駕馭蝙蝠的生物聲吶頻率和精度,Gupta 加入韓金萍團(tuán)隊(duì)編寫能夠把語音訊號(hào)轉(zhuǎn)化為超聲波脈沖的代碼——然后再把超聲波轉(zhuǎn)化為我們能夠聽到的正常語言。

            這首先需要建立一個(gè)數(shù)據(jù)庫。為了盡可能地簡化,韓金萍團(tuán)隊(duì)使用了卡內(nèi)基梅隆大學(xué)開源數(shù)據(jù)庫中,11 個(gè)美式英語朗讀者的英語字母和數(shù)字的發(fā)音。

            舉例子,以字母“A” 或者數(shù)字“1”形式出現(xiàn)的數(shù)據(jù),被麥克風(fēng)接收,然后轉(zhuǎn)化為超聲波信號(hào)。超聲波揚(yáng)聲器播放該信號(hào)。隨后,具有“動(dòng)態(tài)外耳”的人造蝙蝠耳接收信號(hào)。最后,軟件把超聲波信號(hào)轉(zhuǎn)化為原始數(shù)據(jù)——字母“A” 或者數(shù)字“1”。

            現(xiàn)實(shí)(鬧市)中的人造耳朵

            雖然只包含字母和數(shù)字的聲音信號(hào)數(shù)據(jù)庫有較大限制,但通過分析它,韓金萍團(tuán)隊(duì)表示人造耳用“動(dòng)態(tài)、方向性的的時(shí)間頻率模型”豐富了語音信號(hào)。下一步,研究人員把人造耳處理后的聲音與原始語音進(jìn)行對(duì)比,來衡量人造耳的精度。因此,他們把原始語音數(shù)據(jù)和經(jīng)人造耳處理的聲音數(shù)據(jù),放入分類器( classifier )中進(jìn)行識(shí)別。67% 的語音信號(hào)能被成功識(shí)別出來。而在沒有動(dòng)態(tài)外耳的對(duì)照組中,只有 35% 的聲音數(shù)據(jù)被識(shí)別。

            有了更多的可用分析數(shù)據(jù)后,研究員們將著手用行業(yè)基準(zhǔn)來對(duì)該系統(tǒng)進(jìn)行測(cè)試,并開發(fā)仿生學(xué)習(xí)算法。再或者,將來他們可能會(huì)開發(fā)一個(gè)“聆聽” app,把智能手機(jī)麥克風(fēng)變成接入物聯(lián)網(wǎng)的指向性麥克風(fēng),來幫助使用者選擇現(xiàn)實(shí)中他想要聽到的聲音。IBM 研究人員認(rèn)為,實(shí)現(xiàn)它并不是太遙遠(yuǎn)。



          關(guān)鍵詞: IBM 語音識(shí)別

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();