<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 醫(yī)療電子 > 業(yè)界動態(tài) > 科學家研發(fā)人工智能聲吶眼鏡:可識別唇語,準確率達 95%

          科學家研發(fā)人工智能聲吶眼鏡:可識別唇語,準確率達 95%

          作者: 時間:2023-04-10 來源:IT之家 收藏

          IT之家 4 月 10 日消息,美國康奈爾大學的研究人員開發(fā)了一種新技術(shù),可以通過聲納眼鏡進行無聲溝通。這種眼鏡利用微型揚聲器和麥克風來讀取佩戴者默念的單詞,從而可以在不需要物理輸入的情況下執(zhí)行各種任務。

          本文引用地址:http://www.ex-cimer.com/article/202304/445444.htm

          The EchoSpeech glasses (modeled here by lead scientist Ruidong Zhang) could be utilized to control devices, or even to help the voiceless communicate

          這項技術(shù)由康奈爾大學的博士生張瑞東(音譯)領(lǐng)導開發(fā),是在一個類似的項目的基礎(chǔ)上進行的改進,該項目使用了一個無線耳機,而之前的模型則依賴于攝像頭。

          據(jù)IT之家了解,該聲納眼鏡使用一種名為 EchoSpeech 的無聲語音識別接口,利用聲納來感知嘴部運動,同時使用一個深度學習算法實時分析回波特征。這使得系統(tǒng)能夠以約 95% 的準確率識別佩戴者默念的單詞。

          這項技術(shù)最令人興奮的前景之一是,對于有語言障礙的人來說,可以使用它來無聲地將對話輸入到語音合成器中,然后將單詞大聲說出來。眼鏡也可以用來在安靜的圖書館中控制音樂播放,或者在嘈雜的音樂會上口述信息。

          該技術(shù)既小巧又低功耗,也不會侵犯隱私,因為沒有數(shù)據(jù)離開用戶的手機。這樣,就不會有隱私方面的擔憂。眼鏡佩戴非常方便,比其他可用的無聲語音識別技術(shù)更實用、更可行。

          研究人員表示,該系統(tǒng)只需要幾分鐘的訓練數(shù)據(jù)來學習用戶的語音模式,學習完成后,就可以朝用戶的臉上發(fā)送和接收聲波,感知嘴部運動,同時使用深度學習算法分析回波特征。該系統(tǒng)目前能夠識別 31 個孤立的命令和一串連續(xù)的數(shù)字,并且錯誤率低于 10%。

          該系統(tǒng)目前的版本提供了大約 10 小時的電池續(xù)航,并且可以通過藍牙無線地與用戶的智能手機通信。智能手機負責處理和預測所有數(shù)據(jù),并將結(jié)果傳輸?shù)揭恍皠幼麈I”,讓它可以播放音樂、與智能設(shè)備交互或激活語音助手。

          康奈爾大學智能計算機接口未來交互(SciFi)實驗室正在利用康奈爾大學的一個資助計劃來探索將這項技術(shù)商業(yè)化的可能性。




          關(guān)鍵詞: 人工智能 智能穿戴

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();