<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 谷歌等語音識別技術(shù)水平或超人類暫未投入使用

谷歌等語音識別技術(shù)水平或超人類暫未投入使用

作者：時(shí)間：2016-09-12 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

彭博社發(fā)表分析文章稱，現(xiàn)在的語音識別技術(shù)還不夠成熟，較為機(jī)械，一些模糊不清的詞匯難以辨別，也不能通過語境理解用戶的真正意圖。但是，近期語音識別和人工智能領(lǐng)域取得的突破讓一項(xiàng)數(shù)十年前就已問世的數(shù)字神經(jīng)網(wǎng)絡(luò)技術(shù)獲得重生。谷歌正在此神經(jīng)網(wǎng)絡(luò)技術(shù)的基礎(chǔ)上開發(fā)可以整合其海量數(shù)據(jù)的語音系統(tǒng)，其能夠讓語音識別更為智能，大幅改善了識別質(zhì)量。未來，市場上或?qū)⒊霈F(xiàn)準(zhǔn)確率與人類相當(dāng)或水平更高的語音識別系統(tǒng)。

本文引用地址：http://www.ex-cimer.com/article/201609/304051.htm

以下是文章全文：

與數(shù)字語音助手聊天產(chǎn)生的樂趣大概就像你努力與一個(gè)頑固的孩子講道理一樣。如果你曾經(jīng)對著你的Xbox大吼，或者咒罵Siri，那說明你可能已經(jīng)對語音識別失望了。

技術(shù)突破

但是研究人員稱，人類近期在語音識別和人工智能領(lǐng)域取得的突破將很快會大幅提升設(shè)備的理解能力。谷歌著名工程師約翰·沙爾克維克(Johan Schalkwyk)表示，只需一到兩年，這種性能強(qiáng)大的新型設(shè)備就會問世。它不僅能夠聽懂人們說話的意思，還明白上下文的關(guān)聯(lián)與細(xì)微差別。

沙爾克維克正在谷歌從事一項(xiàng)野心勃勃的研究項(xiàng)目，開發(fā)能夠整合公司海量數(shù)據(jù)的語音系統(tǒng)。他表示，目前正在實(shí)驗(yàn)室測試的一個(gè)項(xiàng)目能夠使計(jì)算機(jī)聽懂并在本質(zhì)上“思考”人們向谷歌設(shè)備輸入的語音。

語音和機(jī)器學(xué)習(xí)領(lǐng)域近期的創(chuàng)新應(yīng)該會大幅提升語音識別的能力，緩解人們的不滿情緒。Siri開發(fā)團(tuán)隊(duì)中有人表示，工程師們都在狂熱地開發(fā)語音識別技術(shù)，令其足夠智能，以實(shí)現(xiàn)設(shè)備與用戶真正地對話。“語音識別技術(shù)對所有地區(qū)口語的理解能力已取得長足的進(jìn)步，”Siri底層礎(chǔ)技術(shù)的開發(fā)公司SRI International(后被蘋果收購)副總裁威廉·馬克(William Mark)稱，“這種對話式互動現(xiàn)在成為了一種前沿技術(shù)。”

蒂姆·圖特勒(Tim Tuttle)對語音識別技術(shù)的飛躍等待已久。他在1997年取得了麻省理工學(xué)院的博士學(xué)位，并在該校人工智能實(shí)驗(yàn)室任職。過去10年，他先后在多家硅谷公司工作，并最終在2010年創(chuàng)建了自己的公司Expect Labs。圖特勒的公司去年開始從事一個(gè)系統(tǒng)研發(fā)，將復(fù)雜的語音指令加入到移動應(yīng)用中。這款應(yīng)用能夠允許用戶進(jìn)入一家商店后向手機(jī)詢問要買的掃帚在哪一條貨架走道。

“一年前，我們做了一次基準(zhǔn)測試，得出的結(jié)論是難以實(shí)現(xiàn)這一功能。但是現(xiàn)在，一切都已經(jīng)發(fā)生了改變。我們公司對語音識別進(jìn)行了加倍投資，主要得益于我們所看到的這些技術(shù)進(jìn)步，”圖特勒表示，“你將發(fā)現(xiàn)，那些在準(zhǔn)確率上與人相當(dāng)、或比人更高的語音識別系統(tǒng)實(shí)現(xiàn)商業(yè)化。”

舊技術(shù)獲重生

先來迅速回顧一條歷史教訓(xùn)：兩年半前，谷歌和多倫多大學(xué)的研究人員發(fā)表了一篇頗有影響力的論文，內(nèi)容關(guān)于使用“深度神經(jīng)網(wǎng)絡(luò)”在電腦中模擬語音。幾個(gè)月后，微軟和IBM合作發(fā)表了另外一篇論文。谷歌工程師杰夫·迪恩(Jeff Dean)將這兩篇論文稱之為“語音研究領(lǐng)域20年來取得的最大的一次進(jìn)步”。

新發(fā)現(xiàn)讓一項(xiàng)問世數(shù)十年的數(shù)字神經(jīng)網(wǎng)絡(luò)技術(shù)創(chuàng)新獲得了重生。該技術(shù)在上世紀(jì)80年代在預(yù)測和分析大數(shù)據(jù)方面表現(xiàn)優(yōu)異，但發(fā)展受制于當(dāng)時(shí)過慢的計(jì)算機(jī)速度。神經(jīng)網(wǎng)絡(luò)在近期才成為一個(gè)可行的選擇，這要?dú)w功于計(jì)算機(jī)處理速度的大幅提升和新軟件技術(shù)的發(fā)展。

谷歌的實(shí)驗(yàn)室項(xiàng)目就是基于神經(jīng)網(wǎng)絡(luò)研究。6個(gè)月前，谷歌團(tuán)隊(duì)放棄了一種名為前饋神經(jīng)網(wǎng)絡(luò)的舊方法，轉(zhuǎn)而使用遞歸神經(jīng)網(wǎng)絡(luò)。這一轉(zhuǎn)換使得系統(tǒng)能夠存儲更多信息，處理更長、更復(fù)雜的序列。谷歌的創(chuàng)新成果在于對底層代碼的簡化，允許軟件在相同系統(tǒng)中存儲更多觀點(diǎn)和概念，使之易于問出復(fù)雜的問題和得出合理答案。 “系統(tǒng)構(gòu)建得復(fù)雜會損害其長期發(fā)展，”沙爾克維克說。

谷歌系統(tǒng)現(xiàn)在使用上下文、物理定位及其它了解到的說話者信息對談話的場所和真正含義進(jìn)行預(yù)測，就像人在談話時(shí)大腦所做的一樣。谷歌的新網(wǎng)絡(luò)技術(shù)應(yīng)該會更高效，從而能夠處理比以往更多的數(shù)據(jù)，回答更為復(fù)雜的請求。

為了解釋未來語音識別技術(shù)的工作原理，沙爾克維克使用了距離谷歌加州山景城總部幾英里之外的高級越南餐館作為例子。這家餐館名為Xanh Restaurant。沙爾克維克稱，對于典型的語音識別系統(tǒng)來說，識別出這個(gè)餐館名字的發(fā)音是個(gè)挑戰(zhàn)，因?yàn)閄anh的發(fā)音為“zahn”，識別起來十分困難。“如果我能使用地圖，然后說‘這是一家餐館，它位于加州’，那么可供參考的餐館數(shù)量就會立刻減少很多，”他說，“使用這種語義知識，我們能夠大幅改善語音識別的質(zhì)量。”

這聽起來簡單，但對于計(jì)算機(jī)來說，聽到一個(gè)詞匯，從句子中識別上下文，然后根據(jù)地理位置分析信息是一件極為困難和耗費(fèi)時(shí)間的事情。如今，谷歌語音搜索能夠正確識別餐館，也許就是因?yàn)槠溟_發(fā)者是餐館老顧客的原因。沙爾克維克稱，未來谷歌將能處理其他同樣存在語音模糊不清的眾多問題。

沙爾克維克表示，在谷歌內(nèi)部，語音識別取得了“數(shù)量空前多”的技術(shù)進(jìn)步。盡管谷歌取得的重大進(jìn)步還需要一到兩年時(shí)間才能在手機(jī)上體現(xiàn)出來，該項(xiàng)目已經(jīng)催生出了可用于谷歌其他業(yè)務(wù)的技術(shù)。“你開發(fā)一些技術(shù)準(zhǔn)備登月，與此同時(shí)，你也開發(fā)出了另外100項(xiàng)有用的技術(shù)，”沙爾克維克說。

沙爾克維克稱，三年前，谷歌語音識別技術(shù)或許僅能識別3/4的單詞。而如今，圖特勒稱，得益于創(chuàng)新速度的加快，谷歌手機(jī)語音識別應(yīng)用能夠準(zhǔn)確猜中12/13的單詞。“未來，我們將會生活在一個(gè)設(shè)備沒有鍵盤的世界里，”圖特勒說。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 語音識別 谷歌 數(shù)字神經(jīng)網(wǎng)絡(luò)技

評論

相關(guān)推薦

谷歌中國喊冤稱互聯(lián)網(wǎng)地圖無法可依

felixwoo | 2008-05-08

Nuance語音識別技術(shù)

設(shè)計(jì)方案語音識別 Nuance 消費(fèi)電子 | 2015-02-03

電視機(jī)智能聲控選合系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

資源下載語音識別彩電遙控智能聲控選臺 | 2007-02-16

谷歌行政總廚跳槽Facebook

wxy_88kl | 2008-04-08

谷歌推出Friend Connect 提供共享社交服務(wù)

wxy_88kl | 2008-05-14

利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源的技術(shù)方案

設(shè)計(jì)方案 ARM處理器 MEMS STM32F4 語音識別 | 2015-03-23

孤立詞語音識別系統(tǒng)的DSP實(shí)現(xiàn)

設(shè)計(jì)方案孤立詞 DSP 語音識別 | 2015-03-28

IT企業(yè)CEO薪水揭秘 IBM居高惠普谷歌有點(diǎn)冤

wxy_88kl | 2008-04-28

語音識別及其定點(diǎn)DSP實(shí)現(xiàn)

設(shè)計(jì)方案語音識別 DSP C語言 | 2015-03-28

JavaScript語音識別庫-Julius

視頻 JavaScript 語音識別 Julius | 2015-07-07

谷歌工程師批評 OpenAI，稱其延緩 AGI 研究進(jìn)展

智能計(jì)算 AI 智能計(jì)算谷歌 AGI | 2024-06-12

語音識別在遙控系統(tǒng)中的應(yīng)用設(shè)計(jì)

資源下載語音識別 DTW FED FRED 學(xué)習(xí)型遙控器 | 2007-04-19

蓄謀已久的谷歌與居安思危的百度

wxy_88kl | 2008-04-25

大嘴業(yè)話：如何打敗蘋果

視頻蘋果三星安卓谷歌 | 2012-09-21

基于STM32智能家居系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

設(shè)計(jì)方案 STM32 語音識別服務(wù)器智能家居 | 2015-03-21

谷歌母公司Q2營收847億美元凈利潤236億同比增29%

智能計(jì)算谷歌母公司 Q2 營收 Alphabet 云收入云服務(wù) | 2024-07-24

挑戰(zhàn)蘋果！曝谷歌自研Soc Tensor G5進(jìn)入流片階段：臺積電代工

手機(jī)與無線通信谷歌 Soc 臺積電 Pixel | 2024-07-05

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計(jì)算 openAI SearchGPT 谷歌 | 2024-07-26

谷歌已經(jīng)與臺積電達(dá)成合作：首款芯片為Tensor G5，選擇3nm工藝制造

EDA/PCB 谷歌臺積電 Tensor G5 3nm 工藝 | 2024-06-24

谷歌Tensor G5芯片或已進(jìn)入流片階段，基于臺積電3nm制程

EDA/PCB 谷歌 Tensor G5芯片 AI | 2024-07-02

新一代語音識別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

汽車電子語音識別生物識別人工智能 | 2024-07-18

基于聯(lián)合得分的連續(xù)語音識別確認(rèn)方法

資源下載似然比檢驗(yàn) 備擇模型語音確認(rèn) 語音識別 | 2007-04-19

文件顯示蘋果訓(xùn)練AI用了谷歌TPU芯片

智能計(jì)算蘋果 AI 谷歌 TPU芯片 | 2024-06-12

谷歌 Pixel 9 系列手機(jī)提前至8月14日發(fā)布

谷歌 Pixel 手機(jī) | 2024-06-27

消息稱谷歌Tensor G5芯片已流片預(yù)計(jì)采用3nm制程

EDA/PCB 谷歌 Tensor G5 芯片 3nm制程 | 2024-07-02

基于DTW模型的語音識別

資源下載 DTW模型語音識別 MATLAB | 2007-04-19

本科畢業(yè)設(shè)計(jì)：一種基于發(fā)育思想的語音識別系統(tǒng)實(shí)現(xiàn)

資源下載語音識別人工智能自主式機(jī)器發(fā)育思想自組織映射網(wǎng)絡(luò) 簡單反饋神經(jīng)網(wǎng)絡(luò) | 2007-04-19

4 調(diào)用 Google 語音識別

視頻 Android Wear 圖靈機(jī)器人 Google 語音識別 | 2015-07-07

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();