<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 國內(nèi)外語音識別行業(yè)現(xiàn)狀

          國內(nèi)外語音識別行業(yè)現(xiàn)狀

          作者: 時間:2016-08-23 來源:C114 收藏
          編者按:隨著高速發(fā)展之后,智能手機和它所帶動的相關(guān)產(chǎn)業(yè)都陷入了發(fā)展瓶頸,機器學(xué)習(xí)和人工智能被認為是下一個科技熱潮,而語音識別也會趁著這個風(fēng)口飛起來,國內(nèi)語音行業(yè)也可謂是百花齊放,尤其是最近幾年,不僅涌現(xiàn)了很多國內(nèi)外的小公司,而且巨頭們也開始加速語音識別行業(yè)的布局。

            3、國內(nèi)外巨頭布局的策略差異

          本文引用地址:http://www.ex-cimer.com/article/201608/295872.htm

            上面歷數(shù)了國內(nèi)外各個巨頭陸續(xù)建立引擎的過程和優(yōu)勢技術(shù),有一點我們還是要特別留意一下:國外巨頭欲進入行業(yè),首先想到的就是收購初創(chuàng)的團隊,這些團隊大都也在5-20人之間,掌握著一定的優(yōu)勢技術(shù)。顯然收購一家初創(chuàng)團隊很難滿足其戰(zhàn)略發(fā)展,因此一旦技術(shù)與公司業(yè)務(wù)融合以后,這些巨頭都會頻繁出手再次收購以補齊短板,逐漸建立起適合自己公司發(fā)展的語音識別優(yōu)勢。

            對于技術(shù)相對重要而且技術(shù)點又比較分散的科技型公司,國外巨頭一般不會采取收購商業(yè)模式公司的那種大手筆來收購,這也是導(dǎo)致Nuance最終無人問津的重要因素。想想也是,巨頭自然不會用別人家引擎以免將來掣肘,何況收購技術(shù)類的大型公司無疑也是給自己找了個麻煩。

            國內(nèi)的語音識別發(fā)展脈路沒有那么清晰,剛開始各個巨頭也都是采用專用公司比如、中科信利、云知聲等公司的引擎。后來醒悟過來,紛紛謀求自建,但是除了百度不斷砸入重金后獲得了一定的效果外,其他自建的各大公司沒有啥實質(zhì)性進展。這一點從他們試圖低薪聘請語音識別相關(guān)人才的策略上,也可知道其戰(zhàn)略上沒什么可發(fā)展的。語音識別行業(yè)屬于聲學(xué)和計算機的交叉技術(shù),本來培養(yǎng)的人才就很稀缺,而從上述分析可以看出,國內(nèi)外的技術(shù)源頭實際上大概集中,無非就是業(yè)界相關(guān)的研究機構(gòu)和擁有研發(fā)實力的巨頭公司。

           4、語音識別行業(yè)平衡之下的技術(shù)發(fā)展趨勢

            語音識別行業(yè)現(xiàn)在似乎維持著最大的平衡,因為國內(nèi)外各家的引擎識別率都基本在同一個水平線上,差不多達到了當(dāng)前語音識別技術(shù)的極限,彼此之間差距不是那么明顯。本來蘋果發(fā)布Siri被寄予厚望,這是將語音技術(shù)進行大眾推廣的絕佳良機,但是Siri的表現(xiàn)卻與預(yù)期相差甚遠。即便國內(nèi)非?;馃岬奈⑿?,其中又有幾人使用,甚至知道其中的語音識別技術(shù)呢?倒是同樣源自聲學(xué)技術(shù)的微信搖一搖功能非常火熱。

            這個技術(shù)相對語音識別來說,簡直就是小巫見大巫,但是應(yīng)用場景契合的很好。因此,傳統(tǒng)的語音識別行業(yè)公司都在謀求轉(zhuǎn)型發(fā)展,比如Nuance、等,轉(zhuǎn)型失敗或者技術(shù)儲備不足的,或許將來就是最早倒下的,而且這幾年也有不少家類似公司倒下了。

            未來的語音識別市場,預(yù)計將會有越來越多的公司參與,以后語音識別的性能可能更多的體現(xiàn)在前端技術(shù)和語義理解上。機器要與人自然交流,當(dāng)然就不能重復(fù)手機這套語音對話規(guī)則,必然就要考慮到用戶說話的環(huán)境、周圍環(huán)境的噪音、用戶發(fā)音不準或者方言等等諸多因素,這就要求前端技術(shù)更加精準的模擬人體結(jié)構(gòu),仿真出機器人聽覺系統(tǒng),以實現(xiàn)解放雙手自由對話的目的。

            另外,機器能不能與人自由的交流,不僅需要機器能將語音轉(zhuǎn)換成文字,更需要機器從文字中理解說話人的含義,這一方面是基于大樣本的機器學(xué)習(xí)需要更進一步,另外一方面也需要小樣本的自主學(xué)習(xí),沒有舉一反三的功能,似乎語義理解也無法自主適應(yīng)陌生的環(huán)境。這兩個新興的技術(shù)領(lǐng)域,或許又會孕育出幾家獨角獸企業(yè),將真正推動語音從識別走向交互的自然體驗,從而向著人工智能再次邁進一步。


          上一頁 1 2 3 4 5 6 下一頁

          關(guān)鍵詞: 語音識別 科大訊飛

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();