<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          關(guān) 閉

          新聞中心

          EEPW首頁 > 工控自動化 > 設(shè)計應(yīng)用 > 智能電器如何被人類聲控?

          智能電器如何被人類聲控?

          作者: 時間:2012-08-22 來源:網(wǎng)絡(luò) 收藏

          標簽:智能電網(wǎng)

          本文引用地址:http://www.ex-cimer.com/article/201129.htm

          近兩年,以智能家居為主題的消費電子展越來越多,擁有功能的電視機、空調(diào)、電飯煲、電腦、手機等電器開始引領(lǐng)潮流,逐步取代了觸摸式按鍵的領(lǐng)先操作方式。這種機器愈發(fā)聰明,我們通過聲音即可進行在一定距離范圍內(nèi)的操作,便捷而人性化,讓人感受到“科技以人為本”的時代曙光。在不久的將來,電器會更像人類,它們也會有視覺與聽覺,靠語音識別、監(jiān)控感知即可實現(xiàn)簡單的人機交互。那么,以語音識別為基礎(chǔ)的是個什么原理?難道都長有耳朵嗎?

          其實,語音識別只是電器感知模式識別的一個分支,它從屬于信號處理科學(xué)領(lǐng)域,同時與語音學(xué)、語言學(xué)、數(shù)理統(tǒng)計及神經(jīng)生物學(xué)等學(xué)科有非常密切的關(guān)系。語音識別的目的就是讓機器能夠“聽懂”人類口述的語言,這其中包括了兩方面的含義:其一是逐字逐句聽懂非轉(zhuǎn)化成書面語言文字;其二是對口述語言中所包含的要求或詢問加以理解,做出正確響應(yīng),而不拘泥于所有詞的正確轉(zhuǎn)換。

          自動語音識別技術(shù)有三個基本原理:首先,語音信號中的語言信息是按照短時幅度譜的時間變化模式來編碼;其次,語音是可以閱讀的,即它的聲學(xué)信號可以在不考慮說話人試圖傳達的信息內(nèi)容的情況下,用數(shù)十個具有區(qū)別性的、離散的符號來表示;再次,語音交互是一個認知過程,因而不能與語言的語法、語義和語用結(jié)構(gòu)割裂開來。

          而對于語音識別的預(yù)處理,則包括語音信號采樣、反混疊帶通濾波、去除個體發(fā)音差異和設(shè)備、環(huán)境引起的噪聲影響等,并涉及到語音識別基元的選取和端點檢測問題。在之后的特征提取過程,就是用于提取語音中反映本質(zhì)特征的聲學(xué)參數(shù),如平均能量、平均跨零率、共振峰等。然后是訓(xùn)練階段,即在識別之前通過讓講話者多次重復(fù)語音,從原始語音樣本中去除冗余信息,保留關(guān)鍵數(shù)據(jù),再按照一定規(guī)則對數(shù)據(jù)加以聚類,形成模式庫。最后是模式匹配,這是整個語音識別系統(tǒng)的核心,它根據(jù)一定規(guī)則(如某種距離測度)以及專家知識(如構(gòu)詞規(guī)則、語法規(guī)則、語義規(guī)則等),計算輸入特征與庫存模式之間的相似度(如匹配距離、似然概率),判斷出輸入語音的語意信息。

          除此之外,語音識別技術(shù)還基于對語音的物理屬性、生理屬性和社會屬性3個基本屬性的分析。

          1. 語音的物理屬性

          所謂物理屬性,主要包括音高、音長、音強和音色4個要素。音高是指聲音的高低,主要決定于發(fā)音體振動速度的快慢;音長是指聲音的長短,主要決定于發(fā)音體振動時間的久暫;音強是指聲音的強弱,主要決定于發(fā)音體振動幅度的大小;音色是指聲音的特色,主要決定于發(fā)音物體振動所形成的音波波紋曲折形式不同。

          2. 語音的生理屬性

          所謂生理屬性,主要指發(fā)音器官對語音的影響,包括肺和氣管、候頭和聲帶以及口腔、鼻腔和咽腔等發(fā)音氣官。

          3. 語音的社會屬性

          所謂社會屬性,主要表現(xiàn)在3個方面,一是語音與意義之間并無必然聯(lián)系,它們的對應(yīng)關(guān)系是社會成員約定俗成的;二是各種語言或方言都有自己的語音系統(tǒng);三是語音具有區(qū)別意義的作用。

          語音識別的基本過程根據(jù)實際中的應(yīng)用不同,語音識別系統(tǒng)可以分為:特定人與非特定人的識別、獨立詞與連續(xù)詞的識別、小詞匯量與大詞匯量以及無限詞匯量的識別。但無論那種語音識別系統(tǒng),其基本原理和處理方法都大體類似。

          最后,通過語音識別的一系列過程做出相應(yīng)的預(yù)設(shè)反應(yīng),這樣就被人類聲控了,所以這看似簡單快捷的操控方式其實很復(fù)雜。如此,操控電器會變得非常簡單,不用像現(xiàn)在這樣,先看完枯燥乏味的說明書,或邊看操作步驟邊操控電器了。



          關(guān)鍵詞: 智能電器 聲控

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();