基于LabVIEW的語音分析平臺的實現(xiàn)
語音處理是目前信息學領域的研究熱點和難點,其任務是研究如何利用信號處理技術研究語 音信號,使未來的計算機“能聽會說”。語音信號的處理是對語音信號進行分析,只有通過分析得到的參數(shù)才能做進一步的研究。語音分析涉及大量復雜的數(shù)學運 算,如果采用硬件方式實現(xiàn),從價格和靈活性上都不可取。如果通過計算機軟硬件結合的方法采用主流的編程方式實現(xiàn),則存在編程復雜,不易擴展和界面不友好等 問題。
本文引用地址:http://www.ex-cimer.com/article/193767.htm虛擬儀器是全新概念的最新一代測量儀器,自1987年誕生以來,以前所未有的速度迅猛發(fā)展。虛擬儀器與計算機軟硬件技術的發(fā)展 同步,他利用計算機強大的計算能力和豐富的軟硬件資源來組織儀器系統(tǒng),從而實現(xiàn)實驗儀器系統(tǒng)的部分乃至全部的功能,并最終實現(xiàn)從傳統(tǒng)儀器向計算機的過渡。 虛擬儀器的測量功能可以由用戶根據(jù)需要自行設計軟件來定義或擴展,而非由廠家事先定義且固定不可變更。尤其是美國NI公司的圖形化虛擬儀器開發(fā)平臺 LabVIEW,不僅編程簡單功能完備,而且有多種專用軟件包和豐富的各種板卡可供選擇,這就為開發(fā)一個符合要求且界面友好的語音分析平臺提供了便利。
1工作原理
語音信號一般被看作一種短時平穩(wěn)的隨機信號,主要是對他進行時域、頻域和倒譜域上的信號分析。
語音信號的時域分析是對信號從統(tǒng)計的意義上進行分析,得到短時平均能量、過零率、自相關函數(shù)以及幅差函數(shù)等信號參數(shù)。根據(jù)語音理論,氣流激勵聲道產(chǎn)生語 音,語音信號是氣流與聲道的卷積,因此可以對信號進行同態(tài)分析,將信號轉換到倒譜域,從而把聲道和激勵氣流信息分離,獲得信號的倒譜參數(shù)。
線性預測編碼分析是現(xiàn)代語音信號處理技術中最核心的技術之一,他基于全極點模型,其中心思想是利用若干過去的語音抽樣來逼近當前的語音抽樣,采用最小均 方誤差逼近的方法來估計模型的參數(shù)。矢量量化是一種最基本也是極其重要的信號壓縮算法,充分利用矢量中各分量間隱含的各種內在關系,比標量量化性能優(yōu)越, 在語音編碼、語音識別等方向的研究中扮演著重要角色。
語音識別通常是指利用計算機識別語音信號所表示的內容,其目的是準確地理解語音所蘊含的含義。語音識別的研究緊密跟蹤識別領域的最新研究成果并基本與之保持同步。
語音信號分析,首先需要將語音信號采集到計算機并做預先處理,然后通過選擇實時或延遲的方式,實現(xiàn)上述各種類型的參數(shù)分析,并將分析結果以圖形的方式輸出或保存,從而實現(xiàn)整個平臺的功能。
2系統(tǒng)構成
語音分析平臺由軟、硬件2部分組成,硬件部分的任務是通過麥克風和聲卡將語音信號轉換為電信號,經(jīng)過A/D轉換,以數(shù)字信號的形式傳入計算機,同時具備能將語音波形文件通過聲卡外接耳機或音箱回放。系統(tǒng)框圖如圖1所示。
2.1硬件部分
硬件包括3個部分:拾音及信號調理電路,A/D轉換電路,PC機接口電路。由于聲卡已經(jīng)成為計算機的標準配置(集成或插卡形式),故采用聲卡、話筒的組合實現(xiàn)這部分功能,不但使用簡便而且省去大量硬件設計工作。
2.2軟件部分
LabVIEW是美國NI公司推出的一種通用虛擬儀器開發(fā)軟件,他包含豐富的功能函數(shù)庫和完備的總線設備驅動程序。LabVIEW的一大特色是其基于圖 形的編程方式是采用數(shù)據(jù)流(dat astream)而非傳統(tǒng)的文本方式的編程方法。這種編程方式強調信號處理的實際過程,有利于簡化編程,縮短開發(fā)時間和降低開發(fā)難度。
LabVIEW的編程包括前面板設計和后臺設計。前面板對應一臺儀器的面板,實現(xiàn)對儀表的控制和信號的表達功能。LabVIEW提供了一套豐富的控制模 板庫,用戶通過這些模板來設計面板的內容。后臺對應一臺儀器的內部工作部分,用于實現(xiàn)儀表對信號的采集處理等操作。對應的LabVIEW提供了一套功能模 板庫,用來幫助用戶實現(xiàn)程序改造、儀器控制數(shù)據(jù)分析等功能。主要的功能模塊如下:
采集與預處理完成語音信號的采集,然后對信號進行消噪處理。
時域處理主要包括短時分析與預處理、短時能量、短時平均幅度和短時平均過零率、語音端點檢測、短時自相關函數(shù)、短時平均幅度差函數(shù)和基音周期估計等。
頻域處理主要包括基于短時傅里葉分析與重構、復倒譜和倒譜分析、聯(lián)合時頻分析。
預測與量化主要包括語音信號預測編碼分析和矢量量化。
語音識別主要包括特征表示與提取、譜失真測度、模板匹配技術、隱馬爾可夫模型技術、孤立詞及連接詞識別、大詞匯量連續(xù)語音識別和說話人識別。
與Matlab軟件接口通過LabVIEW提供的Script Node子VI連接主流算法仿真分析軟件Matlab,充分發(fā)揮后者強大的數(shù)據(jù)處理能力。盡管LabVIEW中提供了一些信息處理功能函數(shù),但是畢竟功能 有限,仍無法滿足用戶各種各樣的數(shù)值計算和分析的需求。而Matlab特別擅長數(shù)值分析和處理,如果能夠在LabVIEW中調用他的話,不失為一種較好的 解決方法。
軟件在實現(xiàn)過程中,充分利用LabVIEW軟件本身所提供的豐富的應用分析工具包如數(shù)字濾波器、頻域分析等工具模塊,避免大量的軟硬件開發(fā)工作。
3結語
通過上述方法構建的語音分析平臺,界面豐富友好,操作使用方便,并且能不斷隨著虛擬儀器技術和計算機軟硬件技術的進步而升級。特別重要的是用戶可以在該平臺上開發(fā)驗證新的語音信號分析處理算法。
參考文獻
[1]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語音技術基礎與應用[M].北京:清華大學出版社,2003.
[2]易克初,田斌,付強.語音信號處理[M].北京:國防工業(yè)出版社,2000.
[3]劉君華,郭會軍.基于LabVIEW的虛擬儀器設計[M].北京:電子工業(yè)出版社,2002.
評論