中文語音處理在數(shù)字助聽器的設(shè)計
目前國外對助聽器研究發(fā)展的一個熱點則是集中在中國,確切地講是基于對漢語語言和語音研究,開發(fā)相關(guān)的語音識別技術(shù)和產(chǎn)品。為中心的中文聽力學(xué)也不例外。我們已經(jīng)知道聽覺科學(xué)是一門發(fā)展迅速、知識更新很快的一門學(xué)科,它所研究的對象以人的聽覺為中心,現(xiàn)在我們將介紹和討論科學(xué)家和聽力學(xué)家更關(guān)心的是怎樣將聽覺科學(xué)運用到中國人的聽覺和言語實際中去。
漢語是具有特征化的音調(diào)性語言,與其他以拼音字母為主的語系,如斯拉夫語系等具有很明顯的語音學(xué)差別。這種差別不僅僅在語言特征上非常明確,在具體使用時,區(qū)別也很大。是否不同語系的不同語音特征會影響聽覺受損患者對言語的理解,尤其是在使用基于不同語系研究成果制作成的助聽器時,這種語音的差異是否起到重要作用,最近已成為學(xué)術(shù)和科研的一個熱門課題。比如國內(nèi)研制的人工耳蝸的一個特點便是在設(shè)計其算法時考慮到中文語音特點。國外助聽器廠商將在近期推出以中文語音為特征算法的助聽器。加拿大在中國的一語音實驗室通過多年的研究和實驗,早在 2000 年運用領(lǐng)先的數(shù)字信號處理 (DSP) 技術(shù),在其數(shù)字助聽器中加入中文語音算法,并同時申請了相關(guān)專利。目前他們率先推出的以中文語音處理技術(shù)為核心的全新數(shù)字助聽器 —Intelligia ,在臨床試驗中得到受試者的認(rèn)可,初步證明這種新型助聽器對說以中文為母語的患者有益處。
目前研究的結(jié)果表明,不同的語系,如漢語和英語有各自特點,在聽覺感知過程中有很大差別。英文和漢語在語音和口語上有重要區(qū)別, Ming-Xi Tsai el al ( 2000 )認(rèn)為漢語和英文語音在結(jié)構(gòu)上特征區(qū)別很大。漢語的詞、字、音節(jié)和聲、韻母分節(jié)含有不同層次的信息,并保持復(fù)雜的關(guān)系。在口語中,漢語發(fā)音差異也很大,在不同會話條件下,受到這些結(jié)構(gòu)中不同層次信息的影響。
對中文語音識別和中文語音音調(diào)的研究表現(xiàn)在人工耳蝸的算法上面。言語處理策略是人工耳蝸幫助患者理解語言核心技術(shù),已有大量研究。但對于言語聲尤其是聲調(diào)、語調(diào)的研究,比如對以語調(diào)為基礎(chǔ)的漢語研究還是很少。在最近的一個試驗中,他們用澳大利亞人工耳蝸來觀察對漢語語音理解的影響。結(jié)果表明在某些言語處理策略中漢語的使用的理解度要高于其他時間策略。如果能提高刺激率,加強對語音和音調(diào)的理解,他們也認(rèn)為不同的言語處理策略對漢語說法也有理解。研究再次證明,漢語應(yīng)該有一定的語音系統(tǒng)處理自己的語言,尤其是對聽障人士尤為重要。
美國麻省理工學(xué)院研究者 Michael Qin 在其《在噪音背景發(fā)音和音調(diào)的辨認(rèn)》的試驗中,對漢語普通話音調(diào)的辨認(rèn)和噪音的關(guān)系進(jìn)行了研究。他認(rèn)為不同的語言利用不同類型的聲調(diào)使我們口語富于不同的意義,在噪音環(huán)境下這些有意義的聲調(diào)會受到影響,因此他需要發(fā)現(xiàn)說普通話的中國人怎樣在噪音環(huán)境里辨認(rèn)不同的聲調(diào)。在試驗中他使用 6 個輔元音的音位,同時使用 4 個聲調(diào):陰陽上去。其結(jié)果表明在信噪比降低的情況下,對漢語聲調(diào)和元音的識別受到很大影響,從而影響降低言語的理解能力。因此信噪比影響理解中文很重要的因素。這個試驗對聽覺康復(fù)和設(shè)計有針對性的助聽器具有重要意義。
同時,最近美國成立了一個綜合性專家研究小組,開始研制適合中文語音的助聽器。該小組成員包括世界聞名的豪斯耳研究院、香港中文大學(xué)耳鼻喉科等。與上述研究類似。他們認(rèn)為在聆聽以聲調(diào)作為識別語音和語義的語言時,如普通話、廣東話和泰國語等,可能聽覺更重要的是依靠基頻相關(guān)的信息來理解語言,這是與別的語言不同的。因此,在研制助聽器時,我們應(yīng)該考慮到這些患者的語言特點。
當(dāng)然,筆者最感興趣的是最近由威耳康研究基金 (Wellcome Trust) 贊助的一項題為《中文普通話會話者在理解語言時比英文會話者用腦更多》的試驗,其目的是使用影像技術(shù)來觀察和研究中文母語和英文母語說話者大腦出現(xiàn)的不同活動。主持該項研究的心理學(xué)家索菲斯高特博士發(fā)現(xiàn),當(dāng)英語的受試者聽到英文時,其左顳葉變得異?;钴S,研究者認(rèn)為這個區(qū)是把言語聲組合在一起形成獨立的字詞。但是當(dāng)中文受試者聽到普通話時,其左右顳葉同時活躍起來。顯然,由于說不同語言的受試者用他們大腦的不同區(qū)域?qū)Σ煌Z言的刺激進(jìn)行解碼。這對我們理解這些理論產(chǎn)生了很大的影響。他們進(jìn)一步認(rèn)為中文受試者的左顳葉處理語音信號,而他們的右顳葉則處理聲調(diào),同時產(chǎn)生意義。言語聲是非常復(fù)雜的聲音,而正確理解言語傳遞的意思,在這種情況下,大腦會充分利用說話者抑揚頓挫的聲調(diào)來對其言語進(jìn)行解碼,從而將口語變成有意義的信號。
大腦聽覺區(qū)域很容易受外部影響,而改變對聲音的分辯能力。一旦聽覺受到損傷,必需進(jìn)行康復(fù),大腦需要重新連接和編碼。大腦的可塑性是很強的。了解大腦對不同語言的反應(yīng),可以有效地幫助聽覺患者重新恢復(fù)對語言的理解。重要的是基于這些研究,我們可以清楚地看到研制出具有中文語音特征的聽力康復(fù)設(shè)備。記得在 2002 年北京大學(xué)和中國殘聯(lián)成立言語聽覺中心的開幕式上,鄧樸方先生在發(fā)言中專門談到:他第一次聽說中文語音處理特征對助聽器使用者的影響,他認(rèn)為這是一個重要課題,需做大量工作,而研制出以中文語音為特征的聽覺康復(fù)設(shè)備將會有重要的意義。根據(jù)國際確認(rèn)的聽損發(fā)病率,中國有 10 %的人口,即一億三千萬人有不同程度聽力損失,因此,利用中文語音處理技術(shù)更有效地幫助聽殘患者具有非常重要的作用。
一.中文語音技術(shù)處理原理
中文語音處理策略的英文詞有 “Chinese speech processing strategy” 或 “Chinese speech recognition”, ( 中文語音識別 ) 和 “hearing aid algorithm” ( 助聽器算法 ) 等。其中, algorithm ,即 “ 算法 ” 一詞使用較多,尤其涉及到數(shù)字助聽器的開發(fā), “ 算法 ” 代表了某一特殊技術(shù)的核心。 “ 算法 ” 可以被簡單地看作為實現(xiàn)某些特定信號處理功能的指令序列。中文語音特征可以通過算法研究來形成的。數(shù)字信號處理器和算法構(gòu)成了數(shù)字助聽器的 DSP 線路。包含多通道動態(tài)范圍壓縮、噪音衰減等處理,設(shè)計助聽器的算法的主要目標(biāo)是利用中文語音處理技術(shù),即使在不同的聽音環(huán)境中,須確保言語被聽見并聆聽舒適。同時,利用數(shù)字助聽器改善漢語可懂度,使有聽力損失的中國患者能更容易地理解漢語。
漢語是聲調(diào)單字語言,聲調(diào)是漢語的重要語音特征之一。聲調(diào)特征主要體現(xiàn)在嗓音基頻隨時間變化的模式上。 Eady 技術(shù) (1982) 曾考察過聲調(diào)語言 — 漢語的基頻模式與重音語言 — 英語有什么不同。漢語的聲調(diào)在詞語中具有辯意作用,在生活實踐當(dāng)中,大家也都能體會到聲調(diào)有助于我們聽懂別人的話,而 “ 南腔北調(diào) ” 常表示不易聽懂和不大好懂和不大好聽的意思。
對于連續(xù)言語來說,長時間平均的正、負(fù)顫動因數(shù),各種語言和男女發(fā)音人是差不多的。只是負(fù)顫動總是比正顫動大,而且出現(xiàn)頻率也較高。 Eady 的測量結(jié)果表明,漢語的說話速度要比英語慢一些。這可能是由于說漢語時,說話人要花更大的努力在每一個音節(jié)上來控制聲帶運動,也就是說聲調(diào)語言的音節(jié)喉運動控制有較大的語言學(xué)負(fù)荷,因而花的時間就多一些。結(jié)果就表現(xiàn)為說話慢一些。
因此,聲調(diào)信息主要存在于基頻隨時間的變化中,強度變化對聲調(diào)信息有補償作用,以及清輔音的存在與否對聲調(diào)清晰度是有一定的影響的。
1原理 (Principles)
本文介紹一種可應(yīng)用于數(shù)字助聽器的提高漢語可懂度的語音處理方法,其目標(biāo)是使以漢語為母語的聽殘人士能更容易地理解語言。增強言語可懂度的思路來源于人們的實踐經(jīng)驗。回想一下,當(dāng)你為使一個有聽力障礙的人更容易聽懂自己說話時所采用的方法:你不僅僅要提高音量,而且還要改變發(fā)音方式,說得更慢和更清晰。一些研究表明清楚地讀無意義的語句,比在日常會話句子,大約能提高 17% 的單詞可懂度。這里所謂說得更清晰是指強調(diào)言語信號中的某些暗示,這些暗示有許多不同的形式,如特定音段的持續(xù)時間,元音的共振峰位置或者音素之間的過渡等。
不是所有人都會簡單地、方便地對聽力損失患者 “ 清楚地 ” 講話。因此,我們要采用言語增強的方法就是在說話人和聽話人中間構(gòu)造一個處理模型,該模型能強調(diào)并突出語句中的特定成分,使語句聽起來更清晰。
一切語音之所以能夠表達(dá)意義,是由于各個音之間存在區(qū)別。這些區(qū)別產(chǎn)生于聲腔內(nèi)部的器官和肌肉等活動決定的發(fā)音方法和發(fā)音部位的差異,同時又表現(xiàn)為語音的聲學(xué)特征的差異。本文提出的言語增強的方法正是通過對語音信號的重構(gòu)來強化這些差異。所謂重構(gòu)是指對語音信號中不同性質(zhì)的信號進(jìn)行識別并有針對性地予以處理,強調(diào)其中對人的感知起作用的特征,從而達(dá)到提高言語清晰度的目的。該方法可以簡單地概括為:放大輔音、強調(diào)重音和突出聲調(diào)。
2 漢語語音信號的感知特點
2.1 聲調(diào)
聲調(diào)的調(diào)類。
聲調(diào)的感知。
主要依據(jù)基頻的變化。
聲調(diào)音高的變化對音長和音強都可能產(chǎn)生影響。
2.2 重音
輕重音的聲學(xué)特性。
與實際音強有密切關(guān)系,但并不相等。
還要受音色、音高和音長的制約。
感知特點:分辨輕重音時,音強往往并不是決定性因素。
1 )輔音放大 (Consonant Amplification)
言語知覺的心理實驗證實了如下特點:人在言語感知過程中,對語音信號載荷的關(guān)于發(fā)音方法和發(fā)音部位的分辨信息的知覺能力存在強弱差別??傮w上說,人對發(fā)音方法比對發(fā)音部位有更好的分辨能力。而方法清晰度與輔音清晰度的關(guān)系很相近。在漢語輔音的發(fā)音方法的知覺重要性中,存在清與濁、送氣與不送氣、摩擦與非摩擦的從強到弱的位次關(guān)系。研究表明,相對加強輔音有助于改善語音清晰度。
Kates 描述了放大輔音的方法,圖1是其中被廣為采用的一種模型。該系統(tǒng)把信號分解成幾個波段,在每個波段檢測短時譜形,根據(jù)譜形識別元音和輔音,對輔音則給予放大。需要指出的是,杜利民等提出了漢語語音導(dǎo)引特征的概念,從聲學(xué)信息計算檢測的角度為為漢語自動語音識別系統(tǒng)提供了一種輔助匹配結(jié)構(gòu)。
圖 1 輔音增強系統(tǒng)
2) 重音 (Stress)
組成一段語流的各音節(jié)聲音響亮程度并不完全相等。有的音節(jié)在語流中聽起來聲音比其他音節(jié)響亮,這就是重音音節(jié)。有的重音和語義、語法有密切關(guān)系,如漢語普通話中的詞重音。詞重音出現(xiàn)在詞中,是由于詞的含義不同,重讀音節(jié)的位置也不同。如 “ 技術(shù) ” 和 “ 計數(shù) ” ,重音分別在第一音節(jié)和第二音節(jié)。這種語意的區(qū)別是通過 “ 超音段特征 ” 來表達(dá)的。
在漢語中,重音對韻律特征參數(shù)的影響倍受關(guān)注。語流中 “ 韻律特征 ” ( prosodic feature )是通過音高、音長和音強的變化,即 “ 超音段特征 ” 表現(xiàn)出來。從語圖上觀察,音域明顯擴張重音的特點。高明明對普通話語句匯總強調(diào)重音的聲學(xué)表現(xiàn)進(jìn)行了研究,指出:
( 1 ) “ 音高升高是普通話語句中強調(diào)重音的重要韻律特征 ” 。
( 2 )音高和時長對于強調(diào)重音的實現(xiàn)具有同樣重要的作用。它們之間的關(guān)系是對立互補的。
語音合成的經(jīng)驗告訴我們,音高是調(diào)節(jié)重音最有效的手段,所以強化重音的方法主要是提高音高。
3) 聲調(diào) (Tone and Internation)
一個音節(jié)除了包括由元音和輔音按時間順序排列成系列的音質(zhì)單位以外,還必須包括一定的音高、音強和音長。在一些語言里,音高在音節(jié)中起的作用可以說是和元音、輔音同樣重要,這種能區(qū)別音節(jié)的意義的音高就是 “ 聲調(diào) ” 。根據(jù)聲調(diào)的有無可以把世界上的語言分為聲調(diào)語言和非聲調(diào)語言兩大類。漢、藏語系語言最突出的一個特點就是有聲調(diào)。
漢語普通話的聲調(diào)起著構(gòu)詞辯意的作用。對于具有相同拼音的一個音節(jié),由于聲調(diào)不同,可以具有不同的含義。普通話單音節(jié)的聲調(diào)變化共有四種模式,不同的聲調(diào)反映在語音參數(shù)上是基音頻率軌跡的變化不同。根據(jù)實驗觀察所定義的一些規(guī)則,可以認(rèn)為基音頻率軌跡的某一參數(shù)超越某一預(yù)先確定的門限時,則可判為某一聲調(diào)類型。在此基礎(chǔ)上,黃澤鎮(zhèn)、楊行峻提出的識別模式采用基音軌跡曲線的一、二次斜率、谷點和平坦度對四種聲調(diào)有很強的區(qū)別性,實驗表明,這一算法的結(jié)果識別率可達(dá)到 99% 。
林茂燦指出聲調(diào)信息主要存在于主要元音(及其聲學(xué)過渡)上。考慮到聲調(diào)音高的變化,對音長和音強都可能產(chǎn)生影響,即:去聲最短、最強,上聲最長,最弱,陰平和陽平舉重,陽平又往往比陰平略長一些。聲調(diào)的增強不能簡單地對主要元音進(jìn)行放大,而應(yīng)該不同的聲調(diào)在音高和音強上有不同的處理。實際應(yīng)用中我們采取如下策略:
( 1 )對去聲增強音強。
( 2 )對上聲加大音長。
( 3 )對陰平和陽平不改變。
圖 3 展示的 4 條聲學(xué)曲線分別描述了四聲在不同時間里的頻率特征。
圖 3 漢語四聲的聲調(diào)聲學(xué)特征
2. 方法 (Methodology)
數(shù)字助聽器的核心部分是增益計算,基于頻域的處理過程,它建立了各頻率段的輸入瞬時能量與增益的函數(shù)關(guān)系,如圖3所示,對每個頻段的瞬時能量進(jìn)行短時能量累計和長時間慢速平均可獲得信號識別和分類所必要的數(shù)據(jù)。其中:
( 1 ) E j (n)= a E j (n-1) 式中: a 是時間常數(shù) 。
( 2 )使用倒譜算法提取基頻, 512 個點 FFT , 40ms 漢明窗,窗移為 10ms 。
( 3 )用一個簡單的滑動平均算法對每個音節(jié)測到的基頻進(jìn)行平滑處理,剔除那些平滑段內(nèi)偏離均值過大的值。
( 4 )音高和音長分別進(jìn)行歸一化。
( 5 )采用一個二次曲線在最小均方誤差的意義下逼近基音軌跡。并計算曲線的一次斜率、二次斜率、谷點和平坦度。
上述算法采用基于 TOCCATA 指令系統(tǒng)的匯編語言實現(xiàn)。 14 位 A/D ,采樣率設(shè)為 32KHz 。
圖3 . 漢語言語增強系統(tǒng)處理結(jié)構(gòu)圖
1). 語音的切分 (Classifications of Phonemes)
聲波由音質(zhì)(即音色)、音高、音強和音長四部分組成,這四部分在語音中起著不同的作用,但在時間上又是同時并存的。
音質(zhì)成分 —— 按音節(jié)劃分,如元音、輔音。
超音質(zhì)成分 —— 由音高、音強和音長三部分組成,附著于一個音節(jié)或音段上。
從聲波特性上看,可以由基頻確定音高,根據(jù)振幅確定音強,根據(jù)時間確定音長。
2). 處理原理 (Algorithm Principles)
中文語音處理主要體現(xiàn)在:
在驗配過程的中,考慮中文語音長時間頻譜覆蓋的頻率作加權(quán)處理,抬高目標(biāo)曲線中言語頻率的部分,可以達(dá)到加強語音理解的作用。
在助聽器的信號處理程序中,對壓縮控制器做特別的設(shè)置,使對高頻的信號壓縮的啟動時間和釋放時間很短 , 做到使輔音清晰化的效果,增強使用者對言語的理解度。
在降噪處理中,根據(jù)中文語音在噪音環(huán)境中的采樣分析,得出了為中文語音優(yōu)化的降噪策略。實驗證實,該策略最高可以提高信噪比 18dB 。
二.中文語音處理技術(shù)在涉及助聽器的應(yīng)用
下面是將中文語音技術(shù)應(yīng)用到設(shè)計助聽器的具體實例。這項技術(shù)采用了目前世界上最先進(jìn)的 DSP 數(shù)字技術(shù),包括低功耗的數(shù)字芯片。
1. TOCCATA 數(shù)字信號處理系統(tǒng)
Toccata TM 系統(tǒng)是微型、超低功耗、高效率的數(shù)字信號處理系統(tǒng)。它包括一個高保真加權(quán)疊加濾波器組( WOLA filter bank )、一個 16 位 DSP 核心、兩個 14 位 A/D 轉(zhuǎn)換器、一個 14 位 D/A 轉(zhuǎn)換器和其它外圍設(shè)備。 Toccata TM 技術(shù)提供標(biāo)準(zhǔn)的軟件可編程的 DSP 開發(fā)平臺和采用 0.18 μ 工藝制造的微型超大規(guī)模集成電路。它不但為音頻處理系統(tǒng)制造商也為其它基于 DSP 的微型、低功耗產(chǎn)品的開發(fā)提供了便利。
1.1 硬件結(jié)構(gòu) (Hardware Structure)
圖4 硬件系統(tǒng)結(jié)構(gòu)圖
TOCCATA 系統(tǒng)由三塊芯片組成,一個 “ 模擬 ” 芯片( ALPHA ),一個 “ 數(shù)字 ” 芯片( DELTA ),和一個用于無電存儲的 E 2 PROM 芯片。
1.2 ALPHA 芯片
ALPHA 芯片包括輸入和輸出放大器,二個 A/D 轉(zhuǎn)換器,一個 D/A 轉(zhuǎn)換器,以及主時鐘及供電系統(tǒng)。
1.3 DELTA 芯片
DELTA 芯片包括了 16 位軟件可編程 DSP 核心,一個 WOLA 濾波器組協(xié)處理器,一個 DMA 控制器(輸入輸出處理器或 IOP )和存儲器( RAM 和 ROM )。可編程核心和靈活的濾波器的組合允許通過軟件改變信號的處理方式。因而,該結(jié)構(gòu)可以執(zhí)行傳統(tǒng)的音頻處理系統(tǒng)處理方案(例如雙通道壓縮),當(dāng)然通過 DSP 核心,也可以執(zhí)行更強大的處理方案(例如 16 通道乃至更多通道的壓縮,降噪,抑制反饋等)。
1.4 DSP 核心和指令系統(tǒng) (DSP Core)
RCORE 是一個靈活的 DSP 核心,采用帶單周期連乘累加操作和 40 位累加器的雙哈佛結(jié)構(gòu)。外圍組件通過一個由擴展寄存器、存儲器映象寄存器和共享存儲器組成的復(fù)合體提供。
1.5 信號路徑
圖5 . Toccata 系統(tǒng)提供的信號路徑:
2 Intelligia 數(shù)字助聽器結(jié)構(gòu)
Intelligia 全數(shù)字助聽器是基于上述介紹的芯片的技術(shù)特點設(shè)計的,其結(jié)構(gòu)可由圖 6 表明。盡管同模擬助聽器一樣,數(shù)字助聽器也使用麥克風(fēng)和接收器作為能量轉(zhuǎn)換器,但在數(shù)字信號處理器中經(jīng) A/D 采樣后,電平信號已被轉(zhuǎn)化為數(shù)字編碼。數(shù)字編碼能夠非常靈活地被加以利用來提供增益、改善頻響,或按患者聽力的要求作其它處理。當(dāng) DSP 算法完成后,數(shù)字編碼又被 D/A 轉(zhuǎn)換為電平信號,并經(jīng)由接收器轉(zhuǎn)換為聲音。
數(shù)字助聽器的關(guān)鍵在于具有信息處理系統(tǒng),這里以一款基于現(xiàn)進(jìn)數(shù)字信號處理系統(tǒng) Toccata TM ,開發(fā)出的全數(shù)字助聽器 Intelligia ,具有獨特的中文語音處理功能。助聽器在設(shè)計中將信號分解成 16 個波段濾波處理,再將 16 個波段的信號組成 10 組通道,每個通道獨立使用輸入自動增益控制方法 (AGCi) ,對信號進(jìn)行壓縮處理,每個通道使用快慢兩個時間偵測器,快速時間偵測器用以監(jiān)視信號較快的變化,而慢速時間偵測器偵測較慢的信號變化,也就是音節(jié)的變化,并且選用與中文語音變化相匹配的壓縮、釋放時間常數(shù),達(dá)到更好的聽覺效果。
全數(shù)碼助聽器技術(shù)特點:
1)中文語音信號處理
深入研究中文和其他聲調(diào)語言的發(fā)聲特征后,我們把獨創(chuàng)的中文語音處理的技術(shù)置入 ,使它能大大提高在中文語言環(huán)境中聽音的可懂度。
2)更快
采用專為數(shù)字助聽器設(shè)計的第 3 代數(shù)字助聽器處理系統(tǒng) TOCCATA ,它強大的運算能力使能快速處理各種語音信號。
3)更省電
工作電流不足 1 毫安,并且它能在無信號輸入時自動進(jìn)入省電模式,如此低的能耗免去配戴者經(jīng)常更換電池之苦。
4)完全可編程
通過其可編程的優(yōu)點為聽障者配置最適合的聽力補償程序和參數(shù),從而保證配戴者可以獲得最佳的聽音效果。
5)多通道獨立壓縮
把外界的聲音按頻率細(xì)分成多個波段和通道,并對每個波段和通道的信號進(jìn)行不同的處理,從而保證配戴者聽到更清晰、更逼真的聲音。
6)降噪處理
能有效地抑制環(huán)境噪音,提高辨別語言的能力,從而保證配戴者無論是在嘈雜的大街還是在喧鬧的超市都能聽到清晰的聲音。
7)方向性處理
可配置一個方向性麥克風(fēng)系統(tǒng)和相應(yīng)的軟件,能使降噪的效果更好,從而保證配戴者聽到更清晰、更自然的聲音。
8)聲反饋抑制
助聽器在使用過程中容易引起嘯叫,這種現(xiàn)象即聲反饋。 采用了聲反饋抑制技術(shù),能有效地抑制聲反饋的出現(xiàn),使配戴者聽到更為舒適的聲音。
9)可輕松升級
由于采用全開放的數(shù)字信號處理( DSP )平臺 TOCCATA 技術(shù),提供了可編程的能力,具有充分的適應(yīng)性以及升級能力,因此,配戴者只要采用我們的軟件,就可以立刻享受到最新的功能。下面是這款中文語音處理的技術(shù)指標(biāo)對比 :
表 1 中文語音技術(shù)處理助聽器和其它助聽器的技術(shù)比較
在實驗室中,具有中文言語增強方法的數(shù)字助聽器,初步實驗的結(jié)果表明,中文語音處理技術(shù)的運用,可幫助以漢語為母語的患者更好地理解語言,提高康復(fù)水平。在臨床使用中,佩帶 Intelligia 助聽器的病人感覺效果很好,尤其在噪聲環(huán)境中,增強了語音清晰度。從某種意義上講,病人感到理解語言的能力得到提高。當(dāng)然,我們必須意識到中文語音處理技術(shù)在全數(shù)碼助聽器中的運用仍處在早期研究階段。筆者認(rèn)為聽力學(xué)科學(xué)家和助聽器專家應(yīng)從下列幾方面作更深入的研究:
應(yīng)對以英文和漢語為基礎(chǔ)的語音處理技術(shù)作深入的對比研究,尤其是在噪音環(huán)境中,觀察兩種技術(shù)分別對兩種語音不同處理的效果。最理想的實驗條件應(yīng)是利用有雙語能力的受試者參加。
將中文語音處理技術(shù)和目前使用的非線性助聽器驗配法結(jié)合研究,觀察以英文為基礎(chǔ)制定的驗配方法,是否在中文語音處理技術(shù)支持下,更有效地幫助以漢語為母語的患者在日常生活中提高言語理解能力。
中文語音處理技術(shù)目前是人機對話的研究熱門之一,其算法復(fù)雜多樣,我們應(yīng)該更深入地研究具有中文特色的助聽器技術(shù)算法,充分發(fā)揮數(shù)碼芯片的巨大潛力。
將中文語音處理技術(shù)運用到聽力器設(shè)備中去才剛剛開始,這是一項非常復(fù)雜、涉及許多尚未解決的技術(shù)問題的課題。但是,筆者認(rèn)為只有開發(fā)出具有漢語語音特色的助聽器,才能更有效地幫助眾多的以漢語為母語的聽殘者。
評論