車上設(shè)備人機(jī)語音接口
隨著社會信息化的不斷深入,車上設(shè)備及其功能不斷增加,駕駛中使用這些設(shè)備的頻率很高。由于駕駛員的視覺和手直接控制駕駛操作,傳統(tǒng)的基于視覺和手操作的人機(jī)接口訪問方式,無法適應(yīng)駕駛中對不斷增加的車上設(shè)備的訪問;不僅使用不方便,而且極大地影響安全性,并占用大量的車上空間。由于駕駛中使用類似于手機(jī)等設(shè)備引發(fā)的事故不斷增加,很多地方禁止駕駛中使用這些設(shè)備。在對車上設(shè)備訪問方式進(jìn)行評估中,由于語言訪問方式不需要視覺和手的直接介入,安全性、使用方便性以及占用車上空間等指標(biāo)遠(yuǎn)高于其它方式,被認(rèn)為是最有發(fā)展?jié)摿Φ娜藱C(jī)接口方式[1][2][3]。語言交流方式也是人類最自然的交互方式,隨著語音識別和語音合成等相關(guān)技術(shù)的不斷成熟,語言接口將不斷取代目前基于視覺和手操作的接口?;谡Z言的人機(jī)訪問接口將是車上設(shè)備人機(jī)接口的發(fā)展方向。
隨著車上電子設(shè)備與裝置不斷增多,傳統(tǒng)的連接方式已無法適應(yīng)線束數(shù)量和連接復(fù)雜程度的增加,車上網(wǎng)絡(luò)技術(shù)越來越受到重視;普遍認(rèn)為,所有車上電子裝置將通過車上網(wǎng)絡(luò)連接。車上網(wǎng)絡(luò)協(xié)議以及支撐器件的工業(yè)化和標(biāo)準(zhǔn)化也發(fā)展非???。在不久的將來,所有車上電子裝置都將通過車上網(wǎng)絡(luò)連接。所以本系統(tǒng)與被訪問的設(shè)備之間采用網(wǎng)絡(luò)連接方式。這有利于本系統(tǒng)與被訪問設(shè)備的硬件連接和推廣應(yīng)用。它與車上網(wǎng)絡(luò)之間通過標(biāo)準(zhǔn)網(wǎng)絡(luò)協(xié)議進(jìn)行通信。把語音接口納入到車上網(wǎng)絡(luò)體系中,也是連接語音接口與被訪問設(shè)備的最有效方式。
車上語音接口的支撐技術(shù)是小詞匯量語音識別、語音合成和車上網(wǎng)絡(luò)技術(shù)。小詞匯量語音識別技術(shù)(尤其是孤立詞小詞匯量識別)已經(jīng)達(dá)到實用水平。采用隱馬爾可夫模型的小詞匯量識別可以在非特定人和高噪聲環(huán)境下可靠工作并達(dá)到很高的識別率[4]。對于大量的私人用轎車,可以采用特定人識別方式,不僅可以達(dá)到更高的識別率,而且可以適應(yīng)個人說話口音等因素。車上網(wǎng)絡(luò)已經(jīng)有較成熟的系統(tǒng),如CAN 總線、MOST 總線等。而且越來越多的車上設(shè)備和總成支持網(wǎng)絡(luò)連接方式。這些對與本文介紹的系統(tǒng)將來在車上的推廣應(yīng)用提供了有利的支持。
這方面的技術(shù)是國際上汽車電子技術(shù)研究的一個新領(lǐng)域,被認(rèn)為是將來車上人機(jī)接口的必然發(fā)展方向,在我國尚未開展相關(guān)研究開發(fā)工作。對這項技術(shù)進(jìn)行研究,并開發(fā)具有自主知識產(chǎn)權(quán)的技術(shù)產(chǎn)品,對提高我國汽車整體技術(shù)水平,提高我國汽車信息與電子技術(shù)產(chǎn)品的市場競爭力,具有重要意義。將來在車上使用語音人機(jī)接口方式,已經(jīng)是一種共識,這項技術(shù)的市場潛力巨大。由于在車上應(yīng)用語音接口方式的顯著優(yōu)點,和語音識別與合成技術(shù)已經(jīng)進(jìn)入實用階段,也就是足以支持這類語音接口,國際上各大汽車公司和相應(yīng)的配件廠家正展開車上語言人機(jī)訪問方式一系列相關(guān)技術(shù)的研究,并且取得了一些成果。BOSCH公司最近已經(jīng)開發(fā)出了較為實用的車用語言操縱系統(tǒng)。SENSORY 等公司開發(fā)了適用于車輛環(huán)境的語音處理器件。這些工作目前還處于開發(fā)與完善階段,不久將進(jìn)入市場;預(yù)計,首先在高檔車上使用,隨著技術(shù)不斷成熟成本將下降很快,然后在其它類型車上廣泛應(yīng)用。
2 車上設(shè)備與裝置
這個語音接口訪問的車上設(shè)備和功能主要包括通信裝置(如電話)、車上計算機(jī)、車上媒體裝置(如音響設(shè)備、CD 播放機(jī)等)、車上輔助裝置(如空調(diào)、車門窗、后視鏡等)。語音接口訪問的設(shè)備不包括駕駛操作中影響安全性的裝置和設(shè)備(如轉(zhuǎn)向、信號、制動、加速踏板等)。這個接口與被訪問設(shè)備之間按標(biāo)準(zhǔn)車上網(wǎng)絡(luò)協(xié)議進(jìn)行連接。
車上語音接口,一方面是一個駕駛員訪問其他設(shè)備的界面,另一方面它也是一個車用設(shè)備。設(shè)計中必須遵循汽車環(huán)境要求的指標(biāo)。在汽車環(huán)境下應(yīng)用的設(shè)備必須滿足一些特定的要求,包括:
(1) 高可靠性;
(2) 低成本;
(3) 工作溫度范圍-40~125℃;
(4) 應(yīng)用方便;
(5) 體積小,安裝靈活;
(6) 滿足環(huán)保和電磁兼容要求;
(7) 駕駛中應(yīng)用時,基本不分散駕駛員的視覺和手操縱的注意力;
(8) 在汽車可能出現(xiàn)的任何狀態(tài)下,它是安全的(不應(yīng)引起有害后果)。
3 系統(tǒng)功能與操作方式
3.1 車上語音接口的功能
車上語音接口的主要功能包括:
(1) 上設(shè)備的語言命令控制;即通過這個接口,駕駛員可以用語言命令對這些設(shè)備進(jìn)行操作。
(2) 表盤;即可以通過語音方式給出傳統(tǒng)儀表盤上的各種汽車狀態(tài)信息,如車速、燃料狀態(tài)、蓄電池狀態(tài)、故障狀態(tài)信息以及車上數(shù)據(jù)庫信息等。
(3) 語音形式的提示與報警功能。
3.2 基本操作方式
這個語音接口的基本操作為:
(1) 啟動:當(dāng)汽車上電時,這個系統(tǒng)初始化,并進(jìn)入接受語音命令狀態(tài)。初始化也可以通過初始化按鍵隨時重新進(jìn)入。
(2) 初始化完成后,系統(tǒng)可以接受系統(tǒng)控制命令、設(shè)備控制命令和信息數(shù)據(jù)請求命令。
(3) 系統(tǒng)控制命令用于設(shè)置和檢查語音接口系統(tǒng)狀態(tài)。
(4) 設(shè)備控制命令完成設(shè)備訪問功能。
(5) 信息數(shù)據(jù)請求命令完成獲取汽車狀態(tài)或其他數(shù)據(jù)庫中信息的訪問。
4 車上語音接口硬件結(jié)構(gòu)
由于這個接口是通過車上網(wǎng)絡(luò)與被訪問系統(tǒng)連接,這個接口本身就是網(wǎng)絡(luò)中的一個節(jié)點。它首先識別輸入的語音命令信息,識別后根據(jù)識別的結(jié)果發(fā)送訪問命令信息。在這個實驗系統(tǒng)中,語音接口通過CAN網(wǎng)絡(luò)與被訪問設(shè)備連接。系統(tǒng)硬件結(jié)構(gòu)如圖1 所示。它由兩個信息通路構(gòu)成,一個是由駕駛員到被訪問設(shè)備的控制命令通路,包括拾音器、語音識別、控制信號轉(zhuǎn)換以及與被控制設(shè)備的接口。另一個是由信息源或設(shè)備到駕駛員的反饋信息通路,包括信息獲取設(shè)備接口、數(shù)據(jù)到詞句的轉(zhuǎn)換以及語音合成和發(fā)音器。語音識別部分完成識別駕駛員命令并轉(zhuǎn)換為命令代碼的功能。信號轉(zhuǎn)換部分把命令代碼轉(zhuǎn)換為能控制對應(yīng)設(shè)備的電信號形式。這個接口支持?jǐn)?shù)字信號、模擬信號、串行接口信號和CAN 總線網(wǎng)絡(luò)連接方式。
評論