<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應用 > 車載導航人機語音交互系統(tǒng)的實現(xiàn)

車載導航人機語音交互系統(tǒng)的實現(xiàn)

作者：清華大學汽車安全與節(jié)能國家重點實驗室劉旺楊殿閣連小珉時間：2007-06-10 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

摘要： 支持語音交互是車載導航系統(tǒng)的一個發(fā)展趨勢。本文討論了車載導航系統(tǒng)人機語音交互的實現(xiàn)方法，包括對話模式、關(guān)鍵詞識別、語音控制命令、名稱識別、語音合成。試驗結(jié)果證明，系統(tǒng)能滿足車載導航人機語音交互的要求。

關(guān)鍵詞： 車載語音導航；人機語音交互；語音識別；語音合成

本文引用地址：http://www.ex-cimer.com/article/60124.htm

引言

語音作為自然的人機接口，可以使車載導航系統(tǒng)實現(xiàn)更安全、更人性化的操作。通過國內(nèi)外車載導航系統(tǒng)的功能對比可知，支持語音交互是車載導航系統(tǒng)的一個發(fā)展趨勢。另外，市場信息服務公司J.D Power and Associates的調(diào)研數(shù)據(jù)也表明，56％的消費者更傾向于選擇聲控的導航系統(tǒng)。因此，開發(fā)車載語音導航系統(tǒng)是很有意義的。目前，國內(nèi)已經(jīng)具備開發(fā)車載語音導航系統(tǒng)的技術(shù)基礎(chǔ)，特別是文語轉(zhuǎn)換TTS技術(shù)和基于中小詞匯量的語音命令識別技術(shù)已經(jīng)達到比較實用的程度。本文在課題組的車載導航系統(tǒng)和國內(nèi)兩款語音引擎的基礎(chǔ)上，開發(fā)了一套支持語音交互的車載導航系統(tǒng)。

車載語音導航系統(tǒng)結(jié)構(gòu)

車載語音導航系統(tǒng)從功能上分為車載導航和導航語音交互兩方面。其中車載導航功能包括GPS衛(wèi)星導航定位、電子地圖瀏覽查詢、智能的路徑規(guī)劃、車輛地理位置和速度等導航信息的實時顯示；導航語音交互功能分為語音操作和語音提示兩部分。在系統(tǒng)的設(shè)計中，根據(jù)人機交互的需求，設(shè)計語音導航系統(tǒng)的硬件框架如圖1所示。

圖片1.png

圖1 語音導航系統(tǒng)的硬件框架

語音導航系統(tǒng)和用戶之間的人機交互接口由觸摸屏、按鈕、話筒、顯示屏和擴音器等五個交互設(shè)備組成。該硬件框架可實現(xiàn)常規(guī)的手動交互方式，也可以實現(xiàn)語音交互方式。整個系統(tǒng)劃分為三個子系統(tǒng)：導航子系統(tǒng)、語音識別子系統(tǒng)和語音合成子系統(tǒng)，各子系統(tǒng)間通過接口進行通信，協(xié)調(diào)完成語音導航任務。

車載導航人機語音交互系統(tǒng)對話模式設(shè)計

導航系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)

整個導航系統(tǒng)是一個復雜的人機交互系統(tǒng)，為便于語音交互對話模式的設(shè)計，首先對系統(tǒng)作狀態(tài)劃分，然后從人機交互的角度描述整個系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。將系統(tǒng)劃分為地圖瀏覽、功能選擇等六個功能狀態(tài)和一個退出狀態(tài)。圖2描述了這些狀態(tài)之間的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。

圖中的節(jié)點代表系統(tǒng)的各個狀態(tài)，帶箭頭的連線代表從源狀態(tài)到目標狀態(tài)的轉(zhuǎn)換。狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)接收用戶的操作作為驅(qū)動事件，完成從一個狀態(tài)到另一狀態(tài)的轉(zhuǎn)換，網(wǎng)絡(luò)中的一條路徑便代表著特定的交互過程。

導航系統(tǒng)各狀態(tài)節(jié)點對話模式設(shè)計

為便于描述各狀態(tài)節(jié)點內(nèi)部的對話模式，將狀態(tài)節(jié)點按圖2所示編號為S1~S7，用Tmn表示狀態(tài)節(jié)點Sm到狀態(tài)節(jié)點Sn的轉(zhuǎn)換。另外，借鑒狀態(tài)流stateflow模型的表示方法，提出用于描述車載導航人機語音交互系統(tǒng)中的對話模型。重新定義轉(zhuǎn)換的描述方式，用四個屬性來描述狀態(tài)節(jié)點內(nèi)的一次轉(zhuǎn)換：
T={P1,P2,P3,P4} (1)
其中，t用于表示一個轉(zhuǎn)換，P1~P4為轉(zhuǎn)換的屬性：P1為語音事件；P2為語音輸出；P3為附加條件；P4為轉(zhuǎn)換動作。

這樣，一個轉(zhuǎn)換t便描述了一次對話中用戶的語音輸入、系統(tǒng)的語音輸出、對話受到的限制條件以及系統(tǒng)執(zhí)行的動作。

以地圖瀏覽狀態(tài)為例，說明對話模式設(shè)計的過程。地圖瀏覽狀態(tài)由兩個互斥的子狀態(tài)組成：地圖漫游狀態(tài)和車輛引導狀態(tài)(參見圖2)。這兩種子狀態(tài)的人機交互大部分相同，所以將二者統(tǒng)一劃分在地圖瀏覽狀態(tài)下。對于區(qū)分對待這兩個子狀態(tài)的交互過程，可以通過附加條件來判斷當前子狀態(tài)，再作不同的處理。地圖瀏覽狀態(tài)節(jié)點的對話模式設(shè)計如圖3所示。

圖片2.png

圖2 導航系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)

圖片3.png

圖3 地圖瀏覽狀態(tài)的對話模式

人機語音交互系統(tǒng)的實現(xiàn)

語音控制命令的實現(xiàn)

語音控制命令的實現(xiàn)方案如圖4所示。圖中左邊方框代表整個語音導航系統(tǒng)對話模式的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)STN。根據(jù)對話模式的設(shè)計，將系統(tǒng)分為地圖瀏覽狀態(tài)、功能選擇狀態(tài)、路徑規(guī)劃狀態(tài)等7個狀態(tài)節(jié)點，每個狀態(tài)節(jié)點內(nèi)部均存在各自的語音對話模式，對話模式由若干內(nèi)部轉(zhuǎn)換組成。因此，整個語音導航系統(tǒng)是一個兩層結(jié)構(gòu)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)，其內(nèi)部轉(zhuǎn)換由語音事件驅(qū)動。語音事件由導航子系統(tǒng)的接口模塊根據(jù)語音識別子系統(tǒng)發(fā)送的用戶意圖而產(chǎn)生。

圖片4.png

圖4 語音控制命令的實現(xiàn)設(shè)計方案框圖

語音控制命令的實現(xiàn)過程分為以下四個步驟：
*語音識別引擎根據(jù)當前命令詞表識別用戶語音，得到識別結(jié)果。
*管理窗口獲取到識別結(jié)果，通過查詢“識別詞－控制命令”映射，得到識別結(jié)果對應的控制命令，并將控制命令作為用戶意圖發(fā)送至導航子系統(tǒng)的接口模塊。
*接口模塊響應用戶意圖，通過語音事件改變語音導航系統(tǒng)的狀態(tài)。
*接口模塊根據(jù)語音導航系統(tǒng)的狀態(tài)判斷是否需要更改當前命令詞表，若需要則通過管理窗口更改當前命令詞表。

POI名稱的識別方法

識別子系統(tǒng)除了要識別控制命令以外，還需要識別POI(興趣點、標志點)名稱。POI名稱識別與控制命令識別最大的區(qū)別在于其候選集合在規(guī)模上的差異。在本系統(tǒng)中，進行控制命令識別時候選集合的規(guī)模最大約為30個，但進行POI名稱識別時，以所用的北京電子地圖為例，其POI點的個數(shù)為20,172個，此時其候選集合的規(guī)模比控制命令識別時大幾個數(shù)量級。

利用命令詞識別引擎進行識別時，必須為引擎提供一個當前詞表，需要先將候選集合中的詞條轉(zhuǎn)化為詞表，才能真正地進行識別。同時，基于中小詞表的ASR識別引擎不能生成規(guī)模達2萬多的詞表，所以對于POI名稱識別，采取了不同于控制命令識別的方案。在對控制命令進行識別時，因為候選集合可以用一個詞表來表示，采取了在線識別的方法。而對POI名稱進行識別時，單個詞表無法容納所有的POI名稱，由此提出了利用識別引擎離線識別功能的離線遍歷識別方案。該方案利用多個詞表來描述整個候選集合。實現(xiàn)的具體流程如圖5所示。

圖片5.png

圖5 離線遍歷識別PIO名稱的流程

該方案將候選POI集合劃分為n個子集，并生成各子集的詞表，然后以各詞表為當前詞表進行離線識別，并將這些局部的識別結(jié)果匯總形成一個臨時詞表，最后在這個臨時詞表中進行識別，得出全局的最優(yōu)識別結(jié)果。該過程遍歷了各個子集，相當于在整個候選集合中匹配出最優(yōu)識別結(jié)果，所以識別正確率得到了保證。同時由于識別次數(shù)的增加，導致識別時間相應地變長。

導航系統(tǒng)語音提示的實現(xiàn)方案

導航系統(tǒng)的語音提示由專門的語音合成子系統(tǒng)完成。將語音提示的實現(xiàn)過程分為提出請求和執(zhí)行請求兩步。請求的提出方和執(zhí)行方構(gòu)成客戶/服務器(C/S)模型，其中，語音合成子系統(tǒng)充當服務器。由于語音合成引擎通常不能同時輸出多線合成的語音，所以會遇到請求沖突的情況。發(fā)生請求沖突時，最直接的處理策略是：中止正在進行的合成轉(zhuǎn)而進行下一個合成，或者維持正在進行的合成而忽略新的合成請求。為此在語音合成子系統(tǒng)中設(shè)計了管理模塊用于決定發(fā)生合成沖突時的處理方式。

對于語音合成子系統(tǒng)，合成請求的提出是一個隨機事件，將這類隨機事件記為Qi。每個合成請求Qi都具有優(yōu)先級的屬性，其優(yōu)先級的高低取決于請求的提示信息的重要程度，見表1。管理模塊的處理流程見圖6。如果下一請求Qi+1的優(yōu)先級高于當前請求Qi，則優(yōu)先合成Qi+1。

圖片6.png

圖6 合成子系統(tǒng)優(yōu)先級管理程序流程

表1.png 表2.png

車載語音導航系統(tǒng)的試驗驗證

圖7為本文的車載語音導航系統(tǒng)的實物照片。對本系統(tǒng)進行了語音導航的驗證試驗，通過語音交互完成了表2中所示的車載導航功能。試驗表明，系統(tǒng)的狀態(tài)能夠完全正確地按照設(shè)計的對話模式進行轉(zhuǎn)換，并能正確完成各種導航功能的人機對話過程；同時，系統(tǒng)的語音提示也能正確工作。

圖片7.png

圖7 車載語音導航系統(tǒng)

另外測試了系統(tǒng)正確響應語音控制命令的能力。測試中，用清晰平穩(wěn)的語音，對地圖瀏覽狀態(tài)所有語音控制命令的49個識別詞進行了測試，共測試49

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 0705_A 車載語音導航 汽車電子 人機語音交互 語音識別 雜志_技術(shù)長廊 汽車電子

評論

相關(guān)推薦

村田汽車電子元件技術(shù)交流會現(xiàn)場視頻2

視頻 Murata 汽車電子 | 2008-08-22

大聯(lián)大汽車技術(shù)應用路演重慶場圓滿落幕

汽車電子大聯(lián)大汽車電子 | 2024-06-14

汽車電子密碼鎖

設(shè)計方案汽車電子密碼鎖 | 2009-07-06

村田汽車電子元件技術(shù)交流會現(xiàn)場視頻3

視頻 Murata 汽車電子 | 2008-08-22

汽車電子密碼鎖電路

設(shè)計方案汽車電子密碼鎖 | 2009-08-17

altera的汽車電子的參考設(shè)計

資源下載 altera 汽車電子參考設(shè)計 | 2007-12-12

中國汽車電子半導體器件市場快速增長

hpnet | 2003-11-10

Canalys：2025～2026 年，L2+ 輔助駕駛滲透率 9.3%、L3 達 4.6%

汽車電子汽車電子輔助駕駛 | 2024-07-04

[推薦]2004年汽車電子產(chǎn)業(yè)趨勢研討會

mmm_y | 2004-12-13

2005年汽車電子高級研討會演講稿下載

jackwang | 2005-09-23

調(diào)查——搞汽車電子的請報道。

jackwang | 2003-11-21

韓國計劃開發(fā)高性能通用自動駕駛芯片，算力可達 1000TOPS

汽車電子韓國汽車電子自動駕駛芯片 | 2024-05-08

村田汽車電子元件技術(shù)交流會現(xiàn)場視頻4

視頻 Murata 汽車電子 | 2008-08-22

Maxim 帶汽車電子卸載保護的升壓LED 驅(qū)動器

設(shè)計方案 Maxim 汽車電子卸載保護升壓驅(qū)動器 | 2009-07-27

走進臨港新片區(qū)之國際汽車電子企業(yè)交流會成功舉辦

汽車電子安富利臨港汽車電子 | 2024-05-24

直播預告 | 從汽車到智能家居，干簧傳感器如何發(fā)揮其核心作用？

汽車電子斯丹麥德汽車電子智能家居干簧管 | 2024-05-20

淼鑠實業(yè)做好扎實服務深耕汽車電子電器

元件/連接器汽車電子淼鑠實業(yè) 上海慕尼黑電子展 | 2024-07-19

汽車電子儀表冷卻液溫度表、機油壓力表電路圖

設(shè)計方案汽車電子儀表冷卻溫度表機油壓力表電路圖 | 2010-08-31

PID控制及其在車輛上的應用

資源下載 PID PID控制汽車電子 | 2007-12-29

2004年汽車電子高級技術(shù)研討會演講稿下載??！

jackwang | 2004-11-29

村田汽車電子元件技術(shù)交流會現(xiàn)場視頻5

視頻 Murata 汽車電子 | 2008-08-22

魯棒控制系統(tǒng) 課件

資源下載汽車電子魯棒性能直升機系統(tǒng) Furuta擺 | 2007-12-29

電視機智能聲控選合系統(tǒng)設(shè)計與實現(xiàn)

資源下載語音識別彩電遙控智能聲控選臺 | 2007-02-16

大聯(lián)大汽車技術(shù)應用路演重慶場：探索新能源汽車技術(shù)的未來

汽車電子大聯(lián)大汽車電子 | 2024-06-18

555實用汽車電子點火器電路

設(shè)計方案實用汽車電子點火器 | 2009-07-06

新一代語音識別：可徹底改變車內(nèi)體驗的技術(shù)

汽車電子語音識別生物識別人工智能 | 2024-07-18

芯熾科技發(fā)布革新性MIPI A-PHY SerDes芯片組，驅(qū)動車載與長距視頻傳輸技術(shù)邁入新紀元

汽車電子汽車電子，解串器，芯熾 | 2024-07-12

德州儀器閃耀上海慕展三大板塊更顯產(chǎn)品實力

模擬技術(shù) 德州儀器慕尼黑電子展汽車電子機器人能源 | 2024-07-15

村田汽車電子元件技術(shù)交流會現(xiàn)場視頻1

視頻 Murata 汽車電子 | 2008-08-13

汽車電子的串口通V3.20

資源下載汽車電子串口通 | 2008-01-16

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();