聲控技術車載化推動車聯(lián)網發(fā)展
人類技術文明的發(fā)展史過程中,始終伴隨著感知和肢體的延伸與解放,從結繩記事到視頻電話、從老馬識途到衛(wèi)星導航、從烽火狼煙到智能交通等等,人類的肢體及其感知系統(tǒng)在不斷拓展自身的影響范圍,而在此過程中,信息流向也從簡單到復雜、由單向傳遞變?yōu)殡p向互動?;贗nternet互聯(lián)網技術實現(xiàn)了人的思想聯(lián)網,進而引發(fā)了人類史上空前的信息大爆炸,而作為人類肢體的附屬或衍生物,汽車及其聯(lián)網工程毫無疑問會給人類拓展肢體空間帶來更大的變化。在車聯(lián)網技術的一端,從國內熱炒語音導航開始,人們已經意識到在車聯(lián)網時代,“動嘴”遠比“動手”更為快捷。沿著這種用嘴導航的思路,在車載主機領域全面實現(xiàn)聲控技術,改革人機對話模式,從技術端提高車聯(lián)網終端設備的使用效率和用戶黏度,逐漸成為推動車聯(lián)網發(fā)展的重要環(huán)節(jié)。
聲控操作的優(yōu)劣勢分析
聲控技術對車載主機的貢獻率究竟有多高不好斷言,如果換句話說,車載主機的接觸式操作和非接觸式操作哪種更適合車載使用,可能很多從事車載主機行業(yè)的人會猛然驚醒。目前絕大多數車載主機都通過按鍵、旋鈕、觸摸屏等接觸式操作實現(xiàn)功能,這類物理接觸和按鍵、旋鈕及觸摸屏的物理使用極限有很大關系,如按鍵、旋鈕的阻尼、觸摸屏的壽命等等。在通常使用壽命范圍內,一臺處于正常工作狀態(tài)的車載主機,每一個功能實現(xiàn)都伴隨著很大的誤操作風險。在提升功能操控效率方面,以導航廠家為首的企業(yè)正在謀求更高效的方式。目前車載主機操控中普遍存在的事實是,當車輛處于行駛狀態(tài)時,我們要改變導航路徑時,就需要手動觸摸屏幕設定目的地、路徑等等信息,特別是在目的地輸入時,系統(tǒng)不能辨識的幾率很高。這種情況普遍存在于收音機、DVD、藍牙等主要車載主機功能中,盡管我們設置了很多快捷方式,如導航路徑記憶、收音機存臺、藍牙匹配記錄等個性化操作方式,從長遠來看,這些快捷方式并不能包打天下,也正因為如此,在車載主機的操作方式上,缺乏革命性的產品。
由于觸摸靈敏度問題和菜單之間的距離問題,誤操作的煩惱總會煩擾著車主。此外,任何一臺車載主機,都有使用壽命,其按鍵也會隨著時間和應用次數的增加而靈敏度降低,一旦遇上按鍵失靈,得費多番周折才能重新使用。
客觀而言,對于車載主機來說,聲控技術是一項具有革命性的先進技術,但不可否認的是,聲控技術畢竟使用的是非接觸式操作方式,其傳輸方式受傳輸介質影響,在無線傳輸時的合成質量不是很好,尚需進一步提高。在實驗室測試時效果可能頗為良好,但在背景噪音較大,尤其是車內使用時,識別率不高的問題就出現(xiàn)了,此外,還有其它方面的因素影響著聲控功能的發(fā)揮。
毫無疑問,使用環(huán)境是影響聲控功能最直接的原因之一。一般來說,安靜環(huán)境下,聲控識別系統(tǒng)能表現(xiàn)出良好的識別效果,具有較高的識別能力,但到了嘈雜的環(huán)境下,聲控功能的效果會不斷下降,并且伴隨著噪音的不斷增加,識別率會大大降低,導致不能正確識別。此外,聲源的距離也會使識別效果大打折扣。此處所言音源并非指主機,而是指人的嘴巴,所謂聲源距離則表示嘴巴與車載主機拾音孔之間的距離。我們首先借鑒一下一些智能手機的語音識別效率。一般情況下,人們在使用手機時,通常都會嘴巴對著話筒進行通話,此時手機和嘴巴之間的距離保持在10厘米以內,聲控在這個距離下功能可以發(fā)揮出最佳效果,但是隨著聲源距離的不斷增加,語音識別率會明顯降低,尤其在操作的環(huán)境中,更不能令人滿意。由此可見,在車內,車載主機和聲源之間的距離一般在60厘米左右,如何解決這個距離帶來的音頻在傳輸過程中的能量損耗,從而導致聲控設備不能識別是個大問題。
最后一個影響因素歸結于聲源的屬性。所謂聲源的屬性應該是用戶說話的方言、語音、語調以及語速等,不同的屬性會對聲控功能產生不同的影響。在語言方面,由于車主地域特征比較明顯,通常有標準普通話和方言普通話之分,在標準普通話下手機的語音識別率將會有較高的穩(wěn)定性,而方言普通話語音識別率相對要差得多。當然在語速、語調方面,不同廠商的聲控技術在這些方面的影響也是不一樣的。
聲控技術車載化
從2010年到2011年底,車載主機從硬件和軟件方面都發(fā)生了巨大變化,市場進一步甩開膀子在差異化的道路上前進,從硬件方面看,車載主機的平臺不再是WinCE一統(tǒng)天下,Android等平臺開始加入車載主機,并且延續(xù)手機領域的迅猛勢頭;從軟件方面看,聲控技術加盟車載主機已經在小范圍內成為共識,已有多家廠商開始進行量產或預研。
從目前的產品形態(tài)來看,完全應用聲控技術的車載主機尚未出現(xiàn),目前的車載主機聲控系統(tǒng)只是作為主機的一個功能賣點,這一方面和廠家的“騎墻心態(tài)”有關,另一方面車載主機能否完全實現(xiàn)聲控化還需要技術和市場雙方去驗證,不可操之過急。從長遠來看,聲控技術會是內核、平臺一輪硬件升級換代之后的又一個熱點。如果從這個角度看,2010年熱炒的“一鍵導航”技術只是聲控技術應用于導航功能的一次“初體驗”,當然這種“初夜”帶給行業(yè)的“快感”余波未平。和“一鍵導航”不同的是,聲控技術體現(xiàn)的更多的是“嵌入式”技術與“云計算”的結合,當然,這和“一鍵導航”所提供的服務在技術上并不沖突。
現(xiàn)在看來,聲控技術車載化帶來的最大好處還是在于讓車主的雙手不要離開方向盤的情況下,實現(xiàn)主機的功能操控。也許,這個技術可以給車載主機普遍返修率居高不下帶來意想不到的好處,當然,潛在的風險也是非常高的,最大的問題還是識別率。如何解決在噪雜行駛狀態(tài)下車載主機可能出現(xiàn)識別率不高的情況?根據前裝及后裝市場上曾出現(xiàn)過過的解決方案,兩種辦法可能會對解決這個問題有所幫助,一是采取類似廣本鋒范高配版將藍牙安裝在駕駛位一側A柱上的解決思路,這樣縮短了聲源與車載主機拾音孔之間的距離;另一種解決辦法是將第一種辦法更進一步,每個車載主機直接配備一個無線藍牙,通過無線藍牙將手機、車載主機三者結合起來。
從2012年市場熱點看,聲控技術成為新一輪熱點已經不可逆轉,市場需要新技術、新概念重拾增長勢頭。在這種背景下,車載主機行業(yè)和相關的產業(yè)的整合、融合趨勢也開始顯現(xiàn),如基于云計算的各種數據交換服務、Android等開放平臺的應用共享等等。如果說之前車載主機還是一個小眾行業(yè),其產業(yè)鏈外延較短,那么隨著平臺、技術以及車聯(lián)網等多項技術的催化,車載主機越來越表現(xiàn)為一個開放性的產業(yè)?;貧w聲控技術本身,其能否成為推動車載主機車聯(lián)網的關鍵一環(huán),還存在諸多不確定因素,盡管有很多聲控相關產品及項目獲得了成功,但更多線下線上的配套服務需要完善。
正是因為接觸式操作的這些問題的存在,才讓非接觸式操作方式的優(yōu)勢凸顯出來,目前非接觸式操作較為成熟的當屬聲控技術。由此,我們也能很好理解為何采用非接觸式操作會有更大使用優(yōu)勢,車載主機內部的聲音識別系統(tǒng)屬于硬設備,相對軟件和外設(屏幕、按鍵等)具有更強的耐用性,因此,只要懂中文和發(fā)音基本準確,車載主機內部的聲音識別系統(tǒng)就能較高的識別車主需求。當然,聲控技術應用于車載主機初期,肯定會出現(xiàn)識別率不高等現(xiàn)象,但隨著競爭的出現(xiàn),相應的聲音識別技術肯定會有較大的突破,從而提高車載主機聲音識別的靈敏度。
聲控技術的瓶頸
任何一項技術的出現(xiàn),雖然相比它所取代的技術可能具有壓倒性的優(yōu)勢,但并非該技術就是最優(yōu)化的選擇,對于聲控技術而言,這個論斷同樣成立。從聲控技術面世到開始進入車載主機行業(yè),已經走過近20個年頭,不可謂快,但總算不慢,起碼不晚。
根據市場上了解到的幾家車載主機聲控功能及其實際表現(xiàn)而言,主要問題集中于使用環(huán)境方面,技術本身沒有問題。
評論