智能手機的超性能語音識別技術簡介
未來的方向 本文引用地址:http://www.ex-cimer.com/article/165434.htm
詢問參加開發(fā)語音技術的每一個人下一個巨大的步驟是什么。他們一般會給你一個答案:自然語言處理。
Revis把它解釋為理解你的意思的系統(tǒng),它不僅僅知道你說什么。在會話式的互動模式中,用戶說自己要說的話,沒有限制用戶如何說這個話。他提供了指令或者要求得到信息的例子,如“我在什么地方能夠買到100美元以下的尼康照相機?”或者“給杰尼發(fā)個短信說我晚到20分鐘”或者“今天晚上在Morton's訂三個人的地方”。
谷歌的Mane稱,在口語對話中提供自然的語言處理是一個雙重挑戰(zhàn)。首先,你必須識別這些單詞,然后,你必須理解這個意思。第一部分變得更加容易了。但是,第二部分仍然很難解決:意思是根據(jù)上下文確定的和難以應付的,人類做的語法分析也不是總是成功的。
微軟的Rele認為,手機提供的額外的服務(如羅盤或者GPS)能夠增強自然語言處理的有用性。他說,你可以為兩個人安排吃飯和看電影,方法是利用不同來源的數(shù)據(jù)把這個任務分開,如使用日歷、飯店排名、電影評論和位置等數(shù)據(jù)。
此外,手機的服務能夠用于提供講話的環(huán)境。Rele表示,用戶的語音輸入以及從其它有關用戶及用戶環(huán)境的傳感器和狀態(tài)獲得的智能信息可以提供更豐富的和更相關的結果。例如,如果你剛剛使用Foursquare網站查看有關飯店,一些含糊的語音指令就會傾向于外出吃飯、訂膳宿和要一輛出租車等事情。
多平臺應用程序Vlingo自稱是“虛擬助手”,已經能夠提供這些方面的功能。這個軟件插入到OpenTable和Fandango等服務中以完成許多任務:訂飯店、訂電影票等等。
Nguyen認為未來語音識別技術改善的另一個領域是游戲。他說,在游戲中可以使用語音以增加玩游戲的不同氛圍。例如,你可以把Kirk-style船長的命令傳遞給恒星飛船或者在在一個神秘的事情中審訊疑犯。
是你嗎?
已經應用的另一個功能是自動地把語音識別適用于單個用戶。這是臺式電腦語音識別技術所要求的免提版語音訓練。
例如,最新版本的谷歌語音搜索有一個選擇性加入功能,允許隨著時間的推移建立一個用戶的客戶化語音特征。Mane解釋說,當用戶選擇使用客戶化語音識別的時候,我們在用戶和用戶的語調方面畫一個界限,這使我們能夠建立一個初步的、個性化的語音識別模式。
然而,個性化識別并不是一個能夠解決一切問題的技術,它只是實現(xiàn)語音識別更加無縫化的一個過渡步驟。Mane稱,我們沒有把個性化識別看作一個唯一的解決方案,因為還會有更多的一系列的技術創(chuàng)新。Mane認為,這種技術未來的改進需要我們的用戶更積極的參與。
結論
手機一直是許多技術的孵化器和推動因素,這包括硬件和軟件技術。到目前為止,在這個組合中增加語音功能僅產生了逐步的改善,谷歌語音應用程序的很好的功能。
但是,這些改進正逐步地為更重要的進步鋪平道路。移動技術為如何聚集這些新技術提供了一個全新的舞臺。下一步也許不是一個理解你說的一切事情的手機,而是能夠充分理解你說的事情的一個更有用的手機。
評論