語音識別的金礦在發(fā)展中國家
據(jù)國外媒體報道,雖然人工智能機(jī)器人和自動駕駛汽車可能成為未來的頭條新聞,但谷歌搜索負(fù)責(zé)人本·戈麥斯(Ben Gomes)表示,技術(shù)領(lǐng)域的下一個重大飛躍將是語音服務(wù)的進(jìn)步。戈麥斯表示,更好地理解通用語言對互聯(lián)網(wǎng)的未來發(fā)展至關(guān)重要。
本文引用地址:http://www.ex-cimer.com/article/201809/392297.htm戈麥斯說:“語音識別和對語言的理解是未來搜索和信息的核心。但是有很多難題,比如理解引用語是如何起作用的,理解‘他’、‘她’或‘它’在句子中指的是什么。在語音服務(wù)角度,這只是其面臨的數(shù)以百萬計的問題之一。
9月24日是谷歌成立二十周年之際,而戈麥斯在接受《衛(wèi)報》采訪時發(fā)表了上述言論。而在七年前,谷歌面向公眾推出了其第一個語音服務(wù),也就是一個簡單的將語音轉(zhuǎn)換成文字的搜索工具。
如今,語音識別已經(jīng)成為谷歌搜索和人工智能語音助手的一部分。谷歌的人工智能語音助手嵌入了全球數(shù)十億部智能手機(jī)中,相應(yīng)的語音識別技術(shù)在識字率低的發(fā)展中國家顯得尤為重要。
“對我們來說,語音識別看來似乎是一項先進(jìn)技術(shù),但在印度這樣的國家似乎是一項基本需求,這一點(diǎn)并不明顯。因此,這在某種程度上改變了人們的看法。”出生于坦桑尼亞并在印度班加羅爾長大的戈麥斯說。
“發(fā)展中國家的許多語言從未真正擁有過我們所常見的鍵盤——我學(xué)了10年印地語,但我不知道如何打字——所以語音比打字更容易使用。”
谷歌理解語言的嘗試并不新鮮。在破解了這些基礎(chǔ)知識之后,谷歌從2000年開始進(jìn)行拼寫校正,接著又加入了戈麥斯所稱的“語言軟化”技術(shù)。
“你可以把最初的搜索引擎想象成尋找有嚴(yán)格定義的單詞——這是你輸入的確切單詞,我會試著在文檔標(biāo)題中找到它?!?/p>
“但是人們在了解某個領(lǐng)域時會使用一種語言組織形式,而在他們不了解這一領(lǐng)域時會使用另一種語言組織形式。在英語中,我們通常將其視為同義詞,但它是一種特殊的同義詞。”
例如,人們可能會搜索“我如何改變顯示器的亮度”,使用像“改變”這樣的通用詞,因為他們不知道更具體的詞。但那些對該領(lǐng)域有更多了解的人會在查詢和文檔中使用“調(diào)整”一次。要為用戶找到正確的文檔,您需要將專業(yè)領(lǐng)域的術(shù)語注入到他們的查詢中,這種效果讓谷歌花了五年時間開發(fā)完成。
許多難題阻礙了計算機(jī)在人類層面上真正理解語言,但對于戈麥斯來說,未來在于“語言勇于查找信息將變得更容易”。
“你可以用更復(fù)雜的方式提出更復(fù)雜的問題。實際上你可以和谷歌進(jìn)行對話。”
評論