AI大航海時代,對話機器人如何引領(lǐng)交互方式變革
自計算機出現(xiàn)以來,人機交互界面經(jīng)歷了命令行到圖形化界面的更新迭代,而隨著人工智能(AI)在生活中的逐漸普及和應(yīng)用,例如蘋果的Siri、亞馬遜的Alex,甚至是京東的JIMI已經(jīng)紛紛闖入我們的生活,我們現(xiàn)在正在經(jīng)歷從圖形化界面向?qū)υ捠浇缑娴募夹g(shù)變革時刻,而這其中,對話機器人的發(fā)展將會是一個關(guān)鍵點。
本文引用地址:http://www.ex-cimer.com/article/201801/374486.htm圖形化界面VS對話式界面
比較一下圖形化界面和對話式界面,主要有以下四點差異:
1)圖形化界面是二維的,更加重視廣度;對話式界面是一維的,更加注重深度,用戶可以更專注于一件事情上。
2)圖形化界面更加注重空間感,主次關(guān)系也要通過顏色和距離感來實現(xiàn)差異化,這是圖形化界面設(shè)計時的一個原則;對話式界面更加強調(diào)的是時間感,例如剛剛討論的話題,過一段時間討論同樣的話題就不太重要了。
3)圖形化界面更加強調(diào)共性,就用戶體驗來看,在圖形化界面,同一個系統(tǒng)中每個人看到的東西都差不太多;對話式界面則更強調(diào)個性,我們每個人的對話內(nèi)容都是不一樣的,對話機器人和我說的話應(yīng)該和另外一個人說的話不一樣,更加偏個性一些。
4)圖形化界要求比較穩(wěn)定,用戶希望不要天天改版;對話式界面則是進(jìn)化的,用戶更希望說過的話不需要一遍一遍地再去重復(fù)。
由此可見,在更注重個性化和精準(zhǔn)度的當(dāng)下,對話式界面顯然更符合用戶需求。
對話機器人分類
對話機器人根據(jù)應(yīng)用場景不同主要可以分為三類:個人信息助理、聊天機器人和客服導(dǎo)購機器人。
個人信息助理是用對話形態(tài)做人機交互比較好的應(yīng)用場景,同時由于基本上都是由行業(yè)巨頭在做的,例如蘋果、谷歌、亞馬遜等,因而發(fā)展速度較快,應(yīng)用也比較多。愛因互動CTO洪強寧先生介紹稱,其實,這一領(lǐng)域也確實應(yīng)該由巨頭來做,因為入口是個人信息助理最核心部分,要想將其做好,就要能夠?qū)崿F(xiàn)快速調(diào)動,而最好的入口資源大部分都是掌控在巨頭手中的。同時,隨著技術(shù)飛速發(fā)展,也有很多不同技術(shù)在個人信息助理中應(yīng)用來提升其用戶體驗,預(yù)計一兩年后,大家會比較習(xí)慣用個人信息助理,例如智能手機、智能手表及家里的智能音箱。
聊天機器人相對于另外兩類對話機器人較為簡單,這類機器人并不能完成具體某項任務(wù),主要用作心理陪伴和娛樂。針對這類對話機器人,對話輪次是一個比較重要的技術(shù)指標(biāo),能夠與用戶進(jìn)行自然對話輪次越多,時間越長,可以說機器人的能力就越好。目前來看,業(yè)內(nèi)最好的聊天機器人能夠與人類自然對話二十多輪,再往后聊,你就能夠發(fā)現(xiàn)它跟不上人類的思維了。目前應(yīng)用在聊天機器人上比較好的技術(shù)是seq2seq算法,為了提高其在聊天中的應(yīng)對能力,還需要使用諸多增強技術(shù),例如為聊天機器人注入背景信息、個人信息、知識庫信息,并引入上下文等。
客服導(dǎo)購機器人是為了完成一件事情與機器人溝通,最后能夠達(dá)到某種目的。在這種應(yīng)用場景中,尤其是在做售前應(yīng)用時,主要有三種主要的對話形態(tài):人主導(dǎo)的形態(tài),即人問一個問題,機器回答一個問題;機器人主導(dǎo)形態(tài),即機器人問人問題,人來回答;交叉主導(dǎo)形態(tài),即人問一個問題,機器人發(fā)現(xiàn)不知道該怎么答,會反問一句,人回答了機器人的問題之后,機器人再給出答案。大體上可以分成這三種形態(tài),很多其他復(fù)雜的對話則是由這三種形態(tài)反復(fù)切換來實現(xiàn)。其中人主導(dǎo)的形態(tài)是最簡單的形態(tài),也是目前在商業(yè)應(yīng)用中最為成熟的形態(tài)。
作為AI領(lǐng)域重要重要內(nèi)容之一,對話機器人有怎樣的技術(shù)要求?需要怎樣的工程團(tuán)隊?初創(chuàng)企業(yè)又該怎樣入局?近日,《電子產(chǎn)品世界》編輯在“AI時代的移動技術(shù)革新”大會上采訪了愛因互動CTO洪強寧先生。
語音市場發(fā)展趨于成熟,創(chuàng)業(yè)公司更應(yīng)關(guān)注語義
電子產(chǎn)品世界:在對話機器人領(lǐng)域,創(chuàng)業(yè)公司應(yīng)該怎樣選擇切入點?
洪強寧:語音轉(zhuǎn)文本和文本轉(zhuǎn)語音,現(xiàn)在都有比較專業(yè)的公司在做,而且很多企業(yè)做得已經(jīng)很好了,對于創(chuàng)業(yè)公司而言,我們覺得現(xiàn)在再去做語音就是技術(shù)的浪費了,而更應(yīng)該將資源用到像語義這樣發(fā)展還不是很完備的方向。
現(xiàn)在在做語義的大概有兩種形態(tài):一種形態(tài)是做基礎(chǔ)語義服務(wù)的,并不在乎具體的應(yīng)用場景,例如情感探測、實體抽取等;另外一種是做應(yīng)用場景的,像我們是在考慮機器人在具體應(yīng)用場景下該怎樣去回答問題,和場景與行業(yè)聯(lián)系的非常緊密。
在真實的應(yīng)用場景中,需要用到語音識別的時候,我們會調(diào)用第三方的服務(wù)來生成文本,例如科大訊飛等廠商的語音識別做得已經(jīng)很好了,我們可以直接使用他們的技術(shù)完成前面語音識別部分,而從文本理解是什么含義的時候則是用到我們自己的技術(shù),因為這項技術(shù)還沒有一家公司聲稱做出了一個任何場景都可以使用的平臺,針對售前對話機器人,我們的技術(shù)效果是更好的;同時,這也是我們的核心競爭力和技術(shù)壁壘,我們需要在這上面去深入研究。
機器人服務(wù)平臺要先做專用領(lǐng)域
電子產(chǎn)品世界:如何理解現(xiàn)在的通用機器人服務(wù)平臺和專用機器人服務(wù)平臺?
洪強寧:工程團(tuán)隊的一個非常大的產(chǎn)出是在機器人服務(wù)平臺上,但是創(chuàng)建對外開發(fā)的機器人服務(wù)平臺目前從商業(yè)上看還不是一個好的時機,因為現(xiàn)在對話機器人仍然是和場景緊密結(jié)合的,現(xiàn)在還不太可能脫離場景去搭建一個通用的機器人服務(wù)平臺。
實際上,前兩年已有通用的機器人服務(wù)平臺出現(xiàn),但是效果都不是很好。因而我們更加傾向于做行業(yè)專用的平臺,先使機器人服務(wù)平臺在售前應(yīng)用中用起來效果非常好,之后再在這個基礎(chǔ)上做泛化,做到其他場景中去。
現(xiàn)在我們正在規(guī)劃一個大的機器人服務(wù)平臺,這個是一個工程化的事情,需要做云平臺、PAAS架構(gòu),需要在服務(wù)功能飛速增長的時候有一個非常好的、穩(wěn)定的服務(wù),能夠包括像大數(shù)據(jù)處理等。這個機器人服務(wù)平臺是我們內(nèi)部自己用的,是為了加快算法調(diào)優(yōu)的速度,使算法工程師不再需要去關(guān)心一些工程上的技術(shù)細(xì)節(jié),更專注到算法調(diào)優(yōu)本身。
對話設(shè)計師將會成為新崗位
電子產(chǎn)品世界:AI創(chuàng)業(yè)公司更需要怎樣的人才,對工程團(tuán)隊有怎樣的要求?
洪強寧:對于AI創(chuàng)業(yè)公司來說,更需要的是項目落地人才,即能夠把AI的技術(shù)應(yīng)用到具體場景中的人才。如果是純研究算法的人,對于高校或者是研究院會更小,而對于創(chuàng)業(yè)公司則會更關(guān)注落地的能力,我們追求的是效果,而不是炫酷的技術(shù),有的時候會發(fā)現(xiàn)深度學(xué)習(xí)的效果還不如一些傳統(tǒng)方法的時候,我們也會選擇傳統(tǒng)的方法。
同時,工程團(tuán)隊也需要懂AI算法。工程團(tuán)隊如果完全不懂算法的話是無法和算法工程師進(jìn)行配合的,工程團(tuán)隊做的很大一部分是建立機器人服務(wù)平臺,算法工程師是平臺的用戶,因而工程團(tuán)隊需要知道算法工程師需要的東西是什么,從而給他們提供好用的工具,也需要了解AI是怎么做的,至少需要知道數(shù)據(jù)是怎樣組織的、訓(xùn)練是怎么一回事、模型是怎么加載的,在這些地方,哪些是性能的瓶頸,這都需要工程團(tuán)隊的工程師完全了解的。
電子產(chǎn)品世界:做對話機器人的公司相對于其他AI行業(yè)會有怎樣的特別需要?
洪強寧:在對話機器人領(lǐng)域,產(chǎn)品經(jīng)理有一個很重要的工作職責(zé)是做對話設(shè)計,這個也可能是未來可能產(chǎn)生的一個新崗位?,F(xiàn)在對話機器人的技術(shù)還做不到完全像人一樣溝通,這個崗位要考慮的是當(dāng)機器和人對話的時候,如何設(shè)計機器人的語言,使整個對話變得更自然,這個技術(shù)在真實落地的應(yīng)用中是一件很重要的事情。
AI人才緊缺現(xiàn)狀與高薪資現(xiàn)狀
電子產(chǎn)品世界:如何理解AI人才緊缺和高薪資這一現(xiàn)狀?
洪強寧:掌握新技術(shù)的人就是整個社會的推動力,社會也一定對這種人才的需求是非常旺盛的。其實我們現(xiàn)在身處第四次工業(yè)革命的開始階段,在變革的早期,這樣的人才很少,掌握這類技能的人才被市場爭搶在所難免。在任何技術(shù)早期,你掌握了這項技術(shù),薪資都會相對較高,但是同時也會有這樣一個趨勢:AI技術(shù)越來越成為程序員一個基礎(chǔ)技術(shù)。例如谷歌在面試程序員的時候,不論你面試的是哪個崗位,都會考察你的AI能力。
這就類似云計算的發(fā)展,云計算發(fā)展這么多年,現(xiàn)在工程師如果不懂云計算的基礎(chǔ)知識就不是一個合格的程序員。未來,十年以后,如果不懂得AI的工程師就不是一個合格的程序員。隨著掌握AI技術(shù)的人群越來越多,薪資水平也將會逐漸回到一個相對合理的狀態(tài)。
AI創(chuàng)業(yè)公司與大公司競爭的優(yōu)勢
電子產(chǎn)品世界:與大公司相比,創(chuàng)業(yè)公司有哪些競爭優(yōu)勢?
洪強寧:相比巨頭公司,創(chuàng)業(yè)公司動作更快,關(guān)注點更超前。創(chuàng)業(yè)公司更多專注于場景,而對于單個場景的投入,大公司往往是不足的,只有可能觸及到平臺利益時,大公司才會投入大量資源與創(chuàng)業(yè)公司競爭,而只要創(chuàng)業(yè)公司在這之前建立起很好的競爭壁壘,是不害怕這樣的競爭。
AI行業(yè)其實一個很好的范例,AI行業(yè)需要的是數(shù)據(jù)的積累,而不論是大公司還是小公司都需要時間的積累收集數(shù)據(jù)和處理數(shù)據(jù),例如收集數(shù)據(jù)、清洗數(shù)據(jù)、理解數(shù)據(jù)以及結(jié)合應(yīng)用場景的過程,而這些都需要時間和經(jīng)驗的積累,并不是說大公司會比小公司擁有有更多的競爭優(yōu)勢。
對話機器人的準(zhǔn)確率評判指標(biāo)
電子產(chǎn)品世界:如何評判對話機器人的準(zhǔn)確率,現(xiàn)在對話機器人準(zhǔn)確率是多少?
洪強寧:對話機器人大概可以分為兩類:閑聊機器人和任務(wù)導(dǎo)向機器人。對于閑聊機器人,對話輪次是一個評價指標(biāo),時間越長,機器人做的就越好;而對于任務(wù)導(dǎo)向機器人,主要有兩個評價指標(biāo):任務(wù)完成率和攔截率。
對于任務(wù)導(dǎo)向機器人,我們是希望他可以幫我辦事的,這個時候,對話輪次就不再是一個很好的指標(biāo),相對短的輪次反而會更好;針對此類機器人,單輪對話會有準(zhǔn)確率的概念,具體指機器人對用戶提問響應(yīng)是否正確就是準(zhǔn)確率,此時任務(wù)完成率會作為核心指標(biāo)。
而有些準(zhǔn)確率的數(shù)據(jù)是不可信的,例如機器人自己對自己作出決策和評價,即攔截率。這是指你說的話,機器人覺得可以回答的比率;而準(zhǔn)確率是指我答了,而且還答對的比率。因而準(zhǔn)確率是要比攔截率要低一些的。
現(xiàn)在的準(zhǔn)確率還是要人來判斷的,而為了降低工作量,機器人可以先做一個預(yù)判,然后人再做更正。針對對話機器人,具體準(zhǔn)確率要分應(yīng)用場景,越復(fù)雜、用戶說的話越發(fā)散,準(zhǔn)確率會越低, 大體上應(yīng)該會在百分之七十多到百分之九十多之間波動。 如果是單輪問答,主要還會取決于知識庫的建立情況,一般在百分之八十多到百分之九十多之間波動。
對話機器人要達(dá)要到人的平均水平,至少還要十年
電子產(chǎn)品世界:當(dāng)下很多智能產(chǎn)品并不夠智能,對話機器人也還處在“低配智能”階段,還要多久我們才能到達(dá)“高配智能”階段?
洪強寧:現(xiàn)在對話機器人,甚至AI還處在早期大航海時代,大家都在嘗試在各種應(yīng)用場景下使用這個技術(shù),根據(jù)反饋去優(yōu)化和調(diào)整。我們會全力以赴地關(guān)注用戶的反饋,快速更新技術(shù),并不斷完善我們的產(chǎn)品。
就智能的程度而言,現(xiàn)在確實是受限的,不光是對話機器人,整個AI行業(yè)都存在這個問題,不管是深度學(xué)習(xí),還是傳統(tǒng)機器學(xué)習(xí)方法,都面臨著準(zhǔn)確率不為100%的現(xiàn)狀。通過學(xué)習(xí)大量的現(xiàn)有知識,然后生成一個模型,用這個模型去匹配現(xiàn)有的知識,預(yù)測之后的輸入可以給出一個怎樣的輸出,這樣的一個模型永遠(yuǎn)都會與真實模型有一定的誤差。雖然可以用深度學(xué)習(xí)的方法不斷增加學(xué)習(xí)信息,準(zhǔn)確率會越來越高,但永遠(yuǎn)都無法達(dá)到100%。
我們并不能期望對話機器人不出錯,要期望的是對話機器人出的錯要比人少。我覺得現(xiàn)在談像人一樣的對話機器人還尚早,至少還要兩三年,對話機器人在某些特定場景能夠達(dá)到人的平均水平;而要談通用對話機器人能夠達(dá)到人的平均水平,甚至在某些特定場景超越人類,至少還要十年之久。
評論