人工智能關(guān)鍵技術(shù)決定機器人產(chǎn)業(yè)前途
關(guān)鍵技術(shù)與挑戰(zhàn)
本文引用地址:http://www.ex-cimer.com/article/201807/383277.htm可以預(yù)見,未來服務(wù)機器人有不少有趣的應(yīng)用,但從技術(shù)實現(xiàn)的角度看還存在諸多挑戰(zhàn)。
前面提到過機器人的三大技術(shù)領(lǐng)域,包括感知、認(rèn)知和行為控制。其中行為控制技術(shù)相對來說,已經(jīng)有不少技術(shù)積累。而對于在不久的將來可以實際大規(guī)模應(yīng)用的服務(wù)機器人,將會更偏向于發(fā)展低成本的機器人。諸如機械結(jié)構(gòu)比較簡單的輪式機器人(只有輪式移動平臺加上一個可活動的頭,一般沒有手臂或者手臂比較簡單),由于其控制部分較為簡單,因此在感知和認(rèn)知方面的技術(shù),顯得尤為重要。根據(jù)以往機器人領(lǐng)域的研究進展和對應(yīng)用的初步分析可以認(rèn)為如下的感知、認(rèn)知技術(shù),將是實現(xiàn)應(yīng)用的關(guān)鍵。
1、三維導(dǎo)航定位技術(shù)。不管什么機器人,只要可移動,即需要在家庭或其他環(huán)境中進行導(dǎo)航定位。其中SLAM(Simultaneous Localization and Mapping)技術(shù)可同時進行定位和建圖,在學(xué)術(shù)研究方面已經(jīng)有不少技術(shù)積累。但對于實際系統(tǒng),由于實時性低成本(比如無法采用比較昂貴的雷達設(shè)備)的要求和家庭環(huán)境的動態(tài)變化(物品的擺放),因而對導(dǎo)航定位技術(shù)提出了更高要求,仍需進一步研發(fā)。
2、視覺感知技術(shù)。其中包含人臉識別、手勢識別、物體識別和情緒識別等相關(guān)技術(shù)。視覺感知技術(shù),是機器人和人交互的一個非常重要的技術(shù)。
3、語言交互技術(shù)。其中包含語音識別、語音生成、自然語言理解和智能對話系統(tǒng)等。
4、文字識別技術(shù)。生活中有不少文字信息,如書報和物體的標(biāo)簽信息,這也要求機器人能夠通過攝像頭來進行文字識別。與傳統(tǒng)的掃描后識別文字相比,其可通過攝像頭來進行文字的識別。
5、認(rèn)知技術(shù)。機器人需要逐步實現(xiàn)規(guī)劃、推理、記憶、學(xué)習(xí)和預(yù)測等認(rèn)知功能,從而變得更加智能。
從目前的研究現(xiàn)狀看,服務(wù)機器人面對的關(guān)鍵技術(shù)均有了長足進步,但還有相當(dāng)多的問題要解決。
推動技術(shù)的研發(fā)與實際應(yīng)用結(jié)合
英特爾中國研究院的一個重要研究方向是服務(wù)機器人,研究范圍主要包括魯棒的三維導(dǎo)航定位、人和環(huán)境的視覺感知以及人-機器人交互(包含感知、認(rèn)知、行為控制的結(jié)合)等領(lǐng)域,致力于為英特爾的合作伙伴提供先進的服務(wù)機器人技術(shù)。
研究方法以特定的目標(biāo)應(yīng)用領(lǐng)域為出發(fā)點,并以此來推動技術(shù)的研發(fā)和在實際應(yīng)用中的測試。前面提到的助手類應(yīng)用、少兒教育應(yīng)用、老人看護應(yīng)用,是研究重點。
為了進行應(yīng)用測試,英特爾中國研究院建立了實際的機器人硬件原型。左邊是其內(nèi)部結(jié)構(gòu),由一個帶有英特爾Realsense攝像頭的電腦來控制一個全向移動底盤和頭部的轉(zhuǎn)動,其高度可調(diào),以便適應(yīng)成人與兒童的互動要求。
目前研究院已經(jīng)在視覺感知等領(lǐng)域取得了階段性成果。顯示了利用Realsense攝像頭和SLAM技術(shù)生成家庭環(huán)境地圖,這在后續(xù)就可用來定位導(dǎo)航。研究院還開發(fā)了魯棒的跟蹤技術(shù),可在多人同時出現(xiàn)的情況下,長時間正確地跟蹤一個特定用戶。在未來還會研發(fā)出更多相關(guān)技術(shù)和應(yīng)用,這些技術(shù)也將服務(wù)于業(yè)界的合作伙伴助力開發(fā)出先進的服務(wù)機器人產(chǎn)品。
推動技術(shù)的研發(fā)與實際應(yīng)用結(jié)合
對于機器人技術(shù),大家關(guān)心的一個問題是,是否需要采用專用的人工智能芯片。
目前探索的一個方向被稱作混血計算(Hybrid computing),其是指用通用處理器和其他架構(gòu)一起合作來進行計算。不過,還處于早期探索的階段。
一個架構(gòu)是否能成功地應(yīng)用于服務(wù)機器人,需要看性能是否滿足應(yīng)用的需求,功耗等是否合適,這是一個考慮多種因素平衡的選擇。
可以說現(xiàn)在的通用處理器與已有的一些其他計算單元(如向量處理單元、GPU),已經(jīng)可以為服務(wù)機器人提供一個理想的硬件架構(gòu),尤其是多功能的具有感知、認(rèn)知功能的服務(wù)機器人。目前機器人主要的瓶頸,還是在應(yīng)用需求的開發(fā)和感知、認(rèn)知技術(shù)上。當(dāng)然,未來的架構(gòu),也會隨著對應(yīng)用的深入開發(fā)而不斷創(chuàng)新。硬件設(shè)計面臨的挑戰(zhàn)越來越大,需要不斷地適應(yīng)未來發(fā)展的演變。同時也可以考慮用FPGA架構(gòu)來為一些比較專門的應(yīng)用提供加速,這樣在應(yīng)用發(fā)生變化的時候,將具有更多的靈活性。
對于專業(yè)服務(wù)機器人,其應(yīng)用根據(jù)專業(yè)應(yīng)用領(lǐng)域的不同,而有較大區(qū)分。
1、在物流中心進行貨物分發(fā)。據(jù)悉,這項應(yīng)用已開始在亞馬遜等公司實際使用。未來將不斷地升級,如能夠自動取貨等。
2、在零售店,柜臺,前臺等處為客戶服務(wù)。這些服務(wù)機器人能夠和客人打招呼,并回答一些基本問題,還可以幫客戶提包,端茶送水,并為客戶指路。
3、機器人攝影師。機器人攝影師可以不知疲倦地穿梭于賓客之間,幫人們拍出高質(zhì)量的照片。當(dāng)然此功能在家庭服務(wù)機器人上,同樣是個新鮮的功能。
4、智能安防機器人。在一些警力不足的地方,如果有智能安防機器人24小時巡邏,則會有很好的震懾力,減少犯罪的發(fā)生。
關(guān)鍵技術(shù)與挑戰(zhàn)
可以預(yù)見,未來服務(wù)機器人有不少有趣的應(yīng)用,但從技術(shù)實現(xiàn)的角度看還存在諸多挑戰(zhàn)。
前面提到過機器人的三大技術(shù)領(lǐng)域,包括感知、認(rèn)知和行為控制。其中行為控制技術(shù)相對來說,已經(jīng)有不少技術(shù)積累。而對于在不久的將來可以實際大規(guī)模應(yīng)用的服務(wù)機器人,將會更偏向于發(fā)展低成本的機器人。諸如機械結(jié)構(gòu)比較簡單的輪式機器人(只有輪式移動平臺加上一個可活動的頭,一般沒有手臂或者手臂比較簡單),由于其控制部分較為簡單,因此在感知和認(rèn)知方面的技術(shù),顯得尤為重要。根據(jù)以往機器人領(lǐng)域的研究進展和對應(yīng)用的初步分析可以認(rèn)為如下的感知、認(rèn)知技術(shù),將是實現(xiàn)應(yīng)用的關(guān)鍵。
1、三維導(dǎo)航定位技術(shù)。不管什么機器人,只要可移動,即需要在家庭或其他環(huán)境中進行導(dǎo)航定位。其中SLAM(Simultaneous Localization and Mapping)技術(shù)可同時進行定位和建圖,在學(xué)術(shù)研究方面已經(jīng)有不少技術(shù)積累。但對于實際系統(tǒng),由于實時性低成本(比如無法采用比較昂貴的雷達設(shè)備)的要求和家庭環(huán)境的動態(tài)變化(物品的擺放),因而對導(dǎo)航定位技術(shù)提出了更高要求,仍需進一步研發(fā)。
2、視覺感知技術(shù)。其中包含人臉識別、手勢識別、物體識別和情緒識別等相關(guān)技術(shù)。視覺感知技術(shù),是機器人和人交互的一個非常重要的技術(shù)。
3、語言交互技術(shù)。其中包含語音識別、語音生成、自然語言理解和智能對話系統(tǒng)等。
4、文字識別技術(shù)。生活中有不少文字信息,如書報和物體的標(biāo)簽信息,這也要求機器人能夠通過攝像頭來進行文字識別。與傳統(tǒng)的掃描后識別文字相比,其可通過攝像頭來進行文字的識別。
5、認(rèn)知技術(shù)。機器人需要逐步實現(xiàn)規(guī)劃、推理、記憶、學(xué)習(xí)和預(yù)測等認(rèn)知功能,從而變得更加智能。
從目前的研究現(xiàn)狀看,服務(wù)機器人面對的關(guān)鍵技術(shù)均有了長足進步,但還有相當(dāng)多的問題要解決。
推動技術(shù)的研發(fā)與實際應(yīng)用結(jié)合
英特爾中國研究院的一個重要研究方向是服務(wù)機器人,研究范圍主要包括魯棒的三維導(dǎo)航定位、人和環(huán)境的視覺感知以及人-機器人交互(包含感知、認(rèn)知、行為控制的結(jié)合)等領(lǐng)域,致力于為英特爾的合作伙伴提供先進的服務(wù)機器人技術(shù)。
研究方法以特定的目標(biāo)應(yīng)用領(lǐng)域為出發(fā)點,并以此來推動技術(shù)的研發(fā)和在實際應(yīng)用中的測試。前面提到的助手類應(yīng)用、少兒教育應(yīng)用、老人看護應(yīng)用,是研究重點。
為了進行應(yīng)用測試,英特爾中國研究院建立了實際的機器人硬件原型。左邊是其內(nèi)部結(jié)構(gòu),由一個帶有英特爾Realsense攝像頭的電腦來控制一個全向移動底盤和頭部的轉(zhuǎn)動,其高度可調(diào),以便適應(yīng)成人與兒童的互動要求。
目前研究院已經(jīng)在視覺感知等領(lǐng)域取得了階段性成果。顯示了利用Realsense攝像頭和SLAM技術(shù)生成家庭環(huán)境地圖,這在后續(xù)就可用來定位導(dǎo)航。研究院還開發(fā)了魯棒的跟蹤技術(shù),可在多人同時出現(xiàn)的情況下,長時間正確地跟蹤一個特定用戶。在未來還會研發(fā)出更多相關(guān)技術(shù)和應(yīng)用,這些技術(shù)也將服務(wù)于業(yè)界的合作伙伴助力開發(fā)出先進的服務(wù)機器人產(chǎn)品。
推動技術(shù)的研發(fā)與實際應(yīng)用結(jié)合
對于機器人技術(shù),大家關(guān)心的一個問題是,是否需要采用專用的人工智能芯片。
目前探索的一個方向被稱作混血計算(Hybrid computing),其是指用通用處理器和其他架構(gòu)一起合作來進行計算。不過,還處于早期探索的階段。
一個架構(gòu)是否能成功地應(yīng)用于服務(wù)機器人,需要看性能是否滿足應(yīng)用的需求,功耗等是否合適,這是一個考慮多種因素平衡的選擇。
可以說現(xiàn)在的通用處理器與已有的一些其他計算單元(如向量處理單元、GPU),已經(jīng)可以為服務(wù)機器人提供一個理想的硬件架構(gòu),尤其是多功能的具有感知、認(rèn)知功能的服務(wù)機器人。目前機器人主要的瓶頸,還是在應(yīng)用需求的開發(fā)和感知、認(rèn)知技術(shù)上。當(dāng)然,未來的架構(gòu),也會隨著對應(yīng)用的深入開發(fā)而不斷創(chuàng)新。硬件設(shè)計面臨的挑戰(zhàn)越來越大,需要不斷地適應(yīng)未來發(fā)展的演變。同時也可以考慮用FPGA架構(gòu)來為一些比較專門的應(yīng)用提供加速,這樣在應(yīng)用發(fā)生變化的時候,將具有更多的靈活性。
評論