自律學(xué)習(xí)SDL模型賦能自動(dòng)駕駛
最近發(fā)生的幾起自動(dòng)駕駛惡性事故,某種意義上看,都是因?yàn)樯疃葘W(xué)習(xí)的識(shí)別問題造成的。為什么被大家崇拜的深度學(xué)習(xí)在識(shí)別圖像上會(huì)出現(xiàn)問題?
本文引用地址:http://www.ex-cimer.com/article/202109/428180.htm原因有幾個(gè)方面,最主要的是深度學(xué)習(xí)在理論上屬于函數(shù)映射模型,簡單說就是給它訓(xùn)練什么圖像就只能識(shí)別哪個(gè)圖像,不具有舉一反三的能力。通常我們用手機(jī)拍攝一個(gè)圖像,在屏幕上雖然看不出圖像有什么變化,這是因?yàn)榇竽X有記憶能力。但是對(duì)于沒有智能的機(jī)器識(shí)別來說,隨著相機(jī)的抖動(dòng),拍攝角度,光線等的微小變化所得到的都是完全不同的圖像。深度學(xué)習(xí)就是這樣,哪怕圖像有一點(diǎn)錯(cuò)位,也會(huì)認(rèn)為是另一個(gè)圖像。所以深度學(xué)習(xí)需要上萬乃至上百萬個(gè)圖像的訓(xùn)練才能識(shí)別一個(gè)圖像。這就意味著用深度學(xué)習(xí)模型的自動(dòng)駕駛的圖像識(shí)別裝置,遇到?jīng)]有訓(xùn)練過的圖像時(shí),明明有障礙物,也會(huì)做出沒有障礙物的判斷結(jié)果,出現(xiàn)撞車的惡性事故在所難免。盡管開發(fā)者們下力量不斷的搜集大量圖像數(shù)據(jù)進(jìn)行訓(xùn)練,但是面對(duì)眾多種路況這種做法從科學(xué)觀的立場上講是徒勞的。這也就是馬斯克指責(zé)目前學(xué)術(shù)界給出的AI不夠智能的原因所在。
我們希望更加智能的自動(dòng)駕駛的誕生,需要各方努力,特別需要探索和尋找更好的算法模型。2018年發(fā)表在國際機(jī)器人大會(huì)上的自律學(xué)習(xí)模型是一個(gè)值得自動(dòng)駕駛領(lǐng)域關(guān)注的算法模型。自律學(xué)習(xí)(Self-Discipline Learning)SDL模型其實(shí)就是人工智能領(lǐng)域所期待的機(jī)器學(xué)習(xí)模型。這種模型之所以強(qiáng)大是因?yàn)榫哂兴膫€(gè)特殊的技術(shù)特征。
第一個(gè)技術(shù)特征是能讓機(jī)器模仿人來處理自動(dòng)駕駛的識(shí)別,機(jī)器推理,以及自動(dòng)駕駛的控制問題的算法。深度學(xué)習(xí)是基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)模型,其實(shí)是屬于模式識(shí)別的理論,本不是人工智能的主流算法。人工智能的定義就是把人的智慧授予機(jī)器,讓機(jī)器具有超越人的能力。因此對(duì)于上述自動(dòng)駕駛所面臨的復(fù)雜系問題,近幾十年一直圍繞著如何實(shí)現(xiàn)人為介入,就是說讓人介入到算法里去,把人在如何解決問題的方法構(gòu)成算法,用這樣的算法讓機(jī)器去代替人解決復(fù)雜系問題。人工智能的第一,二次高潮的主流算法就是力圖解決給機(jī)器賦予人的智慧的問題,只是因?yàn)楫?dāng)時(shí)缺少數(shù)學(xué)基礎(chǔ)理論的支持,還無法在技術(shù)上實(shí)現(xiàn)讓機(jī)器智能的目的。因此真正的人工智能算法一定要直接解決如何把人的智慧讓機(jī)器深度理解,讓機(jī)器變聰明來代替人的工作。
談到這里,恐怕包括一些專家學(xué)者們都會(huì)感到茫然。這么復(fù)雜的算法何時(shí)才能得到?其實(shí)支持新一代人工智能的核心理論并不一定是極其抽象的理論,傳統(tǒng)的理論由于過于僵化不容易做到人為介入,把人的智慧授予機(jī)器,在當(dāng)今人工智能領(lǐng)域是行不通的。而往往被人看不上的現(xiàn)代數(shù)學(xué)卻是可以成為人工智能可以產(chǎn)生突破性的核心理論。其中,模糊集合理論就為我們提供了可以針對(duì)任何一種事物的定式化方法。把人的智慧用足夠多的隸屬函數(shù)(Membership Function)的公式來表達(dá),機(jī)器按照這些隸屬函數(shù)來處理各種復(fù)雜系問題,機(jī)器就可以同人一樣聰明起來。
這是受第二次人工智能高潮為了讓機(jī)器聰明起來,所推出的規(guī)則庫理論的啟發(fā),由于當(dāng)時(shí)用規(guī)則所實(shí)現(xiàn)的知識(shí)表現(xiàn)過于簡單,規(guī)則只能告訴機(jī)器在什么情況下,應(yīng)該如何做?面對(duì)復(fù)雜系問題卻需要無窮個(gè)規(guī)則才能解決,所以規(guī)則庫理論以失敗告終。今天,用隸屬函數(shù)進(jìn)行知識(shí)表現(xiàn),一個(gè)隸屬函數(shù)可以相當(dāng)無窮個(gè)規(guī)則,所以不用懷疑隸屬函數(shù)的能力。
我們可以用自動(dòng)駕駛中目前很難解決的機(jī)器推理為例子,介紹上述算法的驚人作用。
自動(dòng)駕駛的機(jī)器推理難就難在要想控制自動(dòng)駕駛車正確的行駛,至少要考慮前后左右共有8輛車之間的距離,速度,加速度,以及自動(dòng)駕駛車的速度,加速度,嚴(yán)格講這就是超越了40個(gè)組合要素的圖靈機(jī)不可解的NP(Non-deterministic Polynomial)問題。所以目前推出的自動(dòng)駕駛就是國際大公司也苦于做不好這個(gè)功能,我們看到的這些自動(dòng)駕駛很少變道,寧可跟著前面的車停下等待。
面對(duì)這個(gè)難題,我們搞的自動(dòng)駕駛中的機(jī)器推理系統(tǒng),就是把人在駕駛汽車時(shí)的安全駕駛,安全禮讓,以及魚貫而行的安全駕駛的智慧用數(shù)百個(gè)隸屬函數(shù)來表達(dá)實(shí)現(xiàn)了機(jī)器深度理解,再通過深度的推理指揮自動(dòng)駕駛的行駛,這樣的自動(dòng)駕駛在路上跑,真的同人的駕駛很接近。為了讓機(jī)器推理能夠適應(yīng)目前在路上經(jīng)常出現(xiàn)的野蠻駕駛的同行車,我們做了幾乎可以模擬實(shí)際路況的自動(dòng)駕駛仿真系統(tǒng),這個(gè)仿真系統(tǒng)中自動(dòng)駕駛車是用我們的機(jī)器推理模型來控制,周圍的同行車可以由人來控制,用人來控制同行車的目的就是,可以由人主動(dòng)的構(gòu)成各種變化多端甚至包括一些危險(xiǎn)的路況場景,通過人同自動(dòng)駕駛博弈,用以考驗(yàn)機(jī)器推理的效果。這就是在新一代人工智能模型下,目前傳統(tǒng)模型不可解決的問題,卻可以輕而易舉的解決的案例。
由此可見,讓機(jī)器聰明起來并不是不可想象的神話,路在腳下只要用心就可以擺脫傳統(tǒng)的理論的束縛,在人工智能的研究中產(chǎn)生突破性的成果。
近代數(shù)學(xué)中的高斯過程理論也是人工智能的核心理論。著名數(shù)學(xué)家高斯發(fā)明的高斯分布的偉大之處在于它可以通過少量的數(shù)據(jù)就能得到大數(shù)據(jù)的訓(xùn)練結(jié)果,基于這個(gè)理論所搞出的機(jī)器學(xué)習(xí)模型一定具有舉一反三的能力。高斯分布還給出了一切事務(wù)發(fā)展的必然結(jié)果,如同人類發(fā)展也是不以人的意志為轉(zhuǎn)移的,一定按照高斯分布由人類起源到人類的高度發(fā)展時(shí)期,最后一定趨于逐漸的終結(jié),由起源到終結(jié)是一個(gè)對(duì)稱的過程,是由高斯分布所決定的。
構(gòu)成自律學(xué)習(xí)SDL模型的其中一個(gè)核心的算法是“概率尺度自組織”,這是一個(gè)既簡單又實(shí)用的自律學(xué)習(xí)的算法。“概率尺度自組織”的迭代過程是在高斯分布的任何的初始空間里,逐步朝著最大的概率空間遷移,并最終在最大概率空間里收斂的過程。我們的自動(dòng)駕駛的三維圖像識(shí)別就是用了這么簡單的算法,自動(dòng)駕駛所遇到的任何障礙物,在三維空間里是一個(gè)密度很大的物體,也就是概率分布最大的空間,利用概率尺度自組織的遷移特性,不管障礙物在什么地方,都可以被算法直接抓住,這種圖像識(shí)別不需要事先訓(xùn)練圖像,不需要特征抽出,徹底避免了深度學(xué)習(xí)對(duì)障礙物與背景不好分離,造成把白色車廂看成是云而釀成惡性事故的發(fā)生。
隨著機(jī)器學(xué)習(xí)被業(yè)界高度重視,距離問題是機(jī)器學(xué)習(xí)的核心理論。為解決概率空間的數(shù)據(jù)的直接分類問題,吸引了無數(shù)數(shù)學(xué)家們投入概率空間距離的研究,雖然有KL(Kullback ?Leible)距離等很多的概率空間距離被發(fā)明,但是基于目前的數(shù)學(xué)基礎(chǔ),數(shù)學(xué)家們把概率空間抽象化,看成是獨(dú)立的無窮維的空間,不能把歐幾里德空間與概率空間融合,以及還解決不了非線性函數(shù)的復(fù)雜的求解問題,致使目前數(shù)學(xué)界提出幾乎所有的概率空間距離都不能在工程上應(yīng)用。
其實(shí)依據(jù)概率空間的嚴(yán)格定義,測度為一的空間就是概率空間,也就是一個(gè)高斯分布的數(shù)據(jù)就是一個(gè)概率空間數(shù)據(jù)。這就揭示出我們現(xiàn)實(shí)的數(shù)據(jù)是由歐幾里德空間發(fā)展到了概率空間的。經(jīng)過長時(shí)間的探索,我們發(fā)現(xiàn)了歐幾里德里空間距離與概率空間距離之間僅僅存在一個(gè)與概率空間的概率密度相關(guān)常數(shù),在歐幾里德空間距離里消除概率空間的距離的這個(gè)常數(shù)就可以得到一個(gè)精確的可以統(tǒng)一歐幾里德空間與概率空間的距離公式。
自律學(xué)習(xí)SDL模型就是用我們發(fā)明的概率空間距離作為概率空間數(shù)據(jù)之間的尺度,以概率尺度自組織的最大概率尺度為聚類的依據(jù),就可以自律的進(jìn)行數(shù)據(jù)聚類。特別是在最大概率空間下的聚類,也可以說是在接近母體的高斯分布下的聚類。這是一個(gè)當(dāng)今最佳的機(jī)器學(xué)習(xí)模型。即可以把概率空間的數(shù)據(jù)直接聚類,又可以得到在概率空間里以小數(shù)據(jù)學(xué)習(xí)得到相當(dāng)于大數(shù)據(jù)學(xué)習(xí)的效果。
SDL模型還可以直接用于自動(dòng)駕駛的控制,在控制領(lǐng)域近20年一直沒有突破,本來為解決隨機(jī)性的控制問題引入了自適應(yīng)控制理論,但是,控制是應(yīng)用于在線系統(tǒng)的,利用統(tǒng)計(jì)學(xué)理論,需要在線的抽取大量的統(tǒng)計(jì)數(shù)據(jù),這是現(xiàn)實(shí)應(yīng)用中很難做到的,因此自適應(yīng)控制一直停滯不前。機(jī)器學(xué)習(xí)為自適應(yīng)控制提供了非常強(qiáng)大的支持,機(jī)器學(xué)習(xí)可以在離線上訓(xùn)練數(shù)據(jù),使用訓(xùn)練后的數(shù)據(jù)進(jìn)行在線控制,不影響在線控制的速度。因此導(dǎo)入機(jī)器學(xué)習(xí)實(shí)現(xiàn)最佳的自適應(yīng)控制是人們期待的算法。
自動(dòng)駕駛的控制問題也對(duì)現(xiàn)代控制理論提出了挑戰(zhàn),汽車是重的載體,在高速運(yùn)動(dòng)中會(huì)產(chǎn)生很大的動(dòng)能,目前雖然有模型預(yù)測控制(Model Predictive Control)MPC模型,以及線性二次型調(diào)節(jié)器控制(Linear Quadratic Regulator)LQR模型,但是,自動(dòng)駕駛需要根據(jù)不同的路況不斷的改變控制狀態(tài),傳統(tǒng)的最佳控制是最不適應(yīng)多變的自動(dòng)駕駛的控制。把人在駕駛汽車時(shí)的生物意識(shí)的自然反應(yīng)是駕駛汽車的最佳的方法,把人的駕駛智慧通過SDL模型的機(jī)器學(xué)習(xí)所得到的自動(dòng)駕駛的高階信息,機(jī)器通過調(diào)用高階信息控制自動(dòng)駕駛,實(shí)現(xiàn)了讓機(jī)器按照人的駕駛智慧進(jìn)行自動(dòng)駕駛,這是目前最理想的自動(dòng)駕駛的控制方法。這種控制方法,不管是冰凍的道路,雪地,以及大水淹沒的道路都可以讓自動(dòng)駕駛平穩(wěn)的行駛,實(shí)踐證明導(dǎo)入這樣的自動(dòng)駕駛的控制算法,可獲得最理想的自動(dòng)駕駛的效果。
使用我們發(fā)明的概率尺度自組織以及概率空間距離公式,以概率空間為中心的自律聚類這一新的機(jī)器學(xué)習(xí)的發(fā)明其先進(jìn)性,在美國獲得的發(fā)明專利中被肯定,這也是構(gòu)成了SDL模型的第二個(gè)技術(shù)特征。
只有符合科學(xué)的理論才可以被實(shí)踐所接受!在人工智能領(lǐng)域存在著很多缺乏科學(xué)依據(jù)宣傳,人工神經(jīng)網(wǎng)絡(luò)是否是深度學(xué)習(xí)可以產(chǎn)生一定應(yīng)用效果的根源?
帶著這個(gè)問題我們的團(tuán)隊(duì)勵(lì)志要打開人工神經(jīng)網(wǎng)絡(luò)的黑箱,我們基于組合理論的基本原則,經(jīng)過大家的努力奮戰(zhàn)終于在一個(gè)人工神經(jīng)網(wǎng)絡(luò)中找到了全局最佳解,這個(gè)全局最佳解實(shí)際上就是一個(gè)高維線性方程的解。在獲得全局最佳解的過程中,我們又掌握了各種數(shù)據(jù)函數(shù)映射的特點(diǎn),以及與梯度下降法SGD(Steepest Gradient Descent)的解的關(guān)系。從而人工神經(jīng)網(wǎng)絡(luò)的不被人知的黑箱被打開了。通過打開黑箱推動(dòng)了深度學(xué)習(xí)的技術(shù)進(jìn)步,我們發(fā)現(xiàn)深度學(xué)習(xí)的應(yīng)用效果主要是卷積核以及反向傳播的作用,而人工神經(jīng)網(wǎng)絡(luò)的作用主要是分類。利用SDL模型可以最佳的最高效率的自律聚類的特點(diǎn),再加上把SDL模型與卷積核與反向傳播技術(shù)的融合,甩掉人工神經(jīng)網(wǎng)絡(luò),使小數(shù)據(jù)小模型的SDL模型的能力超越一般的深度學(xué)習(xí),這就是自律學(xué)習(xí)SDL模型的第三個(gè)技術(shù)特征。
自律學(xué)習(xí)SDL模型的第四個(gè)技術(shù)特征就是:利用自律學(xué)習(xí)的聚類結(jié)構(gòu)簡單以及可分析性的特點(diǎn),可以方便的融合其他技術(shù)。為了解決深度學(xué)習(xí)還很難解決的針對(duì)不同類的數(shù)據(jù)在低維空間混合在一起不可分問題,引用核函數(shù)(Kernel Function)理論,把數(shù)據(jù)映射到高維空間,使不可分離的數(shù)據(jù)利用高維空間的超平面就可以分離的技術(shù)特征,使SDL模型在分類技術(shù)上又產(chǎn)生了飛躍。
SDL模型在幾十年的人工智能的應(yīng)用中,如今已形成一整套完整的理論體系,和立竿見影的應(yīng)用效果。可以在目前深度學(xué)習(xí)所做不到的工業(yè)控制,醫(yī)療領(lǐng)域,自動(dòng)駕駛,以及嵌入式系統(tǒng)等的所有IT產(chǎn)品,以及所有的應(yīng)用場景下發(fā)揮獨(dú)特的作用。SDL模型確實(shí)可以實(shí)現(xiàn)人們對(duì)人工智能的期望,實(shí)現(xiàn)全社會(huì)的人工智能的大普及,可以獲得以往任何技術(shù)所不能產(chǎn)生的經(jīng)濟(jì)效果。
當(dāng)今在人工智能領(lǐng)域的技術(shù)發(fā)展日新月異,經(jīng)過長年的實(shí)踐針對(duì)復(fù)雜系問題用人的智慧賦予機(jī)器讓機(jī)器做出超越人的工作是新一代人工智能的核心理論,也是在工程上最行之有效的方法,在目前人工智能的基礎(chǔ)理論還沒有完全建立起來時(shí),掌握這一核心理論一定會(huì)在實(shí)踐中獲得突破!寄托于年輕一代利用這個(gè)核心理論,在人工智能的發(fā)展過程之中建功立業(yè)!
評(píng)論