「超深度學習」創(chuàng)造新一代人工智能的核心理論
針對深度學習存在的上述問題,超深度學習一舉將深度學習所存在的所有問題全部給予解決。超深度學習的數(shù)學基礎(chǔ)就是公式1所示的一個基于概率尺度的自組織的機器學習算法。
本文引用地址:http://www.ex-cimer.com/article/201902/397690.htm公式1
這里,給定一個屬于集合G的一組隨機分布的數(shù)值pi (i=1,2,…,m),某一集合Gn-1中必然存在一個最大概率值A(chǔ)n-1,以及可以標定最大概率空間的尺度Mn-1,如果把最大概率空間看成是新的一集合Gn,就可以通過迭代,獲得最終可以超越統(tǒng)計學公式化的解,為了區(qū)別于傳統(tǒng)的統(tǒng)計學的結(jié)果,我們可以把An-1稱為最大幾率值,把Mn-1,稱為最大幾率空間的尺度。這就是概率尺度自組織的模型。
概率尺度自組織在圖像識別中,可以從一個小區(qū)域的若干個像素灰度值通過概率尺度自組織得到一個最大幾率值,用于表達該區(qū)域的圖像特征。概率尺度自組織還具有遷移特性,可以自律的朝著大概率的方向遷移,當圖像移位時可以自動的遷移,這是傳統(tǒng)模式識別所做不到的。
圖4是概率尺度自組織具有向大概率方向遷移的特性。 如圖4所示,概率尺度自組織在給定的任何地方,只要是初步滿足一定條件,通過迭代就可以自律的朝著大概率的方向遷移,中間遇到小概率的擾動,也可以跨越小概率的阻擋最終落在大概率的位置上。
圖4 概率尺度自組織具有向大概率方向遷移的特性示意圖
在自動駕駛的車道線識別與障礙物的3D識別的應(yīng)用中,還可以驗證概率尺度自組織可以無訓練的將圖像中最大概率分布的目標圖像直接識別出,還可以按照圖像中的各個最大概率的分布狀態(tài)進行特征抽出,可以得到結(jié)構(gòu)化的特征信息抽出結(jié)果,從而實現(xiàn)圖像理解的識別效果。
例如圖5所示進行人臉識別時可以自動的尋找到概率分布最集中的人的臉部。傳統(tǒng)的摸著石頭過河的程序搜索方法存在一個嚴重的問題是需要對人臉膚色的事先定義,這樣不同膚色在程序規(guī)則上就要調(diào)整,需要大量的程序進行規(guī)則堆積,嚴重影響人臉識別精度的提高,采用概率尺度自組織按照人臉圖像的顏色分布,在整個圖像中是最大的概率,可以直接通過概率尺度自組織的遷移特性直接獲得人臉位置。
圖5 用概率尺度自組織的遷移特性獲得人臉位置示意圖
概率尺度自組織的遷移軌跡,以及最終的結(jié)果需要嚴格的對應(yīng)數(shù)據(jù)空間,用一維的概率尺度衡量二維空間的數(shù)據(jù)就會產(chǎn)生錯誤的結(jié)果。另外概率尺度自組織的解也符合最佳化解的特性,遷移路徑與結(jié)果具有一定的邊界條件。
在模式識別中需要計算樣本數(shù)據(jù)與學習后登錄數(shù)據(jù)之間的距離,我們在實際大量應(yīng)用中所接觸的數(shù)據(jù)證明概率空間一定是存在于歐幾里得空間的,也就是說在歐幾里德空間存在著無數(shù)個概率空間,因此如何找到一個跨越歐幾里得空間與概率空間的距離是提高模式識別的關(guān)鍵。這里我們提出了公式2的概率空間的距離的定義方法,設(shè)是兩個集合的要素,分別是集合要素的復(fù)數(shù)個學習數(shù)據(jù),通過多次的概率尺度自組織機器學習所得到的最大幾率空間的尺度,則從 的概率空間到 (j=1,2,…,n)的概率空間的跨越歐幾里得空間與概率空間的距離G可定義如下:
公式2
公式2雖然是定義出來的,但是可以嚴格證明其正確性,因為概率空間是測度等于1的空間,在概率空間中的距離誤差是概率密度,也可以證明最大幾率空間尺度就是概率密度的近似值。
下面具體介紹超深度學習的架構(gòu),超深度學習與普通的深度學習最大的不同是,傳統(tǒng)的深度學習是通過層與層之間的復(fù)雜連接關(guān)系產(chǎn)生海量數(shù)據(jù),這種人為的將問題復(fù)雜化恐怕是典型學界的做法,這種做法可以引起眾多的學者們的興趣,是起到推動人工智能在理論上的完善必不可少的過程,幾乎科學技術(shù)的發(fā)展都需要這個過程,當發(fā)展到一定程度時,必定有人出來從另一條路出發(fā)將多年積累的理論顛覆,產(chǎn)生可以實際應(yīng)用的新理論。人工智能也一定要走這一道路。超深度學習就是拋磚引玉引發(fā)新一代人工智能創(chuàng)出的理論之一,同深度學習不同的是超深度學習是概率模型,可直接對數(shù)據(jù)進行概率尺度自組織機器學習,可以定量的對輸入的隨機分布信息進行分析,對數(shù)據(jù)進行分類,沉淀深層信息,最終產(chǎn)生定量化的識別與分類,使傳統(tǒng)的系統(tǒng)只有通過實際數(shù)據(jù)的驗證才可以知道識別精度與數(shù)據(jù)分類精度,成為識別結(jié)果的精度可計算性的系統(tǒng),從而使模式識別與數(shù)據(jù)分類進入一個嶄新的時代。
超深度學習始終基于最大概率尺度的自組織,所以是一個新的無監(jiān)督學習模型,無需海量數(shù)據(jù)來承載目標函數(shù)的信息,是對具有隨機特性的輸入數(shù)據(jù)的直接學習,可以產(chǎn)生非常高效率的處理效果,無需巨大的硬件支持,一個最低的硬件配置就完全可以實現(xiàn)各種的人工智能的應(yīng)用,可做到的最佳分類,最佳的模式識別處理結(jié)果。
圖6 超深度學習架構(gòu)示意圖
超深度學習如圖6所示;超深度學習的每一個功能單元是由輸入層,腦神經(jīng)層,以及腦皮層組成的新型神經(jīng)網(wǎng)絡(luò)。在輸入層與腦神經(jīng)層之間的節(jié)點與節(jié)點之間直接連接著大量的概率尺度的自組織機器學習,構(gòu)成了分散機器學習處理系統(tǒng)。
在超深度學習的神經(jīng)網(wǎng)絡(luò)的層數(shù)是與大腦一致,在圖像識別時,提取的是圖像最大概率的特征值,判斷每一個特征值是否屬于某個已登陸的特征向量,是以最大幾率空間的尺度為依據(jù),相當于最大幾率空間的尺度是一個神經(jīng)元的閥值,所對應(yīng)的腦神經(jīng)層的節(jié)點就產(chǎn)生一個腦神經(jīng)信號輸入到腦皮層,以最大幾率空間的尺度為基準值刺激腦皮層,腦皮層被刺激的信號越多越興奮,依據(jù)腦皮層的興奮程度決定是否為目標函數(shù)信息,這豈不是與大腦的機理非常接近嗎?最大幾率空間的尺度就相當于腦神經(jīng)的閥值,并不是深度學習中人為定義的參數(shù),因此大腦機理應(yīng)該建立在概率空間的模型上,通過超深度學習的架構(gòu)終于搞清楚了,這也是通過算法仿真生物神經(jīng)的機理的一個重要的成果。
圖7 在如何深入上超深度學習與深度學習的比較
下面讀者會問超深度學習只有三層如何深入,當今的潮流是大模型,大數(shù)據(jù),大硬件構(gòu)成的大系統(tǒng)是主流。如圖7所示;深度學習是靠大量的增加層數(shù),由于復(fù)雜度是指數(shù)性的,其結(jié)果使系統(tǒng)很快就超負荷了。超深度學習是按照導(dǎo)入解決復(fù)雜系統(tǒng)問題的空間映射原理,可以把任何的復(fù)雜系統(tǒng)的目標函數(shù)映射到任意多的子空間,針對每一個子空間的目標函數(shù)的信息用增加輸入層的節(jié)點的方法進行深入,這使超深度學習可以把目標函數(shù)的處理無限的深入下去,卻不增加系統(tǒng)的復(fù)雜度O(n2)。利用這個特點可以無限的增加特征數(shù)據(jù)集的規(guī)模,深度學習的數(shù)據(jù)集只能幾百萬個,而超深度學習可以達到數(shù)萬以至數(shù)億個以上,隨著系統(tǒng)應(yīng)用的需要可以無限的增加機器學習的數(shù)量,可以預(yù)測今后的人工智能系統(tǒng)用的能力指標將以有多少個機器學習來計算。50年來的計算機由簡單的門電路組成發(fā)展至今原理沒有任何變化,使用的門電路的規(guī)模卻發(fā)生了巨大的變化,計算機的性能也出現(xiàn)了驚人的提高,相信未來的人工智能系統(tǒng)由眾多的機器學習組成的,其能力不管如何過高的估計也不會過分。
再有在目標函數(shù)概率分布模型的優(yōu)勢上,通過小數(shù)據(jù)的訓練可以獲得目標函數(shù)的概率分布,可以相當于無窮的函數(shù)映射的效果。這也是深度學習所望塵莫及的。由于超深度學習可以構(gòu)造比深度學習還大規(guī)模的分散機器學習模型,可以通過小數(shù)據(jù)的訓練獲得超過深度學習的還要大規(guī)模的特征數(shù)據(jù)集,以及無限多的機器學習所構(gòu)成的大的分散處理硬件系統(tǒng),因此超深度學習更加適應(yīng)時代潮流。
將任意一個圖像通過手機拍照后,通過超深度學習變換成一個
1036的代碼,導(dǎo)入了超深度學習無需通過噴印標記的方式構(gòu)成光學可讀性二維碼,而是靠圖像的灰度的自然分布,自組織成一個二維碼,也就是說可以通過手機拍攝商品標識,直接生成一個可以連接網(wǎng)絡(luò)的二維碼,讓全世界的商品一夜之間就可連接網(wǎng)絡(luò)。
超深度學習的實際應(yīng)用的例子之一是如圖8所示;
圖8超深度學習實現(xiàn)圖像變換代碼的例子
超深度學習的圖像直接生成代碼,是對市場流行的開源程序AR圖像識別技術(shù)的顛覆,AR技術(shù)是通過傳統(tǒng)的圖像輪廓識別,產(chǎn)生一個將近10兆字節(jié)識別結(jié)果的文件,由于識別結(jié)果所占用的容量,遠比圖像本身的容量要大,所以一般識別引擎是放到網(wǎng)絡(luò)服務(wù)器上,用手機將被識別的圖像送到網(wǎng)上,網(wǎng)絡(luò)服務(wù)器識別圖像后將網(wǎng)絡(luò)下載的結(jié)果送回手機,這樣的應(yīng)用如果網(wǎng)絡(luò)環(huán)境差,就得不到很好的用戶體驗。超深度學習克服了由于手機在不同情況下拍攝的圖像所產(chǎn)生的非常大的隨機分布信息,通過概率尺度的自組織變換成一個穩(wěn)定的代碼,這個代碼不到十個字節(jié),可以把識別引擎放到手機上做在線圖像變換代碼的應(yīng)用。
超深度學習與深度學習在機理上的比較表1.
超深度學習與普通的深度學習的對比如表1所示;首先從方法上進行比較:
深度學習是在歐幾里得空間里訓練出海量的參數(shù),用海量的參數(shù)承載目標函數(shù)的信息,超深度學習是直接針對輸入的隨機分布數(shù)據(jù)進行概率空間的自組織機器學習,將隨機分布的數(shù)據(jù)進行去偽存真的處理,得出定量的并且穩(wěn)定的最大概率的解,以及可以提煉出深層的信息。
在前面已經(jīng)討論了,深度學習是將目標函數(shù)映射到數(shù)據(jù)集的模型,因此面對具有隨機特性的數(shù)據(jù),需要數(shù)百萬次的訓練,需要付出巨大的數(shù)據(jù)標注費用。超深度學習是概率模型,通過概率分布信息可以將小數(shù)據(jù)的訓練生成具有無限映射效果的概率分布。
在計算復(fù)雜度上兩種模型具有截然不同的區(qū)別,因此在硬件開銷上差距很大,在相同硬件環(huán)境下,超深度學習具有超越深度學習的應(yīng)用效果是不可置疑的。
深度學習是把概率空間的數(shù)據(jù)映射到歐幾里得空間的,所以要對概率空間的隨機數(shù)據(jù)進行全部的訓練,致使應(yīng)用成本巨大不易普及。
特別是深度學習的應(yīng)用效果是靠數(shù)據(jù)集的規(guī)模所產(chǎn)生的,超深度學習不僅在概率模型上優(yōu)于深度學習,在特征集的規(guī)模上同樣可以超越深度學習的數(shù)據(jù)規(guī)模,因此超深度學習在應(yīng)用效果上超越深度學習是名副其實的。
超深度學習與深度學習在應(yīng)用效果上的比較表2.
如表2所示;在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)上深度學習是數(shù)十層乃至數(shù)百層,這樣就使問題的復(fù)雜度急劇擴大,造成組合的空間無窮的大,導(dǎo)致不可能得到最佳組合的解,因此出現(xiàn)黑箱問題等,超深度學習同大腦的構(gòu)造近似,只有輸入層,腦神經(jīng)層,以及腦皮層三層,而且數(shù)學模型很接近大腦的機理,證明超深度學習符合大腦的機理。
再有,在模型能力擴大的方法上深度學習是靠增加隱藏層的數(shù)量來實現(xiàn)的!超深度學習是靠增加輸入層的節(jié)點的個數(shù),通過將復(fù)雜系統(tǒng)空間的映射,把目標函數(shù)變換成若干子空間,并把子空間的特征分量對應(yīng)輸入層的各個節(jié)點,通過擴大節(jié)點的個數(shù)達到深入學習的目的。
下面準備介紹一下我和我的團隊正在進行的超深度學習視覺芯片的開發(fā)情況。
圖9是超深度學習視覺芯片的構(gòu)成,這個項目是同由日立,NEC以及三菱電機,三個公司的半導(dǎo)體事業(yè)部剝離組建的日本最大的芯片公司RENESAS公司聯(lián)合開發(fā)的,采用硬件加軟件的形式。對于非常占用處理時間的顏色變換,以及為盡可能獲取圖像的本來信息,針對圖像的空間映射等采用硬件處理,算法用軟件處理。超深度學習獨特的兩種對抗學習以及無監(jiān)督學習的算法均在這一款芯片里搭載,因此,可以使這一芯片在圖像感知方面做到傳統(tǒng)的算法無可比擬的天衣無縫的精度與應(yīng)用效果。
圖9超深度學習視覺芯片的構(gòu)成
我們的超深度學習的研發(fā)戰(zhàn)略是,首先從算法上布局,既然已經(jīng)證實,導(dǎo)入超深度學習可以顛覆傳統(tǒng)的統(tǒng)計學的兩大參數(shù),那么與這兩大參數(shù)有關(guān)的相關(guān)分析,回歸分析等等大量的統(tǒng)計學的數(shù)學模型,將成為超深度學習的重要架構(gòu),這些成果可以分別通過論文的形式發(fā)表。同時將深度學習理論作為一個鏡子,逐一的將深度學習的一些特殊的算法在超深度學習上實現(xiàn),在應(yīng)用上從圖像感知,語音感知到預(yù)測推論等的應(yīng)用可視化,在推廣上從提供SDK程序,SDL應(yīng)用電路板,SDL芯片以及開源平臺,聯(lián)合開發(fā)等等分別進行,我們是原創(chuàng)單位因此不同我們的用戶競爭,我們的角色是技術(shù)提供與服務(wù),以及基礎(chǔ)性開發(fā),因此不獨立的進行具體項目的開發(fā),可以為從事AI事業(yè)的創(chuàng)業(yè)公司進行技術(shù)合作以及技術(shù)入股。
作為我們奉獻社會的超深度學習,由于不是通過組合方式訓練海量的參數(shù)的,是直接對隨機分量的數(shù)據(jù)進行概率自組織的學習,因此不存在黑箱問題。而且,最大的特點是硬件要求門檻極低,普通一個芯片,任何一個移動終端都可以立即應(yīng)用。超深度學習的基礎(chǔ)理論概念清楚,算法簡單易懂,是可以大量普及的一個為大眾服務(wù)的AI算法。人工智能是國家戰(zhàn)略,自動駕駛汽車是反映人工智能的國家水平的標準。為了證明超深度學習的能力,我們在社會的廣泛支持下,正在自動駕駛汽車的開發(fā)上驗證超深度學習的應(yīng)用效果。目前所有的自動駕駛研發(fā)團隊,都因為控制過于復(fù)雜沒有現(xiàn)成的人工智能模型的支持,而處于停滯不前的現(xiàn)狀。我們寄托超深度學習可以沖破自動駕駛的難關(guān),使L4級別的自動駕駛不再是偽命題。
我是中國人,我愿意將我發(fā)明的超深度學習在中國產(chǎn)業(yè)化,為中國及世界的人工智能發(fā)展服務(wù)。我現(xiàn)在是中國軟件行業(yè)協(xié)會嵌入式系統(tǒng)分會和中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的理事、擔任著中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟新一代人工智能專業(yè)委員會主任職務(wù)。為促進超深度學習在中國的產(chǎn)業(yè)化,我已將超深度學習的宣傳和產(chǎn)業(yè)化的代理授權(quán)給中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的負責人。希望通過中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的積極組織,加快進行超深度學習的產(chǎn)業(yè)化工作。我衷心的希望國家有關(guān)部門和相關(guān)的企事業(yè)單位大力支持超深度學習的產(chǎn)業(yè)化。歡迎從事人工智能的研究和應(yīng)用的單位及專家、學者、技術(shù)人員加入到超深度學習的研究與推廣隊伍中來,共同為早日實現(xiàn)超深度學習的產(chǎn)業(yè)化做努力!
評論