學AI之路,從探索特征出發(fā)
高煥堂 (臺灣VR產(chǎn)業(yè)聯(lián)盟主席,廈門VR/AR協(xié)會榮譽會長兼顧問)
本文引用地址:http://www.ex-cimer.com/article/201910/406449.htm摘?要:AI機器學習的基礎(chǔ)活動之一就是提取特征。本文通過舉例和比喻來領(lǐng)悟特征的含義,以及理解特征提取的方法和目的。而且,從人為的特征提取,開始思考由AI機器自動提取特征的途徑,邁向深度學習之路。
1 從認識特征出發(fā)
1.1 以狗和兔子為例
據(jù)說古代有一位小公主(例如大清時代的格格),常常到荒郊野外去玩,攜帶一只狗去出行。為什么她要攜帶狗呢? 因為狗兒天生就最熟悉兔子的特征,而且兔子的特征也最吸引狗兒們,所以狗兒喜歡又擅長于探索(抓)兔子了。因此,很快就能帶回幾只兔子。
話說有一天,小公主(格格)也想要幾只老鼠,她就攜帶著貓出行。因為貓兒天生就最熟悉老鼠的特征,包括老鼠的味道、長相、習性等。所以貓兒喜歡又擅長于探索(抓)老鼠。因此,也很快就帶回幾只老鼠。
所以,聰明的格格會借助于熟悉兔子特征的狗兒去探索荒郊野外的兔子;也懂得借助于熟悉老鼠特征的貓兒去探索荒郊野外的老鼠。
1.2 以公主和帥哥為例
于此,茲拿“小公主(格格)找心儀的帥哥”來做比喻?,F(xiàn)在,有一位小公主想要交男友、談戀愛了。小公主出去走走,驚動帥哥們,或請人介紹一些帥哥們。
于是,小公主就來識別一下他們的人品、財富、學問等特征(Feature)。在小公主的心中,對于人品、財富、學問等自有她的衡量權(quán)重(Weight)的。然后,小公主將其心中的評比結(jié)果告訴了媽媽。小公主也依據(jù)一樣的評比模式,來評比每一位帥哥。此時,精明的媽媽可能會提出她的看法來教女兒,眼睛要雪亮一些。甚至,媽媽覺得這樣似乎還不放心,就派兩位丫鬟去幫忙識別一番。
剛才的丫鬟們是經(jīng)過學習,而學會幫忙去衡量帥哥們的各種特征值(如人品、財富、學問等),再告訴小公主,然后告訴了媽媽。到了今天,AI(人工智能)日益普及了,也可以通過機器學習(ML)來訓練AI的丫鬟們,甚至訓練AI的格格,來幫人類格格更精確地衡量帥哥們的特征值。
2 特征范例1:玩具兔和玩具熊
我喜歡電視劇里的格格的氣質(zhì),所以就拿格格與玩具來做比喻。例如,這格格有4只玩具兔和玩具熊 [1] 。
所謂特征就是某種事物的特色,讓人們(或其他生物)很容易憑它區(qū)分出來。例如,兔子的特征就是:耳朵長長的、身體輕盈短小。而熊的特征則是:耳朵短短的、身體有些笨重。
由于這位格格身邊有兩位丫鬟,格格就請丫鬟A去量一下這些玩具的耳朵長度,就可以得到“耳朵”特征值了。格格也請丫鬟B去量量這些玩具的體重,就可以得到“體重”特征值了(如圖1)。
3 特征范例2:阿拉伯數(shù)字“2”和“7”
此范例摘自《不編程,而學AI:Excel+TensorFlow》 [1] 。其中,有2個阿拉伯數(shù)字的字型,其可分解為3個筆畫的組成元素:X0、X1和X3。我們可以按如圖2來提取其特征值。
此時格格找來3位丫鬟,并交待如圖3。
于是,得到全部字型的特征值了,如圖3。
4 特征范例3:局部感受野
剛才的兩個范例,其感受野(Receptive field)都是整張圖片。在本范例里,則把它縮小一半(如圖4)。
此時,格格對身旁的兩位丫鬟交代如圖5。
于是,針對第1個字型,丫鬟A在上半部發(fā)現(xiàn)了橫線筆畫,所以得到特征值是1;同時也在下半部發(fā)現(xiàn)了橫線筆畫,所以得到特征值是1。丫鬟B在上半部發(fā)現(xiàn)了(反)斜線筆畫,所以得到特征值是1。同時,也在下半部發(fā)現(xiàn)了斜線筆畫,所以得到特征值是1。然后,把兩人提取的特征值,排成一列(Flatten),如圖6。
接下來,繼續(xù)去測量第2個字型,提取了它的特征值。這時候,針對第2個字型,丫鬟A在上半部發(fā)現(xiàn)了橫線筆畫,所以得到特征值是1;但在下半部沒有發(fā)現(xiàn)到橫線筆畫,所以得到特征值是0。
丫鬟B在上半部發(fā)現(xiàn)了(正)斜線筆畫,所以得到特征值是1。同時,也在下半部發(fā)現(xiàn)了斜線筆畫,所以得到特征值是1。所以得到特征值是1。然后,把兩人提取的特征值,排成一列(Flatten),就得到全部字型的特征值了,如圖7。
5 特征范例4:阿拉伯數(shù)字“0”~“9”
于此,基于剛才范例3的特征提取模式,把原來的兩個字型,擴大為“0”~“3”共4個字型,如圖8。
此時,仍然由3位丫鬟分工去提取特征,如圖9。
于是,針對第1個字型,丫鬟A在上半部沒有發(fā)現(xiàn)橫線筆畫,所以得到特征值是0;但在下半部則發(fā)現(xiàn)了橫線筆畫,所以得到特征值是1。丫鬟B在上半部沒有發(fā)現(xiàn)正斜線筆畫,所以得到特征值是0。但是在下半部發(fā)現(xiàn)了正斜線筆畫,所以得到特征值是1。丫鬟C在上半部沒有發(fā)現(xiàn)反斜線筆畫,所以得到特征值是0。但是在下半部發(fā)現(xiàn)了反斜線筆畫,所以得到特征值是1。然后,把3人提取的特征值,排成一列(Flatten),如圖10。
依序下去,就可以得到全部字型的特征值了,如圖11。
然后,繼續(xù)加以擴大為“0”~“9”共10個字型,如圖12。
此時就可以得到全部字型的特征值了,如圖13。
6 結(jié)束語
在以上的范例里,是由人類(3位丫鬟們)去提取玩具或字型的特征值。這些丫鬟們愈有經(jīng)驗、或愈訓練有素時,其提取特征的準確性會愈高。如果我們也能訓練AI機器來代替這些丫鬟,以便由AI機器來自動提取特征,那將是一件美好的事。這意味著,得到一個新觀念:AI的丫鬟們是可以訓練的,只要訓練AI去認識小小的特征,則一群AI的丫鬟將可以代替人類去復(fù)雜的情境(街景照片)中尋找特征值。
參考文獻
[1] 高煥堂.不編程,而學AI:Excel+TensorFlow.臺灣:廣悅文化事業(yè)有限公司,2018.
本文來源于科技期刊《電子產(chǎn)品世界》2019年第11期第81頁,歡迎您寫論文時引用,并注明出處。
評論