史無(wú)前例!蘋(píng)果開(kāi)誠(chéng)布公談機(jī)器學(xué)習(xí)
即使是如此重視保密的蘋(píng)果,現(xiàn)在隨著時(shí)勢(shì)的改變,一些東西也和過(guò)去不一樣了,最明顯的莫過(guò)于它對(duì)人工智能和機(jī)器學(xué)習(xí)技術(shù)的態(tài)度。我們已經(jīng)看到了一個(gè)更加開(kāi)放的蘋(píng)果,它在機(jī)器學(xué)習(xí)這個(gè)領(lǐng)域的進(jìn)展如何呢?今天大家已經(jīng)可以清楚地了解了。
本文引用地址:http://www.ex-cimer.com/article/201707/362056.htm我們都知道蘋(píng)果是一家特別注重保密文化的公司,基本上只有在新產(chǎn)品公開(kāi)的那一刻,你才會(huì)真正從官方的口中了解到它是什么樣的,而它又使用了些什么材料和什么技術(shù)。這樣的文化曾經(jīng)為我們帶來(lái)無(wú)數(shù)驚喜,但時(shí)過(guò)境遷,堅(jiān)持這種作風(fēng)的蘋(píng)果似乎遇到了新的困境。
所以近兩年來(lái),我們看到了一個(gè)和過(guò)去不太一樣的蘋(píng)果。它比起以往,似乎更加愿意和外界分享自己的科技成果。當(dāng)然了,保密策略肯定是主旋律,但好歹是有了例外 —— 比如說(shuō)機(jī)器學(xué)習(xí)。
在這一段時(shí)間里,我們看到了蘋(píng)果高管們更多地拋頭露面,向媒體談及他們對(duì)人工智能和機(jī)器學(xué)習(xí)的看法。在蘋(píng)果的發(fā)布會(huì)中,“機(jī)器學(xué)習(xí)”成為了一個(gè)高頻詞匯。前一陣子,高管們還集體在訪談中放聲“我們的機(jī)器學(xué)習(xí)技術(shù)也很先進(jìn)”,并透露了公司一直以來(lái)對(duì)該技術(shù)的應(yīng)用實(shí)例。
在這之后,蘋(píng)果宣布旗下的人工智能團(tuán)隊(duì)可以參與相關(guān)的學(xué)術(shù)討論,并允許研究者發(fā)表論文。不久前蘋(píng)果的人工智能專家湯姆·格魯伯還在 TED 大會(huì)上,闡述了蘋(píng)果如何看待這種技術(shù)。對(duì)粉絲們來(lái)說(shuō),蘋(píng)果這么做在過(guò)去幾乎是不可想象的。
似乎是為了證明它之前的那些承諾真的不是空話,蘋(píng)果就在剛剛開(kāi)放了一個(gè)博客,專門(mén)刊載公司的機(jī)器學(xué)習(xí)進(jìn)度。這前所未有的決定,將讓我們看到蘋(píng)果怎樣的機(jī)器學(xué)習(xí)成就呢?
蘋(píng)果的技術(shù)進(jìn)展
我們都知道,人工智能有一項(xiàng)很重要的應(yīng)用就是圖像識(shí)別,而這也是蘋(píng)果在最近幾次系統(tǒng)升級(jí)中著重強(qiáng)調(diào)的,通過(guò)照片的自動(dòng)整理分類(lèi),事實(shí)上我們也已經(jīng)用上了這些技術(shù)。
那么要如何讓設(shè)備能夠準(zhǔn)確判斷圖片上的東西究竟是什么呢?那就需要訓(xùn)練了。人類(lèi)首先要找好大量被手動(dòng)標(biāo)注是某樣物體的,確定無(wú)誤的圖片,比如最簡(jiǎn)單的“貓”、“狗”、“眼睛”這些,然后讓機(jī)器去學(xué)習(xí)和辨認(rèn),這樣它才能開(kāi)始嘗試自己識(shí)別類(lèi)似的圖片。
蘋(píng)果表示,這樣的過(guò)程成本實(shí)在是太高,因?yàn)橐岣邫C(jī)器識(shí)別的準(zhǔn)確率,圖片數(shù)量必須非常龐大,據(jù)了解目前是 100 萬(wàn)張起步,如果還要再多人工標(biāo)注就幾乎不可能。而且,這些圖片還得擁有足夠的多樣性,畢竟可以被標(biāo)注為“貓”、“狗”、“眼睛”的圖片種類(lèi)太多了,太過(guò)單一,機(jī)器如果遇到更復(fù)雜的情況就可能會(huì)認(rèn)不出了。
當(dāng)然還有一種辦法:既然人工標(biāo)注圖片數(shù)量越多越難實(shí)現(xiàn),那么可以使用模擬的手段,自動(dòng)生成海量自動(dòng)被標(biāo)注好的圖片,讓機(jī)器去不斷進(jìn)行識(shí)別。然而這種解決方案也有一個(gè)大問(wèn)題,那就是自動(dòng)生成的圖片往往不夠真實(shí),這樣會(huì)極大影響到人工智能識(shí)別圖片的準(zhǔn)確性。蘋(píng)果的第一篇博文,就是嘗試去解決這個(gè)難題的。
其實(shí)蘋(píng)果的思路很簡(jiǎn)單:如果模擬器生成的圖片不夠真實(shí),那就讓它變得更真實(shí)就好了。有趣的是,研究者們?yōu)榇擞衷O(shè)計(jì)了一套學(xué)習(xí)網(wǎng)絡(luò)。
根據(jù)博文所說(shuō),蘋(píng)果為達(dá)到這個(gè)目的,開(kāi)發(fā)出了所謂的精制器(Refiner R)和辨別器(Discriminator D)。當(dāng)模擬器生成圖片后,精制器 R 負(fù)責(zé)讓它變得更加真實(shí),以通過(guò)辨別器的考驗(yàn)。辨別器的數(shù)據(jù)庫(kù)中有大量的真實(shí)圖片(有趣的是,蘋(píng)果表示這些圖片可以是未標(biāo)注的 —— 又省一筆人工費(fèi)),它負(fù)責(zé)根據(jù)這些真實(shí)圖片,辨別精制器給它的圖片是否為真。
精制器千方百計(jì)要騙過(guò)辨別器,而后者則要努力認(rèn)清前者的“鬼把戲”。兩個(gè)機(jī)制在不斷地“斗法”中提升著自己的能力,直到辨別器再也分不清,學(xué)習(xí)過(guò)程就算完成了。這樣,就能夠在不需要人工標(biāo)注的情況下,生成海量接近真實(shí)的圖片讓人工智能不斷去學(xué)習(xí)了,如此就可以大量減少成本。
還有一點(diǎn)很重要,那就是蘋(píng)果必須要保證整個(gè)學(xué)習(xí)過(guò)程不“跑偏”。因?yàn)樵诰破骱捅鎰e器不停較量和升級(jí)的過(guò)程中,難保會(huì)因?yàn)楦鞣N各樣的因素,讓精制器修改的圖片和辨別器認(rèn)定的標(biāo)準(zhǔn)開(kāi)始走極端,讓最終得到的圖片直接變形。所以蘋(píng)果加入了一些規(guī)范機(jī)制。
首先蘋(píng)果將一幅圖片分成許多部分,然后根據(jù)這些部分中的像素特征,對(duì)較量中出現(xiàn)的失真進(jìn)行統(tǒng)計(jì),失真偏差越大,判定損失就越大。除了局部的判定外,還有一個(gè)整體的自我規(guī)范損失機(jī)制,建立一個(gè)生成圖片修改前后的差異對(duì)比。局部和整體結(jié)合,保證了圖片不會(huì)在這個(gè)過(guò)程中發(fā)生很大的異變。除此之外辨別器本身也有記憶功能,能夠記住那些之前已經(jīng)被判定為假的圖片。
還有一點(diǎn)很有趣,那就是蘋(píng)果暫時(shí)還沒(méi)有找到讓系統(tǒng)自動(dòng)判定學(xué)習(xí)中止的辦法,目前只能是保存學(xué)習(xí)過(guò)程中的所有圖片,人工目測(cè)生成圖像已經(jīng)和真實(shí)非常接近時(shí)中止學(xué)習(xí)。
采用了這樣的解決方案,據(jù)說(shuō)效果還是非常不錯(cuò)的。蘋(píng)果曾邀請(qǐng)志愿者接受測(cè)試,10 位志愿者看了 1000 組圖片,分別有真實(shí)圖片和經(jīng)過(guò)精制器修改的生成圖片。成功分辨出真實(shí)圖片的有 517 組,概率上接近 50%,說(shuō)明人們無(wú)法確定圖片真假,更多是 2 選 1 的概率。而當(dāng)志愿者們?nèi)タ凑鎸?shí)圖片和原始生成圖片時(shí),200 組圖片他們成功分辨出了多達(dá) 162 組。
好戲還在后頭
從蘋(píng)果的這第一篇博文中,我們可以清楚地看到它在機(jī)器學(xué)習(xí)領(lǐng)域的進(jìn)展和思路,可以說(shuō)是史無(wú)前例的開(kāi)誠(chéng)布公。它這么做,自然是為了表明自己在人工智能領(lǐng)域并沒(méi)有落后,希望能夠因此吸引更多人才。
人工智能和機(jī)器學(xué)習(xí)作為蘋(píng)果未來(lái)技術(shù)發(fā)展和產(chǎn)品功能開(kāi)發(fā)的重頭戲,我們會(huì)在越來(lái)越多的發(fā)布會(huì)上看到它們的身影。如果你對(duì)此曾經(jīng)也有疑慮,那么蘋(píng)果現(xiàn)在就是在不斷表明自己的態(tài)度,讓人們放心。
博客開(kāi)了,這也只是第一篇博文而已??上攵?,未來(lái)蘋(píng)果還會(huì)公布更多它的技術(shù)進(jìn)展。在解決了圖像識(shí)別的問(wèn)題后,接下來(lái)它還會(huì)用機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)什么呢?這實(shí)在是讓人期待啊。
評(píng)論