DeepMind的TF Hub demo詮釋「史上最強 GAN 圖像生成器」
上圖是樣本生成單元格的控制界面,可以控制:生成樣本數(shù)量、截斷值、噪聲種子、和類別的參數(shù)。我們可以看看下圖的例子來說明各自的作用。
本文引用地址:http://www.ex-cimer.com/article/201811/394648.htm如上圖所示,很容易看出,生成樣本數(shù)量(10)和類別(芝士漢堡)就是字面的意思,那么截斷值、噪聲種子分別有什么作用呢?僅用一張圖看不出來,我們修改一下參數(shù)看看區(qū)別就行了。
這時,我們只需要拖動滑塊來修改參數(shù),然后 Colab 會立刻執(zhí)行新參數(shù)設置下的任務,但這也意味著我們一次只能修改一個參數(shù)。
經(jīng)過多次實驗,我們發(fā)現(xiàn),截斷值越大,生成樣本的多樣性越大;實際上,截斷值控制的是隱變量分布(一般呈高斯型)的截斷距離,也就是采樣范圍,因此不難理解其對多樣性的作用。
從上到下:截斷值為 0.02、0.26、0.58、1.0 的芝士漢堡生成結(jié)果。
而噪聲種子的值對生成結(jié)果的影響主要是每次生成樣本的初始條件,從而最終生成結(jié)果也會不同,可以用它來改善生成多樣性。
最后是類別參數(shù)的控制,該 Colab 中提供了 1000 個類別選項,可玩性很足,但要找到自己想要的類別實在有點困難。可以這樣操作,雙擊這個單元格,代碼會顯示在左側(cè),右側(cè)會出現(xiàn)鉛筆圖標,點擊該圖標后就能查看完整列表,在這個列表下用 Ctrl+F 搜索類別的編號,再返回修改,這樣就簡單多了。
我們嘗試生成了埃及貓(285)和大熊貓(388)的樣本:
可以發(fā)現(xiàn),埃及貓的眼神不太對,大熊貓有點營養(yǎng)不良。論文給出的結(jié)果很真實自然,但在這個 Colab 實驗中我們也能發(fā)現(xiàn)存在很多「不自然」的生成樣本。
接下來,我們來嘗試圖像插值任務。
如上圖所示,這個任務的可控參數(shù)有:樣本數(shù)量、插值數(shù)量、截斷值、噪聲種子、以及用于插值的圖像類別 A 和 B。樣本數(shù)量是指每次插值時類別 A 和類別 B 的的初始樣本數(shù)量,如下圖所示樣本數(shù)量為 2。下圖展示了一些示例,供大家參考。注意該圖像插值是生成樣本之間的插值,所以左右兩側(cè)的原圖也會有些不自然。
圖像插值結(jié)果示例,其中樣本數(shù)量為 2、插值數(shù)量為 5、截斷值為 0.2、噪聲種子為 0、類別 A 為金毛、類別 B 為雞。
其它參數(shù)不變,插值數(shù)量為 10 的插值結(jié)果示例。
金毛和埃及貓的圖像插值結(jié)果。
知道怎么用了吧?自己去耍吧~
評論