<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > 如何設(shè)計(jì)容器來(lái)實(shí)踐AI模型的PnP

          如何設(shè)計(jì)容器來(lái)實(shí)踐AI模型的PnP

          作者:高煥堂 時(shí)間:2023-10-30 來(lái)源:電子產(chǎn)品世界 收藏


          本文引用地址:http://www.ex-cimer.com/article/202310/452243.htm

          1 前言

          在本專(zhuān)欄的前面文章《從隱空間看AIGC 的未來(lái)發(fā)展》里,曾經(jīng)提到了,今天全球AIGC 產(chǎn)業(yè)即將進(jìn)入產(chǎn)業(yè)的革命性的轉(zhuǎn)折點(diǎn),也逐漸浮現(xiàn)AI 模型( 集裝箱) 的身影。而AI 集裝箱將帶給碼頭( 隱空間) 一項(xiàng)美好的次序。一旦我們致力于制定AI 的規(guī)格,就會(huì)擁有主導(dǎo)未來(lái)AIGC 產(chǎn)業(yè)發(fā)展的話(huà)語(yǔ)權(quán)。

          于是,在本篇文章里,將繼續(xù)以實(shí)例詳細(xì)說(shuō)明AI的設(shè)計(jì)和實(shí)踐技術(shù)。

          2 以Stable Diffusion為例

          首先觀(guān)察SD (Stable Diffusion) 的基本架構(gòu),如圖1。

          1698672574702229.png

          圖1 Stable Diffusion的基本架構(gòu)

          (https://zhuanlan.zhihu.com/p/621325215)

          這圖里的中間( 藍(lán)色) 部分就是隱空間(Latent space) 所在,它內(nèi)含一個(gè)UNet 模型,如圖2。

          1698672635613103.png

          圖2 SD內(nèi)含的UNet模型

          (https://zhuanlan.zhihu.com/p/621325215)

          于是,得到了詳細(xì)的SD隱空間擴(kuò)散(Diffusion) 架構(gòu)圖,如圖3。

          1698672706290244.png

          圖3 SD隱空間擴(kuò)散架構(gòu)圖

          (https://ommer-lab.com/research/latent-diffusion-models/ )

          這個(gè)隱空間里,最核心的是UNet 模型。它本身也是一個(gè)容器( 如同集裝箱),內(nèi)含有QKV 等小模型等。于是,就可以設(shè)計(jì)一個(gè)AI 模型容器來(lái)表示它,例如使用指令:

          class UNetModel(nn.Module):

          ……………

          ……………

          ……………

          這里的UNet 模型就如同< 信紙> 的角色。有了信紙之后,就可以來(lái)設(shè)計(jì)一項(xiàng)更大的< 信箱> 容器了,例如使用指令:

          class LatentDiffusion(nn.Module):

          ……………

          ……………

          于是,有了UNet 模型( 信紙),也有了Diffusion模型( 信封),也有了隱空間( 信箱)。如果拿物流貨運(yùn)來(lái)比喻,這里的UNet 模型就如同< 集裝箱> 的角色,而Diffusion 模型就如同< 輪船> 的角色,而隱空間就如同< 碼頭> 的角色。接著,就來(lái)實(shí)際觀(guān)摩一下SD 的源代碼,從Github 上可以看到SD 的源代碼。

          1698672867927922.png

          進(jìn)入這網(wǎng)頁(yè)之后,就繼續(xù)瀏覽這些源代碼,就可以看到它定義了一個(gè)UNetModel 模型,這就是剛才所說(shuō)的< 信紙> 模型。

          1698684059222265.png

          再繼續(xù)瀏覽源代碼,也就可以看到它定義了一個(gè)LatentDiffusion模型,這就是剛才所說(shuō)的< 信封> 模型。

          1698684102973294.png

          從上述的信紙與信封的比喻,可以領(lǐng)會(huì)出來(lái):無(wú)論信紙、信封或信箱,都是容器互相包容起來(lái)。例如,SD 的LatentDiffusion 包容了UNetModel 小模型, 而UNetModel 又包容了QKV 更小的模型,于是呈現(xiàn)出「序中有亂」的景象。也就是,容器( 如集裝箱) 的外表簡(jiǎn)單有序,因而創(chuàng)造出井然有序。這即是通稱(chēng)的:有機(jī)次序(Organic order)。

          3 演練:動(dòng)手設(shè)計(jì)容器

          步驟1 設(shè)計(jì)小模型

          首先撰寫(xiě)一個(gè)能將灰階圖像彩繪( 渲染) 為彩色圖像的GAN( 生成對(duì)抗) 模型,如下代碼。

          1698684161223283.png

          然后,收集數(shù)十張畢加索(Picasso) 的圖像來(lái)訓(xùn)練它。

          步驟2設(shè)計(jì)容器模型

          訓(xùn)練好了小模型,就可以繼續(xù)撰寫(xiě)一個(gè)容器模型來(lái)包容它( 即剛才的GANModel 模型)。這個(gè)容器模型的代碼如下。

          1698684192229523.png

          在這個(gè)范例里,這個(gè)容器模型包含了一個(gè)自己訓(xùn)練的GANModel小模型。此外,還包含了一個(gè)由OpenCV所提供的FSRCNN 小模型。這FSRCNN 是OpenCV 提供的預(yù)訓(xùn)練模型,其圖像放大的效果,比傳統(tǒng)做法好很多( 例如,沒(méi)有明顯的鋸齒狀邊緣)。

          步驟3 運(yùn)行容器模型

          于是, 這個(gè)容器模型就可以將原始圖像( 如224×224 的JPG 圖像) 透過(guò)FSRCNN 來(lái)放大3 倍,然后交由GAN 模型來(lái)自動(dòng)渲染出大張的圖像( 即672×672 JPG 圖像),如圖4 所示。

          1698684229383055.png

          圖4 讓AI自由渲染Picasso的畫(huà)作

          對(duì)于藝術(shù)文創(chuàng)者而言,AI 可以激發(fā)人們更多想象空間,例如上圖里的GAN 模型是學(xué)習(xí)Picasso 畫(huà)風(fēng),而自動(dòng)渲染出來(lái)的。這個(gè)模型也可以輸入八大山人的畫(huà)作,然后AI 彩繪出Picasso 的色彩風(fēng)格,成為中西合璧的創(chuàng)新作品。

          4 美好效果:易于

          剛才所設(shè)計(jì)的容器模型可以確保內(nèi)含個(gè)小模型( 如GAN、FSRCNN 模型) 的變動(dòng)自由度,來(lái)實(shí)現(xiàn)這些小模型皆能容易(Plug and Play),呈現(xiàn)出流暢新陳代的美好效果。因此創(chuàng)造了完美的有機(jī)次序(Organic Order)。例如,隨時(shí)能流暢的將上述的彩繪GAN 模型汰換掉,重新設(shè)計(jì)一個(gè)新的小模型--- 彩繪UNET模型,如圖5。

          1698684292861807.png

          圖5 讓AI自由渲染八大山人的畫(huà)作

          此時(shí),只需要更改這FSRCNN 容器模型內(nèi)部的代碼即可,并不會(huì)產(chǎn)生漣漪效應(yīng),因而降低了更換小模型的成本。

          5 結(jié)語(yǔ)

          本文展示了如何遷移第三方的預(yù)訓(xùn)練模型,復(fù)用(Reuse) 他人的智慧來(lái)設(shè)計(jì)& 開(kāi)發(fā)自己的容器(Container)模型。并且展示了一項(xiàng)美好商業(yè)效益:能復(fù)用于各種不同的需求情境,并獲得小模型 的效果。

          (本文來(lái)源于EEPW 2023年10月期)



          關(guān)鍵詞: 202310 容器 AI模型 PnP

          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();