<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 市場分析 > 74KB圖片也高清，谷歌用神經(jīng)網(wǎng)絡(luò)打造圖像壓縮新算法

74KB圖片也高清，谷歌用神經(jīng)網(wǎng)絡(luò)打造圖像壓縮新算法

作者：時(shí)間：2020-09-14 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　還在為圖像加載犯愁嗎？
　　最新的好消息是，谷歌團(tuán)隊(duì)采用了一種GANs與基于神經(jīng)網(wǎng)絡(luò)的壓縮算法相結(jié)合的圖像壓縮方式HiFiC，在碼率高度壓縮的情況下，仍能對圖像高保真還原。
　　GAN（Generative Adversarial Networks，生成式對抗網(wǎng)絡(luò)）顧名思義，系統(tǒng)讓兩個神經(jīng)網(wǎng)絡(luò)相互「磨煉」，一個神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)生成接近真實(shí)的數(shù)據(jù)，另一個神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)區(qū)分真實(shí)數(shù)據(jù)與生成的數(shù)據(jù)。
　　簡單來說，就是一個神經(jīng)網(wǎng)絡(luò)「造假」，另一個神經(jīng)網(wǎng)絡(luò)「打假」，而當(dāng)系統(tǒng)達(dá)到平衡時(shí)，生成的數(shù)據(jù)看起來便會非常接近真實(shí)數(shù)據(jù)，達(dá)到「以假亂真」的效果。
　　下面是這種算法展現(xiàn)出來的圖像與JPG格式圖像的對比。
　　可見，在圖像大小接近的情況下（HiFiC大小74kB，JPG圖像大小78kB），算法所展現(xiàn)出來的圖像壓縮效果要好得多。

本文引用地址：http://www.ex-cimer.com/article/202009/418286.htm

　　而在與原圖進(jìn)行對比時(shí)，HiFiC所展現(xiàn)出來的還原效果仍然非常優(yōu)秀。（真的不是在原圖中間畫了條線嗎？）

　　目前處于特殊時(shí)期，大量國外網(wǎng)友仍在家中隔離，Netflix和油管的播放量暴增，一些視頻網(wǎng)站甚至不得不被迫降低視頻在線播放的清晰度，以適應(yīng)激增的數(shù)據(jù)量。
　　但看慣了高清視頻的網(wǎng)友們，面對突如其來的「模糊打擊」自然怨聲載道。
　　用一位網(wǎng)友的話來說，如果視頻行業(yè)也能被應(yīng)用類似的技術(shù)，相信Netflix和油管會特別高興，畢竟這種高清低碼率的圖像復(fù)原實(shí)在太誘惑。

　　哇，如果他們可以對視頻做同樣的事情的話，我相信Netflix和YouTube會很高興的。
　　事實(shí)上，在了解HiFiC算法的原理后，會發(fā)現(xiàn)它的確不難實(shí)現(xiàn)。
接近原圖的圖像重構(gòu)算法
　　此前，相關(guān)研究已有采用神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像壓縮的算法，而隨著近年來生成式對抗網(wǎng)絡(luò)興起，采用GANs生成以假亂真圖像的算法也不在少數(shù)。
　　如果能有辦法將二者結(jié)合，圖像壓縮的效果是不是會更好、更接近于人類的感知？
　　這次圖像壓縮的模型便是基于二者的特性設(shè)計(jì)，在基于神經(jīng)網(wǎng)絡(luò)的壓縮圖像算法基礎(chǔ)上，采用GANs進(jìn)一步讓生成的圖片更接近于人類視覺，在圖像大小和視覺感知間達(dá)到一個平衡。

　　可以看見，HiFiC的架構(gòu)被分成了4個主要部分，其中E為編碼器，G為生成器，D為判別器，而P則是E的輸出E(x)的概率模型（這里用y表示），也就是P用于模擬y的概率分布。
　　GANs運(yùn)作的核心思想在于，需要讓架構(gòu)中的生成器G通過某種方法，「欺騙」判別器D判定樣本為真。
　　而概率模型P，則是達(dá)成這步操作的條件。
　　然后，將E、G、P參數(shù)化為卷積神經(jīng)網(wǎng)絡(luò)，這樣就可以通過率失真優(yōu)化的條件，對這些網(wǎng)絡(luò)進(jìn)行共同訓(xùn)練。
　　同時(shí)，研究者也對已有的幾種GANs算法架構(gòu)進(jìn)行了微調(diào)，使其更適于HiFiC架構(gòu)。
　　研究發(fā)現(xiàn)，將GANs與深度學(xué)習(xí)相結(jié)合的HiFiC算法取得了意想不到的效果。
模型評估
　　下圖是采用目前幾種主流圖像質(zhì)量評估標(biāo)準(zhǔn)，對幾種前沿的圖像壓縮算法與HiFiC算法進(jìn)行比較的結(jié)果。

　　在圖中，評估標(biāo)準(zhǔn)后面自帶的箭頭，表示數(shù)據(jù)更低（↓）或數(shù)據(jù)更高（↑）表示圖像質(zhì)量更好。
　　為了更好地對比，結(jié)果分別采用了HiFiC算法（圖中紅點(diǎn)連線）、不帶GANs的對比算法（圖中橙方連線）、目前較為前沿的M&S算法（圖中藍(lán)方連線）和BPG算法（圖中藍(lán)點(diǎn)連線）。
　　從結(jié)果來看，HiFiC算法在FID、KID、NIQE、LPIPS幾種評估標(biāo)準(zhǔn)均為最優(yōu)，而在MS-SSIM和PSNR標(biāo)準(zhǔn)中表現(xiàn)一般。
　　由評估標(biāo)準(zhǔn)間的差異可見，各項(xiàng)圖像質(zhì)量標(biāo)準(zhǔn)不一定是判斷壓縮技術(shù)的最好辦法。
用戶評測對比
　　畢竟，圖像是用來看的，最終的判斷權(quán)還得交回用戶手里。
　　圖像究竟是否「清晰」，某種程度上得通過人眼的判斷來決定。
　　出于這個考慮，團(tuán)隊(duì)采取了調(diào)研模式，讓一部分志愿者參與算法的比較。
　　他們先展示一張測試圖片的隨機(jī)裁切圖樣，當(dāng)志愿者對其中某張裁切圖樣感興趣時(shí)，便用這一部分來進(jìn)行所有算法的對比。
　　志愿者將原圖與經(jīng)過算法處理后的圖像對比后，選出他們認(rèn)為「視覺上」更接近于原圖的壓縮算法。
　　在所有算法經(jīng)過選取后，將會出現(xiàn)一個排名，以衡量HiFiC的實(shí)際效果。（其中，HiFiC的角標(biāo)Hi、Mi和Lo分別為設(shè)置由高至低3種不同碼率閾值時(shí)的算法）

上圖中，評分越低，則代表圖像在用戶眼中「越清晰」。從圖中來看，HiFiC(Mi)在0.237bpp的壓縮效果下，甚至比兩倍碼率的0.504bpp的BPG算法在用戶眼里還要更好。
　　即使壓縮效果達(dá)到了0.120bpp，也比0.390bpp的BPG算法更好。
　　這項(xiàng)研究再次推動了圖像壓縮技術(shù)的發(fā)展，正如網(wǎng)友所說，隨著圖像壓縮技術(shù)的發(fā)展，在線看4k電影也許真能實(shí)現(xiàn)。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：谷歌 HiFiC 壓縮算法

評論

相關(guān)推薦

谷歌Tensor G5芯片或已進(jìn)入流片階段，基于臺積電3nm制程

EDA/PCB 谷歌 Tensor G5芯片 AI | 2024-07-02

LHARC中的動態(tài)限長編碼壓縮算法

資源下載動態(tài)限長編碼壓縮算法 | 2009-10-13

谷歌 Pixel 9 系列手機(jī)提前至8月14日發(fā)布

谷歌 Pixel 手機(jī) | 2024-06-27

谷歌工程師批評 OpenAI，稱其延緩 AGI 研究進(jìn)展

智能計(jì)算 AI 智能計(jì)算谷歌 AGI | 2024-06-12

IT企業(yè)CEO薪水揭秘 IBM居高惠普谷歌有點(diǎn)冤

wxy_88kl | 2008-04-28

大嘴業(yè)話：如何打敗蘋果

視頻蘋果三星安卓谷歌 | 2012-09-21

SDN面臨的非技術(shù)性挑戰(zhàn)

設(shè)計(jì)方案 SDN 谷歌電信運(yùn)營商投資回報(bào)率 | 2015-07-28

谷歌中國喊冤稱互聯(lián)網(wǎng)地圖無法可依

felixwoo | 2008-05-08

突破傳統(tǒng)手機(jī)應(yīng)用框架　Google平臺讓溝通更傳神

資源下載突破傳統(tǒng) 手機(jī) 應(yīng)用框架谷歌平臺讓溝通更傳神 | 2013-09-22

谷歌Google Android娛樂安全功能創(chuàng)新意

資源下載谷歌 Google Android 娛樂安全功能創(chuàng)新 | 2013-09-22

文件顯示蘋果訓(xùn)練AI用了谷歌TPU芯片

智能計(jì)算蘋果 AI 谷歌 TPU芯片 | 2024-06-12

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

消息稱谷歌Tensor G5芯片已流片預(yù)計(jì)采用3nm制程

EDA/PCB 谷歌 Tensor G5 芯片 3nm制程 | 2024-07-02

挑戰(zhàn)蘋果！曝谷歌自研Soc Tensor G5進(jìn)入流片階段：臺積電代工

手機(jī)與無線通信谷歌 Soc 臺積電 Pixel | 2024-07-05

ITU-G.729語音編碼的源代碼

資源下載語音編碼壓縮算法 ITU-G.729 | 2007-12-28

蓄謀已久的谷歌與居安思危的百度

wxy_88kl | 2008-04-25

谷歌行政總廚跳槽Facebook

wxy_88kl | 2008-04-08

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計(jì)算 openAI SearchGPT 谷歌 | 2024-07-26

谷歌已經(jīng)與臺積電達(dá)成合作：首款芯片為Tensor G5，選擇3nm工藝制造

EDA/PCB 谷歌臺積電 Tensor G5 3nm 工藝 | 2024-06-24

小波分析及在SST 圖像仿真壓縮中的應(yīng)用

資源下載 SST 圖像壓縮小波分析嵌入式小波零樹編碼 SPIHT 壓縮算法 | 2007-04-19

谷歌母公司Q2營收847億美元凈利潤236億同比增29%

智能計(jì)算谷歌母公司 Q2 營收 Alphabet 云收入云服務(wù) | 2024-07-24

谷歌推出Friend Connect 提供共享社交服務(wù)

wxy_88kl | 2008-05-14

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();