<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > AI要完爆人類？一文讀懂AlphaGo Zero的偉大與局限

AI要完爆人類？一文讀懂AlphaGo Zero的偉大與局限

作者：時(shí)間：2017-10-23 來(lái)源：雷鋒網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

　　2017年10月19日，DeepMind團(tuán)隊(duì)重磅發(fā)布AlphaGo Zero，再次震驚世人。相比上一代AlphaGo，該版本的AlphaGo實(shí)現(xiàn)了在AI發(fā)展中非常有意義的一步——”無(wú)師自通“，這也讓去年敗在未升級(jí)版本AlphaGo Master下的中國(guó)棋手柯潔驚呼”人類太多余了“。

本文引用地址：http://www.ex-cimer.com/article/201710/370379.htm

　　

　　相信看過(guò)之前的報(bào)道都知道，AlphaGo Zero的先進(jìn)之處是可以完全從零開始，不需要任何歷史棋譜的指引，更不需要參考人類任何的先驗(yàn)知識(shí)，完全靠自己通過(guò)強(qiáng)化學(xué)習(xí)(Reinforcement Learning )，左右互搏來(lái)增長(zhǎng)棋藝，最終達(dá)到百戰(zhàn)百勝。

　　那是不是就代表AI從此將進(jìn)入到無(wú)需人類知識(shí)，不受人類控制的時(shí)代 ?顯然還達(dá)不到。

　　要想理解為什么，首先從圍棋這個(gè)游戲說(shuō)起。圍棋是一種對(duì)弈游戲，具體來(lái)說(shuō)就是信息透明，規(guī)則透明，結(jié)構(gòu)明確，并且可用規(guī)則是可以窮舉的。而如果到了一些數(shù)據(jù)無(wú)法窮舉的領(lǐng)域，如語(yǔ)音識(shí)別，圖像識(shí)別，自動(dòng)駕駛等，AlphaGo Zero中的算法很難遷移過(guò)來(lái)，也很難“無(wú)師自通”。

　　那AlphaGo Zero中的算法可以借鑒到哪些領(lǐng)域?他的核心技術(shù)是什么?他的偉大之處又是在哪里?這還得請(qǐng)AI科學(xué)家來(lái)談一談。AI科技評(píng)論得知，此版本的AlphaGo所采用的核心技術(shù)就是出自華人團(tuán)隊(duì)研究的深度殘差網(wǎng)絡(luò)(ResNet)。就此背景，雷鋒網(wǎng)(公眾號(hào)：雷鋒網(wǎng))聯(lián)系到了深度殘差網(wǎng)絡(luò)ResNet作者之一孫劍博士來(lái)對(duì)這次的技術(shù)升級(jí)做闡述。ResNet技術(shù)正是他在微軟亞洲研究院時(shí)期的發(fā)明。

曠視首席科學(xué)家，曠視研究院院長(zhǎng)孫劍博士

　　曠視首席科學(xué)家，曠視研究院院長(zhǎng)孫劍博士

　　在他看來(lái)，本次技術(shù)提升足夠偉大，但同樣在真實(shí)技術(shù)落地過(guò)程中有著眾多局限，并指出未來(lái)的主流深度學(xué)習(xí)技術(shù)還將會(huì)圍繞大數(shù)據(jù)訓(xùn)練模式的方式。換句話說(shuō)，AI想脫離人類控制還為時(shí)尚早。

　　孫劍博士在接受雷鋒網(wǎng)的采訪過(guò)程中說(shuō)道：“AlphaGo Zero的偉大之處是第一次讓機(jī)器可以不通過(guò)任何棋譜，不通過(guò)任何人類的經(jīng)驗(yàn)，在只告訴規(guī)則的前提下就實(shí)現(xiàn)了成為一個(gè)圍棋高手，這種無(wú)師自通的學(xué)習(xí)模式在AI整個(gè)發(fā)展上是非常有里程碑意義的?！睂O劍博士講到AlphaGo Zero的技術(shù)意義時(shí)講到，“但是同時(shí)這種無(wú)師自通在很多AI落地上也存在一些局限，因?yàn)閲?yán)格的講，圍棋規(guī)則和判定棋局輸贏也是一種監(jiān)督信號(hào)，所以嚴(yán)格意義上來(lái)講，說(shuō)人類無(wú)用，或者說(shuō)機(jī)器可以自己產(chǎn)生認(rèn)知都是對(duì)AlphaGo Zero理解的不精確?！?/p>

　　在很多AI行業(yè)落地中，實(shí)際上弱監(jiān)督學(xué)習(xí)或無(wú)監(jiān)督或者所謂的無(wú)師自通還是無(wú)法在短期成為主流。比如，就人臉識(shí)別來(lái)講，這個(gè)能力是人類后天學(xué)習(xí)的能力，是通過(guò)時(shí)間不斷演化出來(lái)的一種生存能力，人只有具備了人臉識(shí)別能力，人類社會(huì)才能正常運(yùn)轉(zhuǎn)，把這種后天能力輸出給機(jī)器，其實(shí)就需要人的監(jiān)督信號(hào)。除了人臉識(shí)別，還有很多人工智能研究的方向，比如自然語(yǔ)言處理，都是在模擬人類的一種技能。讓機(jī)器實(shí)現(xiàn)這種任務(wù)就需要海量的數(shù)據(jù)與更多的信號(hào)輸入。再比如醫(yī)學(xué)領(lǐng)域的圖像識(shí)別—AI醫(yī)學(xué)影像讀圖主要依賴于高水平醫(yī)生對(duì)影像的數(shù)據(jù)精標(biāo)，從而機(jī)器學(xué)習(xí)對(duì)疾病的識(shí)別，這關(guān)乎于人的生命問(wèn)題，自然馬虎不得。所以今天，甚至今后很長(zhǎng)一段時(shí)間內(nèi)，監(jiān)督學(xué)習(xí)依然是AI研究與AI商業(yè)化的主流方向。

　　關(guān)于AlphaGo Zero中的算法可以借鑒到哪些領(lǐng)域?孫劍博士沒有直接給出答案，而是總結(jié)了此算法為何能在圍棋領(lǐng)域表現(xiàn)如此出色的幾點(diǎn)原因。首先，圍棋它沒有噪聲，能夠完美重現(xiàn)算法;其次圍棋中的黑白子雙方的信息是完全可觀測(cè)的。最后，也是他認(rèn)為最重要的一點(diǎn)，圍棋對(duì)局可以用計(jì)算機(jī)迅速模擬，很快輸出輸贏信號(hào)?？匆粋€(gè)領(lǐng)域是否能借鑒此算法，基本就要看是否滿足以上三點(diǎn)。

　　AlphaGo的秘密武器：兩大核心要素實(shí)現(xiàn)極簡(jiǎn)算法

　　其實(shí)AlphaGo Zero里面并沒有新的巨大的理論突破，它使用的白板學(xué)習(xí)，早在之前的圍棋系統(tǒng)Creazy Stone中就有用過(guò)。最主要還是用到了孫劍博士發(fā)明的ResNet技術(shù)，談到該技術(shù)時(shí)，他講到： ”AlphaGo Zero的搜索過(guò)程簡(jiǎn)化了很多，例如把以前系統(tǒng)中的兩個(gè)網(wǎng)絡(luò)合并成一個(gè)網(wǎng)絡(luò)、將深度殘差網(wǎng)絡(luò)的輸入做最簡(jiǎn)化。談到本次AlphaGo Zero在技術(shù)特點(diǎn)，他認(rèn)為是“把19x19棋局圖像直接送給神經(jīng)網(wǎng)絡(luò)，讓神經(jīng)網(wǎng)絡(luò)看著棋盤做決策，這個(gè)非常簡(jiǎn)潔?！?/p>

　　AI科技評(píng)論認(rèn)為DeepMind的這一成果的啟發(fā)意義大于借鑒意義。與其想著把算法照搬過(guò)來(lái)，不如朝AlphaGo Zero啟發(fā)的方向探索。在與孫劍博士在采訪交流中，他表示本次AlphaGo Zero的提升主要有兩個(gè)核心要素，一個(gè)是啟發(fā)式搜索，一個(gè)是深度殘差神經(jīng)網(wǎng)絡(luò)，而這兩個(gè)又非常完美的實(shí)現(xiàn)了結(jié)合。其中啟發(fā)式搜索的思想非常樸素，是個(gè)針對(duì)問(wèn)題設(shè)計(jì)的一個(gè)高級(jí)定制版蒙特卡洛數(shù)搜索算法。另外一個(gè)核心要素是深度殘差神經(jīng)網(wǎng)絡(luò)，讓簡(jiǎn)單的搜索算法極大的提升了效率。

　　深度殘差神經(jīng)網(wǎng)絡(luò)在2015年由孫劍在微軟領(lǐng)導(dǎo)的視覺團(tuán)隊(duì)老師率先提出，并在當(dāng)年在ImageNet以及COCO兩大學(xué)術(shù)競(jìng)賽中包攬五項(xiàng)冠軍，其中最重要的部分就是實(shí)現(xiàn)了突破性的152層的網(wǎng)絡(luò)深度，從而讓一些非常復(fù)雜的函數(shù)做映射時(shí)效率與有效性得到極大的提升。強(qiáng)大的網(wǎng)絡(luò)使得AlphaGo Zero已經(jīng)可以有能力學(xué)習(xí)把每一子下在那里的概率和對(duì)整個(gè)棋局的判斷算的非常準(zhǔn)確。

　　開放與互通是AI通往未來(lái)之路的不二法則

　　今年，中國(guó)發(fā)布了人工智能戰(zhàn)略規(guī)劃，起碼從國(guó)家層面上是認(rèn)可AI能給社會(huì)帶來(lái)巨大進(jìn)步。在講到AI的未來(lái)發(fā)展中，孫劍博士強(qiáng)調(diào)了開放與互通兩個(gè)詞。他講到他現(xiàn)在在曠視研究院每天第一件事情就是去網(wǎng)上開放的論文平臺(tái)ArXiv看是否有新的、有意思的論文、思想發(fā)出來(lái)。

　　最后雷鋒網(wǎng)問(wèn)道，ResNet被應(yīng)用到AlphaGo Zero上，您有什么感受?孫劍博士表示：“這次應(yīng)用在AlphaGo Zero中的ResNet殘差神經(jīng)網(wǎng)絡(luò)，曾獲得了CVPR 2016的最佳論文獎(jiǎng)，我也非常高興這個(gè)技術(shù)可以應(yīng)用在AlphaGo Zero系統(tǒng)中，而這個(gè)應(yīng)用過(guò)程其實(shí)并不需要我們直接進(jìn)行接觸而是一種研究成果的交流，人工智能研究最前沿的開源與開放，才能讓我們?cè)谧非蟾鼉?yōu)解的過(guò)程中有很多參考與理論支撐，可以極大的提升新技術(shù)產(chǎn)生的周期?！?/p>

　　孫劍博士還介紹到，曠視研究院今后還會(huì)不斷分享、開放研究成果。今年7月份，曠視研究院在ArXiv公開了一篇ShuffleNet的論文，是一種可以運(yùn)行在很多移動(dòng)端上非常低能耗的神經(jīng)網(wǎng)絡(luò)算法，可以說(shuō)是專為移動(dòng)端而生的算法。發(fā)布至今不光有硬件產(chǎn)品、手機(jī)解鎖產(chǎn)品使用，同時(shí)也有很多同行在使用。

　　雷鋒網(wǎng)AI科技評(píng)論小結(jié)：AlphaGo Zero雖沒有新的突破性的技術(shù)，但這絲毫不影響它的偉大，它能夠完美集成已有的技術(shù)，給研究者帶來(lái)新的啟發(fā)，本身已具有里程碑式的意義。他的局限在于目前只能運(yùn)用到特定領(lǐng)域，不過(guò)，換個(gè)角度來(lái)看，這對(duì)于人類來(lái)說(shuō)未必不是好事兒?？傊珹I 還有很長(zhǎng)的路要走，還需要更多像孫劍博士這樣的科學(xué)家們，不斷借助創(chuàng)新而實(shí)現(xiàn)更多的創(chuàng)新，不斷借助偉大的思想創(chuàng)造偉大的場(chǎng)景。只有不斷的開放最好的認(rèn)知，才能讓AI不斷成長(zhǎng)，讓更多更強(qiáng)的AlphaGo Zero產(chǎn)生。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI 自動(dòng)駕駛

評(píng)論

相關(guān)推薦

Meta發(fā)布“前沿級(jí)”開源AI模型扎克伯格：不怕競(jìng)爭(zhēng)者使用

智能計(jì)算 Meta 開源 AI 模型扎克伯格 | 2024-07-24

海聯(lián)達(dá)（Aigale）Ai-HD1 無(wú)線全高清套件拆解

zhuwei0710 | 2013-04-28

自動(dòng)駕駛：車載系統(tǒng)方案中都有哪些奇招？

晴朗雨 | 2017-03-22

傳感器融合：如何讓自動(dòng)駕駛“看”得更清楚？

物聯(lián)網(wǎng)與傳感器傳感器自動(dòng)駕駛 | 2024-07-23

未來(lái)汽車與數(shù)據(jù)安全談信息化背后的安全隱憂

設(shè)計(jì)方案汽車安全自動(dòng)駕駛 ECU 多模加密 | 2015-06-27

WTC-AI型太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

76-81GHz自動(dòng)駕駛CMOS RADAR

視頻 ADI 自動(dòng)駕駛 CMOS RADAR | 2018-05-31

攜手ADI贏得未來(lái)

視頻 ADI 自動(dòng)駕駛醫(yī)療健康 | 2019-11-08

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

詳解無(wú)人駕駛四個(gè)階段技術(shù)特征

設(shè)計(jì)方案無(wú)人駕駛自動(dòng)駕駛機(jī)械 | 2015-09-10

WTC-AI太陽(yáng)能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

AI 芯片：一場(chǎng)燒錢的瘋狂競(jìng)賽

智能計(jì)算 AI 芯片 | 2024-07-24

為自動(dòng)駕駛共同“把舵” ——自動(dòng)駕駛技術(shù)與產(chǎn)業(yè)預(yù)見研究主題沙龍

jackwang | 2017-12-18

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

HBM4持續(xù)加速：AI時(shí)代競(jìng)爭(zhēng)新焦點(diǎn)

網(wǎng)絡(luò)與存儲(chǔ) HBM AI 內(nèi)存 | 2024-07-25

國(guó)際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

CSR8670CSR8675智能語(yǔ)音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

消息稱 OpenAI 公司 2024 年資金缺口達(dá)到 50 億美元

智能計(jì)算 OpenAI ChatGPT AI | 2024-07-25

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

AI當(dāng)靠山軟件大廠SAP裁員擴(kuò)大至上萬(wàn)

智能計(jì)算 AI 軟件 SAP 裁員 | 2024-07-24

EEPW2017年5月刊(信息通信技術(shù)/5G)

資源下載信息通信技術(shù)/5G 車聯(lián)網(wǎng)＆自動(dòng)駕駛 | 2017-05-09

特斯拉第二季度凈利潤(rùn)同比下滑45%，F(xiàn)SD能否扭轉(zhuǎn)局勢(shì)？

特斯拉 FSD 自動(dòng)駕駛財(cái)報(bào) | 2024-07-25

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

萬(wàn)家樂(lè)JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬(wàn)家樂(lè) | 2013-01-17

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

ADI：傳感技術(shù)助力未來(lái)自動(dòng)駕駛的發(fā)展

視頻 ADI 自動(dòng)駕駛 | 2020-03-16

自動(dòng)駕駛的現(xiàn)狀與未來(lái)（節(jié)選）

視頻 ADI 自動(dòng)駕駛 | 2020-03-16

神經(jīng)網(wǎng)絡(luò)解決方案讓自動(dòng)駕駛成為現(xiàn)實(shí)

儀商城 | 2017-12-22

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();