<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 業(yè)界動(dòng)態(tài) > 【E課堂】一文帶你了解谷歌AlphaGo是怎樣煉成的？

【E課堂】一文帶你了解谷歌AlphaGo是怎樣煉成的？

作者：時(shí)間：2017-04-11 來(lái)源：網(wǎng)易智能

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

　　李世石對(duì)戰(zhàn)AlphaGo慘敗之后，期待中國(guó)選手柯潔為人類圍棋而戰(zhàn)的呼聲就越來(lái)越高，從未停止!

本文引用地址：http://www.ex-cimer.com/article/201704/346432.htm

　　如今，柯潔終于來(lái)到舞臺(tái)中央，將于5月23日-27日在中國(guó)烏鎮(zhèn)圍棋峰會(huì)與AlphaGo一戰(zhàn)高下!屆時(shí)，AlphaGo與世界排名第一的柯潔將完成三番棋對(duì)弈，此次比賽除了AlphaGo與柯潔的世紀(jì)對(duì)戰(zhàn)之外，還會(huì)采用團(tuán)隊(duì)賽、配對(duì)賽的多種形式，中國(guó)圍棋代表隊(duì)其他成員也將參與。那么，AlphaGo究竟是什么?它是如何煉成的?網(wǎng)易智能帶您一一解讀。

　　歡迎參與投票對(duì)于這次人機(jī)大戰(zhàn)，你看好柯潔還是AlphaGo

　　毫無(wú)懸念!AlphaGo穩(wěn)贏。

　　柯潔水平高超，我認(rèn)為柯潔贏。

　　一半一半吧，我還沒想好。查看結(jié)果起止時(shí)間：2017-04-10 至 2017-04-17

　　AlphaGo是什么?

　　AlphaGo是第一個(gè)擊敗人類職業(yè)圍棋選手，第一個(gè)戰(zhàn)勝世界冠軍的程序，是圍棋史上最具實(shí)力的選手之一。2016年3月，在全世界超過一億觀眾的關(guān)注下，Alpha Go經(jīng)過3局對(duì)弈，最終以4比1的總比分戰(zhàn)勝了圍棋世界冠軍李世石，這場(chǎng)比賽成為了人工智能領(lǐng)域的一個(gè)重要里程碑。

　　

一文帶你了解谷歌AlphaGo是怎樣煉成的？

　　過去曾有專家預(yù)測(cè)人工智能需要十年的時(shí)間才有可能戰(zhàn)勝人類職業(yè)選手，在這場(chǎng)比賽之后，AlphaGo憑借其"充滿創(chuàng)意而又機(jī)智"的下法，躋身圍棋界最高職業(yè)稱號(hào)——職業(yè)九段行列，成為歷史上首個(gè)獲得這一榮譽(yù)的非人類棋手。近期，AlphaGo的升級(jí)版本以“Master/Magister”的稱謂與世界頂級(jí)的圍棋選手進(jìn)行60場(chǎng)線上快棋賽，并取得了全勝的出色戰(zhàn)績(jī)。

　　AlphaGo是如何進(jìn)行訓(xùn)練的?

　　一直以來(lái)，圍棋就被認(rèn)為是傳統(tǒng)游戲中，對(duì)人工智能而言最具挑戰(zhàn)性的項(xiàng)目，這不僅僅是因?yàn)閲灏她嫶蟮乃阉骺臻g，更是因?yàn)閷?duì)于落子位置的評(píng)估難度已遠(yuǎn)運(yùn)超過了簡(jiǎn)単的啟發(fā)式算法。為了應(yīng)對(duì)圍棋的巨大復(fù)雜性，AlphaGo采用了一種新穎的機(jī)器學(xué)習(xí)技術(shù)，結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)，通過訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò)(policy network)，將棋盤上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成一個(gè)概率分布。

　　

一文帶你了解谷歌AlphaGo是怎樣煉成的？

　　然后，訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)(value network)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè)，以-1(對(duì)手的絕對(duì)勝利)到1(AlphaGo的絕對(duì)勝利)的標(biāo)準(zhǔn)，預(yù)測(cè)所有可行落子位置的結(jié)果。這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大，而AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹搜索(NCTS)中，實(shí)現(xiàn)了它真正的優(yōu)勢(shì)。最后，新版的AlphaGo產(chǎn)生大量自我對(duì)弈棋局，為下一代版本提供了訓(xùn)練數(shù)據(jù)，此過程循環(huán)往復(fù)。

　　

一文帶你了解谷歌AlphaGo是怎樣煉成的？

　　注意!此過程循環(huán)往復(fù)，我們?nèi)祟愋枰燥埿菹?，而這個(gè)比你聰明的選手還比你勤奮!

　　Alpha Go如何決定落子?

　　

一文帶你了解谷歌AlphaGo是怎樣煉成的？

　　

一文帶你了解谷歌AlphaGo是怎樣煉成的？

　　在獲取棋局信息后，Alpha Go會(huì)根據(jù)策略網(wǎng)絡(luò)(policy network)探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性，進(jìn)而決定最佳落子位置。在分配的搜索時(shí)間結(jié)束時(shí)，模擬過程中被系統(tǒng)最頻繁考察的位置將成為Alpha Go的最終選擇。在經(jīng)過先期的全盤探索和過程中對(duì)最佳落子的不斷揣摩后，Alpha Go的搜索算法就能在其計(jì)算能力之上加入近似人類的直覺判斷。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：谷歌 AlphaGo

評(píng)論

相關(guān)推薦

文件顯示蘋果訓(xùn)練AI用了谷歌TPU芯片

智能計(jì)算蘋果 AI 谷歌 TPU芯片 | 2024-06-12

谷歌工程師批評(píng) OpenAI，稱其延緩 AGI 研究進(jìn)展

智能計(jì)算 AI 智能計(jì)算谷歌 AGI | 2024-06-12

谷歌中國(guó)喊冤稱互聯(lián)網(wǎng)地圖無(wú)法可依

felixwoo | 2008-05-08

谷歌推出Friend Connect 提供共享社交服務(wù)

wxy_88kl | 2008-05-14

谷歌母公司Q2營(yíng)收847億美元凈利潤(rùn)236億同比增29%

智能計(jì)算谷歌母公司 Q2 營(yíng)收 Alphabet 云收入云服務(wù) | 2024-07-24

谷歌云計(jì)算部門再裁員，至少100名員工受影響

國(guó)際視野谷歌計(jì)算機(jī) 國(guó)際 | 2024-06-04

谷歌的電子書市場(chǎng)策略：隨時(shí)可讀之雲(yún)端閱讀

資源下載谷歌的電子書市場(chǎng) 策略 | 2013-09-22

谷歌Google Android娛樂安全功能創(chuàng)新意

資源下載谷歌 Google Android 娛樂安全功能創(chuàng)新 | 2013-09-22

SDN面臨的非技術(shù)性挑戰(zhàn)

設(shè)計(jì)方案 SDN 谷歌電信運(yùn)營(yíng)商投資回報(bào)率 | 2015-07-28

谷歌Tensor G5芯片或已進(jìn)入流片階段，基于臺(tái)積電3nm制程

EDA/PCB 谷歌 Tensor G5芯片 AI | 2024-07-02

谷歌行政總廚跳槽Facebook

wxy_88kl | 2008-04-08

挑戰(zhàn)蘋果！曝谷歌自研Soc Tensor G5進(jìn)入流片階段：臺(tái)積電代工

手機(jī)與無(wú)線通信谷歌 Soc 臺(tái)積電 Pixel | 2024-07-05

突破傳統(tǒng)手機(jī)應(yīng)用框架　Google平臺(tái)讓溝通更傳神

資源下載突破傳統(tǒng) 手機(jī) 應(yīng)用框架谷歌平臺(tái) 讓溝通更傳神 | 2013-09-22

消息稱谷歌Tensor G5芯片已流片預(yù)計(jì)采用3nm制程

EDA/PCB 谷歌 Tensor G5 芯片 3nm制程 | 2024-07-02

谷歌已經(jīng)與臺(tái)積電達(dá)成合作：首款芯片為Tensor G5，選擇3nm工藝制造

EDA/PCB 谷歌臺(tái)積電 Tensor G5 3nm 工藝 | 2024-06-24

蓄謀已久的谷歌與居安思危的百度

wxy_88kl | 2008-04-25

谷歌 Pixel 9 系列手機(jī)提前至8月14日發(fā)布

谷歌 Pixel 手機(jī) | 2024-06-27

IT企業(yè)CEO薪水揭秘 IBM居高惠普谷歌有點(diǎn)冤

wxy_88kl | 2008-04-28

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計(jì)算 openAI SearchGPT 谷歌 | 2024-07-26

大嘴業(yè)話：如何打敗蘋果

視頻蘋果三星安卓谷歌 | 2012-09-21

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();