芒果视频

網站分類

谷歌人工智能圍棋程序AlphaGo戰勝世界圍棋冠軍李世石

本文章由注冊用戶 智識分子 上傳提供 評論 發布 反饋 0
摘要:圍棋人機大戰,是人類與計算機之間的圍棋比賽,特指2016年3月9日至15日在韓國首爾進行的韓國圍棋九段棋手李世石與人工智能圍棋程序阿爾法圍棋AlphaGo之間的五番棋比賽。比賽采用中國圍棋規則,最終結果是人工智能阿爾法圍棋以總比分4比1戰勝人類代表李世石。

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

賽事背景

圍(wei)(wei)(wei)棋人(ren)機大戰(zhan)(zhan),源(yuan)于2016年1月27日英(ying)國《自然》雜志的(de)一篇(pian)文章(zhang)。這篇(pian)文章(zhang)稱(cheng),谷歌的(de)人(ren)工智能系統阿爾(er)法(fa)圍(wei)(wei)(wei)棋(AlphaGo)2015年10月份(fen)以5比0的(de)戰(zhan)(zhan)績完勝歐洲(zhou)冠軍、職(zhi)業圍(wei)(wei)(wei)棋二段(duan)樊(fan)麾(hui),這是人(ren)類歷史上,圍(wei)(wei)(wei)棋人(ren)工智能(AI)第一次在公平比賽中戰(zhan)(zhan)勝職(zhi)業圍(wei)(wei)(wei)棋手。

棋(qi)(qi)類(lei)(lei)(lei)游戲(xi)一(yi)直(zhi)被視為頂(ding)(ding)級人(ren)(ren)類(lei)(lei)(lei)智(zhi)力(li)的(de)(de)試金石。人(ren)(ren)工(gong)(gong)智(zhi)能(neng)(neng)與人(ren)(ren)類(lei)(lei)(lei)棋(qi)(qi)手(shou)的(de)(de)對抗一(yi)直(zhi)在(zai)上(shang)演,此前(qian)在(zai)三子棋(qi)(qi)、跳棋(qi)(qi)和(he)國際(ji)象(xiang)棋(qi)(qi)等棋(qi)(qi)類(lei)(lei)(lei)上(shang),計(ji)算機程(cheng)序都曾打(da)(da)敗過人(ren)(ren)類(lei)(lei)(lei)。在(zai)圍棋(qi)(qi)人(ren)(ren)機大戰之前(qian)的(de)(de)歷(li)史上(shang),最著名的(de)(de)人(ren)(ren)機大戰要數國際(ji)象(xiang)棋(qi)(qi)世(shi)界冠軍加里(li)·卡斯帕羅夫對國際(ji)象(xiang)棋(qi)(qi)人(ren)(ren)工(gong)(gong)智(zhi)能(neng)(neng)程(cheng)序“深藍”的(de)(de)國際(ji)象(xiang)棋(qi)(qi)比賽。1997年(nian),國際(ji)象(xiang)棋(qi)(qi)人(ren)(ren)工(gong)(gong)智(zhi)能(neng)(neng)第(di)一(yi)次(ci)打(da)(da)敗頂(ding)(ding)尖(jian)的(de)(de)人(ren)(ren)類(lei)(lei)(lei);2006年(nian),人(ren)(ren)類(lei)(lei)(lei)最后一(yi)次(ci)打(da)(da)敗頂(ding)(ding)尖(jian)的(de)(de)國際(ji)象(xiang)棋(qi)(qi)人(ren)(ren)工(gong)(gong)智(zhi)能(neng)(neng)。自(zi)那(nei)時起,歐(ou)美傳統里(li)的(de)(de)頂(ding)(ding)級人(ren)(ren)類(lei)(lei)(lei)智(zhi)力(li)游戲(xi)國際(ji)象(xiang)棋(qi)(qi),已(yi)經在(zai)電(dian)腦面前(qian)一(yi)敗涂地(di)。圍棋(qi)(qi)成了人(ren)(ren)類(lei)(lei)(lei)智(zhi)力(li)游戲(xi)最后的(de)(de)一(yi)塊高地(di)。

圍棋人工智(zhi)能(neng)長期以(yi)(yi)來(lai)舉(ju)步維艱(jian),頂級人工智(zhi)能(neng)甚至不能(neng)打(da)敗稍強的(de)(de)業余選(xuan)手。這似乎(hu)也合情合理(li)。因(yin)為要是人工智(zhi)能(neng)用暴力(li)(li)列舉(ju)所有情況的(de)(de)方(fang)式,圍棋需要計算的(de)(de)變化數(shu)量(liang)遠(yuan)遠(yuan)超過已經(jing)觀測到(dao)的(de)(de)宇宙中原子的(de)(de)數(shu)量(liang)。這一巨大的(de)(de)數(shu)目,足以(yi)(yi)令(ling)任何(he)蠻力(li)(li)窮舉(ju)者望而(er)卻步。而(er)人類,可以(yi)(yi)憑(ping)借某種難(nan)以(yi)(yi)復(fu)制(zhi)的(de)(de)算法跳過蠻力(li)(li),一眼看到(dao)棋盤的(de)(de)本質。

后來,人工(gong)智(zhi)能研(yan)究者們祭出了(le)終極(ji)殺器(qi)——“深(shen)度(du)(du)學(xue)習”。深(shen)度(du)(du)學(xue)習是(shi)人工(gong)智(zhi)能領域(yu)中的(de)(de)熱門科目,它能完(wan)成筆(bi)跡(ji)識別、面部識別、駕駛(shi)自動汽(qi)車、自然語言(yan)處理、識別聲音、分(fen)析生物信息數據等非(fei)常復雜的(de)(de)任務(wu)。谷(gu)歌(ge)人工(gong)智(zhi)能程序阿爾法(fa)圍棋(AlphaGo)就(jiu)是(shi)基于(yu)(yu)深(shen)度(du)(du)學(xue)習技(ji)術(shu)研(yan)究開發的(de)(de)。為了(le)測試(shi)阿爾法(fa)圍棋的(de)(de)水平,谷(gu)歌(ge)于(yu)(yu)2016年3月份向圍棋世界冠(guan)軍、韓國(guo)頂(ding)尖棋手(shou)李世石發起挑(tiao)戰。李世石接(jie)受(shou)挑(tiao)戰。

比賽規程

李世石(shi)與(yu)阿爾法圍棋(qi)的圍棋(qi)人機大戰為五(wu)番棋(qi)挑戰,但無論比(bi)分如何(he)將下滿五(wu)局,比(bi)賽采(cai)用(yong)中(zhong)國(guo)圍棋(qi)規則,執(zhi)黑一方(fang)(fang)貼3又3/4子(zi)(即7.5目),各(ge)方(fang)(fang)用(yong)時(shi)為2小時(shi),3次60秒(miao)的讀秒(miao)機會(hui)。五(wu)局比(bi)賽分別于2016年3月9日(ri)、3月10日(ri)、3月12日(ri)、3月13日(ri)和3月15日(ri)在韓國(guo)首爾鐘路區四季酒店進(jin)行,獲得三勝者獲得100萬美(mei)元(yuan)(yuan)獎金(約11億韓元(yuan)(yuan))。若(ruo)阿爾法圍棋(qi)獲勝,獎金將捐贈給(gei)聯(lian)合國(guo)兒童基(ji)金會(hui)、STEM教(jiao)育(yu)以及圍棋(qi)慈善機構。除了100萬美(mei)元(yuan)(yuan)基(ji)礎獎金外(wai),李世石(shi)還可(ke)獲得15萬美(mei)元(yuan)(yuan)出場費。此外(wai)每勝一局還有2萬美(mei)元(yuan)(yuan)勝局獎金,如果五(wu)盤全勝,勝局獎金為10萬美(mei)元(yuan)(yuan)。

賽程賽果

第一局

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

第一(yi)局:阿爾法圍棋執白中盤勝(sheng)李世石

2016年(nian)3月9日,圍(wei)(wei)棋(qi)(qi)(qi)人機大戰(zhan)(zhan)首局(ju)在韓國(guo)首爾(er)四季(ji)酒店打響(xiang)。賽前猜先(xian)(xian)(xian)阿(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)猜錯(cuo),李(li)世石選擇黑(hei)棋(qi)(qi)(qi),率先(xian)(xian)(xian)展(zhan)開(kai)布局(ju)。黑(hei)棋(qi)(qi)(qi)布局(ju)走(zou)出新型,阿(a)爾(er)法(fa)(fa)應對不(bu)佳,出現失(shi)誤。李(li)世石抓住(zhu)電腦布局(ju)不(bu)擅(shan)長(chang)應對新型的弱(ruo)點獲得(de)不(bu)錯(cuo)的局(ju)面。但(dan)圍(wei)(wei)棋(qi)(qi)(qi)的勝(sheng)負關鍵往(wang)往(wang)是中盤階段。阿(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)之后(hou)的下(xia)法(fa)(fa)變得(de)強硬,雙方展(zhan)開(kai)接觸戰(zhan)(zhan)。李(li)世石抓住(zhu)機會,圍(wei)(wei)住(zhu)一塊大空,在大局(ju)上搶得(de)先(xian)(xian)(xian)機。就在觀戰(zhan)(zhan)棋(qi)(qi)(qi)手都認為(wei)李(li)世石占優的情況下(xia),他卻放出了(le)非常(chang)業余的手法(fa)(fa),瞬間使(shi)微弱(ruo)的優勢(shi)(shi)化為(wei)烏有,還(huan)變成了(le)劣(lie)勢(shi)(shi)。進(jin)入官子(zi),阿(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)根(gen)本(ben)不(bu)犯一點錯(cuo)誤,著著精準(zhun)。等(deng)阿(a)爾(er)法(fa)(fa)圍(wei)(wei)棋(qi)(qi)(qi)下(xia)了(le)186手,李(li)世石算清后(hou)投(tou)子(zi)認輸。

第二局

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

第(di)二(er)局:阿爾法圍棋執黑(hei)中盤勝李世(shi)石(shi)

2016年(nian)3月10日,圍(wei)棋(qi)人機(ji)大戰展開第二局(ju)較量。阿爾法(fa)圍(wei)棋(qi)執(zhi)黑先行(xing),李(li)(li)世(shi)石轉變了(le)行(xing)棋(qi)的(de)(de)風(feng)格,開局(ju)下(xia)(xia)得非(fei)常穩健。阿爾法(fa)圍(wei)棋(qi)也下(xia)(xia)出了(le)不(bu)少新(xin)手,這讓李(li)(li)世(shi)石應(ying)對得非(fei)常謹(jin)慎(shen),不(bu)時陷(xian)入長考,這讓他在時間(jian)上(shang)一直(zhi)落后。你來(lai)我往(wang)中,黑37和41兩步尖沖(chong)令人匪夷所思,尤其是第41手,致目(mu)數大虧。中盤(pan)階段(duan),本(ben)來(lai)形(xing)勢(shi)占優的(de)(de)李(li)(li)世(shi)石行(xing)棋(qi)過緩,右上(shang)角(jiao)的(de)(de)一步二路(lu)打(da)拔被(bei)視作敗手,阿爾法(fa)圍(wei)棋(qi)的(de)(de)優勢(shi)逐(zhu)漸(jian)清晰起來(lai)。在形(xing)勢(shi)陷(xian)入被(bei)動的(de)(de)情況下(xia)(xia),李(li)(li)世(shi)石下(xia)(xia)出一手扳的(de)(de)好棋(qi),但幾次轉換后,黑棋(qi)還(huan)是牢牢守住了(le)領先的(de)(de)局(ju)面,而且棋(qi)形(xing)很厚。李(li)(li)世(shi)石雖(sui)然脫了(le)幾手,但并無(wu)實質(zhi)性改變,最終阿爾法(fa)圍(wei)棋(qi)執(zhi)黑于(yu)211手獲(huo)勝且優勢(shi)明顯,總(zong)比(bi)分2比(bi)0領先。

第三局

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

第三局:阿(a)爾法圍棋執白中盤勝李世石

2016年3月12日,圍(wei)棋(qi)(qi)(qi)人(ren)機大戰(zhan)(zhan)展開第三局(ju)(ju)較量。李(li)(li)世石(shi)(shi)執黑先行(xing),該(gai)局(ju)(ju)開始前(qian)(qian),還(huan)(huan)有棋(qi)(qi)(qi)迷(mi)希望李(li)(li)世石(shi)(shi)能夠實現逆(ni)轉,但(dan)阿爾(er)法(fa)圍(wei)棋(qi)(qi)(qi)徹底摧(cui)毀(hui)了這種可能。布(bu)局(ju)(ju)階段,李(li)(li)世石(shi)(shi)左(zuo)下掛角后走高(gao)中國流。行(xing)不到(dao)二(er)十手,李(li)(li)世石(shi)(shi)局(ju)(ju)面(mian)就(jiu)落(luo)入下風(feng)。隨后,雙方在(zai)左(zuo)上(shang)角展開戰(zhan)(zhan)斗(dou),阿爾(er)法(fa)圍(wei)棋(qi)(qi)(qi)對(dui)全局(ju)(ju)的(de)把(ba)握一如既往地強大。李(li)(li)世石(shi)(shi)不但(dan)自己的(de)模(mo)樣被對(dui)手輕松(song)打入,阿爾(er)法(fa)圍(wei)棋(qi)(qi)(qi)還(huan)(huan)借助(zhu)戰(zhan)(zhan)斗(dou)在(zai)下邊圍(wei)起一大塊空,局(ju)(ju)面(mian)看上(shang)去(qu)還(huan)(huan)不如前(qian)(qian)兩盤(pan)好看。隨后的(de)比賽,雖然李(li)(li)世石(shi)(shi)仍然極力抵抗,并且(qie)祭出(chu)劫爭(zheng)的(de)手段,但(dan)是電腦精確應對(dui),讓他無功(gong)而返(fan)。到(dao)阿爾(er)法(fa)圍(wei)棋(qi)(qi)(qi)下了176手后,李(li)(li)世石(shi)(shi)只有投子認負。圍(wei)棋(qi)(qi)(qi)人(ren)機大戰(zhan)(zhan)前(qian)(qian)三盤(pan)人(ren)類三連敗。

第四局

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

第(di)四局:李(li)世石執(zhi)白中盤(pan)勝阿爾法圍(wei)棋

2016年3月13日,圍(wei)棋(qi)(qi)人機(ji)大戰(zhan)展(zhan)開第四局(ju)(ju)(ju)較(jiao)量。在接連三局(ju)(ju)(ju)負于(yu)“阿爾法(fa)(fa)圍(wei)棋(qi)(qi)”后,脫去勝負包袱(fu)的(de)(de)(de)李世(shi)(shi)石(shi)為(wei)榮(rong)譽而(er)戰(zhan),終于(yu)迎(ying)來了(le)“圍(wei)棋(qi)(qi)人機(ji)大戰(zhan)”的(de)(de)(de)首次(ci)(ci)勝利。與前幾局(ju)(ju)(ju)比賽相比,李世(shi)(shi)石(shi)此(ci)(ci)局(ju)(ju)(ju)更多(duo)次(ci)(ci)陷入(ru)(ru)了(le)長時(shi)間思考,導(dao)致耗(hao)(hao)時(shi)過多(duo)。在比賽進行到兩個半(ban)小(xiao)時(shi)后,李世(shi)(shi)石(shi)僅剩下(xia)17分鐘,比“阿爾法(fa)(fa)圍(wei)棋(qi)(qi)”剩余時(shi)間足足少1個小(xiao)時(shi)。但隨(sui)后李世(shi)(shi)石(shi)祭出白(bai)78“挖”的(de)(de)(de)妙手,一場(chang)“逆(ni)襲(xi)”之戰(zhan)也由此(ci)(ci)開始(shi)。阿爾法(fa)(fa)圍(wei)棋(qi)(qi)被李世(shi)(shi)石(shi)的(de)(de)(de)“神之一手”下(xia)得(de)陷入(ru)(ru)混亂,走出了(le)黑93一步常理(li)上的(de)(de)(de)廢(fei)棋(qi)(qi),導(dao)致棋(qi)(qi)盤右側一大片黑子“全死”。此(ci)(ci)后,“阿爾法(fa)(fa)圍(wei)棋(qi)(qi)”判斷(duan)局(ju)(ju)(ju)面對自己不利,每步耗(hao)(hao)時(shi)明顯增長,更首次(ci)(ci)被李世(shi)(shi)石(shi)拖入(ru)(ru)讀秒。最終,李世(shi)(shi)石(shi)冷靜收官(guan)鎖定勝局(ju)(ju)(ju)。到180手,阿爾法(fa)(fa)圍(wei)棋(qi)(qi)中(zhong)盤認輸(shu)。

第五局

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

第五局:阿(a)爾(er)法圍棋執白中盤勝李(li)世(shi)石(shi)

2016年3月(yue)15日,圍(wei)(wei)棋(qi)人機(ji)大(da)戰(zhan)(zhan)展開第五局(ju)(ju)對決。在上局(ju)(ju)比(bi)賽扳回一(yi)城(cheng)后(hou),李世石(shi)向阿(a)(a)爾(er)法(fa)圍(wei)(wei)棋(qi)團(tuan)隊提出(chu)要在末戰(zhan)(zhan)中執黑(hei),因為他覺得阿(a)(a)爾(er)法(fa)圍(wei)(wei)棋(qi)執黑(hei)時發揮并(bing)不完美,戰(zhan)(zhan)勝執白的阿(a)(a)爾(er)法(fa)圍(wei)(wei)棋(qi)才更(geng)有意義。執黑(hei)的李世石(shi)選擇了穩健(jian)的錯(cuo)小目、無(wu)憂(you)角開局(ju)(ju),阿(a)(a)爾(er)法(fa)圍(wei)(wei)棋(qi)則以二(er)連星應對。進(jin)入(ru)中盤,李世石(shi)意圖非(fei)常明顯(xian),以撈實(shi)地(di)為主。但李世石(shi)在79和81手(shou)(shou)連出(chu)緩手(shou)(shou),被視為敗招。阿(a)(a)爾(er)法(fa)圍(wei)(wei)棋(qi)82靠也并(bing)非(fei)好的應手(shou)(shou)。一(yi)波錯(cuo)進(jin)錯(cuo)出(chu)后(hou),黑(hei)棋(qi)在87和89手(shou)(shou)再出(chu)緩手(shou)(shou),致使白棋(qi)左上角的圍(wei)(wei)剿更(geng)加有力,黑(hei)棋(qi)形勢瞬間坍塌。此后(hou),占(zhan)據優勢的阿(a)(a)爾(er)法(fa)圍(wei)(wei)棋(qi)展現了它強大(da)的中后(hou)盤計算能(neng)力,鮮有失誤,落子(zi)效率極高。不過李世石(shi)也并(bing)未放棄,連續走出(chu)強硬應手(shou)(shou),可(ke)惜棋(qi)盤下得越來越小,難再覓逆轉(zhuan)機(ji)會。第280手(shou)(shou),李世石(shi)投子(zi)認(ren)負(fu)。這次圍(wei)(wei)棋(qi)人機(ji)大(da)戰(zhan)(zhan)的最終(zhong)比(bi)分定格(ge)為1比(bi)4。

該圖片由注冊用戶"智識分子"提供,版權聲明反饋

賽事影響

對圍棋項目

圍(wei)棋人(ren)機大(da)戰前(qian),不少(shao)人(ren)擔心圍(wei)棋這塊陣地(di)一旦失守,將對整個(ge)項目產生(sheng)(sheng)滅頂之(zhi)災,因為(wei)不少(shao)人(ren)或(huo)許會產生(sheng)(sheng)這樣的想法:號(hao)稱棋類智力(li)最頂尖的圍(wei)棋也不過(guo)爾(er)爾(er),從而(er)魅力(li)大(da)減。可實際的情(qing)況卻是恰恰相反(fan),很(hen)多平(ping)時不關心圍(wei)棋或(huo)者說根本連圍(wei)棋規(gui)則都不了(le)解的人(ren),也因為(wei)人(ren)機大(da)戰開始了(le)解和(he)關心這項運動。

圍(wei)棋人機大戰期間,關于人機大戰的(de)報(bao)道(dao)充斥于國(guo)(guo)內各種(zhong)媒體的(de)“頭(tou)條”,風頭(tou)完全(quan)蓋(gai)過了足球(qiu)、籃(lan)球(qiu)這(zhe)些(xie)(xie)風靡世界的(de)運動;就連圍(wei)棋普及率極低(di)的(de)歐美(mei)國(guo)(guo)家,英國(guo)(guo)廣播公司(BBC)、路透社、美(mei)聯社這(zhe)些(xie)(xie)主(zhu)流媒體也對(dui)比(bi)賽進行了詳細報(bao)道(dao),這(zhe)在以往幾乎是不可(ke)能(neng)的(de)。

對人工智能

“人(ren)工智能(neng)”這個概念是人(ren)機(ji)大戰最(zui)終極的受益者。圍(wei)棋(qi)人(ren)機(ji)大戰前(qian),人(ren)工智能(neng)對于普(pu)通(tong)人(ren)而言還(huan)是那么“云山霧罩”;圍(wei)棋(qi)人(ren)機(ji)大戰后,人(ren)們通(tong)過各種(zhong)報道已(yi)經了(le)解到(dao),人(ren)工智能(neng)已(yi)經滲(shen)透到(dao)每個人(ren)的工作和生活中。智能(neng)化服務將會快速(su)地接入餐飲(yin)、出行(xing)(xing)、旅游、電(dian)影、教育、醫(yi)療等生活服務領域,覆蓋(gai)用戶吃、住、行(xing)(xing)、玩,人(ren)工智能(neng)在(zai)未來可能(neng)媲美人(ren)類的專職秘書。

阿爾(er)法(fa)圍(wei)棋最大的(de)(de)勝利是(shi)為人工(gong)智(zhi)(zhi)能(neng)(neng)打造了一場全球性的(de)(de)科(ke)普,也代(dai)表了高(gao)科(ke)技企業(ye)對人工(gong)智(zhi)(zhi)能(neng)(neng)技術(shu)充滿“野心(xin)”的(de)(de)宣告。過去的(de)(de)人工(gong)智(zhi)(zhi)能(neng)(neng)只是(shi)存在(zai)于(yu)實驗室的(de)(de)智(zhi)(zhi)慧探(tan)索;而未來的(de)(de)科(ke)學技術(shu),人工(gong)智(zhi)(zhi)能(neng)(neng)將是(shi)基(ji)礎,是(shi)推動商(shang)業(ye)與(yu)社會(hui)發(fa)展的(de)(de)強大動力(li)。

李世石簡介

李世石是李昌鎬之(zhi)后,韓國最具代(dai)表性的棋(qi)(qi)手(shou),他在(zai)2003年(nian)獲第16屆富士通(tong)(tong)杯冠(guan)軍后升為九(jiu)段棋(qi)(qi)手(shou)。自(zi)2002年(nian)加(jia)冕富士通(tong)(tong)杯以來(lai),十年(nian)時間里(li)他共獲18個世界冠(guan)軍。李世石屬于典型的力戰型棋(qi)(qi)風,善(shan)于敏銳地抓(zhua)住對(dui)手(shou)的弱處(chu)主(zhu)動出(chu)擊(ji),以強大(da)的力量擊(ji)垮對(dui)手(shou),他的攻(gong)擊(ji)可以用“穩,準,狠(hen)”來(lai)形容,經常能在(zai)劣勢下完成逆轉。

AlphaGo2015年10月擊敗歐洲冠軍

谷歌曾(ceng)于(yu)2014年以4億歐元收購人工(gong)智能公司DeepMind。由DeepMind研發的AlphaGo項目已(yi)有(you)兩年歷史,AlphaGo曾(ceng)在(zai)去年戰勝了歐洲(zhou)圍棋冠軍樊麾(職(zhi)業二段)。

去(qu)年10月(yue)5日-10月(yue)9日,谷(gu)歌AlphaGo在比賽(sai)中以(yi)5:0的比分完勝了(le)(le)歐洲冠軍。除了(le)(le)戰勝人類外,AlphaGo還(huan)與其他的圍棋程序對戰,獲得(de)了(le)(le)500場(chang)勝利。

AlphaGo原理簡介

傳統的(de)(de)(de)人工智能(neng)方法是將所有可能(neng)的(de)(de)(de)走法構(gou)建成一棵搜索樹(shu) ,但這(zhe)(zhe)種方法對圍棋(qi)并不適用。此次谷歌推出的(de)(de)(de)AlphaGo,將高級搜索樹(shu)與深度神經(jing)網(wang)絡結合在一起(qi)。這(zhe)(zhe)些神經(jing)網(wang)絡通過12個處(chu)理層傳遞對棋(qi)盤的(de)(de)(de)描述,處(chu)理層則包(bao)含數百萬個類似(si)于神經(jing)的(de)(de)(de)連接點。

其中一個神(shen)經網絡“決策網絡”(policy network)負責選擇下一步走(zou)法,另一個神(shen)經網絡“值網絡”(“value network)則預(yu)測比賽勝利方。谷歌方面用(yong)人類圍(wei)棋高(gao)手的三千萬步圍(wei)棋走(zou)法訓練(lian)神(shen)經網絡,與此(ci)同時,AlphaGo也自(zi)行研究(jiu)(jiu)新戰略,在它的神(shen)經網絡 之間運(yun)行了(le)數千局(ju)圍(wei)棋,利用(yong)反復試驗調整連(lian)接點,這(zhe)個流程也稱為鞏固學習(xi)(reinforcement learning)。通過廣泛(fan)使用(yong)Google云平臺,完(wan)成了(le)大量研究(jiu)(jiu)工(gong)作。

AlphaGo在與人的對(dui)弈中用了“兩個(ge)(ge)大腦”來(lai)(lai)(lai)解決問題:“決策網絡(luo)”和“值(zhi)網絡(luo)”。通俗來(lai)(lai)(lai)說就是,一(yi)個(ge)(ge)大腦用來(lai)(lai)(lai)決策當前應該如何落子,另一(yi)個(ge)(ge)大腦來(lai)(lai)(lai)預測(ce)比賽最終的勝利方。

值得(de)一(yi)提的是,李世石(shi)也是第一(yi)次與機器對(dui)戰(zhan),所以他無法像和(he)人(ren)類對(dui)戰(zhan)那樣,先研究(jiu)對(dui)方的棋譜(pu)和(he)下棋風格。李世石(shi)所能(neng)做的就是和(he)自己(ji)對(dui)弈(yi)。谷歌AlphaGo也是通(tong)過這(zhe)種方式鍛煉(lian)自己(ji),真正做到了(le)“人(ren)工智能(neng)”。

李世石之后 谷歌AlphaGo還會挑戰誰?

谷(gu)歌(ge)旗下DeepMind創始人(ren)哈薩比斯(si)曾表示,還有很多實力很強(qiang)的選手(shou),所以這(zhe)次比賽(sai)之后,也(ye)許也(ye)會去中國、日本,與當地高手(shou)切(qie)磋棋藝。

中國圍棋(qi)圍棋(qi)九段柯潔也(ye)對此表示了(le)興趣,昨天AlphaGo戰勝(sheng)李(li)(li)世石后,他(ta)發(fa)微(wei)博稱,“就算阿法狗戰勝(sheng)了(le)李(li)(li)世石,但它贏不(bu)了(le)我”,并且(qie)還置頂(ding)了(le)該(gai)微(wei)博。

并(bing)且他(ta)來(lai)頭也不小,柯潔自述,“現在暫時是(shi)(shi)世(shi)(shi)界圍棋第一人(特地用(yong)了暫時,謙虛是(shi)(shi)美德)正式比(bi)賽我是(shi)(shi)單盤8:2碾壓李世(shi)(shi)石(他(ta)贏得這兩盤沒有任何作用(yong))世(shi)(shi)界冠軍獲得過三次(此(ci)年齡(ling)如此(ci)成績前無古人)”。

網站提醒和聲明
本站(zhan)(zhan)為注冊用(yong)戶(hu)提(ti)供(gong)信息(xi)存(cun)儲空間(jian)服務,非“MAIGOO編(bian)輯上傳提(ti)供(gong)”的文章/文字(zi)均(jun)是(shi)注冊用(yong)戶(hu)自主發布上傳,不(bu)代表本站(zhan)(zhan)觀點,更不(bu)表示本站(zhan)(zhan)支持購買和(he)交易,本站(zhan)(zhan)對(dui)網(wang)頁中內容的合法性(xing)、準確性(xing)、真實性(xing)、適用(yong)性(xing)、安全性(xing)等概不(bu)負責。版權(quan)歸(gui)原作者所有,如有侵權(quan)、虛假(jia)信息(xi)、錯誤信息(xi)或任何問題,請及(ji)時聯系我們,我們將在第(di)一時間(jian)刪除或更正。 申請刪除>> 糾錯>> 投訴侵權>>
提交說明: 快速提交發布>> 查看提交幫助>> 注冊登錄>>
發表評論
您還未登錄,依《網絡安全法》相關要求,請您登錄賬戶后再提交發布信息。點擊登錄>>如您還未注冊,可,感謝您的理解及支持!
最新評論(lun)
暫無評論
展會推薦
展會聚焦
熱門展會
2021年11月19-28日
地點:中國進出口商品交易會展館
已開幕
2021年11月17-21日
地點:深圳會展中心
已開幕
2021年11月25-28日
地點:廣東現代國際展覽中心
距開幕4
2021年12月1-5日
地點:國家會展中心
距開幕10
2021年12月2-4日
地點:深圳國際會展中心
距開幕11
2021年12月11-14日
地點:國家會展中心(上海)
距開幕20
2021年12月28-30日
地點:上海浦東新國際博覽中心
距開幕37
2021年12月(暫定)
地點:合肥濱湖國際會展中心
距開幕40
2022年4月12-16日
地點:海南國際會展中心
距開幕142
2022年4月21-30日
地點:北京中國國際展覽中心新、老展館
距開幕151
2022年4月23-25日
地點:北京國家會議中心
距開幕153
2022年7月8-11日
地點:廣交會展館、廣州保利世貿展館
距開幕229
2022年9月22-24日
地點:北京國家會議中心
距開幕305
2022年9月中上旬
地點:北京國家會議中心和首鋼園
距開幕313
2022年上半年
地點:國家會展中心(上海)
距開幕405
2021年10月22-26日
地點:楊凌農業高新技術產業示范區
已結束
2021年10月22-25日
地點:沈陽國際展覽中心
已結束
2021年10月19-21日
地點:國家會展中心(天津)
已結束
2021年11月11-13日
地點:香港會議展覽中心
已結束
2021年10月21-25日
地點:義烏國際博覽中心
已結束
2021年10月23-25日
地點:深圳會展中心
已結束
2021.9.28-10.3
地點:珠海國際航展中心
已結束
2021.10.15-11.5
地點:中國進出口商品交易會展館(琶洲館)
已結束
2021年11月5-10日
地點:國家會展中心(上海)
已結束
歡迎您來到買購網
登錄
頁面相關分類
熱門模塊
已有4077944個品牌入駐 更新519018個招商信息 已發布1588106個代理需求 已有1350750條品牌點贊