北京時(shí)間3月12日下午消息,谷歌人工智能AlphaGo與韓國棋手李世石今日進(jìn)行了第三場較量,最終AlphaGo戰(zhàn)勝李世石,連續(xù)取得三場勝利。接下來兩場將淪為李世石的“榮譽(yù)之戰(zhàn)”。
武坤是中南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院教授,他的“MyGo”也是一款圍棋人工智能。2015年11月,首屆美林谷杯世界計(jì)算機(jī)圍棋錦標(biāo)賽在北京工體附近進(jìn)行,在來自全世界的參賽隊(duì)中,“MyGo”只屬于第三梯隊(duì),相當(dāng)于圍棋業(yè)余二段的水平,而錦標(biāo)賽的冠軍也無非圍棋業(yè)余五段水平。那時(shí)誰也沒想到,僅僅四個(gè)月后,他們?nèi)急籄lphaGo橫掃了。職業(yè)九段的李世石慘敗,而且還是三連敗。
在中南大學(xué),武坤對于圍棋的熱愛,所有上過他課的學(xué)生都知道。武坤甚至專門開了一門課程,就叫“圍棋人工智能”。
他的“MyGo”誕生于2011年,制作過程只用了三個(gè)月,但研究過程卻是三年。2008年,武坤認(rèn)識了職業(yè)八段圍棋選手王群,和王群的交流讓他發(fā)現(xiàn),職業(yè)圍棋選手的思維和一般人有明顯的區(qū)別,而這種區(qū)別可以用軟件的形式表現(xiàn)出來,他說這就是制作“MyGo”最早的念頭。
“二十歲不成為國手,則終身無望”,這是圍棋界的常識,學(xué)圍棋必須從小開始,但武坤直到上了大學(xué)才開始接觸圍棋。制作“MyGo”之前,武坤沒做出過任何軟件,而“MyGo”的前三年“全都在做理論基礎(chǔ)”。武坤告訴北青報(bào)記者:“比如最簡單的問題,大家都知道執(zhí)黑先走,但是先走的是有優(yōu)勢的,因此圍棋規(guī)則都會給執(zhí)白棋的棋手一些優(yōu)惠,即‘貼目’,那么這個(gè)‘貼目’到底多少合適呢?圍棋發(fā)展幾千年了,一直都是憑感覺來定的?!蔽淅ふf,包括“貼目”在內(nèi)的諸多圍棋要素,都需要進(jìn)行數(shù)據(jù)化,這個(gè)過程最久也最艱難。
跨過“理論基礎(chǔ)”這個(gè)坎,武坤和他的團(tuán)隊(duì)就用了三年。
2012年,武坤帶著“MyGo”的第一版參加了全國計(jì)算機(jī)博弈錦標(biāo)賽,這是中國一個(gè)專門供計(jì)算機(jī)圍棋人工智能比賽的平臺。據(jù)介紹,該比賽的主辦方包括中國人工智能學(xué)會和中國棋院,比賽項(xiàng)目除了圍棋,還有象棋、六子棋等,是各種“中國版AlphaGo”的競技場。
第一次參賽,武坤的“MyGo”只拿到了全國第三,2013年第二次參賽還是第三名。武坤和學(xué)生們做了數(shù)十次改進(jìn)之后,2014年第三次參賽,“MyGo”終于獲得了全國冠軍,又在其后的2015年蟬聯(lián)冠軍,這時(shí)起,“MyGo”終于出名了。
雖然現(xiàn)在有人把“MyGo”捧為中國版的AlphaGo,但武坤自己認(rèn)為,橫掃了李世石的AlphaGo跟傳統(tǒng)意義上的圍棋人工智能根本就不是同一種東西。
2015年,新科中國冠軍的“MyGo”走上了國際賽場,在首屆美林谷杯世界計(jì)算機(jī)圍棋錦標(biāo)賽上,“MyGo”八戰(zhàn)兩勝六負(fù),在9支參賽隊(duì)伍中僅排名第七。武坤表示:“前三名的人工智能算是第一梯隊(duì),第四到第六名算是第二梯隊(duì),而‘MyGo’只能算第三梯隊(duì),和前兩個(gè)梯隊(duì)之間的差距很明顯,很難下贏?!?
但這還不是跟AlphaGo的差距。AlphaGo雖然沒有參加2015年世界計(jì)算機(jī)圍棋錦標(biāo)賽,但在這場賽事前一個(gè)月,AlphaGo已經(jīng)“小試牛刀”了。AlphaGo在2015年10月與歐洲圍棋冠軍職業(yè)二段選手樊麾進(jìn)行了五場對決,樊麾被無情碾壓,AlphaGo以5:0完勝。之后樊麾觀摩了2015年世界計(jì)算機(jī)圍棋錦標(biāo)賽,他提出參賽的圍棋人工智能水平和AlphaGo“根本無法相提并論”。
在AlphaGo手里三連敗,沮喪的并不只有李世石,還有武坤?!氨疽詾槲覀兊摹甅yGo’和世界最強(qiáng)的人工智能只有業(yè)余二段到業(yè)余五段的差距,現(xiàn)在我們根本沒法估算跟AlphaGo的差距?!?
武坤解釋說,相比其他圍棋人工智能,AlphaGo的程序算法非常先進(jìn)。“現(xiàn)如今,圍棋人工智能經(jīng)歷了三代算法,第一代是窮舉算法,即嘗試把所有可能的下法都算出來,然后取必勝的一個(gè)。如果能夠窮舉,那么人類注定無法戰(zhàn)勝人工智能,因?yàn)樗械淖兓荚谌斯ぶ悄艿恼莆罩辛?。這對于國際象棋還有可能,但對于圍棋來說就不現(xiàn)實(shí)?!蔽淅ふf,包括“MyGo”在內(nèi),2015年參賽的9支隊(duì)伍中8支都采用了第二代算法,這種算法利用高頻次的隨機(jī)抽樣、動態(tài)評估、規(guī)劃路徑,選擇勝率最高的走法,也就是說并不試圖窮盡所有的下法,而只是抽選一部分下法,然后選出勝率最高的那一種。這種算法大大提升了圍棋人工智能的水平,使得其可以和業(yè)余選手一較高低。但即使獲得了2015年全球錦標(biāo)賽冠軍的韓國人工智能“石子旋風(fēng)”,在和職業(yè)七段圍棋選手連笑的對決中,先后在“人類讓四子”、“人類讓五子”的比賽中落敗,直到連笑為“石子旋風(fēng)”“讓六子”,“石子旋風(fēng)”才獲得一次險(xiǎn)勝。
而AlphaGo的算法就遠(yuǎn)遠(yuǎn)超越了之前的算法,利用人工智能自我學(xué)習(xí)的能力獲得了飛躍。武坤說,其實(shí)類似AlphaGo這樣的人工智能也曾經(jīng)在2015年的錦標(biāo)賽上出現(xiàn)過,即法國的GoLois,這款法國圍棋人工智能可以模擬人腦神經(jīng)元,具有主動識別、自適應(yīng)等功能,在圖像處理方面也異常強(qiáng)大。然而由于技術(shù)還不成熟,在所有9款圍棋人工智能中排名墊底。“當(dāng)時(shí)我們大家就感覺到了這種模擬人腦思維的算法的巨大潛力,但是沒想到,類似的人工智能來得這么快,這么猛?!?
盡管如此,武坤對于未來仍有信心。他打了個(gè)比方:就像電腦發(fā)明之后,很快誕生了各種更新型的電腦一樣?!爸按蠹叶际窃趯ふ曳较颍F(xiàn)在AlphaGo為我們開辟了一個(gè)了不起的方向。隨著大家對新算法的深入研究,相信會有大批類似AlphaGo的圍棋人工智能出現(xiàn),到那時(shí)中國也會有能做出超越世界超一流棋手的圍棋人工智能,那才是真正的‘中國版AlphaGo’?!?
相關(guān)新聞:人機(jī)圍棋大戰(zhàn)!世界冠軍李世石認(rèn)輸