“星陣圍棋”六獲世界人工智能圍棋大賽冠軍 不會(huì)下圍棋的開(kāi)發(fā)者如何用圍棋開(kāi)拓人工智能的未來(lái)?
2021-12-11
來(lái)源:人民微看點(diǎn)
央廣網(wǎng)北京12月9日消息 據(jù)中央廣播電視總臺(tái)中國(guó)之聲《新聞超鏈接》報(bào)道,2021世界人工智能圍棋賽近日落幕,衛(wèi)冕冠軍“星陣圍棋”以4比0的比分零封對(duì)手“天狗”,第六次斬獲世界人工智能圍棋大賽冠軍。此次大賽代表了當(dāng)今圍棋人工智能的最高水平,決賽階段總計(jì)留下11局精彩棋譜供人研究。不同的人工智能在算法上有何區(qū)別?什么因素決定了水平的高低?人工智能通過(guò)對(duì)圍棋這一領(lǐng)域的學(xué)習(xí),最終能達(dá)到什么目標(biāo)?
比賽現(xiàn)場(chǎng)(央廣網(wǎng)發(fā) 陳堅(jiān) 攝)
人工智能是怎么下圍棋的?每一手需要多長(zhǎng)時(shí)間?
據(jù)“星陣圍棋”主創(chuàng)人、深客科技CEO金涬博士介紹,人工智能圍棋對(duì)弈經(jīng)歷了很大的變化發(fā)展。最初的人工智能比賽使用實(shí)體棋盤,由雙方的選手各自操縱自己的電腦,面對(duì)面把電腦上的招法擺到實(shí)體棋盤上。雖然看似富有儀式感,但也潛藏問(wèn)題。一些不太熟悉圍棋的開(kāi)發(fā)者,一旦落錯(cuò)棋子就會(huì)葬送掉一盤好棋,人為削弱人工智能的優(yōu)勢(shì)。
針對(duì)實(shí)體棋盤比賽的缺陷,最近幾年主辦方開(kāi)發(fā)了線上對(duì)弈平臺(tái)。利于場(chǎng)內(nèi)大屏幕觀賽和線上視頻轉(zhuǎn)播,提高了比賽的便利性與公平性。
人工智能思考每一手的時(shí)間都是一個(gè)可以調(diào)節(jié)的參數(shù),目前每一手棋通常不會(huì)超過(guò)30秒,一盤棋大概兩個(gè)小時(shí)之內(nèi)就能完成。比賽的過(guò)程中,開(kāi)發(fā)者雖然看起來(lái)不用做什么,但在旁觀的同時(shí)需要緊盯著后臺(tái)的數(shù)據(jù),檢查己方程序有沒(méi)有占到優(yōu)勢(shì)。
圍棋AI技術(shù)水平的高低由什么決定?
目前參加比賽的人工智能團(tuán)隊(duì)或多或少都借鑒了“阿爾法狗”的基本技術(shù)架構(gòu),“阿爾法狗”在《Nature》雜志上發(fā)表了兩篇高水平的論文,比較詳細(xì)地闡述了他們訓(xùn)練圍棋AI的技術(shù)方法。但技術(shù)是迭代發(fā)展的,現(xiàn)在,各個(gè)團(tuán)隊(duì)在算法上的區(qū)別就體現(xiàn)在他們?cè)谶@個(gè)基礎(chǔ)上的優(yōu)化程度,這些新的優(yōu)化的有效性決定了當(dāng)前參賽隊(duì)伍的水平高低。
“星陣圍棋”的水平與人們所熟知的“阿爾法狗”比起來(lái)怎樣?
“阿爾法狗”是當(dāng)今高水平圍棋AI的一個(gè)領(lǐng)路人,它將人工智能與深度學(xué)習(xí)兩項(xiàng)技術(shù)和圍棋相結(jié)合,給我們打開(kāi)了一扇門。金涬表示,平心而論,“星陣圍棋”的技術(shù)創(chuàng)新性還比不上“阿爾法狗”。現(xiàn)如今的各個(gè)圍棋AI,包括“星陣圍棋”,都是基于“阿爾法狗”的基本架構(gòu)開(kāi)發(fā)的,是站在巨人肩膀上的創(chuàng)新。如今“阿爾法狗”已經(jīng)退出了圍棋的研發(fā),“星陣圍棋”仍在繼續(xù)以“將人類探索圍棋的水平帶上新高度”作為團(tuán)隊(duì)目標(biāo)。
另外,“星陣”團(tuán)隊(duì)除了做高水平的對(duì)弈AI外,還圍繞圍棋做了很多工作。例如開(kāi)發(fā)網(wǎng)頁(yè)、App,提供覆蓋從初學(xué)到人類頂尖水平的陪練AI等,用戶在棋局之后可請(qǐng)教“星陣”進(jìn)行復(fù)盤,找出本局中欠妥的下法,以達(dá)到棋藝的快速進(jìn)步。
“我只想說(shuō)從這個(gè)角度上講,如果我們把‘阿爾法狗’比作是發(fā)明了飛機(jī)的萊特兄弟,那么‘星陣’可能就是讓每一個(gè)人都能坐上飛機(jī)的波音公司?!苯饹胝f(shuō)。
通過(guò)研究圍棋領(lǐng)域,人工智能的最終目的是什么?
博弈論中,圍棋被認(rèn)為是完全信息博弈“皇冠上的明珠”,因此圍棋算法成為了很多計(jì)算機(jī)科學(xué)家長(zhǎng)久以來(lái)的追求和想要攀登的高峰。雖說(shuō)圍棋AI已在今日達(dá)到了一定水平,但距離完全破解圍棋還十分遙遠(yuǎn)。因此,圍棋可以作為人工智能算法的一片試驗(yàn)田,借此科學(xué)家們可以做出能在更廣泛的領(lǐng)域發(fā)揮更大價(jià)值的人工智能算法。
DeepMind 團(tuán)隊(duì)在研發(fā)完成“阿爾法狗”后,已經(jīng)將精力轉(zhuǎn)向了一些更為實(shí)用化的領(lǐng)域,比如通過(guò)強(qiáng)化學(xué)習(xí)算法為數(shù)據(jù)中心節(jié)能,或者通過(guò)深度學(xué)習(xí)預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu),通過(guò)人工智能預(yù)測(cè)新能源的發(fā)電功率,通過(guò)圖像人工智能技術(shù)做基于醫(yī)療影像的診斷,這些都是十分有前景和有價(jià)值的。人類研究人工智能的最終目的還是為人類所用,能夠創(chuàng)造出在各個(gè)領(lǐng)域替代人類工作的、更加智能的機(jī)器。