央廣網(wǎng)北京12月9日消息 據(jù)中央廣播電視總臺中國之聲《新聞超鏈接》報道,2021世界人工智能圍棋賽近日落幕,衛(wèi)冕冠軍“星陣圍棋”以4比0的比分零封對手“天狗”,第六次斬獲世界人工智能圍棋大賽冠軍。此次大賽代表了當今圍棋人工智能的最高水平,決賽階段總計留下11局精彩棋譜供人研究。不同的人工智能在算法上有何區(qū)別?什么因素決定了水平的高低?人工智能通過對圍棋這一領域的學習,最終能達到什么目標?
比賽現(xiàn)場(央廣網(wǎng)發(fā) 陳堅 攝)
人工智能是怎么下圍棋的?每一手需要多長時間?
據(jù)“星陣圍棋”主創(chuàng)人、深客科技CEO金涬博士介紹,人工智能圍棋對弈經(jīng)歷了很大的變化發(fā)展。最初的人工智能比賽使用實體棋盤,由雙方的選手各自操縱自己的電腦,面對面把電腦上的招法擺到實體棋盤上。雖然看似富有儀式感,但也潛藏問題。一些不太熟悉圍棋的開發(fā)者,一旦落錯棋子就會葬送掉一盤好棋,人為削弱人工智能的優(yōu)勢。
針對實體棋盤比賽的缺陷,最近幾年主辦方開發(fā)了線上對弈平臺。利于場內(nèi)大屏幕觀賽和線上視頻轉(zhuǎn)播,提高了比賽的便利性與公平性。
人工智能思考每一手的時間都是一個可以調(diào)節(jié)的參數(shù),目前每一手棋通常不會超過30秒,一盤棋大概兩個小時之內(nèi)就能完成。比賽的過程中,開發(fā)者雖然看起來不用做什么,但在旁觀的同時需要緊盯著后臺的數(shù)據(jù),檢查己方程序有沒有占到優(yōu)勢。
圍棋AI技術水平的高低由什么決定?
目前參加比賽的人工智能團隊或多或少都借鑒了“阿爾法狗”的基本技術架構,“阿爾法狗”在《Nature》雜志上發(fā)表了兩篇高水平的論文,比較詳細地闡述了他們訓練圍棋AI的技術方法。但技術是迭代發(fā)展的,現(xiàn)在,各個團隊在算法上的區(qū)別就體現(xiàn)在他們在這個基礎上的優(yōu)化程度,這些新的優(yōu)化的有效性決定了當前參賽隊伍的水平高低。
“星陣圍棋”的水平與人們所熟知的“阿爾法狗”比起來怎樣?
“阿爾法狗”是當今高水平圍棋AI的一個領路人,它將人工智能與深度學習兩項技術和圍棋相結(jié)合,給我們打開了一扇門。金涬表示,平心而論,“星陣圍棋”的技術創(chuàng)新性還比不上“阿爾法狗”?,F(xiàn)如今的各個圍棋AI,包括“星陣圍棋”,都是基于“阿爾法狗”的基本架構開發(fā)的,是站在巨人肩膀上的創(chuàng)新。如今“阿爾法狗”已經(jīng)退出了圍棋的研發(fā),“星陣圍棋”仍在繼續(xù)以“將人類探索圍棋的水平帶上新高度”作為團隊目標。
另外,“星陣”團隊除了做高水平的對弈AI外,還圍繞圍棋做了很多工作。例如開發(fā)網(wǎng)頁、App,提供覆蓋從初學到人類頂尖水平的陪練AI等,用戶在棋局之后可請教“星陣”進行復盤,找出本局中欠妥的下法,以達到棋藝的快速進步。
“我只想說從這個角度上講,如果我們把‘阿爾法狗’比作是發(fā)明了飛機的萊特兄弟,那么‘星陣’可能就是讓每一個人都能坐上飛機的波音公司?!苯饹胝f。
通過研究圍棋領域,人工智能的最終目的是什么?
博弈論中,圍棋被認為是完全信息博弈“皇冠上的明珠”,因此圍棋算法成為了很多計算機科學家長久以來的追求和想要攀登的高峰。雖說圍棋AI已在今日達到了一定水平,但距離完全破解圍棋還十分遙遠。因此,圍棋可以作為人工智能算法的一片試驗田,借此科學家們可以做出能在更廣泛的領域發(fā)揮更大價值的人工智能算法。
DeepMind 團隊在研發(fā)完成“阿爾法狗”后,已經(jīng)將精力轉(zhuǎn)向了一些更為實用化的領域,比如通過強化學習算法為數(shù)據(jù)中心節(jié)能,或者通過深度學習預測蛋白質(zhì)的結(jié)構,通過人工智能預測新能源的發(fā)電功率,通過圖像人工智能技術做基于醫(yī)療影像的診斷,這些都是十分有前景和有價值的。人類研究人工智能的最終目的還是為人類所用,能夠創(chuàng)造出在各個領域替代人類工作的、更加智能的機器。