top of page

人工智慧Deepmind的新挑戰


用遊戲學習,不論是對人類還是電腦,都是訓練智力的一大利器。隨著電腦越來越聰明,人類也必須替電腦找到更有挑戰性的任務,從最初的跳棋、西洋棋到最近的圍棋,現在,電腦已經準備好挑戰更複雜的遊戲:《星海爭霸II》。

DeepMind開源訓練《星海爭霸II》AI的工具

《星海爭霸》是由暴雪娛樂推出的即時戰略遊戲,玩家必須透過各種工具擴展基地、發展武器和建築,以及部隊所需的資源,在銀河系中指揮一群外星人軍隊,擊敗其他對手。另一方面,《星海爭霸II》也是專業電競比賽中的比賽項目之一,意味著電腦未來也可挑戰擁有高超技術和智力的電競選手。

看中遊戲複雜性,Google旗下人工智慧新創DeepMind和暴雪娛樂合作,推出可將《星海爭霸II》用於訓練AI的應用程式介面(API)和工具,並於今天開放下載,其中包含遊戲錄影資料庫、Deepmind開源工具以及機器學習API。

首先,資料庫收集多達65,000場《星海爭霸II》電競比賽中的影像、預計未來每月還會增加50萬場,讓AI可透過影像學習人類玩家的戰術。此外,他們也將電玩中的特定遊戲元素拆為迷你遊戲,例如地圖探索、資源收集等,可幫助AI訓練特定技能。

DeepMind將電玩中的特定遊戲元素拆為迷你遊戲,例如地圖探索、資源收集等,幫助AI訓練特定技能。

至於機器學習API,則是讓AI能像人類般玩遊戲,並會回饋數據給研究人員。這表示,研究人員可以限制電腦能力,不讓它們一次看到所有地圖、也不能用超乎人類能力的速度點擊滑鼠,但可以從試驗和錯誤中學習,也就是AI中的「強化學習(reinforcement learning)」過程。

DeepMind發表的機器學習API,可限制電腦能力、讓它們像人類般玩遊戲,例如,不讓它們一次看到所有地圖、也不能用超乎人類能力的速度點擊滑鼠。

為什麼《星海爭霸II》適合訓練AI?高複雜性可訓練規劃能力和記憶力

《星海爭霸II》為什麼適合訓練AI?首先,《星海爭霸II》中的任務相當複雜且多樣,不同玩法也會迎來不同結局。而玩家必須同時間做許多不同的任務,包含管理和生產資源、指揮部隊、部署防衛建築等。

此外,《星海爭霸II》的遊戲資訊並不會在一開始就全部公開,因此玩家要有從現有線索預測假設和預測敵人動態的能力。相較下,在西洋棋和圍棋中,可以看見對手每次的移動和佈局,是一種「全資訊競賽」。

此外,讓AI在圍棋比賽中脫穎而出的超高計算能力,在星海爭霸上恐怕會大打折扣。圍棋落點可能性為10的170次方,研究人員估計,星海爭霸的複雜度,至少要再後面加上100個零。「這是一很大的進展。」Deepmind研究員Oriol Vinyals表示。「這項遊戲需要我們發明出規劃、記憶和如何處理不確定性的能力。」

基於上述原因,星海爭霸比起西洋棋和圍棋,更接近真實世界的屬性。紐芬蘭紀念大學教授、Deepmind星海爭霸工具的顧問David Churchill便指出:「我們正在打造一個可用於真實世界科技的溫床。」

或許很快的,我們就會看到AI和人類展開一場《星海爭霸II》大戰,但結果可能令人令人灰心,就像Deepmind發明的AlphaGO軟體打敗人類圍棋冠軍。

資料來源:The Verge、TechCrunch、Wired

bottom of page