圍棋、撲克相繼失守,人類游戲以后還能怎么玩?

來源:網(wǎng)絡(luò) 時間:2017-06-09 11:24:59

圍棋、撲克相繼失守,人類游戲以后還能怎么玩?

【AI世代編者按】人工智能的復(fù)雜度正在日益提升,而與人玩游戲則是一項技巧十足的任務(wù)。美國研究人員艾倫德·辛茨(Arend Hintze)闡述了人工智能和游戲的進化理論,以及未來的發(fā)展方向。

以下為原文內(nèi)容:

1980年代,一位老師讓我寫一個能玩井字棋的電腦程序。可惜我沒寫出來。但就在幾個星期前,我跟我的一個計算機專業(yè)的研究生解釋了如何用所謂的“Minimax算法”解決井字棋問題,我們大約用了一個小時就把程序?qū)懲炅恕?/p>

我的編程能力這些年的確進步了,但計算機科學(xué)也有了長足發(fā)展。

幾十年前看似無法實現(xiàn)的事情,今天卻有可能變得非常容易。1997年,當IBM“深藍”在6局對戰(zhàn)中擊敗國際象棋大師加里·卡斯帕羅夫(Garry Kasparov)時,人們都感到驚訝不已。2015年,谷歌(微博)披露其DeepMind系統(tǒng)已經(jīng)掌握了多款1980年代的視頻游戲,包括自學(xué)《打磚塊》游戲的取勝秘訣。2016年,谷歌的AlphaGo系統(tǒng)還在一場5局對戰(zhàn)中擊敗了一位頂尖圍棋選手。

關(guān)于計算機系統(tǒng)在各類游戲中擊敗人類選手的探索仍在繼續(xù)。5月末,AlphaGo將在“中國烏鎮(zhèn)圍棋峰會”上挑戰(zhàn)柯潔。隨著計算能力的增強和技術(shù)水平的提升,電腦甚至能在那些我們原本認為需要依靠人類的直覺、智慧和狡詐才能勝出的游戲上戰(zhàn)勝人類——例如撲克。

我最近看見一段排球運動員跟機器人控制的橡膠手臂對練扣殺的視頻,這些手臂竟然能夠攔截專業(yè)運動員的大力扣殺。由此可見,當機器想要取勝時,人類的抵抗將毫無用處。

這是好事:我們希望有完美的人工智能系統(tǒng)替我們開車,還希望有不知疲倦的系統(tǒng)從X光片上尋找癌癥的跡象。但具體到玩游戲這件事情,我們還是不想輸給機器。幸運的是,人工智能可以讓游戲更加有趣,甚至有可能給我們帶來無盡的快樂。

玩不膩的游戲

如今的游戲設(shè)計師看到一個問題:開發(fā)無敵的人工智能系統(tǒng)根本沒有意義。如果毫無勝算,那就沒人愿意玩。

但人們希望玩游戲時能獲得沉浸、復(fù)雜且令人驚喜的體驗。即便是當今最好的游戲,玩過一段時間之后也會覺得無聊。理想的游戲模式是主動適應(yīng)玩家,并通過與之互動來保持游戲的趣味性,甚至讓這種狀態(tài)永遠持續(xù)下去。

所以,當我們設(shè)計人工智能系統(tǒng)時,不能光看到深藍和AlphaGo的勝利,還應(yīng)該看到《魔獸世界》這種大型多人在線游戲的巨大成功。這些游戲的圖形設(shè)計精美,但它們最大的吸引力還在于互動。

多數(shù)人對象棋和圍棋這種極其復(fù)雜的邏輯游戲興趣不大,而是希望與人聯(lián)系,營造社區(qū)。這些MMO游戲面臨的真正挑戰(zhàn)并不是它們能否被人類智能或人工智能擊敗,而是如何讓玩家每次玩游戲時都能有新鮮感。

改變模式

目前,游戲環(huán)境允許人們與其他玩家展開許多互動。地牢突擊隊的角色很容易確定:戰(zhàn)士負責(zé)戰(zhàn)斗,醫(yī)生負責(zé)救治傷員,巫師負責(zé)遠程施法?;蛘呦胂搿秱魉烷T2》,這款多人游戲的重點是通過合作來解開一系列機關(guān)和謎題。

跟朋友一起玩這些游戲可以幫助你們形成共同記憶。但這些環(huán)境或底層情節(jié)的任何變化都必須由人類設(shè)計師和開發(fā)者來部署。

在現(xiàn)實世界中,各種變化都是自然發(fā)生的,不受監(jiān)督,不是人為設(shè)計的,也不會受到人為干預(yù)。玩家需要學(xué)習(xí),而生物需要適應(yīng)。有的生物體甚至?xí)餐M化,對彼此的發(fā)展作出反應(yīng)。(武器技術(shù)的軍備競賽會出現(xiàn)類似的現(xiàn)象。)

當今的電腦游戲沒有這么復(fù)雜。正因如此,我不認為開發(fā)能玩現(xiàn)代游戲的人工智能技術(shù)可以對人工智能研究形成有益的促進。

智能進化

值得一玩的游戲必須因為具有適應(yīng)性而不可預(yù)測,還要因為玩游戲的過程而產(chǎn)生新奇感。未來的游戲需要進化。它們的角色不能僅僅做出反應(yīng),還要具備探索和合作能力,甚至要發(fā)現(xiàn)各種缺點。

達爾文進化論和學(xué)習(xí)是地球上一切新奇事物的形成動力,這同樣可以成為促進虛擬環(huán)境變化的動力。

進化已經(jīng)掌握了創(chuàng)造自然智能的方法。我們是不是也應(yīng)該放棄把自己的思維方式植入到人工智能之中的嘗試,轉(zhuǎn)而直接推動人工智能實現(xiàn)進化?包括我的實驗室和我同事克里斯多夫·阿達米(Christoph Adami)的實驗室在內(nèi),有幾家實驗室正在從事所謂的“神經(jīng)進化”(nero-evolution)研究。

我們在電腦中模擬復(fù)雜的環(huán)境,例如路網(wǎng)或生物生態(tài)系統(tǒng)。我們創(chuàng)造虛擬生物,并讓它們模擬數(shù)十萬代的進化過程。進化本身隨后發(fā)展出最好的動力,或者成為最適應(yīng)環(huán)境的生物——也就是那些生存至今的生物。

如今的AlphaGo已經(jīng)開始了這一進程,它通過不斷與自己對弈,以及分析頂尖棋手的比賽記錄來自我學(xué)習(xí)。但它并不能像我們這樣邊下棋邊學(xué)習(xí),也不能進行無人監(jiān)督的實驗。它無法根據(jù)對手的不同來調(diào)整戰(zhàn)略:對電腦來說,最好的棋就是最好的棋,無論對手的風(fēng)格如何都不會改變。

通過自己的經(jīng)驗來學(xué)習(xí)是人工智能未來的發(fā)展方向。它們可以大幅增加游戲的趣味性,讓機器人不僅能在現(xiàn)實世界中發(fā)揮作用,還能在忙碌中不斷適應(yīng)。(編譯/長歌)

繼續(xù)閱讀與本文標簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。