欧美xxxx做受老人国产的,亚洲精品久久久无码白峰美,亚洲成av人影院,欧美日韩精品人妻狠狠躁免费视频

AI在又一個(gè)游戲中虐哭人類! 團(tuán)體游戲紛紛淪陷!

“奪旗”既是一款兒童在夏令營(yíng)活動(dòng)上常玩的一款游戲,也是《雷神之錘3》(Quake III)和《守望先鋒》(Overwatch)等熱門游戲的一部分。

不管它作為兒童的夏令營(yíng)游戲還是電子游戲,它都是一項(xiàng)團(tuán)隊(duì)運(yùn)動(dòng)。每一方都守衛(wèi)著一面旗幟,同時(shí)也在計(jì)劃奪取另一方的旗幟并將其帶回基地。贏得比賽需要良好的傳統(tǒng)團(tuán)隊(duì)合作,并且在防守和進(jìn)攻之間取得協(xié)調(diào)平衡。

換句話說(shuō),“奪旗”這一游戲需要一系列看起來(lái)非常人性化的技能。但倫敦人工智能實(shí)驗(yàn)室的研究人員表示,至少在虛擬世界中,機(jī)器也能掌握這款游戲。

在周四發(fā)表在《科學(xué)》(Science)雜志上的一篇論文中,研究人員的報(bào)告稱,他們?cè)O(shè)計(jì)了一種自動(dòng)虛擬程序,當(dāng)玩家在《雷神之震3》中玩“奪旗”(capture the flag)游戲模式時(shí),該程序會(huì)表現(xiàn)出類似人類的行為。這些程序能夠與人類玩家組隊(duì),與人類玩家并肩作戰(zhàn),從而相應(yīng)地調(diào)整它們的行為。

與谷歌同屬一家母公司的DeepMind實(shí)驗(yàn)室的研究員沃伊切赫·扎爾內(nèi)基(Wojciech Czarnecki)說(shuō):“這些程序可以適應(yīng)具有任意技能的隊(duì)友。”

通過(guò)數(shù)千小時(shí)的比賽,這些虛擬程序?qū)W會(huì)了非常特殊的技能。比如當(dāng)隊(duì)友快要抓到一面旗子時(shí),它們會(huì)沖向敵方的大本營(yíng)。正如人類玩家所知道的,當(dāng)對(duì)方的旗幟被帶到自己的基地時(shí),新的旗幟就會(huì)出現(xiàn)在對(duì)方的基地,等待著玩家們?nèi)Z取。

DeepMind的項(xiàng)目是構(gòu)建人工智能的廣泛努力的一部分,這種人工智能可以玩極其復(fù)雜的三維視頻游戲,包括《雷神之錘3》、《Dota 2》和《星際爭(zhēng)霸2》。許多研究人員認(rèn)為,虛擬領(lǐng)域的成功最終將改進(jìn)現(xiàn)實(shí)世界中的自動(dòng)化系統(tǒng)。

例如,這些技能可以讓倉(cāng)庫(kù)機(jī)器人受益,因?yàn)樗鼈兛梢酝ㄟ^(guò)團(tuán)隊(duì)合作把貨物從一個(gè)地方搬到另一個(gè)地方,或者幫助自動(dòng)駕駛汽車在擁擠的交通中進(jìn)行集體導(dǎo)航。“游戲一直是人工智能的基準(zhǔn),”位于舊金山的OpenAI實(shí)驗(yàn)室負(fù)責(zé)類似研究的格雷格·布羅克曼(Greg Brockman)說(shuō)。“如果你不能用人工智能解決游戲中的難題,你就不能指望解決任何其他問(wèn)題。”

就算在現(xiàn)在,在像《雷神之錘3》這樣的游戲中建立一個(gè)能夠與人類玩家相匹配的人工智能系統(tǒng)似乎還是不可能的。但在過(guò)去幾年里,DeepMind、OpenAI和其他實(shí)驗(yàn)室取得了重大進(jìn)展,這要?dú)w功于一種名為“強(qiáng)化學(xué)習(xí)”的數(shù)學(xué)技術(shù),這種技術(shù)允許機(jī)器通過(guò)反復(fù)試驗(yàn)來(lái)學(xué)習(xí)任務(wù)。

通過(guò)一遍又一遍地玩游戲,一個(gè)自動(dòng)化的程序可以學(xué)習(xí)哪些策略能帶來(lái)成功,哪些不能。如果這個(gè)程序在隊(duì)友準(zhǔn)備奪取一面旗子時(shí)向?qū)κ值幕匾苿?dòng),能夠不斷地贏得更多的分?jǐn)?shù)的話,那么該程序就會(huì)把這種戰(zhàn)術(shù)添加到自己的算法庫(kù)中。

2016年,DeepMind的研究人員使用同樣的基本技術(shù),建立了一個(gè)系統(tǒng),讓人工智能可以在圍棋中擊敗世界頂級(jí)棋手。許多專家曾認(rèn)為,考慮到《雷神之錘3》的巨大復(fù)雜性,讓人工智能在這一游戲中擊敗對(duì)手這一目標(biāo)要再過(guò)10年才能實(shí)現(xiàn)。

第一人稱的自主電子游戲要復(fù)雜得多,尤其是當(dāng)它們涉及到隊(duì)友之間的協(xié)調(diào)時(shí)。DeepMind的程序需要通過(guò)玩大約45萬(wàn)回合才能學(xué)會(huì)如何奪取這面旗幟,他們?cè)跀?shù)周的訓(xùn)練中積累了大約人類四年的游戲經(jīng)驗(yàn)。起初,程序們慘敗。但他們逐漸學(xué)會(huì)了游戲的微妙之處,比如當(dāng)隊(duì)友突襲對(duì)手的大本營(yíng)時(shí),它們知道該如何輔助隊(duì)友。

自從完成這個(gè)項(xiàng)目后,DeepMind的研究人員還設(shè)計(jì)了另外一個(gè)系統(tǒng),可以打敗一款以太空為背景的戰(zhàn)略游戲《星際爭(zhēng)霸2》(StarCraft II)中的專業(yè)玩家。在OpenAI,研究人員建立了一個(gè)系統(tǒng),可以控制《Dota2》,這款游戲就像“奪旗”的升級(jí)版。今年4月,一支由5個(gè)虛擬的人工智能程序組成的隊(duì)伍擊敗了一支由5名世界上最優(yōu)秀的人類玩家組成的隊(duì)伍。

去年,有“閃電戰(zhàn)”之稱的職業(yè)Dota 2玩家兼評(píng)論員威廉·李(William Lee)與一種早期版本的人工智能打了一場(chǎng)比賽,這一人工智能程序只能進(jìn)行一對(duì)一的比賽,打不了團(tuán)隊(duì)比賽,因此威廉·李對(duì)此并不感興趣。但隨著這些程序的深入學(xué)習(xí),威廉·李開始慢慢地被這些虛擬的程序所震撼到了。

“我認(rèn)為這臺(tái)機(jī)器不可能打出五人團(tuán)體戰(zhàn),更不用說(shuō)贏了,”他說(shuō)。“但是我完全驚呆了。”

盡管這類技術(shù)讓許多游戲玩家感到驚訝與佩服,但許多人工智能專家質(zhì)疑它最終能否解決現(xiàn)實(shí)問(wèn)題。專門研究人工智能的佐治亞理工學(xué)院(Georgia Tech College of Computing)教授馬克·里德爾(Mark Riedl)說(shuō),DeepMind的虛擬程序?qū)嶋H上并沒有團(tuán)隊(duì)中的合作,它們只是對(duì)游戲中發(fā)生的事情做出反應(yīng),而不是像人類玩家那樣彼此交換信息。(即使只是螞蟻也可以通過(guò)交換化學(xué)信號(hào)來(lái)合作。)

雖然結(jié)果看起來(lái)像是團(tuán)隊(duì)合作,但這些程序之所以能夠?qū)崿F(xiàn)這一點(diǎn),是因?yàn)樗鼈兡軌颡?dú)立地完全理解游戲中所發(fā)生的一切。

“如何定義團(tuán)隊(duì)合作不是我想解決的問(wèn)題,”DeepMind的另一位研究人員馬克斯·加德伯格(Max Jaderberg)說(shuō)。“但只有在依靠隊(duì)友的情況下,才有可能有一位虛擬“玩家”出現(xiàn)在對(duì)手的大本營(yíng)里,伺機(jī)奪取旗幟”

這樣的游戲并不像現(xiàn)實(shí)世界那么復(fù)雜。“三維環(huán)境的設(shè)計(jì)是為了讓導(dǎo)航變得容易,”里德博士說(shuō)。“《雷神之錘》的策略和協(xié)調(diào)很簡(jiǎn)單。”

強(qiáng)化學(xué)習(xí)非常適合這種游戲。在電子游戲中,程序能夠很容易就確定成功的衡量標(biāo)準(zhǔn)——更多的分?jǐn)?shù)。(在“奪旗這一游戲”中,玩家根據(jù)奪旗數(shù)量獲得點(diǎn)數(shù)。)但在現(xiàn)實(shí)世界中,沒有人記分。研究人員必須用其他方式來(lái)定義成功。

這是可以做到的,至少在簡(jiǎn)單的任務(wù)上是沒問(wèn)題的。在OpenAI,研究人員已經(jīng)訓(xùn)練了一只機(jī)械手,可以像孩子一樣擺弄字母塊。如果你告訴這只機(jī)械手展示字母A,它就會(huì)拿起字母A的方塊。

在谷歌機(jī)器人實(shí)驗(yàn)室,研究人員已經(jīng)證明,機(jī)器人可以學(xué)會(huì)撿起隨機(jī)的物品,比如乒乓球和塑料香蕉,然后把它們?nèi)拥綆子⒊咄獾睦淅?。這種技術(shù)可以幫助亞馬遜(Amazon)、聯(lián)邦快遞(FedEx)等公司運(yùn)營(yíng)的大型倉(cāng)庫(kù)和配送中心對(duì)物品進(jìn)行分類。如今這些任務(wù)仍然是由人工處理的。

當(dāng)像DeepMind和OpenAI這樣的實(shí)驗(yàn)室處理更大的問(wèn)題時(shí),他們可能開始需要非常大的計(jì)算能力。OpenAI的系統(tǒng)在幾個(gè)月的時(shí)間里(超過(guò)4.5萬(wàn)年的游戲時(shí)間)學(xué)會(huì)了玩《dota2》,但是它開始依賴于成千上萬(wàn)的電腦芯片。布羅克曼說(shuō),僅僅租用所有這些芯片的使用權(quán)就花費(fèi)了實(shí)驗(yàn)室數(shù)百萬(wàn)美元。

DeepMind和OpenAI能夠負(fù)擔(dān)得起所有這些計(jì)算能力所帶來(lái)的資金壓力。OpenAI的資金來(lái)自硅谷的各種巨頭,包括科斯拉風(fēng)投(Khosla Ventures)和科技業(yè)億萬(wàn)富翁里德·霍夫曼(Reid Hoffman)。但卡耐基·梅隆大學(xué)(Carnegie Mellon University)的人工智能研究員戴文德拉·查普勞德(Devendra Chaplot)說(shuō),學(xué)術(shù)實(shí)驗(yàn)室和其他小型機(jī)構(gòu)做不到這一點(diǎn)。對(duì)一些人來(lái)說(shuō),他們擔(dān)心一些資金充足的實(shí)驗(yàn)室將主導(dǎo)人工智能的未來(lái)。

但是,即使是大型實(shí)驗(yàn)室也可能沒有足夠的計(jì)算能力將這些技術(shù)應(yīng)用到復(fù)雜的現(xiàn)實(shí)世界中,這可能需要更強(qiáng)大的人工智能形式,它們可以更快地學(xué)習(xí)。盡管這些人工智能程序現(xiàn)在可以在虛擬世界中贏得勝利,但它們?cè)谙牧顮I(yíng)的空地上(現(xiàn)實(shí)世界)想要戰(zhàn)勝人類還是毫無(wú)希望的——而且在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)都將是如此。

(選自:NYTimes原作者:Cade Metz)