原形毕露!OpenAI 5团战人类职业选手,首战AI大溃败!

大数据文摘出品

编译:罗然、蒋宝尚、CoolBoy

从单人赛打败Dendi到5v5公开赛团灭,OpenAI第一次在DOTA2公开赛中输给了人类玩家。

刚刚,DOTA2全球顶级赛事Ti8(TheInternationalDOTA2Championships)的第一场人机对决「表演赛」结束,OpenAIFive大战Pain战队50多分钟,最终以失败告终。

OpenAICTO,同时也是OpenAIFive的工程领队GregBrockman发推祝贺paiN战队获胜

paiN战队发推庆祝胜利:带着如释重负笑容,庆祝「人类」获得胜利

事实上,今天的这一结局是多数人类玩家没有预料到的。毕竟从Alphago的经验来看,AI的进步速度远超人类。并且本月早些时候,OpenAIFive曾与DOTA2半职业玩家团队交手,比赛结果是2:1,人类输掉了比赛。2017年,比较原始版本的AI在1v1战斗中就击败了人类职业玩家Dendi。

这次国际DOTA2锦标赛OpenAIFive不参与冠军赛的角逐,而是参加国际「特别赛事」。

本周,OpenAIFive还将在国际DOTA2锦标赛(TheInternational)上进行三场比赛中的另外两场,比赛时间分别是北京时间周五、周六上午。搜集了败北新数据的OpenAI能否重振旗鼓,我们拭目以待。

比赛官网

?l=schinese

比赛直播间

比赛速览

本场比赛OpenAIFive的对手是paiN战队。此战队成立于2010年7月,是巴西的一支代表队。虽然paiN是最早被淘汰的两支队伍之一,但这次出现在大赛中已经让他们成为首支晋级TheInternational大赛的巴西战队。

队员一览

这次对战规则仍然受限,英雄被限定在18个中,此外,还有一些常规的限制:例如不能使用召唤,不能使用回复药瓶以及不能使用扫描等。

比赛中OpenAI选择的英雄分别是:潮汐猎人、矮人直升机、水晶室女、死亡先知、巫妖。paiN这方则选的是:莱恩、瘟疫法师、巫医、狙击手和斧王。

在这场比赛中,人类的表现不算很好。在前中期,人类玩家的人头数是落后的,然而英雄操作上也不占优势。但是在后期,paiN的玩家逐渐找回节奏,胜利的天平逐渐向人类这方倾斜。

具体来说,斧王一直表现不好,AI虽然在整体执行力、控制技能释放以及保命道具使用上远超人类,但对于游戏的理解、兵线的调整以及大招的释放还有待提高。

在装备购买上,人类其实比较占优势,因为能够根据对手的情况灵活调整,而AI似乎对装备的理解有障碍,整场比赛中,AI花费了比较多的金钱插眼,比如有一次在肉山处,插了两只真眼两只假眼。

在最后时刻,人类玩家屠灭了人工智慧团队,然后打爆了遗蹟,最终取得了胜利。

在比赛的过程中,AI不断的给出自己的胜率,随着比赛形式的变化,AI的比赛胜率也在不断的变化。比赛的一开始,OpenAI给出了97%的胜率,在第35分钟的时候OpenAI预测的胜率降低到了67%。比赛进行到第49分钟,AI认为自己的胜率为20%。

OpenAI之前是靠规则赢得人类?

这次比赛也掀起了社交网站如reddit的不少评论,大多数评论都是对人工智慧玩家的质疑。

比如

「OpenAI在某些领域似乎非常强大,例如团战和单兵作战,但是缺乏整体策略。此外也有一些百事不得其解的错误,比如经检查肉山的状态等,那么这些有可能克服吗?一些较小的明显缺陷可以被纠正,但是要实施人类水平的策略是非常困难。」

又比如

「人工智慧,在没有相互沟通和对其他队员特别关注的情况下也能够知道其他英雄的情况,包括血量、位置等。而人类则需要对队员的特别关注才能够获得这些信息。」

事实上,OpenAIFive曾与DOTA2半职业玩家团队交手后,就有不少质疑声出现。OpenAI的机器人打败了世界上最出色的人类Dota2玩家,这是否意味着人工智慧在玩竞争性游戏时已经比人类更聪明了?

OpenAIFive机器人由称为神经网络的算法组成,这些算法低效地模仿大脑,并在训练和反馈过程后「学习」完成任务。研究公司将其DOTA2-AI进行了180天的虚拟培训,以便为比赛做好准备。然而,这就说明了机器人只能在一些非常具体和有限制的情景内发挥作用。

在这些唱衰AI的文章中,Vice的这篇报导可以被看作其中的代表

DOTA2是一款拥有超过100位英雄的复杂游戏。他们中的一些人使用古怪和改变游戏规则的技能。本次比赛规则颇受非议,英雄的数量被限制到了18个。这是一个令人难以理解的做法,因为Dota2中的一个团队选择英雄时,会根据对手选择的英雄而有所不同。将英雄的数量从100多个减少到18个,人工智慧的实现就更加简单了。

OpenAIFive机器人通过直接从其应用程式编程接口(API)读取游戏信息来玩DOTA2,允许其他程序轻松地与DOTA2接口。这使得AI实时了解比赛信息,而人类玩家必须在屏幕上才能看到到比赛实时信息。

如果一个人能够在与其他人的比赛中做到这一点,那么他就会被判定作弊。今年6月,一名(人类)职业选手因使用可编程滑鼠,让他的整个队伍没有了参赛资格。然而AIFive就像具有可编程滑鼠和心灵感应的团队一样。

乔治亚理工学院计算机学院人工智慧和机器学习副教授MarkRiedl在採访中曾表达了OpenAI有进步空间。

「该API的目的不是为人工智慧提供比人类更多的信息,但是他们能够完美和即时地知道他们想知道的。他们需要研究转向基于全视觉的输入系统。在比赛时要做到平等,就必须和人类一样使用视觉。」

但不管胜利还是失败,你都能从这些比赛中发现AI不同寻常的能力。「AI知道每个人都在哪里,它知道你拥有多少[攻击力],它确切地知道它们在一条战道上的三个或四个英雄之间可以造成多大的伤害,并且当你处于错误的位置时它会马上把握住时机。而且它知道我从来没有遇到过类似的东西,只是看起来很神奇。」

DOTA2中战胜人类到底对AI研究有何帮助?

而不少看客也在评论中表达了对于DOTA2人机对战的必要性:为什么要花大力气让人机在游戏中对抗呢?

Riedl曾说,「人工智慧玩游戏的主要原因之一是,游戏看起来更像复杂现实世界的跳板。」

OpenAI并不只是想在电子游戏中击败专业队伍,而是在学习如何通过做上千个小决定来达成更大的终极目标。例如OpenAI就在另外一个项目中再次使用了和DOTA2机器人相同学习系统与算法:研究人员设计了一个算法来控制机械手握住一个积木,并且用机械手的指头来操控它指向一个特定的方向。

在跟半职业选手的比赛中获胜后,OpenAI的技术人员JonasSchneider曾在採访中称,这两个项目是同时开始的。但是去年当DOTA2的团队展示出在游戏中击败人类职业选手的进展时,机器人技术团队才了解到强化学习系统的潜力。

「我们用和DOTA实验相同的代码达到了基本同样的性能水平」Schneider说道。「只用了几个星期它就能达到我们之前几个月尝试达到的效果。这让我们十分惊讶。」

这些实验都採用了OpenAI开发的Rapid程序,这一程序协调了同时运行上百种强化学习算法的数以千计的处理器。每种算法驱动一个机器人玩游戏或者模拟手部动作,试验结束后学到的东西会同步给其他机器人。

利用几千倍于普通笔记本电脑的计算力,机械手已经不必通过人类对每个手指的移动进行编码,也可以拥有出色的灵巧度。

对于OpenAI机器人技术团队来说,DOTA2是这项技术可以在未来应用于复杂工作的一个验证。DOTA2系统运用的计算力是机械手的20倍之多,其训练时间长达两星期,而机械手只用了两天——这意味着机器人技术团队有更多的时间和资源来处理那些需要更长时间来学习的新问题。

「我们已经对现在的算法能走这么远感到十分惊讶,所以某种程度上我们希望DOTA可以成为AI游戏探索上的最后一个里程碑,」Schneider说。「很明确的是,如果这样一个复杂的游戏可以通过强化学习来解决,那这将是强化学习和电子游戏的终极考验。」

相关报导: