位置:编程技术网 > 物联网 > 正文 >

人类全面溃败!AI训练4.5万年,DOTA 2人机大战大结局

2019年04月15日 11:00来源:未知手机版

标的是什么意思,鑫瑞蓝天,男友被画成二郎神美国沙滩变溜冰场,苍天白鹤新书,郑元畅林依晨隐婚三年,再造神州,轩尼诗李察,gosu

图片来源图虫:已授站长之家使用

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。

【新智元导读】OpenAI Five在Dota  2 中以2: 0 击败了世界冠军团队,人机大战人类最终不敌AI。OpenAI Five在去年输掉比赛后进行了优化,训练时间相当于人类玩了4. 5 万年。

OpenAI可以宣布自己是世界第一了。

今天凌晨,OpenAI Five在Dota  2 中以2: 0 击败了世界冠军团队OG,再次显示出了AI的强大威力,也正式宣告人类在Dota这种高难度游戏中成为AI的手下败将。

这次比赛,OpenAI Five的表现出是迄今为止展示出的最高水平:人类对手去年赢得了世界上最令人垂涎的电子竞技赛事TI8 的冠军;OpenAI Five在去年输掉比赛后进行了优化,训练时间相当于人类玩了4. 5 万年,赢得比赛也并不出乎意料。

2:0,AI战胜人类

在这场人机大战中,每队只有 17 个英雄可供选择。 OpenAI还选择了所谓的“Captain s Draft”游戏模式。与之前的比赛一样,OpenAI也禁用了召唤和幻觉功能,这两项功能都涉及以英雄副本的形式引入其他变量,以及OpenAI训练系统时未考虑的一些特殊因素和单位。

除此之外,这场比赛与正常的Dota  2 比赛一样,其最终目标是摧毁敌方队伍的“基地”,即每个团队领土末端的大型塔楼,在敌人的队伍成功摧毁其他小型塔后,基地是很脆弱的,整个比赛过程的中心是对塔的攻防,以及英雄与英雄之间的团战。

在第一场比赛中,OpenAI Five让对手OG大吃一惊,通过一系列激进战术获得了胜利,其中包括对游戏中获取的金币的花费方式,在本方英雄死亡时立即买活,即使在比赛初期也是如此。

对此,OpenAI首席技术官Greg Brockman指出,OpenAI喜欢有利于短期收益的战略,说明在长期规划上不如人类,而且DOTA2 这种游戏通常要依赖于长期规划才能获胜。然而,在这场比赛中,这种早期的买活策略得到了回报,OpenAI Five获得了优势,当比赛拖入 30 分钟时,OG顶不住了。

在第二场比赛中,OpenAI表现更好,在最初的几分钟内即获得了对OG的早期优势,然后无情碾压了人类玩家,在第一场比赛时间刚刚过半的时间点上即取得胜利。 

值得注意的是,OpenAI Five在第二场比赛中开始玩得异常激进,以及OG在AI全图范围内的推进时有些无力对抗。OpenAI Five能够利用其特定的英雄选择带来的优势。

飞速进化的OpenAI Five:已经训练4. 5 万年

去年 8 月,OpenAI Five曾以3: 2 击败半职业人类玩家,不过当面对职业对手时,OpenAI便输给了paiN Gaming战队,帅不过三秒。

根据OpenAI联合创始人兼主席Greg Brockman(也是该组织的CTO)的说法,在输掉比赛之后,OpenAI Five是通过在加速的虚拟环境中进行自我改进而变得更加强大的。

OpenAI Five由深度强化学习提供支持,也就是说它的编码目的不是“如何游戏”,而是“如何学习”。Brockman在比赛开始前表示。,AI在 10 个月中,已经玩了 45000 年的Dota  2 游戏,而且,玩了这么长时间也没有觉得无聊。

这场比赛采用三局两胜制,所有bot都使用相同的深度强化学习技术进行训练,并由同一OpenAI系统的不同层独立控制。

OpenAI向公众开放与AI对决,终极目标是实现通用人工智能

对于OpenAI来说,值得庆祝的不仅仅是这次胜利,还因为其证明了对强化学习的态度及其关于AI的普适哲学树立的里程碑。

本文地址:http://www.reviewcode.cn/wulianwang/43994.html 转载请注明出处!

今日热点资讯