观看利用AI的机器人在这个经典的迷宫益智游戏中击败人类
在国际象棋、扑克和围棋等认知密集型游戏中,人工智能程序可以轻松、持续地击败人类竞争对手——但在需要身体灵巧的游戏中,机器人要击败它们的生物对手要困难得多。然而,从经典的儿童益智游戏开始,这种性能差距似乎正在缩小。
瑞士苏黎世联邦理工学院的研究人员最近推出了赛博跑步者,这是他们的新机器人系统,它利用精确的物理控制、视觉学习和人工智能训练强化来学习如何比人类更快地玩迷宫。
迷宫和它的许多变体通常由一个顶部有一个扁平木平面的盒子组成,这个木平面使用外部控制旋钮在x轴和y轴上倾斜。木板顶部是一个迷宫,有许多缝隙。目标是从头到尾移动大理石或金属球,而不会掉进其中一个洞里。至少可以说,这是一个…令人沮丧的游戏。但是只要有足够的练习和耐心,玩家通常可以学会在相对较短的时间内稳定他们的控制,让他们的大理石通过安全。
相比之下,据报道,CyberRunner掌握了在短短5小时内完成游戏所需的灵巧度。不仅如此,研究人员声称它现在可以在不到14.5秒的时间内完成迷宫——比现有的人类记录快6%以上。
赛博跑步者新发现的迷宫专业知识的关键是实时强化学习和头顶摄像机的视觉输入的结合。数小时的试错迷宫运行存储在赛博跑步者的记忆中,使其能够逐步学习如何最好地沿着路线成功导航大理石。
[相关:这个人工智能程序可以教你更好地下棋。]
“重要的是,机器人不会为了学习而停止游戏;算法与玩游戏的机器人同时运行,”该项目的描述写道。“结果,机器人不断变得更好,跑了又跑。”
赛博跑步者不仅学会了击败游戏的最快方法,还通过发现迷宫设计本身的缺陷来做到这一点。在测试可能的路径的过程中,人工智能程序发现了捷径,允许它减少运行时间。基本上,赛博跑步者通过寻找避开迷宫标记路径的捷径来创建自己的迷宫作弊代码。
CyberRunner的设计者已经将该项目完全开源,目的是让世界各地的其他研究人员利用和改进该项目的功能。“在CyberRunner之前,只有拥有大量预算和定制实验基础设施的组织才能在这一领域进行研究,”项目合作者、苏黎世联邦理工学院教授拉斐尔·德安德里亚本周在一份声明中说。“现在,只要不到200美元,任何人都可以从事尖端的人工智能研究。此外,一旦成千上万的CyberRunner出现在现实世界中,就有可能在全球范围内进行大规模实验,同时学习。”
观看利用AI的机器人在这个经典的迷宫益智游戏中击败人类