人工智能正在超越蛮力
国际象棋通常被视为终极精神挑战:在一块8×8的棋盘上下32个棋子,以及几乎无限的可能走法。国际象棋引擎每秒计算数百万步,但传统方法是“蛮力”比赛。蛮力是黑客(显然也是计算机国际象棋模拟)中的一种方法,意味着运行问题的每一种可能性,直到程序找到最佳解决方案。
但马修·赖想让下棋计算机变得更智能。在伦敦帝国理工学院攻读硕士学位期间,他训练人工神经网络达到国际象棋联合会国际大师的水平,比97.8%的评比选手要好。他称自己的软件为长颈鹿。
经过72小时的训练,长颈鹿有46%的时间找出了可能的最佳走法。长颈鹿选择的走法有70%的时间在前3步。赖说,以前在国际象棋中的机器学习尝试,如骑士帽,需要程序员设计“模式识别器”,单独的功能来学习走法,比如用棋子保护国王,或者同时拥有两种颜色的主教的重要性。机器学习算法会观察已经定义的走法,并了解它们有多强。长颈鹿会自动发现这些模式,因此它可以学习连程序员都不会考虑的走法。
赖在他详述长颈鹿的论文中写道:“长颈鹿的打球优势不是来自于能够看得很远,而是来自于能够准确评估棘手的位置,以及理解人类直观的复杂位置概念。”
赖在一组1.75亿数据点上训练了他的人工神经网络,通过不断测试推测解决方案的有效性来模仿人类的学习。他从人类和其他计算机的游戏中提取500万最初的合法棋盘配置,然后对每个棋盘应用随机的合法移动,每个棋盘多次。学习过程包括计算机自己玩,然后根据下一步计算它是否会赢。
在没有任何训练的情况下,长颈鹿在一个标准化的国际象棋引擎测试中获得了15000分中的大约6000分。经过72小时的训练,它在9700分达到顶峰。它学会了。
长颈鹿只打败了一个名为Stockfish 5的引擎,该引擎自2008年创建和调整(最初是围绕2004年的Glaurung国际象棋引擎构建的)。赖写道,长颈鹿能够对抗“精心手工设计的数百个参数的庞然大物”,这是因为它非常年轻,测试包甚至可能低估了他的程序。
赖在他的论文中写道:“由于测试套件很有名,很可能至少有一些引擎是专门针对测试套件进行调整的。由于长颈鹿通过自我游戏发现了所有的评估特征,它很可能知道尚未被人类研究的模式,因此不包括在测试套件中。”
下一步是让长颈鹿更有效率。赖建议使用长颈鹿训练较小的网络可以提高速度,并使用另一个神经网络进行时间管理。
人工智能正在超越蛮力