人工智能正在超越蛮力

AI资讯 2026-01-28 12:29:53 黄先羽

国际象棋通常被视为终极精神挑战：在一块8×8的棋盘上下32个棋子，以及几乎无限的可能走法。国际象棋引擎每秒计算数百万步，但传统方法是“蛮力”比赛。蛮力是黑客（显然也是计算机国际象棋模拟）中的一种方法，意味着运行问题的每一种可能性，直到程序找到最佳解决方案。

但马修·赖想让下棋计算机变得更智能。在伦敦帝国理工学院攻读硕士学位期间，他训练人工神经网络达到国际象棋联合会国际大师的水平，比97.8%的评比选手要好。他称自己的软件为长颈鹿。

经过72小时的训练，长颈鹿有46%的时间找出了可能的最佳走法。长颈鹿选择的走法有70%的时间在前3步。赖说，以前在国际象棋中的机器学习尝试，如骑士帽，需要程序员设计“模式识别器”，单独的功能来学习走法，比如用棋子保护国王，或者同时拥有两种颜色的主教的重要性。机器学习算法会观察已经定义的走法，并了解它们有多强。长颈鹿会自动发现这些模式，因此它可以学习连程序员都不会考虑的走法。

赖在他详述长颈鹿的论文中写道：“长颈鹿的打球优势不是来自于能够看得很远，而是来自于能够准确评估棘手的位置，以及理解人类直观的复杂位置概念。”

赖在一组1.75亿数据点上训练了他的人工神经网络，通过不断测试推测解决方案的有效性来模仿人类的学习。他从人类和其他计算机的游戏中提取500万最初的合法棋盘配置，然后对每个棋盘应用随机的合法移动，每个棋盘多次。学习过程包括计算机自己玩，然后根据下一步计算它是否会赢。

在没有任何训练的情况下，长颈鹿在一个标准化的国际象棋引擎测试中获得了15000分中的大约6000分。经过72小时的训练，它在9700分达到顶峰。它学会了。

长颈鹿只打败了一个名为Stockfish 5的引擎，该引擎自2008年创建和调整（最初是围绕2004年的Glaurung国际象棋引擎构建的）。赖写道，长颈鹿能够对抗“精心手工设计的数百个参数的庞然大物”，这是因为它非常年轻，测试包甚至可能低估了他的程序。

赖在他的论文中写道：“由于测试套件很有名，很可能至少有一些引擎是专门针对测试套件进行调整的。由于长颈鹿通过自我游戏发现了所有的评估特征，它很可能知道尚未被人类研究的模式，因此不包括在测试套件中。”

下一步是让长颈鹿更有效率。赖建议使用长颈鹿训练较小的网络可以提高速度，并使用另一个神经网络进行时间管理。