为什么人工智能在制造时钟方面很糟糕？

AI资讯 2026-01-28 11:45:02 吕宝炎

我无法停止思考AI World Clocks网站。前提很简单：市场上所有主要的AI模型都被要求编写时钟代码，然后你就可以看到结果。问题是：它们都是美丽的灾难。

这些数字似乎总是在错误的地方，有时在时钟本身之外。指针可能在也可能不在正确的位置，有时会漂浮在时钟之外的空间里。即使是非常好的时钟看起来……不知何故也关闭了。

“报时是一件非常人性化的事情，对我们来说很容易做到，而且你很小的时候就学会了，”网站背后的艺术家布赖恩·摩尔在一次采访中告诉我。“扭转局面有点有趣——看到人类可以很容易地做到而计算机不能做到的事情。”

在撰写本文的整个过程中，我一直保持这个网站的开放状态，并且可以确认：这很有趣。但是为什么人工智能在这方面如此糟糕？

需要记住的一点是，该网站将所有模型限制在2000个左右的令牌来生成时钟，并对所有模型使用相同的提示。给定无限的计算能力和非常具体的提示，你可以从人工智能系统中获得更好的时钟。但问题仍然存在：为什么这对人工智能系统来说如此困难？原因指向人工智能系统的工作方式。

人工智能不擅长报时

人工智能不仅不擅长制造时钟；它也不擅长阅读它们。技术专家Alek Safar在2025年的一项研究表明，人类在模拟时钟上报时的准确率为89.1%，而排名最高的人工智能只有39.4%。

这项研究只是假设了可能的原因，但潜在的解释都很有趣。首先，数据集中根本没有足够的时钟图片让人工智能模型准确地学习报时。另一个是时钟图像很难用语言准确描述，这是大型语言模型处理它们所需要的。

爱丁堡大学信息学学院进行的另一项2025年研究还发现，当显示模拟时钟的图像时，所有主要的大型语言模型都无法理解时间。

“我们的发现表明，成功的时间推理需要结合精确的视觉感知、数值计算和结构化的逻辑推理，而目前的MLLM尚未掌握这些，”该研究说。

正如我所说，这两项研究都没有声称完全知道为什么人工智能不擅长这些任务。不过，有一些有趣的因素需要考虑，包括人工智能系统用来理解世界的数据集。

你需要明白的一点是，大型语言模型——当代术语中被称为“人工智能”的技术——并不真正做数学运算。这是违反直觉的，因为我们习惯于将计算机视为数学机器，但现代人工智能技术更多地基于模式识别。时钟是一个有趣的例子。这些系统不是计算指针的角度或位置来判断时间，而是试图根据模式识别来猜测时间。仔细想想，这与我个人在看时钟时如何判断时间没有什么不同——人工智能系统在这方面很糟糕。原因有一些有趣的原因。

10点10分的问题

进入你选择的图像搜索工具，输入“手表”，然后跟踪你在表盘上看到的时间。你会很快注意到大多数模拟手表都设置为十点后十点（10:10）。

为什么是这个特定的时间？因为营销。手表和钟表卖家早就知道，将手表设置为10:10会让潜在买家更有吸引力。2017年发表在《心理学前沿》上的一项研究表明，这可能是因为两只手的角度类似于人类的微笑。另一个考虑因素是，在10:10，指针不会遮住标志、品牌名称或任何复杂的东西，比如日期。基本上，这是一张有吸引力的照片，已经成为手表和钟表营销的标准。

这样做的一个后果是：互联网上的许多手表和时钟图像都设置为10:10。这反过来意味着AI数据集中的大部分时钟都设置为同一时间。让任何人工智能系统给你画一个时钟，大多数时候，他们会把它设置为10:10——有时即使你要求不同的时间。这就是摩尔最终制作他的搞笑糟糕人工智能时钟网站的部分原因。

“我让图像生成器给我一张特定时间的时钟图像，但它肯定做不到，”他告诉我。“我会得到很多10:10的图像，尽管我给了它很多特定的提示。”摩尔并不孤单——至少有一个Reddit用户在试图生成设置为特定时间的时钟时注意到了这一点。

诚然，这只是一个关于钟表的小兔子洞，但它指向了人工智能系统可以访问的数据，这些数据可能会影响它们的能力。关于这个问题的讨论中出现了另一个理论：画时钟是痴呆症的常见测试，这反过来意味着互联网上有一些非常不准确的时钟图。

制造人工智能系统的人并不完全了解它们是如何工作的，所以很多都只是猜测。这就是人工智能时钟网站如此有趣的原因：它是对这些系统如何工作的一瞥。