为什么人工智能在制造时钟方面很糟糕?
我无法停止思考AI World Clocks网站。前提很简单:市场上所有主要的AI模型都被要求编写时钟代码,然后你就可以看到结果。问题是:它们都是美丽的灾难。
这些数字似乎总是在错误的地方,有时在时钟本身之外。指针可能在也可能不在正确的位置,有时会漂浮在时钟之外的空间里。即使是非常好的时钟看起来……不知何故也关闭了。
“报时是一件非常人性化的事情,对我们来说很容易做到,而且你很小的时候就学会了,”网站背后的艺术家布赖恩·摩尔在一次采访中告诉我。“扭转局面有点有趣——看到人类可以很容易地做到而计算机不能做到的事情。”
在撰写本文的整个过程中,我一直保持这个网站的开放状态,并且可以确认:这很有趣。但是为什么人工智能在这方面如此糟糕?
需要记住的一点是,该网站将所有模型限制在2000个左右的令牌来生成时钟,并对所有模型使用相同的提示。给定无限的计算能力和非常具体的提示,你可以从人工智能系统中获得更好的时钟。但问题仍然存在:为什么这对人工智能系统来说如此困难?原因指向人工智能系统的工作方式。
人工智能不擅长报时
人工智能不仅不擅长制造时钟;它也不擅长阅读它们。技术专家Alek Safar在2025年的一项研究表明,人类在模拟时钟上报时的准确率为89.1%,而排名最高的人工智能只有39.4%。
这项研究只是假设了可能的原因,但潜在的解释都很有趣。首先,数据集中根本没有足够的时钟图片让人工智能模型准确地学习报时。另一个是时钟图像很难用语言准确描述,这是大型语言模型处理它们所需要的。
爱丁堡大学信息学学院进行的另一项2025年研究还发现,当显示模拟时钟的图像时,所有主要的大型语言模型都无法理解时间。
“我们的发现表明,成功的时间推理需要结合精确的视觉感知、数值计算和结构化的逻辑推理,而目前的MLLM尚未掌握这些,”该研究说。
正如我所说,这两项研究都没有声称完全知道为什么人工智能不擅长这些任务。不过,有一些有趣的因素需要考虑,包括人工智能系统用来理解世界的数据集。
你需要明白的一点是,大型语言模型——当代术语中被称为“人工智能”的技术——并不真正做数学运算。这是违反直觉的,因为我们习惯于将计算机视为数学机器,但现代人工智能技术更多地基于模式识别。时钟是一个有趣的例子。这些系统不是计算指针的角度或位置来判断时间,而是试图根据模式识别来猜测时间。仔细想想,这与我个人在看时钟时如何判断时间没有什么不同——人工智能系统在这方面很糟糕。原因有一些有趣的原因。
10点10分的问题
进入你选择的图像搜索工具,输入“手表”,然后跟踪你在表盘上看到的时间。你会很快注意到大多数模拟手表都设置为十点后十点(10:10)。
为什么是这个特定的时间?因为营销。手表和钟表卖家早就知道,将手表设置为10:10会让潜在买家更有吸引力。2017年发表在《心理学前沿》上的一项研究表明,这可能是因为两只手的角度类似于人类的微笑。另一个考虑因素是,在10:10,指针不会遮住标志、品牌名称或任何复杂的东西,比如日期。基本上,这是一张有吸引力的照片,已经成为手表和钟表营销的标准。
这样做的一个后果是:互联网上的许多手表和时钟图像都设置为10:10。这反过来意味着AI数据集中的大部分时钟都设置为同一时间。 让任何人工智能系统给你画一个时钟,大多数时候,他们会把它设置为10:10——有时即使你要求不同的时间。这就是摩尔最终制作他的搞笑糟糕人工智能时钟网站的部分原因。
“我让图像生成器给我一张特定时间的时钟图像,但它肯定做不到,”他告诉我。“我会得到很多10:10的图像,尽管我给了它很多特定的提示。”摩尔并不孤单——至少有一个Reddit用户在试图生成设置为特定时间的时钟时注意到了这一点。
诚然,这只是一个关于钟表的小兔子洞,但它指向了人工智能系统可以访问的数据,这些数据可能会影响它们的能力。关于这个问题的讨论中出现了另一个理论:画时钟是痴呆症的常见测试,这反过来意味着互联网上有一些非常不准确的时钟图。
制造人工智能系统的人并不完全了解它们是如何工作的,所以很多都只是猜测。这就是人工智能时钟网站如此有趣的原因:它是对这些系统如何工作的一瞥。
为什么人工智能在制造时钟方面很糟糕?