新研究发现 AI 无法读懂模拟时钟，还不能告诉你某天是周几

更新时间：2025-05-18 03:59:58 发布时间：3小时前浏览：9977 评论：0

内容摘要IT之家 5 月 17 日消息，根据外媒 LiveScience 今日报道，有些人类能轻松完成的任务，AI 却无法胜任。譬如，AI 能编程、画出逼真的图像、生成接近人类语气的文本，甚至在部分考试中取得不错成绩，但在日常生活中最基础的“看钟”

IT之家 5 月 17 日消息，根据外媒 LiveScience 今日报道，有些人类能轻松完成的任务，AI 却无法胜任。譬如，AI 能编程、画出逼真的图像、生成接近人类语气的文本，甚至在部分考试中取得不错成绩，但在日常生活中最基础的“看钟”“算日子”这类事情上，却频繁出错 —— 要么读不准指针位置，要么算不出星期几。

研究人员在 2025 年“国际学习表征会议”（ ICLR ）上介绍了这项发现，有关的论文已经在 arXiv 上发布，目前尚未通过同行评审。

爱丁堡大学研究员、论文作者 Rohit Saxena 表示：“人类从小就能掌握时间与日历概念，而 AI 在这方面的不足，是一个值得警惕的信号。”他指出，若要将 AI 应用于现实生活中对时间敏感的场景，比如排班、自动化流程或辅助技术，这类基本能力的缺陷必须解决。

研究团队向多个具备图文处理能力大语言模型的输入了一组专门制作的时钟与日历图像，受测模型包括 meta 的 Llama 3.2-Vision、Anthropic 的 Claude-3.5 Sonnet、谷歌的 Gemini 2.0 和 OpenAI 的 GPT-4o。测试结果显示，这些模型在判断时钟时间或推算日期星期的任务上，正确率都未超过一半。

Saxena 表示：“过去的 AI 训练依赖大量带标签的例子，而读时钟需要的是空间推理。模型不仅要识别指针是否重叠，还要理解角度、分辨各种风格的表盘，比如罗马数字或艺术化设计。这远比单纯识别‘这是一个时钟’更复杂。”

日历问题同样难住了 AI。例如在“每年第 153 天是星期几”这类问题上，错误率依然居高不下。研究显示，AI 读时钟的正确率仅为 38.7%，判断日历的准确率更低，只有 26.3%。

Saxena 解释道：“对传统计算机来说，算术轻而易举，但对大模型而言则不然。AI 并不执行算法，而是依靠从训练数据中学到的模式来预测答案。”他指出，虽然 AI 有时能答对问题，但其推理过程缺乏一致性，也不基于固定规则，这正是研究所揭示的差距。

研究还揭示了另一个问题，即当 AI 的训练样本缺乏某类现象时，比如闰年或复杂的日历规则，其表现往往更差。Saxena 表示：“即使模型了解‘闰年’这一概念，也不代表它们能将这个知识正确应用到具体的视觉判断中。”

IT之家从报道中获悉，研究强调了两个方面的改进方向：一是训练数据应包含更多具有代表性的示例；二是应重新审视 AI 如何整合逻辑推理与空间感知，尤其是在处理不常遇到的任务时。

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 新研究发现 AI 无法读懂模拟时钟，还不能告诉你某天是周几

本文链接: http://0441.cn/news/show-294998.html (转载时请保留)

0 条

残特奥会聋人足球项目在佛山开赛

科技 perfectworld1121 ⋅ 5阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
20位小米SU7 Ultra车主为小米送上特别礼物！雷军感谢

科技 shjmt333 ⋅ 10阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
白酒公司高管集体大降薪，白酒企业这是怎么了？

科技 ch168 ⋅ 1阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
荔湾20家文博场馆携手开启“博物馆+”模式

科技 jinyinghg ⋅ 13阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
算力互联网试验网建设启动

科技 shsrjx8 ⋅ 2阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
军博会蔚来墙 “智显” 军事新图景，多重技术赋能战场新视觉

科技 gzdebell ⋅ 9阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
广州市标准化研究院调研清远市阳山县太平镇 “广州标准”赋能乡村振兴助力地方标准化建设

科技 boaohuagong ⋅ 14阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
大众轿车高速上撞鸟车标都飞了网友：秒变“卡雁”

科技丹色贸易 ⋅ 11阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
著名国际艺术策展人程昕东：当代艺术最能打动人的是丰富多元的表达

科技 spmy020 ⋅ 14阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18
广州艺术生态孕育破局的可能

科技 zhang425024413 ⋅ 7阅读量 ⋅ 0评论 ⋅ 56分钟前

2025-05-18

雷海燕

去ta空间

24小时热闻

今日推荐