一介布衣、

2026年2月7日

摘要： https://arxiv.org/abs/2504.04170 摘要回顾过去十年人工智能领域的进展，各种重大进展（例如目标检测、图像生成、大语言模型）使人工智能系统能够产生更具语义意义的输出，并在互联网场景中得到广泛应用。然而，当涉及到理解和与物理世界交互时，人工智能系统仍然面临困难。这揭示了一阅读全文

posted @ 2026-02-07 15:25 一介布衣、阅读(3) 评论(0) 推荐(0)

2026年1月14日

Moirai 2.0：时间序列预测，少即是多

摘要： Moirai 2.0：时间序列预测，少即是多摘要我们推出了 Moirai 2.0，这是一个仅解码器的时间序列基础模型，在包含 3600 万个序列的新语料库上进行训练。该模型采用分位数预测和多令牌预测，提高了概率准确性和推理效率。在 Gift-Eval 基准测试中，它位列顶级预训练模型之列，并在准阅读全文

posted @ 2026-01-14 16:16 一介布衣、阅读(54) 评论(0) 推荐(0)

2026年1月3日

【综述】AI智能体时代下的记忆

摘要： https://arxiv.org/pdf/2512.13564 摘要记忆已经出现，并将继续作为基于基础模型的智能体（agent）的一项核心能力。它支撑着长时程推理、持续适应，以及与复杂环境的有效交互。随着关于智能体记忆的研究迅速扩展并获得前所未有的关注，该领域也变得日益碎片化：纳入“智能体记忆” 阅读全文

posted @ 2026-01-03 22:30 一介布衣、阅读(104) 评论(0) 推荐(0)

2025年10月28日

【综述】大语言模型智能体的评估与基准测试

摘要： https://arxiv.org/abs/2507.21504 摘要基于大型语言模型（LLM）的代理（Agent）的兴起为人工智能（AI）应用开辟了新的前沿，但对这些代理的评估仍然是一个复杂且尚不成熟的领域。本综述深入概述了 LLM 代理评估这一新兴领域，并引入了一个二维分类法，该分类法从以下两阅读全文

posted @ 2025-10-28 15:34 一介布衣、阅读(232) 评论(0) 推荐(0)

Robobench：一个全面评估多模态大语言模型作为具身智能的基准

摘要： https://arxiv.org/abs/2510.17801 摘要构建能够在动态、非结构化环境中感知、推理和行动的机器人仍然是一个核心挑战。近期的具身系统通常采用双系统范式，其中系统2（System 2）处理高层推理，而系统1（System 1）执行底层控制。在这项工作中，我们将系统2称为 “ 阅读全文

posted @ 2025-10-28 10:45 一介布衣、阅读(140) 评论(0) 推荐(0)

2025年10月3日

【Anthropic好文】AI 代理的高效上下文工程

摘要： AI 代理的高效上下文工程来源：https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents 获取时间：2025-10-02 14:57:58 UTC 在应用型 AI 领域经历了几年以提示工程为关阅读全文

posted @ 2025-10-03 09:18 一介布衣、阅读(135) 评论(0) 推荐(0)

2025年9月30日

M3-Agent：看见、听见、记住与推理：具备长期记忆的多模态智能体

摘要： https://arxiv.org/abs/2508.09736 https://github.com/bytedance-seed/m3-agent 摘要我们提出了 M3-Agent，这是一种新颖的多模态智能体框架，具备长期记忆能力。类似于人类， M3-Agent能够处理实时的视觉和听觉输入，并阅读全文

posted @ 2025-09-30 16:49 一介布衣、阅读(171) 评论(0) 推荐(0)

2025年9月25日

【综述】基于大语言模型的AI代理通信综述：协议、安全风险与防御对策

摘要： https://arxiv.org/abs/2506.19676 摘要近年来，基于大语言模型（LLM）的AI代理展现出前所未有的智能与适应性，正在迅速改变人类的生产和生活方式。当前，AI代理正经历新一轮的演化，不再像传统LLM那样作为信息孤岛存在，而是开始与其他代理、工具等多种外部实体进行通信，以阅读全文

posted @ 2025-09-25 11:15 一介布衣、阅读(314) 评论(0) 推荐(0)

2025年8月29日

【综述】自我演进的智能代理综述：连接基础模型与终身智能系统的新范式

摘要： https://arxiv.org/abs/2508.07407 摘要近年来，大语言模型（LLMs）的快速发展激发了人们对能够解决复杂现实任务的 AI 智能体的广泛兴趣。然而，现有大多数智能体系统依赖于人工设计的静态配置，部署后难以适应动态变化的环境。为了解决这一局限，最新研究提出了智能体“进化” 阅读全文

posted @ 2025-08-29 17:56 一介布衣、阅读(217) 评论(0) 推荐(0)

2025年8月22日

【综述】自我进化智能体综述：迈向人工超级智能之路

摘要： https://arxiv.org/abs/2507.21046 摘要大型语言模型（LLMs）在多种任务中展现了卓越的能力，但其本质上是静态的，无法根据新任务、不断变化的知识领域或动态交互环境自适应地调整内部参数。随着LLMs越来越多地应用于开放式、交互式环境，这种静态特性已成为关键瓶颈，亟需能够阅读全文

posted @ 2025-08-22 14:24 一介布衣、阅读(442) 评论(0) 推荐(0)

公告