会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一介布衣、
博客园
首页
新随笔
联系
订阅
管理
2026年2月7日
数字基因(Digital Gene):通过解析概念认知物理世界
摘要: https://arxiv.org/abs/2504.04170 摘要 回顾过去十年人工智能领域的进展,各种重大进展(例如目标检测、图像生成、大语言模型)使人工智能系统能够产生更具语义意义的输出,并在互联网场景中得到广泛应用。然而,当涉及到理解和与物理世界交互时,人工智能系统仍然面临困难。这揭示了一
阅读全文
posted @ 2026-02-07 15:25 一介布衣、
阅读(3)
评论(0)
推荐(0)
2026年1月14日
Moirai 2.0:时间序列预测,少即是多
摘要: Moirai 2.0:时间序列预测,少即是多 摘要 我们推出了 Moirai 2.0,这是一个仅解码器的时间序列基础模型,在包含 3600 万个序列的新语料库上进行训练。该模型采用分位数预测和多令牌预测,提高了概率准确性和推理效率。在 Gift-Eval 基准测试中,它位列顶级预训练模型之列,并在准
阅读全文
posted @ 2026-01-14 16:16 一介布衣、
阅读(54)
评论(0)
推荐(0)
2026年1月3日
【综述】AI智能体时代下的记忆
摘要: https://arxiv.org/pdf/2512.13564 摘要 记忆已经出现,并将继续作为基于基础模型的智能体(agent)的一项核心能力。它支撑着长时程推理、持续适应,以及与复杂环境的有效交互。随着关于智能体记忆的研究迅速扩展并获得前所未有的关注,该领域也变得日益碎片化:纳入“智能体记忆”
阅读全文
posted @ 2026-01-03 22:30 一介布衣、
阅读(104)
评论(0)
推荐(0)
2025年10月28日
【综述】大语言模型智能体的评估与基准测试
摘要: https://arxiv.org/abs/2507.21504 摘要 基于大型语言模型(LLM)的代理(Agent)的兴起为人工智能(AI)应用开辟了新的前沿,但对这些代理的评估仍然是一个复杂且尚不成熟的领域。本综述深入概述了 LLM 代理评估这一新兴领域,并引入了一个二维分类法,该分类法从以下两
阅读全文
posted @ 2025-10-28 15:34 一介布衣、
阅读(232)
评论(0)
推荐(0)
Robobench:一个全面评估多模态大语言模型作为具身智能的基准
摘要: https://arxiv.org/abs/2510.17801 摘要 构建能够在动态、非结构化环境中感知、推理和行动的机器人仍然是一个核心挑战。近期的具身系统通常采用双系统范式,其中系统2(System 2)处理高层推理,而系统1(System 1)执行底层控制。在这项工作中,我们将系统2称为 “
阅读全文
posted @ 2025-10-28 10:45 一介布衣、
阅读(140)
评论(0)
推荐(0)
2025年10月3日
【Anthropic好文】AI 代理的高效上下文工程
摘要: AI 代理的高效上下文工程 来源:https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents 获取时间:2025-10-02 14:57:58 UTC 在应用型 AI 领域经历了几年以提示工程为关
阅读全文
posted @ 2025-10-03 09:18 一介布衣、
阅读(135)
评论(0)
推荐(0)
2025年9月30日
M3-Agent:看见、听见、记住与推理:具备长期记忆的多模态智能体
摘要: https://arxiv.org/abs/2508.09736 https://github.com/bytedance-seed/m3-agent 摘要 我们提出了 M3-Agent,这是一种新颖的多模态智能体框架,具备长期记忆能力。类似于人类, M3-Agent能够处理实时的视觉和听觉输入,并
阅读全文
posted @ 2025-09-30 16:49 一介布衣、
阅读(171)
评论(0)
推荐(0)
2025年9月25日
【综述】基于大语言模型的AI代理通信综述:协议、安全风险与防御对策
摘要: https://arxiv.org/abs/2506.19676 摘要 近年来,基于大语言模型(LLM)的AI代理展现出前所未有的智能与适应性,正在迅速改变人类的生产和生活方式。当前,AI代理正经历新一轮的演化,不再像传统LLM那样作为信息孤岛存在,而是开始与其他代理、工具等多种外部实体进行通信,以
阅读全文
posted @ 2025-09-25 11:15 一介布衣、
阅读(314)
评论(0)
推荐(0)
2025年8月29日
【综述】自我演进的智能代理综述:连接基础模型与终身智能系统的新范式
摘要: https://arxiv.org/abs/2508.07407 摘要 近年来,大语言模型(LLMs)的快速发展激发了人们对能够解决复杂现实任务的 AI 智能体的广泛兴趣。然而,现有大多数智能体系统依赖于人工设计的静态配置,部署后难以适应动态变化的环境。为了解决这一局限,最新研究提出了智能体“进化”
阅读全文
posted @ 2025-08-29 17:56 一介布衣、
阅读(217)
评论(0)
推荐(0)
2025年8月22日
【综述】自我进化智能体综述:迈向人工超级智能之路
摘要: https://arxiv.org/abs/2507.21046 摘要 大型语言模型(LLMs)在多种任务中展现了卓越的能力,但其本质上是静态的,无法根据新任务、不断变化的知识领域或动态交互环境自适应地调整内部参数。随着LLMs越来越多地应用于开放式、交互式环境,这种静态特性已成为关键瓶颈,亟需能够
阅读全文
posted @ 2025-08-22 14:24 一介布衣、
阅读(442)
评论(0)
推荐(0)
下一页
公告