会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
22
23
24
25
26
27
28
29
30
···
159
下一页
2025年9月2日
Memento:基于记忆无需微调即可让大语言模型智能体持续学习的框架
摘要: 大语言模型智能体(LLM Agent)是一类利用大语言模型通过交互、推理和决策来自主执行复杂任务的系统,通常具备访问外部工具、记忆系统或环境的能力。与被动响应单一提示的传统LLM不同,LLM智能体采用主动且迭代的运行模式,在明确目标的引导下执行任务。这类系统正被广泛部署为跨领域的自主问题解决器,Op
阅读全文
posted @ 2025-09-02 19:55 deephub
阅读(41)
评论(0)
推荐(0)
2025年9月1日
AI推理方法演进:CoT、ToT与GoT技术对比分析
摘要: 大语言模型的推理能力提升,经历了从规模扩展到方法创新的转变。Google在2022年提出Chain-of-Thought(CoT),通过让模型"展示工作过程"大幅提升了推理表现。随后Tree-of-Thought和Graph-of-Thought相继出现,推理结构从线性链条演进为复杂图网络。 htt
阅读全文
posted @ 2025-09-01 20:04 deephub
阅读(76)
评论(0)
推荐(0)
2025年8月31日
多智能体系统设计:5种编排模式解决复杂AI任务
摘要: 当你有一个由研究员、文案、数据分析师和质检员组成的团队时,如果没有合理的协调机制,再优秀的个体也可能产生冲突的结论、停滞的流程,或者解决错误的问题。AI智能体同样如此。 随着系统从单体模型向多智能体架构演进,编排成为核心技术能力。仅仅拥有强大的智能体远远不够,关键在于让它们有效协作。编排本质上是设计
阅读全文
posted @ 2025-08-31 20:16 deephub
阅读(50)
评论(0)
推荐(0)
2025年8月30日
神经架构搜索NAS详解:三种核心算法原理与Python实战代码
摘要: 最近好多论文开始将 神经架构搜索(NAS) 应用于大模型或 大型语言/视觉语言模型的设计中。 比如: LangVision-LoRA-NAS、Jet-Nemotron、PhaseNAS 等看来NAS又要有一波热度了,所以我来回顾一下NAS的基础技术。 深度学习的成功很大程度上依赖于神经网络架构的精心
阅读全文
posted @ 2025-08-30 21:59 deephub
阅读(62)
评论(0)
推荐(0)
2025年8月29日
多智能体协作为什么这么难:系统频繁失败的原因分析与解决思路
摘要: 在AI智能体架构设计中,一个核心争议正在分化整个技术社区:是构建复杂的多智能体协同系统,还是专注于提升单智能体的综合能力?基于当前大多数生产环境的实践经验,研究机构发现多智能体系统相比于具备充分上下文信息的单智能体,但往往表现出更高的脆弱性和被过度估计的效能。 在AI系统设计初期,将智能体数量与系统
阅读全文
posted @ 2025-08-29 21:42 deephub
阅读(41)
评论(0)
推荐(0)
2025年8月28日
NVFP4量化技术深度解析:4位精度下实现2.3倍推理加速
摘要: 大型语言模型的参数规模和复杂度持续增长,量化技术已成为优化推理效率的核心手段,这一点在消费级和企业级硬件部署中尤为关键。NVIDIA推出的NVFP4格式在众多量化方案中表现突出,其与Blackwell GPU架构的深度集成实现了显著的性能提升,同时保持了模型精度的稳定性。 本文将从技术角度深入分析N
阅读全文
posted @ 2025-08-28 21:19 deephub
阅读(131)
评论(0)
推荐(0)
2025年8月27日
R-Zero:通过自博弈机制让大语言模型无需外部数据实现自我进化训练
摘要: R-Zero框架实现了大语言模型在无外部训练数据条件下的自主进化与推理能力提升。 当前的LLM改进方法高度依赖大规模人工标注数据,这种范式虽然取得了显著成果但面临两个根本性限制:人类生成数据的有限性将导致训练瓶颈,以及人工数据的智能上界制约了模型超越人类能力的可能性。 针对这一挑战,研究人员提出了一
阅读全文
posted @ 2025-08-27 20:42 deephub
阅读(54)
评论(0)
推荐(0)
2025年8月25日
匹配网络处理不平衡数据集的6种优化策略:有效提升分类准确率
摘要: 匹配网络(Matching Networks)是基于度量的元学习方法,通过计算查询样本与支持集中各样本的相似性实现分类。核心机制依赖距离度量函数,余弦相似度因其对向量幅值不敏感的特性成为主流选择。特征提取阶段与相似度计算之间引入的注意力机制能够为特征向量的不同维度分配差异化权重,这种加权策略在处理图
阅读全文
posted @ 2025-08-25 22:11 deephub
阅读(20)
评论(0)
推荐(0)
2025年8月24日
HiRAG:用分层知识图解决复杂推理问题
摘要: 分层检索增强生成系统(Hierarchical Retrieval-Augmented Generation, HiRAG)是一种先进的知识推理框架,专门用于处理复杂知识图中的多层次推理问题。在处理大规模科学文献(如天体物理学或广义相对论相关论文)时,传统的平面知识图往往难以建立远距离概念间的有效连
阅读全文
posted @ 2025-08-24 20:22 deephub
阅读(47)
评论(0)
推荐(0)
2025年8月23日
这也许就是DeepSeek V3.1性能提升的关键:UE8M0与INT8量化技术对比与优势分析
摘要: DeepSeek在发布其V3.1大语言模型时宣布该模型采用了"UE8M0 FP8 scale data format"进行训练,这一技术细节引发了业界对于新兴量化格式的广泛关注。UE8M0作为FP8格式家族中的一个特殊变体,我们今天来看看这个UE8M0到底是什么。 数值表示格式 我们先看看一般的量化
阅读全文
posted @ 2025-08-23 21:17 deephub
阅读(72)
评论(0)
推荐(0)
上一页
1
···
22
23
24
25
26
27
28
29
30
···
159
下一页
公告