deephub

2026年6月4日

手写 Triton Softmax Kernel：程序实例、块大小、mask 与指针算术

摘要： GPU 编程看起来总像黑魔法，满眼是 warps、shared memory、tensor cores，还有 kernel 里古怪的索引运算。但是这篇文章从一个具体例子入手帮你理解 Triton：从头实现一个 softmax kernel。以官方 Triton 教程为基础，深入代码背后的原理并配上阅读全文

posted @ 2026-06-04 21:21 deephub 阅读(3) 评论(0) 推荐(0)

2026年6月3日

Claude Code 调优实操：改完这 10 个设置之后输出质量和效率可以翻倍

摘要：如果你最近感觉 Claude 编码变差了不少，这可能是因为Anthropic 悄悄修改了默认配置参数，而不是模型的问题。 Agent 思考变少了、语法更差、工具调用减少，注释也被去掉了。模型本身没有退化，Anthropic只是把默认执行力度（effort）从"high"降到了"medium"而且没阅读全文

posted @ 2026-06-03 21:31 deephub 阅读(5) 评论(0) 推荐(0)

2026年6月1日

Prompt Engineering 的本质：角色、任务、上下文、格式、约束

摘要：如果你在 ChatGPT、Claude 或 Gemini 里输入过一个问题但是发现："这不是我的意思"——那你已经碰到了 prompt engineering 的核心问题。模型没理解你的想法不是因为它笨，而是因为语言本身就充满歧义，AI 模型不像人，它读不了你的心思，没有共享的对话历史可以依赖，也阅读全文

posted @ 2026-06-01 22:14 deephub 阅读(6) 评论(0) 推荐(0)

2026年5月31日

视频 RAG 中分块策略：基于停顿、滑动窗口与基于 LLM 的方法

摘要：文本的RAG我们都已经很熟悉了，但是如果数据以原始视频转录文本的形式存储，没有合适的时间结构，那么相比标准的 PDF 或文本文档，如何检索视频里面的内容呢？针对同样的问题还可以换一个更高层次的问法： “这个视频整体在讲什么？” 系统会出现幻觉，或者返回一段泛泛的答案——检索器看到的只是孤立的短片段看阅读全文

posted @ 2026-05-31 21:49 deephub 阅读(4) 评论(0) 推荐(0)

2026年5月29日

lat.md：将任意项目代码转换为可查询的知识图谱

摘要：模型一次只能看到项目里的一小部分。当代码规模膨胀到一定程度，把所有文件喂给 AI 就不再是可行的做法——上下文很快被吃光，模型也容易迷失在细节里丢掉对整体的把握。Graphify 可以会把代码、文档，以及视频、音频等媒体素材，一起构建成一份持久化的知识图谱。但是Graphify 偏向做高层信息抽取，阅读全文

posted @ 2026-05-29 22:05 deephub 阅读(5) 评论(0) 推荐(0)

2026年5月27日

四种无向量RAG 方案实测:BM25、GraphRAG、Tree Search、Agent

摘要：基于向量的 RAG 优化的是语义相似度（semantic similarity）：比如"不允许退货的政策"和"允许退货的政策"这两个查询会产生几乎相同的 embedding。模型理解的不是逻辑而是向量空间中的邻近关系。更麻烦的是分块（chunking）：把文档机械切成片段，会把逻辑连贯性一并打碎。阅读全文

posted @ 2026-05-27 21:46 deephub 阅读(4) 评论(0) 推荐(0)

2026年5月26日

Agentic 设计模式拆解：6 种结构的优缺点与应用场景

摘要： Agentic AI 这项技术并不新，只是模型性能提高后让它从研究环境走向了可以规模化落地的阶段。所以这篇文章总结一些常见的设计模式，这些模式归纳了在大量已验证实现中反复出现的共性，可以视为一组结构化的骨架，用来理解智能体（Agent）、用户、模型和工具之间的核心交互。下面会介绍 5 种常见的设阅读全文

posted @ 2026-05-26 21:56 deephub 阅读(5) 评论(0) 推荐(0)

2026年5月25日

从零搭建 Harness Engineering 框架：Rule、Skill、Sub-Agent等工程落完整路径

摘要： Harness Engineering（脚手架工程）这个概念已经流行一阵了。网上大多数文章都停留在理论层面，反复解释为什么现代 AI 开发不能再依赖单个 Prompt、也不能把模型当成"聪明的代码自动补全"。不过这里有一个实际问题被反复提及：概念我懂了。可一旦真要落到工程上，第一步到底该做什么？阅读全文

posted @ 2026-05-25 21:39 deephub 阅读(14) 评论(0) 推荐(0)

2026年5月23日

推理 → 行动 → 观察：用 LangChain + Python 实现一个智能体循环

摘要：如果你用过 ChatGPT 或 Claude的话对标准聊天机器人的工作方式应该不陌生：提问然后得到一个回答。但如果交给它一个多步骤任务呢？比如：“帮我找到最便宜航班，查询我的常旅客积分，并预订最佳选项”。这时标准聊天机器人就会卡住，因为它没有在单次响应之后继续推进的机制。智能体循环架构（agen 阅读全文

posted @ 2026-05-23 20:48 deephub 阅读(9) 评论(0) 推荐(0)

2026年5月21日

TraceML：用三行代码为训练循环加入 step 级诊断

摘要：一直以来，你都能盯着 loss 曲线看；TraceML 让你看见训练循环内部的效率。在每个训练步骤内部，时间究竟是如何在数据加载、前向、反向和优化器之间分配的，你其实并不清楚。在查看训练运行时，工程师常用的工具链大致是这样： nvidia-smi 和集群仪表盘，用于查看 GPU 利用率 W&B、M 阅读全文

posted @ 2026-05-21 22:02 deephub 阅读(6) 评论(0) 推荐(0)

overfit深度学习

公告