1 2 3 4 5 ··· 159 下一页
摘要: GPU 编程看起来总像黑魔法,满眼是 warps、shared memory、tensor cores,还有 kernel 里古怪的索引运算。但是这篇文章从一个具体例子入手帮你理解 Triton:从头实现一个 softmax kernel。 以官方 Triton 教程为基础,深入代码背后的原理并配上 阅读全文
posted @ 2026-06-04 21:21 deephub 阅读(3) 评论(0) 推荐(0)
摘要: 如果你最近感觉 Claude 编码变差了不少,这可能是因为Anthropic 悄悄修改了默认配置参数,而不是模型的问题。 Agent 思考变少了、语法更差、工具调用减少,注释也被去掉了。 模型本身没有退化,Anthropic只是把默认执行力度(effort)从"high"降到了"medium"而且没 阅读全文
posted @ 2026-06-03 21:31 deephub 阅读(5) 评论(0) 推荐(0)
摘要: 如果你在 ChatGPT、Claude 或 Gemini 里输入过一个问题但是发现:"这不是我的意思"——那你已经碰到了 prompt engineering 的核心问题。 模型没理解你的想法不是因为它笨,而是因为语言本身就充满歧义,AI 模型不像人,它读不了你的心思,没有共享的对话历史可以依赖,也 阅读全文
posted @ 2026-06-01 22:14 deephub 阅读(6) 评论(0) 推荐(0)
摘要: 文本的RAG我们都已经很熟悉了,但是如果数据以原始视频转录文本的形式存储,没有合适的时间结构,那么相比标准的 PDF 或文本文档,如何检索视频里面的内容呢?针对同样的问题还可以换一个更高层次的问法: “这个视频整体在讲什么?” 系统会出现幻觉,或者返回一段泛泛的答案——检索器看到的只是孤立的短片段看 阅读全文
posted @ 2026-05-31 21:49 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 模型一次只能看到项目里的一小部分。当代码规模膨胀到一定程度,把所有文件喂给 AI 就不再是可行的做法——上下文很快被吃光,模型也容易迷失在细节里丢掉对整体的把握。Graphify 可以会把代码、文档,以及视频、音频等媒体素材,一起构建成一份持久化的知识图谱。但是Graphify 偏向做高层信息抽取, 阅读全文
posted @ 2026-05-29 22:05 deephub 阅读(5) 评论(0) 推荐(0)
摘要: 基于向量的 RAG 优化的是语义相似度(semantic similarity):比如"不允许退货的政策"和"允许退货的政策"这两个查询会产生几乎相同的 embedding。模型理解的不是逻辑而是向量空间中的邻近关系。 更麻烦的是分块(chunking):把文档机械切成片段,会把逻辑连贯性一并打碎。 阅读全文
posted @ 2026-05-27 21:46 deephub 阅读(4) 评论(0) 推荐(0)
摘要: Agentic AI 这项技术并不新,只是模型性能提高后让它从研究环境走向了可以规模化落地的阶段。 所以这篇文章总结一些常见的设计模式,这些模式归纳了在大量已验证实现中反复出现的共性,可以视为一组结构化的骨架,用来理解智能体(Agent)、用户、模型和工具之间的核心交互。 下面会介绍 5 种常见的设 阅读全文
posted @ 2026-05-26 21:56 deephub 阅读(5) 评论(0) 推荐(0)
摘要: Harness Engineering(脚手架工程)这个概念已经流行一阵了。网上大多数文章都停留在理论层面,反复解释为什么现代 AI 开发不能再依赖单个 Prompt、也不能把模型当成"聪明的代码自动补全"。不过这里有一个实际问题被反复提及: 概念我懂了。可一旦真要落到工程上,第一步到底该做什么? 阅读全文
posted @ 2026-05-25 21:39 deephub 阅读(14) 评论(0) 推荐(0)
摘要: 如果你用过 ChatGPT 或 Claude的话对标准聊天机器人的工作方式应该不陌生:提问然后得到一个回答。但如果交给它一个多步骤任务呢?比如:“帮我找到最便宜航班,查询我的常旅客积分,并预订最佳选项”。 这时标准聊天机器人就会卡住,因为它没有在单次响应之后继续推进的机制。 智能体循环架构(agen 阅读全文
posted @ 2026-05-23 20:48 deephub 阅读(9) 评论(0) 推荐(0)
摘要: 一直以来,你都能盯着 loss 曲线看;TraceML 让你看见训练循环内部的效率。 在每个训练步骤内部,时间究竟是如何在数据加载、前向、反向和优化器之间分配的,你其实并不清楚。在查看训练运行时,工程师常用的工具链大致是这样: nvidia-smi 和集群仪表盘,用于查看 GPU 利用率 W&B、M 阅读全文
posted @ 2026-05-21 22:02 deephub 阅读(6) 评论(0) 推荐(0)
1 2 3 4 5 ··· 159 下一页