上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 158 下一页
摘要: 传统统计方法在时间序列分析中既简洁又有力,但面对大规模时间序列集合时,扩展性往往不尽如人意。现实中的趋势变化往往微弱、带有噪声、数量也不止一个,靠肉眼判断既不可靠也不现实。一旦需要处理数十乃至数百条时间序列,人工识别就更不可行了。Figure 1: Identify the optimal numb 阅读全文
posted @ 2026-03-11 21:07 deephub 阅读(11) 评论(0) 推荐(0)
摘要: 多数开发者通过教程学Python,教程教的是语法——循环、类、字典。但有经验的Python工程师依赖一套完全不同的工具:惰性求值、描述符、动态类创建、函数式管道。 这些不是入门技巧,是架构层面的武器。 开始使用它们之后,项目体积缩小了,维护成本降低了,自动化也顺畅得多。以下是改变一切的七个技巧。 h 阅读全文
posted @ 2026-03-10 20:51 deephub 阅读(7) 评论(0) 推荐(0)
摘要: 把 AI agent 的逻辑拆分到多个独立运行的服务中,听起来复杂做起来也确实容易乱。LangGraph 的 RemoteGraph 特性算是一个干净的方案:本地编排器负责流程控制,远程图服务器承担具体计算,状态管理和控制流的职责边界清晰。 本文要构建的项目是一个循环数学引擎:本地图编排一个远程图: 阅读全文
posted @ 2026-03-09 20:57 deephub 阅读(8) 评论(0) 推荐(0)
摘要: 和 AI 对话超过 20 轮之后,看着它慢慢开始胡说八道,如果有过这种经历,那么你就应该看看这篇论文 跟 AI 聊天机器人对话时,用户输入的每一个字都会被保存,模型给出的每一条回复同样会被保存。所有历史内容在下一轮对话中被回传给模型,再下一轮,再下一轮,像河底的沉积物越堆越高。 每一个聊天机器人、每 阅读全文
posted @ 2026-03-08 21:43 deephub 阅读(20) 评论(0) 推荐(0)
摘要: Microsoft AutoGen 曾是构建 LLM 多智能体系统的标杆性开源框架。2023 年末由 Microsoft Research 发布后迅速成为研究人员和开发者的默认选择:智能体之间可以互相对话、调用工具、编写并执行代码、在流程中引入人类审批,以对话式的协调方式取代了单条长 Prompt 阅读全文
posted @ 2026-03-07 21:52 deephub 阅读(93) 评论(0) 推荐(0)
摘要: 训练集和测试集如果来自不同的分布,会怎样? 类似的问题不是没遇到过只是语境不同,比如说模型上次构建以来是否发生了数据漂移?销售分析中产品 A 和产品 B 的分布是否存在差异?归结下来问的都是同一件事,如何量化两个分布之间的差异。 https://avoid.overfit.cn/post/7e479 阅读全文
posted @ 2026-03-06 21:01 deephub 阅读(8) 评论(0) 推荐(0)
摘要: AI 和 LLM 的进步通常归因于三个方面的持续改进:模型、数据、计算。三者互相关联。要跑起那些参数量庞大的模型,就需要足够的计算资源来支撑。Llama 3 最大的模型超过 4000 亿参数在 16000 块 GPU 上训练了数周乃至数月,优化计算意味着在更低的成本下训练更大的模型。 本文将介绍 G 阅读全文
posted @ 2026-03-05 20:54 deephub 阅读(7) 评论(0) 推荐(0)
摘要: 本文从简单概率的概念出发,逐步过渡到条件概率,最后介绍贝叶斯定理。整个过程会尽量保持直观,不涉及复杂的数学形式。 假设有两个盒子:盒子 A 和盒子 B。盒子 A 装了 4 个球,3 红 1 绿;盒子 B 同样装了 4 个球,1 红 3 绿。 一个蒙着眼的人站在两个盒子前面,随机选中任一盒子的概率是 阅读全文
posted @ 2026-03-04 19:43 deephub 阅读(15) 评论(0) 推荐(0)
摘要: 在生产环境部署过LLM的人都知道模型权重只是问题的一半,另一半是KV cache:存储注意力状态的运行时内存,让模型在生成token时不必从头开始重算。能不能管好这块内存决定了系统是一个卡顿的demo还是一个可用的推理服务。 本文梳理KV cache管理经历的5个时代,从它根本不存在的阶段,到今天正 阅读全文
posted @ 2026-03-03 21:12 deephub 阅读(28) 评论(0) 推荐(0)
摘要: 可穿戴设备的生理信号处理是健康科技与研究领域反复出现的工程难题。ECG 记录、心率变异性指标、加速度计数据,不管处理哪一类信号,从原始传感器输出到有意义的生物标志物,整条链路都是碎片化的:算法散落在论文、代码仓库和临时脚本里,接口各不相同,数据模型也无法共享。 PhysioDSP 是一个开源 Pyt 阅读全文
posted @ 2026-03-02 21:22 deephub 阅读(12) 评论(0) 推荐(0)
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 158 下一页