摘要: 根据小红书和牛客网的面经总结。 阅读全文
posted @ 2026-03-02 21:47 MoonOut 阅读(632) 评论(0) 推荐(0)
摘要: 存下来方便查阅。 阅读全文
posted @ 2023-06-16 10:10 MoonOut 阅读(612) 评论(1) 推荐(0)
摘要: TBC。 阅读全文
posted @ 2026-05-27 14:26 MoonOut 阅读(40) 评论(0) 推荐(0)
摘要: TBC。 阅读全文
posted @ 2026-05-27 14:26 MoonOut 阅读(31) 评论(0) 推荐(0)
摘要: 读了 step 3.5 flash 和 step-deepresearch。 阅读全文
posted @ 2026-05-25 11:47 MoonOut 阅读(20) 评论(0) 推荐(0)
摘要: 简单读了 kimi k2 k2.5 和 kimi-researcher。 阅读全文
posted @ 2026-05-15 16:46 MoonOut 阅读(27) 评论(0) 推荐(0)
摘要: 读了 DeepSeek-v3.2 和 v4 的技术报告。 阅读全文
posted @ 2026-05-15 16:46 MoonOut 阅读(67) 评论(0) 推荐(0)
摘要: 读了 mirothinker v1 v1.7 H1 和 miroflow。 阅读全文
posted @ 2026-05-15 16:40 MoonOut 阅读(17) 评论(0) 推荐(0)
摘要: 2026.05 | 速读文章纪录 阅读全文
posted @ 2026-05-01 18:11 MoonOut 阅读(127) 评论(0) 推荐(0)
摘要: 记录了一下目前安装 claude code 的过程。 阅读全文
posted @ 2026-04-29 23:10 MoonOut 阅读(500) 评论(0) 推荐(0)
摘要: 核心解决方案:从本地下载 vscode 服务器,然后 scp 传到 ubuntu 机器上去,同时降级 Remote - SSH 插件。20260417 补档。 阅读全文
posted @ 2026-04-17 23:24 MoonOut 阅读(286) 评论(0) 推荐(0)
摘要: 总结了 skill discovery 领域的经典工作。 阅读全文
posted @ 2026-04-12 15:25 MoonOut 阅读(197) 评论(0) 推荐(0)
摘要: 整理了 MiroThinker 项目的技术报告和公开资料。 阅读全文
posted @ 2026-04-09 17:18 MoonOut 阅读(281) 评论(0) 推荐(0)
摘要: 阅读了强化学习、推荐系统、CLIP、robotics 等领域的 scaling laws 论文。 阅读全文
posted @ 2026-04-08 15:58 MoonOut 阅读(93) 评论(0) 推荐(0)
摘要: 整理了 12 个 LLM 后训练 / Agent 相关的 GitHub 高 star 项目,涵盖 RL 后训练、多轮交互、search agent、CLI agent 等前沿内容。 阅读全文
posted @ 2026-04-02 15:51 MoonOut 阅读(692) 评论(0) 推荐(0)
摘要: 双指针法也不算很难理解,画一下图就能理解了。 阅读全文
posted @ 2026-03-25 00:25 MoonOut 阅读(55) 评论(0) 推荐(0)
摘要: bfs 爆搜挺好的,打算先学一个 bfs,dfs 以后再看。 阅读全文
posted @ 2026-03-25 00:03 MoonOut 阅读(117) 评论(0) 推荐(0)
摘要: 感觉是经典 dp 问题,前两个贪心,后两个背过好了。 阅读全文
posted @ 2026-03-23 14:33 MoonOut 阅读(99) 评论(0) 推荐(0)
摘要: 中心扩展法:o(n) 遍历所有可能长出回文串的中心位置,o(n) 从中心位置向外拓展回文串。dp:dp[i][j] 表示 s[i:j+1] 是否是回文串,s[i] == s[j] 时 dp[i][j] = dp[i+1][j-1]。 阅读全文
posted @ 2026-03-23 14:05 MoonOut 阅读(198) 评论(0) 推荐(0)
摘要: ① 小于 L 位的数可以随便组成,ans += Σ_{i=1}^{L-1} [D^i];② 对于组成正好 L 位的数,对数位从高到低逐个数考察,如果 s[i] < d[j] 则后面 (L-1-i) 位数字随便选,如果 s[i] == d[j] 则去考察 s[i+1] 看看能否用 d[j'] 匹配上,如果 s[i] > 所有 d[j] 则统计结束。 阅读全文
posted @ 2026-03-23 13:34 MoonOut 阅读(65) 评论(0) 推荐(0)
摘要: 本博客总结了与强化学习、RLHF 相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-21 19:13 MoonOut 阅读(1423) 评论(0) 推荐(0)
摘要: 整理了 focal 等经典 offline meta-RL 工作的 1. offline 数据集收集、2. policy 训练和性能测试的方法。 阅读全文
posted @ 2026-03-19 16:34 MoonOut 阅读(222) 评论(0) 推荐(0)
摘要: 本博客总结了与多模态、主流模型架构相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-18 14:29 MoonOut 阅读(1471) 评论(0) 推荐(0)
摘要: 本博客总结了 LLM 八股面试题中的手撕代码题。 阅读全文
posted @ 2026-03-15 21:57 MoonOut 阅读(2074) 评论(2) 推荐(3)
摘要: 本博客总结了与 LLM 训练流程、微调技术相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-11 23:14 MoonOut 阅读(1106) 评论(0) 推荐(0)
摘要: 本博客总结了与 Transformer 相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-11 16:33 MoonOut 阅读(1676) 评论(0) 推荐(1)
摘要: 根据小红书和牛客网的面经总结。 阅读全文
posted @ 2026-03-11 15:12 MoonOut 阅读(2893) 评论(0) 推荐(0)
摘要: 复习一下经典 dp 模型 背包问题。 阅读全文
posted @ 2026-03-10 20:08 MoonOut 阅读(126) 评论(0) 推荐(0)
摘要: 感觉状态机的思路是最直观的。 阅读全文
posted @ 2026-03-10 18:57 MoonOut 阅读(27) 评论(0) 推荐(0)
摘要: 这个题使用桶排序思想:维护一个长度为 MAX_OCCUR_COUNT 的数组 buckets,buckets[i] = c 代表元素 c 出现 i 次。 阅读全文
posted @ 2026-03-10 16:29 MoonOut 阅读(24) 评论(0) 推荐(0)
摘要: 这个题不需要用到并查集;o(m×n) 复杂度遍历整个地图,使用 bfs 把所有岛屿“淹没”,就可以了。 阅读全文
posted @ 2026-03-10 15:00 MoonOut 阅读(99) 评论(0) 推荐(0)
摘要: 如果二叉树维护了父节点,则寻找最小公共祖先可以使用时间复杂度 o(H)、空间复杂度 o(1) 的双指针法,利用路径相等的原理,非常巧妙。 阅读全文
posted @ 2026-03-10 14:19 MoonOut 阅读(52) 评论(0) 推荐(0)
摘要: 经典二叉树递归题。如果 node == p 或 q 或 None,返回 node;然后,left, right = dfs(左子树) (右子树);如果 left 或 right 有值,证明 p 或 q 被找到了,返回有值的那个;如果 left right 都有值,则 p q 分别为 left right,return node。 阅读全文
posted @ 2026-03-10 14:08 MoonOut 阅读(184) 评论(0) 推荐(0)
摘要: 递归调用函数,对一个“根节点-左节点-右节点”结构的情况进行枚举:1. 路径为“根节点→左节点或右节点→它的子节点”;2. 路径为“左节点的子节点→左节点→根节点→右节点→右节点的子节点”。 阅读全文
posted @ 2026-03-10 13:43 MoonOut 阅读(79) 评论(0) 推荐(0)
摘要: 使用拒绝采样,构造 7×7 = 49 大小的空间,然后只使用 1-40。 阅读全文
posted @ 2026-03-04 14:19 MoonOut 阅读(216) 评论(0) 推荐(2)
摘要: 感觉是简单最小堆题目,不知道为啥 leetcode 评级是 hard。以及,因为 python list 排序很快,所以也可直接把链表上所有元素拿下来,排序,再构建全新链表。 阅读全文
posted @ 2026-03-03 23:21 MoonOut 阅读(68) 评论(0) 推荐(0)
摘要: 利用数组 1 末尾的空闲空间,使用从后向前的双指针,遍历数组 1 2 。 阅读全文
posted @ 2026-03-03 23:04 MoonOut 阅读(103) 评论(0) 推荐(0)
摘要: 二分查找:第 K 小的元素是多大呢?在有序矩阵中,给定一个数值,只需要 o(n) 复杂度,就可以得到 ≤ 它的元素的数量。因此,时间复杂度为 二分的 o(log 值域大小) × 查找的 o(n)。 阅读全文
posted @ 2026-03-03 23:00 MoonOut 阅读(105) 评论(0) 推荐(0)
摘要: 经典的 o(n) 做法,是通过类似快排的 partition pivot 操作,递归寻找第 k 大的数;然而思路四更加简洁优雅,时间复杂度也是 o(n) 的。 阅读全文
posted @ 2026-03-03 22:37 MoonOut 阅读(218) 评论(0) 推荐(0)
摘要: 先排序,然后固定数字 1,双指针法搜索数字 2 3,注意要把重复的数字 2 3 去除。 阅读全文
posted @ 2026-03-03 17:04 MoonOut 阅读(161) 评论(0) 推荐(0)
摘要: 使用 python 的 dict 存储 "字符: 出现位置" 的映射。 阅读全文
posted @ 2026-03-03 16:49 MoonOut 阅读(203) 评论(0) 推荐(0)
摘要: 第一次用 python 写记忆化搜索,用 dict 写起来很方便,思路也很清晰。 阅读全文
posted @ 2026-03-03 15:26 MoonOut 阅读(39) 评论(0) 推荐(0)