随笔档案「2026年4月」 - 程序员老奥

摘要：

前阵子我把Kokoro整合到OddTTS里，给我的小落同学项目用起来了，结合 Moonshine（语音识别）+ Kokoro（语音合成），可以实现完全的本地端到端语音对话，但是由于我的电脑配置太差（十年前的老笔记本），所以还是想再把OddASR的模型再给换一个更轻量级的试试看效果，这个Moonshine的数据看上去不错，后面准备把它整合一下到OddASR，放到小落同学上去跑跑看效果。阅读全文

posted @ 2026-04-13 23:59 程序员老奥阅读(13) 评论(0) 推荐(0)

轻量级语音变声方案：FFmpeg 实现指南

摘要：

为OddTTS加了一下变声的功能，用的是ffmpeg的方案，时延稍微增加一点，但是还可以接受。阅读全文

posted @ 2026-04-12 23:08 程序员老奥阅读(7) 评论(0) 推荐(0)

复刻自己：Pika AI Selves 深度测评 + 我的小落同学对比

摘要：

我自己也在做一个类似的东西，叫**小落同学**。看到 Pika AI Selves 的时候，第一反应是：终于有人跟我想到一块去了。第二反应是：但我们的路数不太一样。阅读全文

posted @ 2026-04-08 23:41 程序员老奥阅读(13) 评论(0) 推荐(0)

用 OpenSpec 规范 AI 辅助开发：让 AI 准确理解你的需求

摘要：

OpenSpec 能保证 AI 理解了你的需求，但不能保证代码完全正确。用这套工具不会让你完全放手，只是把 debug 的环节从"改 prompt 重跑"变成了"review 代码"——后者通常更高效。阅读全文

posted @ 2026-04-06 23:10 程序员老奥阅读(81) 评论(0) 推荐(0)

用 OddTTS + oh-my-openagent 从0实现有声书功能

摘要：

实测效果： - 5 万字文本 → 约 2.5 小时音频 - 纯 CPU 推理，不需要显卡 - 8 种音色切换（Kokoro 引擎） - 中英混合朗读自然 - 中途停止后可以从断点继续阅读全文

posted @ 2026-04-05 18:45 程序员老奥阅读(36) 评论(0) 推荐(0)

OddTTS更新：十年前老笔记本以纯CPU跑中英混合语音合成

摘要：特别感谢一下一位大佬：**路遥**。因为前面我以为Kokoro不支持中英混合，所以一开始是准备用MeloTTS的（对CPU要求相对较高），在他的提示下才发现原来Kokoro也可以通过将创建英文和中文两个pipeline来实现中英混合。阅读全文

posted @ 2026-04-04 21:57 程序员老奥阅读(17) 评论(0) 推荐(0)

04 2026 档案

公告