04 2026 档案

摘要:轻量级本地ASR方案:Moonshine Voice从入门到实战前阵子我把Kokoro整合到OddTTS里,给我的小落同学项目用起来了,结合 Moonshine(语音识别)+ Kokoro(语音合成),可以实现完全的本地端到端语音对话,但是由于我的电脑配置太差(十年前的老笔记本),所以还是想再把OddASR的模型再给换一个更轻量级的试试看效果,这个Moonshine的数据看上去不错,后面准备把它整合一下到OddASR,放到小落同学上去跑跑看效果。 阅读全文
posted @ 2026-04-13 23:59 程序员老奥 阅读(13) 评论(0) 推荐(0)
摘要:轻量级语音变声方案:FFmpeg 实现指南为OddTTS加了一下变声的功能,用的是ffmpeg的方案,时延稍微增加一点,但是还可以接受。 阅读全文
posted @ 2026-04-12 23:08 程序员老奥 阅读(7) 评论(0) 推荐(0)
摘要:复刻自己:Pika AI Selves 深度测评 + 我的小落同学对比我自己也在做一个类似的东西,叫**小落同学**。看到 Pika AI Selves 的时候,第一反应是:终于有人跟我想到一块去了。第二反应是:但我们的路数不太一样。 阅读全文
posted @ 2026-04-08 23:41 程序员老奥 阅读(13) 评论(0) 推荐(0)
摘要:用 OpenSpec 规范 AI 辅助开发:让 AI 准确理解你的需求OpenSpec 能保证 AI 理解了你的需求,但不能保证代码完全正确。用这套工具不会让你完全放手,只是把 debug 的环节从"改 prompt 重跑"变成了"review 代码"——后者通常更高效。 阅读全文
posted @ 2026-04-06 23:10 程序员老奥 阅读(81) 评论(0) 推荐(0)
摘要:用 OddTTS  + oh-my-openagent 从0实现有声书功能实测效果: - 5 万字文本 → 约 2.5 小时音频 - 纯 CPU 推理,不需要显卡 - 8 种音色切换(Kokoro 引擎) - 中英混合朗读自然 - 中途停止后可以从断点继续 阅读全文
posted @ 2026-04-05 18:45 程序员老奥 阅读(36) 评论(0) 推荐(0)
摘要:特别感谢一下一位大佬:**路遥**。因为前面我以为Kokoro不支持中英混合,所以一开始是准备用MeloTTS的(对CPU要求相对较高),在他的提示下才发现原来Kokoro也可以通过将创建英文和中文两个pipeline来实现中英混合。 阅读全文
posted @ 2026-04-04 21:57 程序员老奥 阅读(17) 评论(0) 推荐(0)