摘要: 解密Prompt系列66. 视觉Token爆炸→DeepSeek-OCR光学压缩 很多人认为:图像Token的信息密度和效率远不如文本。但 DeepSeek-OCR的核心价值就是它通过一套巧妙的*串行视觉压缩架构*,实现1个视觉Token近乎无损地承载10个文本Token的惊人效率。本文我们借着DeepSeek-OCR回顾下多模态的底层技术演进。 阅读全文
posted @ 2025-12-15 07:48 风雨中的小七 阅读(128) 评论(0) 推荐(0)