摘要: 当行业还在为百万 token 上下文窗口而欢呼时,小米已经悄然将这个数字推到了一个新的量级。 2026年4月27日,小米开源了MiMo-V2.5-Pro——一个拥有1.02万亿总参数、但每次推理只激活420亿参数的混合专家(MoE)语言模型。这不是简单的参数堆砌,而是一次架构层面的深度创新:它支持高 阅读全文
posted @ 2026-05-08 15:37 OpenCSG 阅读(99) 评论(0) 推荐(0)