会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
OpenCSG
博客园
首页
新随笔
联系
订阅
管理
2026年5月8日
万亿参数只激活420亿:小米MiMo-V2.5-Pro用混合专家架构重新定义长文本推理
摘要: 当行业还在为百万 token 上下文窗口而欢呼时,小米已经悄然将这个数字推到了一个新的量级。 2026年4月27日,小米开源了MiMo-V2.5-Pro——一个拥有1.02万亿总参数、但每次推理只激活420亿参数的混合专家(MoE)语言模型。这不是简单的参数堆砌,而是一次架构层面的深度创新:它支持高
阅读全文
posted @ 2026-05-08 15:37 OpenCSG
阅读(99)
评论(0)
推荐(0)
公告