大模型榜单周报(2026-01-04)
1. 本周概览
DeepSeek在市占率方面表现突出,份额增加显著。同时,通义实验室开源了GUI智能体MAI-UI,涵盖从端侧小模型到云端大模型的多个尺寸版本。此外,DeepSeek提出了名为「mHC(流形约束超连接)」的新架构,能够在增加极少训练时间开销的情况下实现显著性能提升。
2. 重点关注事件
- 通义实验室于12月26日开源GUI智能体MAI-UI,提供从2B端侧小模型到235B云端大模型四个尺寸版本,覆盖全场景部署需求,论文地址:https://arxiv.org/abs/2512.22047
- DeepSeek于12月31日提出名为「mHC(流形约束超连接)」的新架构,在27B参数模型上,仅增加约6.7%的训练时间开销,即可实现显著性能提升,论文地址:https://arxiv.org/abs/2512.24880
3. 榜单变化
- OpenRouter模型调用量变化:Grok Code Fast 1、Claude Sonnet 4.5保持前两位;小米发布的MiMo-V2-Flash (free)从第4名上升至第3名;编程调用量方面,Grok Code Fast 1保持第1,Devstral 2 2512 (free)上升6名至第2位,MiMo-V2-Flash新上榜位列第8。
- OpenRouter公司市占率变化:Google保持第1位,DeepSeek份额上升3.7%(从9.6%增至13.3%),位列榜单第2名;xAI市占率下降3%(从14.4%降至11.4%),OpenAI市占率下降2.5%(从10.5%降至8.0%);小米、MistralAI、Qwen、z-AI保持第6-9名。
- 大语言模型Text Arena榜单:GLM-4.7新晋榜单第17名,模型评分基于预发布测试,可能会随公开发布后社区反馈和投票的演变而发生变化。
- 编程能力WebDev Arena榜单:minimax-m2.1-preview新晋榜单第6名,紧跟gemini-3-flash之后,超过glm-4.7,评分基于预发布测试。
- 图像编辑能力Artificial Analysis Image Editing Leaderboard:Wan 2.6新晋榜单第7名,排名在Nano Banana之后。
4. OpenRouter排行榜
| 测评类型 | 第一名 | 第二名 | 第三名 |
|---|---|---|---|
| 模型调用量 | Grok Code Fast 1 | Claude Sonnet 4.5 | MiMo-V2-Flash (free) |
| 公司市占率 | DeepSeek | Anthropic | |
| 编程模型调用量 | Grok Code Fast 1 | Devstral 2 2512 (free) | Gemini 3 Flash Preview |
各公司按不同能力领域排名汇总
| 测评类型 | 领先公司 |
|---|---|
| 大语言模型 Text Arena | Google、xAI、Anthropic、OpenAI、百度、智谱、阿里巴巴、月之暗面 |
| 编程能力 LMArena | Anthropic、OpenAI、Google |
| 编程能力 LiveCodeBench | OpenAI、Anthropic、Google |
| 代码工程任务能力 SWE-benchLite | OpenAI、Google、阿里巴巴、月之暗面等 |
| 图像编辑和生成能力 Image Edit Arena | OpenAI、Google、字节、Reve |
| 文生图能力 Text-to-Image Arena | OpenAI、Google、Black Forest Labs、腾讯、字节 |
| 图像编辑和生成能力 Image Editing Leaderboard | OpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve |
| 文生图能力 Text to Image Leaderboard | OpenAI、Google、Black Forest Labs、字节、ImagineArt |
| GPQA 榜单 | OpenAI、Google、xAI、Anthropic、阿里巴巴 |
| FrontierMath 榜单 | OpenAI、Google、月之暗面、Anthropic、xAI |
| Humanity's Last Exam 榜单 | Google、OpenAI、Anthropic |
| GAIA 榜单 | Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等 |
关注我,第一时间掌握更多AI前沿资讯!

浙公网安备 33010602011771号