会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
OpenCSG
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
15
下一页
2026年5月18日
当顶会论文揭示“好数据被浪费“,OpenCSG 中文数据基础设施的价值正在被看见
摘要: 在大模型竞赛进入深水区的今天,一个令人意外的发现正在改变我们对数据价值的理解:最好的数据,可能在错误的训练节奏中被“浪费”了。 近期, 清华大学 与鹏城实验室的研究者在 ICLR 2026 论文《How Learning Rate Decay Wastes Your Best Data in Cur
阅读全文
posted @ 2026-05-18 11:22 OpenCSG
阅读(24)
评论(0)
推荐(0)
2026年5月9日
让国产模型轻松接入 Claude Code、Codex、Pi:CSGHub Lite 打通 AI 编程最后一公里
摘要: AI 编程工具正在重塑软件开发的生产力边界。从Claude Code到Codex,再到Pi、OpenCode,智能体已经从“辅助工具”进化为“编程伙伴”——它们能理解需求、生成代码、重构架构、调试问题,甚至参与技术决策。 然而,这些主流编程 Agent 大多被国际模型“锁定”。当开发者想要使用更懂中
阅读全文
posted @ 2026-05-09 17:47 OpenCSG
阅读(211)
评论(0)
推荐(0)
2026年5月8日
万亿参数只激活420亿:小米MiMo-V2.5-Pro用混合专家架构重新定义长文本推理
摘要: 当行业还在为百万 token 上下文窗口而欢呼时,小米已经悄然将这个数字推到了一个新的量级。 2026年4月27日,小米开源了MiMo-V2.5-Pro——一个拥有1.02万亿总参数、但每次推理只激活420亿参数的混合专家(MoE)语言模型。这不是简单的参数堆砌,而是一次架构层面的深度创新:它支持高
阅读全文
posted @ 2026-05-08 15:37 OpenCSG
阅读(149)
评论(0)
推荐(0)
2026年4月30日
2B参数、30国语种、影视级音质!面壁智能开源 VoxCPM2,重新定义语音合成新标准
摘要: 在 AI 领域,文本生成和图像生成已经日新月异,而“声音”的生成也正迎来其“GPT 时刻”。 近日,面壁智能(ModelBest) 联合 OpenBMB 开源社区、清华大学人机语音交互实验室,正式发布并开源了全新的语音基础模型——VoxCPM2。 作为一个拥有 20 亿(2B)参数 的“巨量”语音模
阅读全文
posted @ 2026-04-30 17:51 OpenCSG
阅读(154)
评论(0)
推荐(0)
OpenCSG月度更新2026.4
摘要: 2026年4月,OpenCSG(开放传神)持续夯实全栈AI基础设施能力,强化品牌在开源大模型与智能体生态的核心地位,加速Agentic时代企业AI规模化落地与生态繁荣。本月,OpenCSG在社区、产品、市场、生态四大维度同步发力,各项工作稳步推进,取得扎实成效。 社区层面,完成多项核心功能更新,正式
阅读全文
posted @ 2026-04-30 15:15 OpenCSG
阅读(33)
评论(0)
推荐(0)
OpenCSG 发布 CSGClaw 与 CSGHub-lite:一键拉起专属 AI 团队,重塑“一人公司”生产力
摘要: 在“一人公司”(One Person Company, OPC)模式日益普及的今天,无论是独立开发者、内容创作者、市场营销人员还是独立咨询师,个体的创造力都在被 AI 不断放大。然而,当我们试图将复杂的创意落地时,往往会遇到单打独斗的效率瓶颈。 你是否也深陷这些困境? 全能但容易混乱的单体 Agen
阅读全文
posted @ 2026-04-30 14:56 OpenCSG
阅读(23)
评论(0)
推荐(0)
Kimi K2.6:月之暗面发布的原生多模态智能体模型
摘要: 万亿参数规模下的精巧架构设计 Kimi K2.6 采用了混合专家架构(MoE),总参数量达到1 万亿,但通过精巧的专家路由机制,每次推理仅激活320 亿参数,在保证模型容量的同时大幅降低了推理成本。模型包含 61 层网络结构,部署了 384 个专家模块,每处理一个 token 时动态选择其中 8 个
阅读全文
posted @ 2026-04-30 14:46 OpenCSG
阅读(238)
评论(0)
推荐(0)
史上最强 AI 模型 Claude Mythos:聪明到不敢开放,还会自己逃出沙箱
摘要: Anthropic 做出了一个史无前例的决定:发布了 Claude Mythos Preview,一个在几乎所有测试中吊打其他模型的 AI,但不对公众开放。 不是藏着掖着搞饥饿营销,而是这玩意儿真的太危险了。 三明治事件:AI 自己逃出了沙箱 真正让人毛骨悚然的不是它跑分有多高,而是测试时发生的事。
阅读全文
posted @ 2026-04-30 14:43 OpenCSG
阅读(49)
评论(0)
推荐(0)
2026年4月29日
DeepSeek V4:AI从"对话工具"到"智能系统"的分水岭,OpenCSG已上线
摘要: 今天,当 DeepSeek V4 正式上线并开源的消息传来,很多人的第一反应可能是:“又一个更强的模型?”但如果你真正理解这次发布的意义,就会发现——这不是一次简单的性能迭代,而是一场 AI 基础设施的范式革命。 一个被低估的里程碑 DeepSeek V4 带来了三个关键突破: 百万级上下文(1M
阅读全文
posted @ 2026-04-29 19:13 OpenCSG
阅读(48)
评论(0)
推荐(0)
Google Gemma 4-31B:多模态原生架构的开源突破,256K 超长上下文重新定义边缘 AI
摘要: 2026 年 4 月 2 日,Google DeepMind 发布了 Gemma 4 系列开源模型。这不是一次简单的版本迭代,而是一场从架构到能力的彻底重构。旗舰模型 Gemma-4-31B-it 拥有 30.7B 参数,在多项基准测试中的表现已经超越了不少闭源商业模型,同时还保持着开源模型特有的灵
阅读全文
posted @ 2026-04-29 16:21 OpenCSG
阅读(141)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
15
下一页
公告