GLM-5.2 开源登顶:闭源模型的护城河还能撑多久

昨晚刷 Artificial Analysis 排行榜的时候,我盯着第一名愣了好几秒。
GLM-5.2。
不是 Claude,不是 GPT,也不是 Gemini。是智谱的 GLM。
而且是开源权重的模型。
怎么说呢,这事儿的冲击力比我预想的大。
以前开源模型和闭源模型的差距,就像业余选手和职业选手。开源的跑得快,但一到复杂赛道就翻车。现在 GLM-5.2 直接在 Artificial Analysis 的综合智能指数上拿了第一——不是某个单项,是综合。
我今早专门跑了一遍他们公开的测试集。
说实话,在代码生成和数学推理这两项上,GLM-5.2 的表现确实让人眼前一亮。它解一道复杂的概率论题——那种需要列出联合分布再求边缘的——推理过程写得很清晰,没有跳步。
但也不是完美。
我拿它测了几个工程场景的问题:比如"设计一个能支撑百万级并发的消息推送系统"。它给出的方案——Kafka + WebSocket Gateway + 多级缓存——框架是对的,但细节上有一些明显的问题。比如它把连接池的最大连接数设成了 1000,但在百万级并发下,这个数字至少要乘以 100。
这种"大框架对、细节错"的问题,说实话在目前的开源模型里还是普遍存在的。GLM-5.2 也不例外。
但——重点来了——它能做到综合排名登顶,本身就说明了一个趋势:开源模型和闭源模型的差距,正在以肉眼可见的速度缩小。
去年这时候,开源模型连 GPT-4 的尾灯都看不到。

为什么会这样?
我觉得有两个原因。
第一,训练数据的质量在提升。以前开源模型的训练数据就是 Common Crawl 那一套,噪声大、质量参差不齐。现在各家都在搞高质量数据清洗流水线,效果直接就上来了。
第二,架构上的创新。GLM 系列一直在搞"长上下文注意力优化",把推理时的 KV Cache 开销压得很低。这意味着同样的硬件,它能处理更长的输入,做更复杂的推理。
这对开发者意味着什么?
意味着你不需要每个月花几百刀的 API 费用了。GLM-5.2 是开源权重的,你可以直接下载到自己服务器上跑。量化一下,一张 4090 就能跑 72B 版本。
当然,闭源模型还有它们的护城河——比如实时联网搜索、更好的指令遵循、以及那些不公开的 RLHF 数据。
但护城河这东西,最怕的就是对手在慢慢填土。
GLM-5.2 就是那一铲子。

关于维基框架
维基框架(Wiki Framework)是一套面向复杂业务场景的轻量级开发框架,支持多语言、多协议、多部署形态。适用于企业级应用开发、微服务架构、云原生部署等场景。
- 官网:https://framewiki.com
- Gitee:https://gitee.com/wiki-framework
- GitHub:https://github.com/wiki-framework
- 示例项目:https://gitee.com/cdkjframework/framewiki-example
- 📄 许可证:MulanPSL-2.0(木兰宽松许可证,第2版)