智谱 GLM-5.1 正式发布:华为芯片训练的开源模型编码能力达 Claude Opus 4.6 的 94.6%

张开发
2026/4/17 13:33:45 15 分钟阅读

分享文章

智谱 GLM-5.1 正式发布:华为芯片训练的开源模型编码能力达 Claude Opus 4.6 的 94.6%
一、GLM-5.1 为何值得关注2026 年 3 月 27 日智谱 AI品牌已更名为 Z.ai宣布 GLM-5.1 正式上线面向所有 GLM Coding Plan 用户Lite/Pro/Max 套餐开放。这是继 GLM-5 发布仅六周后的一次重大迭代核心亮点包括编码能力大幅提升在以 Claude Code 为测试框架的编码评测中GLM-5.1 得分 45.3满分 113较 GLM-5 的 35.4 提升 28%逼近闭源前沿与 Claude Opus 4.6 的 47.9 分相比GLM-5.1 达到其 94.6% 的水平差距仅 2.6 分全部基于华为芯片训练这是目前在编码任务上表现最接近西方前沿模型的国产硬件训练成果即将开源据社区信息据 Reddit r/LocalLLaMA模型权重将于 4 月 6 日或 7 日以 MIT 协议发布二、核心评测数据解读模型编码评测得分满分 113相对 Opus 4.6 占比推理速度tokens/sClaude Opus 4.647.9100%—GLM-5.145.394.6%44.3GLM-535.473.9%—据 Z.ai 官方数据及 Serenitiesai 的独立评测文章GLM-5.1 的编码评测得分为 45.3。需要注意以下几点据 serenitiesai.com 评测评测为自报数据截至 3 月 30 日尚无独立第三方实验室对 45.3 分进行验证测试框架偏差使用 Claude Code 作为测试框架可能对 Claude 模型系列有内建优势直接对比需谨慎速度代价GLM-5.1 的推理速度约 44.3 tokens/s大约是 GPT-5.4 的一半是 Grok 4.20 的约 1/6据 BridgeBench 数据。对于 Agent 式自主编码场景影响较小但交互式结对编程时体感明显三、技术亮点分析3.1 强化学习驱动的编码专项优化据多方分析据 LinkedIn 技术文章GLM-5.1 的编码能力飞跃主要归功于一套大规模强化学习RL训练管线针对编码任务分布进行了专项优化。六周内实现 28% 的提升体现了当前迭代式 RL 后训练的高效性。3.2 国产硬件突破GLM-5.1 完全在华为昇腾芯片上完成训练这证明了主权算力栈sovereign compute stack在前沿编码任务上已具备竞争力。对于有数据隐私要求或本地部署需求的开发者和企业这提供了一条不依赖 NVIDIA 生态的可行路径。3.3 Agent 编码工作流支持GLM-5.1 支持的核心编码能力包括自主多步编码任务minimal hand-holding长上下文代码库重构与调试Agentic 工作流规划 → 执行 → 验证循环四、Coding Plan 定价与实操接入4.1 套餐定价据 [Z.ai]官方订阅页面[z.ai/subscribe]截至3 月 30 日数据套餐月费适用场景Lite$3促销价轻度编码辅助Pro$10 起日常开发主力Max更高具体需查官网重度 Agent 编码对比 Claude Pro 的 $20/月定价GLM-5.1 Coding Plan 以 $3-10/月的价格提供了 94.6% 的编码性能性价比优势显著。4.2 在 Claude Code 中切换到 GLM-5.1据 Z.ai 官方文档docs.z.ai/devpack/using5.1在 Claude Code 中使用 GLM-5.1 需要修改环境变量macOS 用户# 编辑 Claude Code 配置# 将默认模型映射修改为 GLM-5.1exportANTHROPIC_DEFAULT_OPUS_MODELglm-5.1exportANTHROPIC_DEFAULT_SONNET_MODELglm-5.1exportANTHROPIC_DEFAULT_HAIKU_MODELGLM-4.5-Air# 启动 Claude Code 后确认模型已切换# 在 Claude Code 终端中手动将 model name 改为 glm-5.1Windows 用户同样修改对应环境变量具体路径参见官方文档。4.3 在 OpenClaw 中使用据 Z.ai 文档GLM-5.1 也支持在 OpenClaw 等 Coding Agent 中使用步骤如下# OpenClaw 配置示例~/.openclaw/config.yamlmodel:provider:z-ainame:glm-5.1api_key:your-z-ai-api-key# 确保使用 Z.ai 的 API 端点base_url:https://api.z.ai/v1⚠️ 注意目前仅支持配置了自定义模型设置的 Coding Agent 工具。如果你使用的工具不支持自定义模型配置需要等待后续官方适配。五、适用场景与局限性适合使用 GLM-5.1 的场景成本敏感的独立开发者以 1/7 到 1/2 的价格获得接近 Opus 级别的编码辅助数据隐私要求高的企业等待 4 月开源后可本地部署数据不出内网国产化合规需求华为芯片训练 即将开源的权重满足信创要求Agent 式长链路编码自主规划与执行的场景中速度劣势不明显需要谨慎的场景交互式实时编程44.3 tokens/s 的速度在结对编程中体感较慢非编码任务目前的评测集中在编码领域通用推理/写作/数学等能力尚未有对等评测生产环境稳定性作为新发布模型建议先在非关键环境中充分测试六、对行业的影响国产 AI 芯片可行性再获验证GLM-5.1 证明了华为昇腾芯片可以训练出在特定任务上逼近全球前沿水平的模型编码模型竞争白热化从 MiniMax M2.5 到 GLM-5.1开源/低成本编码模型正在快速缩小与 Claude Opus 的差距开源生态加速4 月初的 MIT 协议开源将为本地部署和二次开发提供新选择七、小结与行动建议GLM-5.1 以 28% 的代际提升和 94.6% 的 Opus 编码水平在成本效益上树立了新标杆。对于开发者的具体行动建议立即体验注册 GLM Coding Plan Lite$3/月在 Claude Code 或 OpenClaw 中切换模型试用关注开源动态4 月 6-7 日关注 GitHub 上的权重发布评估本地部署可行性等待独立评测在做出生产决策前建议等待第三方独立验证数据对比测试建议在自己的实际项目中做 A/B 对比而非仅依赖通用 benchmarkGLM-5.1 用 $3 的价格做到了 Claude Opus 94.6% 的编码水平国产芯片训练的开源模型正在改写游戏规则。你会考虑在项目中用 GLM-5.1 替代 Claude 吗你更看重编码速度还是性价比欢迎评论区分享你的看法 觉得有价值点赞支持一下⭐ 收藏本文等开源权重发布后随时回看接入指南 关注我每天 AI 技术干货更新第一时间获取 GLM-5.1 开源后的实测评测

更多文章