国产模型第一次形成了完整替代方案

MiniMax M3开源了。6月12日GitHub仓库开放下载，华为云同一天完成昇腾算力适配。没有预告，没有发布会，直接扔了。

编程能力打平GPT-5.5

SWE-Bench Pro，这个benchmark让模型自己读GitHub issue、写代码、跑测试，是衡量编程能力最权威的测试之一。MiniMax M3得了59.0%，GPT-5.5是58.6%，Gemini 3.1 Pro更低。

M3赢了。

而且是全球公开benchmark上，国产模型第一次在这个级别上超过GPT-5.5。不是打平，是超过。

另一个更有意思的数字：SVG-Bench上M3超过Opus 4.7。不是跟跑，是领跑。

M3的核心技术叫MSA（MiniMax Sparse Attention），MiniMax自己研发的稀疏注意力架构。

传统大模型处理长上下文，计算量会爆炸性增长。MSA的思路很简单：不是每个token都需要关注其他所有token，只选相关的。

效果是：100万token上下文下，预填充加速9.7倍，解码加速15.6倍。单token计算量只有上一代模型的1/20。

说白了，以前处理一个装满整个代码仓库的上下文，可能需要几分钟。现在几十秒搞定。

再说DeepSeek这边。

V4-Pro提供了一个Anthropic兼容的API端点。你正在用Claude Code写代码，只需要改三个环境变量（API地址、模型名、密钥），底层就从Claude换成了DeepSeek。

界面不变，操作不变，习惯不变。唯一的变化是账单。

Claude Opus 4.8的标准价格是输入5美元/百万token、输出25美元/百万token。DeepSeek V4-Pro的输出价格是6元/百万token。

差了将近17倍。

而且LiveCodeBench上V4-Pro得了93.5%，比Opus 4.6的91.7%还高。便宜，而且不差。

模型有了，还得能跑。

M3开源当天，华为云就完成了昇腾算力的适配。不是「计划支持」，是「已经跑起来了」。同时摩尔线程也宣布适配。

三个环节全部打通：

每一个环节都有国产替代方案。

M3的商业化方案很直接。Plus版每月49块，给6亿token。Max版119块，18亿token。Ultra版469块，55亿token。

对比一下：Claude Pro每月20美元（约145元），给的是固定额度。M3的Max版119元给18亿token，按Claude的价格算大概值几百美元。

而且这个成本优势是结构性的。MSA让单token计算量降到1/20，不会因为补贴停止而消失。

回到2025年底，AI编程工具的格局很清晰：上层是Claude Code、Cursor、GitHub Copilot，底层模型是GPT-5.5、Claude Opus、Gemini。国产模型在编程领域基本处于「能用但不够好」的状态。

现在情况不一样了。M3在编程benchmark上超过GPT-5.5。V4-Pro在代码质量上不输Claude Opus，价格便宜17倍。华为昇腾和摩尔线程能跑。API可以直接替换。

这不是单点突破，是整个工具链第一次形成了完整替代方案。

对开发者来说，选择变多了。对闭源模型来说，定价权被动摇了。对整个行业来说，这是一个信号：国产模型在编程这个最硬核的赛道上，从「跟跑」变成了「领跑」。

GPT-5.6和Claude Opus 4.9会怎么接招，是接下来的看点。