国产模型第一次形成了完整替代方案
国产模型第一次形成了完整替代方案

MiniMax M3开源了。6月12日GitHub仓库开放下载,华为云同一天完成昇腾算力适配。没有预告,没有发布会,直接扔了。
编程能力打平GPT-5.5
SWE-Bench Pro,这个benchmark让模型自己读GitHub issue、写代码、跑测试,是衡量编程能力最权威的测试之一。MiniMax M3得了59.0%,GPT-5.5是58.6%,Gemini 3.1 Pro更低。
M3赢了。
而且是全球公开benchmark上,国产模型第一次在这个级别上超过GPT-5.5。不是打平,是超过。
另一个更有意思的数字:SVG-Bench上M3超过Opus 4.7。不是跟跑,是领跑。 
1M上下文的效率是怎么做到的
M3的核心技术叫MSA(MiniMax Sparse Attention),MiniMax自己研发的稀疏注意力架构。
传统大模型处理长上下文,计算量会爆炸性增长。MSA的思路很简单:不是每个token都需要关注其他所有token,只选相关的。
效果是:100万token上下文下,预填充加速9.7倍,解码加速15.6倍。单token计算量只有上一代模型的1/20。
说白了,以前处理一个装满整个代码仓库的上下文,可能需要几分钟。现在几十秒搞定。 
三个变量换掉Claude Code
再说DeepSeek这边。
V4-Pro提供了一个Anthropic兼容的API端点。你正在用Claude Code写代码,只需要改三个环境变量(API地址、模型名、密钥),底层就从Claude换成了DeepSeek。
界面不变,操作不变,习惯不变。唯一的变化是账单。
Claude Opus 4.8的标准价格是输入5美元/百万token、输出25美元/百万token。DeepSeek V4-Pro的输出价格是6元/百万token。
差了将近17倍。
而且LiveCodeBench上V4-Pro得了93.5%,比Opus 4.6的91.7%还高。便宜,而且不差。 
算力链也打通了
模型有了,还得能跑。
M3开源当天,华为云就完成了昇腾算力的适配。不是「计划支持」,是「已经跑起来了」。同时摩尔线程也宣布适配。
三个环节全部打通:
- 模型层:M3打平GPT-5.5,V4-Pro打平Claude Opus
- API层:V4-Pro兼容Anthropic API,迁移成本几乎为零
- 算力层:华为昇腾+摩尔线程,国产硬件跑国产模型
每一个环节都有国产替代方案。 
价格体系也变了
M3的商业化方案很直接。Plus版每月49块,给6亿token。Max版119块,18亿token。Ultra版469块,55亿token。
对比一下:Claude Pro每月20美元(约145元),给的是固定额度。M3的Max版119元给18亿token,按Claude的价格算大概值几百美元。
而且这个成本优势是结构性的。MSA让单token计算量降到1/20,不会因为补贴停止而消失。 
这为什么重要
回到2025年底,AI编程工具的格局很清晰:上层是Claude Code、Cursor、GitHub Copilot,底层模型是GPT-5.5、Claude Opus、Gemini。国产模型在编程领域基本处于「能用但不够好」的状态。
现在情况不一样了。M3在编程benchmark上超过GPT-5.5。V4-Pro在代码质量上不输Claude Opus,价格便宜17倍。华为昇腾和摩尔线程能跑。API可以直接替换。
这不是单点突破,是整个工具链第一次形成了完整替代方案。
对开发者来说,选择变多了。对闭源模型来说,定价权被动摇了。对整个行业来说,这是一个信号:国产模型在编程这个最硬核的赛道上,从「跟跑」变成了「领跑」。
GPT-5.6和Claude Opus 4.9会怎么接招,是接下来的看点。