MiniMax M3 国产开源模型第一次站在了山顶

2026年6月1日，MiniMax发布M3。

没有预热，没有发布会直播。一份技术报告直接丢到网上，模型权重直接开源。

然后整个AI圈安静了。

59%，超过GPT-5.5

SWE-Bench Pro，目前最权威的编程能力基准测试。

M3拿到59.0%，超过GPT-5.5和Gemini 3.1 Pro，接近Anthropic最强的Claude Opus 4.7。

这不是「接近」，是反超。

更关键的是，M3是开源的。全球范围内，你找不到第二个在编程能力上超越GPT-5.5、同时完全开源的模型。

闭源巨头花了数千亿堆出来的技术壁垒，被一个中国团队用开源的方式从正面撞开了。

M3的核心突破是MSA，MiniMax自研的稀疏注意力架构。

传统大模型处理长上下文，计算量随序列长度平方增长。100万token的上下文，算力成本直接爆炸。

MSA的思路不一样。它用KV-block选择机制取代全注意力，只对关键信息做精确计算，其余用稀疏近似。

结果呢？在100万token长度下，M3的单token计算量只有上一代的1/20。Prefill阶段加速超过9倍，解码阶段加速超过15倍。

以前跑不动百万级上下文的团队，现在用M3可以跑，而且很快。

M3是国内第一个同时具备三项能力的大模型，前沿编程、100万超长上下文、原生多模态。

原生多模态不是「能看图」这么简单。M3支持图片和视频输入，还能操作电脑桌面，跨应用、跨文件、跨系统执行复杂任务。

MiniMax官方展示了一个案例，M3自主运行近12个小时，成功复现了一篇获奖AI论文《Learning Dynamics of LLM Finetuning》，验证了原论文的核心发现。

12个小时，没人盯着。自己读论文、写代码、跑实验、验证结果。

这不是「AI辅助」，这是AI自主科研的雏形。

M3的API定价，512k上下文以内，输入每百万token只要2.1元，输出8.4元。

作为对比，GPT-5.5的输出价格是2.5美元/百万token，约18元。M3的价格不到它的1/8。

MiniMax还同步推出了Token Plan订阅制。Plus版每月49元6亿token，Max版每月119元18亿token。个人开发者直接订阅，不用按量付费。

京东云当天就宣布接入M3，开放服务。

5月29日，MiniMax与中信证券签署辅导协议，正式启动A股IPO。

MiniMax今年1月刚在港股上市，市值2666亿港元。如果A股IPO成功，它将成为少数同时在港股和A股上市的AI公司。

数据也在涨。截至5月底，MiniMax全球客户超100万，半年前增长了5倍。全球用户约3亿。过去两个月ARR增长超过100%。

2025年全年收入7903.8万美元，同比增长159%，超过70%来自国际市场。

一家中国AI公司，主要收入来自海外。这个事实本身就说明了很多。

过去两年，AI行业的叙事是「闭源模型越来越强，开源模型追不上」。

DeepSeek V3第一次动摇了这个叙事。M3是第二次，而且更彻底，不只是追平，是在编程这个最实用的场景上反超了。

当最强的编程模型是开源的，每个开发者、每个中小企业、每个创业团队都能免费用到。不需要API密钥，不需要付费，下载权重就能跑。

闭源巨头的护城河不只是技术，还有生态锁定、用户习惯、品牌信任。开源模型正在从另一个方向拆墙，用免费+开放把用户抢过来。

M3不是终点。它证明了一件事，开源模型的天花板比所有人以为的要高得多。