Home
avatar

杨晏

MiniMax M3 国产开源模型第一次站在了山顶

MiniMax M3 国产开源模型第一次站在了山顶

图片

2026年6月1日,MiniMax发布M3。

没有预热,没有发布会直播。一份技术报告直接丢到网上,模型权重直接开源。

然后整个AI圈安静了。


59%,超过GPT-5.5

图片

SWE-Bench Pro,目前最权威的编程能力基准测试。

M3拿到59.0%,超过GPT-5.5和Gemini 3.1 Pro,接近Anthropic最强的Claude Opus 4.7。

这不是「接近」,是反超

更关键的是,M3是开源的。全球范围内,你找不到第二个在编程能力上超越GPT-5.5、同时完全开源的模型。

闭源巨头花了数千亿堆出来的技术壁垒,被一个中国团队用开源的方式从正面撞开了。


MSA:为什么能做到

图片

M3的核心突破是MSA,MiniMax自研的稀疏注意力架构。

传统大模型处理长上下文,计算量随序列长度平方增长。100万token的上下文,算力成本直接爆炸。

MSA的思路不一样。它用KV-block选择机制取代全注意力,只对关键信息做精确计算,其余用稀疏近似。

结果呢?在100万token长度下,M3的单token计算量只有上一代的1/20。Prefill阶段加速超过9倍,解码阶段加速超过15倍。

以前跑不动百万级上下文的团队,现在用M3可以跑,而且很快。


不只是写代码

图片

M3是国内第一个同时具备三项能力的大模型,前沿编程、100万超长上下文、原生多模态。

原生多模态不是「能看图」这么简单。M3支持图片和视频输入,还能操作电脑桌面,跨应用、跨文件、跨系统执行复杂任务。

MiniMax官方展示了一个案例,M3自主运行近12个小时,成功复现了一篇获奖AI论文《Learning Dynamics of LLM Finetuning》,验证了原论文的核心发现。

12个小时,没人盯着。自己读论文、写代码、跑实验、验证结果。

这不是「AI辅助」,这是AI自主科研的雏形。


定价:输入2.1元/百万token

图片

M3的API定价,512k上下文以内,输入每百万token只要2.1元,输出8.4元

作为对比,GPT-5.5的输出价格是2.5美元/百万token,约18元。M3的价格不到它的1/8

MiniMax还同步推出了Token Plan订阅制。Plus版每月49元6亿token,Max版每月119元18亿token。个人开发者直接订阅,不用按量付费。

京东云当天就宣布接入M3,开放服务。


回A股,市值2666亿港元

图片

5月29日,MiniMax与中信证券签署辅导协议,正式启动A股IPO。

MiniMax今年1月刚在港股上市,市值2666亿港元。如果A股IPO成功,它将成为少数同时在港股和A股上市的AI公司。

数据也在涨。截至5月底,MiniMax全球客户超100万,半年前增长了5倍。全球用户约3亿。过去两个月ARR增长超过100%。

2025年全年收入7903.8万美元,同比增长159%,超过70%来自国际市场。

一家中国AI公司,主要收入来自海外。这个事实本身就说明了很多。


开源改变了什么

图片

过去两年,AI行业的叙事是「闭源模型越来越强,开源模型追不上」。

DeepSeek V3第一次动摇了这个叙事。M3是第二次,而且更彻底,不只是追平,是在编程这个最实用的场景上反超了。

当最强的编程模型是开源的,每个开发者、每个中小企业、每个创业团队都能免费用到。不需要API密钥,不需要付费,下载权重就能跑。

闭源巨头的护城河不只是技术,还有生态锁定、用户习惯、品牌信任。开源模型正在从另一个方向拆墙,用免费+开放把用户抢过来。

M3不是终点。它证明了一件事,开源模型的天花板比所有人以为的要高得多。

AI MiniMax M3 国产 大模型