MiniMax M3 + DeepSeek 降价 + 微软MAI — 公众号正文
MiniMax M3 + DeepSeek 降价 + 微软MAI — 公众号正文

「国产模型登顶:代码超越GPT-5.5,价格砍到地板上」
6月1日,MiniMax发布了旗舰大模型M3。
几个关键数据值得说。
SWE-Bench Pro上59.0%,超过GPT-5.5。
同时超过了Gemini 3.1 Pro,接近Claude Opus 4.7。
更关键的是,这是开源模型。 
可以拿去做fine-tune,可以本地部署,数据不出内网,没有API调用的上限焦虑。
M3的参数结构很特别。196B总参数,只有11B被激活。
这不是大家传言的MOE混合专家架构。官方架构是纯自研的MSA稀疏注意力机制。
这个架构带来的效果很直接。100万上下文窗口下,单token计算量仅为上一代的1/20。
100万token是什么概念。你可以把整个代码库直接喂进去。
它也是原生多模态模型,支持图片和视频输入,还能操作电脑桌面。
SVG-Bench上超过Opus 4.7。OmniDocBench超过Gemini 3.1 Pro。Claw-Eval端到端Agent评测拿到最高分。
国内首个同时具备长上下文、多模态和强大Agent能力的开源模型。
从追赶到登顶,MiniMax M3用了不到一年。
「价格战还在打:DeepSeek永久降价75%」

就在M3发布的前一周,DeepSeek做了一个更狠的操作。
5月22日,DeepSeek宣布V4-Pro模型API价格永久降价至原价的四分之一。
不是限时促销。不是月底到期恢复原价。
是永久。
调价后每百万tokens:
- 输入(缓存命中)0.025元,全球新低
- 输入(缓存未命中)3元
- 输出6元
腾讯云6月2日紧接着公告,对DeepSeek-V4系列价格进行下调,**最高降幅达97.5%**。
在全球AI行业深陷涨价潮的背景下,HBM价格半年暴涨超500%,微软和亚马逊等云厂商纷纷提价,部分涨幅高达463%。
DeepSeek选择了完全相反的方向。
V4-Flash的输入token,cache hit价格降到了0.0028美元每百万token。
这不是简单的价格战。模型架构和推理工程共同突破,把成本压到了竞争对手几乎无法跟进的水平。MoE稀疏架构加上KV缓存优化,才是背后的关键。

「微软也在变:7款自研模型+Project Solara」
微软Build 2026大会给出了另一个信号。
连发7款自研MAI模型,覆盖推理、编程、图像等领域。
其中MAI-Code-1-Flash在SWE-Bench等基准测试中全面超越Claude Haiku 4.5,同时token消耗减少60%。
这不是一个孤立的编程模型。
微软同时公布了代号为Project Solara的芯片到云端平台方案。这是为AI Agent优先体验打造的硬件加软件整合方案。
微软在悄悄做一件事,减少对外部模型的依赖。
路透社和The Information的报道都提到,微软已秘密研发代号为MAI的自主AI推理模型,性能在通用基准测试中与OpenAI的o1、o3-mini相当。
同时加速测试xAI、Meta、Anthropic和DeepSeek的模型,探索在Copilot产品中替代OpenAI技术的可能性。
去OpenAI化,从传闻变成落地。 
「国产模型的三步棋」

把这三件事放在一起看,能拼出一幅清晰的图景。
第一步,性能追上来了。MiniMax M3在SWE-Bench Pro上59.0%的成绩,让开源模型第一次在编程专项能力上超越了最顶尖的闭源模型。这不是接近,是超越。
第二步,价格打下来了。DeepSeek的永久降价策略,直接把高性能大模型的门槛降到了地板上。0.025元每百万tokens,这个价格意味着中小企业和独立开发者可以无顾虑地大规模使用。
第三步,生态在重构。微软自研模型加Project Solara,说明连全球第二大科技公司的战略都在调整。当自研模型能达到竞品水平,生态控制权比什么都重要。
这三步棋,中国AI公司正在同时落子。
开源开放给了开发者无限可能。永久降价打破了价格壁垒。生态重构意味着这场竞争已经从单一模型的比拼,变成了从芯片到云端的全栈较量。
格局已经变了。
以前讨论国产AI,关键词是「追赶」。
现在应该是**「登顶」**。