MiniMax M3 + DeepSeek 降价 + 微软MAI — 公众号正文

「国产模型登顶：代码超越GPT-5.5，价格砍到地板上」

6月1日，MiniMax发布了旗舰大模型M3。

几个关键数据值得说。

SWE-Bench Pro上59.0%，超过GPT-5.5。

同时超过了Gemini 3.1 Pro，接近Claude Opus 4.7。

更关键的是，这是开源模型。

可以拿去做fine-tune，可以本地部署，数据不出内网，没有API调用的上限焦虑。

M3的参数结构很特别。196B总参数，只有11B被激活。

这不是大家传言的MOE混合专家架构。官方架构是纯自研的MSA稀疏注意力机制。

这个架构带来的效果很直接。100万上下文窗口下，单token计算量仅为上一代的1/20。

100万token是什么概念。你可以把整个代码库直接喂进去。

它也是原生多模态模型，支持图片和视频输入，还能操作电脑桌面。

SVG-Bench上超过Opus 4.7。OmniDocBench超过Gemini 3.1 Pro。Claw-Eval端到端Agent评测拿到最高分。

国内首个同时具备长上下文、多模态和强大Agent能力的开源模型。

从追赶到登顶，MiniMax M3用了不到一年。

「价格战还在打：DeepSeek永久降价75%」

就在M3发布的前一周，DeepSeek做了一个更狠的操作。

5月22日，DeepSeek宣布V4-Pro模型API价格永久降价至原价的四分之一。

不是限时促销。不是月底到期恢复原价。

是永久。

调价后每百万tokens：

输入（缓存命中）0.025元，全球新低
输入（缓存未命中）3元
输出6元

腾讯云6月2日紧接着公告，对DeepSeek-V4系列价格进行下调，**最高降幅达97.5%**。

在全球AI行业深陷涨价潮的背景下，HBM价格半年暴涨超500%，微软和亚马逊等云厂商纷纷提价，部分涨幅高达463%。

DeepSeek选择了完全相反的方向。

V4-Flash的输入token，cache hit价格降到了0.0028美元每百万token。

这不是简单的价格战。模型架构和推理工程共同突破，把成本压到了竞争对手几乎无法跟进的水平。MoE稀疏架构加上KV缓存优化，才是背后的关键。

「微软也在变：7款自研模型+Project Solara」

微软Build 2026大会给出了另一个信号。

连发7款自研MAI模型，覆盖推理、编程、图像等领域。

其中MAI-Code-1-Flash在SWE-Bench等基准测试中全面超越Claude Haiku 4.5，同时token消耗减少60%。

这不是一个孤立的编程模型。

微软同时公布了代号为Project Solara的芯片到云端平台方案。这是为AI Agent优先体验打造的硬件加软件整合方案。

微软在悄悄做一件事，减少对外部模型的依赖。

路透社和The Information的报道都提到，微软已秘密研发代号为MAI的自主AI推理模型，性能在通用基准测试中与OpenAI的o1、o3-mini相当。

同时加速测试xAI、Meta、Anthropic和DeepSeek的模型，探索在Copilot产品中替代OpenAI技术的可能性。

去OpenAI化，从传闻变成落地。

「国产模型的三步棋」

把这三件事放在一起看，能拼出一幅清晰的图景。

第一步，性能追上来了。MiniMax M3在SWE-Bench Pro上59.0%的成绩，让开源模型第一次在编程专项能力上超越了最顶尖的闭源模型。这不是接近，是超越。

第二步，价格打下来了。DeepSeek的永久降价策略，直接把高性能大模型的门槛降到了地板上。0.025元每百万tokens，这个价格意味着中小企业和独立开发者可以无顾虑地大规模使用。

第三步，生态在重构。微软自研模型加Project Solara，说明连全球第二大科技公司的战略都在调整。当自研模型能达到竞品水平，生态控制权比什么都重要。

这三步棋，中国AI公司正在同时落子。

开源开放给了开发者无限可能。永久降价打破了价格壁垒。生态重构意味着这场竞争已经从单一模型的比拼，变成了从芯片到云端的全栈较量。

格局已经变了。

以前讨论国产AI，关键词是「追赶」。

现在应该是**「登顶」**。

杨晏

MiniMax M3 + DeepSeek 降价 + 微软MAI — 公众号正文

「国产模型登顶：代码超越GPT-5.5，价格砍到地板上」

「价格战还在打：DeepSeek永久降价75%」

「微软也在变：7款自研模型+Project Solara」

「国产模型的三步棋」