Home
avatar

杨晏

MiniMax M3 + DeepSeek 降价 + 微软MAI — 公众号正文

MiniMax M3 + DeepSeek 降价 + 微软MAI — 公众号正文

图片

「国产模型登顶:代码超越GPT-5.5,价格砍到地板上」

6月1日,MiniMax发布了旗舰大模型M3。

几个关键数据值得说。

SWE-Bench Pro上59.0%,超过GPT-5.5。

同时超过了Gemini 3.1 Pro,接近Claude Opus 4.7。

更关键的是,这是开源模型。 图片

可以拿去做fine-tune,可以本地部署,数据不出内网,没有API调用的上限焦虑。

M3的参数结构很特别。196B总参数,只有11B被激活。

这不是大家传言的MOE混合专家架构。官方架构是纯自研的MSA稀疏注意力机制。

这个架构带来的效果很直接。100万上下文窗口下,单token计算量仅为上一代的1/20

100万token是什么概念。你可以把整个代码库直接喂进去。

它也是原生多模态模型,支持图片和视频输入,还能操作电脑桌面。

SVG-Bench上超过Opus 4.7。OmniDocBench超过Gemini 3.1 Pro。Claw-Eval端到端Agent评测拿到最高分。

国内首个同时具备长上下文、多模态和强大Agent能力的开源模型。

从追赶到登顶,MiniMax M3用了不到一年。


「价格战还在打:DeepSeek永久降价75%」

图片

就在M3发布的前一周,DeepSeek做了一个更狠的操作。

5月22日,DeepSeek宣布V4-Pro模型API价格永久降价至原价的四分之一。

不是限时促销。不是月底到期恢复原价。

是永久。

调价后每百万tokens:

  • 输入(缓存命中)0.025元,全球新低
  • 输入(缓存未命中)3元
  • 输出6元

腾讯云6月2日紧接着公告,对DeepSeek-V4系列价格进行下调,**最高降幅达97.5%**。

在全球AI行业深陷涨价潮的背景下,HBM价格半年暴涨超500%,微软和亚马逊等云厂商纷纷提价,部分涨幅高达463%。

DeepSeek选择了完全相反的方向。

V4-Flash的输入token,cache hit价格降到了0.0028美元每百万token

这不是简单的价格战。模型架构和推理工程共同突破,把成本压到了竞争对手几乎无法跟进的水平。MoE稀疏架构加上KV缓存优化,才是背后的关键。


图片

「微软也在变:7款自研模型+Project Solara」

微软Build 2026大会给出了另一个信号。

连发7款自研MAI模型,覆盖推理、编程、图像等领域。

其中MAI-Code-1-Flash在SWE-Bench等基准测试中全面超越Claude Haiku 4.5,同时token消耗减少60%。

这不是一个孤立的编程模型。

微软同时公布了代号为Project Solara的芯片到云端平台方案。这是为AI Agent优先体验打造的硬件加软件整合方案。

微软在悄悄做一件事,减少对外部模型的依赖。

路透社和The Information的报道都提到,微软已秘密研发代号为MAI的自主AI推理模型,性能在通用基准测试中与OpenAI的o1、o3-mini相当。

同时加速测试xAI、Meta、Anthropic和DeepSeek的模型,探索在Copilot产品中替代OpenAI技术的可能性。

去OpenAI化,从传闻变成落地。 图片


「国产模型的三步棋」

图片

把这三件事放在一起看,能拼出一幅清晰的图景。

第一步,性能追上来了。MiniMax M3在SWE-Bench Pro上59.0%的成绩,让开源模型第一次在编程专项能力上超越了最顶尖的闭源模型。这不是接近,是超越。

第二步,价格打下来了。DeepSeek的永久降价策略,直接把高性能大模型的门槛降到了地板上。0.025元每百万tokens,这个价格意味着中小企业和独立开发者可以无顾虑地大规模使用。

第三步,生态在重构。微软自研模型加Project Solara,说明连全球第二大科技公司的战略都在调整。当自研模型能达到竞品水平,生态控制权比什么都重要。

这三步棋,中国AI公司正在同时落子。

开源开放给了开发者无限可能。永久降价打破了价格壁垒。生态重构意味着这场竞争已经从单一模型的比拼,变成了从芯片到云端的全栈较量。

格局已经变了。

以前讨论国产AI,关键词是「追赶」。

现在应该是**「登顶」**。

AI MiniMax DeepSeek 微软