国产大模型6月决战,DeepSeek 500亿融资+MiniMax M3刚发布
国产大模型6月决战,DeepSeek 500亿融资+MiniMax M3刚发布

6月的AI圈,国产大模型集体发力。
一边是DeepSeek V4.1预计本月发布,500亿首轮融资即将落地,腾讯100亿、宁德时代50亿、梁文锋个人200亿。另一边,MiniMax M3在6月1日刚发布就刷爆多个编程榜单,SWE-Bench Pro 59%超越GPT-5.5。
两个事件撞在一起,信号很清晰,国产大模型正在从技术追赶转向生态卡位。
一、DeepSeek 500亿融资,中国AI最大单笔

6月3日路透社报道,DeepSeek即将完成约500亿元人民币的首轮融资。
这笔钱从哪来?创始人梁文锋个人出资200亿,腾讯拟投100亿,宁德时代50亿,网易和京东也在最终谈判。融资完成后投后估值3500亿到4000亿。
500亿人民币,约合74亿美元。如果落地,刷新中国AI公司单轮融资纪录。
更值得关注的是投资方阵容。腾讯和宁德时代不是传统意义上的AI投资人。腾讯要的是生态入口,宁德时代要的是AI赋能制造业。这说明DeepSeek已经不是”一个做模型的创业公司”,而是成了产业资本眼中的基础设施。
二、V4.1本月发布,多模态+MCP+企业工具

DeepSeek V4系列4月24日发布,V4-Pro和V4-Flash两个版本,1.6万亿参数MoE架构,1M上下文窗口。发布后两天就25折,缓存命中价格暴跌90%,5月底永久化,最终价格只有发布时的四分之一。
V4.1预计6月上线,升级方向很明确,更多面向企业的工具、增强MCP(模型上下文协议)支持、具备处理图像和音频的能力。
时间点选得很微妙。英伟达刚在GTC 2026宣布AI PC和DGX Station,华为在推昇腾生态。DeepSeek要抢占”国产大模型落地”的窗口期。
还有个细节,V4系列首次将国产芯片与英伟达GPU并列写入硬件验证清单,直接拥抱华为CANN和寒武纪,不再依赖CUDA。
三、MiniMax M3,开源编程模型的新标杆

6月1日,MiniMax发布M3,技术报告一出来就炸了。
核心数据,SWE-Bench Pro 59%,超越GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。Claw-Eval Agent评测最高分。SVG-Bench超越Opus 4.7。
架构上是真正的颠覆。自研MSA(MiniMax Sparse Attention)稀疏注意力,完全舍弃了上一代的MOE结构。100万上下文窗口,单Token计算量仅为上代的1/20,预填充加速9.7倍,解码加速15.6倍。
最关键的标签,开源。M3是目前全球唯一同时具备前沿编程能力、1M超长上下文、原生多模态的开源模型。
四、从技术追赶到生态卡位

把DeepSeek和MiniMax放在一起看,国产大模型的打法变了。
DeepSeek走的是”资本+生态”路线。500亿融资拉来腾讯、宁德时代这种产业巨头,V4.1强化MCP支持对接企业系统,拥抱国产芯片降低算力依赖。目标不是”模型最强”,而是”生态最不可替代”。
MiniMax走的是”开源+性能”路线。M3在编程榜单上直接对标GPT-5.5和Opus 4.7,100万上下文窗口,开源权重和技术报告10天内发布。用技术实力抢开发者生态。
两条路线,同一个目标,在AI基础设施层建立护城河。
五、三个判断

第一,DeepSeek的500亿融资如果落地,将彻底改变国内AI公司的估值锚点。从梁文锋个人出200亿就能看出来,创始人对技术路线的信心是坚定的。
第二,M3的开源策略会加速国产模型在开发者中的渗透。编程能力是AI落地的第一战场,59%的SWE-Bench Pro分数已经足够让大量企业用户迁移。
第三,国产大模型之间的竞争正在从”谁分数高”变成”谁的生态强”。DeepSeek拉资本、MiniMax抢开源,两条路殊途同归。
6月才刚开始,后面还有V4.1正式发布、融资最终落地、M3权重开源。这个月的AI圈,会很热闹。