Home
avatar

杨晏

国产开源模型,替掉闭源的时刻到了

国产开源模型,替掉闭源的时刻到了

图片

6月12日,MiniMax M3正式开源了。上次聊它还是6月1日刚发布,十天不到,权重就放出来了。

这才是重点。一个SWE-Bench Pro **59.0%**的模型不是论文展览品,不是”即将开源”的期货,是你现在就能下载的东西。


M3,三个「唯一」撑起来的

国内开源模型不少,但能同时站上三条线的,目前只有M3。

编程。SWE-Bench Pro **59.0%,超了GPT-5.5的58.6%**,超了Gemini 3.1 Pro,逼近Claude Opus 4.7。这是全球开源模型首次在这个最硬核的编程评测上超过闭源第一梯队。

1M上下文。MSA稀疏注意力架构,100万token的窗口不是摆设,解码速度比基准快15.6倍,1M上下文计算量仅传统注意力的1/20。长代码仓库塞进去,不卡。

原生多模态。图片+视频输入,还能操作电脑桌面。这三个能力,海外闭源前沿模型才有,国内开源模型M3是第一个齐备的。

196B总参数,11B激活。用MoE做推理效率,不是新思路,但M3把它跑通了而且放出来了。

开源当天,摩尔线程MTT S5000做了Day-0适配,华为云昇腾也接上了。国产芯片+国产模型,这不是象征性握手,是实打实的部署链路。 图片


另一边,Claude Code的用户在偷偷换引擎

同一个月,另一件看起来低调但影响同样大的事在发生。

DeepSeek V4-Pro提供了一个Anthropic兼容的API端点

说白了就是,你用的还是Claude Code那个终端界面,打的还是熟悉的命令,但背后跑的已经是DeepSeek V4-Pro了。改三个环境变量就完事。

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_AUTH_TOKEN=你的DeepSeek_API_Key
export ANTHROPIC_MODEL=deepseek-v4-pro

这样做的人越来越多了。CSDN上”deepseek claude code”搜索量暴涨**170%**,保姆级教程遍地都是。

为什么?看价格就懂了。

DeepSeek V4-Pro:输入3元/百万token,输出6元。缓存命中0.025元。

Claude Opus 4.7:输入5美元/百万token,输出25美元。

按输出算,差了将近17倍

有个开发者写了一篇实测文章,标题很直白——“上周Claude Code账单87.4美元,换成DeepSeek后一周只花了11.8美元。” 省了**83%**。

GitHub上还冒出了DeepClaude这个开源项目(aattaran/deepclaude),专门把DeepSeek V4 Pro接入Claude生态,LiveCodeBench得分96.4%,输出token成本从约15美元/百万降到0.87美元/百万,暴降17倍。功能全保留,文件编辑、Bash执行一个不少。

顺带一提,DeepSeek V4-Pro的SWE-Bench成绩是80.6%,跟Claude Opus 4.6(约80.8%)几乎持平,但价格是1/7图片


两件事叠一起,性质变了

单独看M3开源,是一个开源模型追平闭源的事件。

单独看DeepSeek兼容Claude API,是一个省钱技巧。

但两件事叠加在一起,性质不一样了。

M3替代GPT-5.5。编程评测已经超了,权重大家都能下,API免费(开源自己部署),商用也有MiniMax官方接入。

DeepSeek V4-Pro替代Claude Code。SWE-Bench逼近Opus水平,价格1/7到1/17,接入方式是无痛切换三个环境变量。

原来用闭源不是不想换,是换了性能掉太多、成本省了但体验也缩水了。现在这条线被磨平了。性能打平甚至反超,价格砍掉九成,接入零门槛。

国产模型把闭源编程工具的底层抽走了。没夸张。 图片


MiniMax一边开源,一边去科创板敲钟了

5月29日,MiniMax和中信证券签了A股上市辅导协议,正式冲刺科创板。

1月9日港交所上市,发行价165港元,目前市值约2666亿港元。半年不到就要回A股搞”A+H”双重上市,速度够猛。

CSDN有人分析说「不是看不懂,是被逼的」,港股流动性不够撑MiniMax的国产算力叙事,A股有更好的估值锚。但不管怎么说,一家代码80%由AI完成、平均年龄29岁、账上超十亿美金的公司,在开源和上市双线同时推进,这个信号本身就值得注意。

开源不是慈善,是商业策略。M3开源了,生态做大,IPO故事更好讲。这跟当年红帽的逻辑一样,用免费拉用户,用企业服务和资本市场赚钱。 图片

只是这次的主角,换成了国产模型。

随笔