2026年6月1日,MiniMax正式发布了新一代旗舰大模型MiniMax M3。这款模型在编程、Agent能力、原生多模态以及推理效率上实现了全面跃升,不仅刷新了多个全球基准测试的记录,更以一系列“自主进化”的惊人表现,印证了公司从模型研发者向AI时代平台型公司迈进的战略路径。
技术突破:架构创新驱动效率与性能双升
M3的核心创新在于采用了全新的稀疏注意力架构MSA。这一架构使得模型在支持100万上下文窗口的同时,实现了计算速度的巨大飞跃:与上一代M2相比,该模型在prefilling(预填充)阶段实现了超过9倍的加速倍率,解码阶段更是超过15倍。在真实软件工程基准SWE-Bench Pro上,M3的表现小幅超越GPT-5.5,接近Claude Opus 4.7,展现出强大的代码理解与生成能力。
更为关键的是,M3是原生多模态模型,支持图片、视频输入并具备电脑操作能力。在多项自主Agent评测中,M3均获得最高分。这种多模态与Agent能力的深度融合,使其不仅能“看懂”世界,更能“操作”软件,为构建真正自主的智能体奠定了基础。
自主进化:模型驱动模型,开启研发新范式
M3最令人瞩目的并非单项指标,而是其展现出的“自我迭代”潜力。在PostTrainBench测试中,研究团队赋予M3一项挑战:12小时内,从零开始训练4个仅有预训练基座的模型。全程无人干预,M3自主完成了数据合成、训练、评测到迭代的完整闭环,最终使这4个模型在数学、编程等任务上习得基本能力。
更令人惊叹的是,M3能连续工作24小时,通过147次benchmark提交和近2000次工具调用,自主将CUDA内核的硬件峰值利用率从7.6%提升至71.3%,实现了9.4倍的加速。这意味着,MiniMax M3已经初步具备了优化自身底层基础设施的能力,极大地降低了人类工程师的调优负担。
战略协同:从模型到平台,从研发到生态
M3的发布不是孤立的技术事件,而是MiniMax平台化战略的关键一环。伴随M3一同发布的还有全新AI编程工具MiniMax Code,后者充分利用了M3的长上下文与多模态能力,能够实现跨应用、跨系统的复杂操作。尽管实测显示其在任务完成度上仍有提升空间,但其主动沟通、迭代规划和自我纠错的协作模式,已展现出“同事级”AI助手的雏形。
这一技术突破与公司的商业化进展形成了有力呼应。根据华创证券研报数据,MiniMax已实现“模型突破—产品落地—规模变现”的闭环验证。2025年,公司营收同比增长159%至7900万美元,其中AI原生产品收入占比达67.2%。
从全模态自研能力,到全球化用户与开发者生态,再到M3展现出的自主进化潜能,MiniMax正沿着AI时代平台型公司的路径坚定前行。其近期向A股提交上市辅导备案,更凸显了其借力资本市场、持续巩固技术与生态壁垒的决心。在大模型从“能力竞赛”转向“规模化商业落地”的关键阶段,MiniMax凭借扎实的技术底座与清晰的平台战略,已然占据了一个有利的身位。