MiniMax M3发布：稀疏注意力架构+自主进化，AI模型向平台型公司跨越

2026年6月1日，MiniMax正式发布了新一代旗舰大模型MiniMax M3。这款模型在编程、Agent能力、原生多模态以及推理效率上实现了全面跃升，不仅刷新了多个全球基准测试的记录，更以一系列“自主进化”的惊人表现，印证了公司从模型研发者向AI时代平台型公司迈进的战略路径。

技术突破：架构创新驱动效率与性能双升

M3的核心创新在于采用了全新的稀疏注意力架构MSA。这一架构使得模型在支持100万上下文窗口的同时，实现了计算速度的巨大飞跃：与上一代M2相比，该模型在prefilling（预填充）阶段实现了超过9倍的加速倍率，解码阶段更是超过15倍。在真实软件工程基准SWE-Bench Pro上，M3的表现小幅超越GPT-5.5，接近Claude Opus 4.7，展现出强大的代码理解与生成能力。

更为关键的是，M3是原生多模态模型，支持图片、视频输入并具备电脑操作能力。在多项自主Agent评测中，M3均获得最高分。这种多模态与Agent能力的深度融合，使其不仅能“看懂”世界，更能“操作”软件，为构建真正自主的智能体奠定了基础。

自主进化：模型驱动模型，开启研发新范式

M3最令人瞩目的并非单项指标，而是其展现出的“自我迭代”潜力。在PostTrainBench测试中，研究团队赋予M3一项挑战：12小时内，从零开始训练4个仅有预训练基座的模型。全程无人干预，M3自主完成了数据合成、训练、评测到迭代的完整闭环，最终使这4个模型在数学、编程等任务上习得基本能力。

更令人惊叹的是，M3能连续工作24小时，通过147次benchmark提交和近2000次工具调用，自主将CUDA内核的硬件峰值利用率从7.6%提升至71.3%，实现了9.4倍的加速。这意味着，MiniMax M3已经初步具备了优化自身底层基础设施的能力，极大地降低了人类工程师的调优负担。

战略协同：从模型到平台，从研发到生态

M3的发布不是孤立的技术事件，而是MiniMax平台化战略的关键一环。伴随M3一同发布的还有全新AI编程工具MiniMax Code，后者充分利用了M3的长上下文与多模态能力，能够实现跨应用、跨系统的复杂操作。尽管实测显示其在任务完成度上仍有提升空间，但其主动沟通、迭代规划和自我纠错的协作模式，已展现出“同事级”AI助手的雏形。

这一技术突破与公司的商业化进展形成了有力呼应。根据华创证券研报数据，MiniMax已实现“模型突破—产品落地—规模变现”的闭环验证。2025年，公司营收同比增长159%至7900万美元，其中AI原生产品收入占比达67.2%。

从全模态自研能力，到全球化用户与开发者生态，再到M3展现出的自主进化潜能，MiniMax正沿着AI时代平台型公司的路径坚定前行。其近期向A股提交上市辅导备案，更凸显了其借力资本市场、持续巩固技术与生态壁垒的决心。在大模型从“能力竞赛”转向“规模化商业落地”的关键阶段，MiniMax凭借扎实的技术底座与清晰的平台战略，已然占据了一个有利的身位。