1 июня компания Xiyu Technology официально выпустила модель MiniMax M3 нового поколения. Эта модель обладает передовыми возможностями программирования, сверхдлинным контекстом до 1 МБ и поддерживает встроенную мультимодальность (изображения, видеовход и операции на рабочем столе компьютера). Она стала первой моделью в Китае, обладающей этими тремя возможностями одновременно, и в настоящее время является единственной моделью с открытым исходным кодом.

Согласно официальным данным, в наборе для оценки программирования SWE-Bench Pro M3 набрал 59,0%, превзойдя GPT-5.5 и Gemini 3.1 Pro и приблизившись к Opus 4.7; по оценке Агента Claw-Eval M3 получил высший балл; на мультимодальном тестовом наборе OmniDocBench M3 получил более высокие баллы, чем Gemini 3.1 Pro.
M3 использует новую архитектуру разреженного внимания MSA (MiniMax Sparse Attention). При 1 миллионе контекстов сумма вычислений на токен составляет всего 1/20 от модели предыдущего поколения. Этап предзаполнения ускорен более чем в 9 раз, а этап декодирования ускорен более чем в 15 раз.
MiniMax одновременно обновил код MiniMax продукта агента и запустил план подписки Token Plan (Plus 49 юаней в месяц, Max 119 юаней в месяц, Ultra 469 юаней в месяц). API M3 с этого момента открыт для использования, а контекстная версия 512k доступна со скидкой 50% в течение ограниченного времени, продолжающегося 7 дней. Вес моделей и технические отчеты будут доступны в открытом доступе в течение 10 дней.