На конференции разработчиков Build 2026 Microsoft объявила о значительном расширении своего собственного семейства моделей MAI, созданного командой Microsoft AI Superintelligence, выпустив первую модель вывода общего назначения MAI-Thinking-1, кодовую модель MAI-Code-1 для GitHub Copilot, а также несколько обновленных версий моделей речи, транскрипции и генерации изображений для дальнейшего улучшения своей среды сквозных технологий искусственного интеллекта. Это знаменует собой ускоренное расширение Microsoft в области базовых моделей от речи и изображений до сложных рассуждений и сценариев повышения производительности разработчиков.

Microsoft заявила, что семейство моделей MAI продолжало расширяться в прошлом году и выпустило MAI-Voice-1, MAI-1-preview, MAI-Transcribe-1 и MAI-Image-2 ранее в этом году, а затем выпустила MAI-Image-2.5, который улучшил качество рендеринга текста, стилизованных иллюстраций и коммерческих изображений. На этот раз на этой основе добавляются новые модели рассуждения и кодирования, а линейки продуктов для голоса, транскрипции и изображения одновременно обновляются, чтобы сформировать более полный портфель продуктов.
MAI-Thinking-1 — первая модель вывода, официально анонсированная Microsoft. Он был обучен с нуля командой Microsoft AI и не был выделен из других моделей. Microsoft подчеркнула, что модель обучена с использованием чистых, коммерчески лицензированных данных уровня предприятия и предназначена для удовлетворения требований корпоративных пользователей к соответствию данных и коммерциализации. MAI-Thinking-1 — это модель среднего масштаба с 35 миллиардами параметров активации и поддержкой 128 тысяч контекстных окон. Он в основном предназначен для таких сценариев, как сложное многоэтапное выполнение инструкций, длинное контекстное рассуждение и генерация кода.
Хотя Microsoft не раскрыла в своем объявлении подробные данные тестов, она процитировала результаты независимого обзора в своем блоге и сообщила, что в слепом тестировании общее предпочтение рецензентов было больше к MAI-Thinking-1, чем к Claude Sonnet 4.6 от Anthropic. Кроме того, Microsoft также заявила, что в тесте задачи кода SWE-bench Pro MAI-Thinking-1 был сопоставим с Claude Opus 4.6 по производительности кодирования, что показывает потенциал этой модели для разработчиков и решения сложных инженерных задач. MAI-Thinking-1 в настоящее время находится в закрытой предварительной версии для избранных клиентов через Microsoft Foundry.
Что касается создания изображений, ранее выпущенный Microsoft MAI-Image-2.5 и его «флэш-вариант» были открыты для разработчиков через Microsoft Foundry. Согласно последним данным списка статей Arena, приведенным Microsoft, MAI-Image-2.5 превзошел Google Nano Banana Pro в задаче генерации текстовых изображений и вошел в тройку лидеров в списке. Эта модель была интегрирована в PowerPoint и постепенно внедряется в OneDrive, предоставляя возможности создания изображений более высокого качества для экосистемы Office.
Что касается транскрипции речи, в апреле этого года Microsoft выпустила MAI-Transcribe-1, который поддерживает транскрипцию речи в текст на 25 наиболее часто используемых языках на основе собственных данных об использовании продукта. На этот раз Microsoft выпустила обновленную версию MAI-Transcribe-1.5, которая достигла ведущего в отрасли уровня точности распознавания речи и расширила количество охватываемых языков до 43. В ближайшее время компания планирует добавить в модель возможности потоковой транскрипции, чтобы удовлетворить потребности сценариев реального времени.
Что касается синтеза речи, после объявления о том, что MAI-Voice-1 стал общедоступным в апреле этого года, Microsoft на этот раз выпустила MAI-Voice-2 и его молниеносную версию. Модель генерации речи нового поколения поддерживает более 15 дополнительных языков и предоставляет больше вариантов голосового стиля для адаптации к более богатым сценариям приложений, таким как многоязычное обслуживание клиентов, дублирование контента и интеллектуальные помощники.
Для сценариев кодирования разработчиков Microsoft одновременно запустила MAI-Code-1, эффективную модель кода вывода, оптимизированную для рабочих нагрузок GitHub. Эта модель была запущена в GitHub Copilot и Visual Studio Code и обеспечивает поддержку ежедневного кодирования, рефакторинга, завершения кода и других сценариев. Хотя Microsoft не раскрыла конкретные результаты тестов MAI-Code-1, этот релиз рассматривается как важный сигнал — Microsoft больше не полагается полностью на OpenAI и Anthropic для базовой модели GitHub Copilot, а постепенно вводит модели собственной разработки.
Что касается каналов распространения, помимо предоставления услуг предприятиям и разработчикам через Microsoft Foundry, Microsoft также объявила, что ее модели серии MAI будут запущены на сторонних платформах, таких как Fireworks AI, Baseten и OpenRouter. В то же время Fireworks AI стал общедоступным в Microsoft Foundry, предоставляя корпоративным клиентам больше возможностей архитектуры и развертывания. Сотрудничая с несколькими платформами, Microsoft надеется еще больше снизить порог доступа и ускорить внедрение моделей MAI в различных облачных и инструментальных экосистемах.
На основе общей схемы Microsoft строит полную матрицу возможностей ИИ корпоративного уровня, используя несколько типов моделей, таких как рассуждение MAI, кодирование, речь, транскрипция и изображения. С добавлением MAI-Thinking-1 и MAI-Code-1 голос Microsoft в области сложных рассуждений и продуктивности разработчиков значительно усилился, а также предоставил более конкурентоспособную техническую базу для GitHub Copilot, серии Office и платформ для совместной работы.