Недавно Microsoft выпустила модель изображений для генерации текста последнего поколения MAI-Image-2.5, и она сразу же заняла третье место в последнем рейтинге генерации текста Arena, показав, что ее общая сила в области генерации изображений с помощью ИИ явно догоняет лидеров отрасли. В настоящее время в этом списке первое место занимает gpt-image-2 от OpenAI с результатом 1388.

Microsoft заявила, что MAI-Image-2.5 значительно улучшила свою производительность в различных стилях изображений, может лучше соответствовать подсказкам пользователя для создания изображений, а также имеет значительные улучшения в рендеринге текста и детализации экрана.

Первоначально Microsoft запустила собственную модель генерации изображений MAI-Image-1 в прошлом году. Модель заняла лишь 9-е место в рейтинге Arena's Image Arena, что существенно отличалось от топовых моделей других лабораторий того времени. Затем Microsoft интегрировала модель в Bing.com/create и мобильное приложение Bing и сделала ее доступной для пользователей. В марте этого года команда Microsoft AI выпустила второе поколение MAI-Image-2, которое принесло значительные улучшения в характеристиках естественного освещения, восстановлении цвета кожи и т. д. и впервые вошло в тройку лидеров рейтинга Arena, уступая только Gemini-3.1-flash-image-preview от Google и gpt-image-1.5-high-fidelity от OpenAI. Он также одновременно подключен к Copilot, Bing Image Creator и Microsoft Foundry API, к которым могут обращаться разработчики.

Исходя из этого, MAI-Image-2.5 нового поколения еще больше усиливает общие возможности модели. Microsoft заявила, что MAI-Image-2.5 может более точно понимать и выполнять текстовые подсказки пользователя, генерируемые изображения более связны в деталях и общей структуре, а рендеринг текстового контента более надежен. Возможности визуального мышления модели также были расширены за счет более точного понимания объектов, освещения, пропорций, структур сцены и пространственных отношений, что помогает создавать изображения, которые в большей степени соответствуют реальным сценам и ожиданиям пользователей.

HJRDuJKbsAAbMCN.jpg

Microsoft особо подчеркнула, что MAI-Image-2.5 добился наиболее очевидного прогресса в рендеринге текста, стилизации иллюстраций и коммерческих изображений, включая плакаты, проверку упаковки, креативность бренда и изображения продуктов и т. д., что может обеспечить более высокое качество продукции. По сравнению с моделью предыдущего поколения, текст на изображениях, созданных новой моделью, более четкий и четкий, макет более стабильный, а визуальные элементы бренда более заметные и имеют более общую текстуру, что в большей степени соответствует потребностям коммерческого дизайна и маркетинговых приложений.

Мустафа Сулейман, глава подразделения искусственного интеллекта Microsoft, заявил в социальных сетях, что MAI-Image-2.5 занял третье место в рейтинге Arena Vincentian Chart, что означает еще один важный скачок в качестве генерации изображений. Он также предсказал, что на предстоящей конференции Build команда Microsoft AI представит больше соответствующих обновлений и выпусков. Он сказал, что это всего лишь еще один шаг в усилиях Microsoft в области визуализации ИИ, и в будущем компания продолжит продвигать итерацию возможностей моделей и форм продуктов.

В настоящее время MAI-Image-2.5 открыт для всех пользователей для пробного использования через Arena, и пользователи могут напрямую сравнивать и испытывать его с другими моделями на платформе. Согласно плану Microsoft, эта новая модель также будет запущена на MAI Playground и Microsoft Foundry в ближайшие две недели, предоставляя обычным пользователям и разработчикам более разнообразные возможности создания и интеграции генеративных изображений.