На конференции разработчиков систем ввода-вывода в этом году компания Google официально представила новое поколение моделей серии Gemini 3.5 и новую серию Gemini Omni. Gemini 3.5 Flash был первым, который был открыт для публики, а Gemini Omni ориентирован на возможность «генерировать видео из любого входного сигнала».

Gemini 3.5 Flash уже доступен всем пользователям через режим AI в приложении Gemini и поиск Google. Google утверждает, что модель имеет уровень интеллекта, сравнимый с большими флагманскими моделями во многих измерениях, сохраняя при этом стабильную быстродействие серии Flash.

Согласно введению, Gemini 3.5 Flash на данный момент является самым мощным агентом Gemini и моделью генерации кода. Он даже превосходит Gemini 3.1 Pro в тестах производительности, связанных со сложным кодом и агентами, и сохраняет лидерство в мультимодальном понимании, поэтому он также установлен в качестве текущей модели по умолчанию. Пользователи могут напрямую вызывать эту модель при ежедневном поиске, разговорах в приложении и других сценариях, чтобы получать более быстрые и разумные ответы и поддержку кода.

Gemini Omni, представленный в то же время, представляет собой последнюю попытку Google в направлении генеративного видео. Эта новая модель может генерировать видео с любого входа. Пользователи могут свободно комбинировать изображения, аудио, видео и текст в качестве входных данных, а модель генерирует высококачественный видеоконтент на основе реальных знаний Gemini. После завершения генерации пользователи также могут выполнять несколько этапов диалогового редактирования на естественном языке, чтобы изменить и точно настроить детали видео.

Первой моделью серии Gemini Omni является Gemini Omni Flash, которая поддерживает частичную или полную модификацию видео и может продолжать сохранять связность повествования исходной сцены в течение нескольких этапов создания, что позволяет пользователям постоянно вносить изменения, не теряя основную сюжетную линию. В Google заявили, что эта модель имеет более интуитивное понимание физических понятий, таких как гравитация, кинетическая энергия и динамика жидкости, что позволяет ей генерировать более реалистичные и достоверные динамические сцены.

Что касается творческого опыта, Gemini Omni позволяет пользователям использовать свои собственные голоса и аватары для участия в создании видео, тем самым создавая цифровые аватары с личными характеристиками. Чтобы решить проблемы отслеживания и безопасности синтетического контента, все видео, созданные с помощью этой модели, будут снабжены цифровыми водяными знаками SynthID для маркировки и идентификации контента, созданного искусственным интеллектом.

Что касается доступности, Gemini Omni Flash доступен подписчикам по всему миру начиная с сегодняшнего дня. Пользователи, оформившие подписку на планы Google AI Plus, Pro и Ultra, могут использовать модель непосредственно в приложении Gemini и Google Flow. В то же время Google также бесплатно представляет эту возможность в YouTube Shorts и YouTube Create, что позволяет большему количеству авторов испытать функцию создания видео на основе технологии Gemini на основных контент-платформах.