Alphabet (материнская компания Google) выпустила Gemini 3.1 Flash Live, новую модель искусственного интеллекта, специально созданную для аудио- и видеоприложений в реальном времени. Этот шаг сигнализирует об усилении конкуренции в сфере мультимодального искусственного интеллекта. Google утверждает, что это лучшая аудио- и голосовая система, которую она когда-либо создавала. Эта модель разработана для обеспечения более естественного общения и более быстрого реагирования на потребительские и корпоративные продукты. Этот выпуск предназначен для разработчиков, предприятий и обычных пользователей, которым нужен более плавный голосовой интерактивный интерфейс.

Google утверждает, что Gemini 3.1 Flash Live работает быстрее, чем предыдущие модели, и может удвоить объем памяти разговорного контекста. Это делает модель более практичной в сценариях длительного разговора, таких как мозговой штурм, поиск в реальном времени и сложный обмен вопросами и ответами.

Модель теперь интегрирована во многие продукты Google, включая Gemini Live, возможности поиска в реальном времени, Gemini Live API в Google AI Studio и Gemini Enterprise. Такая широкая интеграция показывает, что Google интегрирует свою новейшую технологию искусственного интеллекта во всю экосистему, а не просто запускает ее как отдельный продукт.

Этот сдвиг важен, поскольку голосовая связь в реальном времени и мультимодальные возможности становятся ключевым полем битвы в области искусственного интеллекта, а основные платформы стремятся сделать их более простыми в использовании и более широко используемыми в бизнесе.