Несколько недель назад OpenAI представила свою новейшую крупномасштабную языковую модель для сервисов генеративного искусственного интеллекта, GPT-4Turbo, на своем первом мероприятии для разработчиков. Впоследствии Microsoft объявила, что добавит модель GPT-4Turbo в свой сервис Azure OpenAI. Сегодня Microsoft объявила об усовершенствованиях своего сервиса Azure OpenAI: модель GPT-4 Turbo с Vision теперь доступна клиентам в качестве общедоступной предварительной версии.
Microsoft сообщила в своем блоге:
Эта усовершенствованная мультимодальная модель искусственного интеллекта сохраняет все мощные функции GPT-4Turbo, но при этом предоставляет возможность обрабатывать и анализировать входные изображения. Это открывает возможность использовать GPT-4 для более широкого круга задач, включая улучшение доступности, интерпретацию и анализ визуальных данных, а также визуальный ответ на вопросы (VQA).
Кроме того, Microsoft добавила дополнительные функции для клиентов Azure OpenAI через предварительную версию GPT-4 Turbo с Vision. Одним из них является оптическое распознавание символов (OCR), которое исследует изображение и извлекает любой текст из изображения, чтобы его можно было интегрировать в подсказки пользователю.
Еще одной особенностью GPT-4 TurbowithVision является заземление объекта, которое позволяет ИИ проверять изображение и отображать ключевые объекты на изображении на основе текстовых подсказок пользователя. Аналогично, ИИ может анализировать отдельные кадры видео.
Microsoft добавила:
Объединив GPT-4 Turbo с Vision, Azure AI Search и Azure AI Vision, теперь можно объединять изображения и текстовые данные для разработки решений, которые подключаются к пользовательским данным с помощью векторного поиска для улучшения работы чат-бота.
Стоимость услуги составляет 0,01 доллара США за 1000 слов ввода и 0,03 доллара США за 1000 слов вывода, при этом цены на расширенные функции различаются.
В настоящее время GPT-4Turbo с Vision доступен в регионах AzureOpenAI — Восток Австралии, Центральная Швеция, Север Швейцарии и Запад США. Клиенты, получившие доступ к общедоступной предварительной версии GPT-4Turbo с возможностями машинного зрения, будут автоматически обновлены до «стабильной, готовой к производству версии в ближайшие недели».