Стремясь более агрессивно конкурировать с конкурирующими компаниями, занимающимися искусственным интеллектом, такими как Google, OpenAI представила Flex Processing, вариант API, который предлагает более низкие цены за использование моделей искусственного интеллекта, но с более медленным временем отклика и «периодической недоступностью ресурсов».

По словам OpenAI, обработка Flex представляет собой бета-версию недавно выпущенных моделей вывода OpenAI o3 и o4-mini и предназначена для решения низкоприоритетных и «непроизводственных» задач, таких как оценка модели, обогащение данных и асинхронные рабочие нагрузки.
Это сокращает затраты на API почти вдвое. Для o3 цены на обработку Flex составляют 5 долларов США за миллион входных токенов (~750 000 слов) и 20 долларов США за миллион выходных токенов по сравнению со стандартными ценами в 10 долларов США за миллион входных токенов и 40 долларов США за миллион выходных токенов. Для o4-mini Flex снизила цену с 1,10 доллара за миллион входных слов и 4,40 долларов за миллион выходных слов до 0,55 долларов за миллион входных слов и 2,20 долларов за миллион выходных слов.
Внедрение процессоров Flex происходит на фоне того, что цены на новейший искусственный интеллект продолжают расти, а конкуренты выпускают более дешевые, более эффективные и бюджетные модели. В четверг Google выпустила Gemini 2.5 Flash. Производительность этой модели вывода эквивалентна или даже лучше, чем у DeepSeek R1, а стоимость входного слова ниже.
В электронном письме клиентам, объявляющем цены на Flex, OpenAI также отметила, что разработчики на уровнях 1-3 ее уровней использования должны пройти недавно введенный процесс аутентификации для доступа к o3. (Уровни определяются суммой, потраченной на услуги OpenAI.) Дайджест вывода O3 и поддержка API потоковой передачи также требуют аутентификации.
OpenAI ранее заявляла, что аутентификация призвана удержать злоумышленников от нарушения ее политики использования.
узнать больше:
https://platform.openai.com/docs/guides/flex-processing