Google сокращает вычислительную мощность Gemini для Meta

Как сообщает Financial Times со ссылкой на людей, знакомых с этим вопросом, примерно в марте этого года Google предупредила Meta, что она больше не может удовлетворить свои крупномасштабные потребности в вычислительной мощности и мощности для модели Gemini, что вынудило социального гиганта сократить ее использование и отложить многочисленные внутренние проекты в области искусственного интеллекта. Соответствующие ограничения продолжают действовать. Meta попросила внутренних сотрудников «внимательно следить» за потреблением токенов ИИ и использовать более сдержанный подход к входным, выходным данным и общему использованию модели. Это резко контрастирует с подходом компании к энергичному продвижению внутри компании и даже «обязательному» использованию ИИ в определенных сценариях в течение прошлого года.

В отчете отмечается, что, хотя в последние годы Meta вложила значительные средства в создание собственной модели Llama с открытым исходным кодом, а генеральный директор Марк Цукерберг постоянно заявлял, что искусственный интеллект станет основной платформой компании следующего поколения, Meta на самом деле во многом полагается на Gemini от Google во многих ключевых бизнес-связях. По словам людей, знакомых с вопросом, Meta широко использует Gemini в таких сценариях, как обслуживание клиентов, чат-боты рекламодателей, генерация кода, удаление подозрительного или вредоносного контента и обнаружение мошенничества, и оно было выбрано в качестве внутреннего предпочтительного решения именно потому, что его производительность лучше, чем у собственной модели Meta; в то же время Клод из Anthropic также конкурирует и использует его в некоторых сферах бизнеса.

Сокращение предложения Google затрагивает не только Meta, но и других клиентов, использующих Google Cloud и Gemini, но Meta выделяется, поскольку спрос намного выше, чем у аналогичных клиентов. В отличие от Google, Microsoft и Amazon, Meta не управляет собственным бизнесом по облачным вычислениям, а это означает, что в дополнение к своим внутренним системам искусственного интеллекта, разработанным самостоятельно, ей приходится приобретать внешние вычислительные мощности и модельные услуги у конкурентов. В условиях быстрого расширения внутреннего спроса эта проблема структурной зависимости еще больше усугубляется.

Чтобы справиться с растущим спросом на ИИ, Google в последние годы продолжает увеличивать инвестиции в центры обработки данных и специализированное оборудование. Квартальная выручка ее облачного бизнеса превысила 20 миллиардов долларов США, а портфель незавершенных заказов приближается к 460 миллиардам долларов США, что показывает, что общий спрос рынка вычислительной мощности намного превышает существующие производственные мощности. Google заявила, что ее собственная модель обрабатывает более 16 миллиардов токенов в минуту посредством прямых вызовов API, что примерно на 60% больше, чем в предыдущем квартале. Это также подтвердило со стороны, что на этапе коммерциализации крупных моделей вычислительная мощность и мощность становятся ключевыми узкими ресурсами.

Meta пытается решить ту же проблему другим путем: с одной стороны, компания расширяет собственный дата-центр, а с другой стороны, она работает с Broadcom над разработкой индивидуальных чипов ускорения MTIA, надеясь в будущем постепенно снизить свою зависимость от поставщиков облачных сервисов и моделей, таких как Google. После неудачи в своей ставке на Метавселенную, Meta срочно необходимо создать повествование о «следующей платформе» в области ИИ. Этот инцидент с «ограниченностью» из-за чрезмерной зависимости от внешних моделей также выявил его недостатки и срочность в плане инфраструктуры и вычислительной мощности.