Клод Сонет 5 уже здесь: цена снижена на 40%, но счет заставит вас чувствовать себя «болезненно»

Anthropic включает некоторые из своих «флагманских возможностей» в модель по умолчанию для бесплатных пользователей. Ранним утром 1 июля по пекинскому времени был официально представлен Пятый Сонет Клода. Он может самостоятельно планировать задачи, вызывать браузеры и терминалы, писать код, проверять ошибки и запускать сложные рабочие процессы... По официальным словам Anthropic, это модель Sonnet, которая на данный момент является «наиболее агентоподобной».Его производительность уже близка к Opus 4.8, но цена снизилась на ступеньку ниже.

Звучит вкусно.

В период выпуска входные и выходные цены токенов Sonnet 5 (за миллион) составляют всего 2 и 10 долларов США соответственно; даже если нормальность вернется к норме в конце августа, входная и выходная цены токенов составят 3 и 15 долларов США соответственно. По сравнению со стандартной ценой Opus 4.8 (входные 5 долларов США/выходные 25 долларов США), Sonnet 5 эквивалентен прямой скидке в 40% и даже ниже — 40% скидке в течение начального периода запуска.

但如果你只盯着跑分表和价格战，那就低估了Anthropic的野心。

Это больше похоже на экстремальный стресс-тест, проведенный единорогом Кремниевой долины накануне IPO: когда модель почти флагманского уровня станет достаточно дешевой, чтобы ее можно было использовать в качестве ежедневного инструмента повышения производительности, будут ли корпоративные клиенты по-прежнему включать ее в «пилотный проект»? Осмелятся ли они по-настоящему интегрировать ИИ в основные бизнес-процессы?

Этот ответ не только определяет, насколько популярный Сонет 5 может быть продан, но также определяет, сможет ли грандиозная история Anthropic, указывающая на оценку в триллион долларов, привлечь реальные деньги на рынке капитала.

В то же время Anthropic объявила в официальном документе, что Министерство торговли США сняло экспортный контроль с Claude Fable 5 и Mythos 5, и доступ к этим двум моделям будет восстановлен завтра.

01Четыре месяца от платежного барьера до публичного эталона: интеллектуальные агенты больше не благородны

Если вы никогда раньше не использовали топовую версию Opus, возможно, вы не понимаете, какой эффект принес Sonnet 5 на этот раз.

Верните время в февраль этого года. В то время, если бы вы хотели, чтобы ИИ не только отвечал на вопросы в окне чата, но и управлял браузером, открывал терминал и самостоятельно выполнял сложные многоэтапные рабочие процессы, вам, вероятно, пришлось бы потратить деньги на покупку самой дорогой модели.

Это привилегия меньшинства, поддерживаемая корпоративными бюджетами, и обычные пользователи не могут в нее вмешиваться.

Теперь, когда вы открываете Claude, бесплатная модель по умолчанию уже имеет такую возможность.

Эксперт по продуктам искусственного интеллекта Аакаш Гупта поделился рядом шокирующих сравнений после своего опыта. Он вытащил данные и сообщил, что на SWE-bench Pro, жестком тесте кодирования агентов, Sonnet 5 набрал 63,2%, а флагманский Opus 4.8 — 69,2%, догнав более 90% флагманского уровня.

В другом тесте научной работы GDPval-AA v2 Sonnet 5 набрал 1618 баллов, даже напрямую превзойдя 1615 баллов Opus 4.8. Его чувства очень непосредственны;То, что всего четыре месяца назад было платным доступом высокого класса, теперь является стандартом для всех.

Гупта также напоминает всем, что независимо от того, какое преимущество вы в настоящее время имеете на кривой цена-качество, этот ров, по сути, представляет собой всего лишь краткосрочную аренду, которая постоянно обнуляется.То, что на самом деле объявила сегодня Anthropic, может быть, это значительно сокращенный график амортизации.Цикл амортизации передовых интеллектуальных технологий составляет всего около четырех-шести месяцев, и большинство команд уже перешли на дешевый уровень еще до того, как большинство команд даже закончили презентацию, объясняющую, почему необходима дорогая версия.

Другой пользователь X @Shawnife также выразил аналогичные чувства в социальных сетях.

Он считает, что такие релизы, как Sonnet 5, легко недооценивают не потому, что улучшения не важны, а потому, что достижения ИИ теперь кажутся настолько частыми, что скачки мощности начинают казаться нормальными. Для него важно не только то, что «Сонет» стал лучше;Скорее, грань между «повседневными моделями» и «передовыми возможностями» постоянно становится тоньше.

Несколько месяцев назад достижение такого уровня разумности, использования инструментов, автономности и надежности часто означало выбор самой крупной модели, доступной на тот момент, и принятие высоких затрат, связанных с ней. Теперь Sonnet 5 значительно приближается к возможностям уровня Opus, сохраняя при этом ценовой диапазон, что сделает возможным более широкое использование.

@Shawnife заключила:Такое ощущение, что мы вступаем в этап, когда люди перестают спрашивать «какая модель самая умная» и начинают спрашивать «что мы можем построить сейчас, когда этот уровень мощности достаточно дешев, чтобы использовать его каждый день».Часто именно здесь начинается настоящая трансформация.

02 Не просто «будь умнее», а научись «доводить дело до конца»

У обычных пользователей ощущение того, что модель стала умнее, зачастую смутное, но у разработчиков очень острый нюх.

Самая большая особенность этого обновления Sonnet 5 заключается не в том, что он может лучше общаться, а в том, что он стал чрезвычайно «надежным» и особенно хорош в выполнении той грязной работы, которая раньше застревала на полпути.

Это «нерушимое» качество является ключом к тому, чтобы компании осмелились превратить экспериментальные проекты в промышленное внедрение.Самым большим препятствием в продвижении ИИ от пилотного проекта к производственной линии является не индивидуальный балл за определенный выдающийся навык, а способность поддерживать стабильность в хаотичном и непредсказуемом реальном рабочем процессе. Путеводитель, заблудившийся после достижения шестьдесят четвёртой ступени дороги из восьмидесяти шагов, не так полезен, как честная карта.

Давайте сначала посмотрим на объективные данные.

В тесте прокси-кодирования SWE-bench Pro Sonnet 5 набрал 63,2%, а Sonnet 4.6 предыдущего поколения — 58,1%. Этот скачок приблизил Sonnet 5 к 69,2% Opus 4.8.

В другой оценке кода, Terminal-Bench 2.1, в которой больше внимания уделяется реальному бою, разрыв еще больше сократился: Sonnet 5 достиг 80,4%, а Opus 4.8 - 82,7%, почти сравняв счет.

С точки зрения междисциплинарного рассуждения, используя окончательный тест на людях в качестве эталона, Sonnet 5 с помощью инструментов набрал 57,4%, что практически соответствует 57,9% Opus 4.8.

В оценке OSWorld-Verified, которая имитирует реальные компьютерные операции, Sonnet 5 набрал 81,2%, что является существенным улучшением по сравнению с 78,5% предыдущего поколения.

Эти цифры в совокупности указывают на тот факт, что Sonnet 5 не представляет собой лоскутное одеяло предыдущего поколения, он сразу переходит в диапазон производительности, который во многом совпадает с флагманской моделью.

Давайте посмотрим на субъективный опыт.

Суале Асиф, соучредитель редактора кода AI Cursor, использовал его для выполнения своей повседневной работы и обнаружил, что эта новая модель может придерживаться установленного плана, следовать спецификациям разработки и, наконец, обеспечить четкую серию многоэтапных изменений кода по комфортной цене, как по-настоящему надежный инженер со стабильной производительностью.

Дэниел Шепард, старший инженер платформы автоматизации Zapier, поставил перед ней задачу, которую предыдущие модели часто не справлялись: автоматически обновлять сложную иерархию учетных записей Salesforce компании и рассылать строго отформатированное объявление о выпуске. Предыдущие модели обычно застревали на полпути,Но Sonnet 5 завершает весь рабочий процесс от начала до конца. Эта возможность надежно завершить весь процесс полностью меняет экономику автоматизации.

Опыт ведущего подкаста Бена Дэвиса выявляет новый уровень чувств. Его первой реакцией было то, что производительность этой штуки в эталонных тестах на самом деле была очень плохой, и она была особенно неэффективна с точки зрения рассуждений. Это была не быстрая модель. Несмотря на то, что цена была снижена, это была не дешевая модель из-за проблем с неэффективностью.

Но когда тема сменилась, он сказал, что его первым впечатлением было то, что он чувствовал, что все остальные ошибаются. Это была очень хорошая модель. Он использовал выражение, что Sonnet5 пахнет «следующим поколением».

Он объяснил, что Fable — это первая модель «следующего поколения», которую получил каждый.Характеристики этой модели — не высокий балл, а способность работать непрерывно в течение смехотворно долгого времени, способность хорошо обращаться с субагентами, возможность проверять собственную работу, а также способность заполнять пробелы в ваших подсказках и по-настоящему понимать смысл ваших слов лучше, чем любая предыдущая модель.

Sonnet 5 унаследовал эту особенность от своего первого теста, проверяя собственный вывод и активно проверяя наличие ошибок без явного запроса об этом. Однако он также признал, что, как и большинство моделей Claude, он иногда слишком много проповедует, отвечает на вопросы, которые вы не задавали, и легко уходит от темы. К счастью, когда вы ему на это укажете, он не будет долго с вами спорить, а просто признает вашу ошибку и вернется в нужное русло.

Итак, его вывод таков:Пока Fable действительно не вернется, это может быть лучшая модель.

Наконец, давайте посмотрим на реальную деловую практику. Результаты тестов генерального директора Box Аарона Леви предоставляют более веские доказательства этих предыдущих чувств.

Box имеет собственную собственную сложную систему оценки работы с искусственным интеллектом, которая позволяет модели сквозно анализировать реальные корпоративные документы. Он включил Сонет 5 и начал его использовать, и результаты были просто потрясающими. В нескольких прибыльных секторах высокой сложности, таких как энергетика, Sonnet 5 опережает своего предшественника на 4,7 процентных пункта, розничная торговля – на 4,4 процентных пункта и профессиональные услуги – на 2,6 процентных пункта.

Леви также поделился несколькими конкретными практическими случаями. При проведении комплексной проверки финансирования Sonnet 5 рассчитал коэффициент ликвидности и левериджа компании из исходного баланса и даже обнаружил заниженное соотношение долга к собственному капиталу в исходном отчете и отметил все три кредита как нарушения, а не только те, которые допускаются самим документом.

При анализе затрат на капитальный ремонт другие модели могут бездумно складывать все числа в таблице, но они ловко ограничивают их собственной структурой KPI, определенной компанией, аккуратно исключая затраты на производственные потери, которые следует отслеживать отдельно, а также следуют подсказкам, чтобы найти поврежденную справочную ячейку в электронной таблице.

При анализе доходов SKU не возникает распространенной ошибки деления на сумму. Вместо этого он точно рассчитывает вклад каждого продукта в знаменатель правильной подкатегории и даже может объяснить, почему определенная категория продуктов не попала в первую девятку рейтинга.

Леви считает, что в областях, где неструктурированные данные очень сложны, Sonnet 5 действительно продемонстрировал свою способность нести знамя производства.Он подтвердил, что эта модель вскоре будет доступна клиентам Box AI Studio для создания собственного персонализированного интеллекта компании.

03 Леджер в токенайзере: дешевле, но не обязательно экономия денег

Для корпоративных клиентов именно возможность стабильно обрабатывать сложные документы является именно той причиной, по которой они готовы платить. Но предпосылкой готовности платить является то, что счет должен соответствовать бюджету.

На первый взгляд кажется, что стоимость Sonnet 5 сильно снизилась, и вы можете купить смартфон, близкий к Opus, по специальной цене всего в 2 и 10 долларов США. Однако после завершения теста многие люди обернулись и напомнили всем, что нужно обратить внимание на то, чтобы «избегать ловушек».

У Саймона Уиллисона, исследователя, специализирующегося на деталях ИИ, есть привычка. Каждый раз, когда выпускается новая модель, он переходит непосредственно к разделу «новые функции» документации разработчика, потому что там обычно скрыто больше практической информации, чем официальный анонс. На этот раз он действительно раскопал техническую деталь, которую нужно было тщательно взвесить.

В Sonnet 5 появилась новая версия сегментатора слов, и способ обработки текста изменился. Прямым следствием этого является то, что для того же входного текста текущее потребление токенов почти на 30% больше, чем у старой модели Sonnet 4.6.

Он провел фактическое измерение, используя общедоступный инструмент подсчета Claude Token, и результаты были весьма интуитивными. Для тестирования он использовал полный текст английской версии Всеобщей декларации прав человека. На старой модели Sonnet 4.6 было израсходовано всего 2356 токенов. К Сонету 5 оно непосредственно расширилось до 3341 токена, увеличившись в 1,42 раза. При переходе на испанскую версию количество токенов увеличилось с 3572 до 4747, увеличившись в 1,33 раза.

Самым жестоким было протестировать файл кода Python, содержащий более 4000 строк. Токен резко увеличился с 44014 до 56113, увеличившись в 1,27 раза. Единственное, что принесло ему облегчение, это упрощенный китайский. Потребление токенов китайского текста на двух моделях было в основном одинаковым, с небольшими колебаниями в 1,01 раза, что было практически незначительно.

Этот вывод означает, что для разработчиков, которые в значительной степени полагаются на обработку на английском языке или используют много кода на Python, стоимость модели в расчете на задачу может быть не такой хорошей, как рекламируется.

Anthropic фактически признал это в сносках официального документа. Они объяснили, что цель установления преференциальных цен состоит в том, чтобы сохранить переходный период примерно нейтральным с точки зрения затрат.Другими словами, часть нескольких долларов, выделяемых на снижение цен, используется для защиты от инфляции токенов.

Эта скрытая переменная заставила некоторых разработчиков, изначально аплодировавших снижению цен, мгновенно успокоиться и начать пересчитывать свои расчеты с учетом типичных для них рабочих нагрузок.

04 В соцсетях разразилась огромная ссора: кто-то кричал, что он классно пахнет, а кто-то требовал вернуть деньги.

Когда бы ни была выпущена модель, в социальных сетях не будет одного голоса. В первые несколько часов после запуска Sonnet 5 отзывы о платформе X быстро разделились.

Некоторые люди считают это сообщение искренним, а другие бесцеремонно выражают свое разочарование.

Жалоба пользователя X @BennettBuhner была весьма резкой. Он прямо сказал, что Sonnet 5 — худшая модель на данный момент. Его причина в том, что фактическая стоимость потребления каждой задачи выше, чем при использовании Opus, но производительность хуже, чем у Opus, и переход от номера версии с 4,6 до 5 не является значимым улучшением ни в каком аспекте. Он выразил свое недовольство, используя придуманное слово «Антрослоп» с явной иронией.

Пользователь X @weswinder также выразил подобное замешательство. Его логика проста. Sonnet 5 выглядит дороже, чем Opus 4.8, и он не такой умный.Если для получения худших результатов требуется больше токенов, то так называемое преимущество в цене за единицу токена фактически бессмысленно.Он прямо спросил, в чем значение этой модели?

Другой пользователь X, @DaveShapi, испытал американские горки. Его первой реакцией был шок. По его собственным словам, он не мог поверить, что говорит это, но режим максимального усилия в Сонете 5 был слишком напряженным. Он описал это как ощущение, будто скормил коробку белок кучей кокаина, затем сказал: «Да благословит вас Бог» и ждал, чтобы увидеть, что выйдет с другой стороны.

Затем он пожаловался, что Сонет 5 слишком легко уходит от темы, что он проповедует, как и большинство Клодов, отвечает на вопросы, которые вы не задавали, и в целом слишком высокомерен. К счастью, есть преимущество. Когда вы укажете ему на ошибки, он не будет долго с вами спорить. Он просто признает свои ошибки и спросит, что не так. Нам не о чем беспокоиться. Он беспомощно спросил, зачем мне тратить на это деньги?

Но помимо голосов недовольства, некоторые люди высказывали и совершенно другие суждения. Комментарии пользователя X @kimmonismus привлекли более стратегический уровень внимания.

Результат оценки, который он получил, заключался в том, что Sonnet 5 действительно был лучше предыдущего поколения, чего все и ожидали, но он был слабее Opus 4.8 во всех оценках. Чего он особенно не понимает, так это того, что раз скачка производительности нет, то почему номер версии прыгает сразу с 4.6 на 5 вместо того, чтобы называть ее 4.8 или аналогичным номером. Обычно большой скачок номера версии означает значительный скачок в возможностях, но на этот раз это явно не так.

@kimmonismus сказал, что в целом этот релиз оставил его в замешательстве и вызвал больше вопросов, чем ответов. Он не мог не рассмотреть Sonnet 5 в контексте Fable 5. Поскольку все уже знали, что существует Fable 5 со значительно более высокими характеристиками внутри, а также знали, что можно предположить, что внутри находится лучший Opus, почему они долго сдерживались и выпустили только Sonnet 5, который не был ни хорошим, ни плохим?

Он предположил, что это, вероятно, связано с нынешней потребностью в сдержанности. Настоящим моментом является то, что, поскольку нормативные коммуникации по-прежнему задерживаются по всем направлениям, Anthropic необходимо выпустить что-то сейчас, чтобы поддерживать разговор и не забывать об этом, включая поддержание этих позитивных голосов.По его мнению, выход «Сонета 5», наверное, можно понять только в этом контексте, оставляющем послевкусие какой-то переходной промежуточности, что, по крайней мере лично для него, в целом разочаровывает.

Несмотря на эту критику, многие люди высказались в пользу Anthropic.

Некоторые думают, что сравнение Sonnet с Opus само по себе показывает, что Sonnet обошел рынок. Продукцию среднего класса сравнивают с флагманскими моделями, что как раз доказывает, что производительность втиснулась в первый эшелон. Другие отметили, что пользователи Free теперь могут покупать модели такого уровня бесплатно, поэтому придраться не к чему.

Подобные противоречия сами по себе показывают, что Сонет 5 находится в хрупком балансе. До успеха еще далеко, но и до провала еще далеко.Настоящим испытанием является не молва в день релиза, а то, сколько разработчиков на самом деле переведут свой ежедневный рабочий процесс на эту модель в ближайшие несколько недель, и будут ли те, кто перешел, кивнуть или нахмуриться, когда получат счет в конце месяца.

05Опасность «запечатывания» и сдержанности накануне IPO

Будучи звездной компанией, стремящейся к оценке в триллион долларов, Anthropic чрезвычайно строга в вопросах безопасности. На этот раз в системной карточке Сонета 5 оценка безопасности занимает большое место и раскрывается множество деталей.

Давайте сначала поговорим о направлениях прогресса. По сравнению с Sonnet 4.6 предыдущего поколения, Sonnet 5 имеет реальные улучшения во многих аспектах.

Он демонстрирует меньший уровень галлюцинаций и подобострастного поведения, лучше отклоняет вредоносные запросы и более устойчив к атакам с внедрением подсказок в сценариях агента. Должностное лицо провело полный набор автоматических поведенческих проверок, и объем тестирования охватывает ряд ненадлежащих действий, таких как сотрудничество, злоупотребления и обман. Общий балл неадекватного поведения Sonnet 5 ниже, чем у предыдущего поколения, а значит, он безопаснее.

Но, честно говоря, это не самый безопасный вариант.В системной карточке четко указано, что по сравнению с более мощным Opus 4.8 и Claude Mythos Preview, в котором особое внимание уделяется сетевой безопасности, Sonnet 5 показал несколько более высокий уровень неправомерных действий в той же оценке.Это заявление очень осторожное, но его достаточно, чтобы проиллюстрировать проблему. Более сильные модели на самом деле лучше справляются с некоторыми аспектами безопасности.

Наиболее интуитивное сравнение дает тест эксплойтов, разработанный в сотрудничестве с Mozilla.

Задачей модели было написать полезные программные эксплойты для браузера Firefox 147. Табель успеваемости по Сонету 5 очень чистый. Никаких полезных уязвимостей вообще нет, а вероятность успеха равна нулю. Его частичный показатель успеха составляет 13,2%, что немного выше, чем 8,8% у Sonnet 4.6 предыдущего поколения, но оба показателя заслуживают упоминания перед Opus 4.8. Opus 4.8 дал 68,8% доступных эксплойтов, а Mythos 5 достиг 88,4%.

Другими словами, хотя универсальность Sonnet 5 резко возросла, между ним и двумя его старшими братьями все еще существует разрыв с точки зрения навыков сетевой безопасности, требующих чрезвычайно разрушительной силы.

Чтобы не допустить того, чтобы он был слишком умным и вызывал хаос, подход Anthropic заключается в прямом включении защиты сетевой безопасности по умолчанию. Эта система может обнаруживать и блокировать опасное поведение при использовании сети в режиме реального времени. Всякий раз, когда модель пытается коснуться опасной зоны, появляется защитный экран.

Чиновники пояснили, что строгость этого комплекса мер защиты такая же, как и у Opus 4.7 и 4.8. Поскольку они сочли общий уровень риска сетевой безопасности Sonnet 5 низким, они не приняли более строгих мер, таких как ограничение Fable 5.

Для тех организаций с особыми потребностями, которым требуется меньшая защита для исследований в области кибербезопасности, Anthropic предлагает канал «Программы киберпроверки». Организации, которые уже присоединились к программе, автоматически получат те же права доступа к Sonnet5, и им не нужно будет подавать повторную заявку. В общем, официальная рекомендация — тем, кто серьезно относится к работе по сетевой безопасности, использовать Opus4.8.

06 Какую роль играет Сонет 5 в повествовании об IPO?

Anthropic спешит выйти на биржу, и ее оценка выросла почти до одного триллиона долларов США. Размещение Sonnet 5 на этом узле больше похоже на стратегический шаг, чем на обычное обновление.

Глядя на траекторию финансирования за последние шесть месяцев, можно сказать, что оно действительно быстрое. В феврале этого года Anthropic завершила финансирование на сумму 30 миллиардов долларов США при оценке в 380 миллиардов долларов США. В то время годовой доход достиг 14 миллиардов долларов США, увеличиваясь более чем в десять раз каждый год в течение последних трех лет. К концу мая компания завершила еще одно финансирование серии H на сумму 65 миллиардов долларов США, ее оценка подскочила до 965 миллиардов долларов США, а годовой доход увеличился до более чем 47 миллиардов долларов США.

Но этот темп роста также требует неизбежного внимания. Гил Лурия, директор по технологическим исследованиям аналитической фирмы D.A. Дэвидсон облил его холодной водой, предупредив, что, хотя Anthropic, похоже, и лидирует в плане передовых моделей,Но большая часть текущего использования происходит в результате испытаний и экспериментов, которые могут оказаться неустойчивыми.Преобразование любопытных экспериментов разработчиков в зависимости на уровне производства с помощью долгосрочных контрактов является наиболее серьезным препятствием, с которым сталкиваются лаборатории искусственного интеллекта.

Глядя на ценовую стратегию Sonnet 5 в этом контексте, логика становится ясной. Корпоративные клиенты, которые пробуют дорогие модели класса Opus, могут обнаружить, что Sonnet 5 предлагает достаточно хорошее качество продукции по цене, которую финансовые отделы готовы одобрить в широком масштабе.Если это произойдет, это может ускорить переход отрасли от экспериментов к внедрению, что является ключевым шагом для Anthropic, чтобы оправдать свою оценку.

Есть еще один признак, который легко игнорировать. Всего за день до запуска Sonnet 5 губернатор Калифорнии Гэвин Ньюсом объявил о партнерстве, которое позволит предоставить Claude всем агентствам штата со скидкой 50%, а также бесплатное обучение персонала.Это означает, что Anthropic будет получать постоянный регулярный доход.

Кейт Дженсен, глава Anthropic в Америке, сказала, что речь идет о том, чтобы Клод был доступен для тех, кто поддерживает работу Калифорнии. Это соглашение также распространилось на различные города и округа Калифорнии. Это не разовая продажа, а своего рода глубокая привязка, которая позволяет базе доходов проникнуть в сообщество разработчиков и проникнуть в систему государственных услуг. Для корпоративных клиентов именно возможность стабильно обрабатывать сложные документы является именно той причиной, по которой они готовы платить.

07Конкурентная среда и давление на оценку стоимости

Время выхода Sonnet 5 также совпадает с самым конкурентным окном во всей отрасли.

В марте OpenAI завершила финансирование на сумму 122 миллиарда долларов США при оценке в 852 миллиарда долларов США, а также готовится к собственному IPO. После слияния SpaceX Илона Маска и xAI цена IPO составила 135 долларов США за акцию при оценке в 1,77 триллиона долларов США. Google, Meta и множество хорошо финансируемых азиатских стартапов в области искусственного интеллекта борются за один и тот же корпоративный рынок.

Это затратная гонка вооружений, в которой никто не смеет остановиться и перевести дух.

Аналитик PitchBook Харрисон Ролфес сказал по этому поводу нечто вполне реальное. Он имеет в виду, что не стоит просто смотреть на поверхностные цифры, такие как оценка стоимости и выручка. Все это можно накопить, сжигая деньги.Действительно важная цифра — это валовая прибыль, которая показывает, сколько денег остается после вычета прямых затрат, таких как вычислительная мощность и счета за электроэнергию, на каждый доллар, заработанный компанией. До сих пор внешний мир никогда не видел этого числа. Если валовая прибыль уродлива, независимо от того, насколько высока выручка, она принесет только убыток.

Таким образом, листинг этой волны компаний, занимающихся искусственным интеллектом, в 2026 году либо станет самым успешным праздником капитала со времен интернет-пузыря, либо станет негативным учебным материалом для инвесторов на публичном рынке, чтобы они помнили, как дорого обходится просто слушать историю, не заглядывая в книги.

Подтекст этого предложения заключается в том, что на Уолл-стрит нелегко произвести впечатление быстрым ростом доходов. Они будут слой за слоем снимать финансовые отчеты, чтобы увидеть, сколько вычислительной мощности тратится на каждый доллар дохода. Валовая прибыль — ключевой индикатор, позволяющий проверить, является ли компания, занимающаяся искусственным интеллектом, технологическим чудом или черной дырой капитала. Публичные рынки жестоки.

Заключение

Теперь мяч отсутствует.Настоящим испытанием Sonnet 5 будет не эталонная диаграмма в день выпуска, а показатели выставления счетов и удержания в последующие месяцы.Действительно ли разработчики перенесли свой повседневный рабочий процесс? Когда они получают счет в конце месяца, они кивают или хмурятся? Это единственные, которые имеют значение.

Если разобрать, есть три переменные, которые определят ответ.

Во-первых, это надежность агента.Тестирование производительности проверяет потолок возможностей, а производственная среда проверяет долгосрочную стабильность. После того, как тысячи разработчиков начинают работать по своим собственным хаотичным и непредсказуемым сценариям, то, выпадет ли Sonnet 5 из цепочки, важнее, чем то, какой высокий балл он наберет в лаборатории.

Вторая — переменная счета, спрятанная в токенизаторе.Если корпоративные клиенты не будут рассчитывать затраты на основе своих бизнес-сценариев, а просто будут смотреть на рекламируемую цену за единицу каждого токена и думать, что это дешево, то, когда период скидок закончится, реальный счет может оказаться шокирующим.

Третья переменная более интересна.Если предположить, что Sonnet 5 действительно успешен, разработчики будут массово мигрировать, а корпоративные клиенты также внедрят его в производственный процесс, что будет дальше?

Положение Опуса станет неловким. Если Sonnet уже может обеспечить достаточную производительность при гораздо меньших затратах в большинстве сценариев, кто захочет тратить более чем вдвое больше денег на вызов Opus?В этот момент Anthropic может столкнуться с контратакой собственного успеха. Чем лучше Sonnet продается, тем больше будут сокращены продажи Opus, а Opus — это линия продуктов с более высокой валовой прибылью.

Либо возьмите на себя инициативу по снижению цен и сокращению прибыли, либо наблюдайте, как клиенты переходят от дорогих продуктов к более дешевым. Ни один из этих путей не является легким.

Ставка Anthropic на этот раз находится прямо посередине двух концовок.

Получилась модель, производительность которой близка к флагманам, но цену можно развернуть в больших масштабах. Компания хочет доказать одно: передовые возможности могут не только оставаться на самом дорогом флагманском уровне, но также могут стать инфраструктурой, которую предприятия смогут использовать каждый день и одновременно зарабатывать деньги.

Когда Anthropic действительно выйдет на публичный рынок, инвесторы дадут ответ: может ли этот маршрут «близко к флагману, снижение цен» поддержать историю, близкую к триллиону долларов.