Сегодня Ant Bailing официально выпустила Ling-2.6-flash — модель Instruct с общим объёмом параметров 104Б и параметром активации 7,4Б.Эта модель фокусируется на «эффективности токена». Сохраняя уровень конкурентного интеллекта, он быстрее, экономичнее и больше подходит для крупномасштабных реальных приложений.

Согласно авторитетным данным искусственного анализа сторонней оценки, Ling-2.6-flash демонстрирует выдающиеся преимущества эффективности токенов, достигая индекса интеллекта 26 баллов с 15 миллионами выходных токенов, сохраняя при этом высокий уровень интеллекта и контролируя потребление вывода на относительно низком уровне.

Понятно, что Ling-2.6-flash следует гибридной линейной архитектуре Ling 2.5. Эта весьма разреженная архитектура MoE имеет очевидные преимущества в производительности оборудования.

При наличии 4 карт H20 ​​скорость вывода может достигать 340 токенов/с, а пропускная способность предварительного заполнения в 2,2 раза выше, чем у Nemotron-3-Super.

В оценке выходной скорости Ling-2.6-flash заняла первое место среди моделей того же уровня параметров со стабильной скоростью вывода 215 токенов/с.

С точки зрения потребления токенов соотношение ввода-вывода Ling-2.6-flash было значительно улучшено.

В полной оценке искусственного анализа общее потребление Ling-2.6-flash составило 15 миллионов токенов, в то время как такие модели, как Nemotron-3-Super, достигли или превысили 110 миллионов токенов. Это означает, что Ling-2.6-flash использует только около 1/10 потребления токенов для выполнения аналогичных задач оценки.

В Ling-2.6-flash внесены целевые улучшения для сценариев агента. Он по-прежнему поддерживает сильные возможности выполнения задач, одновременно контролируя потребление токенов. Модель достигла уровня SOTA того же размера в тестах, связанных с агентами, таких как BFCL-V4, TAU2-bench, SWE-bench Verified, Claw-Eval и PinchBench.

В то же время Ling-2.6-flash поддерживает отличные показатели по таким параметрам, как общие знания, математические рассуждения, выполнение инструкций и анализ длинного текста.

Что касается цен на API, Ling-2.6-flash стоит 0,1 доллара США за миллион токенов на входе и 0,3 доллара США на выходе.В настоящее время API Ling-2.6-flash официально открыт для пользователей, и предоставляется недельная бесплатная пробная версия с ограниченным сроком действия.

Пользователи могут получить соответствующие услуги через OpenRouter и Bailing big model tbox. Предполагается, что впоследствии эта модель будет выпущена коммерческая версия LingDT через Ant Digital для обслуживания глобальных разработчиков, а также малых и средних предприятий.