JetBrains недавно объявила, что Mellum2, ее модель машинного обучения следующего поколения для систем разработки программного обеспечения, официально открыта. Прошло чуть больше года с тех пор, как в 2025 году компания открыла исходный код своей первой модели Mellum. В то время Mellum представляла собой небольшую модель, ориентированную на завершение кода, с размером параметров около 4 миллиардов. Для сравнения, общее количество параметров Mellum2 выросло до 12 миллиардов.Однако JetBrains подчеркивает, что благодаря использованию разреженной архитектуры Mixture-of-Experts (MoE) каждый токен фактически участвует в вычислении только около 2,5 миллиардов активных параметров, поэтому он по-прежнему может поддерживать высокую скорость вывода на стандартном оборудовании.

В отличие от «ориентированного» Mellum, который выполняет только задачи по дополнению кода в редакторе, Mellum2 позиционируется как полноценный интеллектуальный помощник по кодированию. Он может генерировать и редактировать код, вызывать внешние инструменты, выполнять многоэтапные «агентские» рабочие процессы, поддерживать длинные разговоры и иметь возможности явного рассуждения. Разработчики могут использовать базовые модели, настроенные на основе директив и модели Think Edition под лицензией Apache 2.0, чтобы сохранять полный контроль над своими данными при создании продуктов или внутренних инструментов.
Что касается технических характеристик, Mellum2 имеет существенные изменения во многих ключевых индикаторах по сравнению с Mellum первого поколения: в оригинальном Mellum использовался плотный дизайн параметров, а Mellum2 перешел на архитектуру MoE; общее количество параметров увеличилось с 4 миллиардов до 12 миллиардов, но активных параметров упало с 4 миллиардов до 2,5 миллиардов; контекстное окно значительно увеличилось с 8192 токенов до 131072 токенов, что делает его более подходящим для обработки длинных документов и сложных инженерных сценариев; оба поколения моделей используют лицензию Apache 2.0 с открытым исходным кодом.
В JetBrains заявили, что Mellum2 особенно подходит для маршрутизации и оркестрации сложных рабочих нагрузок ИИ, построения конвейеров с расширенной генерацией данных (RAG) с малой задержкой, обеспечения быстрой поддержки вывода для субагентов в больших системах и развертывания ИИ в локальных или частных средах. Чтобы еще больше повысить эффективность модели в профессиональных областях, таких как программирование и математика, на этапе предварительного обучения команда приняла трехэтапный «курс» данных, постепенно переходя от разнообразных веб-данных к более тщательно проверенному коду и математическому контенту.
Помимо Mellum2, JetBrains также объявила о корректировке линейки продуктов: компания прекратит поддержку DataSpell, своей IDE для обработки данных для разработчиков Python. Согласно официальной информации, 28 мая DataSpell был официально «выведен из эксплуатации», а соответствующие функции обработки данных будут интегрированы в профессиональную версию PyCharm. Существующие активные подписки DataSpell будут автоматически конвертированы в PyCharm Pro 1 сентября 2026 г.