Сингапурская национальная инициатива по искусственному интеллекту (AISG) знаменует собой критический стратегический сдвиг.В своем последнем проекте большой модели языка Юго-Восточной Азии AISG отказалась от модели Meta и вместо этого приняла архитектуру с открытым исходным кодом Qwen от Alibaba. Этот выбор не только отражает пересмотр технического пути, но и знаменует собой важный шаг в расширении глобального влияния китайской модели искусственного интеллекта с открытым исходным кодом.

25 ноября AISG выпустила модель «Qwen-SEA-LION-v4», основанную на архитектуре Qwen, которая быстро возглавила список с открытым исходным кодом, измеряющий уровень владения языком в Юго-Восточной Азии. Этот шаг направлен на решение проблемы языковой адаптации, которая уже давно беспокоит регион.Западные модели с открытым исходным кодом, представленные серией Llama от Meta, плохо работают при работе с региональными языками, такими как индонезийский, тайский и малайский, что серьезно ограничивает эффективность разработки локализованных приложений ИИ.

Хотя Llama имеет лидирующую производительность среди моделей с открытым исходным кодом, ее «англоориентированный» базовый дизайн трудно фундаментально изменить, и он крайне неэффективен при обработке нелатинских сценариев, таких как тайский и бирманский. AISG постепенно осознала, что полагаться на модели с открытым исходным кодом Кремниевой долины не является оптимальным решением для стран Юго-Восточной Азии, и ей необходимо искать базовые модели, которые действительно обладают возможностями понимания нескольких языков, особенно азиатских языковых контекстов.


На этом фоне AISG наконец обратила свое внимание на Китай и выбрала Qwen3-32B от Alibaba в качестве основы модели Sea-Lion нового поколения.

В отличие от западных моделей, Qwen3 на этапе предварительного обучения использует до 36 триллионов данных токенов, охватывая 119 языков и диалектов по всему миру.Эта «врожденная многоязычность» не только «распознает» индонезийские, малайские и другие иероглифы, но и понимает их грамматическую структуру снизу, что значительно снижает технический порог для последующего обучения AISG.

Чтобы лучше адаптироваться к уникальным письменным привычкам языков Юго-Восточной Азии, Qwen-Sea-Lion-v4 отказывается от «токенизатора предложений», обычно используемого в западных моделях, и вместо этого использует более продвинутый токенизатор кодирования пар байтов (BPE). Эта технология позволяет более точно сегментировать символы в языках без пробелов, таких как тайский и бирманский, что значительно повышает точность перевода и скорость рассуждения.

Помимо технологических преимуществ, ключом к успеху Alibaba также являются практические соображения по коммерческому внедрению. В Юго-Восточной Азии имеется большое количество малых и средних предприятий, которые не могут позволить себе дорогие кластеры графических процессоров H100.Оптимизированный Qwen-Sea-Lion-v4 может бесперебойно работать на ноутбуках потребительского уровня, оснащенных 32 ГБ памяти, что позволяет обычным разработчикам локально развертывать эту модель национального уровня. Эта особенность «возможностей промышленного уровня и порога потребительского уровня» точно соответствует проблеме нехватки вычислительных ресурсов в регионе.

Это сотрудничество представляет собой не односторонний выпуск технологий, а глубокую двустороннюю интеграцию. Согласно соглашению, Alibaba предоставляет мощную универсальную базу рассуждений, а AISG вносит свои очищенные 100 миллиардов токенов языков Юго-Восточной Азии. Эти данные полностью исключают риски, связанные с авторским правом, а концентрация контента из Юго-Восточной Азии достигает 13%, что в 26 раз больше, чем у Llama2.

В оценочном списке Sea-Helm Sea-Lion v4, оснащенный базовой технологией Alibaba, быстро возглавил список моделей с открытым исходным кодом того же масштаба, подтверждая техническую ценность и региональную адаптируемость этого стратегического сотрудничества.