Недавно зарубежные СМИ сообщили, что Bytedance использовала технологию OpenAI для разработки собственной большой языковой модели, что нарушало условия обслуживания OpenAI. В ответ ответственное лицо ByteDance заявило, что при использовании сервисов, связанных с OpenAI, компания подчеркивает, что должна соблюдать свои условия использования. Мы также находимся в контакте с OpenAI, чтобы прояснить возможные недоразумения, вызванные внешними отчетами.

Ниже приводится введение в использование ByteDance сервисов OpenAI:

1. В начале этого года, когда техническая группа впервые приступила к изучению большой модели, некоторые инженеры применили API-сервисы GPT для экспериментальных исследований проектов на меньших моделях. Эта модель предназначена только для тестирования, выход в интернет не планируется и она никогда не использовалась внешне. Эта практика была прекращена после того, как в апреле компания представила проверку спецификации вызовов API GPT.

2. Еще в апреле этого года команда Byte Big Model выдвинула четкие внутренние требования не добавлять данные, сгенерированные моделью GPT, в набор обучающих данных Byte Big Model, а также обучить команду инженеров соблюдать условия обслуживания при использовании GPT.

В марте и сентябре компания провела очередной раунд внутренних проверок и приняла меры для дальнейшего обеспечения соответствия вызовов API к GPT нормативным требованиям. Например, пакетная выборка проверяет сходство между выходными результатами модели и GPT, чтобы аннотаторы данных не могли использовать GPT в частном порядке.

4. В ближайшие дни мы снова проведем комплексную проверку на предмет строгого соблюдения условий использования соответствующих сервисов.