OpenAI выпускает набор инструментов для обеспечения безопасности молодежи с открытым исходным кодом, чтобы помочь разработчикам создавать более безопасные приложения ИИ

OpenAI объявила во вторник о выпуске ориентированного на молодежь набора инструментов для разработчиков политики безопасности, призванного помочь сторонним приложениям включать правила безопасности для защиты несовершеннолетних с самого начала их разработки. Инструментарий доступен в виде набора подсказок «Политика безопасности молодежи», которые можно напрямую вызывать, и его можно использовать с взвешенной моделью безопасности OpenAI gpt-oss-safeguard с открытым исходным кодом.

В OpenAI заявили, что разработчикам не нужно начинать с нуля разработку механизмов безопасности для несовершеннолетних, и они могут напрямую использовать этот набор подсказок для «усиления» существующих или вновь разработанных приложений ИИ. Эти политики сосредоточены на чувствительных областях, таких как изображения насилия и порнографический контент, вредное изображение тела и поведение, рискованные действия и вызовы, романтические или жестокие ролевые игры, а также товары и услуги с возрастными ограничениями. Компания подчеркивает, что эти политики безопасности представлены в виде подсказок, поэтому их можно легко адаптировать к другим моделям, кроме gpt-oss-safeguard, но ожидается, что эффект будет лучше при использовании в собственной экосистеме OpenAI.

При разработке политики OpenAI сотрудничает с третьими сторонами в области безопасности молодежи и контента, в том числе с организацией по надзору за безопасностью ИИ Common Sense Media и Everything.ai. Робби Торни, руководитель отдела оценки искусственного интеллекта и цифровых технологий в Common Sense Media, заявил в своем заявлении, что эти оперативные, основанные на словах политики помогают установить значимый практический результат в области безопасности для всей экосистемы, а метод выпуска с открытым исходным кодом также позволяет всем сторонам постоянно корректировать и совершенствоваться с течением времени.

OpenAI отмечает в сопутствующем блоге, что даже опытным командам на практике часто сложно преобразовать абстрактные цели безопасности в конкретные, осуществимые правила. Компания считает, что такое отклонение может привести к лазейкам в мерах защиты, несогласованным стандартам реализации и даже чрезмерной блокировке, поэтому четкие и четко сформулированные политики являются ключевым фундаментом для построения эффективной системы безопасности.

OpenAI также признает, что этот набор политик не может фундаментально решить все сложные проблемы безопасности ИИ. Но компания подчеркнула, что новый инструмент представляет собой дальнейшее расширение существующих мер безопасности, включая родительский контроль на уровне продукта, прогнозирование возраста и другие функции. В 2025 году OpenAI обновила спецификацию поведения (Model Spec) своей большой языковой модели, чтобы уточнить, как модель должна реагировать и ограничивать взаимодействие с пользователями младше 18 лет.

Тем не менее, OpenAI сталкивается с вопросами о своей собственной безопасности. В настоящее время компания сталкивается с многочисленными исками, поданными членами семей пользователей, которые покончили жизнь самоубийством после чрезмерного использования ChatGPT. В иске утверждается, что некоторые опасные отношения возникли после того, как пользователи обходили систему безопасности чат-бота, и что ни одна из нынешних моделей защиты не является по-настоящему «непробиваемой». На этом фоне в отрасли в целом считают, что, хотя эта подсказка о политике безопасности молодежи с открытым исходным кодом не является окончательным решением, она обеспечивает относительно простой в использовании путь соблюдения требований для независимых разработчиков и небольших команд и рассматривается как новый шаг вперед в продвижении практики безопасности ИИ для несовершеннолетних.

узнать больше:

https://github.com/openai/teen-safety-policy-pack