Gracenote, принадлежащая Nielsen, подает в суд на OpenAI за предполагаемое нарушение прав при получении медиа-метаданных

Gracenote, компания, предоставляющая услуги идентификации метаданных и контента, принадлежащая Nielsen, подала иск против OpenAI в Федеральный суд США по Южному округу Нью-Йорка, обвинив компанию, занимающуюся искусственным интеллектом, в сканировании и использовании ее базы данных медиа-метаданных и уникальной структуры ассоциации данных в больших масштабах без разрешения и без уплаты каких-либо сборов для обучения больших языковых моделей, которые поддерживают коммерческие продукты, такие как ChatGPT, что представляет собой серьезное нарушение авторских прав и ставит под угрозу ее основной бизнес.

В жалобе компания Gracenote заявила, что на протяжении многих лет она использовала сотни редакторов для ручного редактирования и аннотирования фильмов, телевидения, музыки и спортивного контента по всему миру, а также создала «базу данных программ», которая включает в себя введение в программы, описания видеофункций, уникальные идентификаторы контента и сложные графики взаимосвязей, а также завершила регистрацию в Бюро регистрации авторских прав США. Компания считает, что эта база данных не только содержит определенный текстовый контент, но также включает в себя собственную структурную конструкцию для классификации, связывания и организации различных работ. Эта «структура взаимоотношений» является важным источником ценности услуг для корпоративных клиентов, таких как платформы потокового мультимедиа и производители смарт-телевизоров.

В жалобе говорится, что OpenAI просканировал и ассимилировал вышеуказанные данные без разрешения, а когда пользователи задавали вопросы через ChatGPT, он выдавал описание, которое было очень похоже или даже полностью соответствовало описанию программы Gracenote, почти дословно. Примеры, предоставленные Gracenote, включают ситуацию, когда пользователь попросил ChatGPT описать популярный сериал «Игра престолов», и модель предоставила почти идентичный контент версии, написанной редакторами Gracenote. Компания также сообщила, что несколько версий ChatGPT могли воспроизводить большие фрагменты описаний программ в ее базе данных с очень небольшим количеством подсказок, что указывает на то, что соответствующий текст и его базовая организационная структура были напрямую скопированы и встроены в модель.

Gracenote предположила, что несанкционированное использование OpenAI своих метаданных и реляционной структуры не только нарушает защищенные авторским правом тексты и структуры баз данных, но также предоставляет распространителям медиаконтента и производителям оборудования возможность создавать альтернативные службы метаданных на основе «бесплатно сканируемых данных», тем самым напрямую ослабляя рыночную конкурентоспособность аналогичных продуктов Gracenote. В жалобе предупреждается, что, если такое поведение невозможно остановить и исправить, производители терминалов, таких как смарт-телевизоры, могут полагаться на данные, «обратно полученные» из моделей искусственного интеллекта, для создания собственных платформ метаданных, конкурирующих с Gracenote, без необходимости платить какие-либо лицензионные сборы.

Что касается претензий, Gracenote опирается на тот факт, что ее база данных зарегистрирована в Бюро авторских прав США, и помимо требования компенсации за фактические убытки, она также требует возмещения установленных законом убытков в связи с продолжающимся и крупномасштабным нарушением авторских прав. Так называемые законные убытки представляют собой фиксированную или диапазонную сумму, заранее определенную законом для конкретных видов нарушений авторских прав, тогда как фактические убытки используются для компенсации правообладателю фактических экономических потерь, понесенных в результате нарушения авторских прав.

В ответ на интервью Axios представитель OpenAI заявил, что ее модели «способствуют инновациям», обучены на «общедоступных данных» и поддерживаются «добросовестным использованием». Многие компании, занимающиеся искусственным интеллектом, в том числе OpenAI, последовательно заявляют, что модели обучения путем сканирования общедоступного интернет-контента соответствуют определению добросовестного использования в соответствии с действующим законодательством США об авторском праве на том основании, что эти данные могут предоставить пользователям новые и полезные услуги и информацию после преобразования с помощью модели.

Еще одна причина, по которой иск Gracenote привлекает внимание, заключается в том, что компания всегда была открыта для сотрудничества с компаниями, занимающимися искусственным интеллектом, и заключила множество соглашений о лицензировании данных, связанных с искусственным интеллектом, с Samsung, Google и другими компаниями. В жалобе Gracenote заявила, что она много раз обращалась в OpenAI для обсуждения вопросов лицензирования, но ей «неоднократно отказывали или игнорировали в течение длительного периода времени», и поэтому ей пришлось прибегнуть к судебному разбирательству для защиты своих прав и интересов. Генеральный директор компании Джаред Грусд подчеркнул в своем заявлении, что «Поддержка развития искусственного интеллекта и противодействие воровству не являются противоречивыми понятиями. Это единственный путь к устойчивому развитию отрасли», заявив, что иск направлен на защиту этого будущего.

Юристы полагают, что, поскольку многочисленные споры об авторских правах между медиа- и информационными компаниями и компаниями, занимающимися искусственным интеллектом, ожидают решения суда, это дело, вероятно, станет важным ориентиром для судей, чтобы выяснить, могут ли «нетрадиционные произведения», такие как структуры баз данных и карты ассоциаций метаданных, получить защиту авторских прав, и как определить «границы добросовестного использования больших моделей». В своей жалобе Gracenote подчеркнула, что большая часть контента, выдаваемого OpenAI, «почти идентична» метаданным, которые компания лицензирует своим клиентам. Таким образом, он не извлекает новую информацию, а представляет собой существенную копию существующего контента. Это станет одним из ключевых спорных моментов, отличающих это дело от других дел об авторском праве на ИИ.