Новости

Какие ваши доказательства: Nvidia отринула обвинения в обучении ИИ на пиратских книгах

Компания Nvidia отвергла утверждения о том, что она обучала модели ИИ на пиратских книгах. Юристы компании в федеральном суде Калифорнии заявили, что предполагаемые контакты Nvidia с библиотекой пиратского сайта Anna’s Archive не являются доказательством нарушения авторских прав.

В ходатайстве об отклонении иска, поданном 29 января, компания утверждает, что авторы дела «Nazemian против Nvidia» не смогли убедительно доказать, что их конкретные работы были загружены или использованы в обучении ИИ-моделей Nvidia, несмотря на расширение жалобы истцов за счёт включения новых предположений и наборов данных.

Дело было возбуждено в начале 2024 года и рассматривалось в Северном округе Калифорнии. Оно касается утверждений о том, что инструменты ИИ и эталонные модели Nvidia обучались на книгах, защищённых авторским правом и полученных из так называемых «теневых библиотек», включая Anna’s Archive и Books3. В изменённой жалобе истцов упоминаются внутренние обсуждения, в ходе которых сотрудники Nvidia якобы пытались получить подтверждение доступа к Anna’s Archive. Истцы утверждают, что это является доказательством незаконного использования.

В своём ходатайстве об отклонении иска Nvidia утверждает, что в изменённом исковом заявлении отсутствуют даже самые основные элементы, необходимые для предъявления иска о нарушении авторских прав. Согласно заявлению компании, истцы «не приводят фактов, свидетельствующих о том, что Nvidia скопировала какие-либо из их защищённых авторским правом произведений, когда такое копирование имело место или какие модели Nvidia предположительно содержат эти произведения». Компания заявляет, что без этих деталей иски носят исключительно спекулятивный характер.

Обращаясь непосредственно к обвинениям, связанным с репозиторием пиратских книг Anna’s Archive, Nvidia заявляет, что, хотя заявитель описывает внутренние обсуждения и запросы о потенциальном доступе к сайту, он не утверждает, что Nvidia фактически получила или скачала какие-либо произведения истцов. В ходатайстве также утверждается, что обсуждение или оценка возможных источников данных не равнозначны копированию материалов, защищённых авторским правом, и что закон об авторском праве требует от истцов излагать факты, свидетельствующие о воспроизведении защищённых произведений. «Равновероятно, что Nvidia не [получала доступа к произведениям истцов]», — говорится в ходатайстве.

Nvidia, не стесняясь в выражениях, также критикует истцов за то, что они полагаются на утверждения, сделанные «на основании разговоров и убеждений». Компания заявляет, что таким образом истцы неправомерно пытаются использовать процесс раскрытия информации в качестве основы искового заявления. В своём ходатайстве Nvidia напоминает суду, что истцы по делам о нарушении авторских прав должны заявлять о нарушении до начала процесса раскрытия информации, а не полагаться на него для определения того, произошло ли нарушение вообще, что, по-видимому, пытаются сделать истцы в данном случае.

Nvidia также стремится сузить рамки дела, оспаривая включение информации о дополнительных наборах данных и моделях, таких как Megatron 345M, добавленных в изменённое исковое заявление. Компания утверждает, что истцы неправомерно объединяют в одном деле несколько моделей и инструментов, не объясняя при этом, как та или иная модель обучалась на их работах. В нескольких случаях Nvidia ссылается на свою собственную общедоступную документацию, чтобы доказать, что предположения истцов о данных для обучения противоречат общедоступным источникам.

В изменённом иске также выдвигается теория вторичной ответственности, связанная с фреймворком Nvidia NeMo Megatron и его поддержкой загрузки больших общедоступных наборов данных, таких как The Pile. Nvidia отвечает, что в иске не утверждается о прямом нарушении авторских прав какой-либо третьей стороной, что необходимо для обоснования претензий о соучастии или косвенном нарушении авторских прав. Компания утверждает, что предоставление необязательных инструментов не устанавливает ответственности при отсутствии конкретных утверждений о том, что пользователи нарушили авторские права, используя эти инструменты.

Слушание по ходатайству об отклонении иска назначено на 2 апреля 2026 года в Окружном суде США Северного округа Калифорнии.

Источник