Авторы обвинили NVIDIA в нарушении авторских прав в расширенном коллективном иске, поданном недавно, утверждая, что компания получила миллионы пиратских книг из Архива Анны для обучения искусственному интеллекту. В жалобе ссылаются на внутренние документы, свидетельствующие о том, что NVIDIA добивалась высокоскоростного доступа к данным теневой библиотеки. NVIDIA, производитель чипов, добился увеличения доходов от сектора искусственного интеллекта благодаря спросу на ее чипы для обучения ИИ и услуги центров обработки данных. Компания разрабатывает модели искусственного интеллекта, такие как NeMo, Retro-48B, InstructRetro и Megatron, обучаемые с использованием своего оборудования и обширных текстовых библиотек. Это судебное разбирательство последовало за предыдущими судебными исками, в которых авторы обвиняли технологические компании в обучении моделей ИИ на пиратских книгах. В начале 2024 года авторы подали в суд на NVIDIA, утверждая, что ее модели искусственного интеллекта были обучены на наборе данных Books3, который без разрешения включал защищенные авторским правом работы с сайта Bibliotik. NVIDIA защищала свои действия как добросовестное использование, заявляя, что книги служат статистическими корреляциями для ее моделей искусственного интеллекта. В ходе расследования истцы обнаружили дополнительные доказательства. В пятницу авторы подали измененную жалобу, которая расширила иск. Это обновление включало больше книг, авторов и моделей искусственного интеллекта, а также новые заявления о «теневой библиотеке». Авторы, в том числе Абди Наземян, цитировали внутренние электронные письма и документы NVIDIA, утверждая, что компания охотно загрузила миллионы книг, защищенных авторским правом. В жалобе утверждается, что «давление конкуренции подтолкнуло NVIDIA к пиратству», включая сотрудничество с Anna's Archive. Согласно измененной жалобе, член команды NVIDIA по стратегии данных связался с Anna's Archive, чтобы оценить предложения данных. В жалобе подробно описывается взаимодействие: «Отчаянно нуждаясь в книгах, NVIDIA связалась с «Архивом Анны» — крупнейшей и самой наглой из оставшихся теневых библиотек — по поводу приобретения миллионов пиратских материалов и «включения Архива Анны в данные предварительного обучения для наших студентов». «Архив Анны» взял десятки тысяч долларов за «высокоскоростной доступ» к своим пиратским коллекциям; NVIDIA исследовала особенности этого доступа. В жалобе говорится, что «Архив Анны» проинформировал NVIDIA о незаконном характере своей библиотеки. Затем пиратская библиотека спросила руководителей NVIDIA, было ли получено внутреннее разрешение на продолжение. Разрешение якобы было получено в течение недели, после чего «Архив Анны» предоставил доступ к своим пиратским книгам. «Через неделю после обращения в «Архив Анны» и через несколько дней после того, как «Архив Анны» получил предупреждение о незаконном характере своих коллекций, руководство NVIDIA дало «зеленый свет» на продолжение пиратства. Архив Анны предложил NVIDIA миллионы пиратских книг, защищенных авторским правом», — говорится в жалобе. Архив Анны обещал NVIDIA доступ примерно к 500 терабайтам данных, содержащих миллионы книг, которые обычно доступны через систему цифрового кредитования Интернет-архива, которая сама подверглась юридической проверке. В жалобе не уточняется, заплатила ли NVIDIA Архиву Анны за этот доступ. В жалобе утверждается, что помимо базы данных Books3 NVIDIA загружала книги из LibGen, Sci-Hub и Z-Library. Авторы также утверждают, что NVIDIA распространяет скрипты и инструменты, позволяющие корпоративным клиентам автоматически загружать The Pile, содержащий пиратский набор данных Books3. В этих исках выдвигаются обвинения в косвенном и сопутствующем нарушении прав, утверждая, что NVIDIA получала доход от клиентов за счет облегчения доступа к этим наборам данных. Авторы требуют компенсации ущерба, обращаясь к указанным авторам и, возможно, к сотням других лиц в коллективном иске. Это первое публичное раскрытие переписки между крупной американской технологической компанией и «Архивом Анны», что потенциально повышает заметность пиратской библиотеки после недавней потери доменных имен. Копия первой объединенной и исправленной жалобы, поданной в Окружной суд США Северного округа Калифорнии, доступна в формате PDF. Среди названных авторов Абди Наземян, Брайан Кин, Стюарт О'Нан, Андре Дубус III и Сьюзен Орлеан.

  Плейлист Spotify в бутылке: как получить Spotify Time Capsule 2024

Source: Авторы обвиняют NVIDIA в массовом пиратстве в области обучения ИИ