OpenAI случайно удалила важные данные, связанные с иском об авторских правах к The New York Times, во время продолжающегося судебного разбирательства по искам о нарушении авторских прав. Инцидент касался данных из выделенных виртуальных машин, предоставленных истцам, что OpenAI признала суду в недавнем заявлении. В результате адвокаты Times заявили, что потеряли недельную работу, связанную с этим делом.
OpenAI сталкивается с проблемой потери данных в судебном процессе с The New York Times
Согласно письмо из ТаймсКоманда юристов заявила, что эта потеря данных потребовала «целой недели работы экспертов и юристов» и была «безвозвратно утеряна». Истцы расследовали утверждения о том, что модели OpenAI были обучены на несанкционированном контенте. В рамках этого процесса они собрали данные за 150 часов интенсивного исследования наборов обучающих данных OpenAI, в частности, в поисках случаев нарушения авторских прав. Отчет от TechCrunch указал, что удаление произошло 14 ноября, когда «программы и данные результатов поиска, хранящиеся на одной из выделенных виртуальных машин, были стерты инженерами OpenAI».
суть иска утверждается что OpenAI вместе с Microsoft — ее партнером, использующим технологию OpenAI для своего чат-бота Bing AI — нарушили авторские права The New York Times, используя платный контент без разрешения. The Times утверждает, что модели OpenAI создали «почти дословные» копии ее статей, что является аргументом в пользу возмещения ущерба. OpenAI последовательно опровергала эти обвинения, утверждая, что ее обучение было основано на общедоступных данных, что квалифицируется как добросовестное использование в соответствии с законами об авторском праве.
Представитель OpenAI назвал инцидент «сбоем». При этом им удалось успешно восстановить большую часть удаленных данных, а критические элементы, включая «структуру папок и имена файлов», остаются утерянными и, следовательно, непригодными для использования. В результате перед адвокатами Times теперь стоит задача возобновить сбор доказательств с нуля. Несмотря на обстоятельства, они сообщили, что у них «нет оснований верить». [the erasure] было намеренным», подчеркнув, что OpenAI лучше всего подходит для поиска в своих наборах данных. Тем не менее, они также отметили нежелание компании раскрывать подробности о своих данных по обучению.

Ситуация еще больше усложняется тем, что аналогичные претензии по авторским правам были предъявлены OpenAI. Недавний иск Raw Story и AlterNet против компании был отклонен, поскольку истцы не смогли предоставить достаточные доказательства ущерба, связанного с их обвинениями. В отличие, Нью-Йорк Таймс как сообщается, инвестировала более 1 миллиона долларов в судебные издержки для ведения дела против OpenAI. Это финансовое обязательство иллюстрирует особые трудности, с которыми сталкиваются небольшие издатели при конкуренции с высокотехнологичными компаниями.
OpenAI, с другой стороны, недавно заключила лицензионные соглашения с несколькими крупными медиакомпаниями, разрешая использовать их контент для обучения своих моделей искусственного интеллекта, обеспечивая тем самым компенсацию и кредит. Отчеты показывают, что OpenAI платит издательскому гиганту Dotdash Meredith не менее 16 миллионов долларов ежегодно за лицензионные права, что отражает ее стратегию поиска официальных партнерских отношений, а не постоянных судебных разбирательств.
Изображение предоставлено: Фуркан Демиркая/Идеограмма
Статья The New York Times Юридическая проблема усугубляется, поскольку OpenAI случайно удаляет важные данные, впервые появившиеся на TechBriefly.
Source: Юридическая проблема New York Times усугубляется, поскольку OpenAI случайно удаляет важные данные





