Nvidia enfrenta acusaciones de violación de derechos de autor al capacitar a los LLM de NeMo Megatron en varios libros – Tecnología
Escritores demandan a Nvidia por infracción de derechos de autor en su plataforma de IA NeMo Megatron
Un grupo de escritores ha presentado una demanda colectiva contra la empresa tecnológica Nvidia, acusándola de infringir sus derechos de autor al entrenar los modelos de lenguaje grande (LLM) que forman parte de su plataforma NeMo Megatron con sus obras. La plataforma NeMo es un conjunto de herramientas de Inteligencia Artificial (IA) conversacional diseñada para investigadores que trabajan en el reconocimiento automático de voz (ASR), procesamiento del lenguaje natural (NLP) y síntesis de texto a voz (TTS).
NeMo Megatron utiliza obras protegidas por derechos de autor en su entrenamiento
Abdi Nazemian, Brian Keene y Stewart O’Nan son tres de los escritores que han presentado la demanda, alegando que Nvidia utilizó sus obras protegidas por derechos de autor para entrenar la herramienta de IA NeMo Megatron. La demanda señala que la plataforma almacena sus LLM en el sitio web de la comunidad de IA, Hugging Face, que especifica los conjuntos de datos con los que los modelos han sido entrenados.
Uno de los conjuntos de datos utilizados es The Pile, desarrollado por EleutherAI, que a su vez contiene el archivo Books3. Este archivo, según la demanda, es en realidad una copia del rastreador Bibliotik, que combina libros de ficción y no ficción. El archivo Books3 comprende 108 GB de datos y 196,640 títulos, incluyendo obras de los demandantes, como ‘Like a Love Story’, de Nazemian; ‘Last Night at the Lobster’, de O’Nan; y ‘Ghost Walk’, de Keene.
Los demandantes nunca autorizaron a Nvidia a utilizar sus obras
La demanda sostiene que los escritores nunca dieron permiso a Nvidia para copiar, exhibir o distribuir públicamente sus obras, ya que los derechos de autor corresponden exclusivamente a los demandantes según la regulación de ‘copyright’ de Estados Unidos. A pesar de que Hugging Face eliminó en octubre de 2023 los repositorios en cuestión, Nvidia habría realizado varias copias de las obras infractoras durante el entrenamiento de su plataforma NeMo.
Como resultado, los autores han sido perjudicados por los actos de infracción directa de derechos de autor por parte de Nvidia y, por lo tanto, tienen derecho a una indemnización por daños y perjuicios legales, daños reales, restitución de ganancias y otros recursos.
Frente a estas acusaciones, presentadas en el Distrito Norte de California (Estados Unidos), Nvidia ha afirmado que su plataforma de IA NeMo fue creada cumpliendo con la ley de derechos de autor, según informa The Wall Street Journal.