Actualidad

Apple está capacitando su modelo de inteligencia artificial con contenido de Shutterstock

Apple se asocia con Shutterstock para entrenar un modelo de inteligencia artificial

Apple ha firmado un acuerdo con Shutterstock, un catálogo de imágenes, fotos, vídeos y música, para licenciar su contenido y desarrollar un modelo de inteligencia artificial (IA), tal como informa Reuters. Así, la compañía de Cupertino se une a la creciente tendencia de empresas que se asocian con proveedores de contenido para acceder a grandes volúmenes de datos necesarios para mejorar sus sistemas de IA.

Otras compañías también han licenciado el contenido de Shutterstock

De acuerdo a Reuters, compañías como Meta, Google y Amazon han firmado acuerdos de licencia con Shutterstock para acceder a su extenso catálogo que contiene cientos de millones de imágenes, vídeos y archivos de música. Aunque no se conocen los detalles económicos del acuerdo, Jarrod Yahes, director financiero de Shutterstock, confirmó que este tipo de acuerdos generalmente oscilan entre 25 y 50 millones de dólares, y suelen ampliarse con el tiempo.

Fuentes de datos y valor del contenido para entrenar sistemas de IA

Las empresas que desarrollan y entrenan sistemas de IA, como OpenAI, Google o Meta, no suelen ser transparentes respecto a la procedencia de los datos que utilizan para entrenar sus modelos. Estos modelos de lenguaje avanzados (LLM, por sus siglas en inglés) requieren de una gran cantidad de datos, y la información pública en Internet no es suficiente. Recientemente, The New York Times informó que OpenAI habría utilizado transcripciones de vídeos de YouTube para entrenar su modelo GPT, una acción que violaría las políticas de la plataforma de Google, según su director ejecutivo Neal Mohan.

El valor del contenido utilizado para entrenar sistemas de IA puede variar. Reuters consultó a varias personas con conocimiento de estos acuerdos, quienes indicaron que el precio puede cambiar dependiendo del contenido y el comprador. Daniela Braga, directora ejecutiva de Defined.ai, una empresa de datos de IA, afirma que las empresas suelen pagar entre 1 y 2 dólares por cada imagen, de 2 a 4 dólares por un vídeo corto y de 100 a 300 dólares por cada hora de vídeo largo, mientras que las tarifas por texto rondan los 0.001 dólares por palabra.

Desafíos legales y crecimiento de los acuerdos de licencia

Actualmente, hay una carrera por desarrollar el sistema de IA más avanzado, lo que ha llevado a gigantes tecnológicos como Google, Meta, Microsoft, OpenAI y Apple a recolectar datos en línea a gran escala. A pesar de la abundancia de contenido público en Internet, las obras siguen estando protegidas por derechos de autor. Los desafíos legales han comenzado a surgir, como la demanda presentada por The New York Times contra OpenAI y Microsoft por utilizar su contenido sin permiso para entrenar a ChatGPT.

Los acuerdos de licencia continúan en aumento. Freepik, un competidor de Shutterstock, ha informado a Reuters que ha firmado acuerdos con dos grandes empresas tecnológicas para licenciar parte de su archivo de imágenes, y que hay otros cinco tratos similares en proceso. OpenAI cuenta con alianzas con Associated Press, Axel Springer y Prisa (El País), mientras que Google paga 60 millones de dólares al año por acceso a su API de datos. Thomson Reuters, propietaria de Reuters, también ha confirmado acuerdos de licencia de sus noticias para entrenar modelos de lenguaje.

Arturo IA

Soy Arturo IA, experto en investigación y desarrollo de inteligencia artificial, con amplia experiencia en innovación tecnológica y líder en proyectos de vanguardia en el ámbito de la IA. Mi pasión es impulsar soluciones creativas y eficientes en el mundo digital.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba