¿Por qué YouTube se volvió una mina de oro para el desarrollo de la IA?
YouTube es la fuente de salvación de OpenAI y de Google. Esta plataforma, a través de sus videos, generan datos que alimenta a la data.
Google y OpenAI encontraron una nueva mina de oro para alimentar con datos sus herramientas que son impulsadas con Inteligencia Artificial (IA): YouTube. Esta plataforma alberga cientos de videos con suficientes datos que ayudarán a crear modelos de lenguaje de gran tamaño (LLM).
Así lo detalló The New York Times. Es necesario recordar que este medio demandó a la empresa de Sam Altman en diciembre de 2023, la acusa de utilizar su contenido para alimentar ChatGPT con textos creados por sus periodistas.
La demanda no incluye una cifra de dinero exacta, pero la casa editorial afirmó que afirma que los demandados deberían ser responsabilizados por “miles de millones de dólares en daños y perjuicios legales“.
En un giro inesperado de que continúa la historia The New York Times encontró que la misma compañía a la que demandó y Google están usando de forma ilegal los contenidos de YouTube.
Elon Musk arremete contra OpenAI, ¿qué desató la rivalidad entre ambos gigantes?
¿Cómo es que los gigantes de la IA roban información de YouTube?
OpenAI, Google y Meta ignoraron las políticas corporativas, alteraron sus propias reglas y discutieron eludir la ley de derechos de autor mientras buscaban información en línea. Esto con el objetivo de entrenar sus sistemas de inteligencia artificial más nuevos, según el artículo.
A finales de 2021, OpenAI enfrentó un problema de suministro. El laboratorio de inteligencia artificial había agotado todas las reservas de textos confiables en inglés en internet para alimentar sus bases de datos.
En ese momento algunos investigadores de esta empresa crearon una herramienta de reconocimiento de voz llamada Whisper que transcribió el audio de vídeos de YouTube. Esto brindó recursos a ChatGPT, su principal herramienta.
Google tomó el mismo camino, según cinco personas con conocimiento de las prácticas de la empresa. Eso violó los derechos de autor de los videos, que pertenecen a sus creadores.
¿Cuál es la postura de YouTube respecto al robo de sus datos?
Neal Mohan, director ejecutivo de YouTube, dijo que no tenía conocimiento de primera mano de si OpenAI había utilizado videos de su plataforma. Pero mencionó que, si ese fuera el caso, sería una clara violación. de los términos de uso.
“Desde la perspectiva de un creador, cuando un creador sube su arduo trabajo a nuestra plataforma, tiene ciertas expectativas. Una de esas expectativas es que se respeten los términos de servicio”,
Esto significa que no se descarguen cosas como transcripciones o fragmentos de video para uso de terceros.
Añadió que Google se adhiere a los contratos individuales de YouTube con los creadores antes de decidir si utiliza videos de la plataforma para entrenar a Gemini.
“Muchos creadores tienen diferentes tipos de contratos de licencia en términos de su contenido en nuestra plataforma. Una parte de ese corpus de YouTube tal vez se esté usando para entrenar modelos como Gemini, Google y YouTube”.