Los canales de YouTube de Netflix Anime, Aniplex USA y GKIDS se encuentran entre los numerosos canales de YouTube cuyos videos han sido raspados por la empresa de inteligencia artificial Runway. 404 Media compartió una extensa hoja de cálculo redactada que detalla los canales de YouTube que la compañía utilizó para entrenar su herramienta de generación de videos de inteligencia artificial, a pesar de que esto va en contra de los Términos de Servicio de YouTube.
Además de estos, otros canales relacionados con el anime mencionados en el documento incluyen canales de recapitulación como Anime Recap Time, Recap-kun y AniClimax; así como ensayistas de video centrados en el anime como Mastar y Anime Philosopher. También se mencionan canales como Animenz Piano Sheets, Anime Luna, Utoi Anime Talk TV y Anime Select, que aparentemente fueron raspados, ya que sus canales estaban etiquetados con “anime”.
Se ha informado que la IA de Runway también raspó una página de Archive.org que presentaba varias películas de Studio Ghibli, así como varios sitios piratas incluidos Aniwave, Animesuge, 9Anime, Aniwatch y una iteración del ya desaparecido KissAnime. Un número de canales de animación independientes también se vio afectado.
Google había advertido previamente a OpenAI en contra de usar los videos de la plataforma para entrenar su modelo de inteligencia artificial Sora, afirmando que sería una infracción de los Términos de Servicio de la plataforma.
“Desde la perspectiva de un creador, cuando un creador sube su trabajo duro a nuestra plataforma, tiene ciertas expectativas. Una de esas expectativas es que se cumplirán los términos de servicio. No se permite descargar cosas como transcripciones o fragmentos de video, y eso es una clara violación de nuestros términos de servicio. Esas son las reglas básicas en términos de contenido en nuestra plataforma”, dijo el CEO de YouTube, Neil Mohan, a Bloomberg.
404 Media informa que un ex-empleado anónimo de Runway reveló que hubo un esfuerzo a nivel de empresa para compilar información de videos en hojas de cálculo que serían utilizadas para el entrenamiento de IA. La empresa entonces descargó masivamente los videos utilizando herramientas de descarga de YouTube disponibles, específicamente YouTube-DL. También empleó un servicio proxy para evitar la detección por parte de YouTube al descargar múltiples videos.
“Los canales en esa hoja de cálculo fueron un esfuerzo a nivel de empresa para encontrar videos de buena calidad para construir el modelo. Esto se utilizó luego como entrada para un enorme rastreador web que descargó todos los videos de todos esos canales, utilizando proxies para evitar ser bloqueados por Google”, dijo el ex-empleado a 404 Media.
Si bien aún no se ha verificado si se utilizaron los videos de todos estos canales para entrenar el modelo de IA de Runway, es importante señalar que los canales fueron categorizados bajo etiquetas, que podrían ser utilizadas como comandos cada vez que un usuario quiera generar un estilo específico de video de IA. Runway, que recaudó millones de dólares de patrocinadores como NVIDIA y Google el año pasado, no ha emitido un comunicado al respecto.