OpenAI y Google, acusados de utilizar vídeos de YouTube para alimentar sus modelos de IA

La llegada de la inteligencia artificial está suponiendo un gran avance para ciertas áreas, pero también ha causado grandes polémicas en cuanto a su regulación. En este caso, OpenAI está en el punto de mira por su herramienta de IA, y es que la empresa ha utilizado su herramienta de reconocimiento de voz Whisper para transcribir millones de vídeos de YouTube, que en total suman más de un millón de euros. Tal como señaló The New York Times, las transcripciones se introdujeron en el modelo de la marca de GPT-4 conocido mundialmente por su gran capacidad de generar textos.

Si bien esta práctica demuestra la avanzada capacidad de la herramienta, está considerada como posible violación de los derechos de autor de los creadores y es que, según las políticas de YouTube, está completamente prohibido realizar transcripciones o descargas no autorizadas de contenidos.

Y es que esta no sería la primera vez que OpenAI se vería en un disputa legal, puesto que, anteriormente The New York Times también había acusado a la empresa de infringir los derechos de autor por utilizar millones de sus artículos para entrenar grandes modelos lingüísticos sin ningún tipo de permiso. Es así como, este nuevo informe sobre los vídeos de YouTube despierta otra gran batalla que luchar.

Google al tanto de la situación

Así también, tal y como señalan desde el medio anteriormente mencionado, Google al parecer estaba al tanto de las acciones que estaba llevando a cabo OpenAI. Sin embargo, decidió no intervenir porque estaba utilizando vídeos de YouTube para entrenar a sus propios modelos de IA. Además, se dice que los conjuntos de datos no solo contienen contenidos de YouTube sino también de otros datos de Google Docs y Google Sheets. 

Por su parte, Google ya había tratado esta disputa el pasado junio de 2023 cuando revisó su política de privacidad para ampliar el alcance de su uso de contenidos disponibles públicamente, incluido el entrenamiento de su modelo de lenguaje Bard. Dichos cambios que entraron en vigor tan solo un mes después estuvieron expuestos por la empresa como un avance en la aclaración de sus prácticas, afirmando que cualquier uso de datos para el entrenamiento de IA se lleva a cabo siempre desde el consentimiento de los usuarios que deciden participar en las funciones experimentales.

A pesar de las garantías que presentaba el gigante tecnológico, al momento de actualizarse la política de privacidad se ha despertado una gran incertidumbre al producirse en medio de las acusaciones de uso generalizado de contenidos de YouTube para entrenar modelos de IA.

Por su parte, Google y OpenAI todavía no se han pronunciado respecto a las acusaciones de la revelación porque lo que se espera que próximamente se dé a conocer la postura de cada empresa, así como las medidas oportunas frente a la problemática.

Valeria Rodriguez

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *