Es noticia
ChatGPT y la inteligencia artificial generativa: los retos jurídicos
  1. Jurídico
  2. Tribuna
Pedro del Rosal

Tribuna

Por
Ceyhun Necati Pehlivan

ChatGPT y la inteligencia artificial generativa: los retos jurídicos

El uso de ChatGPT y otras aplicaciones similares de inteligencia artificial generativa plantea nuevos retos tanto éticos como jurídicos

Foto: Foto: Reuters
Foto: Reuters

La inteligencia artificial (IA) generativa ya está cambiando nuestras vidas. Entre sus aplicaciones se cuenta con Dall-E que crea obras de arte o más recientemente ChatGPT, un chatbot basado en la IA. Entrenado con un enorme conjunto de datos, ChatGPT es capaz de proporcionar respuestas detalladas y convincentes (aunque no siempre correctas) a prácticamente cualquier pregunta, dando la impresión de ser una inteligencia real y similar a la humana.

Sus aplicaciones son prácticamente infinitas. Puede chatear, ofrecer opiniones, aportar ideas, responder a preguntas de investigación, explicar conceptos, redactar contenidos, realizar revisiones gramaticales, traducir, escribir códigos de software y mucho más. No cabe duda de que supone un punto de inflexión. Siendo gratuito para los usuarios finales, ChatGPT se convirtió rápidamente en la plataforma web con el ritmo de crecimiento más rápido de la historia, superando el millón de usuarios en sus primeros cinco días y los mil millones de visitas en un solo un mes.

No obstante, el uso de ChatGPT y otras aplicaciones similares a la IA generativa plantea nuevos retos tanto éticos como jurídicos. Entre estos últimos, mencionamos la posible vulneración de los derechos de propiedad intelectual y de protección de datos personales.

¿Entrenar a una IA vulnera derechos de IP?

Según sus propias palabras, ChatGPT fue entrenado con "aproximadamente 45 terabytes de texto de distintas fuentes, incluidos libros, artículos, sitios web y más... unos 45.000 millones de palabras en total". Cuando se utiliza una cifra tan elevada de datos para entrenar a una IA, es habitual obtener esos datos de Internet, muchas veces sin autorización de sus titulares. Inevitablemente, los procesos de entrenamiento también generan copias de las obras subyacentes. Esto ocurre, principalmente, porque los datos deben ser pre procesados para eliminar el "ruido" y la información irrelevante antes de ser utilizados. Esta copia no autorizada de contenidos de terceros podría vulnerar los derechos de autor (copyright).

Foto: Varios abogados utilizan esta herramienta con asiduidad. (EFE/WU Hao)

No obstante, todo depende de dónde se realice la copia. En la Unión Europea, utilizar tecnologías de "minería de textos y datos" en obras a las que se ha accedido legalmente está permitido por la Directiva sobre derechos de autor en el mercado único digital, siempre que el titular de los derechos no haya excluido expresamente su uso "de manera adecuada, como medios de lectura mecánica".

En Estados Unidos, donde OpenAI tiene su sede, generalmente se considera que dicha minería de textos y datos estaría permitida mediante la defensa de "uso justo" (fair use defense, en inglés) frente a una infracción de derechos de autor. Esta consideración se ha visto reforzada tras el caso Google Books, en el que se permitió a Google crear una biblioteca digital donde realizar búsquedas sin el permiso de los autores, sobre la base de que transformaba los libros en datos con fines de investigación. Sin embargo, no está claro que el mismo razonamiento aplique a la IA.

Tras la reciente decisión del Tribunal Supremo de Estados Unidos sobre Andy Warhol Foundation for the Visual Arts, es probable que los tribunales estadounidenses den menos importancia a que el output de la IA generativa se parezca a una obra protegida por derechos de autor y que en cambio se centren en la finalidad para la que se
utiliza dicho output para competir con la obra original. Los tribunales están enjuiciando actualmente varias demandas que deberían resolver esta cuestión. En estos casos, se alega que el entrenamiento de modelos de IA con obras de acceso público constituye una infracción de los derechos de autor.

Foto: Andy Warhol junto al cuador 'Princess Of Iran', en su estudio de Nueva York. (Getty/Graham Wood)

Con el objetivo de atraer inversiones en IA, los gobiernos están generando una especie de carrera a la baja en relación con la minería de textos y datos. Antes de lanzar un producto completamente entrenado a escala internacional, las empresas de IA pueden elegir los entornos normativos más favorables para entrenar (de forma lícita) sus modelos de IA con contenidos disponibles. Por tanto, cuanto más restrictivo sea el régimen nacional de acceso a los datos de entrenamiento, más difícil será que la tecnología de IA se desarrolle en ese país.

¿A quién pertenecen los contenidos creados por IA?

La protección de los derechos de autor en relación con las respuestas de ChatGPT y otros contenidos similares generados por la IA varía según el país. Por ejemplo, Reino Unido otorga protección de derechos de autor a las obras "generadas por ordenador" en las que no hay un autor humano, pero muchas otras jurisdicciones, como la estadounidense, exigen que el autor sea un humano para que surjan derechos de autor. Conforme al derecho europeo, la IA no puede poseer derechos de autor, ya que no puede ser reconocida como autora y no tiene personalidad jurídica que es un requisito previo para poseer activos intangibles.

En caso de que los derechos de propiedad intelectual subsistan en los contenidos generados por ChatGPT, estos son propiedad del usuario final. Los términos de uso de OpenAI son claros en este sentido: "Por medio de la presente, OpenAI te cede todos sus derechos, títulos e intereses sobre los contenidos generados. Esto significa que puedes utilizar los contenidos generados para cualquier fin, incluidos fines comerciales, como la venta o la publicación". No obstante, tal y como reconoce OpenAI en el mismo apartado, "El contenido generado puede no ser único... Otros usuarios también pueden hacer preguntas similares a las tuyas y obtener la misma respuesta. Las respuestas solicitadas por y generadas para otros usuarios no se considerarán tuyas".

Foto: Andy Warhol, acompañado de varios amigos, en El Quijote, el restaurante español junto al Chelsea Hotel. Foto: DAVID MCCABE/HOTEL CHELSEA Opinión
TE PUEDE INTERESAR
Sobre inspiraciones, originalidad y derechos de autor
Daniel Gutiérrez Bernardo

Con ello se establece un sistema claro de derechos de uso con un alcance amplio para todos los usuarios, pero deja sin valor la titularidad de la propiedad intelectual de cualquier contenido generado por ChatGPT.

¿Los contenidos generados por IA vulneran los derechos de IP?

Existe el riesgo de que los contenidos generados por ChatGPT no sean contenidos totalmente nuevos, sino que reproduzcan total o parcialmente obras existentes protegidas por derechos de autor. OpenAI parece estar cada vez más reactivo ante la reciente oleada de litigios relacionados con la IA generativa y las acusaciones de incumplimiento en relación con las entradas y contenidos generados por la IA.

Por ejemplo, en marzo de este año, la respuesta de ChatGPT al solicitar los primeros cuatro párrafos de una novela fue: "¡Claro! Aquí están los cuatro primeros párrafos...". En abril, la respuesta de ChatGPT a la misma pregunta fue: "No puedo reproducir ni proporcionar ningún contenido protegido por derechos de autor en su totalidad, incluidos extractos de novelas. Proporcionar contenido protegido por derechos de autor iría en contra de la política de uso de OpenAI e infringiría los derechos del autor original". No obstante, el mismo día, ChatGPT sí proporcionó toda la letra de varias canciones pop, por lo que puede que OpenAI tenga trabajo pendiente en este sentido.

OpenAI parece estar cada vez más reactivo ante la reciente oleada de litigios y acusaciones de incumplimiento por contenidos generados por IA

Otros contenidos ilegales generados por ChatGPT pueden ser más difíciles de detectar. Cuanto menor sea el número de entradas de datos en relación con cualquier tema, más probable será que el contenido generado reproduzca gran parte del material utilizado para generar la respuesta sobre ese tema. Por lo tanto, los usuarios deben ser prudentes al utilizar este tipo de herramientas.

ChatGPT y protección de datos personales

La posible vulneración de los derechos de propiedad intelectual no es el único reto jurídico que la IA generativa plantea. Tal y como comentamos, el entrenamiento de ChatGPT implica el tratamiento de grandes cantidades de datos personales. Muchos de estos datos personales quedan integrados en el modelo final. Para poder hacer esto, se debe informar a los afectados y contar con una base de legitimación de conformidad con el Reglamento europeo General de Protección de Datos (RGPD).

Esto no es solo un debate teórico. La Agencia Española de Protección de Datos (AEPD) ya ha iniciado de oficio actuaciones previas de investigación a OpenAI por un posible incumplimiento de la normativa de protección de datos. La AEPD aún no ha dado a conocer su decisión. Asimismo, a principios de abril, la autoridad italiana de protección de datos, el Garante, prohibió temporalmente el uso de ChatGPT en Italia por este motivo. Tras una serie de medidas adoptadas por OpenAI, como por ejemplo la publicación de una política de privacidad detallada o la aclaración de la base legitimadora, el Garante levantó la prohibición, al menos de momento.

Foto: Logo de ChatGPT. (Reuters/Dado Ruvic)

Al Garante también le preocupa que ChatGPT vulnere el principio de exactitud, ya que suele "alucinar" inventándose cosas. Se ha llegado a inventar hasta referencias académicas y citas legales y ha respondido con información falsa cuando se le ha presionado.

Por último, no está claro cómo OpenAI pretende cumplir con los derechos que el RGPD concede a los interesados, como el "derecho al olvido". Para cumplir con este derecho podría ser necesario eliminar los datos personales de los conjuntos de datos bajo los que se entrena ChatGPT y volver a entrenar el modelo con esos datos resultantes. ChatGPT tiene la última palabra en este artículo: "A medida que el campo de la IA generativa sigue avanzando, se plantean una miríada de complejidades legales que requieren una cuidadosa consideración y regulación para garantizar un uso responsable y ético de esta poderosa tecnología". ¿Sopa de letras insípida o análisis perspicaz? En cualquier caso, es probable que a partir de ahora veamos muchos más contenidos generados por la IA.

* Ceyhun Necati Pehlivan es abogado y counsel en Linklaters.

La inteligencia artificial (IA) generativa ya está cambiando nuestras vidas. Entre sus aplicaciones se cuenta con Dall-E que crea obras de arte o más recientemente ChatGPT, un chatbot basado en la IA. Entrenado con un enorme conjunto de datos, ChatGPT es capaz de proporcionar respuestas detalladas y convincentes (aunque no siempre correctas) a prácticamente cualquier pregunta, dando la impresión de ser una inteligencia real y similar a la humana.

Inteligencia Artificial
El redactor recomienda