Tribuna
Por
Los datos: el maná de la inteligencia artificial
El maná que necesita la IA para ser y crecer no cae del cielo necesariamente y puede ser -generalmente será- un bien jurídico con titular y sujeto a derechos y restricciones que limitan su tráfico
La inteligencia artificial ha tenido varias fases. Sin entrar en particulares podría decirse que la primera se inicia en los años 50 y se centra en la representación del conocimiento mediante símbolos. Siguió la segunda que introduce el aprendizaje automático mediante algoritmos y modelos (Machine Learning). Y con las redes neuronales artificiales y el Deep Learning (esencial para el reconocimiento de imágenes y el procesamiento del lenguaje natural) llegamos al hito que de alguna forma ha marcado el momento actual: la llegada de IAs como ChatGPT.
Recordemos: la llegada de ChatGPT sucedió a finales de 2022 y en apenas dos meses logró 100 millones de usuarios activos. Hace apenas otros dos meses se informó que estaba ya por 200 millones de usuarios semanales y que el 92% de las empresas Fortune 500 utilizan sus productos. Es la aplicación de internet con el crecimiento más rápido de la historia.
Pero: ¿De qué se alimenta la Inteligencia Artificial para crecer tan rápido?
La respuesta es sencilla: de datos.
Esto nos lleva a dos reflexiones. La primera es que no habría sido posible un florecimiento tan vertiginoso como el actual en un momento anterior. Este nuevo paso evolutivo (o involutivo, según se mire) llega en una época en la que se generan casi 200 millones de Zetabytes en datos en el mundo, 5 veces más que hace 7 años; y en el que la economía de los datos se estima en casi el 6% del PIB europeo (y parece poco). Los datos se generan en interacciones online pero también mediante la sensorización y dispositivos que miden la actividad offline. Los propios productos que se comercializan en todos los ámbitos generan cada vez más datos (IoT). Se han generado más datos en los últimos dos años que en el resto de la historia. Eso, unido a la infinita capacidad de almacenamiento a bajo coste y la veloz capacidad de procesamiento explica que la vida, a día de hoy, esté prácticamente, digitalizada.
En otras palabras: en 2024 el mundo es ya casi por completo información representada simbólicamente en forma computable. Y la IA tiene acceso a esa información para aprender y decidir. Es, por decirlo de alguna forma, su maná, su sangre, su gasolina.
Hablemos ahora de ese maná, pues ya sabemos que son datos y que son muchos y están en todos lados. Pero cabe -y uno debe- preguntarse: ¿puede la IA usarlos sin más?
La respuesta es relativamente sencilla: depende.
En primer lugar, podría hacerlo para realizar minería de datos, es decir para generar información que incluya pautas, tendencias o correlaciones. La ley se lo permite, pero solo para esa finalidad específica y siempre que el titular de los datos no se oponga y, se discute, que sea un proceso automatizado (no supervisado por humanos). Es decir que si la IA en cuestión quiere usar los datos para otro fin (o sin cumplir con los requisitos expuestos) tendrá que valorar si puede hacerlo.
Y que pueda, en ese caso, dependerá de muchos factores. Dependerá, por ejemplo, de que los datos sean o no una obra creativa protegida por la ley de propiedad intelectual. Recordemos que existe una sentencia, INFOPAQ, que dice que la elección, secuencia y combinación de 11 palabras puede constituir una obra creativa. Es decir, un comentario de Facebook o una review de Amazon podrían serlo. Pero dependerá también de que los datos constituyan o no una base de datos. Y si la constituyen de que, por la selección o disposición de sus contenidos, constituyan creaciones intelectuales. O si no son creaciones intelectuales, de que el creador de la base de datos no haya hecho una inversión sustancial en la misma que merezca protección jurídica. Ojo, también dependerá de que los datos no puedan llegar a ser un secreto comercial. Si los datos en cuestión son secretos, tienen un valor comercial por su carácter secreto y han sido objeto de medidas razonables para mantenerlos secretos, gozarían de ciertas protecciones. En todos los casos anteriores, la ley predispone que será necesaria la autorización del titular de los datos para su uso.
Pero la cosa no acaba ahí: la posibilidad de utilizar los datos también va a depender de lo que vaya a hacer la IA con esa información y que no contravenga la normativa de competencia deseal: si el uso que hace brinda a la empresa detrás de la IA una ventaja competitiva objetivamente contraria a las exigencias de la buena fe, por ejemplo facilitando un aprovechamiento indebido de del esfuerzo ajeno, podría ser un acto de competencia desleal.
Finalmente, aunque no se dé nada de lo expuesto, el uso de los datos puede estar restringido contractualmente. La sentencia de Ryanair del Tribunal de Justicia de la Unión Europea de 2015 ratificó algo que parecía evidente: es válido poner restricciones contractuales al uso de los datos. Eso hace que, aunque haya datos que no sean una manifestación creativa que goce de protección, ni una base de datos en la que se ha hecho una inversión sustancial, ni un secreto, ni su uso sea desleal, habrá que analizar si existen unos términos legales a los que el uso de la información esté sujeto, si son oponibles a la empresa detrás de la IA que pretende usarlos y, por último, si restringen su uso.
Por lo tanto, que una IA pueda o no usar los datos depende, en cada caso, cuanto menos, de muchos factores. Es decir que el maná que necesita la IA para ser y crecer no cae del cielo necesariamente y puede ser -generalmente será- un bien jurídico con titular y sujeto a derechos y restricciones que limitan su tráfico. Supongo que esto, intuitivamente por lo menos, ya se sabía. Pero ahora que ya le hemos puesto nombre a ese pensamiento intuitivo de que en este mundo no hay nada que alimente que sea gratuito, cabe preguntarse si se le pueden poner puertas al campo y si lo que acabamos de explicar frenará o no a la IA.
* Alexander Benalal, socio de Tecnología y Dispute Resolution de ThinkSmartLaw.
La inteligencia artificial ha tenido varias fases. Sin entrar en particulares podría decirse que la primera se inicia en los años 50 y se centra en la representación del conocimiento mediante símbolos. Siguió la segunda que introduce el aprendizaje automático mediante algoritmos y modelos (Machine Learning). Y con las redes neuronales artificiales y el Deep Learning (esencial para el reconocimiento de imágenes y el procesamiento del lenguaje natural) llegamos al hito que de alguna forma ha marcado el momento actual: la llegada de IAs como ChatGPT.