Big Data: No son los rusos, es el big data. Blogs de Big Data

No son los rusos, es el big data

Me da la sensación de que hemos cambiado de enemigo, de los malvados rusos al terrible 'big data'. Alguien tiene que ser el responsable de la victoria de Trump, nunca el votante

Foto: Foto: Reuters.
Foto: Reuters.

“The goal is to turn data into information, and information into insight.” Carly Fiorina, exCEO de HP.

Febrero es un mes muy frío en Varsovia. En el de 2008, la temperatura media fue de 3 grados centígrados. Seco, muy seco; no cayó una sola gota de agua. Al norte de Londres, en Cambridge, no hacía mucho mejor. Pero Michal Kosinski tenía muy claro que sus intereses estaban allí, en el centro de psicometría de la universidad británica. Recibió con enorme ilusión su admisión en el programa de doctorado, uno de los de más difícil acceso del mundo. Mientras tanto, Barack Obama se preparaba para la nominación como candidato a la Casa Blanca, algo que conseguiría en junio.

En Cambridge, Kosinski conoció a David Stillwell, que llevaba algún tiempo trabajando sobre una 'app' que había lanzado para Facebook, MyPersonality. El objetivo de la 'app' era sencillo, y muy goloso para estudiantes de un doctorado de psicología: obtener la mayor información posible acerca de los rasgos de personalidad de los usuarios de Facebook, los famosos 'big five' que se resumen en las siglas OCEAN: 'Openness' (apertura al cambio), 'Conscientiousness' (responsabilidad), 'Extraversion' (extraversión, sociabilidad), 'Agreeableness' (cordialidad, afabilidad), y 'Neuroticism' (neuroticismo, inestabilidad emocional). No costaba nada intentarlo, era barato, y quizá algunos usuarios se animasen a utilizarlo. Y así, casi como en un juego, Kosinsky y Stillwell se encontraron con millones de respuestas y la mayor base de datos1 que jamás nadie pudo soñar en esa área.

Estamos ya en 2012 y Kosinski presenta los resultados de su investigación: con menos de 70 'likes' de Facebook, podía predecir el color de la piel de las personas, su orientación sexual, y, lo que resultará determinante, su sensibilidad política hacia el partido Demócrata o el Republicano. Por supuesto, sus hábitos de vida, su religión, su inteligencia, todo ello era accesible a través de la combinación de likes, OCEAN y el algoritmo que desarrollaron. 150 'likes' permitían al algoritmo saber de quien voluntariamente había cedido su intimidad más que sus propios padres, 300 más que su pareja.

Con menos de 70 'likes' podía predecir el color de la piel, su orientación sexual y su sensibilidad política hacia el partido Demócrata o el Republicano

Si algo caracterizó la segunda campaña de Barack Obama fue la altísima inversión en tecnología. En 2008 su equipo ya había hecho sus pinitos, desarrollando un modelo de persuabilidad basado en métodos tradicionales (demoscopia, entrevistas telefónicas…). Crearon asimismo una primera 'app' que los seguidores descargaban en su 'smartphone' y en la que cedían gustosamente sus datos al candidato; en ese 2008, el equipo de Obama tenía acceso, a través de la combinación de la 'app' y de los datos estadísticos públicos (como el catastro), a las revistas a las que los usuarios estaban suscritos, las matrículas de sus coches, los apellidos (que dan lugar a un origen racial probable)… para de este modo establecer un modelo de estimación de voto.

En la campaña de 2012, tras una inversión de 1.000 millones de dólares en 'data science', el equipo mejoró sustancialmente la 'app' y se dio cuenta que en las redes sociales tenía la mejor y más barata plataforma de acceso al votante; se calcula que el ahorro que supuso la emisión de mensajes por las RRSS equivale a 50 millones de dólares en anuncios de televisión. Ese equipo, liderado por Craig Fox (nunca confirmado como tal por el equipo de campaña, profesor de la escuela de negocios de la UCLA, reputado economista de la cada vez más importante área del 'behavioral economics' que fundaron Kahneman y Tversky) dio lugar al COBS, Consortium of Behavioral Scientists del partido demócrata, que fue la semiente del Social and Behavioral Sciences Team que Obama fundó en la Casa Blanca y que se conoció como la 'brigada del empujón' (en inglés, el 'nudge brigade'; apreciará el lector avezado el término 'nudge', el mismo que titulaba el libro de 2008 del actual premio Nobel de economía, Richard Thaler, especialista en la misma disciplina que Fox).

En las redes sociales tenía la mejor y más barata plataforma de acceso al votante

Con esa inversión, el equipo de campaña de Obama accedió a las plataformas de televisión por cable de los norteamericanos, a sus 'likes' de Facebook, a Twitter, a MySpace (qué lejano suena ya…) para así construir 16 millones de perfiles de votantes. Se consolidaba entonces la era del 'microtargeting', la selección de la persona por encima del grupo.

Mientras tanto, Facebook continuaba desarrollando su trabajo de poner en contacto a la gente. Cuando Obama llega al poder por vez primera, no eran ni 100 millones los usuarios de la plataforma; en su reelección, ya eran 1.000 millones; hoy superan los 2.000 millones.

Evolución del número de usuarios de Facebook. (statista)
Evolución del número de usuarios de Facebook. (statista)

Corre octubre de 2014 cuando Facebook anuncia un acuerdo con Brian Acton y Jan Koum para comprarles WhatsApp por 20.000 millones de dólares. Esa 'app' que todos llevamos en el móvil contaba por entonces con unos 600 millones de usuarios a los que malamente les sacaban 3 céntimos de dólar (el famoso ARPU, 'average revenue per user'). Facebook pagaba entonces unos 50 dólares por usuario activo, y alrededor de 19 veces las ventas proyectadas; esas cifras solo se habían manejado para la industria farmacéutica. El, para muchos, 'enorme error' de Zuckerberg de entonces se ha reflejado en un crecimiento de la acción de Facebook desde los menos de 80 dólares de entonces a los más de 185 del viernes, a alcanzar los 1.500 millones de usuarios de WhatsApp cinco años antes de lo previsto, y a un rendimiento de 5,07 dólares por usuario en el tercer trimestre de 2017 (que son más de 21 dólares en EEUU y Canadá, y casi 7 en Europa). No es muy complicado entender las razones de la operación.

Un año antes de esa compra, en 2013, se funda en Londres Cambridge Analytica (CA) como 'spin off 'de Strategic Communication Laboratories, SCL. El objetivo de CA es claro: usar las técnicas de ciencia de datos para la comunicación y el análisis electoral. Entre sus patrocinadores está la familia Mercer, accionista de la empresa y de claras simpatías hacia el partido republicano. Tras participar activamente en la campaña del Brexit de la mano de Nigel Farage y el Leave.eu, son contratados inicialmente por la campaña de Ted Cruz en los EEUU, y posteriormente por la de Donald Trump.

El objetivo de Cambridge Analytica es claro: usar las técnicas de ciencia de datos para la comunicación y el análisis electoral

Allí, mejoran sustancialmente las técnicas de 'microtargeting' que había desarrollado el equipo de Obama cuatro años antes (y que, curiosamente, el equipo de Hillary desprecia, pese a invertir unos 1.400 millones de dólares, frente a los menos de 1.000 del actual presidente) y efectúan alrededor de 250 millones de perfiles de norteamericanos, más que votantes potenciales (unos 231 millones entonces) y casi el doble de los finalmente inscritos (alrededor de 137 millones). De cada perfil, entre 3.000 y 5.000 registros.

Piensen en una matriz de Excel de 250 millones de filas con al menos 3.000 columnas. Esa es la potencia de la ciencia de datos: convertir esos datos en información, y esa información en conocimiento. El 8 de noviembre de 2016, Donald Trump se convertía en el 45º presidente de los EEUU, contra todos los pronósticos (bueno, realmente no todos). Se confirmaba que el rastro digital de los votantes, potenciales o no, era el nuevo oro. La demoscopia, tan bien representada por Nate Silver hasta entonces, estaba herida de muerte.

Como ven, no hay nada que Cambridge Analytica haya hecho que no hiciesen antes los demás, incluido Obama, el premio Nobel de la paz que metió en la Casa Blanca, a cargo del contribuyente, a un equipo de economistas del comportamiento para conocer mejor lo que desean realmente los norteamericanos. Me da la sensación de que hemos cambiado de enemigo, de los malvados rusos al terrible 'big data'. Alguien tiene que ser el responsable de la victoria de Trump, nunca el votante.

Por cierto, el día que Kosinski presentó sus resultados, allá en ese lejano 2012, recibió dos llamadas de teléfono. La primera, de Facebook, demandándole por uso indebido de la información. La segunda, también de Facebook, ofreciéndole trabajo. Lo demás ya es historia.

1Como trabajo de investigación que fue, puede consultarse aquí sin ningún problema, simplemente dándose de alta, como hacen muchos de mis alumnos del Master de Data Science para Finanzas del CUNEF de forma regular.

Big Data

Escribe un comentario... Respondiendo al comentario #1
4 comentarios
Por FechaMejor Valorados
Mostrar más comentarios