Es noticia
Política 2.0: el rastro digital es la clave
  1. Economía
  2. Big Data
Juan Manuel López-Zafra

Big Data

Por

Política 2.0: el rastro digital es la clave

En el tiempo que tarda usted en leer este 'post' se han dado 2.500.000 'likes' en Facebook y se han lanzado más de cinco millones de tuits. ¿Vamos de verdad a seguir haciendo preguntas a la gente?

Foto: El presidente de Estados Unidos, Donald Trump. (EFE)
El presidente de Estados Unidos, Donald Trump. (EFE)

"It is a capital mistake to theorize before one has data".

Arthur Conan Doyle

Cuando, en la noche del 19 de octubre pasado, Hillary Clinton abandonaba el tercer y último debate presidencial en la Universidad de Nevada, los institutos de opinión llevaban horas trabajando en las encuestas telefónicas que señalaban, repetitivas, lo mismo que todas las demás desde hacía meses: una victoria segura, aunque cada vez más apretada. La evolución demoscópica mantenía la lenta caída de la candidata entre los votantes norteamericanos, junto con el correspondiente ascenso del republicano, que en ningún caso alcanzaba siquiera el 40% de opiniones a favor de su victoria frente a Clinton.

Le daba lo mismo. Durante el debate, los algoritmos que manejaba el equipo de Cambridge Analytica lanzaban 175.000 versiones distintas del mensaje del candidato, 175.000 variaciones sobre un mismo tema, personalizadas hasta el límite.

El equipo de 'data scientists' de Trump solo avanzaba sobre lo que el de Obama había comenzado a desarrollar durante la campaña de 2008 y explotado durante la de 2012. El equipo del que iba a convertirse en el primer presidente negro de la historia de los EEUU empleó en su primera elección presidencial alrededor de ocho ingenieros (frente al único que empleó Kerry en la de 2004) que trabajaban con información almacenada en servidores físicos, con alguna incursión en la nube de Amazon.

Foto: Kevin Spacey, protagonista de 'House of Cards'. Opinión

Durante su primer mandato, rodeado de una popularidad y un aura sin precedentes desde JFK, el presidente norteamericano se presentaba en septiembre de 2011 con más de 10 millones de seguidores en Twitter y más de 23 millones de 'likes' en Facebook. Pongámoslo en contexto: Mitt Romney se arrastraba por entonces con 93.000 seguidores en Twitter —menos de los que hoy tiene mi amigo Daniel Lacalle—. Los servidores físicos hacía ya tiempo que habían dejado paso a la nube y los 'clusters' de Hadoop para manejar, solo de cara a la captación de fondos para la campaña, alrededor de 10 terabytes de información. Fue entonces cuando un jovencísimo Dan Wagner, hoy CEO de Civis, se hizo cargo de la parte analítica de la campaña para centrarse en el 'microtargeting', la selección milimétrica de las características de los votantes norteamericanos.

Wagner trabajaba mano a mano con el equipo de COBS (por Consortium of Behavioral Scientists, o consorcio de científicos del comportamiento), dirigido (aunque nunca reconocido oficialmente) por Craig Fox, el catedrático del Anderson School of Management de la Universidad de California. El equipo de científicos del comportamiento (la rama de la teoría de la decisión que Kahneman y Tverski habían fundado en 1979, y de los que hemos hablado en alguna ocasión en esta columna) había convencido de su potencia a la dirección de campaña cuando en febrero del año de la reelección lanzó a los voluntarios a realizar 300.000 llamadas telefónicas con un cierto mensaje para lograr el voto a Obama. Elegida dos días después una muestra de 20.000 de ellos, la tasa de fidelidad al presidente superaba en más de cuatro puntos al resto de la población.

Foto: Donald Trump en un acto de campaña. (Reuters) Opinión
TE PUEDE INTERESAR
Por qué ganará Trump
Juan Manuel López-Zafra

La estrategia de la que se perfilaba ya como semilla del Behavioral Sciences Team que Obama daría rango oficial en 2015 (la famosa Nudge Brigade que lucha contra el abandono escolar, por el ahorro de los mayores para su pensión o para evitar los impagos en los préstamos de estudiantes, siempre con técnicas directamente extraídas de las aportaciones de Kahneman, Klein y otros brillantes colegas estudiantes del comportamiento) se basaba en persuadir a los votantes, entre otros aspectos, mediante el refuerzo de mensajes positivos (nada de “Obama no es musulmán”, un mensaje que, sin quererlo, reforzaba la idea de la falsa religión del presidente, sino “Obama es cristiano”) y en hacerles partícipes del éxito (presentarse al votante diciéndole “usted, como votante de las anteriores elecciones…” logra implicarle en el proceso y aumenta su autoestima, mejorando su receptividad).

Encerrados en un sótano del cuartel general demócrata, mientras tanto, los científicos de datos de Wagner comían pizza al tiempo que manejaban la información de 16 millones de perfiles, con una inversión cercana a los 1.000 millones de dólares. Gracias a la 'app' de la campaña de Obama, y cruzándolo con 'open data' de fuentes libremente disponibles, fueron capaces de manejar la información de cuáles eran las revistas a las que estaban suscritos los simpatizantes, las matrículas de sus coches, las licencias de caza, los amigos de Facebook, incluso el posible origen racial en virtud de los apellidos. El objetivo inmediato era claro: establecer la probabilidad de voto al presidente, y centrar los esfuerzos en los indecisos. Fue entonces cuando el estadístico y 'data cruncher' Nate Silver y su blog 'fivethirtyeight' (por los 538 votos del colegio electoral norteamericano) saltaron definitivamente a la fama, al predecir con éxito el resultado en los 51 estados en liza (en 2008, 'solo' había acertado 50).

Hoy, como señalamos aquí en junio pasado, Nate Silver, su método de ponderación de encuestas y la demoscopia tal y como la conocemos son historia. Todas las encuestas tradicionales vienen fallando estrepitosamente desde hace meses. Un grupo de estudiantes de RRII y Economía de la URJC está estudiando a qué puede deberse, aunque me inclino a pensar que la presión social (directa o no) hace muy difícil responder con honestidad a unos profesionales que muchos ven como extensión de unos medios tremendamente politizados. Los casos de la CNN, el NYT o el WAPO en EEUU, por no hablar aquí de ciertas cadenas de televisión, llevan posiblemente al encuestado a mentir en su respuesta, multiplicando el voto oculto que los modelos tradicionales no han sido capaces de ponderar adecuadamente. Esta situación de inmensa incertidumbre demoscópica hace temblar a Francia ante las posibilidades reales de Le Pen.

El éxito de Trump da prueba de ese fracaso, como señalé aquí dos días antes de las elecciones del 8 de noviembre. Con una mínima inversión publicitaria pero una millonaria en 'big data' y 'data science', el equipo liderado por el tan todopoderoso como odiado Steve Bannon, miembro del consejo de administración de Cambridge Analytica, manejaba con soltura 250.000.000 de perfiles con 5.000 datos por perfil. El rastro digital que todos dejamos es la clave. El desarrollo del 'text mining', el análisis del sentimiento y el NLP ('natural language processing') posibilitaron el éxito. Ya están trabajando en la reelección.

En el tiempo que ha tardado usted en leer este 'post', se han subido medio millón de fotos a Instagram, se han dado 2.500.000 'likes' en Facebook, se han lanzado más de cinco millones de tuits y se han visto más de 45 millones de vídeos en YouTube. ¿Vamos de verdad a seguir haciendo preguntas a la gente?

"It is a capital mistake to theorize before one has data".

Big Data Sigma Dos Barack Obama Hillary Clinton