Es noticia
El fin de la demoscopia
  1. Economía
  2. Big Data
Juan Manuel López-Zafra

Big Data

Por

El fin de la demoscopia

Hacer la pregunta correcta, acumular la información, analizarla con las técnicas adecuadas y ser capaz de responder es, hoy, el reto

“Hay 33 millones de versiones diferentes de Netflix”. Joris Evers

Cuando Netflix decidió lanzar 'House of Cards' el uno de febrero de 2013, lo que más sorprendió a los gurús de las series no fue que se lanzasen simultáneamente los 13 capítulos de esa primera temporada; tampoco los 100 millones de dólares de presupuesto, algo 'normal' cuando el director es David Fincher (muy reconocido por 'La red social', la película sobre los inicios de Facebook) y el protagonista es Kevin Spacey (ganador de dos premios Oscar en 1995 y 1999). Lo que realmente provocó el cambio de la sonrisa inicial (“se la van a pegar”) a la admiración incrédula (“no puede ser…”) fue la decisión de lanzar la serie sin ni siquiera someter al habitual juicio de los expertos un simple capítulo piloto. La compañía de Los Gatos lanzó la serie de golpe, jugándose 100 millones de dólares… sabiendo que era una apuesta ganadora.

[Consulte aquí todos los resultados de las elecciones generales del 26-J]

Por entonces, la compañía contaba con 30 millones de suscriptores de vídeo bajo demanda. Hoy son ya más de 80 millones en todo el mundo: 80 millones de usuarios que pagan por ver contenido original y a los que Netflix jamás ha preguntado acerca de sus gustos. Sabe cuándo acceden, cuándo salen, cuándo avanzan o retroceden, qué calificaciones otorgan, desde qué dispositivo acceden. Saben su edad, su sexo, su código postal. Saben que si ven 15 horas de vídeo al mes, la probabilidad de mantenerlos en cartera es de un 75%, mientras que si solo ven cinco horas, la misma probabilidad cae dramáticamente; y entonces reaccionan, ofreciendo a ese usuario nuevos contenidos acordes con sus preferencias.

Cuando un conductor arranca por la mañana su vehículo camino del trabajo, una huella digital queda impresa en los servidores centrales de Octo Telematics con tanta fuerza como los pies y las manos de Tarantino en el hormigón del Teatro Chino de Hollywood. Octo es la compañía italiana líder de servicios telemáticos y proveedora de las principales compañías de seguro del mundo, con más de cuatro millones de vehículos conectados en todo el mundo y una base de datos con casi 400.000 millones de kilómetros almacenados en sus servidores.

Ningún partido ha logrado un resultado siquiera similar al de las casas de estudios de opinión, que fallaron estrepitosamente en sus previsiones

A través de un dispositivo instalado en el vehículo, Octo monitoriza la fecha y la hora de uso, la velocidad máxima a la que circula, la distancia que recorre en cada trayecto, la velocidad media y el tipo de vía por el que ha circulado. Pero lo que realmente hace de Octo un líder global con el 36% de la cuota mundial de pólizas de seguro basadas en uso (UBI) es su decelerómetro, una especie de péndulo de Foucault electrónico que recoge las deceleraciones fronto-laterales a las que el vehículo es sometido. Un dispositivo que salva vidas, al lanzar de forma automática una señal a los servicios de emergencia en caso de un golpe que pudiera paralizar el vehículo. La compañía que trabaja con Octo no necesita preguntar a su asegurado cuántos kilómetros realiza cada año para medir su exposición al riesgo; tampoco necesita preguntarle si cumple o no con los límites de velocidad y si conduce o no de forma segura; al cabo de un par de temporadas de seguimiento conocerá más de ese asegurado que él mismo. Nunca tendrá que preguntarle nada más, porque lo sabrá todo; hasta si ha tenido hijos.

El principal derrotado de esta contienda electoral no ha sido Podemos, ni el PSOE; ni siquiera Ciudadanos. Ninguno de ellos ha logrado un resultado siquiera similar al de las principales casas de estudios de opinión, que fallaron estrepitosamente en sus previsiones.

Sin duda, se trata de empresas competentes, técnica y metodológicamente perfectamente dotadas, que juegan en un mercado enormemente competitivo en que su principal competidor, el Centro de Investigaciones Sociológicas (CIS), no fue capaz de identificar lo que estaba pasando, a pesar de contar con recursos casi infinitos; tan es así que la última oleada, publicada este mismo mes, contó con más de 14.000 entrevistas realizadas.

No es un problema metodológico, en eso tienen razón las empresas demoscópicas. Dudarlo es desconocer su trabajo. El problema es emplear hoy el mismo tipo de técnicas de identificación de señal que hace 50 años. Parece que RTVE y la FORTA invirtieron más de 300.000 euros (de nuestro dinero) en 132.000 entrevistas a pie de urna en más de 1.100 colegios electorales, con casi 1.400 personas trabajando en ello. Fiar el resultado de una inversión tan cuantiosa a la respuesta de un individuo es, cuanto menos, arriesgado, por mucha cocina que el chef aplique. De que el problema está en la técnica y en reposar la confianza en la respuesta da fe la previsión que hicimos desde DataMetrica, nuestra empresa de 'data science', que recogemos en el siguiente gráfico.

Alimentamos el modelo de regresión cuantílica suavizada por 'splines' con todas las encuestas publicadas desde el 20-D. No se incorporaron las previsiones de la frutería de Andorra de la última semana, que después se mostraron tan erróneas como las demás. Habida cuenta que el modelo se alimenta de ellas, el resultado (en términos de previsión tanto de porcentaje de voto final como de escaños) está directamente influido por ellas. Como puede observarse, y salvo en el caso de C’s, nuestro resultado 'clava' el de las encuestas, especialmente el de GAD3. Falla igual, pero por una fracción del coste. Y falla igual porque todos los estudios de opinión publicados desde diciembre han errado de forma sistemática.

En un mundo donde todos los días, a todas horas, en todos los lugares, los votantes dejan rastro digital, triunfará quien sea capaz de identificar el comportamiento de cada segmento de votantes. Netflix no fio 100 millones de dólares a la decisión de unos expertos; una aseguradora no fía hoy su cuenta de resultados a la respuesta de un asegurado. Hacer la pregunta correcta, acumular la información, analizarla con las técnicas adecuadas y ser capaz de responder es, hoy, el reto.

“Hay 33 millones de versiones diferentes de Netflix”. Joris Evers