Opinión

¿Puede el big data predecir quién ganará el Mundial de Rusia 2018?

A menudo escuchamos que el "big data nos ayuda a predecir comportamientos, tendencias, etc.’, pero… ¿podría esta tecnología anticipar el próximo ganador del Mundial de Rusia 2018? ¿Serían fiables sus resultados? ¿En caso afirmativo, estaríamos perdiendo el encanto del deporte?

Para poder contestar a estas preguntas es necesario analizar en profundidad cómo funcionan los modelos predictivos (machine learning) empleados en los estudios de big data. Estos modelos son una representación matemática de los datos y permiten, mediante diferentes cálculos, determinar la probabilidad de un suceso desconocido. Los modelos analizan una gran cantidad de información e infieren de ella las respuestas a las preguntas planteadas por los programadores. Es importante resaltar que los modelos sólo pueden aprender a partir de los datos que ingestan, por lo que no podrán realizar ningún tipo de predicción si no se dispone de información sobre este hecho. En inglés, esto se conoce comolearning from data, el aprendizaje desde los datos.

En el caso particular del Mundial de Fútbol de Rusia 2018, los modelos matemáticos deben recoger toda la información que pueda condicionar el resultado de cualquier enfrentamiento entre dos selecciones. Lo más natural es analizar los enfrentamientos previos que han tenido ambos conjuntos, pero, evidentemente, esto es insuficiente si se quieren realizar predicciones fiables. Existen numerosos factores que pueden influir en el desarrollo de un partido: la climatología, la afición, el estado de forma de los jugadores, el estado del césped, etc.

Asimismo, hay otros factores muy poco evidentes que también pueden influir: enfrentarse a un compañero de equipo, las noticias locales, la localización del hotel o el tiempo de trayecto hasta el estadio. Un modelo predictivo que busque determinar el ganador del mundial deberá recoger toda esta información, agregarla mediante diferentes mecanismos matemáticos y garantizar un algoritmo de inferencia para conseguir aprender a partir de los datos.

El big data no nos va a convertir en adivinos, pero sí que nos va a permitir tomar decisiones

La generación del modelo matemático es tediosa por el gran número de variables que lo componen. Pero es aún más difícil conseguir la ingente cantidad de información necesaria para que este modelo aprenda. Se necesitan decenas de miles de datos fiables sobre los sucesos contemplados en el modelo para permitirle inferir conocimiento a partir de los mismos. En cualquier caso, por complejo que sea el modelo, siempre habrá situaciones que no hayan sido contempladas en el mismo y que condicionen los enfrentamientos. ¿O acaso algún estudio contemplaba la posibilidad de que Julen Lopetegui fuera destituido como seleccionador a pocas horas de comenzar el mundial? Por complejo que sea el modelo predictivo desarrollado, siempre quedará lugar para la sorpresa y el espectáculo.

Utilizando el planteamiento indicado anteriormente y tras incorporar todos los datos disponibles, los modelos predictivos actuales son capaces de mostrarnos aquellos equipos con más probabilidades de alzarse con la copa del Mundial de Fútbol. A día de hoy, estos resultados nos indicarían que Brasil, Francia e Inglaterra son las máximas favoritas. Por todo lo anterior, podemos concluir que el big data no nos va a convertir en adivinos, pero sí que nos va a permitir tomar decisiones en función de las observaciones realizadas.

LA PREGUNTA
¿Cuáles han sido los hitos del canal en los últimos 20 años?