Actualidad
Big Data

Cómo realiza Bing sus predicciones mediante Big Data y Learning Machine

El buscador de Microsoft ofrece por primera vez en España las predicciones de la Liga, que es algo que ya hacía en los campeonatos de Alemania, Francia e Italia, además de en la Champions League. ¿Qué tecnologías utiliza para predecir los resultados con escaso margen de error?

Bing-big data


Microsoft comenzó a investigar en 2008 cómo la información que aparecía en las búsquedas en Bing podía utilizarse para vaticinar hechos futuros. Desde entonces, su sistema de predicciones se ha probado en diferentes acontecimientos deportivos, políticos y sociales. Por ejemplo, en el Mundial de Fútbol de Brasil de 2014, Bing acertó el pronóstico en 15 de los 16 partidos de la fase de grupos; durante las últimas elecciones legislativas estadounidenses Bing acertó 34 de 35 senadores, 33 de 36 gobernadores y el 96% de los miembros de la cámara de representantes, o También predijo la victoria del No en el referéndum de independencia de Escocia con un porcentaje de apoyo similar al que finalmente dieron las urnas.

El buscador de Microsoft ofrece ahora en España las predicciones de la Liga, que es algo que ya hacía en los campeonatos de Alemania, Francia e Italia, además de en la Champions League.

¿Cómo lo hace?
Los expertos de Microsoft crearon un motor de predicción utilizando todo el potencial del Big Data y del Machine Learning (aprendizaje de las máquinas) que permite que los propios sistemas aprendan en función de la experiencia y al análisis masivo de datos.

La principal novedad de estas predicciones es que, mediante sofisticados modelos de matemática predictiva, el algoritmo diseñado por Microsoft combina esos datos con la percepción de los aficionados, procedente de las consultas de millones de usuarios expresadas a través de las búsquedas en el buscador y en las redes sociales. Toda esta información, analizada con técnicas de machine-learning, asigna a cada equipo una forma de porcentaje de probabilidades de victoria, empate o derrota que publica junto a la información de cada partido.

Así, el buscador combina en sus modelos predictivos la información objetiva de los datos existentes junto con las tendencias que muestran los usuarios en el buscador y en las redes sociales, gracias a patrones de comportamientos determinados previamente, para proporcionar una serie de conocimientos que ayudan a tomar decisiones con más confianza en una amplia gama de temas.

Diferentes enfoques, según el acontecimiento
En los actos basados en votaciones, los usuarios no solo evalúan lo que ha pasado en el momento más recientes, sino que crean sus favoritos, a quienes defienden para que no sean eliminados. Esto se aprecia perfectamente en las búsquedas y en las redes sociales, donde también se comprueban qué aspectos están relacionados con los patrones de las votaciones. Se examinan también temporadas pasadas para determinar las tendencias, que se suelen prolongar a las siguientes.

No obstante, una simple búsqueda de un participante no determina que el usuario vaya a votar por él. Este modelo también tiene en cuenta cuándo un participante aparece relacionado con una noticia no conectada con el evento. En estos actos, la clave es el sentimiento, y se ha comprobado que hay un sesgo medible que debe ser contabilizado y ajustado. Es más, las encuestas suelen tener respuestas más radicales que lo que se escribe en el buscador y en las redes sociales.

En cuanto a los eventos en los que las decisiones son de un selecto grupo de expertos, la mejor práctica es encontrar patrones de comportamiento que ayuden a inferir cómo votan estos grupos de personas. En estos patrones también influye la actividad en el buscador y en las redes sociales, pues el público en general tiene buena intuición.

Finalmente, los eventos deportivos pertenecen a la categoría que más debate y escepticismo provocan. En este caso, las predicciones del ganador no se pueden determinar por su popularidad. Por el contrario, lo primordial es el análisis de los puntos fuertes y débiles del equipo, las estadísticas históricas, los factores que benefician o perjudican a las escuadras y la tradición de los resultados en sus emparejamientos.

En este tipo de acontecimientos, se construyen modelos previos que determinan un ranking de potencial de esos equipos. Luego se añade el sentimiento social procedente del buscador y las redes sociales, así como la información más reciente, como lesionados, suspensiones, meteorología, y la predicción está servida. Se ha comprobado que añadir esta sabiduría de la multitud incrementa las posibilidades de acierto un 5%.

 



TE PUEDE INTERESAR...

Nuevo número de nuestra revista de canal 
 
DealerWorld Digital

 

Cobertura de nuestros encuentros

 

Documentos ComputerWorld



Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?