" />
basura
ZOOM
GALERÍA
0 COMENTARIOS

Cómo trabajan los científicos para predecir el comportamiento de las personas

Así funciona el Big Data social

Desde TnL hemos abordado el tema del Big Data en diversas ocasiones. En los últimos años la minería de datos se ha convertido en un gran filón. Ya no se trata sólo de obtener millones de datos y empaquetarlos, el verdadero valor está en la capacidad combinada de los algoritmos matemáticos y el análisis humano; es poder coger esos millones de datos y encontrar relaciones, causas y, lo más importante, efectos. Porque en última instancia lo que se quiere es aprender a predecir comportamientos, saber con antelación qué es lo que puede pasar.

En un artículo publicado en la revista digital PNAS por Adam Mann se explica precisamente cómo la ciencia computacional social es capaz, por ejemplo, de usar los datos de las torres de telefonía móvil para predecir las partes de Londres en las que se prevé que aumente la delincuencia; o cómo Google busca información de votaciones por zonas el día de las elecciones para conocer las repercusiones de las diferentes leyes de registro de votante; o, incluso, cómo se usan los modelos matemáticos para explicar cómo obtener mejor rendimiento gracias a las interacciones de los inversores financieros o averiguar cómo se producen las burbujas financieras.

Mann explica cómo los investigadores han empleado los datos GPS smartphones y taxis para clasificar a las personas de San Francisco, según patrones comportamiento, en “redes tribales”. Los datos permiten así conocer cómo se mueve la población, dado que estudiantes, turistas y financieros usan diversos medios para moverse por la ciudad, lo que permite agrupar socialmente los barrios y cómo estos van evolucionando.

mapa

Sobre estas líneas se ve un plano de la ciudad de México. En un modelo diseñado por Alex Pentland (del MIT) y su equipo de investigadores, crearon un mapa de calor con las predicciones sobre delincuencia en la ciudad según los desplazamientos de las personas.

Habitualmente la sociología se alimentaba de encuestas sobre muestras de población, entrevistas, censos y otros datos gubernamentales. Los datos obtenidos ahora mediante la ciencia computacional social permiten conocer mejor a los individuos y sirven de herramienta no sólo a la sociología, también a la política y a la economía. En 1930 un sociólogo tuvo que ir de puerta en puerta pidiendo a la gente que le dijeran cuánto dinero se habían gastado el año anterior. Hoy es posible obtener los datos de las operaciones financieras de toda una ciudad en unos pocos milisegundos, sólo con acceder a la información de las tarjetas de crédito. Quizá por esto, desde 2009 algunos científicos, entre ellos Alex Pentland, hablan del nacimiento de un nuevo campo, refiriéndose a la ciencia computacional social.

Lo que los datos dicen de ti

Los datos dicen que una persona blanca, que ha tenido una buena educación, y que proviene de una familia acomodada es, por estadística, más propenso a votar. Así es comprensible que los esfuerzos de las campañas electorales se centren en dirigirse a la gente que se considera que va a acudir a las urnas, en lugar de a la que no. Aunque las cosas no son nunca tan sencillas, y existen infinidad de variables que interaccionan para generar reacciones diferentes. El que logre entender cómo funcionan esas variables tendrá en su mano la clave para vender predicciones sociales fiables al 98,9%.

Los millones de datos recopilados se mueven a través de simulaciones de ordenador, que establecen cómo se espera que se comporten las personas, y sin necesidad de hacer encuestas en las que, por otra parte, es probable que la gente no cuente toda la verdad. Como seres sociales que somos, el big data social permite a los investigadores conocer mejor cómo nos conectamos entre nosotros, cómo nos relacionamos, lo que podría convertirse en tendencia social, las probabilidades de que se produzcan crímenes o de que alguien se enriquezca. Al final, señala Mann (y nosotros también) una parte fundamental de todo esto es la seguridad y la ética con la que se manejan e interpretan esos datos.

Las simulaciones por ordenador son otra de las grandes ventajas con la que cuenta ahora esta nueva sociología. Ya a finales de la década del 2000 los científicos pudieron demostrar que conforme las ciudades crecen en residentes, había rasgos que crecían exponencialmente como el PIB, las patentes por cabeza, la delincuencia o las ratios de contagio de las enfermedades de transmisión sexual. Un ejemplo de esto es que se conocía que al duplicarse la población la productividad económica creció un 130%, pero no se sabían las razones.

Las investigaciones del equipo de Pentland mediante simulaciones por ordenador, donde se observaban los patrones en las relaciones sociales en ciudades virtuales de 10.000 y 10.000.000 de habitantes. Conforme crecía la población el número de interacciones de cada individuo aumentaba exponencialmente. Sin embargo, el cómo se evolucionan (o no) los crecimientos de población en distintas ciudades del mundo, podría ayudar a establecer los elementos que hay que incorporar (o eliminar) para que determinadas reacciones se produzcan. Así vieron que en los países del tercer mundo el aumento de la población no trajo el aumento exponencial de la productividad. El análisis de las redes de transporte en esos países, donde habitualmente está poco desarrollado y no facilitan que la gente se mueva e interactúe entre sí, permitió establecer una interesante conclusión desde el equipo de Pentland: si quieres que una ciudad prospere, haz que su sistema de transporte mejore.

Para el politólogo Salomón Messing, de la Universidad de Stanford en California, cada vez que compartimos una opinión, un comentario, un vídeo o una imagen en las redes sociales, estamos dando información para que otros conozcan nuestra conducta (pasada, actual y futura). Lo que más información arroja sobre nosotros es nuestro teléfono móvil.

Investigaciones realizadas por un equipo liderado por David Lazer han puesto de relieve que los teléfonos móviles pueden ayudar a hacer predicciones más certeras sobre las tasas de desempleo. Aunque aparentemente no tengan nada en común, lo cierto es que las torres de telefonía pueden mostrar los movimientos que hacen las personas, diferentes entre los que trabajan y los que no. Dado que en ocasiones las personas en paro no siempre admiten inmediatamente su situación, los datos obtenidos gracias las torres de telefonía son más precisos y cercanos al tiempo real que las estadísticas tradicionales de desempleo. Los datos obtenidos por Lazer dieron información sobre desempleo más precisa y con cuatro meses de antelación a la publicación de los informes oficiales.

¿Hasta qué punto es ético extraer datos de personas?

Según señala Mann en su artículo, la parte más controvertida de esta disciplina es la realización online de experimentos aleatorios, con el objetivo de ver qué pasa cuando cambias o manipulas una de las variables. A menudo estos experimentos se hacían con una muestra de entre 30 y 40 estudiantes de psicología voluntarios, pero ahora las redes sociales puede proporcionar mucha más información de millones de usuarios. Teóricamente esa información es anónima, quiere decir que se sacan datos de perfiles que, en principio, no están ligadas a un nombre, unos apellidos o un DNI.

Del estudio del comportamiento de los usuarios en las redes sociales han salido cosas muy interesantes. Durante las elecciones de 2010 en EE.UU. se vio a través de Facebook que las personas eran más proclives a votar o buscar información para hacerlo cuando se les mostraba información de los familiares o amigos que ya habían ido a votar. Posteriormente, un polémico estudio que dio mucho que hablar usó Facebook para jugar con las emociones de los usuarios y ver lo que pasaba: en pocas palabras, se envió a propósito información sesgada positiva (previa manipulación del feed y sin permiso de los usuarios) a un grupo de personas y negativa a otro. El estudio, que buscaba conocer cómo se contagian las emociones, demostró que las personas que recibieron la información positiva fueron más propensos a compartir mensajes positivos, mientras que los que recibieron las malas noticias se mostraron más pesimistas y tristes en los contenidos que compartían.

Aunque está claro que este estudio actuó mal al manipular información y hacerlo sin el consentimiento de los usuarios, la verdad, como bien apunta Mann, es que es algo que pasa continuamente sin que lo sepamos. Por eso el tema de la seguridad en las redes sociales y la protección de datos es tan importante, y uno de los retos de los científicos es asegurarse de que sus bases de datos son a prueba de hackers. El otro reto consiste en saber más que el usuario, y ser capaces de elaborar técnicas para detectar cuándo alguien está mintiendo. De otra forma, todo ese trabajo no servirá para obtener datos que realmente representen a la sociedad. Así, predecir el futuro no será cosa de magia, sino de big data.

Fuente: PNAS

No comments yet.

Deja un comentario