Big data y aplicaciones

Un nuevo libro del CSIC nos acerca al big data y sus aplicaciones en política, sanidad y ciberseguridad

El libro recoge los riesgos y dilemas éticos que plantea el big data a través de ejemplos como Google, Amazon o Facebook./ Johannes Plenio

David Ríos y David Gómez-Ullate describen la tecnología y métodos usados por la ciencia de datos y explican su potencial en diversos ámbitos.

Los seres humanos generamos en nuestro día a día ingentes cantidades de información gracias al uso masivo de sensores y dispositivos móviles. Esos conjuntos de datos denominados big data no solo se caracterizan por su gran volumen, sino también por la velocidad a la que se producen y por la variedad que presentan (mensajes de voz, imágenes, correos electrónicos, datos geoespaciales, etc.). Además, están alcanzando cada vez más valor para las empresas y gobiernos, que intentan aprovecharlos para mejorar las relaciones con los consumidores o los ciudadanos, personalizar servicios y productos y automatizar todo tipo de procesos. Para explicarnos esta nueva era tecnológica los investigadores David Ríos Insua y David Gómez-Ullate Oteiza han escrito Big data. Conceptos, tecnologías y aplicaciones, el último número de la colección de divulgación ¿Qué sabemos de?, editada por el CSIC y Los Libros de la Catarata.

El libro comienza con una revisión de los conceptos, tecnologías y metodologías propios de la ciencia de datos. “Al hablar de big data con frecuencia se pone el énfasis en la capacidad de almacenar datos; sin embargo, una parte esencial de cualquier proyecto de este tipo consiste en emplear adecuadamente algoritmos para su procesamiento que permitan aprender de ellos, de manera que la aplicación que se desarrolle en cada caso pueda predecir comportamientos futuros y realizar tareas que entendemos como inteligentes”, explica David Ríos, investigador del Instituto de Ciencias Matemáticas (ICMAT) del CSIC.

A continuación, el texto se centra en tres ámbitos en los que este fenómeno puede ayudar, y también perjudicar, en la toma de decisiones. Uno de ellos es el big data para la política y las administraciones públicas. Los autores mencionan áreas como la planificación urbana y energética, donde estas tecnologías tienen mucho que aportar. También pueden ser cruciales en la gestión de catástrofes naturales; aquí el despliegue de los equipos de emergencia depende de la disponibilidad de información relevante, como los movimientos de la población afectada. Según David Gómez-Ullate, investigador distinguido de la Universidad de Cádiz, “el análisis de los registros de llamadas, convenientemente agregados y anonimizados, ofrece posibilidades para caracterizar el comportamiento humano durante sucesos críticos y mejorar así el establecimiento de alertas tempranas y la gestión de mecanismos de emergencia.”

La parte oscura de estas aplicaciones son las fake news, cuyo punto de inflexión fueron las elecciones presidenciales de 2008 en Estados Unidos. “Se está intentando automatizar la detección de noticias falsas con métodos que combinan dos vías: por un lado, identificar patrones lingüísticos, y por otro, analizar cómo se difunden estos mensajes”, explican los autores.

El campo de la sanidad es uno de los que está cambiando de forma más perceptible las prácticas profesionales y de planificación gracias al big data. El diagnóstico automático de cáncer de piel sobre fotografías o la detección de metástasis de cáncer de mama sobre imágenes histológicas son algunas de las aplicaciones en las que se está trabajando. Además, la gran cantidad de sensores y dispositivos que podemos llevar como una prenda de vestir proporcionan información en tiempo real con un gran potencial. Su tratamiento colectivo abre un nuevo campo de posibles estudios científicos y avance del conocimiento. De hecho, en el texto se citan algunas experiencias que demuestran que estos datos bien tratados pueden ser un recurso muy valioso en salud pública. Por ejemplo, un proyecto que instala GPS y sensores para medir la calidad del aire en inhaladores. La información sobre la frecuencia de uso del inhalador, la posición y la calidad del aire en ese punto generan un mapa de los lugares que afectan más a las personas con asma y desarrollar estudios de incidencia de esta enfermedad en función de la polución.

Asimismo, en un mundo hiperconectado tanto usuarios como corporaciones y gobiernos pueden verse afectados por ciberataques, que ya son considerados una amenaza global. Los autores dedican un capítulo a describir metodologías estándar de ciberseguridad y explorar cómo el big data puede contribuir a reducir esas amenazas.

Cuando el producto somos nosotros

Los aspectos éticos de esta transformación digital a gran escala ocupan otro de los capítulos del libro. A diferencia de los usuarios, las empresas son muy conscientes del valor de la información, y por eso suelen ofrecer servicios cuyo verdadero fin es conseguir nuestros datos. “Nos hemos acostumbrado a que muchas aplicaciones o herramientas de nuestros dispositivos móviles sean gratis, pero en internet, cuando no sabes cuál es el producto, entonces el producto eres tú”, afirman los investigadores. Los autores describen el “verdadero negocio de los gigantes de internet” a través de casos como Google, Amazon o Facebook. También explican el modelo de Airbnb y Booking, que actualmente son las principales empresas hoteleras pese a que no tienen un solo alojamiento en propiedad. Son empresas de datos que recopilan, limpian y analizan información y desarrollan aplicaciones para poner en contacto proveedores de servicios con consumidores.

Al final, el libro trata de poner en contexto estos avances tecnológicos. Debemos esperar una evolución tanto en la tecnología como en los métodos de uso del big data para mejorar los sistemas de ayuda en la toma de decisiones. “Sigue habiendo muchas posibilidades para las administraciones públicas y organizaciones no gubernamentales, que hasta el momento han estado por detrás de las empresas en la aplicación del big data”, concluyen los autores.

Integrado en la colección de divulgación ¿Qué sabemos de?, el libro Big data. Conceptos, tecnologías y aplicaciones puede adquirirse tanto en librerías como en las páginas web de la Editorial CSIC y Los Libros de la Catarata. Con esta obra, la colección suma 108 títulos que acercan la actualidad científica y tecnológica al conjunto de la sociedad.

Para solicitar entrevistas con los autores o más información, contactar con: [email protected] (Teléfono 915680043).

Sobre los autores

David Ríos es AXA-ICMAT Chair en Análisis de Riesgos Adversarios en el ICMAT-CSIC y numerario de la Real Academia de Ciencias Exactas, Físicas y Naturales. Es catedrático de Estadística e Investigación Operativa (en excedencia). Previamente ha sido profesor o investigador en Manchester, Leeds, Duke, Purdue, Paris-Dauphine, Aalto, CNR-IMATI, IIASA, SAMSI y UPM. Entre otros, ha recibido el Premio DeGroot de la ISBA por su libro Adversarial Risk Analysis. Es asesor científico de Aisoy Robotics. Ha escrito más de 130 artículos con revisión y 15 monografías sobre sus temas de interés que incluyen la inferencia bayesiana, la ciencia de datos, el análisis de decisiones y el análisis de riesgos, y sus aplicaciones, principalmente, a seguridad y ciberseguridad.

David Gómez-Ullate es investigador distinguido en la Universidad de Cádiz y profesor titular de Matemática Aplicada en la Universidad Complutense de Madrid, actualmente en excedencia. Su labor reciente se centra en la transferencia de conocimiento al sector industrial en ciencia de datos e inteligencia artificial. En la actualidad dirige proyectos en el sector aeronáutico, seguros y biomédico aplicando técnicas de visión artificial y procesamiento de lenguaje natural.

CSIC

Esta entrada se publicó en Libros y Revistas en 26 Nov 2019 por Francisco Martín León