Judea Pearl, galardonado del premio Fronteras del Conocimiento de la Fundación BBVA en Tecnologías de la Información y la Comunicación, revolucionó la estadística y la inteligencia artificial con su formalización de las relaciones causa-efecto
Los humanos tomamos decisiones, generalmente, basándonos en nuestro conocimiento sobre el mundo que nos rodea y, en concreto, prediciendo en mayor o menor medida las consecuencias de nuestros actos. Por tenue que pueda ser, esto requiere de un entendimiento de las relaciones causa-efecto. ¿Qué efectos tendrá una acción determinada? ¿Qué hubiera ocurrido si actuásemos de otra manera? ¿Es un hecho la causa de otro, hay algo que no estamos teniendo en cuenta y que causa ambos, o más bien es pura coincidencia? Comprender a nivel detallado estas relaciones causales tiene consecuencias importantes tanto a nivel personal como social y político. Judea Pearl (Israel, 1936), el nuevo beneficiario del premio Fronteras del Conocimiento 2022 en Tecnologías de la Información y la Comunicación de la Fundación BBVA, es uno de los creadores de un formalismo que extiende el estudio de la causalidad a numerosos escenarios.
Para resolver un problema, debemos comprender qué posibles acciones funcionan o cuáles no y por qué, incorporando además la incertidumbre que marca nuestra limitada perspectiva del mundo. Por ejemplo, para diseñar distintos tratamientos médicos como las vacunas de la polio, sarampión y, como no, el covid-19, o la terapia antirretroviral para el VIH, es fundamental obtener una caracterización detallada y específica de la relación entre el tratamiento y la respuesta.
En estadística existe la famosa premisa de que correlación no implica causación, como claramente demuestran las correlaciones espúreas. Por ejemplo, existe una correlación entre el número de películas en las que aparece Nicolás Cage en la década de los 2000 y el número de ahogamientos en piscinas durante esos mismos años. ¿Significa esto acaso que si Cage saca un nuevo filme debemos tener más cuidado en la piscina? En general, no. Esta correlación no implica una conexión causal, sólo es una de tantas coincidencias que aparecen de manera aleatoria.
Por otro lado, en ocasiones puede haber variables o factores de confusión que afectan a la vez a varias variables de interés, y su efecto puede inducir a conclusiones erróneas parecidas a las anteriores. Como ejemplo, hay una correlación demostrable entre el número de helados vendidos en una ciudad y el número de crímenes violentos. En este caso, existe una variable de confusión: los crímenes violentos son más frecuentes cuando suben las temperaturas, lo cual aumenta también la venta de helados.
Una de las técnicas “clásicas” más importantes en el estudio de la causalidad son las pruebas controladas aleatorizadas (RCT, por sus siglas en inglés). En su forma más básica, una RCT separa una población aleatoria en dos grupos: uno será tratado o alterado de alguna forma y otro se mantendrá sin alterar (grupo control) para estudiar la diferencia relativa entre ambos. Por ejemplo, en un estudio de efectividad vacunal, la mitad de las personas participantes son tratadas con placebo y la otra mitad recibirá la dosis. Así, bajo ciertos requisitos, la aleatorización de ambos grupos permite discernir si dicha alteración tiene o no un determinado efecto de interés en la población.
Los RCT son muy versátiles para esclarecer las relaciones causales entre distintos factores, pero no siempre es factible realizarlos por problemas de tiempo, financiación, dificultad para encontrar casos de estudio, etc. Frente a ello, son necesarias nuevas estrategias para hacer estudios de la causalidad. Aquí es donde brilla el trabajo de Pearl, proporcionando una nueva forma de realizar estos análisis.
Pearl estudia la causalidad desde una nueva perspectiva, extendiendo los modelos de redes bayesianas para interpretarlos como modelos de causalidad. Las redes bayesianas, desarrolladas también por Pearl, son una herramienta gráfica que permite representar visualmente modelos probabilísticos. Estos modelos son ampliamente utilizados en estadística por su capacidad para describir sucesos y relaciones probabilísticas complejas con gran precisión y aparecen con frecuencia en la investigación en inteligencia artificial, estadística y otras ciencias fundamentales. Fuera del contexto académico también se utilizan, por ejemplo, para apoyar a los centros sanitarios al decidir qué tratamiento requiere un paciente.
Combinando los modelos extendidos de redes bayesianas con el control de las variables de confusión, es posible determinar con claridad relaciones causales bajo ciertas hipótesis. Esto resuelve, además, situaciones aparentemente paradójicas, donde según quién o cómo se hagan los análisis de los datos se obtienen conclusiones contradictorias (lo que se conoce como la paradoja de Simpson). Además, este análisis causal es un remedio altamente efectivo frente a posibles manipulaciones, que pretenden confundir o difuminar las conclusiones de la comunidad científica, como sucedió con el tabaco en los años 70 del siglo pasado, cuando se trató de ocultar la relación entre el tabaco y el cáncer.
A pesar de las discusiones que provocó dentro de la comunidad científica, la obra de Pearl El libro del por qué: La nueva ciencia de la causa y el efecto, que se mueve entre la estadística y la filosofía, ha popularizado su lenguaje para el análisis causal. Las contribuciones de Pearl son importantes en distintos campos de la ciencia, pero además nos ayudan a obtener una nueva forma de comprender el mundo, con implicaciones directas en el bienestar y en la forma de tomar decisiones que afectan a los demás y al medio que nos rodea.
Simón Rodríguez es investigador postdoctoral en el ICMAT.
Ágata Timón G Longoria es coordinadora de la Unidad de Cultura Matemática del ICMAT.
https://elpais.com/ciencia/cafe-y-teoremas/2022-02-23/las-matematicas-del-porque-de-las-cosas.html
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario