miércoles, 24 de diciembre de 2014

Una forma de distinguir entre causalidad y correlación

Los matemáticos finalmente han descubierto la manera de distinguir la correlación de la causalidad

Gracias, estadísticas. (TaxRebate.org.uk) - QZ




Zach Wener-Fligner

Desenredar causa y efecto pueden ser endiabladamente difícil.Imagine un pequeño pueblo en las llanuras. Cada día, los molinos de viento giran, y el viento soplaba, haciendo entrar polvo en los ojos de todos. Las cosas siguieron así durante algún tiempo: los molinos de viento giraban, el viento soplaba. Así que la gente del pueblo, siendo gente lógicas, finalmente decidió que era suficiente y derribaron todos los molinos de viento.

Es fácil para nosotros ver cuando éstas tontas ficciones de gente del pueblo que salieron mal: viento hace girar los molinos de viento, y no al revés.
Pero hay muchos ejemplos del mundo real más matizados donde es más difícil distinguir la causalidad de la correlación. Un estudio de 1999 concluyó que dormir con una luz de noche como un niño llevó a la miopía. Esto mas tarde se demostró falso: de hecho, la miopía es genética, y los padres miopes con más frecuencia colocan luces de noche en las habitaciones de sus hijos.
Otro ejemplo se refiere al colesterol HDL. Este colesterol "bueno" se asocia con menores tasas de enfermedades del corazón. Pero los medicamentos para enfermedades cardiacas que elevan el colesterol HDL son ineficaces. ¿Por qué? Resulta que mientras que el colesterol HDL es un subproducto de un corazón sano, no causa realmente la salud del corazón.
Las correlaciones son una moneda de diez centavos por docena, inconcluyentes y endebles. Las relaciones causales son firmes y accionables y se alinean de forma más convincente con la forma natural que pensamos sobre las cosas.
Encontrar correlaciones es fácil, de hecho, hay un proyecto llamado espurios correlaciones que busca automáticamente a través de los datos públicos de seguirles la pista, no importa lo absurda que se encuentren.



Por el contrario, la determinación de relaciones causales es muy duro. Pero las técnicas descritas en un nuevo prometedor documento para hacer precisamente eso. La intuición básica detrás del método demostrado por el Prof. Joris Mooij de la Universidad de Amsterdam y sus coautores es sorprendentemente simple: si un evento influye en otro, entonces el ruido aleatorio en el evento que causa se verá reflejado en el evento afectada.
Por ejemplo, supongamos que estamos tratando de determinar la relación entre el la cantidad de tráfico de la carretera, y el tiempo que tarda John para ir al trabajo. Tanto tiempo de viaje de John y el tráfico en la carretera fluctuarán un poco aleatoriamente: a veces John llegará a la luz roja a la vuelta de la esquina, y perderá cinco minutos extra; a veces el clima helado ralentizará las carreteras.

Pero la idea clave es que la fluctuación aleatoria en el tráfico afectará el tiempo de viaje de John, mientras que la fluctuación aleatoria en el tiempo de viaje de John no afectará al tráfico. Al detectar el residuo de la fluctuación del tráfico en tiempo de viaje de John, hemos podido demostrar que el tráfico provoca que su tiempo de viaje a los cambios, y no al revés.

Sin embargo, este método no es una bala de plata. Como cualquier prueba estadística, no funciona el 100% del tiempo. Y sólo puede manejar las situaciones más básicas de causa y efecto. En un evento de tres situaciones -similar a la correlación de consumo de helado con muertes por ahogamiento, ya que ambos dependen de lo caliente que esté el clima-esta técnica se tambalea.

En cualquier caso, es un importante paso adelante en el campo a menudo desconcertante de las estadísticas. Y esa es la causa, sí, de celebración.

No hay comentarios:

Publicar un comentario en la entrada