Correlación vs. Causalidad: Leer los datos con atención

Jazmie Jamaludin

Dos cosas se mueven juntas. Las ventas aumentan en las semanas posteriores al inicio de un boletín. Los visitantes que ven un video de producto compran con más frecuencia. Tus días de mayor actividad son también los más rentables. Es lo más natural del mundo observar patrones como estos y concluir que una cosa está causando la otra. Y a veces esa conclusión es correcta. Pero a veces está gravemente equivocada, y actuar en consecuencia desperdicia dinero, esfuerzo y confianza. Saber distinguirlas es una de las habilidades más valiosas que puede desarrollar un empresario.

Este es el centro de la diferencia entre correlación y causalidad. Correlación significa que dos cosas tienden a moverse juntas. Causalidad significa que una cosa realmente hace que la otra suceda. Son fáciles de confundir porque la causalidad siempre produce correlación, por lo que una causa real y una coincidencia pueden parecer idénticas en un gráfico. Esta guía explica cómo distinguirlas, por qué la distinción es tan importante para las decisiones y los hábitos sencillos que te impiden ser engañado por un patrón que no significa nada.

Lo que la correlación realmente te dice

Cuando dos mediciones suben y bajan juntas, están correlacionadas. La correlación es genuinamente útil: puede señalar relaciones que vale la pena investigar, y puede ayudarte a predecir una cosa a partir de otra incluso cuando no entiendas por qué. Si las ventas de helados aumentan de manera fiable cada vez que otra cosa determinada aumenta, puedes usar eso para anticipar la demanda, independientemente de la razón subyacente. La correlación es una herramienta perfectamente buena para detectar patrones y hacer pronósticos.

Lo que la correlación no puede hacer es decirte por qué existe el patrón. Guarda silencio sobre la cuestión de la causa. Dos cosas pueden moverse juntas porque una causa la otra, o porque ambas son impulsadas por una tercera cosa que no has notado, o por pura coincidencia durante el período que casualmente observaste. El gráfico se ve igual en todos los casos. Esta es la trampa: los datos te muestran el patrón pero permanecen completamente en silencio sobre la razón, y nuestro instinto es llenar ese silencio con una historia sobre la causa.

Tres causas
Una correlación puede provenir de una causa verdadera, un tercer factor oculto, o pura coincidencia.
Fuente: Nielsen Norman Group

El tercer factor oculto

La razón más común por la que una correlación engaña es una variable latente: un tercer factor que impulsa las dos cosas que estás observando. Considera un negocio que nota que los clientes que usan su aplicación móvil gastan mucho más que los que no la usan. Es tentador concluir que la aplicación causa un mayor gasto y dedicar dinero a promocionar la aplicación a todo el mundo. Pero la verdadera historia podría ser que los clientes más leales y entusiastas son tanto los que se molestan en instalar la aplicación como los que habrían gastado más de todos modos. La aplicación no causó el gasto. La lealtad causó ambas cosas.

Este patrón aparece en todas partes una vez que empiezas a buscarlo. Un tercer factor genuino, a menudo algo obvio en retrospectiva como la estación, la hora del día, el tipo de cliente o una campaña en segundo plano, impulsa silenciosamente las dos cosas que parecen conectadas. El peligro es que la falsa conclusión parece muy razonable. Nadie cuestiona "la aplicación hace que la gente gaste más" porque se ajusta a lo que esperamos. La disciplina es hacer una pausa y preguntarse qué más podría estar produciendo ambas mitades del patrón.

Coincidencia en períodos cortos

La segunda trampa es la pura casualidad. Durante cualquier período corto de tiempo, muchas cosas no relacionadas sucederán para moverse juntas sin ninguna razón. Si mides suficientes métricas, algunos pares de ellas se alinearán maravillosamente por suerte. Por eso, una correlación sorprendente descubierta al rastrear datos merece más sospecha, no menos. Cuantos más lugares busques, más probable será que encuentres una coincidencia que parezca significativa y no lo sea.

La protección contra esto es preguntarse si tenías una razón para esperar la conexión antes de verla. Una relación que predijiste de antemano, basándote en una comprensión sensata de cómo funcionan las cosas, es más digna de confianza que una que encontraste por casualidad mientras buscabas. Un patrón que se mantiene durante un período largo y en diferentes condiciones es más digno de confianza que uno que aparece en una sola ventana corta. Las coincidencias tienden a desvanecerse cuando sigues observando; las relaciones reales tienden a persistir.

Por qué dos cosas podrían moverse juntas
Explicación Qué significa para tu decisión
Una realmente causa la otra Actuar en consecuencia debería funcionar; vale la pena invertir en ello
Un tercer factor oculto impulsa ambos Actuar sobre lo incorrecto desperdicia esfuerzo
Pura coincidencia Actuar en consecuencia no logra nada

Cómo probar la causalidad real

Si la correlación por sí sola no puede probar la causa, ¿qué puede? La respuesta más fiable es un experimento controlado. Cuando cambias deliberadamente una cosa, mantienes todo lo demás lo más estable posible y observas si el resultado cambia, estás probando la causalidad directamente. Esto es exactamente lo que hace una prueba A/B bien ejecutada: al dividir aleatoriamente a tu audiencia y cambiar una variable, eliminas los terceros factores ocultos y aíslas el efecto del cambio. Si la versión con el cambio tiene un mejor rendimiento, tienes una evidencia real de causa, no solo un patrón coincidente.

Los experimentos no siempre son posibles, y cuando no lo son, aún puedes fortalecer o debilitar una afirmación causal a través de un razonamiento cuidadoso. Pregúntate si la causa precedió al efecto en el tiempo, ya que una causa no puede seguir a su efecto. Pregúntate si existe un mecanismo sensato que explique cómo una produce la otra. Pregúntate si la relación se mantiene en diferentes grupos y períodos. Nada de esto prueba la causalidad por sí solo, pero juntos te permiten juzgar cuánta confianza merece una conexión antes de apostar dinero en ella.

Cambia una cosa
Un experimento controlado es la forma más segura de pasar de la correlación a una causa genuina.
Fuente: Nielsen Norman Group

Por qué esto es importante para tu negocio

El costo de confundir correlación con causalidad es el costo de actuar basándose en una creencia falsa. Si concluyes que una aplicación provoca un mayor gasto cuando la lealtad es el verdadero impulsor, puedes gastar mucho en promocionar la aplicación y no ver ningún retorno, porque atacaste el síntoma en lugar de la causa. Si concluyes que un patrón coincidente es real, puedes construir una estrategia sobre arena. Estos errores son caros precisamente porque parecen muy razonables en ese momento, y a menudo pasan desapercibidos durante meses.

El error opuesto también importa. A veces, una causa real es descartada como mera correlación por personas que han aprendido el eslogan "correlación no es causalidad" sin aprender a sopesar la evidencia. El objetivo no es el escepticismo generalizado, sino un juicio cuidadoso: tomar los patrones lo suficientemente en serio como para investigarlos, mientras se resiste la tentación de sacar conclusiones precipitadas. Ese equilibrio es lo que separa una lectura reflexiva de los datos de la credulidad y la parálisis, y se encuentra en el centro de cualquier enfoque honesto para detectar tendencias de datos.

Causalidad inversa y la dirección de la flecha

Incluso cuando una cosa afecta genuinamente a otra, es sorprendentemente fácil equivocarse en la dirección. Supongamos que notas que los clientes que reciben muchos de tus correos electrónicos también son los que más compran. Es tentador concluir que los correos electrónicos impulsan la compra, por lo que deberías enviar más correos a todo el mundo. Pero la flecha puede apuntar en la otra dirección: tus clientes más comprometidos compran mucho y, como están comprometidos, también eligen recibir más correos electrónicos. Actuar en base a la historia inversa, inundando a los clientes no comprometidos con mensajes, podría molestarlos y no lograr nada. Preguntarse en qué dirección apunta realmente la flecha, y si podría apuntar en ambas direcciones a la vez, es una disciplina que previene toda una categoría de errores costosos.

Una prueba útil es pensar cuidadosamente sobre el tiempo y sobre lo que realmente cambiaste. Si el supuesto efecto ya estaba ocurriendo antes de la supuesta causa, la historia no puede ser correcta. Y si puedes encontrar un caso en el que la causa cambió por sí sola, sin los compañeros habituales, puedes observar si el efecto siguió. Estos pequeños actos de razonamiento no siempre darán una respuesta clara, pero separan constantemente las relaciones que sobrevivirán al contacto con la realidad de las que simplemente parecían convincentes en un gráfico.

Las muestras pequeñas hacen que las coincidencias parezcan reales

Gran parte de la falsa certeza proviene de sacar conclusiones con muy pocos datos. Cuando los números son pequeños, la aleatoriedad ordinaria produce patrones de aspecto dramático, y es fácil confundir una racha de suerte con una señal significativa. Una sola semana buena después de un cambio no prueba que el cambio funcionó, así como una sola semana mala no prueba que falló. Esperar a que se acumulen suficientes datos, y ser especialmente sospechoso de las conclusiones sólidas extraídas de un puñado de observaciones, es una de las formas más fiables de evitar ser engañado. Cuanto menor sea la muestra, más humildes deben ser tus conclusiones, y más debes tratar una relación aparente como una pregunta para investigar en lugar de una respuesta para actuar.

Hábitos prácticos que te mantienen honesto

Unos pocos hábitos sencillos son de gran ayuda. Cuando notes un patrón, anota lo que crees que lo está causando antes de actuar, luego enumera deliberadamente otras explicaciones, especialmente posibles terceros factores. Pregúntate si esperabas esta relación de antemano o si solo la encontraste buscando. Siempre que puedas, prueba tu creencia con un pequeño cambio controlado en lugar de hacer un gran compromiso basado en un gráfico. Y dale tiempo a los patrones importantes, observando si se mantienen en diferentes períodos y condiciones antes de confiar en ellos.

Sobre todo, mantente curioso en lugar de seguro. La frase "dos cosas se movieron juntas, por lo tanto, una causó la otra" siempre debe provocar una pausa. Esa pausa, repetida como un hábito, te salvará de una larga lista de errores costosos a lo largo de los años. Leer datos con atención no se trata de ser inteligente con las estadísticas. Se trata de ser honesto sobre lo que sabes y lo que no sabes, y de negarse a dejar que un gráfico ordenado te lleve a una conclusión que en realidad no puede respaldar. Es una piedra angular de un análisis de datos sólido para pequeñas empresas.

Vale la pena nombrar una trampa más, porque es muy común: el sesgo de confirmación. Cuando un patrón halaga una decisión que ya hemos tomado, o apoya una creencia que nos agrada, tendemos a aceptarlo sin el escrutinio que aplicaríamos a un resultado inconveniente. La cura es tratar los patrones que más te gustan con una sospecha adicional en lugar de menos, y buscar activamente las explicaciones que preferirías que no fueran ciertas. Una relación que sobrevive a un esfuerzo honesto por derribarla es mucho más digna de confianza que una que abrazaste simplemente porque te dijo lo que querías escuchar.

Nada de esto requiere que te conviertas en un estadístico. Solo requiere el hábito constante de hacer mejores preguntas antes de actuar. ¿Qué más podría explicar este patrón? ¿Lo esperaba de antemano o lo encontré por casualidad? ¿Se mantiene a lo largo del tiempo y en diferentes condiciones? ¿Podría la flecha apuntar en la otra dirección? ¿He reunido suficientes datos para estar seguro? Repasa esa lista corta cada vez que un gráfico te tiente a una conclusión segura, y evitarás la gran mayoría de los errores que llevan a las empresas a gastar dinero en cosas que nunca iban a funcionar.

Preguntas frecuentes

¿Es inútil la correlación si no prueba la causa?+
En absoluto. La correlación es valiosa para detectar relaciones que vale la pena investigar y para hacer predicciones. Simplemente no puede, por sí misma, decirte por qué dos cosas se mueven juntas, por lo que no debe ser la única base para una gran decisión.
¿Qué es una variable latente?+
Es un tercer factor oculto que impulsa las dos cosas que estás observando, creando una correlación que no tiene nada que ver con que una cause la otra. Detectarlas es clave para evitar conclusiones falsas.
¿Cómo puedo probar que algo causa un resultado?+
La forma más fiable es un experimento controlado, como una prueba A/B, donde cambias una cosa, mantienes todo lo demás estable y ves si el resultado cambia. Esto elimina factores ocultos y aísla el efecto real.
¿Debo desconfiar de cada patrón que encuentre?+
No. El objetivo es un juicio cuidadoso, no un escepticismo generalizado. Tómate los patrones lo suficientemente en serio como para investigarlos, pero resiste la tentación de sacar conclusiones precipitadas. Los patrones que predijiste de antemano y que se mantienen a lo largo del tiempo merecen más confianza.

Referencias

  1. Nielsen Norman Group, artículos sobre interpretación de datos y cómo evitar errores de análisis, nngroup.com
  2. Ayuda de Google Analytics, documentación sobre cómo analizar tendencias y segmentos de forma responsable, support.google.com

Para lecturas relacionadas, vea cómo una interpretación cuidadosa apoya la fiabilidad de las pruebas A/B y la significancia, cómo convertir la información en acción en análisis procesables, y los fundamentos de la mejora basada en datos.

Si deseas ayuda para leer tus datos con confianza, explora nuestros servicios de análisis de datos o ponte en contacto para discutir tus preguntas.

Regresar al blog

AUTOMATICE. OPTIMICE. DOMINE.

Optimice sus operaciones y ofrezca una experiencia de cliente fluida. Deje que nuestros expertos implementen tecnología de vanguardia y flujos de trabajo optimizados para que pueda concentrarse en lo que mejor sabe hacer.