Korrelation vs. Kausalität: Daten sorgfältig lesen
Jazmie JamaludinZwei Dinge bewegen sich gemeinsam. Die Verkaufszahlen steigen in den Wochen, nachdem Sie einen Newsletter gestartet haben. Besucher, die sich ein Produktvideo ansehen, kaufen häufiger. Ihre geschäftigsten Tage sind auch Ihre profitabelsten. Es ist das Natürlichste auf der Welt, solche Muster zu betrachten und daraus zu schließen, dass das eine das andere verursacht. Und manchmal ist diese Schlussfolgerung richtig. Aber manchmal ist sie völlig falsch, und darauf zu handeln, verschwendet Geld, Mühe und Vertrauen. Die beiden auseinanderzuhalten, ist eine der wertvollsten Fähigkeiten, die ein Geschäftsinhaber entwickeln kann.
Dies ist der Kern des Unterschieds zwischen Korrelation und Kausalität. Korrelation bedeutet, dass zwei Dinge dazu neigen, sich gemeinsam zu bewegen. Kausalität bedeutet, dass das eine das andere tatsächlich hervorruft. Sie sind leicht zu verwechseln, weil Kausalität immer Korrelation erzeugt, sodass eine echte Ursache und ein Zufall in einem Diagramm identisch aussehen können. Dieser Leitfaden erklärt, wie man sie auseinanderhält, warum der Unterschied für Entscheidungen so wichtig ist, und welche einfachen Gewohnheiten Sie davor bewahren, von einem bedeutungslosen Muster getäuscht zu werden.
Was Korrelation wirklich aussagt
Wenn zwei Messungen gemeinsam steigen und fallen, sind sie korreliert. Korrelation ist tatsächlich nützlich: Sie kann Sie auf untersuchenswerte Beziehungen hinweisen und Ihnen helfen, eine Sache aus einer anderen vorherzusagen, selbst wenn Sie den Grund nicht verstehen. Wenn der Eiscremeabsatz zuverlässig steigt, wann immer etwas anderes steigt, können Sie dies nutzen, um die Nachfrage zu antizipieren, unabhängig vom zugrunde liegenden Grund. Korrelation ist ein ausgezeichnetes Werkzeug, um Muster zu erkennen und Vorhersagen zu treffen.
Was Korrelation nicht leisten kann, ist Ihnen zu sagen, warum das Muster existiert. Sie schweigt zur Frage der Ursache. Zwei Dinge können sich gemeinsam bewegen, weil das eine das andere verursacht, oder weil beide von einer dritten Sache angetrieben werden, die Sie nicht bemerkt haben, oder aus reinem Zufall über den Zeitraum, den Sie betrachtet haben. Das Diagramm sieht in jedem Fall gleich aus. Dies ist die Falle: Die Daten zeigen Ihnen das Muster, schweigen aber völlig über den Grund, und unser Instinkt ist es, dieses Schweigen mit einer Geschichte über die Ursache zu füllen.
Der verborgene dritte Faktor
Der häufigste Grund, warum eine Korrelation irreführt, ist eine verborgene Variable: ein dritter Faktor, der beide Dinge antreibt, die Sie beobachten. Stellen Sie sich ein Unternehmen vor, das feststellt, dass Kunden, die seine mobile App nutzen, viel mehr ausgeben als diejenigen, die dies nicht tun. Es ist verlockend zu schlussfolgern, dass die App höhere Ausgaben verursacht, und viel Geld in die Bewerbung der App bei allen zu investieren. Aber die wahre Geschichte könnte sein, dass die treuesten, enthusiastischsten Kunden sowohl diejenigen sind, die sich die Mühe machen, die App zu installieren, als auch diejenigen, die sowieso mehr ausgegeben hätten. Die App hat die Ausgaben nicht verursacht. Die Loyalität hat beides verursacht.
Dieses Muster taucht überall auf, sobald man anfängt, danach zu suchen. Ein echter dritter Faktor, oft etwas im Nachhinein Offensichtliches wie die Jahreszeit, die Tageszeit, der Kundentyp oder eine im Hintergrund laufende Kampagne, treibt leise beide Dinge an, die scheinbar miteinander verbunden sind. Die Gefahr besteht darin, dass die falsche Schlussfolgerung so vernünftig erscheint. Niemand stellt in Frage „die App lässt die Leute mehr ausgeben“, weil es dem entspricht, was wir erwarten. Die Disziplin besteht darin, innezuhalten und zu fragen, was sonst noch beide Hälften des Musters erzeugen könnte.
Zufall über kurze Zeiträume
Die zweite Falle ist der reine Zufall. Über einen kurzen Zeitraum hinweg werden sich viele unzusammenhängende Dinge ohne jeden Grund gemeinsam bewegen. Wenn Sie genügend Metriken messen, werden einige Paare davon zufällig wunderschön übereinstimmen. Deshalb verdient eine auffällige Korrelation, die durch das Durchsuchen von Daten entdeckt wurde, mehr Misstrauen, nicht weniger. Je mehr Orte Sie betrachten, desto wahrscheinlicher ist es, dass Sie eine scheinbar bedeutungsvolle Koinzidenz finden, die es aber nicht ist.
Der Schutz davor ist die Frage, ob Sie einen Grund hatten, die Verbindung zu erwarten, bevor Sie sie sahen. Eine Beziehung, die Sie im Voraus auf der Grundlage eines vernünftigen Verständnisses der Funktionsweise der Dinge vorhergesagt haben, ist vertrauenswürdiger als eine, auf die Sie beim Suchen gestoßen sind. Ein Muster, das über einen langen Zeitraum und unter verschiedenen Bedingungen Bestand hat, ist vertrauenswürdiger als eines, das in einem einzigen kurzen Zeitfenster auftritt. Zufälle zerfallen tendenziell, wenn man sie weiter beobachtet; echte Beziehungen bleiben tendenziell bestehen.
| Erklärung | Was es für Ihre Entscheidung bedeutet |
|---|---|
| Eines verursacht wirklich das andere | Handeln sollte funktionieren; lohnenswert zu investieren |
| Ein verborgener dritter Faktor treibt beides an | Handeln auf das Falsche verschwendet Mühe |
| Reiner Zufall | Handeln erreicht überhaupt nichts |
Wie man echte Kausalität testet
Wenn Korrelation allein keine Ursache beweisen kann, was dann? Die zuverlässigste Antwort ist ein kontrolliertes Experiment. Wenn Sie bewusst eine Sache ändern, alles andere so konstant wie möglich halten und beobachten, ob sich das Ergebnis ändert, testen Sie die Kausalität direkt. Genau das leistet ein gut durchgeführtes A/B-Testing: Indem Sie Ihr Publikum zufällig aufteilen und eine Variable ändern, eliminieren Sie verborgene dritte Faktoren und isolieren den Effekt der Änderung. Wenn die Version mit der Änderung besser abschneidet, haben Sie einen echten Beweis für die Ursache, nicht nur ein zufälliges Muster.
Experimente sind nicht immer möglich, und wenn sie es nicht sind, können Sie eine kausale Behauptung durch sorgfältiges Denken immer noch stärken oder schwächen. Fragen Sie, ob die Ursache zeitlich vor dem Effekt lag, da eine Ursache ihrem Effekt nicht folgen kann. Fragen Sie, ob es einen vernünftigen Mechanismus gibt, der erklären würde, wie das eine das andere hervorbringt. Fragen Sie, ob die Beziehung über verschiedene Gruppen und Zeiträume hinweg Bestand hat. Nichts davon beweist die Kausalität allein, aber zusammen ermöglichen sie es Ihnen zu beurteilen, wie viel Vertrauen eine Verbindung verdient, bevor Sie Geld darauf setzen.
Warum dies für Ihr Unternehmen wichtig ist
Die Kosten der Verwechslung von Korrelation mit Kausalität sind die Kosten des Handelns auf der Grundlage eines falschen Glaubens. Wenn Sie schlussfolgern, dass eine App höhere Ausgaben verursacht, während Loyalität der wahre Treiber ist, investieren Sie möglicherweise stark in die Bewerbung der App und sehen keinen Ertrag, weil Sie das Symptom statt die Ursache angegangen sind. Wenn Sie schlussfolgern, dass ein zufälliges Muster real ist, bauen Sie möglicherweise eine Strategie auf Sand. Diese Fehler sind gerade deshalb teuer, weil sie zum Zeitpunkt so vernünftig erscheinen, und sie bleiben oft monatelang ununtersucht.
Der entgegengesetzte Fehler ist ebenfalls wichtig. Manchmal wird eine echte Ursache von Menschen als bloße Korrelation abgetan, die den Slogan „Korrelation ist keine Kausalität“ gelernt haben, ohne gelernt zu haben, wie man Beweise abwägt. Ziel ist nicht pauschale Skepsis, sondern sorgfältiges Urteilsvermögen: Muster ernst genug nehmen, um sie zu untersuchen, während man dem Drang widersteht, sofort zu Schlussfolgerungen zu springen. Dieses Gleichgewicht trennt eine durchdachte Dateninterpretation von sowohl Leichtgläubigkeit als auch Lähmung und steht im Mittelpunkt jedes ehrlichen Ansatzes zur Erkennung von Datentrends.
Umgekehrte Kausalität und die Richtung des Pfeils
Selbst wenn eine Sache eine andere wirklich beeinflusst, ist es überraschend einfach, die Richtung falsch einzuschätzen. Angenommen, Sie stellen fest, dass Kunden, die viele Ihrer E-Mails erhalten, auch am meisten kaufen. Es ist verlockend zu schlussfolgern, dass die E-Mails den Kauf antreiben, und Sie daher alle mehr E-Mails schicken sollten. Aber der Pfeil könnte in die andere Richtung zeigen: Ihre engagiertesten Kunden kaufen viel und, weil sie engagiert sind, entscheiden sie sich auch dafür, mehr E-Mails zu erhalten. Das Handeln nach der umgekehrten Geschichte, indem man unengagierte Kunden mit Nachrichten überschwemmt, könnte sie verärgern und nichts bewirken. Die Frage, in welche Richtung der Pfeil wirklich zeigt und ob er vielleicht in beide Richtungen gleichzeitig zeigt, ist eine Disziplin, die eine ganze Kategorie teurer Fehler verhindert.
Ein nützlicher Test besteht darin, sorgfältig über den Zeitpunkt und darüber nachzudenken, was Sie tatsächlich geändert haben. Wenn der vermeintliche Effekt bereits vor der vermeintlichen Ursache eingetreten ist, kann die Geschichte nicht stimmen. Und wenn Sie einen Fall finden, in dem sich die Ursache allein geändert hat, ohne die üblichen Begleiter, können Sie beobachten, ob der Effekt gefolgt ist. Diese kleinen Denkakte werden nicht immer eine klare Antwort liefern, aber sie trennen stetig die Beziehungen, die den Kontakt mit der Realität überleben werden, von denen, die nur auf einem Diagramm überzeugend aussahen.
Kleine Stichproben lassen Zufälle real erscheinen
Ein großer Teil falscher Gewissheit entsteht durch das Ziehen von Schlussfolgerungen aus zu wenigen Daten. Wenn die Zahlen klein sind, erzeugt gewöhnliche Zufälligkeit dramatisch aussehende Muster, und es ist leicht, einen Glücksfall mit einem bedeutungsvollen Signal zu verwechseln. Eine einzige gute Woche nach einer Änderung beweist nicht, dass die Änderung funktioniert hat, genauso wenig wie eine einzige schlechte Woche beweist, dass sie fehlgeschlagen ist. Auf genügend Daten zu warten und besonders misstrauisch gegenüber starken Schlussfolgerungen zu sein, die aus einer Handvoll Beobachtungen gezogen werden, ist eine der zuverlässigsten Möglichkeiten, sich nicht täuschen zu lassen. Je kleiner die Stichprobe, desto bescheidener sollten Ihre Schlussfolgerungen sein, und desto mehr sollten Sie eine scheinbare Beziehung als Frage zur Untersuchung und nicht als Antwort zum Handeln behandeln.
Praktische Gewohnheiten, die Sie ehrlich halten
Einige einfache Gewohnheiten reichen weit. Wenn Sie ein Muster bemerken, schreiben Sie auf, was Sie für die Ursache halten, bevor Sie handeln, und listen Sie dann bewusst andere Erklärungen auf, insbesondere mögliche dritte Faktoren. Fragen Sie sich, ob Sie diese Beziehung im Voraus erwartet haben oder sie nur durch Suchen gefunden haben. Wo immer Sie können, testen Sie Ihre Annahme mit einer kleinen kontrollierten Änderung, anstatt eine große Verpflichtung auf der Grundlage eines Diagramms einzugehen. Und geben Sie wichtigen Mustern Zeit, indem Sie beobachten, ob sie über verschiedene Zeiträume und Bedingungen hinweg Bestand haben, bevor Sie ihnen vertrauen.
Vor allem: Bleiben Sie neugierig statt gewiss. Der Satz „zwei Dinge bewegten sich zusammen, also verursachte das eine das andere“ sollte immer eine Pause auslösen. Diese Pause, als Gewohnheit wiederholt, wird Sie über die Jahre vor einer langen Liste kostspieliger Fehler bewahren. Daten sorgfältig zu lesen bedeutet nicht, clever mit Statistiken umzugehen. Es bedeutet, ehrlich zu sein, was Sie wissen und was nicht, und sich nicht von einem ordentlichen Diagramm zu einer Schlussfolgerung überreden zu lassen, die es eigentlich nicht stützen kann. Es ist ein Grundpfeiler einer soliden Datenanalyse für kleinere Unternehmen.
Es lohnt sich, noch eine Falle zu nennen, denn sie ist so verbreitet: die Bestätigungsfehler. Wenn ein Muster eine Entscheidung schmeichelt, die wir bereits getroffen haben, oder einen Glauben stützt, den wir hegen, neigen wir dazu, es ohne die Überprüfung zu akzeptieren, die wir bei einem unbequemen Ergebnis anwenden würden. Das Heilmittel besteht darin, die Muster, die Ihnen am besten gefallen, mit besonderer Skepsis zu behandeln, anstatt mit weniger, und aktiv nach Erklärungen zu suchen, die Sie lieber nicht wahrhaben möchten. Eine Beziehung, die einen ehrlichen Versuch überlebt, sie zu widerlegen, ist weitaus vertrauenswürdiger als eine, die Sie einfach angenommen haben, weil sie Ihnen sagte, was Sie hören wollten.
Nichts davon erfordert, dass Sie ein Statistiker werden. Es erfordert lediglich die stetige Gewohnheit, bessere Fragen zu stellen, bevor Sie handeln. Was könnte dieses Muster noch erklären? Habe ich es im Voraus erwartet oder bin ich zufällig darauf gestoßen? Hält es über die Zeit und unter verschiedenen Bedingungen stand? Könnte der Pfeil in die andere Richtung zeigen? Habe ich genug Daten gesammelt, um sicher zu sein? Gehen Sie diese kurze Liste durch, wann immer ein Diagramm Sie zu einer selbstbewussten Schlussfolgerung verführt, und Sie werden die meisten Fehler vermeiden, die Unternehmen dazu bringen, Geld für Dinge auszugeben, die niemals funktionieren würden.
Häufig gestellte Fragen
Ist Korrelation nutzlos, wenn sie keine Ursache beweist?+
Was ist eine verborgene Variable?+
Wie kann ich tatsächlich beweisen, dass etwas ein Ergebnis verursacht?+
Sollte ich jedem Muster misstrauen, das ich finde?+
Referenzen
- Nielsen Norman Group, Artikel zur Dateninterpretation und zur Vermeidung von Analysefehlern, nngroup.com
- Google Analytics Hilfe, Dokumentation zur verantwortungsvollen Analyse von Trends und Segmenten, support.google.com
Für weiterführende Lektüre sehen Sie, wie eine sorgfältige Interpretation zuverlässige A/B-Tests und Signifikanz unterstützt, wie Sie Erkenntnisse in Handlungen umsetzen in umsetzbarer Analytik und die Grundlagen der datengesteuerten Verbesserung.
Wenn Sie Hilfe bei der sicheren Auswertung Ihrer Daten wünschen, erkunden Sie unsere Datenanalyse-Dienstleistungen oder kontaktieren Sie uns, um Ihre Fragen zu besprechen.