Abhängigkeiten zwischen Variablen

Der erste Schritt einer Datenanalyse kann es sein, die Wirkungszusammenhänge zwischen den einzelnen Variablen zu untersuchen. Aufgrund der intuitiven Interpretierbarkeit und der guten Darstellbarkeit können Entscheidungsbäume verwendet werden. Für jede Variable, deren Abhängigkeit von den anderen Variablen untersucht werden soll, kann ein Baum erstellt werden. Die jeweils anderen Variablen können nun in dem Entscheidungsbaum auftauchen, wenn sie zur Erklärung der Variable nützlich sind.

Idee der Bayes-Netze

In Bayes-Netzen werden Wahrscheinlichkeitsbeziehungen zwischen Variablen analysiert und veranschaulicht. Die Wahrscheinlichkeit für eine Variablenausprägung in Abhängigkeit von der Ausprägung anderer Variablen (bedingte Wahrscheinlichkeit) wird aus den Daten geschätzt. Das zentrale Ergebnis ist ein Graph, in dem je zwei Variablen miteinander verbunden sind, wenn sie voneinander abhängen. Diese Verbindungen können auch gerichtet sein und angeben, wie die Variablen sich beeinflussen. Im Idealfall kann ein Bayes-Netz sogar kausal interpretiert werden.