Überblick Woche 5+6
Empirische (Un-) Abhängigkeit
Zwei Merkmale sind empirisch unabhängig voneinander, wenn in einer zweidimensionalen Häufigkeitstabelle alle bedingten Häufigkeiten gleich der relativen Randhäufigkeit sind.
Beispiel für empirische Unabhängigkeit:
=> Die Merkmale X und Y sind unabhängig
Wenn auch nur eine einzige Häufigkeit ein klein wenig von der Verteilung bei völliger Unabhängigkeit abweicht, nennt man die Merkmale empirisch abhängig.
Beispiel für empirische Abhängigkeit:
Kontingenzkoeffizient
Der Kontingenzkoeffizient ist der „Korrelationskoeffizient für nominale Merkmale“. Um den Kontingenzkoeffizient zu ermitteln, muss man zunächst Chi-Quadrat (X2) ausrechnen.
Chi-Quadrat (X2) ist eine Maßzahl für die Abweichung von der völligen Unabhängigkeit. Um also Chi-Quadrat auszurechnen, muss man erstmal wissen, wie die Soll-Häufigkeiten bei völliger Unabhängigkeit sind.
Wie also sind die Soll-Häufigkeiten? Die Soll-Häufigkeiten werden mithilfe der Randhäufigkeiten ausgerechnet.
Beispiel:
Wir multiplizieren die jeweiligen Randhäufigkeiten und teilen durch die Gesamthäufigkeit:
usw.
Jetzt haben wir die Soll-Häufigkeiten und können Chi-Quadrat (X2) ausrechenen.
Beispiel:
Glossar S.17
Der Kontingenzkoeffizent C kann jetzt anhand von X2 und der Gesamthäufigkeit n = 80 ausgerechnet werden:
Glossar S.17
Jetzt kann auch noch der korrigierte Kontingenzkoeffizent Ckorr ausgerechnet werden:
Glossar S.17
C* ist dabei der kleinere Wert aus Zeilen- und Spaltenanzahl. Wir haben 3 Zeilen und 3 Spalten, also ist C*= 3.