Statistik VL 6: Korrelation und linearer Zusammenhang

Statistik M3, HS2014 Universität Basel

Statistik M3, HS2014 Universität Basel


Kartei Details

Karten 17
Sprache Deutsch
Kategorie Sport
Stufe Universität
Erstellt / Aktualisiert 17.01.2015 / 27.12.2015
Weblink
https://card2brain.ch/box/statistik_vl_6_korrelation_und_linearer_zusammenhang
Einbinden
<iframe src="https://card2brain.ch/box/statistik_vl_6_korrelation_und_linearer_zusammenhang/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

wann ist eine positive Korrelation (bzw. Kovarianz gegeben?

wenn ein hoher Wert auf einer Variable häufig mit einem hohen Wert einer anderen einhergeht.

zB Optimismus + Risikobereitschaft

wann ist eine negative Korrelation (bzw. Kovarianz) gegeben?

wenn ein hoher Wert auf einer Variable häufig mit einem niedrigen Wert einer anderen einhergeht.

zB Optimismus + Ängstlichkeit

Wie kann das Ausmass eines linearen Zusammenhangs klassifiziert werden?

small: -0.29 bis -0.1 = negativ / 0.10 bis 0.29 = positiv

medium: -0.49 bis -0.3 = negativ / 0.30 bis 0.49 = positiv

large: -1.00 bis -0.50 = negativ / 0.50 bis 1.00 = positiv

Wofür wird die Kovarianz benötigt?

= gemeinsame Varianz

zur Herleitung der Korrelation

Wovon hängt die Kovarianz ab?

von der Skalierung der beteiligten Variablen

> Kovarianzen dürfen nicht direkt interpretiert oder zwischen Untersuchungen verglichen werden

deshalb wird sie standardisiert! Standardisierte Kovarianz = Korrelationskoeffizient

Was ist der Korrelationskoeffizient?

standardisierte Kovarianz

Was versteht man unter Heteroskedastizität?

Varianzheterogenität > unterschiedliche Streuung innerhalb einer Datenmessung

typisches Beispiel wenn bei einer Zeitreihe die Abweichungen von der Trendgerade mit Fortlauf der Zeit steigen zB für Treffergenauigkeit der Wettervorhersage. Je weiter in der Zukunft, desto unwahrscheinlicher ist eine genaue Prognose.

Was versteht man unter Homoskedastizität?

wenn Varianzen der Variablen nicht signifikant unterschiedlich sind.

Was ist der Determinations-Koeffizient?

die quadrierte Korrelation r2

er beschreibt den relativen Anteil der gemeinsamen Varianz von zwei Merkmalen.

je grösser der r2 Wert, umso stärker überlappen sich die Kreise

Was bedeutet ein r2 Wert von 0.64?

ab 0.64 überlappt sich mehr als die Hälfte der beiden Varianzen

Was ist eine Scheinkorrelation?

hier wird nicht von einer Kausalität ausgegangen.

zB Handicap eines Golfers hängt nicht mit Rentabilität eines Unternehmens zusammen.

Was braucht man um Kausalitäten zu haben?

meherere Messzeitpunkte, Kontrollgruppen etc.

aus deskripitiver Beobachtung kann und darf nicht auf Kausalität geschlossen werden!

Was kann über diese Grafik ausgesagt werden?

Stichprobe mit zu kleiner Streubreite.

Wichtig wäre hier zB die Einschätzung der Konfidenzintervalle um zu beurteilen, wie sicher der Parameter abgebildet wird.

Was ist wichtig bzgl. der Interpretation von Korrelationen?

Korrelationen zeigen nur statistischen Zusammenhang. Sie dürfen nicht als Beweis für Kausalität verwendet werden!

was bewirkt eine Überhöhung der Korrelation?

heterogene Stichprobe

Ausreisser

heterogene Untergruppen

was bewirkt eine Absenkung der Korrelation?

nicht-lineare Zusammenhänge

Ausreisser

Messungenauigkeit

homogene, kleine Stichprobe

Was ist der Phi-Koeffizient?

gibt eine Korrelation von dichotomen Variablen an, die der Produkt-Moment Korrelation über die zugrundeliegenden Binärdaten entspricht.

zB Messen der Assoziation zwischen Zustimmung zu oder Ablehnung einer Politikentscheidung und dem Geschlecht