Lernkartei Multivariate Statistik und Datenanalyse: Inferenzstatistik (Seite 1 von 2)

Karten	70
Lernende	11
Sprache	Deutsch
Kategorie	Psychologie
Stufe	Universität
Erstellt / Aktualisiert	18.01.2019 / 19.07.2024
Weblink	https://card2brain.ch/box/20190118_multivariate_statistik_cnVo
Einbinden	<iframe src="https://card2brain.ch/box/20190118_multivariate_statistik_cnVo/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was bedeutet es, dass ein Verfahren „robust“ ist?

Verfahren, deren Ergebnisse nicht oder nur wenig durch Ausreißerwerte beeinflusst werden.

Robustheit eines Verfahrens

D.h. dass Verfahren nicht stark auf Verletzung seiner Annahmen reagiert

Standardisierte Effektstärken

Um Größe des Effekts zu quantifizieren, sodass er mit anderen Effekten verglichen werden kann.

Cohens d

< .3 kleiner Effekt

.3 bis .8 mittlerer Effekt

> .8 großer Effekt

Was ist eine Stichprobenkennwertverteilung?

Was ist eine Stichprobe?

Teilmenge einer Grundgesamtheit

vs. Population (Grundgesamtheit)

Was ist damit gemeint, dass ein bestimmter Stichprobenkennwert „erwartungstreu“ ist?

Damit ist gemeint, dass der Erwartungswert eines bestimmten Stichprobenkennwertes dem Parameter der Population entspricht.

Was genau ist ein p-Wert?

Wahrscheinlichkeit, ein empirisches Ergebnis (oder ein noch stärker gegen die Nullhypothese sprechendes Ergebnis) unter der Nullhypothese zu finden.

Formal handelt es sich um die bedingte Wahrscheinlichkeit:

Wie funktionieren Resampling-Verfahren?

Aus der vorliegenden Stichprobe („sample“) werden erneut Stichproben gezogen.

Ziel ist es, die Verteilung der Prüfgröße oder der Stichprobenkennwerte empirisch zu bestimmen.

Zwei Ansätze werden unterschieden:

– Bootstrapping
– Rerandomisierung

Was ist mit der Annahme „missing at random“ (MAR) gemeint?

Bei dieser Ausfallsart ist der Ausfall systematisch, man kennt aber den Ausfallprozess und kann die Ausfallsrate anhand von erhobenen Variablen (X) vorhersagen.

Im Februar (Y) wurden nur die 7 Personen einbestellt und gemessen, die im Januar Bluthochdruck hatten (X > 140).

Was ist mit der Annahme „missing completely at random“ (MCAR) gemeint?

Ob ein Wert fehlt oder nicht hängt weder von der betrachteten Variablen selbst (Y) noch von anderen erfassten Variablen (X) ab.

Im Februar (Y) wurden nur 7 zufällig ausgewählte Personen (23%) einbestellt und gemessen

Was ist mit der Annahme „missing not at random“ (MNAR) gemeint?

Fehlende Werte hängen von der Ausprägung der betrachteten Variablen (Y) selbst ab. Dieser Zusammenhang kann von anderen Variablen (X) nicht (vollständig) erklärt werden

Im Februar (Y) wurden nur Messungen von den 7 Personen notiert, die im Februar Bluthochdruck hatten (Y > 140)

Welches R-Fenster ist zu sehen?

R-Skript

Welches R-Fenster ist zu sehen?

Objektumgebung

Welches R-Fenster ist zu sehen?

Plot-Output

Wozu dient die Raute? #

Das Skript wird automatisch ausgeführt

Die Zeile mit # erscheint nicht im Output

Zum Vermerk eigener Kommentare im Skript

Zur Installation von einem Package

Was passiert beim Klicken auf dieses Symbol?

Nur Datensätze werden aus der Objektumgebung gelöscht

Der Output wird gelöscht

Das Skript wird komplett ausgeführt

Alle Objekte werden aus der Objektumgebung gelöscht

Was bedeutet dieser Befehl in R: setwd("C:/Users/Student/Desktop/RDaten/")?

Zu Beginn jedes R-Skriptes wird das Arbeitsverzeichnis festleget (set working directory), in dem alle relevanten Daten gespeichert sind.

Was steht in der Klammer?

Objekt

Funktion

Argumente

Skript

Aus was bestehen Befehle in R?

Befehle bestehen aus

Funktionen,

obligatorische Argumente

und optionale Argumente (werden in den Klammern meist durch Kommata getrennt)

Ohne obligatorische Argumente funktioniert ein Befehl nicht→mindestens einobligatorisches Argument wird benötigt!

data <- read.table("stepd.csv", header = TRUE, sep = ";", dec = ".", na = -99)

Welcher Fehler wurde begangen?

Keiner

Fehlender Werte wurden falsch kodiert

header = FALSE

Der Datensatz ist ungeeignet

Welcher Fehler wurde im folgenden Befehl gemacht?

Erstis <- read.table( “Erstis.dat”, header = TRUE, sep = “\t”, dec = “.”, na = -99)

na = -9

Was kann man sich durch folgenden Befehl in R anzeigen lassen?

colnames(dat)

Variablenansicht

dat[15,3]

Werte der Zeile 15 in Spalte 3 anzeigen

colnames(dat[,5:10])

Variablennamen der Spalten 5 bis 10

view(dfSummary(dat)

wichtigste Informationen des Datensatzes anzeigen lassen

Mögliche Skalenniveaus

- Metrisch (z.B. Alter)

− Ordinal (z.B. Schulnoten)

− Nominal (z.B. Geschlecht)

Variablen, die Zahlen enthalten, werden in R automatisch als ordinale Variablen eingelesen.

richtig

falsch

class(data$Variable)

Objektklasse überprüfen:

− metrische Variablen: „integer“ / „double“ / „numeric“

− kategoriale Variablen: „factor“

Variablen welcher Skalenniveaus müssen zum Faktor umkodiert werden?

Metrisches Skalenniveau

Ordinales Skalenniveau

Nominales Skalenniveau

Welche Funktion hat der Zuweisungspfeil „<-“ in R?

Der Zuweisungspfeil „<-“ überschreibt die alte Variable.

Alternative: die Variable vor dem Zuweisungspfeil umbenennen
(z.B.: data$Variable.factor <- factor(data$Variable)), um dem Datensatz eine neue Variable hinzuzufügen

Welche Funktionen haben labels und levels in R?

-> Umkodieren von Zahlenwerten in Labels

data$Variable<-factor(data$Variable,levels<-c(1,2,3),labels<-c(“A“,“B“,“C“))

- neue labels mit Anführungszeichen umschließen

− die Reihenfolge der Zahlen und der Labels in den Klammern müssen übereinstimmen!

data$Variable_neu <- recode(data$Variable, "Ausgangswert = neue Bezeichnung")

dat$age.neu <- recode(dat$age, " 18:29='jung'; 30:50='mittelalt'; 51:63='alt‘ ")

Umpolen und Rekodieren von Variablen (indem man die ursprüngliche Variable von einem sinnvollen Wert abzieht und als neue Variable speichert)

Die Ausprägung der Variable „age“ reicht von 18 bis 63. Erstellt wird eine neue Variable, die alle von 18 bis 29 als „jung“, alle von 30 bis 50 als „mittelalt“ und alle von 51 bis 63 als „alt“ bezeichnet.

data$Variable.mean <- rowMeans(data[,c(„Variable1", „Variable2",„Variable3")], na.rm = TRUE)

Mittelwert von Variablen bilden

data$Variable.sum <- rowSums(data[,Spalte von:Spalte bis], na.rm = TRUE)

colnames(dat)
dat$exp_sum <- rowSums(dat[,16:17], na.rm=TRUE)

Summe von Variablen bilden

Summe der Variablen „exp_succes“ und „exp_content“ wird gebildet und als neue Variable exp_sum gespeichert. Vorher werden mit der colnames-Funktion die entsprechenden Spalten herausgesucht.

Was versteht man unter Robustheit eines Verfahrens?

Fehlende Werte haben wenig Einfluss auf das Ergebnis

Valide Ergebnisse sind zu erwarten, auch wenn einige Annahmen nicht zutreffen

Alle Grundannahmen müssen zutreffen, dann liegt Robustheit vor

Ausreißer haben wenig Einfluss auf das Ergebnis

Was versteht man unter robusten Verfahren?

Fehlende Werte haben wenig Einfluss auf das Ergebnis

Ausreißer müssen vor der Analyse unbedingt ausgeschlossen werden, um ein robustes Verfahren zu erhalten

Alle Grundannahmen müssen zutreffen, dann liegt ein robustes Verfahren vor

Ausreißer haben wenig Einfluss auf das Ergebnis

Was ist der Klumpeneffekt?

Klumpen(stichproben) haben keinen besonderen Effekt

Die Stichprobe kann sinnvoll in Klumpen zusammengefasst werden, z.B. Schulklassen

Ergebnisse sind ungenauer, wenn Personen innerhalb eines Klumpen sich ähneln

Ergebnisse sind genauer, wenn Personen innerhalb eines Klumpens sich ähneln

Fehlende Werte hängen von den nicht erhobenen Werten ab, selbst nach Kontrolle durch erhobene Variablen.

Welcher Fehler liegt vor?

MCAR

MNAR

MAR

Was sind die Voraussetzungen für einen t-Test?

- Normalverteilung

- Varianzhomogenität

Wofür t-Test?

z.B. um Mittelwertsunterschiede auf Signifikanz zu testen

- > lässt dann Schlussfolgerung auf zugrundeliegende Population zu

Multivariate Statistik und Datenanalyse: Inferenzstatistik

Lernkarteien erstellen oder kopieren

Lernkarteien erstellen oder kopieren

Melde dich an, um alle Karten zu sehen.

SWITCHaai

Office 365

Edulog

Apple ID

Google