PHB 18/19
Kartei Details
Karten | 70 |
---|---|
Lernende | 11 |
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 18.01.2019 / 19.07.2024 |
Weblink |
https://card2brain.ch/box/20190118_multivariate_statistik_cnVo
|
Einbinden |
<iframe src="https://card2brain.ch/box/20190118_multivariate_statistik_cnVo/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was bedeutet es, dass ein Verfahren „robust“ ist?
Verfahren, deren Ergebnisse nicht oder nur wenig durch Ausreißerwerte beeinflusst werden.
Robustheit eines Verfahrens
D.h. dass Verfahren nicht stark auf Verletzung seiner Annahmen reagiert
Standardisierte Effektstärken
Um Größe des Effekts zu quantifizieren, sodass er mit anderen Effekten verglichen werden kann.
Cohens d
< .3 kleiner Effekt
.3 bis .8 mittlerer Effekt
> .8 großer Effekt
Was ist eine Stichprobe?
Teilmenge einer Grundgesamtheit
vs. Population (Grundgesamtheit)
Was ist damit gemeint, dass ein bestimmter Stichprobenkennwert „erwartungstreu“ ist?
Damit ist gemeint, dass der Erwartungswert eines bestimmten Stichprobenkennwertes dem Parameter der Population entspricht.
Wie funktionieren Resampling-Verfahren?
Aus der vorliegenden Stichprobe („sample“) werden erneut Stichproben gezogen.
Ziel ist es, die Verteilung der Prüfgröße oder der Stichprobenkennwerte empirisch zu bestimmen.
Zwei Ansätze werden unterschieden:
– Bootstrapping
– Rerandomisierung
Was ist mit der Annahme „missing at random“ (MAR) gemeint?
Was ist mit der Annahme „missing not at random“ (MNAR) gemeint?
Wozu dient die Raute? #
Was bedeutet dieser Befehl in R: setwd("C:/Users/Student/Desktop/RDaten/")?
Zu Beginn jedes R-Skriptes wird das Arbeitsverzeichnis festleget (set working directory), in dem alle relevanten Daten gespeichert sind.
Aus was bestehen Befehle in R?
Befehle bestehen aus
Funktionen,
obligatorische Argumente
und optionale Argumente (werden in den Klammern meist durch Kommata getrennt)
Ohne obligatorische Argumente funktioniert ein Befehl nicht→mindestens einobligatorisches Argument wird benötigt!
data <- read.table("stepd.csv", header = TRUE, sep = ";", dec = ".", na = -99)
Was kann man sich durch folgenden Befehl in R anzeigen lassen?
colnames(dat)
Variablenansicht
dat[15,3]
Werte der Zeile 15 in Spalte 3 anzeigen
colnames(dat[,5:10])
Variablennamen der Spalten 5 bis 10
view(dfSummary(dat)
wichtigste Informationen des Datensatzes anzeigen lassen
Mögliche Skalenniveaus
- Metrisch (z.B. Alter)
− Ordinal (z.B. Schulnoten)
− Nominal (z.B. Geschlecht)
Variablen, die Zahlen enthalten, werden in R automatisch als ordinale Variablen eingelesen.
class(data$Variable)
Objektklasse überprüfen:
− metrische Variablen: „integer“ / „double“ / „numeric“
− kategoriale Variablen: „factor“
Variablen welcher Skalenniveaus müssen zum Faktor umkodiert werden?
Welche Funktion hat der Zuweisungspfeil „<-“ in R?
Der Zuweisungspfeil „<-“ überschreibt die alte Variable.
Alternative: die Variable vor dem Zuweisungspfeil umbenennen
(z.B.: data$Variable.factor <- factor(data$Variable)), um dem Datensatz eine neue Variable hinzuzufügen
Welche Funktionen haben labels und levels in R?
-> Umkodieren von Zahlenwerten in Labels
data$Variable<-factor(data$Variable,levels<-c(1,2,3),labels<-c(“A“,“B“,“C“))
- neue labels mit Anführungszeichen umschließen
− die Reihenfolge der Zahlen und der Labels in den Klammern müssen übereinstimmen!
data$Variable_neu <- recode(data$Variable, "Ausgangswert = neue Bezeichnung")
dat$age.neu <- recode(dat$age, " 18:29='jung'; 30:50='mittelalt'; 51:63='alt‘ ")
Umpolen und Rekodieren von Variablen (indem man die ursprüngliche Variable von einem sinnvollen Wert abzieht und als neue Variable speichert)
Die Ausprägung der Variable „age“ reicht von 18 bis 63. Erstellt wird eine neue Variable, die alle von 18 bis 29 als „jung“, alle von 30 bis 50 als „mittelalt“ und alle von 51 bis 63 als „alt“ bezeichnet.
data$Variable.mean <- rowMeans(data[,c(„Variable1", „Variable2",„Variable3")], na.rm = TRUE)
Mittelwert von Variablen bilden
data$Variable.sum <- rowSums(data[,Spalte von:Spalte bis], na.rm = TRUE)
colnames(dat)
dat$exp_sum <- rowSums(dat[,16:17], na.rm=TRUE)
Summe von Variablen bilden
Summe der Variablen „exp_succes“ und „exp_content“ wird gebildet und als neue Variable exp_sum gespeichert. Vorher werden mit der colnames-Funktion die entsprechenden Spalten herausgesucht.
Was versteht man unter Robustheit eines Verfahrens?
Was versteht man unter robusten Verfahren?
Was ist der Klumpeneffekt?
Fehlende Werte hängen von den nicht erhobenen Werten ab, selbst nach Kontrolle durch erhobene Variablen.
Welcher Fehler liegt vor?
Wofür t-Test?
z.B. um Mittelwertsunterschiede auf Signifikanz zu testen
- > lässt dann Schlussfolgerung auf zugrundeliegende Population zu