PHB 18/19


Fichier Détails

Cartes-fiches 70
Utilisateurs 11
Langue Deutsch
Catégorie Psychologie
Niveau Université
Crée / Actualisé 18.01.2019 / 19.07.2024
Lien de web
https://card2brain.ch/box/20190118_multivariate_statistik_cnVo
Intégrer
<iframe src="https://card2brain.ch/box/20190118_multivariate_statistik_cnVo/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was bedeutet es, dass ein Verfahren „robust“ ist?

Verfahren, deren Ergebnisse nicht oder nur wenig durch Ausreißerwerte beeinflusst werden.

Robustheit eines Verfahrens

D.h. dass Verfahren nicht stark auf Verletzung seiner Annahmen reagiert 

Standardisierte Effektstärken

Um Größe des Effekts zu quantifizieren, sodass er mit anderen Effekten verglichen werden kann.

Cohens d

< .3 kleiner Effekt

.3 bis .8 mittlerer Effekt

> .8 großer Effekt 

 

Was ist eine Stichprobenkennwertverteilung?

Was ist eine Stichprobe? 

Teilmenge einer Grundgesamtheit 

vs. Population (Grundgesamtheit) 

Was ist damit gemeint, dass ein bestimmter Stichprobenkennwert „erwartungstreu“ ist?

Damit ist gemeint, dass der Erwartungswert eines bestimmten Stichprobenkennwertes dem Parameter der Population entspricht. 

Was genau ist ein p-Wert?

Wahrscheinlichkeit, ein empirisches Ergebnis (oder ein noch stärker gegen die Nullhypothese sprechendes Ergebnis) unter der Nullhypothese zu finden.

Formal handelt es sich um die bedingte Wahrscheinlichkeit:

Wie funktionieren Resampling-Verfahren?

Aus der vorliegenden Stichprobe („sample“) werden erneut Stichproben gezogen.

Ziel ist es, die Verteilung der Prüfgröße oder der Stichprobenkennwerte empirisch zu bestimmen.

Zwei Ansätze werden unterschieden:

– Bootstrapping
– Rerandomisierung

Was ist mit der Annahme „missing at random“ (MAR) gemeint?

Bei dieser Ausfallsart ist der Ausfall systematisch, man kennt aber den Ausfallprozess und kann die Ausfallsrate anhand von erhobenen Variablen (X) vorhersagen.

 

Im Februar (Y) wurden nur die 7 Personen einbestellt und gemessen, die im Januar Bluthochdruck hatten (> 140).

Was ist mit der Annahme „missing completely at random“ (MCAR) gemeint?

Ob ein Wert fehlt oder nicht hängt weder von der betrachteten Variablen selbst (Y) noch von anderen erfassten Variablen (X) ab.

Im Februar (Y) wurden nur 7 zufällig ausgewählte Personen (23%) einbestellt und gemessen

Was ist mit der Annahme „missing not at random“ (MNAR) gemeint?

Fehlende Werte hängen von der Ausprägung der betrachteten Variablen (Y) selbst ab. Dieser Zusammenhang kann von anderen Variablen (X) nicht (vollständig) erklärt werden

Im Februar (Y) wurden nur Messungen von den 7 Personen notiert, die im Februar Bluthochdruck hatten (Y > 140)

Welches R-Fenster ist zu sehen?

R-Skript

Welches R-Fenster ist zu sehen? 

 

 

Objektumgebung 

Welches R-Fenster ist zu sehen?

 

 

Plot-Output

Wozu dient die Raute? #

Was passiert beim Klicken auf dieses Symbol?

Was bedeutet dieser Befehl in R: setwd("C:/Users/Student/Desktop/RDaten/")?

Zu Beginn jedes R-Skriptes wird das Arbeitsverzeichnis festleget (set working directory), in dem alle relevanten Daten gespeichert sind.

Was steht in der Klammer?

Aus was bestehen Befehle in R?

Befehle bestehen aus

Funktionen,

obligatorische Argumente

und optionale Argumente (werden in den Klammern meist durch Kommata getrennt)

Ohne obligatorische Argumente funktioniert ein Befehl nichtmindestens einobligatorisches Argument wird benötigt!

data <- read.table("stepd.csv", header = TRUE, sep = ";", dec = ".", na = -99)

Welcher Fehler wurde begangen?

 

Welcher Fehler wurde im folgenden Befehl gemacht? 

Erstis <- read.table( “Erstis.dat”, header = TRUE, sep = “\t”, dec = “.”, na = -99)

na = -9

Was kann man sich durch folgenden Befehl in R anzeigen lassen? 

colnames(dat)

Variablenansicht

dat[15,3]

Werte der Zeile 15 in Spalte 3 anzeigen

colnames(dat[,5:10])

Variablennamen der Spalten 5 bis 10

view(dfSummary(dat)

wichtigste Informationen des Datensatzes anzeigen lassen

Mögliche Skalenniveaus

- Metrisch (z.B. Alter)

−  Ordinal (z.B. Schulnoten)

−  Nominal (z.B. Geschlecht)

Variablen, die Zahlen enthalten, werden in R automatisch als ordinale Variablen eingelesen.

class(data$Variable)

Objektklasse überprüfen:

− metrische Variablen: „integer“ / „double“ / „numeric

− kategoriale Variablen: „factor

Variablen welcher Skalenniveaus müssen zum Faktor umkodiert werden?

Welche Funktion hat der Zuweisungspfeil „<-“ in R?

Der Zuweisungspfeil „<-“ überschreibt die alte Variable.

Alternative: die Variable vor dem Zuweisungspfeil umbenennen
(z.B.: 
data$Variable.factor <- factor(data$Variable)), um dem Datensatz eine neue Variable hinzuzufügen

Welche Funktionen haben labels und levels in R?

-> Umkodieren von Zahlenwerten in Labels

data$Variable<-factor(data$Variable,levels<-c(1,2,3),labels<-c(“A“,“B“,“C“))

- neue labels mit Anführungszeichen umschließen

− die Reihenfolge der Zahlen und der Labels in den Klammern müssen übereinstimmen!

data$Variable_neu <- recode(data$Variable, "Ausgangswert = neue Bezeichnung")

dat$age.neu <- recode(dat$age, " 18:29='jung'; 30:50='mittelalt'; 51:63='alt‘ ")

Umpolen und Rekodieren von Variablen (indem man die ursprüngliche Variable von einem sinnvollen Wert abzieht und als neue Variable speichert)

Die Ausprägung der Variable „age“ reicht von 18 bis 63. Erstellt wird eine neue Variable, die alle von 18 bis 29 als „jung“, alle von 30 bis 50 als „mittelalt“ und alle von 51 bis 63 als „alt“ bezeichnet.

data$Variable.mean <- rowMeans(data[,c(„Variable1", „Variable2",„Variable3")], na.rm = TRUE)

Mittelwert von Variablen bilden

data$Variable.sum <- rowSums(data[,Spalte von:Spalte bis], na.rm = TRUE)

 

colnames(dat)
dat$exp_sum <- rowSums(dat[,16:17], na.rm=TRUE)

Summe von Variablen bilden

Summe der Variablen „exp_succes“ und „exp_content“ wird gebildet und  als neue Variable exp_sum gespeichert.  Vorher werden mit der colnames-Funktion die entsprechenden Spalten herausgesucht. 

Was versteht man unter Robustheit eines Verfahrens?

Was versteht man unter robusten Verfahren?

Was ist der Klumpeneffekt?

Fehlende Werte hängen von den nicht erhobenen Werten ab, selbst nach Kontrolle durch erhobene Variablen.

Welcher Fehler liegt vor?

Was sind die Voraussetzungen für einen t-Test?

- Normalverteilung

- Varianzhomogenität 

Wofür t-Test?

z.B. um Mittelwertsunterschiede auf Signifikanz zu testen

- > lässt dann Schlussfolgerung auf zugrundeliegende Population zu