Statistik
Statistik, DATA
Statistik, DATA
Set of flashcards Details
Flashcards | 106 |
---|---|
Language | Deutsch |
Category | Micro-Economics |
Level | University |
Created / Updated | 27.12.2021 / 06.07.2023 |
Weblink |
https://card2brain.ch/box/20211227_statistik
|
Embed |
<iframe src="https://card2brain.ch/box/20211227_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Create or copy sets of flashcards
With an upgrade you can create or copy an unlimited number of sets and use many more additional features.
Log in to see all the cards.
Wir ermitteln die Grösse von Männern und Frauen. Ein t-Test ergibt folgendes Resultat. Interpretiere:
1. Varianzen sind gleich: Signifikanz = 0.551, T = -4.343, 2-seitige Sig. = 0.000
2. Varianzen nicht gleich: Signifikanz = leer, T = -4.343, 2-seitige Sig. = 0.000
In unserem Beispiel ist der Sig.-Wert 0,551. Wir können annehmen, dass die Varianzen beider Gruppen gleich sind.
Für unsere Interpretation verwenden wir daher die Werte aus der ersten Reihe der Tabelle.
t-Wert < 0: Der Mittelwert für Größe ist bei den Frauen kleiner als bei den Männern.
Sig. (2-seitig): Die Signifikanz wird mit 0,000 angegeben. Mit einem Sig. Wert niedriger als 0,05 wird die Nullhypothese – es gibt keine Unterschiede in den Mittelwerten – verworfen.
Du kannst annehmen, dass es signifikante Unterschiede in den Mittelwerten der Größe von Männern und Frauen bestehen.
Du möchtest wissen, ob sich die durchschnittliche Grösse (Mittelwert) von Männern und Frauen unterscheiden. Du möchtest dies mit einem T-Test überprüfen. Dieser Test ist nur möglich, wenn auch Normalverteilung besteht. Diese ist nun nicht gegeben. Welchen Test wendest du an?
Ist die Variable nicht normalverteilt, solltest du eher den Wilcoxon- oder den Mann-Whitney-U-Test verwenden.
Wann wird der Korrelationskoeffizent nach Pearson verwendet?
Um den Zusammenhang zwischen zwei metrischen Variablen anzugeben.
Nehmen wir an, wir haben zusätzlich zu der Körpergröße auch das Gewicht der zehn Personen erhoben. Nun wollen wir den Zusammenhang zwischen den beiden Variablen “Körpergröße” und “Gewicht” bestimmen.
Wann wird der Rangkorrelationskoeffizient nach Spearman verwendet?
Um den Zusammenhang zwischen zwei ordinalen Variablen anzugeben.
Wir haben acht Studierende nach Ihren Abiturnoten in den Fächern Deutsch und Englisch gefragt und wollen nun den Zusammenhang zwischen den beiden Variablen bestimmen.
Wie wird die Korrelation resp. der Zusammenhang zwischen 2 nominalen Variablen bestimmt?
Mit dem Chi-Quadrat-Wert und daraus Cramer’s V.
Wir haben 250 Personen von drei verschiedenen Studienrichtungen, nämlich Jura, Naturwissenschaften (NW) und Sozialwissenschaften (SW) befragt und wollen nun den Zusammenhang zwischen der Wahl der Studienrichtung und dem Geschlecht der Studierenden bestimmen.
Was ist der Modus?
Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt.
Warum ist die Zufallsstichprobe wichtig?
Du möchtest Aussagen über die Größe eines durchschnittlichen Deutschen machen. Wenn deine Stichprobe nur aus Basketballspielern besteht, wird dies zu einem falschen Eindruck führen.
Die von dir Befragten sind miteinander verwandt. In Bezug auf ihre Größe sind sie also nicht unabhängig voneinander.
Wann werden Variablen transformiert?
Um eine lineare Beziehung herzustellen. Ansonsten besteht Heteroskedastizität (zu grosse Streuung und keine Linearität)
Was ist die ANOVA?
ANOVA steht für Varianzanalyse (engl. Analysis of Variance) und wird verwendet um die Mittelwerte von mehr als 2 Gruppen zu vergleichen.
Sie ist eine Erweiterung des t-Tests, der die Mittelwerte von maximal 2 Gruppen vergleicht.
Du möchtest herausfinden, ob es einen Unterschied in der Größe zwischen Fußballspielern, Turnern und Volleyballspielern gibt. Also, ob sich die durchschnittliche Grösse dieser Gruppen voneinander unterscheidet.
Wann wird die Einfaktorielle Varianzanalyse (ANOVA) durchgeführt?
Du verwendest die einfaktorielle Varianzanalyse, wenn du eine Gruppenvariable für alle Gruppen hast sowie eine abhängige Variable.
Du vergleichst die durchschnittliche Größe von verschiedenen Athleten und Athletinnen wie Fußballspielern, Turnern und Volleyballspielern miteinander. Die Art des Sports ist hier die einzige Gruppenvariable und Größe die einzige abhängige Variable.
Wann wird die Zweifaktorielle Varianzanalyse durchgeführt?
Die zweifaktorielle Varianzanalyse verwendest du, wenn 2 oder mehr Gruppenvariablen in deinem konzeptionellen Modell zusammen mit einer abhängigen Variable vorhanden sind.
Du vergleichst die durchschnittliche Größe von verschiedenen Gruppen von Athleten und Athletinnen und ihr Geschlecht. Es wird dann nicht nur getestet, ob sich die Mittelwerte von Turnern, Fußballspielern oder Volleyballspielern voneinander unterscheiden, sondern auch, ob ein Größenunterschied zwischen Männern und Frauen besteht, die diese Sportarten praktizieren.
Wann wird die Mehrfaktorielle Varianzanalyse (MANOVA) angewendet?
Die mehrfaktorielle Varianzanalyse wendest du an, wenn es mehrere abhängige Variablen gibt. Du kannst diese ANOVA jeweils mit einer oder mehreren Gruppenvariablen durchführen.
Du möchtest nicht nur die durchschnittliche Größe, sondern auch das durchschnittliche Gewicht von verschiedenen Gruppen von Athleten und Athletinnen miteinander vergleichen.
Verwende daher immer eine MANOVA, wenn du mehrere abhängige Variablen hast.
Wann wird die logistische Regression angewendet? Zeichne die Kurve der logistischen Regression und interpretiere sie. Beispiel ob jemand nach einer Aufnahmeprüfung angenommen oder abgelehnt wird.
- um nominalskalierte Kriterien vorherzusagen. Beispiel ist der Ausgang einer Aufnahmeprüfung. Resultat ist "Angenommen" oder "Abgelehnt".
Somit wird die Wahrscheinlichkeit einer Annahme ins Studium geschätzt. Den Kriterien wird jeweils eine Zahl 1 (angenommen) und 0 (abgelehnt) zugewiesen. Resultat ist die Wahrscheinlichkeit dafür, dass das Kriterium = 1 ist.
Wie wahrscheinlich ist es, dass die Intelligenz zur Annahme ins Studium führt. Je höher die Intelligenz, desto wahrscheinlicher die Annahme und der Prädiktor = 1.
Bei tieferem IQ ist wahrscheinlich, dass der Wert = 0 annimt. In der Mitte herrscht die grösste Unsicherheit, wobei bei hohem IQ die Aufnahme sehr wahrscheinlich ist.
Je steiler die Kurve, desto besser die Vorhersage.
Positives Vorzeichen = Kurve steigt und Wahrscheinlichkeit, dass Kriterium = 1 ist, nimmt zu.
Was ist der Unterschied zwischen der linearen und der logistischen Regression?
linear = z. B. Körpergrösse, die unendlich viele Ausprägungen hat.
logistisch = z. B. Aufnahmeprüfung, Hier verwendest du ein nominalskaliertes Kriterium. Dieses Kriterium hat nur ein paar wenige Ausprägungen, die keine natürliche Reihenfolge haben.
Was bedeutet Deskriptive Statistik? Nenne Beispiele.
Beschreibung von Datensätzen anhand von Werten (Quartile, Median, Varianz, Verteilung, …), Grafiken (Histogramme, Boxplots, …) sowie linearen Zusammenhängen zwischen zwei Variablen (Korrelation)
Wie werden Gruppenvergleiche gemacht?
Untersuchung von Mittelwertsunterschieden zwischen zwei und mehr Gruppen (z.B. t-Tests, Kruskal-Wallis-Test, Varianzanalyse, …)
Was ist die Regressionsanalyse und welche Arten gibt es?
Analyse der Zusammenhänge zwischen zwei oder mehreren Variablen (lineare Regression, logistische Regression)
Welche weiterführende Methoden können in DATA sonst noch angewendet werden?
Exkurs in ausgewählte Verfahren und Best Practices (Datenvisualisierung, Text Mining, …)
Wie unterschiedlich kann eine Merkmalsbeschreibung sein?
- Diskrete Daten
- Stetige Daten
- Skalenniveaus: Kategoriale Daten und Kardinalskalierte Daten
Was sind Diskrete Daten und welchen Sonderfall gibt es?
Daten können nur endlich viele Werte annehmen
z.B. Schulnoten, Likert-Skalen
Sonderfall: Dichotome Daten
Dichotome Daten können nur zwei Werte annehmen
z.B. Wahr/Falsch, Licht ein/Licht aus
Was sind stetige Daten und welchen Sonderfall gibt es?
Daten können beliebige reelle Werte annehmen
z.B. Temperatur, Höhenmeter
Sonderfall: Quasistetige Daten
Diskrete Daten, die sehr viele Werte annehmen können
z.B. Euro (2 Nachkommastellen)
Was ist die Grundgesamtheit (Population)?
Gesamte Menge aller Individuen oder Objekte, die von Interesse für die Aussagen des Forschungsprojekts sind
Z.B.: Alle SchülerInnen in der Schweiz
Was ist die Stichprobe?
Teilmenge der Grundgesamtheit, die im Rahmen des Forschungsprojekts betrachtet wird
z.B. SchülerInnen aus 20 verschiedenen Schulen in der Schweiz
Welche deskriptive Statistik wird gesucht?
- Welche Punktzahl wurde wie oft vergeben?
Häufigkeit
Welche deskriptive Statistik wird gesucht?
- Welche Punktzahl wurde am häufigsten vergeben?
Modus
Welche deskriptive Statistik wird gesucht?
- Wie viele Punkte wurden im Durchschnitt vergeben?
Arithmetisches Mittel
-
- 1 / 106
-