Statistik

Statistik, DATA

Statistik, DATA


Kartei Details

Karten 106
Sprache Deutsch
Kategorie BWL
Stufe Universität
Erstellt / Aktualisiert 27.12.2021 / 06.07.2023
Weblink
https://card2brain.ch/box/20211227_statistik
Einbinden
<iframe src="https://card2brain.ch/box/20211227_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was sagt das Signifikanzniveau aus?

Das Signifikanzniveau α beschreibt die maximale Wahrscheinlichkeit, dass eine Nullhypothese fälschlicherweise abgelehnt wird.

Hypothesenbildung:
Du möchtest herausfinden, ob es sich positiv auf die Studienleistung von Studierenden in Deutschland auswirkt, Freiwilligenarbeit zu leisten. Grundgesamtheit: alle Studierenden in Deutschland. Es ist praktisch unmöglich, alle Studierenden in Deutschland zu befragen. Daher kannst du dich dafür entscheiden, nur Studierende von zwei Universitäten in deiner Studie zu berücksichtigen. Diese Studierenden sollen repräsentativ für alle Studierenden in Deutschland sein.

Bevor du eine statistische Untersuchung durchführen kannst, musst du Hypothesen aufstellen. Du gehst davon aus, dass es sich positiv auf die Studienleistung von Studierenden auswirkt, wenn sie Freiwilligenarbeit leisten.

Nullhypothese H0: Die Nullhypothese besagt immer, dass es keinen statistisch signifikanten Zusammenhang zwischen der abhängigen und den unabhängigen Variablen gibt.

1. Nullhypothese H0: Es besteht kein Zusammenhang zwischen der Anzahl der geleisteten Stunden an Freiwilligenarbeit und der Studienleistung.

Alternativhypothese H1: Die Alternativhypothese besagt, dass es einen statistisch signifikanten Zusammenhang zwischen der abhängigen und den unabhängigen Variablen gibt.

2. Alternativhypothese H1: Es besteht ein positiver Zusammenhang zwischen der Anzahl der geleisteten Stunden an Freiwilligenarbeit und der Studienleistung.

Anhand welcher Kriterien das Signifikanzniveau bestimmt?

Oft wird ein Signifikanzniveau von 5 % (α = 0.05) gewählt, aber für strengere Tests oder bei einem großen Datenvolumen bietet es sich an, ein Signifikanzniveau von 1 % festzulegen (α = 0.01).

Mit welchem Test überprüfe ich meine Hypothesen?

Zur Überprüfung deiner Hypothesen wählst du einen t-Test und ein Signifikanzniveau von 5 % (α = 0.05).

Das Testergebnis gibt eine Fehlerwahrscheinlichkeit von 0.06 an. Dieses Ergebnis ist nicht signifikant, da der Wert oberhalb des Signifikanzniveaus von 0.05 liegt.

Du kannst die Nullhypothese also nicht verwerfen.

Du hast folgenden Sachverhalt:
Der mittlere Notendurchschnitt der freiwillig Arbeitenden (mehr als 10 Stunden) ist M = 2.3 (SD = 0.6), während derjenige der nicht oder wenig freiwillig Engagierten (0 - 10 Stunden) M = 2.5 (SD = 0.4) beträgt.

Interpretiere die Ergebnisse.

Die Studierenden mit mehr als zehn Stunden Freiwilligenarbeit pro Woche erreichten bei einem Konfidenzintervall von 95 % [-0.3; 0.4] keine signifikant besseren Studienleistungen als solche, die zwischen null und zehn Stunden Freiwilligenarbeit leisten (p > 0.05).

Wann wird der t-Test verwendet?

Wenn du die Mittelwerte von maximal 2 Gruppen miteinander vergleichen möchtest.

Zum Beispiel kannst du mit dem t-Test analysieren, ob Männer im Durchschnitt größer als Frauen sind.

Was mache ich, wenn ich die Mittelwerte von mehr als 2 Gruppen vergleichen möchte?

Wenn du die Mittelwerte von mehr als 2 Gruppen vergleichen willst, kannst du eine ANOVA oder eine multiple Regression mit Dummy-Variablen wählen.

Nenne ein Beispiel eines Einstichproben t-Tests.

Du möchtest herausfinden, ob deine Schokoladen-Riegel wirklich 300 Gramm im Durchschnitt wiegen, wie es auf der Packung steht.Um das zu testen, wiegst du 40 Riegel ab und vergleichst das tatsächliche Gewicht mit dem Gewicht, das sie haben sollten (300 Gramm).

Verwende den Einstichproben-t-Test, wenn du untersuchen möchtest, ob sich der Mittelwert einer Stichprobe von einem bestimmten Wert unterscheidet.

Nenne ein Beispiel eines Zweistichproben t-Tests.

Du möchtest wissen, ob sich die durchschnittliche Größe von Männern und Frauen unterscheidet.

Wenn du testen möchtest, ob sich die Mittelwerte zweier Stichproben voneinander unterscheiden, verwendest du den Zweistichproben-t-Test.

Nenne ein Beispiel eines abhängigen t-Tests.

Du misst die Größe derselben Personen im Jahr 2015 und im Jahr 2018. Diese Werte sind klar voneinander abhängig. Du verwendest einen abhängigen t-Test.

Der abhängige t-Test wird verwendet, wenn man 2 Mittelwerte von miteinander verbundenen (abhängigen) Stichproben vergleichen möchte.

Was sagt der Levene-Test der Varianzgleichheit aus? Was bedeutet es, wenn die Signifikanz unter 0.05 liegt? Was wenn grösser 0.05?

Was sagt die Varianz aus?

Dieser Test analysiert, ob die Varianz beider Gruppen gleich ist. Das ist wichtig, um zu erkennen, ob du die erste oder letzte Zeile der Tabelle für deine Interpretation verwendest.

Signifikanz: Wenn die Signifikanz des Levene-Tests unter dem üblichen Wert von 0,05 liegt, wird die Nullhypothese – die Varianzen sind gleich – abgelehnt.

In unserem Beispiel ist der Wert 0,551. Wir können annehmen, dass die Varianzen beider Gruppen gleich sind. Die Varianz gibt an, wie sich deine Beobachtungswerte um den Mittelwert aller Beobachtungen verteilen.

Wir ermitteln die Grösse von Männern und Frauen. Ein t-Test ergibt folgendes Resultat. Interpretiere:

1. Varianzen sind gleich: Signifikanz = 0.551, T = -4.343, 2-seitige Sig. = 0.000
2. Varianzen nicht gleich: Signifikanz = leer, T = -4.343, 2-seitige Sig. = 0.000

In unserem Beispiel ist der Sig.-Wert 0,551. Wir können annehmen, dass die Varianzen beider Gruppen gleich sind. 

Für unsere Interpretation verwenden wir daher die Werte aus der ersten Reihe der Tabelle.

t-Wert < 0: Der Mittelwert für Größe ist bei den Frauen kleiner als bei den Männern.

Sig. (2-seitig): Die Signifikanz wird mit 0,000 angegeben. Mit einem Sig. Wert niedriger als 0,05 wird die Nullhypothese – es gibt keine Unterschiede in den Mittelwerten – verworfen.

Du kannst annehmen, dass es signifikante Unterschiede in den Mittelwerten der Größe von Männern und Frauen bestehen.

Du möchtest wissen, ob sich die durchschnittliche Grösse (Mittelwert) von Männern und Frauen unterscheiden. Du möchtest dies mit einem T-Test überprüfen. Dieser Test ist nur möglich, wenn auch Normalverteilung besteht. Diese ist nun nicht gegeben. Welchen Test wendest du an?

Ist die Variable nicht normalverteilt, solltest du eher den Wilcoxon- oder den Mann-Whitney-U-Test verwenden.

Wann wird der Korrelationskoeffizent nach Pearson verwendet?

Um den Zusammenhang zwischen zwei metrischen Variablen anzugeben.

Nehmen wir an, wir haben zusätzlich zu der Körpergröße auch das Gewicht der zehn Personen erhoben. Nun wollen wir den Zusammenhang zwischen den beiden Variablen “Körpergröße” und “Gewicht” bestimmen.

Wann wird der Rangkorrelationskoeffizient nach Spearman verwendet?

Um den Zusammenhang zwischen zwei ordinalen Variablen anzugeben.

Wir haben acht Studierende nach Ihren Abiturnoten in den Fächern Deutsch und Englisch gefragt und wollen nun den Zusammenhang zwischen den beiden Variablen bestimmen.

Wie wird die Korrelation resp. der Zusammenhang zwischen 2 nominalen Variablen bestimmt?

Mit dem Chi-Quadrat-Wert und daraus Cramer’s V.

Wir haben 250 Personen von drei verschiedenen Studienrichtungen, nämlich Jura, Naturwissenschaften (NW) und Sozialwissenschaften (SW) befragt und wollen nun den Zusammenhang zwischen der Wahl der Studienrichtung und dem Geschlecht der Studierenden bestimmen.

Was ist der Modus?

Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt.

Warum ist die Zufallsstichprobe wichtig?

Du möchtest Aussagen über die Größe eines durchschnittlichen Deutschen machen. Wenn deine Stichprobe nur aus Basketballspielern besteht, wird dies zu einem falschen Eindruck führen.

Die von dir Befragten sind miteinander verwandt. In Bezug auf ihre Größe sind sie also nicht unabhängig voneinander.

Was analysiere ich mit einem t-Test und einer ANOVA? Wie kann ich das Resultat überprüfen?

Wenn du einen t-Test oder eine ANOVA durchführst, dann analysierst du die Varianz zwischen mehreren Gruppen. Das Resultat kannst du mit dem Levene’s Test überprüfen.

Wann werden Variablen transformiert?

Um eine lineare Beziehung herzustellen. Ansonsten besteht Heteroskedastizität (zu grosse Streuung und keine Linearität)

Was ist die ANOVA?

ANOVA steht für Varianzanalyse (engl. Analysis of Variance) und wird verwendet um die Mittelwerte von mehr als 2 Gruppen zu vergleichen.

Sie ist eine Erweiterung des t-Tests, der die Mittelwerte von maximal 2 Gruppen vergleicht.

Du möchtest herausfinden, ob es einen Unterschied in der Größe zwischen Fußballspielern, Turnern und Volleyballspielern gibt. Also, ob sich die durchschnittliche Grösse dieser Gruppen voneinander unterscheidet.

Wann wird die Einfaktorielle Varianzanalyse (ANOVA) durchgeführt?

Du verwendest die einfaktorielle Varianzanalyse, wenn du eine Gruppenvariable für alle Gruppen hast sowie eine abhängige Variable.

Du vergleichst die durchschnittliche Größe von verschiedenen Athleten und Athletinnen wie Fußballspielern, Turnern und Volleyballspielern miteinander. Die Art des Sports ist hier die einzige Gruppenvariable und Größe die einzige abhängige Variable.

Wann wird die Zweifaktorielle Varianzanalyse durchgeführt?

Die zweifaktorielle Varianzanalyse verwendest du, wenn 2 oder mehr Gruppenvariablen in deinem konzeptionellen Modell zusammen mit einer abhängigen Variable vorhanden sind.

Du vergleichst die durchschnittliche Größe von verschiedenen Gruppen von Athleten und Athletinnen und ihr Geschlecht. Es wird dann nicht nur getestet, ob sich die Mittelwerte von Turnern, Fußballspielern oder Volleyballspielern voneinander unterscheiden, sondern auch, ob ein Größenunterschied zwischen Männern und Frauen besteht, die diese Sportarten praktizieren.

Wann wird die Mehrfaktorielle Varianzanalyse (MANOVA) angewendet?

Die mehrfaktorielle Varianzanalyse wendest du an, wenn es mehrere abhängige Variablen gibt. Du kannst diese ANOVA jeweils mit einer oder mehreren Gruppenvariablen durchführen.

Du möchtest nicht nur die durchschnittliche Größe, sondern auch das durchschnittliche Gewicht von verschiedenen Gruppen von Athleten und Athletinnen miteinander vergleichen.

Verwende daher immer eine MANOVA, wenn du mehrere abhängige Variablen hast.

Wann wird die logistische Regression angewendet? Zeichne die Kurve der logistischen Regression und interpretiere sie. Beispiel ob jemand nach einer Aufnahmeprüfung angenommen oder abgelehnt wird.

- um nominalskalierte Kriterien vorherzusagen. Beispiel ist der Ausgang einer Aufnahmeprüfung. Resultat ist "Angenommen" oder "Abgelehnt".

Somit wird die Wahrscheinlichkeit einer Annahme ins Studium geschätzt. Den Kriterien wird jeweils eine Zahl 1 (angenommen) und 0 (abgelehnt) zugewiesen. Resultat ist die Wahrscheinlichkeit dafür, dass das Kriterium = 1 ist.

Wie wahrscheinlich ist es, dass die Intelligenz zur Annahme ins Studium führt. Je höher die Intelligenz, desto wahrscheinlicher die Annahme und der Prädiktor = 1.

Bei tieferem IQ ist wahrscheinlich, dass der Wert = 0 annimt. In der Mitte herrscht die grösste Unsicherheit, wobei bei hohem IQ die Aufnahme sehr wahrscheinlich ist.

Je steiler die Kurve, desto besser die Vorhersage.

Positives Vorzeichen = Kurve steigt und Wahrscheinlichkeit, dass Kriterium = 1 ist, nimmt zu.

Was ist der Unterschied zwischen der linearen und der logistischen Regression?

linear = z. B. Körpergrösse, die unendlich viele Ausprägungen hat.

logistisch = z. B. Aufnahmeprüfung, Hier verwendest du ein nominalskaliertes Kriterium. Dieses Kriterium hat nur ein paar wenige Ausprägungen, die keine natürliche Reihenfolge haben.