Statistik

Statistik, DATA

Statistik, DATA


Kartei Details

Karten 106
Sprache Deutsch
Kategorie BWL
Stufe Universität
Erstellt / Aktualisiert 27.12.2021 / 06.07.2023
Weblink
https://card2brain.ch/box/20211227_statistik
Einbinden
<iframe src="https://card2brain.ch/box/20211227_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was bedeutet Deskriptive Statistik? Nenne Beispiele.

Beschreibung von Datensätzen anhand von Werten (Quartile, Median, Varianz, Verteilung, …), Grafiken (Histogramme, Boxplots, …) sowie linearen Zusammenhängen zwischen zwei Variablen (Korrelation)

Wie werden Gruppenvergleiche gemacht?

Untersuchung von Mittelwertsunterschieden zwischen zwei und mehr Gruppen (z.B. t-Tests, Kruskal-Wallis-Test, Varianzanalyse, …)

Was ist die Regressionsanalyse und welche Arten gibt es?

Analyse der Zusammenhänge zwischen zwei oder mehreren Variablen (lineare Regression, logistische Regression)

Welche weiterführende Methoden können in DATA sonst noch angewendet werden?

Exkurs in ausgewählte Verfahren und Best Practices (Datenvisualisierung, Text Mining, …)

Wie unterschiedlich kann eine Merkmalsbeschreibung sein?

- Diskrete Daten

- Stetige Daten

- Skalenniveaus: Kategoriale Daten und Kardinalskalierte Daten

Was sind Diskrete Daten und welchen Sonderfall gibt es?

Daten können nur endlich viele Werte annehmen
z.B. Schulnoten, Likert-Skalen

Sonderfall: Dichotome Daten
Dichotome Daten können nur zwei Werte annehmen
z.B. Wahr/Falsch, Licht ein/Licht aus

Was sind stetige Daten und welchen Sonderfall gibt es?

Daten können beliebige reelle Werte annehmen
z.B. Temperatur, Höhenmeter

Sonderfall: Quasistetige Daten
Diskrete Daten, die sehr viele Werte annehmen können
z.B. Euro (2 Nachkommastellen)

Was sind kategoriale Daten?

Was sind kardinalskalierte Daten?

Was ist die Grundgesamtheit (Population)?

Gesamte Menge aller Individuen oder Objekte, die von Interesse für die Aussagen des Forschungsprojekts sind

Z.B.: Alle SchülerInnen in der Schweiz

Was ist die Stichprobe?

Teilmenge der Grundgesamtheit, die im Rahmen des Forschungsprojekts betrachtet wird

z.B. SchülerInnen aus 20 verschiedenen Schulen in der Schweiz 

Deskriptive Analysen dienen dem Beschreiben von Daten hinsichtlich dreier Charakteristika. Welchen?

Welche deskriptive Statistik wird gesucht?

 

- Welche Punktzahl wurde wie oft vergeben?

Häufigkeit

Welche deskriptive Statistik wird gesucht?

 

- Welche Punktzahl wurde am häufigsten vergeben?

Modus

Welche deskriptive Statistik wird gesucht?

 

- Wie viele Punkte wurden im Durchschnitt vergeben?

Arithmetisches Mittel

Welche deskriptive Statistik wird gesucht?

 

- Was ist die höchste und was die niedrigste Punktzahl, die vergeben wurde?

Spannweite

Welche deskriptive Statistik wird gesucht?

 

- Wie stark streuen die Punktzahlen um den Mittelwert?

Varianz

Welche deskriptive Statistik wird gesucht?

 

- Steht die Punktzahl im Zusammenhang mit anderen Faktoren, wie beispielweise der investierten Lernzeit? 

Korrelation

Welcher Ansatz kann bei Klausurergebnissen betreffend Häufigkeitsverteilung gewählt werden?

Welcher Ansatz kann bei "gegangenen Schritten" betreffend Häufigkeitsverteilung gewählt werden?

Was ist ein Arithmetisches Mittel?

Der Durchschnittswert.

Erkläre den Median (Zentralwert) bei einer Klausurarbeit.

„Der Median liegt bei 6 Punkten, 50% der Klausuren haben weniger oder gleich viele Punkte“

Erkläre ein Quartil bei einer Klausurarbeit.

„Das untere Quartil liegt bei 5,5 Punkten, 25% der Klausuren haben weniger oder gleich viele Punkte“

Erkläre den Modus.

„Am häufigsten wurden 6 Punkte pro Klausur vergeben“

Was ist die Spannweite?

Abstand zwischen dem kleinsten und dem größten Messwert

Was ist die Varianz?

Mittlere quadratische Abweichung vom Mittelwert

Was ist die Standardabweichung?

Durchschnittliche Abweichung vom Mittelwert.

„Die Punktezahl liegt durchschnittlich 1,4 Punkte vom Mittelwert entfernt“ 

Nenne die wichtigen Verteilungen.

Normalverteilung (stetig), Binomialverteilung (diskret) und logistische Verteilung (stetig).

Erkläre das Boxplot.

Wie wird überprüft ob Normalverteilung besteht?

Wie wird rechnerisch überprüft ob Normalverteilung besteht? Welcher Test wird verwendet? Stelle Hypothesen auf. Welcher Test wird verwendet wenn keine Normalverteilung besteht?

Was ist die H0 und was die H1?

Nullhypothese H0 und Alternativhypothese H1

Was ist das besondere an der Nullhypothese?

Nullhypothese kann !nie! bestätigt werden

Wir haben die Hypothese 1:  Personen mit längerer Arbeitserfahrung besitzen ein höheres Einkommen als Personen mit kürzerer Arbeitserfahrung.

Nenne eine H0 und eine H1.

H0: Personen die eine längere Arbeitserfahrung besitzen unterscheiden sich nicht hinsichtlich ihres Einkommens von Personen mit kürzerer Arbeitserfahrung

H1: Personen mit längerer Arbeitserfahrung unterscheiden sich hinsichtlich ihres Einkommens von Personen mit kürzerer Arbeitserfahrung

Arbeitserfahrung und Einkommen. Gibt es einen Zusammenhang?

Nenne eine mögliche H0 und eine H1.

H0: Es existiert kein positiver linearer Zusammenhang zwischen der Arbeitserfahrung und dem Einkommen einer Person

H1: Je länger die Arbeitserfahrung einer Person, desto höher ist auch ihr Einkommen

Erkläre:

Kausalität = 1

Kausalität = -1

Kausalität = 0

r = 1 perfekte positive Korrelation (X steigt, Y steigt)

r = -1 perfekte negative Korrelation (X steigt, Y nimmt ab)

r = 0 keine Korrelation (Variablen stehen in keinem linearen Zusammenhang) 

Korrelation = Kausalität?

Nein

Was ist der Korrelationskoeffizient?

Wann wird eine Hypothese verworfen resp. angenommen?

p-Wert < 0.001 oder < 0.05

Welche Faktoren können den Pearson-Korrelationskoeffizienten beeinflussen?

Nicht-lineare Zusammenhänge
Z.B. quadratische Zusammenhänge werden nicht erfasst

Outliers
Extreme Werte können Korrelationskoeffizenten verzerren

Diskrete Variablen
Stufen minimieren Aussagekraft von Scatterplot und Korrelation