Mathe

Nadja Rieke

Nadja Rieke

Kartei Details

Karten 202
Sprache Deutsch
Kategorie Mathematik
Stufe Grundschule
Erstellt / Aktualisiert 25.03.2014 / 09.01.2020
Weblink
https://card2brain.ch/box/statistik18
Einbinden
<iframe src="https://card2brain.ch/box/statistik18/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Geschichtete Zufallsauswahl

Die Grundgesamtheit wird zerlegt in sich nicht überschneidende (disjunkte) Teilgesamtheiten -> Schichten

Schichten

bezüglich des zu untersuchenden Merkmals in sich möglichst homogen

untereinander möglichst heterogen

Stichprobenvariable

Das vorher bekannte Merkmal, nach dem die Grundgesamtheit in Schichten zerlegt wird

Klumpen

Grundgesamtheit zerfällt auf natürliche Weise in disjunkte Teilgesamtheiten

Klumpenstichprobe

Es wird eine Zufallsstichprobe aus der Menge aller Klumpen gezogen.

Alle Elemente der ausgewählten Klumpen werden untersucht

Daten

Beobachtete Werte eines Merkmals oder mehrere Merkmale in einer Grundgesamtheit von Merkmalsträgern

Datenerhebung

Gewinnung von Daten

Erhebungsdesigns

Planung der Datengewinnung

unabhängige Variable

Einflussfaktor -> Ausprägung eines Merkmals, die im Experiment verändert werden kann

abhängige Variable

Zielgröße -> Merkmal das sich in einem Experiment abhängig vom Einflussfaktor verändert

Störvariable

Einfluss von für die Untersuchung irrelevanter Daten

Versuchsgruppe

wird variierenden Einflussfaktoren ausgesetzt

Quasi-Experiment

Erhebungsdesign ohne randomisierte Zuordnung

Personen entscheiden selbst ob sie der Versuchs- oder der Kontrollgruppe angehören

es gibt keine Zufallsauswahl

Histogramm

durch Balken repräsentiert. Visualisiert die absolute und relative Besetzungshäufigkeit von Klassen

Breite = Klassenbreite

Höhe = Besetzungshäufigkeit

univariate Datenanalyse

Datenauswertung für ein Merkmal

multivariate Datenanalyse

Datenauswertung für mehrere Merkmale

gruppierte oder klassierte Daten

Der Gesamtbereich in dem die Merkmalsausprägungen liegen wird in Teilintervalle zerlegt und die Daten diesen zugeordnet.

Absolute Häufigkeit

Zusammenfassung der in den Rohdaten enthaltenen Information durch Angabe von Häufigkeiten der Merkmalsausprägungen

hängt von der Länge n der Urliste ab

addiert sich zu n. 

absolute Häufigkeit für ein diskretes Merkmal

Bezeichnet Anzahl der Elemente der Urliste, die mit dem Wert a Übereinstimmen

Relative Häufigkeit

Macht Datensätze unterschiedlichen Umfangs direkt vergleichbar

addieren sich zu 1

Relative Häufigkeit für ein diskretes Merkmal

repräsentiert Anteile, die man auch oft in Form von Prozentwerten ausweist (x 100)

empirische Verteilung

Häufigkeitsverteilung für ein Merkmal X

Welche Lageparameter gibt es?

Modalwert, Median und Mittelwert

Welche Streuungsparameter gibt es?

empirische Varianz, empirische Standardabweichung, Spannweite (lineares Streuungsmaß)

Skalenniveau Def.

1. Gibt an welche Vergleichsaussagen welche rechnerischen Operationen für die Skalenwerte zulässig und sinnvoll sind.

2. 

Proxyvariable

Zum messbar machen eines nicht beobachtbaren Merkmals (hypothetisches Konstrukt) wird eine Proxyvariable herangezogen. -> näherungsweiseverwendbare beobachtbare Variable.

Wie lassen sich Häufigkeitstabellen grafisch darstellen?

Kreisdiagramm

Stab- und Säulendiagramme

Kumulierte Häufigkeitsverteilung

zeigt wie viele Werte unterhalb oder oberhalb eines Schwellwertes X liegen -> Voraussetzung: mind. ordinalskaliert

Absolute kumulierte Häufigkeitsverteilung

Summe der absoluten Häufigkeiten, die der Bedingung a < x genügen. -> monoton steigende Treppenfunktion

relative kumulierte Häufigkeitsverteilung

= empirische Verteilsfunktion

- absolute kumulierte Häufigkeit wird durch den Umfang n des Datensatzes geteilt.

- monoton steigende Treppenfunktion

Modus

Modalwert, Xmed

- lässt sich immer anwenden

- Merkmalsausprägung mit der größten Häufigkeit

Median

x-Schlange, Zentralwert

- berücksichtigt nur ein oder 2 zentrale Elemente

- geordneter Datensatz -> mittlerer Wert daraus

Mittelwert

arithmetisches Mittel, X-quer

- nur bei metrischskalierten

berücksichtigt alle Werte mit dem Gewicht 1/n

hohe Sensivität/ geringe Robustheit gegenüber Ausreißern.

Spannweite R

- mertrisch skalierte

- geordneter datensatz

Differenz aus dem größten und dem kleinsten Wert

- hohe Sensivität/ geringe Robustheit gegenüber Ausreißern

Können zwei Datensätze in den Lageparametern übereinstimmen und sich dennoch bezüglich der Variation der Merkmalswerte deutlich unterscheiden?

Ja

Was ist ein häufig verwendetes Maß für die Streuung eines Datensatzes?

Varianz/ Stichprobenvarianz (auch empirische Varianz genannt)

Varianz s2

- quadratisches Streuungsmaß

 

Standardabweichung / empirische Standardabweichung

- erhält man, indem man die Wurzel aus der empirischen Varianz zieht.

- ist anschaulicher als die Varianz

korrigierte Varianz /korrigierte Stichprobenvarianz

s*2 -> uneinheitliche Definition von Varianz und Standardabweichung -> s* -> korrigierte Standardabweichung

-> die Unterschiede verschwinden bei zunehmendem n können aber bei kleinen n ins Gewicht fallen.

p-Quantil -> xp

- Verallgemeinerung des Medians

- markiert die Mitte eines Datensatzes

- Merkmal muss mindestens ordinalskaliert sein

- Eigenschaften: mindestens p x 100% der Elemente sind kleiner oder gleich xp und mindestens (1-p) x 100% sind größer oder gleich xp

- Elemente müssen in einer geordneten Reihenfolge sein.

bei ordinalskalierten nicht eindeutig bestimmt