Statistik
Mathe
Mathe
Kartei Details
Karten | 202 |
---|---|
Sprache | Deutsch |
Kategorie | Mathematik |
Stufe | Grundschule |
Erstellt / Aktualisiert | 25.03.2014 / 09.01.2020 |
Weblink |
https://card2brain.ch/box/statistik18
|
Einbinden |
<iframe src="https://card2brain.ch/box/statistik18/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Geschichtete Zufallsauswahl
Die Grundgesamtheit wird zerlegt in sich nicht überschneidende (disjunkte) Teilgesamtheiten -> Schichten
Schichten
bezüglich des zu untersuchenden Merkmals in sich möglichst homogen
untereinander möglichst heterogen
Stichprobenvariable
Das vorher bekannte Merkmal, nach dem die Grundgesamtheit in Schichten zerlegt wird
Klumpen
Grundgesamtheit zerfällt auf natürliche Weise in disjunkte Teilgesamtheiten
Klumpenstichprobe
Es wird eine Zufallsstichprobe aus der Menge aller Klumpen gezogen.
Alle Elemente der ausgewählten Klumpen werden untersucht
Daten
Beobachtete Werte eines Merkmals oder mehrere Merkmale in einer Grundgesamtheit von Merkmalsträgern
Datenerhebung
Gewinnung von Daten
Erhebungsdesigns
Planung der Datengewinnung
unabhängige Variable
Einflussfaktor -> Ausprägung eines Merkmals, die im Experiment verändert werden kann
abhängige Variable
Zielgröße -> Merkmal das sich in einem Experiment abhängig vom Einflussfaktor verändert
Störvariable
Einfluss von für die Untersuchung irrelevanter Daten
Versuchsgruppe
wird variierenden Einflussfaktoren ausgesetzt
Quasi-Experiment
Erhebungsdesign ohne randomisierte Zuordnung
Personen entscheiden selbst ob sie der Versuchs- oder der Kontrollgruppe angehören
es gibt keine Zufallsauswahl
Histogramm
durch Balken repräsentiert. Visualisiert die absolute und relative Besetzungshäufigkeit von Klassen
Breite = Klassenbreite
Höhe = Besetzungshäufigkeit
univariate Datenanalyse
Datenauswertung für ein Merkmal
multivariate Datenanalyse
Datenauswertung für mehrere Merkmale
gruppierte oder klassierte Daten
Der Gesamtbereich in dem die Merkmalsausprägungen liegen wird in Teilintervalle zerlegt und die Daten diesen zugeordnet.
Absolute Häufigkeit
Zusammenfassung der in den Rohdaten enthaltenen Information durch Angabe von Häufigkeiten der Merkmalsausprägungen
hängt von der Länge n der Urliste ab
addiert sich zu n.
absolute Häufigkeit für ein diskretes Merkmal
Bezeichnet Anzahl der Elemente der Urliste, die mit dem Wert a Übereinstimmen
Relative Häufigkeit
Macht Datensätze unterschiedlichen Umfangs direkt vergleichbar
addieren sich zu 1
Relative Häufigkeit für ein diskretes Merkmal
repräsentiert Anteile, die man auch oft in Form von Prozentwerten ausweist (x 100)
empirische Verteilung
Häufigkeitsverteilung für ein Merkmal X
Welche Lageparameter gibt es?
Modalwert, Median und Mittelwert
Welche Streuungsparameter gibt es?
empirische Varianz, empirische Standardabweichung, Spannweite (lineares Streuungsmaß)
Skalenniveau Def.
1. Gibt an welche Vergleichsaussagen welche rechnerischen Operationen für die Skalenwerte zulässig und sinnvoll sind.
2.
Proxyvariable
Zum messbar machen eines nicht beobachtbaren Merkmals (hypothetisches Konstrukt) wird eine Proxyvariable herangezogen. -> näherungsweiseverwendbare beobachtbare Variable.
Wie lassen sich Häufigkeitstabellen grafisch darstellen?
Kreisdiagramm
Stab- und Säulendiagramme
Kumulierte Häufigkeitsverteilung
zeigt wie viele Werte unterhalb oder oberhalb eines Schwellwertes X liegen -> Voraussetzung: mind. ordinalskaliert
Absolute kumulierte Häufigkeitsverteilung
Summe der absoluten Häufigkeiten, die der Bedingung a < x genügen. -> monoton steigende Treppenfunktion
relative kumulierte Häufigkeitsverteilung
= empirische Verteilsfunktion
- absolute kumulierte Häufigkeit wird durch den Umfang n des Datensatzes geteilt.
- monoton steigende Treppenfunktion
Modus
Modalwert, Xmed
- lässt sich immer anwenden
- Merkmalsausprägung mit der größten Häufigkeit
Median
x-Schlange, Zentralwert
- berücksichtigt nur ein oder 2 zentrale Elemente
- geordneter Datensatz -> mittlerer Wert daraus
Mittelwert
arithmetisches Mittel, X-quer
- nur bei metrischskalierten
berücksichtigt alle Werte mit dem Gewicht 1/n
hohe Sensivität/ geringe Robustheit gegenüber Ausreißern.
Spannweite R
- mertrisch skalierte
- geordneter datensatz
Differenz aus dem größten und dem kleinsten Wert
- hohe Sensivität/ geringe Robustheit gegenüber Ausreißern
Können zwei Datensätze in den Lageparametern übereinstimmen und sich dennoch bezüglich der Variation der Merkmalswerte deutlich unterscheiden?
Ja
Was ist ein häufig verwendetes Maß für die Streuung eines Datensatzes?
Varianz/ Stichprobenvarianz (auch empirische Varianz genannt)
Varianz s2
- quadratisches Streuungsmaß
Standardabweichung / empirische Standardabweichung
- erhält man, indem man die Wurzel aus der empirischen Varianz zieht.
- ist anschaulicher als die Varianz
korrigierte Varianz /korrigierte Stichprobenvarianz
s*2 -> uneinheitliche Definition von Varianz und Standardabweichung -> s* -> korrigierte Standardabweichung
-> die Unterschiede verschwinden bei zunehmendem n können aber bei kleinen n ins Gewicht fallen.
p-Quantil -> xp
- Verallgemeinerung des Medians
- markiert die Mitte eines Datensatzes
- Merkmal muss mindestens ordinalskaliert sein
- Eigenschaften: mindestens p x 100% der Elemente sind kleiner oder gleich xp und mindestens (1-p) x 100% sind größer oder gleich xp
- Elemente müssen in einer geordneten Reihenfolge sein.
bei ordinalskalierten nicht eindeutig bestimmt