Statistik 3
Deskriptivstatistik für metrische Variablen
Deskriptivstatistik für metrische Variablen
Kartei Details
Karten | 41 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 07.01.2016 / 03.01.2023 |
Weblink |
https://card2brain.ch/box/statistik_31
|
Einbinden |
<iframe src="https://card2brain.ch/box/statistik_31/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Lernkarteien erstellen oder kopieren
Mit einem Upgrade kannst du unlimitiert Lernkarteien erstellen oder kopieren und viele Zusatzfunktionen mehr nutzen.
Melde dich an, um alle Karten zu sehen.
Robuste Lagemasse (Arten):
- δ-getrimmtes Mittel
- δ-winsorisiertes Mittel
getrimmtes Mittel:
bestimmte Anzahl der kleinsten und grössten Werte werden entfernt und das arithmetische Mittel der verbleibenden Werte wird bestimmt
– z.B. werden beim δ = 0,05-getrimmten Mittel 5 % der kleinsten sowie 5 % dergros̈stenWerteentfernt
– wenn n * δ keine ganze Zahl ergibt wird das Ergebnis abgerundet und die entsprechende Anzahl von Werten am unteren und am oberen Ende der Verteilung entfernt
– Beispiel mit δ = 0,20: 10 Studierendenjobs, Monatslohn in CHF 160; 200; 200; 400; 440; 720; 760; 800; 820; 5000
0,20 * 10 = 2 --> 2 Werte oben und unten entfernen
winsorisiertes Mittel:
Extremwerte werden nicht wie beim getrimmten Mittel entfernt, sondern auf einen bestimmten Wert festgelegt
– Die unteren Extremwerte werden dabei auf den niedrigsten »gezählten« (d. h. nicht entfernten) Wert gesetzt; die oberen Extremwerte werden auf denhoc̈hsten»gezaḧlten«Wertgesetzt
– die Berechnung der Anzahl der gleichzusetzenden Werte entspricht derjenigen beim getrimmten Mittel
– Beispiel mit δ = 0,20: 10 Studierendenjobs, Monatslohn in CHF 160; 200; 200; 400; 440; 720; 760; 800; 820; 5000
0,20*10=2
--> 2 Werte oben und unten dem jeweils letzten »gezählten« gleichsetzen
p-Quantil:
Wert xp (0 < p < 1), für den gilt, dass mindestens ein Anteil
p · 100% der Daten kleiner oder gleich xp und mindestens ein
Anteil (1 – p) · 100% der Daten grösser oder gleich xp ist
Berechnung von xp gleich wie für den Median / die Quartile:
xp =xq falls n·p keine ganze Zahl ist (q ist die nächste ganze Zahl, die auf n · p folgt)
xp =0,5∙(xq+xq+1) falls n·p eine ganze Zahl ist (q=n·p)
Streubereich:
Wertebereich, in dem alle beobachteten Werte liegen: SB = [xmin; xmax]
Variationsbreite:
v = xmax - xmin
Semiquartilsabstand:
SQA = IQA/2
Kleiner Inter-/Semiquartilsabstand:
geringe Streuung im mittleren Bereich der Verteilung
empirische Varianz:
arithmetisches Mittel der quadrierten Abweichungen der Messwerte vom Mittelwert (mittlere quadratische Abweichung)
s2x
empirische Standardabweichung:
Quadratwurzel aus der Varianz
sx
Eigenschaften von Varianz und Standardabweichung:
1. Reagieren empfindlich auf Ausreisser und Extremwerte
(durch die Quadrierung fallen grosse Differenzen stärker ins Gewicht)
2. Addition einer Konstanten zu den Messwerten ändert die Varianz und Standardabweichung nicht
3. Multiplikation der Messwerte mit einer Konstanten b führt zu einer Erhöhung der Varianz um den Faktor b2 und zu einer Erhöhung der Standardabweichung um den Faktor des Betrages von b
Variationskoeffizient:
Vx
Masstabsunabhängiges Streuungsmass, das die Standardabweichung am Mittelwert standardisiert
Zum Vergleich unterschiedlicher Streuungen, wenn Streuung vom Mittelwert abhängt
Insbesondere bei verhältnisskalierten Variablen geeignet, da Ähnlichkeits- transformation (ym = b * xm) sich auf Standardabweichung und Mittelwert mit dem gleichen Faktorbetrag (b) auswirkt
Stichprobenvarianz und Stichprobenstandardabweichung:
> Werden zur Schätzung der Varianz und Standardabweichung in der Population herangezogen
> Sind häufig Voreinstellungen bei Computerprogrammen (z.B. SPSS)
σˆ 2x
σˆx
z-Transformation:
Die Verteilung z-transformierter Werte hat einen Mittelwert von 0 und eine Standardabweichung von 1 (standardisierte Werte)
metrische Variablen:
Intervall-, Verhältnis- und Absolutskala
primäre Häufigkeitsverteilungen:
etnsteht aus der Urliste: gruppierte und geordnete Auflistung aller Messwerte
sekundäre Häufigkeitsverteilung:
> Ausgehend von der primären Häufigkeits- verteilung werden Kategorien gebildet und unter diesen werden die Messwerte zusammengefasst
> Kategorienbildung mehr oder weniger willkürlich (meistens 10-20 Kategorien)
> Faustregel zur Bestimmung der Anzahl Kategorien: \(\sqrt{k}\)
(k: Anzahl Merkmausausprägungen)
> Kategoriengrenzen (cj und cj-1) werden so definiert, dass sie genau zwischen dem grössten und dem kleinsten Messwert benachbarter Kategorien liegen
z.B. für die 1. Kategorie: c1 (Obergrenze) = 34,5 c0 (Untergrenze) = 29,5
Histogramm:
Unterscheidet sich vom Säulendiagramm dadurch, dass die Breite der Säulen interpretierbar ist (da auf Zahlenstrahl angeordnet und Abstand zwischen Zahlen bei metrischen Variablen bedeutsam)
Polygonzug:
- Die Mitten der Kategorien werden miteinander verbunden
- Sinnvoll bei kontinuierlichen Variablen (z.B. Reaktionszeit)
--> bringt den kontinuierlichen Charakter des Merkmals zum Ausdruck
wichtige Beschreibunsmerkmale von Verteilungsformen:
- Symmetrie vs. Asymmetrie
- Gipfelform (Schiefe und Wölbung) und Gipfelzahl
Besonderheit symmetrischer Verteilungen:
links und rechts (spiegelverkehrt) von einem bestimmten Wert identisch
Besonderheit asymmetrische Verteilungen:
Schwerpunkt ist verschoben
- Linksgipflig / linkssteil / rechtsschief
- Rechtsgipflig / rechtssteil / linksschief
breitgipflig:
Verteilungen mit vielen Werten um den Modalwert
schmalgipflig oder steilgipflig:
Verteilungen mit wenig Werten um den Modalwert
Verteilungen nach Gipfelzahl:
- Unimodal
- Bimodal
- Multimodal
weitere Verteilungen, die nicht auf einem Haufen basieren:
U-förmige, umgekehrt U-förmige, V-, L- oder J-förmige Verteilungen
Interquartilsabstand:
Breite der Box im Box- und Whiykers-Diagramm
(Abstand Unteres Quantil und oberes Quantil)
Ausreisser Wert:
nicht im Q1/3 + 1.5 x IQA Whiskers, aber im Q1/3 + 3 x IQA Whiskers
Extremwert:
nichtmehr im Q1/3 + 3 x IQA Whiskers
-
- 1 / 41
-