Statistik 2.2

Deskriptivstatistik für ordinalskalierte Variablen

Deskriptivstatistik für ordinalskalierte Variablen


Kartei Details

Karten 19
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 30.12.2015 / 12.12.2024
Weblink
https://card2brain.ch/box/statistik_2_2
Einbinden
<iframe src="https://card2brain.ch/box/statistik_2_2/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

singuläre Daten:

  • Bei singulären Daten kommt jeder beobachtete Wert (prinzipiell) nur

    einmal vor

  • Beispiel: Rangordnung Marathonlauf 

Variablen mit geordneten Kategorien:

  • Personen oder Objekten werden vorgegebenen Kategorien zugeordnet

    — Beispiel: «nicht fröhlich», «etwas fröhlich», «sehr fröhlich»
    — Per Definition gleiche Ausprägungen für verschiedene Personen 

Rangbindungen:

mehrere Personen teilen sich einen Rangplatz

Vorgehen bei Rangbindungen:

  1. Die für eine Bindungsgruppe in Frage kommenden Ränge werden gemittelt 

  2. Jedem Objekt einer Bindungsgruppe wird dieser mittlere Rang (midrank)

    zugewiesen 

  3. Beispiel: Bei 4 Personen gibt es einen kleinsten und einen grössten Wert sowie zwei gleich grosse mittlere Werte. Die zwei mittleren Personen bekommen alle den midrank 2,5, da (2 + 3) / 2 = 2,5 

Prozentrang:

  • Es macht einen Unterschied, ob man bei einem Marathonlauf als 20. angekommen ist (Rangplatz 20), wenn 200 Personen (Prozentrangwert 10%) oder 2000 Personen (Prozentrangwert 1%) teilgenommen haben. 
 Im ersten Fall gehört man zu den 10% der schnellsten Läufer, im zweiten Fall zu dem 1% der besten Läufer. 

  • \(PRm = {{Rm} \over n} \times 100\)

Lagemass für Variablen mit geordneten Kategorien:

Modus

geordnete Kategorien:

wird geordnet von 1 - k

  • –  1 – strongly disagree

  • –  2 – disagree

  • –  3 – slightly disagree

  • –  4 – neither agree nor disagree

  • –  5 – slightly agree

  • –  6 – agree

  • –  7 – strongly agree 

Bei singulären Daten (ohne Bindung) eindeutige Bestimmung des Modus möglich?

Nein

zusätzliches Lagemass:

Median, 

  • Der Median ist derjenige («mittlere») Wert, für den gilt:

    • •  Mindestens 50% der Werte sind kleiner oder gleich dem Median.

    • •  Mindestens 50% der Werte sind grösser oder gleich dem Median. 

bestimmung des Median bei singulären Daten (ohne Bindung):

\((n + 1) : 2\)

jedoch bei singulären Daten nicht besonders interessant

Bestimmung des Median bei Variablen mit geordneten Kategorien 
 (auch verwendbar bei singulären Daten mit Rangbindung): 

ungerades n

Bei ungeradem n ist der Median gleich dem Merkmalswert (Kategorie) der Person, die an der Stelle (n + 1) / 2 in der Rangreihe steht 

Bestimmung des Median bei Variablen mit geordneten Kategorien (auch verwendbar bei singulären Daten mit Rangbindung): 

gerades n

Bei geradem n bestimmt man den Median als arithmetischen Mittelwert der Merkmalswerte der Personen, die an den Stellen n / 2 und n / 2 + 1 stehen 

Medianklasse

Kategorie, in die der MEdian fällt bei gruppierten Daten

Medianklasse identifizieren:

Es ist die Klasse, innerhalb derer der Wert der kumulierten relativen Häufigkeit von 0,5 überschritten wird 

Dispersion bei singulär ordinalskalierten Daten:

wenig interessant, da meist jeder Wert genau einmal vorkommt

Dispersion bei Variablen mit geordneten Kategorien

  1. relativer Informationsgehalt auch interessantes Mass, ordinale Information wird allerdings nicht ausgenutzt

  2. deshalb: empirischer Interquartilsbereich 

Dispersion bei ordinalskalierten Daten, Vorgehen:

Reihe der Messwerte wird in Quartile geteilt

Berechnung von Q1, falls Stichprobe nicht durch 4 teilbar (also keine ganze Zahl):

\(Q_1 = x_q\)

x ist Merkmalswert einer geordneten Kategorie

dann ist q die nächste ganze Zahl, die auf \(n \times 0.25\) folgt

Berechnung von Q1, falls Stichprobe durch 4 teilbar (also ganze Zahl entsteht):

muss mitteln

zunächst \(q = n \times 0.25 \)

und dieses dann mitteln \(Q1 = 0.5 \times (x_q + x_{q+1})\)