Mathe

Nadja Rieke

Nadja Rieke

Kartei Details

Karten 202
Sprache Deutsch
Kategorie Mathematik
Stufe Grundschule
Erstellt / Aktualisiert 25.03.2014 / 09.01.2020
Weblink
https://card2brain.ch/box/statistik18
Einbinden
<iframe src="https://card2brain.ch/box/statistik18/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Wie wird das p-Quantil bei metrisch skalierten Merkmalen eindeutig festgelegt?

np = n mal p

kp = X([np]+1) falls np nicht ganzzahlig

Xp = 1/2 x (X(np) + X(np +1))

Wichtige Quantile:

0,25 - Quantil = unteres Quantil

0,5 Quantil = Median

0,75 Quantil = oberes Quantil

Quartilsabstand

Q: = X0,75 - X0,25

-> Interquartilsabstand (IQR)

Dezile

- ergeben sich bei Wahl von p = 0,1, p=0,2,...p=0,9

- werden oft mit D1, D2,...D9 abgekürzt

Der Median stimmt mit dem Dezil D5 überein.

Was zeigt das Verhältnis von D9/D1 ?

hohe Werte dieses Quotienten sprechen für eine ausgeprägte Ungleichheit

-> Informationen über den Grad der Ungleichheit

Wann spricht man von einer linkssteilen Verteilung?

der überwiegende Teil der Daten ist linksseitig konzentriert + steiler Abfall der Verteilung

Wann spricht man von einer rechtssteilen Verteilung?

sie fällt an der rechten Flanke steiler ab.

Das Nichtübereinstimmen von Median und Mittelwert einer Verteilung ist ein Indizis, wofür?

Asymmetrie

Boxplot (Schachtelzeichnung)

- geografisches Instrument zur Beurteilung einer empirischen Verteilung (Zentrum, Streuung, Asymmetrie)

-  Zusammenfassen von 5 Charakteristika eines Datensatzes (einfache Form)

  

Welche 5 Charakteristika fasst das Boxplot in seiner einfachsten Form zusammen?

2 Extremwerte: Xmin = X(1) und max = X(n)

2 Quantile: X0,25 und X0,75

Den Median: X0,5

Wodurch wird die Länge der Boxplot definiert?

Durch die beiden Quantile X0,25 und X0,75

Wie kann die Länge der Box berechnet werden?

mit dem Quartilsabstand Q

Wie verteilen sich die Daten in, ober- und unterhalb der Box?

50% der Daten liegen in der Box

- je 25% liegen unter und über der Box

Wo liegt der Median in der Box wenn es sich um eine symmetrische Verteilung handelt?

gebnau in der Mitte

Lorenzkurve

- Instrument für die grafische Beurteilung von Konzentrationsphänomenen.

-> Visualisiert wie sich die Summe aller Merkmalswerte innerhalb der Grundgesamtheit verteilt.

- bei metrisch skalierten Merkmalen mit nicht negativer Ausprägung

 

- Elemente sind nach größe sortiert

Sie ist über dem Intervall [0;1] definiert

- ein aus n Teilstrecken bestehender monoton steigender Polygonzug

- verbindet (0,0) mit den Punkten (ui; vi),... (un; vn)

Was bedeutet Konzentration?

Konzentration bezüglich des jeweiligen Merkmals liegt vor, wenn sich die Merkmalssumme ungleichmäßig auf die betrachteten Statischen Einheiten verteilt.

Wie werden die Teilstrecken für die Lorenzkurve gebildet?

Ui:= i/n ; i= 1,...,n

Was geschieht mit der Lorenzkurve bei fehlender Merkmalskonzentration?

Merkmalswerte sind alle gleich groß

ui = vi

die Lorenzkurve verbindet die Punkte (0/0) und (1/1) direkt

Lorenzkurve ist eine Diagonale

Beurteilung der Konzentration anhand der Lorenzkurve

- Je stärker die Lorenzkurve von der Diagonalen abweicht (je stärker sie durchhängt) desto größer ist die Konzentration.

Was geschieht mit den Stützpunkten der Lorenzkurve, wenn man die Werte der Urliste mit einem positiven Faktor multipliziert?

Sie bleiben unverändert

Berechnung der Lorenzkurve bei gruppierten Daten

Polygonzug besteht bei Gruppierung zu k Klassen aus k Teilstrecken

Konzentrationsmaße

zeigen die Stärke der Konzentration

Gini-Koeffizient

G = Konzentrationsmaß

zur Berechnung wird die gewichtete Merkmalssumme qn benötigt [Merkmalssumme (nicht gewichtet) pn)

- es gilt: 0 kleiner gleich G kleiner gleich (n-1)/n

Ginbi-Koeffizient im Fall Maxcimaler Konzentration

G=2A ist durch Gmax = (n-1) / n nach oben begrenzt

Gini- Koeffizient im Fall fehlender Konzentration

A = 0

- G nimmt sein Minimum an Gmin = 0

Was ist der Nachteil des Gini-Koeffizienten?

Die obere Schranke G hängt von der Länge n der Urliste ab

Normierter Gini- Koeffizient

G/Gmax = n/(n-1) x G

Die untere Schranke wird bei fehlender Konzentration erreicht, die obere Schranke bei maximaler Konzentration.

Konzentrationsbewertung anhand des normierten Gini-Koeffizienten

0< G* kleiner = 1 -> mäßige Konzentration

0,5 < G* < 1 -> deutliche Konzentration

Anwendungsfeld für Gini-Koeffizienten

Quantifizierung von Einkommensungleichheiten (Alternativ: Quantilsquotient)

Was für AUssagen liefert der Gini-Koeffizient?

X% der Merkmalsträger teilen sich y% der Merkmalssumme

KEINE Aussagen der Art: x Merkmalsträger sind für y% der Merkmalssumme verantwortlich

Kritik am Gini-Koeffizienten

misst nur relative Konzentration

Maß für absolute Konzentration

Herfindahl-Index

Herfindahl-Index

- Werte der Urliste müssen nicht geordnet vorliegen

- besitzt eine positive untere Schranke, die mit abnehmender Länge n der Urliste größer wird.

Herfindahl-Index bei vollständiger Konzentration

pn = 1, alle anderen 0 -> H: = 1

Herfindahl-Index bei gleichmäßiger Merkmalsverteilung

Alle Teile besitzen den Wert 1/n

H nimmt sein Minimum an

Hmin = n x (1/n)2 = 1/n

Anwendungsfeld für den Herfindahl-Index

Kartellbehörden: Messung unerwünschter Anbieterkonzentrationen

Wozu werden Index- und Verhältnisszahlen benötigt?

Ermöglichen Vergleiche zwischen Regionen (EU-Staatsschulden / Bruttoinlandsprodukt)

Beispiel für zusammengesetzte Indikatoren

amtlicher Verbraucherpreisindex

Human Development Index (HDI)

-> hängt von der Gewichtung der Einzelindikatoren ab

Maßzahlen

Quantifizieren einen Sachverhalt

Verhältniszahlen

2 Maßzahlen werden durch Quotientenbildung miteinander verknüpft

Ermöglichen Vergleichbarkeit statischer Informationen für unterschiedliche Regionen oder Zeitpunkte