Statistik
BOEK FFHS
BOEK FFHS
Set of flashcards Details
Flashcards | 29 |
---|---|
Language | Deutsch |
Category | Statics |
Level | University |
Created / Updated | 07.09.2018 / 19.02.2023 |
Weblink |
https://card2brain.ch/box/20180907_statistik
|
Embed |
<iframe src="https://card2brain.ch/box/20180907_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was ist die absolute Häufigkeit?
Man unterscheidet in der Statistik zwischen der absolute und der relativen Häufigkeit. Dabei ergibt sich die Häufigkeit aus der Urliste. In der Urliste, oder auch Beobachtungsreihe genannt, sind sämtliche beobachteten Merkmalswerte aufgelistet.
Nun ist die absolute Häufigkeit einer Merkmalsausprägung x genau die Anzahl der Merkmalswerten in der Urliste, die mit der Merkmalsausprägung x übereinstimmen. Man bezeichnet die absolute Häufigkeit mit h(x).
Besitzt man beispielsweise die folgende Urliste: (1,4,2,1,4,5,2,3,3,1), die die Noten der letzten Klassenarbeit beinhaltet. Möchte man nun von der Note 1 die absolute Häufigkeit bestimmen, dann geht man die Urliste durch und summiert die Anzahl der 1. In diesem Fall wäre die absolute Häufigkeit der Note 1 also 3, oder auch h(1)=3
Was ist die relative Häufigkeit?
Die relative Häufigkeit ergibt sich nun aus der Division der absoluten Häufigkeit durch die Gesamtanzahl der Elemente der Urliste. Da die Noten-Urliste insgesamt 10 Elemente umfasst,Urliste: (1,4,2,1,4,5,2,3,3,1) ist die relative Häufigkeit für die Note 1 also 3/10=0,3.
Multipliziert man die relative Häufigkeit mit 100, dann erhält man die prozentuale relative Häufigkeit. 0,3*100=30% → 30% der Schüler haben eine 1 in ihrer Klausur erhalten.
Die aufsummierten relativen Häufigkeiten müssen immer 1 ergeben. Für die obere Urliste der Noten ergibt sich also folgende relativen Häufigkeiten:
Was ist die Häufigkeitsdichte?
Die Häufigkeitsdichte spielt bei klassierten Merkmale eine Rolle. So gibt die Häufigkeitsdichte bei einem Histogramm die Höhe des Rechtecks an. Mit ihr kann man Klassen erst vergleichen. Ausgedrückt ist die Häufigkeitsdichte einer Klasse das Verhältnis der absoluten oder der relativen Häufigkeit einer Klasse zur entsprechenden Klassenbreite. Entsprechend einfach lässt sich die Häufigkeitsdichte auch berechnen.
Mit der absoluten Häufigkeit für die Klasse i ergibt sich folgende Formel:
h(xi)/Obere Grenze i - untere Grenze i
ei einer relativen Häufigkeit ersetzt man in der oberen Formel einfahc die absolute Häufigkeit h(xi) mit der relativen Häufigkeit p(xi).
Was ist eine statistische Einheit?
Unter der statistischen Einheit versteht man ein Einzelobjekt einer statistischen Untersuchung. Eine Statistik richtet sich aber im Normalfall nicht auf dieses einzelne elementare Objekt, sondern auf eine Menge von Elemente, also die Zusammenfassung der statistischen Einheiten. Diese nennt man dann statistische Masse oder auch statistische Gesamtheiten.
Was sind Bestandes- und Ereignissmassen?
Weiterhin wird die statistische Masse in die Bestandsmasse und die Ereignismasse unterteilt. Unter der Bestandsmasse versteht man die statistischen Massen, deren zeitliche Abgrenzung ein Zeitpunkt ist, während man unter der Ereignismasse die statistischen Massen versteht, deren zeitliche Abgrenzung ein Zeitraum ist. So ergibt die Bestandsmasse + die Ereignismasse (die sich wiederum in Zugangsmasse und Abgangsmasse aufteilen lässt), wiederum die Bestandsmasse. Dies nennt man auch die Fortschreibungsformel. Anbei Beispiele für Bestandsmassen, sowie Ereignismassen (unterteilt in Zugangsmassen und Abgangsmassen):
Bestandsmassen/Ereignismassen/Zugangsmasse/Abgangsmasse
Bevölkerung/Geburten/Todesfälle
Kassenbestand/Einzahlungen/Auszahlungen
Reisende/Ankunft/Abreise
Studenten/Immatrikulationen/Exmatrikulationen
Welche Kriterien müssen bei eine statistische Masse abgegrenz werden können?
Nun möchte man aber nur Objekte in der statistischen Masse zusammenfassen, die vom Untersuchungsziel als gleichartig angesehen werden. Deshalb muss die statistische Masse in die nachfolgenden Kriterien eindeutig abgegrenzt werden können:
- sachlich
- räumlich
- zeitlich
Was sind qualitative Merkmale?
Unter qualitative Merkmale versteht man die Merkmalsausprägungen, die ohne einen ordnende Vergleichbarkeit nebeneinander stehen. Das heißt also, dass die Reihenfolge bei den Merkmalsausprägungen völlig willkürlich ist. Man kann sich nicht aufgrund ihrer Merkmalswerte bewerten. Es handelt sich also bei qualitative Merkmale um nominalskalierte Merkmale.
Beispiele für qualitative Merkmale:Geschlecht, der Familienstand oder die Religion.
Was sind quantitative Merkmale?
Bei quantitativen Merkmalen sind die Merkmalsausprägungen reelle Zahlen. Damit hanelt es sich bei quantitative Merkmale um metrisch skalierte Merkmale. Damit lassen sich quantitative Merkmale durch ihre reellen Werte vergleichen.
Beispiele für quantitative Merkmale: Alter, Gewicht, Größe, Temperatur, Wartezeit ...
Was sind diskrete/stetige Merkmale?
Bei quantitative Merkmale kann man darüber hinaus noch zwischen diskreten und stetigen (kontinuierlichen) Merkmalen unterscheiden. Man spricht von einem diskreten Merkmal, wenn nur bestimmte Werte der reellen Zahlen angenommen werden können (in der Regel ganze Zahlen). Von stetigen Merkmalen spricht man hingegen, wenn alle reelle Zahlen, bzw. ein bestimmtes Intervall daraus, als Merkmalswert angenommen werden können.
Beispiele für diskrete Merkmale: Kinderzahl, Zahl der Arbeitnehmer eines Betriebs
Beispiele für stetige Merkmale: Gewicht, Größe, Lebensdauer, Temperatur
Was sind Häufbare Merkmale?
Unter einem häufbaren Merkmal versteht man ein Merkmale, bei dem den Merkmalsträger mehrere Merkmalsausprägungen gleichzeitig zugeordnet werden können. So ist das Merkmal „belegte Schulfächer“ häufbar, da ein Schüler mehr als nur ein Schulfach belegt hat, sondern mehrere (Mathe, Deutsch, Englisch ...).
Ein nicht häufbares Merkmal ist dementsprechend ein Merkmal, bei dem jedem Merkmalsträger genau eine Merkmalsausprägung zugeordnet ist. Ein nicht häufbares Merkmal wäre beispielsweise die "Augenfarbe". Ein Mensch kann nämlich immer nur eine Augenfarbe besitzen (braun, blau ...)
Was ist eine Skala in der Statistik?
Merkmalsausprägungen bilden eine Skala ab. Eine Skala ist ein Maßstab zur Messung der Merkmalsausprägungen bei den Untersuchungseinheite
Welche Skalen gibt es?
- Nominalskala (nicht metrisch)
- Ordinalskala (nicht metrisch)
- Intervallskala (metrisch)
- Verhältnisskala (metrisch)
Wa sist eine Nominalskala?
Die Nominalskala findet bei qualitative Merkmale Anwendung, also bei Merkmalen, deren Ausprägungen keine natürliche Reihenfolge bilden, sondern gleichberechtigt nebeneinanderstehen. Dies wäre beispielsweise bei der Religion oder dem Geschlecht der Fall. Ordnet man in der Nominalskala den einzelnen Merkmalsausprägungen Ziffern zu, dann verschlüsselt man diese. Diese Verschlüsselung dient aber lediglich zur Identifikation. Generell stellt diese Skala die geringste Anforderungen an die Merkmalsausprägungen, bietet aber dementsprechend auch nur die geringste Möglichkeiten bei der statistischen Auswertung.
Lageparameter: Modus
Was ist eine Ordinalskala? Wann wird Sie angewendet?
Bei der Ordinalskala besteht zwischen den Merkmalsausprägungen eine Rangordnung. So lässt sich zwischen den Merkmalsausprägungen eine „größer als“-Relation aufstellen. Besteht eine Ordinalskala lediglich aus ganzzahligen Ordnungsziffern die mit 1 beginnt und eine ununterbrochene Reihenfolge bildet, dann spricht man auch von einer Rangskala. So wäre die Bundesliga-Tabelle beispielsweise eine Rangskala.
Wichtig ist zu verinnerlichen, dass zwar eine Rangordnung mit der Ordinalskala abgebildet werden kann, eine Angabe der Distanz zwischen den einzelnen Rangstufen aber nicht möglich ist.
Lageparameter: Modus, Median
Was ist eine Quasi-metrische Ordinalskala? Wann wird Sie angewendet?
In der Wissenschaft wird man bei der Durchführung von Studien bzw. Experimenten häufig auf die sogenannte Likert-Skala stoßen. Diese ist offiziell eine Ordinalskala. Die Antwortmöglichkeiten reichen bei der Likertskala von häufig von „stimmt gar nicht zu“ bis „stimmt voll zu“, wobei es insgesamt meist fünf Skalenpunkte gibt. Generell kann man nicht davon ausgehen, dass der Befragte die Abstände der einzelnen Antwortmöglichkeiten als gleich weit entfernt wahrnimmt (äquidistant). Um bei der späteren Auswertung die erhobenen Daten aber dennoch wie intervallskalierte Daten behandeln zu können, greift man zu einem kleinen Trick, in dem man die Skalenpunkte optisch in gleich weiten Abständen anordnet und über die Skalenpunkte eine gleichbleibende Nummerierung durchführt.
Was ist eine Metrische Skala? Wann wird Sie angewendet?
Die metrische Skala findet bei quantitativen Merkmalen Anwendung. Die Abstände zwischen den Ausprägungen können also gemessen werden, da es sich bei den Ausprägungen um reelle Zahlen handelt. Dies ist z.B. bei Kinderzahl oder Temperatur der Fall. Die metrische Skala kann man in die Intervallskala und in die Verhältnisskala (auch Ratioskala genannt) differenzieren.
Was ist eine Intervallkala? Wann wird Sie angewendet?
ei der Intervallskala ist der Nullpunkt willkürlich festgelegt (z.B. Temperatur: Celsius – Fahrenheit). Daraus folgt, dass man bei der Intervallskala keine Verhältnisse der Merkmalswerte bilden darf. Sprich man darf nicht sagen, dass die eine Merkmalsausprägung ein Vielfaches einer anderen Merkmalsausprägung ist. Eine Messung erfolgt in konstanten Maßeinheiten, Distanzangaben sind damit im Gegensatz zur Ordinalskala möglich.
Lageparameter: Modus, Median Arithmetisches Mittel
Was ist eine Verhältnisskala/Ratioskala? Wann wird Sie angewendet?
Bei der Verhältnisskala ist der Nullpunkt hingegen fest auf natürliche Weise oder durch Konventionen vorgegeben. Wie auch die Intervallskala sind bei der Verhältnisskala Distanzangaben möglich. Darüber hinaus kann man, wie der Name schon sagt, im Gegensatz zur Intervallskala auch Verhältnisse der Merkmalswerte damit ausdrücken. Die Multiplikation und Division ist also bei diesem Skaleinnievau erlaubt und auch nur bei diesem! Damit besitzt die Verhältnisskala das höchste Skalenniveau. Dennoch ist eine Transformation in niedrige Skalenniveaus jederzeit möglich. Ein Beispiel für eine Verhältnisskala ist die Nennung des Alters, des Nettoeinkommens, des Gewinns ...
Lageparameter: Modus, Median Arithmetisches Mittel, Geometrisches Mittel
Welche Transformation der Skalen sind möglich?
Nominalskala
Es sind symmetrische Transformationen zulässig, bei denen sich lediglich die Klassenbezeichnung ändert (Verschlüsselung). Es sind also alle bijektiven Abbildungen möglich.
Ordinalskala
Es sind streng monotone Transformationen zulässig. D.H. Neben der Bijektivität muss die Ordnung erhalten bleiben, sodass die Abbildung entweder streng monoton steigend oder streng monoton fallend sein muss.
Intervallskala
Es sind lineare Transformationen der folgenden Art zulässig: y = ax + b (a>0) Beispiel: Umrechnung von Fahrenheit in Celsius.
Verhältnisskala
Es sind Ähnlichkeitstransformationen der folgenden Art zulässig: y=ax (x>0). Eine Verschiebung des Nullpunkts ist nicht möglich, da fest vorgegeben! Beispiel: Umrechnung von m in cm
Was wird bei der Klassifizierung gemacht?
Mit einer Klassierung von Merkmalsausprägungen fasst man diese in Klassen zusammen. Dabei gehört jede Merkmalsausprägungen auch in genau eine Klasse. Wie viele Klassen man verwendet, das bleibt jedem selbst überlassen und ist von Fall zu Fall verschieden. Entscheidet man sich nämlich für zu viele Klassen, dann ist die Wahrscheinlichkeit hoch, dass einige Klassen gar nicht oder nur sehr gering besetzt sind. Entscheidet man sich hingegen für zu wenige Klassen, dann besteht die Gefahr, dass die charakteristische Form der Verteilung nicht klar wird. Als einen sehr groben Anhaltspunkt kann man die „Wurzelregel“ nehmen. Demnach ist die Anzahl der Klassen einfach die Wurzel der Elemente der Urliste.
Generell schließt man Klassen nach oben und nach unten. Dann ist die obere Klassengrenze der einen Klasse gleichzeitig die untere Grenze der nächsten Klasse. Die jeweils erste und letzte Klasse können offene Randklassen sein. D.H. das sie jeweils nach links offen (erste Klasse) oder nach rechts offen (letzte Klasse) sind. Die offenen Randklassen dienen „Ausreißer“ einzufangen.
Klassenbreite: Die Klassenbreite ergibt sich aus der Differenz von oberer und unterer Klassengrenze → Klassenbreite = Obere Grenze – Untere Grenze
Klassenmitte: Die Klassenmitte ist das arithmetische Mittel aus unterer und oberer Klassengrenze → Klassenmitte= 0.5(Untere Grenze + Oberer Grenze)
Was ist der Modus/Modalwert?
Der Modus, oder auch Modalwert genannt, ist ein Lageparameter, der die häufigsten auftretende Merkmalsausprägungen angibt. Dabei kann es durchaus vorkommen, dass es mehrere häufigste Werte gibt, in dem Fall gibt es dann auch mehrere Modalwerte. Angewandt werden kann der Modus bei Nominalskalen (qualitative Merkmale), Ordinalskalen (Rangmerkmale) und metrische Skalen (quantitative Merkmale).
Beispiel: Besitzt man folgende Urliste mit allen Noten der letzten Klausur: Urliste: (1,4,2,1,4,5,2,3,3,1), dann ist der Modus 1, da die 1 am häufigsten in der Liste vorkommt (3 mal)
Was ist der Modus bei klassierten Merkmalen?
Bei klassierten Merkmalen bestimmt man nicht direkt den Modus, sondern die sogenannte modale Klasse. Dabei ist die modale Klasse die Klasse, die die größte Häufigkeitsdichte aufweist. Dabei berechnet man die Häufigkeitsdichte in dem man die absolute/relative Häufigkeit durch die Klassenbreite teilt.
Wie wird der Median bei klassierten Merkmalen bestimmt?
Bei einem klassierten Merkmal liegt der Median genau in der Klasse, in der die Summenhäufigkeitsfunktion den Wert 0.5 erreicht, bzw. das erste Mal überschreitet. Die Feinberechnung des Medians kann darüber hinaus mit lineare Interpolation durchgeführt werden. Sprich, wenn der Median nicht auf einer Klassengrenze liegt, muss erst einmal die Klasse bestimmt werden, in die der Median fällt. Diese Klasse heißt Einfallklasse und ist genau die Klasse, bei der die Summenhäufigkeitsfunktion für die untere Grenze (αE) kleiner als 0.5 ist und die Summenhäufigkeitsfunnktion für die obere Klassengrenze (βE) größer als 0.5 ist.
Anschließend lässt sich der Median in dieser Einfallsklasse folgendermaßen berechnen:
Untere Klassengrenze + (0.5-relative Summenhäufigkeit der unteren Grenze)/(relative Häufigkeit) * Klassenbreite
Was ist das Arithmetisches Mittel?
Beim arithmetischen Mittel hat die genaue Lage aller Merkmalswerte im Gegensatz zum Median einen direkten Einfluss. Dementsprechend ist das arithmetische Mittel „anfälliger“ gegen Ausreißer bei den Beobachtungswerten.
Berechnen lässt sich das arithmetische Mittel durch den Kehrwert der Anzahl an Merkmalswerten multipliziert mit der Summe aller Merkmalswerten. Mittelwert : Summe der Werte / Anzahl Werte
Wie lässt sich das Arithmetisches Mittel bei klassierten Merkmalen bestimmen?
Wie schon beim Median, kann auch der arithmetische Mittel nicht exakt bei einem klassierten Merkmal bestimmt werden. Stattdessen verwendet man einfach im Normalfall die Klassenmitte (zI) als Repräsentant. Diese werden mit den ihren absoluten Häufigkeiten multipliziert und aufsummiert. Am Ende teilt man sie noch mit n.
Was sind Balken-, Säulen- und Stabdiagramme?
Ein Balkendiagramm / Säulendiagramm eignet sich zur grafischen Darstellung der Häufigkeit von Ausprägungen beliebig skalierter Merkmale, wobei Du absolute oder relative Häufigkeiten darstellen kannst. Man unterscheidet je nach Richtung der Anordnung. Ordnest Du die Häufigkeiten als längliche, horizontale Rechtecke an, erhältst Du ein Balkendiagramm. Ordnest Du sie dagegen vertikal an, erhältst Du ein Säulendiagramm. Vertikal in Linien anstatt Balken ist ein STabdiagramm.
Was ist der Median und wie wird er berechnet?
Der Median oder Zentralwert ist ein Mittelwert in der Statistik und ein Lageparameter. Der Median einer Auflistung von Zahlenwerten ist der Wert, der an der mittleren (zentralen) Stelle steht, wenn man die Werte der Größe nach sortiert.
Berechnung: Bei einer ungeraden Anzahl an Datenwerten ist der Median der Wert in der Mitte. Bei einer geraden Anzahl an Datenwerten entspricht der Median dem Durchschnittder beiden mittleren Werte. Der Median ist die Mitte, bzw. der Zentralwert des Datensatzes.
Was ist ein Lageparameter?
Als Lageparameter oder Lagemaße bezeichnet man in der deskriptiven Statistik gewisse Kennzahlen einer Stichprobe, die eine zentrale Tendenz des Datensatzes zum Ausdruck bringen.
Was ist das geometrische MIttel und wie wird es berechnet?
Das geometrische MIttel wird zur Berechnung von Durchschnittswerten aus voneinander abhängigen Zahlen verwendet. (z.B. Wachstumsrate)
Eine zeigt uns die Umsätze und die Umsatzzuwächse unseres jährlichen Restaurantumsatzes an. Im Jahr 2006 lag der Restaurantumsatz z.B. um 13,1 Prozent über dem, des Jahres 2005. Wie bilden wir aus mehreren Wachstumsraten einen Durchschnittswert? Der Einsatz des arithmetischen Mittels wäre hier denkbar, ist jedoch zur Berechnung einer durchschnittlichen Wachstumsrate nicht sinnvoll.
Warum? Weil die Wachstumsraten der einzelnen Jahre voneinander abhängen und wir sie deshalb nicht wie unabhängige Werte einfach "addieren" dürfen, müssen wir sie durch folgende Formel "multiplizieren".
Es liegen uns 4 Werte vor, "n" beträgt also 4 und wir rechnen daher "4. Wurzel aus dem Produkt der einzelnen Wachstumsraten.
Dies ist das geometrische Mittel und wir kennen nun die durchschnittliche jährliche Wachstumsrate unseres Restaurantumsatzes.
Man kann sich einfach merken: Wenn der Durchschnittswert aus Wachstumsraten gebildet werden soll, so muss die Formel des geometrischen Mittels verwendet werden.
die "n Wurzel aus (x1*x2*x3...*xn).