Statistik
3. Semester / Xevelonakis
3. Semester / Xevelonakis
Set of flashcards Details
Flashcards | 32 |
---|---|
Language | Deutsch |
Category | Maths |
Level | University |
Created / Updated | 11.01.2018 / 13.01.2018 |
Weblink |
https://card2brain.ch/box/20180111_statistik_x2Qo
|
Embed |
<iframe src="https://card2brain.ch/box/20180111_statistik_x2Qo/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Nominalskala
Zwischen Kategorien gibt es keine Ordnungsvorschriften, Zuordnung erfolgt auf Grund des Entscheides (Gleichheitsrelation): gehört dazu/gehört nicht dazu (Geschlecht, Zivilstand etc.)
= qualitativ (diskret), keine Zahlen
Ordninalskala
Gleichheitsrelation + Ordnungsrelation (kleiner, grösser, besser, schlechter)
= qualitativ (diskret), keine Zahlen
Intervallskala
keine Verhältnisse
- Gleichheitsrelation + Ordnungsrelation + Distanz
- Differenz zwischen zwei Werten stellt sinnvolle Grösse dar
- Quotient oder Produkt nicht sinnvoll
- (natürlicher) Nullpunkt nicht definiert
- z.B. Geburtsjahr
= metrisch, quantitativ (kann diskret oder stetig sein; zahlenlastig)
Verhältnisskala
Alles möglich, auch Verhältnisse
- Gleichheitsrelation + Ordnungsrelation + Distanz + fester (natürlicher) Nullpunkt
- z.B. Anzahl Personen in einem Haushalt
= metrisch/quantitativ (kann diskret oder stetig sein, zahlenlastig)
Grundgesamtheit
Menge der Merkmalsträger, über die man Aussagen machen will. Folgende Abgrenzungen sind dabei erforderlich:
- zeitlich (z.B. die letzten 6 Monate)
- örtlich (z.B. im Kanton ZH)
- sachlich (z.B. abgesprungene Kunden)
Diskrete Merkmale (Unterteilung metrische Datentypen)
keine Kommastellen, keine negativen Werte. Besitzen abzählbar viele Ausprägungen (Kinderanzahl, Autos pro Haushalt etc.)
Stetige Merkmale (Unterteilung metrische Datentypen)
Können auch Zwischenwerte realisiert werden. (Benzinverbrauch, Körpergrösse etc.)
Quasistetig (Sonderfall der Unterteilung metrischer Datentypen)
Diskrete Merkmale, die sehr viele Werte annehmen können, werden oft als stetige Merkmale betrachtet (bspw. durchschnitliche Zahl der Geburten einer Frau liegt bei 1.38 Kindern)
Diskretisierung (Unterteilung metrischer Datentypen)
Angaben in Fragebögen wie "Alter in Jahren" oder "Körpergrösse in cm" machen aus einem stetigen Merkmal ein diskretes
Statistische Erhebung
- Primärstatistik (Daten werden für die Untersuchung erhoben)
- Sekundärstatistik (Wird auf bestehendes Datenmaterial zurückgegriffen
- Vollerhebung (alle Elemente von der Grundgesamtheit werden untersucht)
- Teilerhebung (eine Teilmenge der Grundgesamtheit wird untersucht (Stichprobe))
Kreisdiagramme
für Darstellung von prozentualen Verteilungen einer Grundgesamtheit. weniger nützlich, wenn alle Abschnitte etwa gleich gross sind.
Balkendiagramm
besitzen höhere Genauigkeit und sind ideal in Situationen, in denen gleiche Kategorien vorliegen. Möglich, mehr als eine Datenreihe abzubilden
Histogramme
Werte werden auf einer kontinuierlichen numerischen Skala abgebildet. Zwischen einzelnen Balken gibt es keine Lücken. Fläche einzelner Balken entspricht der anteiligen Häufigkeit
Liniendiagramme
besser dazu geeignet, Trends sichtbar zu machen
Elemente beim Erstellen eines Diagramms
Merkmalsträger, Merkmal, Skalenniveau, Absolute Häufigkeit, Relative Häufigkeit
Summenhäufigkeitspolygon
verwendet, um kumulierte Häufigkeit darzustellen (bspw. Welche Kunden generieren 75% des Gesamtumsatzes)
arithmetisches Mittel
Das arithmetische Mittel (x Dach) einer Grundgesamtheit ist deren Summe, geteilt durch Anzahl der Werte, die die Grundgesamtheit blden (nur bei Verhältnis-/Intervallskalen möglich
Median
Bei Ausreissern (mind. ordinal skaliert). jener Wert, der genau in der Mitte der geordneten Merkmalswerte liegt. Oberhalb und unterhalb des Medians liegen gleich viele Werte
Modus/Modalwert
Modus = jener Merkmalswert einer Erhebung, der am häufigsten vorkommt. der einzige Lageparameter, der auch für nominalskalierte Merkmale geeignet ist
Spannweite
kann man messen, wie stark die Werte in einer Wertreihe streuen. Je grösser Streuung, desto grösster Stichproben, um repräsentative Werte zu bekommen
Boxplot
stellt Spannweite, den interquartilsabstand und Median dar. Im gleichen Diagramm kann man mehr als eine Datenreihe abbilden. Dadurch können Schwankungsbereiche der Datenreihen verglichen werden
Varianz
ist eine Methode zur Messung der Streuung in Daten. Die Varianz ist das Mittel der quadrierten Abweichungen vom Mittelwert.
Standardabweichung
Wenn man Quadratwurzel aus der Varianz zieht, entsteht Standardabweichung
Univariate Daten
entsprechen einer einzigen Variable pro Beobachtung (bspw. Häufigkeit der Konzertbesucher)
Bivariate Daten
bei der Untersuchung des Zusammenhangs zwischen zwei Merkmalen x (Sonnenschein) und y (Konzertbesucher) intressieren die Fragen:
- besteht ein Zusammenhang zwischen x und y?
- von welcher Form ist der Zusammenhang?
- von welcher Stärke/Intensität ist der Zusammenhang?
Regressionsanalyse
misst Form oder Tendenz des Zusammenhangs durch eine mathematische Funktion. Damit Form des Zusammenhangs darstellbar ist, müssen Abstände zwischen den Merkmalswerten messbar sein. Die Regressionsanalyse eignet sich also nur für intervall- oder verhältnisskalierte Merkmale
Methode der kleinsten Quadrate
= mathematisches Verfahren zur Anpassung einer Trendlinie an bivariaten Daten.
Korrelationskoeffizient
misst, wie gut die Gerade zu den Daten passt. Ist eine Zahl zwischen -1 (fallende Gerade) und +1 (steigende Gerade)
Erwartungswert
wichtigster Lageparameter bei der Wahrscheinlichkeitsverteilung. Entspricht dem zu erwartenden, durchschnittlichen Ergebnis, das man erhält, wenn das Zufallsexperiment genügend oft wiederholt wird
Varianz
Streuung der Zufallsvariablen wird durch die Varianz oder Standardabweichung angegeben
Bedingte Wahrscheinlichkeiten
lassen sich mit Hilfe von Wahrscheinlichkeitsbäumen visualisieren
Normalverteilung
ist die wichtigste stetige Verteilung. Gibt unendlich viele Normalverteilungen (Bsp.: Einkommen ist normalverteilt. heisst, dass die meisten Menschen einen durchschnittlichen Lohn haben und nur sehr wenige sehr arm oder reich sind)