Statistik

3. Semester / Xevelonakis

3. Semester / Xevelonakis

Livia Steiner

Livia Steiner

Set of flashcards Details

Flashcards 32
Language Deutsch
Category Maths
Level University
Created / Updated 11.01.2018 / 13.01.2018
Weblink
https://card2brain.ch/box/20180111_statistik_x2Qo
Embed
<iframe src="https://card2brain.ch/box/20180111_statistik_x2Qo/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Nominalskala

Zwischen Kategorien gibt es keine Ordnungsvorschriften, Zuordnung erfolgt auf Grund des Entscheides (Gleichheitsrelation): gehört dazu/gehört nicht dazu (Geschlecht, Zivilstand etc.)

= qualitativ (diskret), keine Zahlen

Ordninalskala

Gleichheitsrelation + Ordnungsrelation (kleiner, grösser, besser, schlechter)

= qualitativ (diskret), keine Zahlen

Intervallskala

keine Verhältnisse

- Gleichheitsrelation + Ordnungsrelation + Distanz
- Differenz zwischen zwei Werten stellt sinnvolle Grösse dar
- Quotient oder Produkt nicht sinnvoll
- (natürlicher) Nullpunkt nicht definiert
- z.B. Geburtsjahr

= metrisch, quantitativ (kann diskret oder stetig sein; zahlenlastig)

Verhältnisskala

Alles möglich, auch Verhältnisse

- Gleichheitsrelation + Ordnungsrelation + Distanz + fester (natürlicher) Nullpunkt
- z.B. Anzahl Personen in einem Haushalt

= metrisch/quantitativ (kann diskret oder stetig sein, zahlenlastig)

Grundgesamtheit

Menge der Merkmalsträger, über die man Aussagen machen will. Folgende Abgrenzungen sind dabei erforderlich:
- zeitlich (z.B. die letzten 6 Monate)
- örtlich (z.B. im Kanton ZH)
- sachlich (z.B. abgesprungene Kunden)

Diskrete Merkmale (Unterteilung metrische Datentypen)

keine Kommastellen, keine negativen Werte. Besitzen abzählbar viele Ausprägungen (Kinderanzahl, Autos pro Haushalt etc.)

Stetige Merkmale (Unterteilung metrische Datentypen)

Können auch Zwischenwerte realisiert werden. (Benzinverbrauch, Körpergrösse etc.)

Quasistetig (Sonderfall der Unterteilung metrischer Datentypen)

Diskrete Merkmale, die sehr viele Werte annehmen können, werden oft als stetige Merkmale betrachtet (bspw. durchschnitliche Zahl der Geburten einer Frau liegt bei 1.38 Kindern)

Diskretisierung (Unterteilung metrischer Datentypen)

Angaben in Fragebögen wie "Alter in Jahren" oder "Körpergrösse in cm" machen aus einem stetigen Merkmal ein diskretes

Statistische Erhebung

- Primärstatistik (Daten werden für die Untersuchung erhoben)
- Sekundärstatistik (Wird auf bestehendes Datenmaterial zurückgegriffen
- Vollerhebung (alle Elemente von der Grundgesamtheit werden untersucht)
- Teilerhebung (eine Teilmenge der Grundgesamtheit wird untersucht (Stichprobe))

Kreisdiagramme

für Darstellung von prozentualen Verteilungen einer Grundgesamtheit. weniger nützlich, wenn alle Abschnitte etwa gleich gross sind.

Balkendiagramm

besitzen höhere Genauigkeit und sind ideal in Situationen, in denen gleiche Kategorien vorliegen. Möglich, mehr als eine Datenreihe abzubilden

Histogramme

Werte werden auf einer kontinuierlichen numerischen Skala abgebildet. Zwischen einzelnen Balken gibt es keine Lücken. Fläche einzelner Balken entspricht der anteiligen Häufigkeit

Liniendiagramme

besser dazu geeignet, Trends sichtbar zu machen

Elemente beim Erstellen eines Diagramms

Merkmalsträger, Merkmal, Skalenniveau, Absolute Häufigkeit, Relative Häufigkeit

Summenhäufigkeitspolygon

verwendet, um kumulierte Häufigkeit darzustellen (bspw. Welche Kunden generieren 75% des Gesamtumsatzes)

arithmetisches Mittel

Das arithmetische Mittel (x Dach) einer Grundgesamtheit ist deren Summe, geteilt durch Anzahl der Werte, die die Grundgesamtheit blden (nur bei Verhältnis-/Intervallskalen möglich

Median

Bei Ausreissern (mind. ordinal skaliert). jener Wert, der genau in der Mitte der geordneten Merkmalswerte liegt. Oberhalb und unterhalb des Medians liegen gleich viele Werte

Modus/Modalwert

Modus = jener Merkmalswert einer Erhebung, der am häufigsten vorkommt. der einzige Lageparameter, der auch für nominalskalierte Merkmale geeignet ist

Spannweite

kann man messen, wie stark die Werte in einer Wertreihe streuen. Je grösser Streuung, desto grösster Stichproben, um repräsentative Werte zu bekommen

Boxplot

stellt Spannweite, den interquartilsabstand und Median dar. Im gleichen Diagramm kann man mehr als eine Datenreihe abbilden. Dadurch können Schwankungsbereiche der Datenreihen verglichen werden

Varianz

ist eine Methode zur Messung der Streuung in Daten. Die Varianz ist das Mittel der quadrierten Abweichungen vom Mittelwert.

Standardabweichung

Wenn man Quadratwurzel aus der Varianz zieht, entsteht Standardabweichung

Univariate Daten

entsprechen einer einzigen Variable pro Beobachtung (bspw. Häufigkeit der Konzertbesucher)

Bivariate Daten

bei der Untersuchung des Zusammenhangs zwischen zwei Merkmalen x (Sonnenschein) und y (Konzertbesucher) intressieren die Fragen:
- besteht ein Zusammenhang zwischen x und y?
- von welcher Form ist der Zusammenhang?
- von welcher Stärke/Intensität ist der Zusammenhang?

Regressionsanalyse

misst Form oder Tendenz des Zusammenhangs durch eine mathematische Funktion. Damit Form des Zusammenhangs darstellbar ist, müssen Abstände zwischen den Merkmalswerten messbar sein. Die Regressionsanalyse eignet sich also nur für intervall- oder verhältnisskalierte Merkmale

Methode der kleinsten Quadrate

= mathematisches Verfahren zur Anpassung einer Trendlinie an bivariaten Daten. 

Korrelationskoeffizient

misst, wie gut die Gerade zu den Daten passt. Ist eine Zahl zwischen -1 (fallende Gerade) und +1 (steigende Gerade)

Erwartungswert

wichtigster Lageparameter bei der Wahrscheinlichkeitsverteilung. Entspricht dem zu erwartenden, durchschnittlichen Ergebnis, das man erhält, wenn das Zufallsexperiment genügend oft wiederholt wird

Varianz

Streuung der Zufallsvariablen wird durch die Varianz oder Standardabweichung angegeben

Bedingte Wahrscheinlichkeiten

lassen sich mit Hilfe von Wahrscheinlichkeitsbäumen visualisieren

Normalverteilung

ist die wichtigste stetige Verteilung. Gibt unendlich viele Normalverteilungen (Bsp.: Einkommen ist normalverteilt. heisst, dass die meisten Menschen einen durchschnittlichen Lohn haben und nur sehr wenige sehr arm oder reich sind)