Stochastik - KE 1 (statistische Datenanalyse)
Kurs 01146 - Fernuni Hagen
Kurs 01146 - Fernuni Hagen
Kartei Details
Karten | 55 |
---|---|
Sprache | Deutsch |
Kategorie | Mathematik |
Stufe | Universität |
Erstellt / Aktualisiert | 16.08.2014 / 17.11.2024 |
Weblink |
https://card2brain.ch/box/stochastik_ke_1_statistische_datenanalyse
|
Einbinden |
<iframe src="https://card2brain.ch/box/stochastik_ke_1_statistische_datenanalyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Wie ist der Begriff der "statistischen Einheit" definiert?
Die "statistische Einheit" ist das Objekt, an dem die interessiernede Größe beobachtet wird. Zum Beispiel das durch ein bestimmtes Wasserwerk zur Verfügung gestellte Trinkwasser in einer Trinkwasseruntersuchung.
Wie ist der Begriff des "Merkmals" definiert?
Das "Merkmal" ist die interessierende Größe. Zum Beispiel der Sauerstoffgehalt des Trinkwasser.
Wie ist der Begriff der "Merkmalsausprägung" definiert?
Die "Merkmalsausprägung" ist ein konkreter Wert, den das Merkmal für eine spezifische statistische Einheit annimmt. Zum Beispiel 7,6 mg/l im Wasserwerk Berlin/Spandau.
Wie ist der Begriff der "Grundgesamtheit" definiert?
Die "Grundgesamtheit" ist die Menge aller für die Untersuchung relevanten statistischen Einheiten. Zum Beispiel alle Wasserwerke in Deutschland.
Wie ist der Begriff der "Stichprobe" definiert?
Die "Stichprobe" ist die Teilmenge der Grundgesamtheit, die untersucht wird. Zum Beispiel alle Wasserwerke mit einer Förderleistung größer als 2.000.000 m³ pro Stunde.
Wie ist eine Nominalskala definiert?
Ein Nominalskala unterscheided Merkmale qualitativ, nicht aber quantitativ, es gibt also keine Ordnung.
Wie ist eine Ordinalskala definiert und wie wird sie auch bezeichnet?
Eine Ordinal- oder Rangskala ordnet qualitativ unterscheidbare Merkmale der Größe nach. Eine Interpretation der Abstände ist nicht möglich.
Wie ist eine metrische Skala definiert und wie lässt sie sich detaillierter aufführen?
Mit der metrischen Skala können qualitativ unterscheidbare Merkmale geordnet werden und Abstände sind interpretierbar. Wir unterscheiden weiterhin:
- Intervallskala: Differenzenbildung zwischen Merkmalsausprägungen ist möglich, zum Beispiel wie bei Temperaturen.
- Verhältnisskala: Differenzen- und Quotientenbildung ist möglich, zum Beispiel wie bei Geschwindigkeiten.
- Absolutskala: Differenzen- und Quotientenbildung ist möglich und es existiert eine natürliche Einheit, wie zum Beispiel die Anzahl der Schüler einer Klasse oder Wahlberechtigte in einem Wahlkreis.
Wie ist eine "Stichprobe vom Umfang n" definiert?
Für n Merkmalsausprägungen x1, …, xn heißt x = (x1, …, xn) eine Strichprobe vom Umfang n.
Wie ist der Begriff "Merkmalwert" definiert?
Für eine n-elementige Stichprobe x = x1, …, xn heißt xk* mit k aus N und k <= n ein Merkmalwert, wenn eine Merkmalausprägung xk aus {x1, …, xn} den Wert xk* annimmt.
Wie ist der Begriff der "absoluten Häufigkeit" und "relativen Häufigkeit" eines Merkmalwertes xk* definiert?
Es ist die absolute Häufigkeit hk definiert durch hk(xk*) := Anzahl der statistischen Einheiten einer n-elementigen Stichprobe x, deren Merkmalausprägung den Wert von xk* annimmt und die relative Häufigkeit rk ist definiert durch rk := hk/n.
Was sind eine geordnete Stichprobe und wie ist der Rang einer Merkmalsausprägung auf einer Ordinalskala oder einer metrischen Skala definiert?
Sei x[1] die kleinste Merkmalsausprägung der Stichprobe x im Sinne der Ordnung und x[k] die k-t-kleinste Merkmalsausprägung der Stichprobe x, dann bezeichnet := (x[1], …, x[n]) die geordnete Stichprobe der n-elementigen Stichprobe x. Es ist:
Rang i> := 1 + #{ j | xj < xi } + 1/2 * #{ j | (j < i oder j > i) und xj = xi },
wobei #{ } die Mächtigkeit einer Menge bezeichnet.
Was sind Balken- und Säulendiagramme, welche Größen werden überlicherweise abgetragen und worauf sollte bei ihrer Erstellung geachtet werden?
Bei Balkendiagrammen (/Säulendiagrammen) werden absolute oder relative Häufigkeiten als Länge horizontaler Balken (/Höhe vertikaler Säulen) interpretiert. Balken (/Säulen) sollten sich nicht berühren und die gleiche Höhe (/Breite) haben.
Die Reihenfolge der dargestellten Merkmale ist bei nominal skalierten Merkmalen irrelevant, ab ordinal skalierten Merkmalen sollte die Reihenfolge beachtet werden, bei metrisch skalierten Merkmalen sollte darüber hinaus bei 0 begonnen werden und es sollten die Abstände der Merkmale berücksichtigt werden.
Was sind Kreisdiagramme, welche Größe wird abgetragen und wann können sie eingesetzt werden?
Bei Kreisdiagrammen werden relative Häufigkeiten rk in Mittelpunktswinkel ak mittels ak(xk*) := rk(xk*) * 360 umgerechnet und anschließend in einem Kreis dargestellt. Hierbei entsprechen die Verhältnisse von Winkeln, Bogenlängen und Kreissektorengrößen einander. Diese Darstellungsform eignet sich nur für nominal skalierte Merkmale, wegen der aufgehobenen Ordnung der Merkmale zueinander.
Wie sind absolute Summenhäufigkeit Hk und relative Summenhäufigkeit Rk definiert?
Sei x eine n-elementige Stichprobe und komme xk* mit absoluter Häufigkeit hk := hk(xk*) und relativer Häufigkeit rk := rk(xk*) vor, für alle k <= n. Dann sind:
Hk := h1 + … + hk die absolute Summenhäufigkeit von xk*
und
Rk := r1 + … + rk die relative Summenhäufigkeit von xk*.
Wie sind Liniendiagramme oder Häufigkeitspolygone definiert?
Zur Darstellung zeitlicher Verläufe werden relative oder absolute Häufigkeiten wie beim Säulendiagramm, nun aber punktuell über der Säulenmitte aufeinander folgender Beobachtungen abgetragen und anschließend die Merkmalsausprägungen jeweils zweier, benachbarter Beobachtungszeitpunkte mit einer Linie verbunden. Bei mehr als 4 Merkmalen pro Diagramm verliert die Darstellung ihre Anschaulichkeit.
Was sind klassierte Daten, wann wenden wir sie an und wie werden sie dargestellt?
Wenn die Anzahl der möglichen Merkmalsausprägungen zu groß für eine anschauliche Darstellung wird und die Daten mindestens ordinal, besser metrisch skaliert sind, teilen wir sie in Klassen oder Gruppen ein und erhalten klassierte Daten. Die Anzahl der Klassen sollte nach der Regel von Sturge Wurzel (n) für kleine n - etwa n < 100 - und log2 n für große n sein.
Die Darstellung erfolgt entweder mittels Histogrammen, die ähnlich wie Balken- oder Säulendiagramme aufgebaut sind, allerdings keinen Abstand der einzelnen Merkmale aufweisen und bei denen die Flächeninhalte der abgetragenen Rechtecke den abgetragenen Häufigkeiten entsprechen sollen, oder mittels Stamm-Blatt-Diagrammen, bei denen die Darstellung der führenden gleichen Ziffern(-folgen) der jeweiligen Klassen in einer Spalte und daneben auf einer (bei Nichtunterscheidung der statistischen Einheiten) oder beiden Seiten (bei Unterteilung der statistischen Einheiten in zwei Vergleichsgruppen) der Stammspalte die Darstellung der Blätter durch die jeweils vorkommenden folgenden Ziffern in bliebiger Reihenfolge, aber wiederum in Spalten, um die Anzahl der Blätter je Stamm leicht visuell erfassen zu können.
Wie lautet Walter Krämers Empfehlung für die Darstellung von Daten?
Balken (/Säulen) für Vergleiche, Torten für Anteile, Kurven für Trends...
Wie ist der Modalwert oder Modus einer Stichprobe definiert?
Sei x eine n-elementige Stichprobe. Der Wert xi aus x mit:
h(xi) >= h(xj) für alle xj aus x heißt Modalwert xmod oder Modus von x.
Welches sind die Voraussetzungen für den Satz über die Schwerpunkteigenschaft des arithmetischen Mittels?
Gegeben sei ein quantitatives Merkmal, eine n-elementige Stichprobe x und das arithmetische Mittel der Stichprobe.
Welches sind die Voraussetzungen für den Satz über die arithmetischen Mittel quantitativ skalierter (also in R liegender) Stichproben?
1. Seien y1, …, yM Stichproben mit n1, …, nM Elementen und x die aus den y1, …, yM zusammengesetzte Stichprobe.
2. Seien x = (x1, …, xn) und y = ax + b = (ax1+ b, …, axn + b) mit a, b aus R.
3. Seien x = (x1, …, xn), y = (y1, …, yn) und z := ax + by = (ax1 + by1, …, axn + byn,) für a, b aus R.
Wie lautet der Satz über ein p-Quantil x[i]?
x[i] ist bestimmt durch i = np oder i = np + 1, falls np aus N, bzw. i = die größte ganze Zahl, die kleiner oder gleich np ist + 1 sonst.
Was ist gemeint, wenn vom
- ersten oder unteren Quartil,
- dem 0,5-Quantil oder 2. Quartil,
- dem dritten Quartil,
- dem 0. Quartil,
- dem 4. Quartil,
- dem ersten Dezil
die Rede ist?
Gemeint ist jeweils,
- das 0,25-Quantil,
- der Median,
- das 0,75-Quantil,
- das Minimum,
- das Maximum,
- das 0,1-Quantil.
Wie ist ein Lagemaß definiert?
Sei A eine Teilmenge von IRn. Ein Lagemaß ist eine Abbildung L: A → IR, für die folgendes gilt:
L(x1+t, …, xn+t) = L(x1, …, xn) + t
für alle t aus IR und alle (x1, …, xn) aus A.
Wie ist das a-getrimmte Mittel definiert?
Es ist für eine geordnete Stichprobe <x>:
xt,a := (n - 2k)-1 * (x[k+1] + … + x[n-k])
für 0 < a < 1/2 und k := die größte ganze Zahl kleiner oder gleich na.
Wann ist das Produkt n nichtnegativer Zahlen mit konstanter Summe maximal?
Das ist Produkt ist genau dann am größten, wenn alle Faktoren gleich sind.
Wie ist ein Streumaß definiert?
Ein Streumaß ist eine Abbildung s: IRn → IR mit der folgenden Eigenschaft:
s(x1 + t, …, xn + t) = s(x1, …, xn) für alle t aus IR und alle (x1, …, xn) aus IRn.
Wie ist die Spannweite einer Stichprobe definiert?
Die Spannweite ist die Differenz aus dem Maximum und dem Minimum der Merkmalsausprägungen der Stichprobe.