Kurs 01146 - Fernuni Hagen


Fichier Détails

Cartes-fiches 55
Langue Deutsch
Catégorie Mathématiques
Niveau Université
Crée / Actualisé 16.08.2014 / 17.11.2024
Lien de web
https://card2brain.ch/box/stochastik_ke_1_statistische_datenanalyse
Intégrer
<iframe src="https://card2brain.ch/box/stochastik_ke_1_statistische_datenanalyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Wie ist der Begriff der "statistischen Einheit" definiert?

Die "statistische Einheit" ist das Objekt, an dem die interessiernede Größe beobachtet wird. Zum Beispiel das durch ein bestimmtes Wasserwerk zur Verfügung gestellte Trinkwasser in einer Trinkwasseruntersuchung.

Wie ist der Begriff des "Merkmals" definiert?

Das "Merkmal" ist die interessierende Größe. Zum Beispiel der Sauerstoffgehalt des Trinkwasser.

Wie ist der Begriff der "Merkmalsausprägung" definiert?

Die "Merkmalsausprägung" ist ein konkreter Wert, den das Merkmal für eine spezifische statistische Einheit annimmt. Zum Beispiel 7,6 mg/l im Wasserwerk Berlin/Spandau.

Wie ist der Begriff der "Grundgesamtheit" definiert?

Die "Grundgesamtheit" ist die Menge aller für die Untersuchung relevanten statistischen Einheiten. Zum Beispiel alle Wasserwerke in Deutschland.

Wie ist der Begriff der "Stichprobe" definiert?

Die "Stichprobe" ist die Teilmenge der Grundgesamtheit, die untersucht wird. Zum Beispiel alle Wasserwerke mit einer Förderleistung größer als 2.000.000 m³ pro Stunde.

Wie ist eine Nominalskala definiert?

Ein Nominalskala unterscheided Merkmale qualitativ, nicht aber quantitativ, es gibt also keine Ordnung.

Wie ist eine Ordinalskala definiert und wie wird sie auch bezeichnet?

Eine Ordinal- oder Rangskala ordnet qualitativ unterscheidbare Merkmale der Größe nach. Eine Interpretation der Abstände ist nicht möglich.

Wie ist eine metrische Skala definiert und wie lässt sie sich detaillierter aufführen?

Mit der metrischen Skala können qualitativ unterscheidbare Merkmale geordnet werden und Abstände sind interpretierbar. Wir unterscheiden weiterhin:

  • Intervallskala: Differenzenbildung zwischen Merkmalsausprägungen ist möglich, zum Beispiel wie bei Temperaturen.
  • Verhältnisskala: Differenzen- und Quotientenbildung ist möglich, zum Beispiel wie bei Geschwindigkeiten.
  • Absolutskala: Differenzen- und Quotientenbildung ist möglich und es existiert eine natürliche Einheit, wie zum Beispiel die Anzahl der Schüler einer Klasse oder Wahlberechtigte in einem Wahlkreis.

Wie ist eine "Stichprobe vom Umfang n" definiert?

Für n Merkmalsausprägungen x1, …, xn heißt x = (x1, …, xn) eine Strichprobe vom Umfang n.

Wie ist der Begriff "Merkmalwert" definiert?

Für eine n-elementige Stichprobe x = x1, …, xn heißt xk* mit k aus N und k <= n ein Merkmalwert, wenn eine Merkmalausprägung xk aus {x1, …, xn} den Wert xk* annimmt.

Wie ist der Begriff der "absoluten Häufigkeit" und "relativen Häufigkeit" eines Merkmalwertes xk* definiert?

Es ist die absolute Häufigkeit hk definiert durch hk(xk*) := Anzahl der statistischen Einheiten einer n-elementigen Stichprobe x, deren Merkmalausprägung den Wert von xk* annimmt und die relative Häufigkeit rk ist definiert durch rk := hk/n.

Was sind eine geordnete Stichprobe und wie ist der Rang einer Merkmalsausprägung auf einer Ordinalskala oder einer metrischen Skala definiert?

Sei x[1] die kleinste Merkmalsausprägung der Stichprobe x im Sinne der Ordnung und x[k] die k-t-kleinste Merkmalsausprägung der Stichprobe x, dann bezeichnet := (x[1], …, x[n]) die geordnete Stichprobe der n-elementigen Stichprobe x. Es ist:

Rang i> := 1 + #{ j | xj < xi } + 1/2 * #{ j | (j < i oder j > i) und xj = xi },

wobei #{ } die Mächtigkeit einer Menge bezeichnet.

Was sind Balken- und Säulendiagramme, welche Größen werden überlicherweise abgetragen und worauf sollte bei ihrer Erstellung geachtet werden?

Bei Balkendiagrammen (/Säulendiagrammen) werden absolute oder relative Häufigkeiten als Länge horizontaler Balken (/Höhe vertikaler Säulen) interpretiert. Balken (/Säulen) sollten sich nicht berühren und die gleiche Höhe (/Breite) haben.

Die Reihenfolge der dargestellten Merkmale ist bei nominal skalierten Merkmalen irrelevant, ab ordinal skalierten Merkmalen sollte die Reihenfolge beachtet werden, bei metrisch skalierten Merkmalen sollte darüber hinaus bei 0 begonnen werden und es sollten die Abstände der Merkmale berücksichtigt werden.

Was sind Kreisdiagramme, welche Größe wird abgetragen und wann können sie eingesetzt werden?

Bei Kreisdiagrammen werden relative Häufigkeiten rk in Mittelpunktswinkel ak mittels ak(xk*) := rk(xk*) * 360 umgerechnet und anschließend in einem Kreis dargestellt. Hierbei entsprechen die Verhältnisse von Winkeln, Bogenlängen und Kreissektorengrößen einander. Diese Darstellungsform eignet sich nur für nominal skalierte Merkmale, wegen der aufgehobenen Ordnung der Merkmale zueinander.

Wie sind absolute Summenhäufigkeit Hk und relative Summenhäufigkeit Rk definiert?

Sei x eine n-elementige Stichprobe und komme xk* mit absoluter Häufigkeit hk := hk(xk*) und relativer Häufigkeit rk :=  rk(xk*) vor, für alle k <= n. Dann sind:

Hk := h1 + … + hk die absolute Summenhäufigkeit von xk*

und

Rk := r1 + … + rk die relative Summenhäufigkeit von xk*.

Wie ist die empirische Verteilungsfunktion Fn definiert und wann sollte sie nicht verwendet werden?

Fn: IR → [0, 1] ist definiert wie angegeben und sollte nicht für nominal oder ordinal skalierte Merkmale verwendet werden, weil Abstände fälschlich interpretiert werden könnten.

Wie sind Liniendiagramme oder Häufigkeitspolygone definiert?

Zur Darstellung zeitlicher Verläufe werden relative oder absolute Häufigkeiten wie beim Säulendiagramm, nun aber punktuell über der Säulenmitte aufeinander folgender Beobachtungen abgetragen und  anschließend die Merkmalsausprägungen jeweils zweier, benachbarter Beobachtungszeitpunkte mit einer Linie verbunden. Bei mehr als 4 Merkmalen pro Diagramm verliert die Darstellung ihre Anschaulichkeit.

Was sind klassierte Daten, wann wenden wir sie an und wie werden sie dargestellt?

Wenn die Anzahl der möglichen Merkmalsausprägungen zu groß für eine anschauliche Darstellung wird und die Daten mindestens ordinal, besser metrisch skaliert sind, teilen wir sie in Klassen oder Gruppen ein und erhalten klassierte Daten. Die Anzahl der Klassen sollte nach der Regel von Sturge Wurzel (n) für kleine n - etwa n < 100 - und log2 n für große n sein.

Die Darstellung erfolgt entweder mittels Histogrammen, die ähnlich wie Balken- oder Säulendiagramme aufgebaut sind, allerdings keinen Abstand der einzelnen Merkmale aufweisen und bei denen die Flächeninhalte der abgetragenen Rechtecke den abgetragenen Häufigkeiten entsprechen sollen, oder mittels Stamm-Blatt-Diagrammen, bei denen die Darstellung der führenden gleichen Ziffern(-folgen) der jeweiligen Klassen in einer Spalte und daneben auf einer (bei Nichtunterscheidung der statistischen Einheiten) oder beiden Seiten (bei Unterteilung der statistischen Einheiten in zwei Vergleichsgruppen) der Stammspalte die Darstellung der Blätter durch die jeweils vorkommenden folgenden Ziffern in bliebiger Reihenfolge, aber wiederum in Spalten, um die Anzahl der Blätter je Stamm leicht visuell erfassen zu können.

Wie lautet Walter Krämers Empfehlung für die Darstellung von Daten?

Balken (/Säulen) für Vergleiche, Torten für Anteile, Kurven für Trends...

Wie ist der Modalwert oder Modus einer Stichprobe definiert?

Sei x eine n-elementige Stichprobe. Der Wert xi aus x mit:

h(xi) >= h(xj) für alle xj aus x heißt Modalwert xmod oder Modus von x.

Wie ist der Median oder Zentralwert eines ordinal skalierten Merkmals definiert?

Sei x eine n-elementige Stichprobe, dann ist der Median wie angegeben definiert.

Wie ist der Median oder Zentralwert eines metrisch skalierten Merkmals definiert?

Sei x eine n-elementige Stichprobe, dann ist der Median wie angegeben definiert.

Wie ist das arithmetische Mittel oder der empirische Mittelwert definiert?

Sei x eine n-elementige Stichprobe bzw. eine klassierte Stichprobe mit n Klassen, dann gelten wenn hk die absolute Häufigkeit des Merkmalwertes xk* für alle k aus {1, …, i} für ein i aus N mit i <= n bezeichnet:

Welches sind die Voraussetzungen für den Satz über die Schwerpunkteigenschaft des arithmetischen Mittels?

Gegeben sei ein quantitatives Merkmal, eine n-elementige Stichprobe x und das arithmetische Mittel der Stichprobe.

Wie lautet der Satz über die Schwerpunkteigenschaft des arithmetischen Mittels?

Unter den angegebenen Voraussetzungen gilt:

Welches sind die Voraussetzungen für den Satz über die arithmetischen Mittel quantitativ skalierter (also in R liegender) Stichproben?

1. Seien y1, …, yM Stichproben mit n1, …, nM Elementen und x die aus den y1, …, yM zusammengesetzte Stichprobe.

2. Seien x = (x1, …, xn) und y = ax + b = (ax1+ b, …, axn + b) mit a, b aus R.

3. Seien x = (x1, …, xn), y = (y1, …, yn) und z := ax + by = (ax1 + by1, …, axn + byn,) für a, b aus R.

Wie lautet der Satz über die arithmetischen Mittel quantitativ skalierter (also in R liegender) Stichproben?

Unter den angegebenen Voraussetzungen gelten:

Wie lautet die Definition eines p-Quantils?

Sei <x> eine geordnete, n-elementige Stichprobe eines ordinal skalierten Merkmals, dann heißt für p aus [0, 1] ein Wert x[k], für den die  beiden angegebenen Ungleichungen gelten, p-Quantil der Stichprobe.

Wie lautet der Satz über ein p-Quantil x[i]?

x[i] ist bestimmt durch i = np oder i = np + 1, falls np aus N, bzw. i = die größte ganze Zahl, die kleiner oder gleich np ist + 1 sonst.

Was ist gemeint, wenn vom

  • ersten oder unteren Quartil,
  • dem 0,5-Quantil oder 2. Quartil,
  • dem dritten Quartil,
  • dem 0. Quartil,
  • dem 4. Quartil,
  • dem ersten Dezil

die Rede ist?

Gemeint ist jeweils,

  • das 0,25-Quantil,
  • der Median,
  • das 0,75-Quantil,
  • das Minimum,
  • das Maximum,
  • das 0,1-Quantil.

Wie ist ein Lagemaß definiert?

Sei A eine Teilmenge von IRn. Ein Lagemaß ist eine Abbildung L: A → IR, für die folgendes gilt:

L(x1+t, …, xn+t) = L(x1, …, xn) + t

für alle t aus IR und alle (x1, …, xn) aus A.

Wie ist das a-getrimmte Mittel definiert?

Es ist für eine geordnete Stichprobe <x>:

xt,a := (n - 2k)-1 * (x[k+1] + … + x[n-k])

für 0 < a < 1/2 und k := die größte ganze Zahl kleiner oder gleich na.

Wie ist das geometrische Mittel definiert?

Sei x = (x1, …, xn) eine Stichprobe eines quantitativen Merkmals auf einer Verhältnisskala mit xi >= 0 für i = 1, …, n. Dann ist das geometrische Mittel wie angegeben definiert.

Wie ist das harmonische Mittel definiert?

Sei x = (x1, …, xn) eine Stichprobe eines quantitativen Merkmals auf einer Verhältnisskala mit xi > 0 für i = 1, …, n. Dann ist das harmonische Mittel wie angegeben definiert.

Wie ist sind Linksschiefe, Rechtsschiefe und Symmetrie definiert?

Die Begriffe sind wie angegeben definiert.

Wie lautet der Satz über die AGM-Ungleichung?

Sei x eine quantitativ skalierte Stichprobe auf einer Verhältnisskala mit ausschließlich positiven Merkmalsausprägungen, dann gilt:

Wann ist das Produkt n nichtnegativer Zahlen mit konstanter Summe maximal?

Das ist Produkt ist genau dann am größten, wenn alle Faktoren gleich sind.

Wie ist ein Streumaß definiert?

Ein Streumaß ist eine Abbildung s: IRn → IR mit der folgenden Eigenschaft:

s(x1 + t, …, xn + t) = s(x1, …, xn) für alle t aus IR und alle (x1, …, xn) aus IRn.

Wie ist die Spannweite einer Stichprobe definiert?

Die Spannweite ist die Differenz aus dem Maximum und dem Minimum der Merkmalsausprägungen der Stichprobe.

Wie ist die mittlere absolute Abweichung einer Stichprobe bezüglich c definiert?

Sei x eine n-elementige Stichprobe eines quantitativen Merkmals auf einer Intervallskala, dann ist die mittlere absolute Abweichung bezüglich c wie angegeben definiert.