M5

Tim Hambacher

Tim Hambacher

Set of flashcards Details

Flashcards 17
Language Deutsch
Category German
Level Primary School
Created / Updated 14.01.2013 / 31.07.2014
Weblink
https://card2brain.ch/box/quantitative_datenanalyse_vl3_parameterschaetzung
Embed
<iframe src="https://card2brain.ch/box/quantitative_datenanalyse_vl3_parameterschaetzung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

 

Grundproblem der Inferenzstatistik

 

·       Kennwerte in der Population (Parameter), also die „wahren Werte“, sind nicht bekannt

·       Parameterschätzung: Versuch, die wahren Werte aus der Stichprobe zu schätzen.

Fehlerquellen beim Schließen

  • sampling error (Stichprobenfehler)
  • non-sampling error (systematischer Fehler)

 

Stichprobenfehler (sampling error)

 

·       Es können sich in der Stichprobe rein zufällig andere Verhältnisse ergeben als in der Population

·       Beispiel: Aus einer Urne mit roten und schwarzen Kugeln könnten nur rote Kugeln gezogen werden.

·       Diese Fehler können nicht ausgeschlossen werden, ihre Wahrscheinlichkeit kann aber beschränkt werden (Vertrauensintervall und Signifikanztest).

 

Systematische Fehler (nonsampling error)

 

·       Merkmal besitzt in der Stichprobe eine systematisch andere Auftretenswahrscheinlichkeit als in der Population

·       Beispiel: Untersuchung zum Freizeitverhalten erwachsener Deutscher. Es werden nur Menschen als Altersheimen befragt, somit ergibt sich ein systematischer Unterschied.

·       Von einer repräsentativen Stichprobe spricht man dann, wenn es keine systematischen Fehler bei der Stichprobenauswahl gibt.

 

Parameterschätzung

 

·       Schätzung des Populationsmittelwertes μ

·       Für die Schätzung des Populationsmittelwertes μ bieten sich an:

o   Stichprobenmittelwert 

o   Median

o   Modus

 

Übersicht über verscheidene Verteilungen

 

·       Verteilungen von Stichproben

o   Beschreibung einer Stichprobe (beobachtbar)

·       Verteilung von Population

o   Beschreibung einer Population (normalerweise nicht beobachtbar)

·       Verteilung von Kennwerten

o   Beschreibung von Kennwerten (theoretische Verteilung)

 

Kennwertverteilung des Mittelwerts

 

·       Die Verteilung der Stichprobenmittelwerte (Kennwertverteilung) eines Merkmals X geht für große n (>30) in eine Normalverteilung über.

·       Wenn die Population normalverteilt ist, dann geht die Verteilung der Stichprobenmittelwerte (Kennwertverteilung) auch für kleine n in eine Normalverteilung über.

·       Der Mittelwert der Verteilung der Stichprobenmittelwerte ist identisch mit dem Populationsmittelwert, d.h. wenn man viele Stichproben ziehen und mitteln würde, dann würde man in Erwartungen nicht falsch liegen.

·       Daraus resultiert, dass der Mittelwert einer Stichprobe der beste Schätzer für das Populationsmittel ist

Kriterien für gute Schätzer

- Erwartungstreue

- Konsistenz

- Suffizienz

- relative Effizienz

Erwartungstreue

 

o   Der Erwartungswert (x Strich drüber)  kann den wahren Wert μ  mathematisch vorhersagen

o   Die Erwartungstreue eines Schätzers sagt nicht unbedingt etwas über die Genauigkeit der Schätzung aus!

o   (x Strich drüber) ist ein erwartungstreuer Schätzer für μ

o   Median und Modus sind erwartungstreue Schätzer für μ, wenn die Verteilung symmetrisch und eingipflig ist.

o   Ein erwartungstreuer Schätzer schätzt systematisch weder zu groß noch zu klein, sondern liegt im „Mittel“ richtig.

Konsistenz

 

  •      Konsistenz: Mit wachsendem Stichprobenumfang n nähert sich der Schätzer dem wahren Wert.

 

  •    Ein Abweichen des Schätzers vom wahren Wert um jeden noch so kleinen Betrag wird mit wachsendem n beliebig klein.

Relative Effizienz

 

·       Relative Effizienz: Die Streuung der Schätzwerte ist möglichst klein.

o   x ist ein effizienterer Schätzer als etwa der Median, da die Verteilung des Medians eine größere Streuung hat als die Verteilung des arithmetischen Mittelwerts.

Suffizienz

 

·       Alle Informationen in der Stichprobe werden ausgeschöpft.

Schätzung der Populationsvarianz 

 

·       Es wäre naheliegend die Schätzung der Populationsstandardabweichung σ eines Merkmals X durch die Stichprobenstandardabweichung s vorzunehmen:...

·       Ein optimaler Schätzer für die Populationsstandardabweichung σ ist:...

·       Die Formel für den Schätzer der Populationsstandardabweichung ist identisch mit der Stichprobenstandardabweichung, außer dass durch n-1 geteilt wird.

·       Das Dach über dem σ bedeutet, dass der Wert geschätzt ist

 

Standardfehler des Mittelwertes

 

·       Eine wichtige Größe in der Inferenzstatistik ist die Standardabweichung der Verteilung der Stichprobenmittelwerte (Kennwertverteilung, Mittelwertverteilung)

·       Wir wissen, dass die Stichprobenmittelwerte normalverteilt um den wahren Mittelwert μ verteilt sind.

·       Die Streuung der Mittelwertverteilung wird als Standardfehler des Mittelwertes oder auch als Standardschätzfehler des Mittelwertes bezeichnet.

·       Maß für die Genauigkeit, mit welcher der wahre Mittelwert μ durch einen Stichprobenmittelwert geschätzt wird.

·       Maß wie weit ein Stichprobenmittelwert vom Populationsmittelwert fällt.

·       Standardfehler des Mittelwerts: ...

 

Schätzung des Standardfehlers

 

·       Der Standardfehler ist ein Maß für die Genauigkeit, mit welcher der wahre Mittelwert der Population durch einen Stichprobenmittelwert geschätzt wird.

 

·       Schätzung des Standardfehlers durch Einsetzen der geschätzten Populationsstandardabweichung σ und teilen durch die Wurzel der Stichprobengröße.

·       Implikation: Um Standardfehler genauer zu machen braucht man größere Stichproben und Genauigkeit wird nicht linear besser (d.h. doppelte Stichprobe ist nicht halber Standardfehler)
 

·       2 Schritte

1.     Schätzen der Populationsstandardabweichung: hier n-1 Formel benutzen

2.     Schätzen des Standardfehlers der Kennwertverteilung: hier geteilt durch Wurzel von n benutzen

 

Zusammenfassung Kennwerteverteilung

 

·       Die Kennwerteverteilung des Mittels ist normalverteilt wenn n>30 (oder wenn Verteilung in Population normalverteilt ist)

·       Das arithmetische Mittel der Kennwerteverteilung ist identisch mit dem aritmethischen Mittel der Population

·       Die Standardabweichung der Kennwerteverteilung ist identisch der Standardabweichung der Population dividiert mit der Wurzel der Stichprobengröße

·       Arithmetische Mittel und Standardabweichung der Population sind normalerweise unbekannt - werden aber geschätzt durch die Statistiken der Stichprobe

 

Zentraler Grenzwertsatz

 

·       Stammen verschiedene Stichproben vom Umfang n aus der gleichen Population, so werden die zufälligen Unterschiede zwischen den Mittelwerten bei wachsendem Stichprobenumfang n grundsätzlich immer kleiner.

·       Die Verteilung der Stichprobenmittelwerte eines Merkmals X geht für große n in eine Normalverteilung über, deren Varianz proportional zum Stichprobenumfang klein wird.

Dabei ist es unerheblich wie das Merkmal X selbst in der Population verteilt ist (siehe Abbildung)
 

 

·       Begründung: Es werden durch die Bildung des Mittelwertes in großen Stichproben sehr viele kleine unsystematische Effekte aufsummiert à Normalverteilung