M5
Kartei Details
Karten | 17 |
---|---|
Sprache | Deutsch |
Kategorie | Deutsch |
Stufe | Grundschule |
Erstellt / Aktualisiert | 14.01.2013 / 31.07.2014 |
Weblink |
https://card2brain.ch/box/quantitative_datenanalyse_vl3_parameterschaetzung
|
Einbinden |
<iframe src="https://card2brain.ch/box/quantitative_datenanalyse_vl3_parameterschaetzung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Grundproblem der Inferenzstatistik
· Kennwerte in der Population (Parameter), also die „wahren Werte“, sind nicht bekannt
· Parameterschätzung: Versuch, die wahren Werte aus der Stichprobe zu schätzen.
Fehlerquellen beim Schließen
- sampling error (Stichprobenfehler)
- non-sampling error (systematischer Fehler)
Stichprobenfehler (sampling error)
· Es können sich in der Stichprobe rein zufällig andere Verhältnisse ergeben als in der Population
· Beispiel: Aus einer Urne mit roten und schwarzen Kugeln könnten nur rote Kugeln gezogen werden.
· Diese Fehler können nicht ausgeschlossen werden, ihre Wahrscheinlichkeit kann aber beschränkt werden (Vertrauensintervall und Signifikanztest).
Systematische Fehler (nonsampling error)
· Merkmal besitzt in der Stichprobe eine systematisch andere Auftretenswahrscheinlichkeit als in der Population
· Beispiel: Untersuchung zum Freizeitverhalten erwachsener Deutscher. Es werden nur Menschen als Altersheimen befragt, somit ergibt sich ein systematischer Unterschied.
· Von einer repräsentativen Stichprobe spricht man dann, wenn es keine systematischen Fehler bei der Stichprobenauswahl gibt.
Parameterschätzung
· Schätzung des Populationsmittelwertes μ
· Für die Schätzung des Populationsmittelwertes μ bieten sich an:
o Stichprobenmittelwert
o Median
o Modus
Übersicht über verscheidene Verteilungen
· Verteilungen von Stichproben
o Beschreibung einer Stichprobe (beobachtbar)
· Verteilung von Population
o Beschreibung einer Population (normalerweise nicht beobachtbar)
· Verteilung von Kennwerten
o Beschreibung von Kennwerten (theoretische Verteilung)
Kennwertverteilung des Mittelwerts
· Die Verteilung der Stichprobenmittelwerte (Kennwertverteilung) eines Merkmals X geht für große n (>30) in eine Normalverteilung über.
· Wenn die Population normalverteilt ist, dann geht die Verteilung der Stichprobenmittelwerte (Kennwertverteilung) auch für kleine n in eine Normalverteilung über.
· Der Mittelwert der Verteilung der Stichprobenmittelwerte ist identisch mit dem Populationsmittelwert, d.h. wenn man viele Stichproben ziehen und mitteln würde, dann würde man in Erwartungen nicht falsch liegen.
· Daraus resultiert, dass der Mittelwert einer Stichprobe der beste Schätzer für das Populationsmittel ist
Kriterien für gute Schätzer
- Erwartungstreue
- Konsistenz
- Suffizienz
- relative Effizienz
Erwartungstreue
o Der Erwartungswert (x Strich drüber) kann den wahren Wert μ mathematisch vorhersagen
o Die Erwartungstreue eines Schätzers sagt nicht unbedingt etwas über die Genauigkeit der Schätzung aus!
o (x Strich drüber) ist ein erwartungstreuer Schätzer für μ
o Median und Modus sind erwartungstreue Schätzer für μ, wenn die Verteilung symmetrisch und eingipflig ist.
o Ein erwartungstreuer Schätzer schätzt systematisch weder zu groß noch zu klein, sondern liegt im „Mittel“ richtig.
Konsistenz
- Konsistenz: Mit wachsendem Stichprobenumfang n nähert sich der Schätzer dem wahren Wert.
- Ein Abweichen des Schätzers vom wahren Wert um jeden noch so kleinen Betrag wird mit wachsendem n beliebig klein.
Relative Effizienz
· Relative Effizienz: Die Streuung der Schätzwerte ist möglichst klein.
o x ist ein effizienterer Schätzer als etwa der Median, da die Verteilung des Medians eine größere Streuung hat als die Verteilung des arithmetischen Mittelwerts.
Suffizienz
· Alle Informationen in der Stichprobe werden ausgeschöpft.
Schätzung der Populationsvarianz
· Es wäre naheliegend die Schätzung der Populationsstandardabweichung σ eines Merkmals X durch die Stichprobenstandardabweichung s vorzunehmen:...
· Ein optimaler Schätzer für die Populationsstandardabweichung σ ist:...
· Die Formel für den Schätzer der Populationsstandardabweichung ist identisch mit der Stichprobenstandardabweichung, außer dass durch n-1 geteilt wird.
· Das Dach über dem σ bedeutet, dass der Wert geschätzt ist
Standardfehler des Mittelwertes
· Eine wichtige Größe in der Inferenzstatistik ist die Standardabweichung der Verteilung der Stichprobenmittelwerte (Kennwertverteilung, Mittelwertverteilung)
· Wir wissen, dass die Stichprobenmittelwerte normalverteilt um den wahren Mittelwert μ verteilt sind.
· Die Streuung der Mittelwertverteilung wird als Standardfehler des Mittelwertes oder auch als Standardschätzfehler des Mittelwertes bezeichnet.
· Maß für die Genauigkeit, mit welcher der wahre Mittelwert μ durch einen Stichprobenmittelwert geschätzt wird.
· Maß wie weit ein Stichprobenmittelwert vom Populationsmittelwert fällt.
· Standardfehler des Mittelwerts: ...
Schätzung des Standardfehlers
· Der Standardfehler ist ein Maß für die Genauigkeit, mit welcher der wahre Mittelwert der Population durch einen Stichprobenmittelwert geschätzt wird.
· Schätzung des Standardfehlers durch Einsetzen der geschätzten Populationsstandardabweichung σ und teilen durch die Wurzel der Stichprobengröße.
· Implikation: Um Standardfehler genauer zu machen braucht man größere Stichproben und Genauigkeit wird nicht linear besser (d.h. doppelte Stichprobe ist nicht halber Standardfehler)
· 2 Schritte
1. Schätzen der Populationsstandardabweichung: hier n-1 Formel benutzen
2. Schätzen des Standardfehlers der Kennwertverteilung: hier geteilt durch Wurzel von n benutzen
Zusammenfassung Kennwerteverteilung
· Die Kennwerteverteilung des Mittels ist normalverteilt wenn n>30 (oder wenn Verteilung in Population normalverteilt ist)
· Das arithmetische Mittel der Kennwerteverteilung ist identisch mit dem aritmethischen Mittel der Population
· Die Standardabweichung der Kennwerteverteilung ist identisch der Standardabweichung der Population dividiert mit der Wurzel der Stichprobengröße
· Arithmetische Mittel und Standardabweichung der Population sind normalerweise unbekannt - werden aber geschätzt durch die Statistiken der Stichprobe
Zentraler Grenzwertsatz
· Stammen verschiedene Stichproben vom Umfang n aus der gleichen Population, so werden die zufälligen Unterschiede zwischen den Mittelwerten bei wachsendem Stichprobenumfang n grundsätzlich immer kleiner.
· Die Verteilung der Stichprobenmittelwerte eines Merkmals X geht für große n in eine Normalverteilung über, deren Varianz proportional zum Stichprobenumfang klein wird.
Dabei ist es unerheblich wie das Merkmal X selbst in der Population verteilt ist (siehe Abbildung)
· Begründung: Es werden durch die Bildung des Mittelwertes in großen Stichproben sehr viele kleine unsystematische Effekte aufsummiert à Normalverteilung