M5
Set of flashcards Details
Flashcards | 17 |
---|---|
Language | Deutsch |
Category | German |
Level | Primary School |
Created / Updated | 14.01.2013 / 31.07.2014 |
Weblink |
https://card2brain.ch/box/quantitative_datenanalyse_vl3_parameterschaetzung
|
Embed |
<iframe src="https://card2brain.ch/box/quantitative_datenanalyse_vl3_parameterschaetzung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Create or copy sets of flashcards
With an upgrade you can create or copy an unlimited number of sets and use many more additional features.
Log in to see all the cards.
Grundproblem der Inferenzstatistik
· Kennwerte in der Population (Parameter), also die „wahren Werte“, sind nicht bekannt
· Parameterschätzung: Versuch, die wahren Werte aus der Stichprobe zu schätzen.
Fehlerquellen beim Schließen
- sampling error (Stichprobenfehler)
- non-sampling error (systematischer Fehler)
Stichprobenfehler (sampling error)
· Es können sich in der Stichprobe rein zufällig andere Verhältnisse ergeben als in der Population
· Beispiel: Aus einer Urne mit roten und schwarzen Kugeln könnten nur rote Kugeln gezogen werden.
· Diese Fehler können nicht ausgeschlossen werden, ihre Wahrscheinlichkeit kann aber beschränkt werden (Vertrauensintervall und Signifikanztest).
Systematische Fehler (nonsampling error)
· Merkmal besitzt in der Stichprobe eine systematisch andere Auftretenswahrscheinlichkeit als in der Population
· Beispiel: Untersuchung zum Freizeitverhalten erwachsener Deutscher. Es werden nur Menschen als Altersheimen befragt, somit ergibt sich ein systematischer Unterschied.
· Von einer repräsentativen Stichprobe spricht man dann, wenn es keine systematischen Fehler bei der Stichprobenauswahl gibt.
Parameterschätzung
· Schätzung des Populationsmittelwertes μ
· Für die Schätzung des Populationsmittelwertes μ bieten sich an:
o Stichprobenmittelwert
o Median
o Modus
Übersicht über verscheidene Verteilungen
· Verteilungen von Stichproben
o Beschreibung einer Stichprobe (beobachtbar)
· Verteilung von Population
o Beschreibung einer Population (normalerweise nicht beobachtbar)
· Verteilung von Kennwerten
o Beschreibung von Kennwerten (theoretische Verteilung)
Kennwertverteilung des Mittelwerts
· Die Verteilung der Stichprobenmittelwerte (Kennwertverteilung) eines Merkmals X geht für große n (>30) in eine Normalverteilung über.
· Wenn die Population normalverteilt ist, dann geht die Verteilung der Stichprobenmittelwerte (Kennwertverteilung) auch für kleine n in eine Normalverteilung über.
· Der Mittelwert der Verteilung der Stichprobenmittelwerte ist identisch mit dem Populationsmittelwert, d.h. wenn man viele Stichproben ziehen und mitteln würde, dann würde man in Erwartungen nicht falsch liegen.
· Daraus resultiert, dass der Mittelwert einer Stichprobe der beste Schätzer für das Populationsmittel ist
Kriterien für gute Schätzer
- Erwartungstreue
- Konsistenz
- Suffizienz
- relative Effizienz
Erwartungstreue
o Der Erwartungswert (x Strich drüber) kann den wahren Wert μ mathematisch vorhersagen
o Die Erwartungstreue eines Schätzers sagt nicht unbedingt etwas über die Genauigkeit der Schätzung aus!
o (x Strich drüber) ist ein erwartungstreuer Schätzer für μ
o Median und Modus sind erwartungstreue Schätzer für μ, wenn die Verteilung symmetrisch und eingipflig ist.
o Ein erwartungstreuer Schätzer schätzt systematisch weder zu groß noch zu klein, sondern liegt im „Mittel“ richtig.
Konsistenz
- Konsistenz: Mit wachsendem Stichprobenumfang n nähert sich der Schätzer dem wahren Wert.
- Ein Abweichen des Schätzers vom wahren Wert um jeden noch so kleinen Betrag wird mit wachsendem n beliebig klein.
Relative Effizienz
· Relative Effizienz: Die Streuung der Schätzwerte ist möglichst klein.
o x ist ein effizienterer Schätzer als etwa der Median, da die Verteilung des Medians eine größere Streuung hat als die Verteilung des arithmetischen Mittelwerts.
Suffizienz
· Alle Informationen in der Stichprobe werden ausgeschöpft.
Schätzung der Populationsvarianz
· Es wäre naheliegend die Schätzung der Populationsstandardabweichung σ eines Merkmals X durch die Stichprobenstandardabweichung s vorzunehmen:...
· Ein optimaler Schätzer für die Populationsstandardabweichung σ ist:...
· Die Formel für den Schätzer der Populationsstandardabweichung ist identisch mit der Stichprobenstandardabweichung, außer dass durch n-1 geteilt wird.
· Das Dach über dem σ bedeutet, dass der Wert geschätzt ist
Standardfehler des Mittelwertes
· Eine wichtige Größe in der Inferenzstatistik ist die Standardabweichung der Verteilung der Stichprobenmittelwerte (Kennwertverteilung, Mittelwertverteilung)
· Wir wissen, dass die Stichprobenmittelwerte normalverteilt um den wahren Mittelwert μ verteilt sind.
· Die Streuung der Mittelwertverteilung wird als Standardfehler des Mittelwertes oder auch als Standardschätzfehler des Mittelwertes bezeichnet.
· Maß für die Genauigkeit, mit welcher der wahre Mittelwert μ durch einen Stichprobenmittelwert geschätzt wird.
· Maß wie weit ein Stichprobenmittelwert vom Populationsmittelwert fällt.
· Standardfehler des Mittelwerts: ...
Schätzung des Standardfehlers
· Der Standardfehler ist ein Maß für die Genauigkeit, mit welcher der wahre Mittelwert der Population durch einen Stichprobenmittelwert geschätzt wird.
· Schätzung des Standardfehlers durch Einsetzen der geschätzten Populationsstandardabweichung σ und teilen durch die Wurzel der Stichprobengröße.
· Implikation: Um Standardfehler genauer zu machen braucht man größere Stichproben und Genauigkeit wird nicht linear besser (d.h. doppelte Stichprobe ist nicht halber Standardfehler)
· 2 Schritte
1. Schätzen der Populationsstandardabweichung: hier n-1 Formel benutzen
2. Schätzen des Standardfehlers der Kennwertverteilung: hier geteilt durch Wurzel von n benutzen
Zusammenfassung Kennwerteverteilung
· Die Kennwerteverteilung des Mittels ist normalverteilt wenn n>30 (oder wenn Verteilung in Population normalverteilt ist)
· Das arithmetische Mittel der Kennwerteverteilung ist identisch mit dem aritmethischen Mittel der Population
· Die Standardabweichung der Kennwerteverteilung ist identisch der Standardabweichung der Population dividiert mit der Wurzel der Stichprobengröße
· Arithmetische Mittel und Standardabweichung der Population sind normalerweise unbekannt - werden aber geschätzt durch die Statistiken der Stichprobe
Zentraler Grenzwertsatz
· Stammen verschiedene Stichproben vom Umfang n aus der gleichen Population, so werden die zufälligen Unterschiede zwischen den Mittelwerten bei wachsendem Stichprobenumfang n grundsätzlich immer kleiner.
· Die Verteilung der Stichprobenmittelwerte eines Merkmals X geht für große n in eine Normalverteilung über, deren Varianz proportional zum Stichprobenumfang klein wird.
Dabei ist es unerheblich wie das Merkmal X selbst in der Population verteilt ist (siehe Abbildung)
· Begründung: Es werden durch die Bildung des Mittelwertes in großen Stichproben sehr viele kleine unsystematische Effekte aufsummiert à Normalverteilung
-
- 1 / 17
-