M2_Statistik I Kap. 1-2
B.Sc. Psychologie Fernuniversität Hagen
B.Sc. Psychologie Fernuniversität Hagen
Set of flashcards Details
Flashcards | 23 |
---|---|
Students | 21 |
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 25.10.2013 / 16.10.2019 |
Weblink |
https://card2brain.ch/box/m2statistik_i_kap_12
|
Embed |
<iframe src="https://card2brain.ch/box/m2statistik_i_kap_12/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Definition Statistik
Eine Wissenschaft, die Methoden zur Gewinnung von Daten und zum Lernen aus Daten bereit stellt.
Wo spielt Statistki eine Rolle?
- industriellen Fertigungsprozessen, Dinestleistungsbereich (bereits in der Designphase eines Produkts, Serviceleistungen)
- Mart- und Werbeforschung (Marktanteile auf Stichprobenbasis ermitteln, Marktpotentiale
- Einschaltquoten für Radio- und Fernsehsender
- Banken (Vergabe von Krediten, Analyse von Kapitalmarktdaten)
- Lebensmittelkonzerne (werten Scannerdaten aus)
- Pharmahersteller (Wirksamkeits- und Unbedenklichkeitsnachweise)
- Psychologie (Psychologische Interventionen)
- Soziologie, Sozialpsychologie
- Medizin, Gesunheitsökonomie, Biologie
- Bildungspädagogik
- Ingenieurwissenschaften, Versicherungsmathematik, Wirtschaftswissenschaften, Umweltwissenschaften
- Politikplanung (Bevölerungsdaten)
- uva.
Was sind die Aufgaben der Statistik?
- Erhebung von Daten
- Beschreibung und Visualisierung der erhobenen Befunde
- Identifikation von Auffälligkeiten in Daten
- Ableitung von Schlüssen
Bedeutung des Begriffs "Statistik":
- Wissenschaft (in unserem Manuskript überwiegend in diesem Sinne)
- Kenngrößen die sich aus statistischen Daten ableiten (Mittelwert)
- Funktionen von Zufallsvariablen (zur Schätzung der Kenngrößen)
- Datensatz
Was sind die 2 Bereiche der Statistik?
beschreibende (deskriptive) Statistik und schließende Statistik
Was umfasst die beschreibende (deskriptive) Statistik und welches Ziel verfolgt sie?
- numerische und grafische Verfahren zur Charakterisierung und Präsentation von Daten
- Techniken der Datenerhebung (werden meist zugerechnet)
- beschreibende Statistik wird am meisten verwendet (benötigt eigentlich keine Modelle)
- explorative Datenanalyse
Ziel: Reduktion der enthaltenen statistischen Informationen durch Aggregation auf wenige Kenngrößen, möglichst ohne größeren Verlust an relevanter Information.
Was ist explorative Datenanalyse?
Ohne Einsatz von Modellen wird mit rechenintensiven Verfahren nach auffälligen Mustern und Strukturen in Datenbeständen gesucht.
z. B. Scannerdaten eines Lebensmittelskonzern werden heute routinemäßig nach Auffälligkeiten durchleuchtet, ohne dass schon unbedingt eine Hypothese im Spiel ist.
= Data Mining
Was umfasst die schließende (induktive) Statistik?
Sie leitet aus Stichprobendaten Aussagen ab, die sich auf eine umfassendere Grundgesamtheit beziehen. Werden in Wahrscheinlichkeitsmodellen beschrieben.
Typische Aufgaben: Schätzen von Modellparametern, Testen von Hypothesen
Die Folgerungen sind oft mit Unsicherheiten verknüpft (Schätzfehler, Fehlentscheidungen beim Testen)
Was sind Schlüsselqualifikationen?
Beziehen sich auf Fähigkeiten zur sachadäquaten Anwendung von Wissen und auf Strategien zur Erschließung neuen Wissens.
- soziale Kompetenz (Kommunikationsfähigkeit)
- Medienkompetenz (Fähigkeit zur Nutzung der Informationsfülle)
- Methodenkompetenz (Fähigkeit zur Nutzung von Werkzeugen, Arbeitstechniken, Theorien zur Lösung von Problemen
- Beschäftigungsfähigkeit (neue Schlüsselqualifikation durch Bologna-Prozess)
Begriffe die man kennen sollte:
Evidence Based Decision Making (Datengestützte Entscheidungsfindung) - Medizin, Politik, Markt- und Meinungsforschung,...
Statistical literacy (statistische Methodenkompetenz) wirkt sich positiv auf Beschäftigungsfähigkeit aus, da es in immer mehr Bereichen an Bedeutung zunimmt
Grundbegriffe:
statistische Einheiten / Merkmalsträger: Objekte, auf die sich eine statistische Untersuchung bezieht
Grundgesamtheit / Population: die Menge aller für eine Fragestellung interessierenden statistischen Einheiten
Teilpopulation: Teilmengen von Grundgesamtheiten
Merkmale / Variablen: Eigenschaften statistischer Einheiten (Großbuchstaben, z. B. X,Y,Z)
Merkmalsausprägungen: Werte, die ein Merkmal annehmen kann (Kleinbuchstagen, z. B. a1, a2, a3,...)
Stichprobe: Auswahl nach einem Auswahlverfahren einer Teilmenge aus einer Grundgesamtheit
Urwerte/Primärdaten/Rohdaten: Beobachteten Werte für ein Merkmal ->Zusammenfassung der Daten = Urliste
Zufallsvariable: wenn man die Ausprägung eines Merkmals als das Ergebnis eines Zufallsvorgangs interpretiert, deren Ausprägungen auch Realisierungen (Bsp. für Realisierg. von Zufallsvariablen: beobachteten Ergebnisse einer Serie von Roulettespielen)
Stichprobenvariablen: Ausprägungen aller Elemente einer Stichprobe als Zufallsvariablen interpretiert
Klassifizierung von Merkmalen:
z.B. Anzahl der möglichen Ausprägungen
-diskretes Merkmal: endlich viele Ausprägungen oder höchstens abzählbar ungendlich (Primzahlen, gerade ganze Zahlen,...) viele Ausprägungen
-stetiges Merkmal: Ausprägungen bilden ein Intervall, für je 2 Merkmalsauprägungen eines stetigen Merkmals gilt, dass auch alle Zwischenwerte angenommen werden können. (Körpergröße, Größe einer Wohnung)
-> durch Rundung o. Gruppierung kann man jedes stetige Merkmal in diskrete Variabllen überführen, aber Informationsverlust!
--> mehr Übersichtlichkeit, aber innerhalb der Klassen kann man nicht mehr differenzieren (z.B. Messung von Bruttojahreseinkommen anhand von Einkommensklassen)
Beispiele für diskrete und stetige Merkmale:
diskrete Merkmale: Anzahl der Fachsemester von Studierenden, Güteklassen bei Lebensmitteln oder Hotels, Familienstand einer Person, Anzahl der zu einem Haushalt gehörenden Personen
stetige Merkmale: Zeitangaben, Längen, Gewichte, Merkmale zur Quantifizierung der Schadstoffbelastung von Luft und Wasser, Bruttoeinkommen, Mietpreise, Intelligenzquotient einer Person
Zweite Merkmalsklassifikation
basiert auf der Art der verwendeten Messskala, man unterscheidet 3 Skalenniveaus:
- Nominalskalen: Ausprägungen eines Merkmals stellen lediglich Namen oder Kategorie dar, z.B. Branchenzugehörigkeit von Arbeitnehmern, Studienfach eines Studenten, Transportmedium von Pendlern. Typisch: es gibt keine natürliche Rangordnung, Bildung von Differenzen oder Quotienten ist nicht sinnvol
- Ordinalskalen(Rangskala): es gibt eine natürliche Rangordnung, aber Differnez- oder Quotientenbildung nicht sinnvoll. Z. B. Schulnoten, Bonitätsbewertungen. Es gibt zwar Rangordnung zw. den Stufen, aber Abstände zw. 2 Stufen sind nicht direkt vergleichbar
- metrische Skalen (Kardinalskala): Auch Abstände (Differenzen) zw. Merkmalsausprägungen sind sinnvol interpretierbar.
->Verhältnisskala/Ratioskala (Geschwindigkeit - Quotient sinnvoll, Merkmal mit nat. Nullpunkt ->100 km/h sind doppelt so schnell wie 50 km/h), wenn natürlicher Nullpunkt existiert, ansonsten Intervallskala (Temperaturmessung - Quotient nicht sinnvol)
Spezialfall der Verhältnisskala: Absolutskala, hat natürlichen Nullpunkt und zusätzlich eine natürliche Einheit (z.B. Anzahl der Fachsemester)
Skalenniveaus stellen eine Hierarchie da (S.18)
Operationen, die für Daten eines best. Skalenniveaus zulässig sind, sind stets auch auf Daten aller höheren Niveaus anwendbar. Man kann z.B. ein Merkmal, das ordinalskaliert ist auf einer Nominalskala messen und ein metrisch skaliertes Merkmal auf einer Ordinalskala oder Nominalskala, allerdings Informationsverlust!
Was ist die Likert-Skala?
Messung von persönlichen Einstellungen oder Empfindungen -> nicht direkt beobachtbare Variablen = Latente Variablen, z.B. die individuellen Ausprägungen der Merkmale "Intelligenz", "Leistungsmotivation", "Aggressivität", "Umweltbewusstsein", "Schmerz" -> Vorlegung von Aussagen (Items) und Erfassung des Grades der Zustimmung ("trifft zu" bis "trifft nicht zu")
Anzahl der Stufen der Skala kann ungerade (neutrale Bewertung in der Mitte der Skala) oder gerade (keine neutrale Position) --> Ordinalskaliert (Abstände der Stufen nicht zwingend gleich)
Verwendung in den Sozialwissenschaften, Markt- und Meinungsforschung, Psychologie, Medizin (Einschätzung von Schmerzintensität)
--->Instrument zur Erhebung ordinalskalierter Daten
Likert-Skala: Verwendung in der Praxis:
häufig wird Äquidistanz der Stufen unterstellt um Anwendung von Operationen zu rechtfertigen, die eigentlich nur für metrisch skalierte Daten zulässig sind, z. B. Mittelwertbildung
Likert-Skala heißt auch Ratingskala. Ratinskala aber nicht nur im Zusammenhang mit der Messung von persönlichen Einstellungen und Empfindungen, sondern auch bei der Bewertung der Bonität von Staaten, Unternehmen oder individuellen Kreditnehmern
Weitere Beispiele für Merkmale mit unterschiedlicher Skalierung:
-Nominalskalierte Ausprägungen: Parteipräferenz von Wählern, Konfessionszugehörigkeit, Geschlecht
-Ordinal- oder rangkaliert: Militärischer Rang, Höchster erreichter Bildungsabschluss, Temperatur (wenn Unterscheidung nur zw. kalt, normal, warm, heiß), Antworten einer 5-stufigen Likert-Skala (trift zu - trifft nicht zu)
-Metrisch: Geburtsjahr (Intervallskala), Lebensalter, CO2-Emissionen von Pkws (Verhältnisskala)
Klassifikation nach Merkmalsausprägungen (Kategorie oder Zahl):
-qualitatives Merkmal: wenn Ausprägungen Kategorien sind - nominal (ungeordnet, z.B. Konfessionszugehörigkeit) oder ordinalskaliert (geordnet, z.B. Güteklasse bei Lebensmitteln), Ausprägungen werden oft Zahlencodes zugeordnet (etwa 2=verheiratet), damit lässt sich aber nicht rechnen
-quantitatives Merkmal: Ausprägungen sind echte Zahlen, metrisch skalierte Merkmale sind stets quantitativ
Was ist Operationalisierung?
Festlegung von Messanweisungen (Verfahren spezifizieren, mit dem sich ein merkmal quantifizieren lässt)
Beurteilung der Qualität von Messverfahren:
- Objektivität (intersubjektive Nachvollziebarkeit)
- Reliabilität (Messgenauigkeit) - bezieht sich auf technische Ebene
- Validität (Gültigkeit) - bezieht sich auf inhaltlichen Aspekt
Wann tritt Operationalisierung von Merkmalen auf?
Bei der Formulierung und Überprüfung von Forschungshypothesen.
Will man z.B. nicht direkt beobachtbares Merkmal "Bildungsstand einer Person" messen, wird eine Proxyvariable (näherungsweise verwendbare beobachtbare Variable) herangezogen. Z.B. höchster erreichter Bildungsabschluss
Oder "Patriotismus", hier kommen u. A. Personenbefragungen oder Verhaltensbeobachtungen in Betracht
Warum ist die Harmonisierung von statistischen Ämtern so wichtig?
Auch bei direkt beobachtbaren Merkmalen (manifeste Variablen, z.B. Bruttoeinkommen eine AN) kann es wichtig sein, genau zu spezifizieren, was gemessen werden soll.
Das Europäische Amt für Statistik (Eurostat) regelt z. B. welche Komponenten zu einer Variablen gehören und welche nicht. Das sichert die Vergleichbarkeit von Daten über Ländergrenzen hinaus und macht die amtl. Statistik von aktuellen Politiken unabhängiger. Somit keine Manipulation vor Wahlen. Überwachung von Daten, die für die Stabilität der Eurozone besonders relevant sind, vor allem Daten zur Entwicklung von Staatsscchulden und Haushaltsdefiziten.