Statitik Grundlegende Begriffe
Grundlegende Begriffe erläutern Hartwig Vester
Grundlegende Begriffe erläutern Hartwig Vester
Kartei Details
Karten | 148 |
---|---|
Sprache | Deutsch |
Kategorie | Soziales |
Stufe | Universität |
Erstellt / Aktualisiert | 08.09.2019 / 22.08.2021 |
Weblink |
https://card2brain.ch/box/20190908_statitik_grundlegende_begriffe
|
Einbinden |
<iframe src="https://card2brain.ch/box/20190908_statitik_grundlegende_begriffe/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was sind Skalen
Eine Skala ist eine strukturtreue Abbildung eines empirischen Relativs in ein numerisches Relativ
ohne Abschluss 1
Hauptschule 2
Mittlere Reife 3
Fachhochschulreife 4
Hochschulreife 5
Wahrheitstabelle
Anschließend kann aus der Wahrheitstabelle mittels logischer Minimierung – in der Regel durch das entsprechende QCA-Programm – überprüft werden, inwiefern notwendige und/oder hinreichende Bedingungen für das Outcome Y vorliegen.
Ein Problem bei der Reduktion der Wahrheitstabelle kann der Umgang mit begrenzter empirischer Vielfalt und den sogenannten logischen Rudimenten („logical remainders“)
Hauptachsenanalyse und Hauptkomponentenanalyse
Was ist der Unterschied zwischen einer Hauptachsenanalyse und einer Hauptkomponentenanalyse bei einer Faktorenanalyse?
Streng genommen gehört nur die Hauptachsenanalyse (engl. Principal Axis Factoring, PAF) zu der Faktorenanalyse. Bei dieser Methode werden nur die Kovarianzen aller Variablen – meist sind es die Items eines Fragebogens – analysiert, es ist also nicht unbedingt das Ziel, die vollständige Varianz der Variablen aufzuklären, sondern nur ihre gemeinsame Varianz. Das Verfahren wird in erster Linie dann eingesetzt, wenn es darum geht, latente Konstrukte oder Strukturen hinter den Variablen zu entdecken und diese „sichtbar“ zu machen. Der Anteil an Varianz einer Variablen, der nicht mit anderen Variablen kovariiert, wird also nicht berücksichtigt.
Bei der Hauptkomponentenanalyse (engl. Principal Component Analysis, PCA) wird hingegen versucht, die vollständige Varianz aller Variablen mit wenigen Komponenten zu erklären. Sie wird dann eingesetzt, wenn das Ziel darin besteht, die Datenstruktur zu reduzieren. Kurz zusammengefasst kann man formulieren, dass die HAA kovarianz- und die HKA varianzorientiert ist. Oft kommen jedoch beide Verfahren zu ähnlichen Ergebnissen.
Ökologischer Fehlschluss
Zusammenhänge auf der Aggregatebene (z.B. Arbeitslosen-quote und Wahlbeteiligung) können nicht einfach auf die Individualebene übertragen werden. Fachausdruck: ökologischer Fehlschluss. Bei Falter der Zusammenhang zwischen der Arbeitslosigkeit und dem Anteil der NSDAP Wähler, dieser Zusammenhang war auf der Mikroebene nicht erkennbar, diese whlten prioritr die KPD.
Äquivalenzproblem
Ein valides Messinstrument kann in Kontext A etwas völlig anderes messen als in Kontext B. Die Vergleichbarkeit der Indikatoren ist schwierig
Äquifinalität
Dies bedeutet, dass unterschiedliche Bedingungen oder auch Kombinationen mehrerer Bedingungen zum selben Outcome führen können.
Zusammenhang von S G W
Der Zusammenhang „S * G W“ sagt aus, dass die Kombination von starken sozialdemokratische Parteien UND starken Gewerkschaften hinreichend für ausgebaute Wohlfahrtsstaaten ist. Immer wenn beide Bedingungen gemeinsam auftreten, liegt auch das Outcome eines ausgebauten Wohlfahrtsstaates vor.
Zuordnungen
Wählen Sie jeweils aus, welcher Fachbegriff beschrieben wird.
Folgende Zuordnungen sind korrekt:
Summe der quadrierten Faktorladungen > Eigenwert
Anteil der Varianz eines Items, der durch die Faktoren erklärt werden kann > Kommunalität
Korrelation zwischen dem Faktor und einem Item > Faktorladung
Summe der quadrierten Korrelationen aller Items mit dem Faktor > Eigenwert
Differenz von 1 und spezifischer Varianz > Kommunalität
Zuordnung zu einer Analyseebene
uV aV Bezeichnung der Hypothese
Mikromerkmal Mikromerkmal Individualhypothese
( z.B. Bildung ) ( z.B, Einkommen )
Makromerkmal Makromerkmal Kollektivhypothese
Arbeitslosenquote Stimmenanteil
Makromerkmal
8 z.B. Klassengrösse) Leistung in einem Test Kontexthypothese
Wie unterscheiden sich Typologien
Typologien lassen sich anhand verschiedener Merkmale unterscheiden.
Zum einen gibt es den Gegensatz zwischen Idealtypen und extrahierten Typen:
[Idealtypen] entstehen durch [Deduktion] und abstrahieren von der Realität,
während [extrahierte Typen] die Wirklichkeit beschreiben sollen. Außerdem unterscheiden sich Typologien anhand des Grades der [Generalisierung]: dieser nimmt mit der Anzahl der Merkmalskombinationen [ab].
Weiterhin lassen sich klassifikatorische von [kontinuierlichen] Typologien unterscheiden: der empirisch beobachtete Gegenstand kann entweder [genau] einem Typ (klassifikatorisch) oder [mehr oder weniger] einem Typ ([kontinuierlich]) zugeordnet werden.
Werte von Regressionskoeffizienten
Der Wertebereich der RegressionskoeffizientenB (Logit-Koeffizienten) ist von -unendlich bis +unendlich.
Der Wertebereich der Exp(B)-Koeffizienten (Odds-Ratio) ist von 0 bis +unendlich.
Welche Organisation archiviert quantitative Datensätze?Musterantwort: GESIS
) Musterantwort: GESIS
Welche drei Elemente eines Konzepts lassen sich unterscheiden? Woraus besteht das Konzept
Term, Intension und Extension.
Was sind deskriptive Forschungsfragen?
Deskriptive Forschungsfragen dienen der Beschreibung. Sie sind nach King et al. (1994) zwar häufig unentbehrlich für wissenschaftliche Forschung, aber die Sammlung von Fakten ist nicht das Ziel sozialwissenschaft-licher Forschung.
Was ist Overreporting?
Mit Overreporting wird das Phänomen bezeichnet, dass die durch Umfragen ermittelte Wahlbeteiligung regelmäßig höher ausfällt als die offizielle (amtliche) Wahlbeteiligung. Ursachen: Soziale Erwünschtheit, Selektivität der Stichprobe.
Was ist eine Zufallsstichprobe?
Jedes Element der Grundgesamt hat eine bestimmte (gleiche) und von 0 verschiedene Chance in die Stichprobe zu gelangen
Was ist der extrahierte Typ
Er entsteht induktiv, durch Beobachtung und Beschreibung der Wirklichkeit: Aspekte eines Phänomens, die verschiedene Fälle gemeinsam haben, werden zusammengefasst.
Was bedeutem aV und uV und Konstante
I. Variable mit mindestens 2 Ausprägungen
Abhängige Variable ( aV ) = Y Soll erklärt werden
Unabhängige Variable ( uV ) = X beeinflusst die aV
Manifeste Variable
Latente Variable
Konstante mit nur einer Ausprägung
Warum muss bei der Lektüre empirischer Studien immer die Operationalisierung in den Blick genommen werden?
: Wird ein Konzept unterschiedlich operationalisiert, dann sind auch unterschiedliche Befunde möglich. Deshalb ist zu prüfen, ob unterschied-liche Befunde nicht einfach auf unterschiedliche Operationalisierungen zurück-zuführen sind.
Warum ist die Festlegung eines Forschungsthemas in der Regel nicht ausreichend für die Entwicklung und Durchführung eines Forschungs-projekts?
Ein Thema eines Forschungsprojekts grenzt zwar den Inhalt des Projekts lose ab, es schränkt aber das Projekt noch nicht hinreichend ein.
Wann besitzt ein Forschungsprojekt theoretische Relevanz?
Theoretische Relevanz besitzt ein Forschungsprojekt, wenn es den Grundstock wissenschaftlicher Erkenntnisse über soziale Sachverhalte er-weitert.
Verfahren gemeinsamer Skalen
gemeinsamen Skala zusammengefasst werden können. Hierfür existieren verschiedene Verfahren und Varianten, von denen im Folgenden die Verwendung von (1) Summenwerten, (2) Summenwerten basierend auf „Marker-Variablen“, (3) gewichteten Summenwerten sowie (4) sogenannten Faktorenwerten diskutiert werden sollen (
Wahr oder Falsch
: Die Vereinfachung und Ordnung von Fällen im Rahmen der Typenbildung ist häufig ein komplexes Vorhaben. → wahr,
Die Frage, ob mit Idealtypen oder extrahierte Typen gearbeitet wird, ist am Ende des Typenbildungsprozesses relevant. → falsch,
Extrahierte Typen stellen empirisch beobachtbare Fakten dar. → falsch,
Für die Typenbildung ist es häufig hilfreich, zunächst eine Matrix zu konstruieren, die alle logisch möglichen Kombinationen der Merkmalsausprägungen unterscheidet. → wahr,
Sind viele Zellen der Matrix mit vielen Fällen gefüllt, ist es häufig ratsam, weitere Attribute oder Ausprägungen hinzuzufügen. → wahr,
Sind viele Zellen der Matrix leer, ist es häufig ratsam, weitere Attribute oder Ausprägungen hinzuzufügen. → falsch,
Erscheinen in einer Matrix viele Merkmalskombinationen unsinnig, kann man von Klassifikation zu Kontinua übergehen. → wahr
Validitätät
Validität ist die Gültigkeit einer Messung . : Inhaltsvalidität = wie gut reprsentiert die Variable das theoretische Konstrukt
Konstruktvalidität = sind die Messinstrumente geeignet für die Entwicklung einer Theorie
Kriteriumsvaliditt = Vergleich der eigenen Messinstrumente mit anderen etablierten Messinstrumenten
Typologiern bei x zentrierten Designs
In Typologien können Fälle in den relevanten Aspekten eines kausalen Zusammenhangs vereinfacht und geordnet werden, um kausale Homogenität zu erreichen
Durch Typologien werden mehrere Variablen in Typen zusammengefasst.
Durch diese Reduktion der Anzahl der Variablen kann der Unbestimmtheit (also Anzahl der Fälle < Anzahl der Variablen) begegnet werden
Typologie Lehnert (2007, S. 92) definiert eine Typologie als "ein theoretisch oder empirisch gewonnenes Konzept, mit dessen Hilfe sich komplexe Phänomene anhand einer begrenzten Anzahl von Attributen ordnen lassen".
Lehnert (2007, S. 92) definiert eine Typologie als "ein theoretisch oder empirisch gewonnenes Konzept, mit dessen Hilfe sich komplexe Phänomene anhand einer begrenzten Anzahl von Attributen ordnen lassen".
Trennschärfekoeffizient
Ein zweites Maß zur Beurteilung der Güte einer Skala stellt der sogenannte Trennschärfekoeffizient dar. Dieser gibt die (korrigierte) Korrelation eines Items oder einer Variable mit der Gesamtskala an
SUIN Bedingungen
„hinreichende, aber nicht notwendige Teile einer nicht hinreichenden, aber notwendigen Bedingung.
das Vorliegen einer bestimmten sozialpolitischen Leistung die Existenz starker Gewerkschaften im jeweiligen Land oder aber starke sozialdemokratische Parteien notwendig sind, jedoch nicht hinreichend. In dem Beispiel sind entsprechend beide Bedingungen „starke Gewerkschaften“ sowie „starke sozialdemokratische Parteien“ SUIN-Bedingungen
Suin
SUIN-Bedingungen sind dagegen definiert als „Sufficient, but Unnecessary part of a factor that is Insufficient, but Necessary for the result“ (Schneider und Wagemann 2012, S. 79), sie sind also hinreichende, aber nicht notwendige Teile einer nicht hinreichenden, aber notwendigen Bedingung.
Sozialkapital → Terminus,
Wähler*innen in Demokratien → Extension,
Eine Kombination aus Netzwerken, sozialem Vertrauen und Normen wie Fairness und Reziprozität → Intension,
Parteiidentifikation → Terminus,Emotionale Verbundenheit mit einer Partei → Intension Menschen in einer Gesellschaft → Extension
siehe oben
Skalenniveau ist wichtig
Skalenniveau Beispiel Lagemaße
Nominalskala Geschlecht Modus Erlaubt nur die Unterscheidung
Ordinalskala Schulabschluss Modus, Median Rangordnung " Höher " "Grosser "
Intervallskala Temperatur in C Modus, Median, Mittelwert Abstände sind gleich , Rangfolge
Rationalskala Einkommen Modus, Median, Mittelwert
Sie wollen den kausalen Effekt einer uV auf eine aV untersuchen.
Musterantwort: Experiment
Sie suchen verlässliche Informationen zur Arbeitslosenquote und zur Inflation in den 28 EU-Staaten. Bei welcher Institution finden Sie valide Informationen?
Eurostat
Scree Test
Scree-Tests. Bei diesem wird die gesamte Verlaufslinie der abgetragenen Eigenwerte grafisch inspiziert.
Rosenberg Skala
Rosenberg-Skala (Rosenberg 1956, 1957; Zmerli et al. 2007, S. 39). Im Detail basiert diese Skala auf drei verschiedenen Items zu Vertrauenswürdigkeit, Fairness und Hilfsbereitschaft
Reliabilität = Zuverlässigkeit einer Messung Die ParalleltestMethode zeitgleiche Messung mit weiteren Indikatoren
Die Test- Retest Methode zeitversetzte Messung desselben Objekts
Die Split-Half Methode Aufteilung in zwei zufällige Gruppen für Subskalen mit jeweils der Hälfte der ursprünglichen Fragen
Die ParalleltestMethode zeitgleiche Messung mit weiteren Indikatoren
Die Test- Retest Methode zeitversetzte Messung desselben Objekts
Die Split-Half Methode Aufteilung in zwei zufällige Gruppen für Subskalen mit jeweils der Hälfte der ursprünglichen Fragen
Regressionskoeffizienten
- Nicht standardisierte Koeffizienten (Rohkoeffizienten): Diese geben den direkten Einfluss einer unabhängigen Variablen auf die abhängige Variable an. Sie sind in der Einheit der unabhängigen Variable ausgedrückt. Das bedeutet, wenn ein Koeffizient zum Beispiel 3 ist, bedeutet dies, dass für jede Einheit, die die unabhängige Variable zunimmt, die abhängige Variable um 3 Einheiten (in ihrer eigenen Maßeinheit) zunimmt. Nicht standardisierte Koeffizienten sind nützlich, um den absoluten Effekt einer Variable in ihrer natürlichen Skala zu verstehen.
- Standardisierte Koeffizienten (Beta-Koeffizienten): Diese Koeffizienten werden errechnet, indem die Variablen vor der Analyse standardisiert werden, d.h. sie werden in eine Form umgewandelt, bei der sie einen Mittelwert von 0 und eine Standardabweichung von 1 haben. Standardisierte Koeffizienten zeigen die Stärke des Einflusses einer unabhängigen Variablen auf die abhängige Variable, unabhängig von den Maßeinheiten der Variablen. Sie sind nützlich, um die relative Wichtigkeit verschiedener Variablen in einem Modell zu vergleichen, insbesondere wenn diese Variablen unterschiedliche Maßeinheiten haben.
Zusammenfassend: Nicht standardisierte Koeffizienten sind hilfreich, um den spezifischen Einfluss einer Variablen in ihren ursprünglichen Einheiten zu verstehen, während standardisierte Koeffizienten verwendet werden, um die relative Bedeutung von Prädiktoren in einem Modell zu vergleichen.
Quotenstichproben bei ESS
ESS verwendet
geschichtete und mehrstufige Zufallsstichproben
Quotenstichproben sind nicht zulässig
Regressionsformen
Die logistische,
nominale,
ordinale
und lineare Regressionen
sind geeignete Analyseverfahren für Querschnittsdaten (einmalige Datenerhebung). Für Paneldaten wie beim SOEP stehen fortgeschrittene Analyseverfahren zur Verfügung
QCA Operatoren
– + steht für das logische ODER
– * steht für das logische UND
– steht für eine hinreichende Bedingung – steht für eine notwendige Bedingung
– ~ steht für das Nicht-Vorhandensein einer Bedingung bzw. die Negation einer Menge