Statitik Grundlegende Begriffe

Grundlegende Begriffe erläutern Hartwig Vester

Grundlegende Begriffe erläutern Hartwig Vester


Kartei Details

Karten 148
Sprache Deutsch
Kategorie Soziales
Stufe Universität
Erstellt / Aktualisiert 08.09.2019 / 22.08.2021
Weblink
https://card2brain.ch/box/20190908_statitik_grundlegende_begriffe
Einbinden
<iframe src="https://card2brain.ch/box/20190908_statitik_grundlegende_begriffe/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was sind Skalen

Eine Skala ist eine strukturtreue Abbildung eines empirischen Relativs in ein numerisches Relativ

ohne Abschluss                                         1

Hauptschule                                               2

Mittlere Reife                                              3

Fachhochschulreife                                  4

Hochschulreife                                          5                   

Wahrheitstabelle

Anschließend kann aus der Wahrheitstabelle mittels logischer Minimierung – in der Regel durch das entsprechende QCA-Programm – überprüft werden, inwiefern notwendige und/oder hinreichende Bedingungen für das Outcome Y vorliegen.

Ein Problem bei der Reduktion der Wahrheitstabelle kann der Umgang mit begrenzter empirischer Vielfalt und den sogenannten logischen Rudimenten („logical remainders“)

Hauptachsenanalyse und Hauptkomponentenanalyse

Was ist der Unterschied zwischen einer Hauptachsenanalyse und einer Hauptkomponentenanalyse bei einer Faktorenanalyse?

Streng genommen gehört nur die Hauptachsenanalyse (engl. Principal Axis Factoring, PAF) zu der Faktorenanalyse. Bei dieser Methode werden nur die Kovarianzen aller Variablen – meist sind es die Items eines Fragebogens – analysiert, es ist also nicht unbedingt das Ziel, die vollständige Varianz der Variablen aufzuklären, sondern nur ihre gemeinsame Varianz. Das Verfahren wird in erster Linie dann eingesetzt, wenn es darum geht, latente Konstrukte oder Strukturen hinter den Variablen zu entdecken und diese „sichtbar“ zu machen. Der Anteil an Varianz einer Variablen, der nicht mit anderen Variablen kovariiert, wird also nicht berücksichtigt.

Bei der  Hauptkomponentenanalyse (engl. Principal Component Analysis, PCA) wird hingegen versucht, die vollständige Varianz aller Variablen mit wenigen Komponenten zu erklären. Sie wird dann eingesetzt, wenn das Ziel darin besteht, die Datenstruktur zu reduzieren. Kurz zusammengefasst kann man formulieren, dass die HAA kovarianz- und die HKA varianzorientiert ist. Oft kommen jedoch beide Verfahren zu ähnlichen Ergebnissen.

Ökologischer Fehlschluss

Zusammenhänge auf der Aggregatebene (z.B. Arbeitslosen-quote und Wahlbeteiligung) können nicht einfach auf die Individualebene übertragen werden. Fachausdruck: ökologischer Fehlschluss. Bei Falter der Zusammenhang zwischen der Arbeitslosigkeit und dem Anteil der NSDAP Wähler, dieser Zusammenhang war auf der Mikroebene nicht erkennbar, diese whlten prioritr die KPD.

Äquivalenzproblem

Ein valides Messinstrument kann in Kontext A etwas völlig anderes messen als in Kontext B. Die Vergleichbarkeit der Indikatoren ist schwierig

Äquifinalität

 Dies bedeutet, dass unterschiedliche Bedingungen oder auch Kombinationen mehrerer Bedingungen zum selben Outcome führen können.

Zusammenhang von S G W

Der Zusammenhang „S * G W“ sagt aus, dass die Kombination von starken sozialdemokratische Parteien UND starken Gewerkschaften hinreichend für ausgebaute Wohlfahrtsstaaten ist. Immer wenn beide Bedingungen gemeinsam auftreten, liegt auch das Outcome eines ausgebauten Wohlfahrtsstaates vor.

Zuordnungen

Wählen Sie jeweils aus, welcher Fachbegriff beschrieben wird.

Folgende Zuordnungen sind korrekt:

Summe der quadrierten Faktorladungen > Eigenwert

Anteil der Varianz eines Items, der durch die Faktoren erklärt werden kann > Kommunalität

Korrelation zwischen dem Faktor und einem Item > Faktorladung

Summe der quadrierten Korrelationen aller Items mit dem Faktor > Eigenwert

Differenz von 1 und spezifischer Varianz > Kommunalität

Zuordnung zu einer Analyseebene

uV                                                   aV                                         Bezeichnung der Hypothese

 

Mikromerkmal                 Mikromerkmal                  Individualhypothese

( z.B. Bildung  )                       ( z.B, Einkommen )

Makromerkmal                  Makromerkmal                Kollektivhypothese

Arbeitslosenquote                  Stimmenanteil

Makromerkmal

8 z.B. Klassengrösse)           Leistung in einem Test        Kontexthypothese

Wie unterscheiden sich Typologien

Typologien lassen sich anhand verschiedener Merkmale unterscheiden.

Zum einen gibt es den Gegensatz zwischen Idealtypen und extrahierten Typen:

[Idealtypen] entstehen durch [Deduktion] und abstrahieren von der Realität,

während [extrahierte Typen] die Wirklichkeit beschreiben sollen. Außerdem unterscheiden sich Typologien anhand des Grades der [Generalisierung]: dieser nimmt mit der Anzahl der Merkmalskombinationen [ab].

Weiterhin lassen sich klassifikatorische von [kontinuierlichen] Typologien unterscheiden: der empirisch beobachtete Gegenstand kann entweder [genau] einem Typ (klassifikatorisch) oder [mehr oder weniger] einem Typ ([kontinuierlich]) zugeordnet werden.

Werte von Regressionskoeffizienten

Der Wertebereich der RegressionskoeffizientenB (Logit-Koeffizienten) ist von -unendlich bis +unendlich.

Der Wertebereich der Exp(B)-Koeffizienten (Odds-Ratio) ist von 0 bis +unendlich.

Welche Organisation archiviert quantitative Datensätze?Musterantwort: GESIS

) Musterantwort: GESIS

Welche drei Elemente eines Konzepts lassen sich unterscheiden?  Woraus besteht das Konzept

 Term, Intension und Extension.

Was sind deskriptive Forschungsfragen?

 Deskriptive Forschungsfragen dienen der Beschreibung. Sie sind nach King et al. (1994) zwar häufig unentbehrlich für wissenschaftliche Forschung, aber die Sammlung von Fakten ist nicht das Ziel sozialwissenschaft-licher Forschung.

Was ist Overreporting?

Mit Overreporting wird das Phänomen bezeichnet, dass die durch Umfragen ermittelte Wahlbeteiligung regelmäßig höher ausfällt als die offizielle (amtliche) Wahlbeteiligung.                                   Ursachen: Soziale Erwünschtheit, Selektivität der Stichprobe.

Was ist eine Zufallsstichprobe?

Jedes Element der Grundgesamt hat eine bestimmte (gleiche) und von 0 verschiedene Chance in die Stichprobe zu gelangen

Was ist der extrahierte Typ

 Er entsteht induktiv, durch Beobachtung und Beschreibung der Wirklichkeit: Aspekte eines Phänomens, die verschiedene Fälle gemeinsam haben, werden zusammengefasst.

Was bedeutem aV und uV und Konstante

I. Variable mit mindestens 2 Ausprägungen

Abhängige Variable ( aV )    =  Y                             Soll erklärt werden

Unabhängige Variable ( uV ) = X                             beeinflusst die aV

Manifeste Variable

Latente Variable

 

Konstante  mit nur einer Ausprägung

Warum muss bei der Lektüre empirischer Studien immer die Operationalisierung in den Blick genommen werden?

: Wird ein Konzept unterschiedlich operationalisiert, dann sind auch unterschiedliche Befunde möglich. Deshalb ist zu prüfen, ob unterschied-liche Befunde nicht einfach auf unterschiedliche Operationalisierungen zurück-zuführen sind.

Warum ist die Festlegung eines Forschungsthemas in der Regel nicht ausreichend für die Entwicklung und Durchführung eines Forschungs-projekts?

 

 Ein Thema eines Forschungsprojekts grenzt zwar den Inhalt des Projekts lose ab, es schränkt aber das Projekt noch nicht hinreichend ein.

Wann besitzt ein Forschungsprojekt theoretische Relevanz?

Theoretische Relevanz besitzt ein Forschungsprojekt, wenn es den Grundstock wissenschaftlicher Erkenntnisse über soziale Sachverhalte er-weitert.

Verfahren gemeinsamer Skalen

gemeinsamen Skala zusammengefasst werden können. Hierfür existieren verschiedene Verfahren und Varianten, von denen im Folgenden die Verwendung von (1) Summenwerten, (2) Summenwerten basierend auf „Marker-Variablen“, (3) gewichteten Summenwerten sowie (4) sogenannten Faktorenwerten diskutiert werden sollen (

Wahr  oder Falsch

: Die Vereinfachung und Ordnung von Fällen im Rahmen der Typenbildung ist häufig ein komplexes Vorhaben. → wahr,

Die Frage, ob mit Idealtypen oder extrahierte Typen gearbeitet wird, ist am Ende des Typenbildungsprozesses relevant. → falsch,

Extrahierte Typen stellen empirisch beobachtbare Fakten dar. → falsch,

Für die Typenbildung ist es häufig hilfreich, zunächst eine Matrix zu konstruieren, die alle logisch möglichen Kombinationen der Merkmalsausprägungen unterscheidet. → wahr,

Sind viele Zellen der Matrix mit vielen Fällen gefüllt, ist es häufig ratsam, weitere Attribute oder Ausprägungen hinzuzufügen. → wahr,

Sind viele Zellen der Matrix leer, ist es häufig ratsam, weitere Attribute oder Ausprägungen hinzuzufügen. → falsch,

Erscheinen in einer Matrix viele Merkmalskombinationen unsinnig, kann man von Klassifikation zu Kontinua übergehen. → wahr

Validitätät

Validität ist die Gültigkeit einer Messung . : Inhaltsvalidität = wie gut reprsentiert die Variable das theoretische Konstrukt

                                                                Konstruktvalidität = sind die Messinstrumente geeignet für die Entwicklung einer Theorie

                                                                Kriteriumsvaliditt  = Vergleich der eigenen Messinstrumente mit anderen                         etablierten                                                                         Messinstrumenten

 

Typologiern bei x zentrierten Designs

In Typologien können Fälle in den relevanten Aspekten eines kausalen Zusammenhangs vereinfacht und geordnet werden, um kausale Homogenität zu erreichen

Durch Typologien werden mehrere Variablen in Typen zusammengefasst.

Durch diese Reduktion der Anzahl der Variablen kann der Unbestimmtheit (also Anzahl der Fälle < Anzahl der Variablen) begegnet werden

Typologie   Lehnert (2007, S. 92) definiert eine Typologie als "ein theoretisch oder empirisch gewonnenes Konzept, mit dessen Hilfe sich komplexe Phänomene anhand einer begrenzten Anzahl von Attributen ordnen lassen".

Lehnert (2007, S. 92) definiert eine Typologie als "ein theoretisch oder empirisch gewonnenes Konzept, mit dessen Hilfe sich komplexe Phänomene anhand einer begrenzten Anzahl von Attributen ordnen lassen".

Trennschärfekoeffizient

Ein zweites Maß zur Beurteilung der Güte einer Skala stellt der sogenannte Trennschärfekoeffizient dar. Dieser gibt die (korrigierte) Korrelation eines Items oder einer Variable mit der Gesamtskala an

SUIN Bedingungen

„hinreichende, aber nicht notwendige Teile einer nicht hinreichenden, aber notwendigen Bedingung.

 

das Vorliegen einer bestimmten sozialpolitischen Leistung die Existenz starker Gewerkschaften im jeweiligen Land  oder aber starke sozialdemokratische Parteien notwendig sind, jedoch nicht hinreichend. In dem Beispiel sind entsprechend beide Bedingungen „starke Gewerkschaften“ sowie „starke sozialdemokratische Parteien“ SUIN-Bedingungen

Suin

SUIN-Bedingungen sind dagegen definiert als „Sufficient, but Unnecessary part of a factor that is Insufficient, but Necessary for the result“ (Schneider und Wagemann 2012, S. 79), sie sind also hinreichende, aber nicht notwendige Teile einer nicht hinreichenden, aber notwendigen Bedingung.

Sozialkapital → Terminus,

Wähler*innen in Demokratien → Extension,

Eine Kombination aus Netzwerken, sozialem Vertrauen und Normen wie Fairness und Reziprozität → Intension,

Parteiidentifikation → Terminus,Emotionale Verbundenheit mit einer Partei → Intension Menschen in einer Gesellschaft → Extension

siehe oben

Skalenniveau  ist wichtig

Skalenniveau          Beispiel                   Lagemaße

Nominalskala         Geschlecht             Modus                                    Erlaubt nur die Unterscheidung

Ordinalskala          Schulabschluss      Modus, Median                      Rangordnung " Höher " "Grosser "

Intervallskala         Temperatur in C      Modus, Median, Mittelwert    Abstände sind gleich , Rangfolge

Rationalskala        Einkommen          Modus, Median, Mittelwert

Sie wollen den kausalen Effekt einer uV auf eine aV untersuchen.

 Musterantwort: Experiment

Sie suchen verlässliche Informationen zur Arbeitslosenquote und zur Inflation in den 28 EU-Staaten. Bei welcher Institution finden Sie valide Informationen?

Eurostat

Scree Test

Scree-Tests. Bei diesem wird die gesamte Verlaufslinie der abgetragenen Eigenwerte grafisch inspiziert.

Rosenberg Skala

Rosenberg-Skala (Rosenberg 1956, 1957; Zmerli et al. 2007, S. 39). Im Detail basiert diese Skala auf drei verschiedenen Items zu Vertrauenswürdigkeit, Fairness und Hilfsbereitschaft

Reliabilität = Zuverlässigkeit einer Messung                     Die ParalleltestMethode  zeitgleiche Messung mit weiteren Indikatoren

                                                                                    Die Test- Retest Methode  zeitversetzte Messung desselben Objekts

                                                                                    Die Split-Half Methode  Aufteilung in zwei zufällige Gruppen für Subskalen mit jeweils der Hälfte der ursprünglichen Fragen

   Die ParalleltestMethode  zeitgleiche Messung mit weiteren Indikatoren

                                                                                    Die Test- Retest Methode  zeitversetzte Messung desselben Objekts

                                                                                    Die Split-Half Methode  Aufteilung in zwei zufällige Gruppen für Subskalen mit jeweils der Hälfte der ursprünglichen Fragen

Regressionskoeffizienten

  1. Nicht standardisierte Koeffizienten (Rohkoeffizienten): Diese geben den direkten Einfluss einer unabhängigen Variablen auf die abhängige Variable an. Sie sind in der Einheit der unabhängigen Variable ausgedrückt. Das bedeutet, wenn ein Koeffizient zum Beispiel 3 ist, bedeutet dies, dass für jede Einheit, die die unabhängige Variable zunimmt, die abhängige Variable um 3 Einheiten (in ihrer eigenen Maßeinheit) zunimmt. Nicht standardisierte Koeffizienten sind nützlich, um den absoluten Effekt einer Variable in ihrer natürlichen Skala zu verstehen.
  2. Standardisierte Koeffizienten (Beta-Koeffizienten): Diese Koeffizienten werden errechnet, indem die Variablen vor der Analyse standardisiert werden, d.h. sie werden in eine Form umgewandelt, bei der sie einen Mittelwert von 0 und eine Standardabweichung von 1 haben. Standardisierte Koeffizienten zeigen die Stärke des Einflusses einer unabhängigen Variablen auf die abhängige Variable, unabhängig von den Maßeinheiten der Variablen. Sie sind nützlich, um die relative Wichtigkeit verschiedener Variablen in einem Modell zu vergleichen, insbesondere wenn diese Variablen unterschiedliche Maßeinheiten haben.

Zusammenfassend: Nicht standardisierte Koeffizienten sind hilfreich, um den spezifischen Einfluss einer Variablen in ihren ursprünglichen Einheiten zu verstehen, während standardisierte Koeffizienten verwendet werden, um die relative Bedeutung von Prädiktoren in einem Modell zu vergleichen.

Quotenstichproben bei ESS

ESS verwendet

geschichtete und mehrstufige Zufallsstichproben

Quotenstichproben sind nicht zulässig

Regressionsformen

Die logistische,

nominale,

ordinale

und lineare Regressionen

sind geeignete Analyseverfahren für Querschnittsdaten (einmalige Datenerhebung). Für Paneldaten wie beim SOEP stehen fortgeschrittene Analyseverfahren zur Verfügung

QCA Operatoren

– + steht für das logische ODER

– * steht für das logische UND

– steht für eine hinreichende Bedingung – steht für eine notwendige Bedingung

– ~ steht für das Nicht-Vorhandensein einer Bedingung bzw. die Negation einer Menge