Quantitative Datenanalyse

Quantitative Datenanalyse

Quantitative Datenanalyse


Kartei Details

Karten 113
Sprache Deutsch
Kategorie Mathematik
Stufe Universität
Erstellt / Aktualisiert 17.02.2020 / 17.02.2020
Weblink
https://card2brain.ch/box/20200217_quantitative_datenanalyse
Einbinden
<iframe src="https://card2brain.ch/box/20200217_quantitative_datenanalyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was ist der erste Schritt in d er Faktorenanalyse ?

Wie stark korrelieren die einzelnen Variablen untereinander

Wie kann man Überprüfen ob die Korrelationsmatrix geeignet ist ?

Bartlett-test und KMO Kriterium

Wie wählt man kmo und bartlett test aus ? (2 häckchen )

Was sind die Kennwerte für das KMO Kriterium ?

Muss grösser  gleich 0.5 sein um geeignet zu sein für eine Faktorenanalyse

Was sagt die 0 Hypothese beim Bartlett test aus ?

Alle Variablen sind unkorreliert 

Wie werden Faktoren extrahiert ?

Die Faktorladung representiert beide Variablen. Je besser die Variablen zusammenhängen desto grösser wäre die Faktorladung

Was  beschreibt die Kommunalität ?

Den Anteil der Varianz einer Variable welche durch alle Faktoren erklärt wird 

 

Die erklärte Varianz sollte über 0.5 sein

Was drückt der Eigenwert aus ?

Wieviel Varianz erklärt ein Faktor im Hinblick auf alle Variablen

Was beschreiben die Eigenwerte in der folgenden Matrix. was ist zu wäheln ?

Wie viele Varianz der Variablen die Faktoren jeweil erklären können. Mehr als 1s ist anzustreben

Wie wählen soviele Faktoren wie wir Eigenwerte grösser als 1 haben

Was ist die alternative zur  bestimmung der anzahl Faktore zur Eigenwert Methode ?

Der Scree Test; Man schaut an wo ein Knick entsteht. (die stärkste Änderung)

Man wählt die Anzahl Faktoren links vom knick

Was macht die rotierte Faktorlösung ?

Die rotierte Faktorlösung optimiert die Faktoren solange bis sie möglichst nahe an den einzelnen Variablen dranstehen. Möglichst hohe Faktorladungen werden so ausgewiesen

Was zeigt folgende Tabelle ?

Zeigt an wie stark die Variablen mit den Faktoren zusammenhängen.  Als nächster Schritt muss überlegt werden wie man die Faktoren bennennen soll

Wie kann man die Faktoren als Variable abspeichern ?

Was sagt die Faktorstufe aus ?

Sie zeigt die Korrelation einerVariable zu einer gebildeten Faktorstufe

 

 

 

Was ist der Ablauf in der Clusteranalyse ? 

1. Ähnlichkeiten bestimmen zwischen den unterschiedlichen Fällen. Bsp Antworten zusammenfassen von ähnlichen Probanden

2,  Entscheiden wie man diese Fälle zusammenfassen will (Welcher Fusionierungsalgorithmus

3, Bestimmung der Clusterzahl

Was für Variablen arten nimmt man in der Clusteranalyse ?

Metrisch oder nicht metrisch--> Beider funktioniert nicht zusammen

Ordne die Clusteranalyse ein

«Die Clusteranalyse strebt eine Bündelung von Objekten an. Das Ziel ist dabei, die Objekte so zu Gruppen (Clustern) zusammenzufassen, dass die Objekte in einer Gruppe möglichst ähnlich und die Gruppen untereinander möglichst unähnlich sind. Beispiele sind die Bildung von Persönlichkeitstypen auf Basis der psychografischen Merkmale von Personen oder die Bildung von Marktsegmenten auf Basis nachfragerelevanter Merkmale von Käufern.

In was für einer Matrix können Proximitätsmasse eingeteilt werden ?

Skalenniveau (metrisch,Binär)

Distanzmasse, Ähnlichkeitsmasse

 Was zeigt das Ähnlichkeitsmass bei der binären Clusteranalyse ?

Wie oft gibt es eine gemeinsame 1-->Ja  oder gemeinsame 0--> nein

Was gibt es für Strategien die überinstimmungen zu zählen  bei binären Variablen

Wie führt man im SPSS hierarchische Cluster durch ?

was macht man um die Ähnlichkeitsmatrix zu sehen ?

Wo schaltet man um auf Binärskalierte Variablen ?

Bei Methoden

Wo kann man die Ähnlichkeitmasse auswählen ?

Wie sieht eine metrische Matrix aus bei einer Clusteranalyse

Wie berrechnet man bei metrischen Variablen die euklidische metrische Distanz ?

Wie macht man für metrische distanzanalysien eine euklidische metrische Distanz ?

1. Auswählen ähnlichkeit

2. Bei  Methoden auswählen

Was macht das Wardverfaheren im agglomerativen Hierarchischen Clustern ?

«Das Ward-Verfahren unterscheidet sich […] insbesondere dadurch, dass nicht diejenigen Gruppen zusammengefasst werden, die die geringste Distanz aufweisen, sondern es werden die Objekte (Gruppen) vereinigt, die ein vorgegebenes Heterogenitätsmass am wenigsten vergrössern. Das Ziel des Ward-Verfahrens besteht folglich darin, jeweils diejenigen Objekte (Gruppen) zu vereinigen, die die Streuung (Varianz) in einer Gruppe möglichst wenig erhöhen. Dadurch werden möglichst homogene Cluster gebildet. Als Heterogenitätsmass wird das Varianzkriterium verwendet, das auch als Fehlerquadratsumme bezeichnet wird.»

Wo liest man in folgender Tabelle die Fehlerquadratsumme ab ?

Bei den Koeffizienten

Wie bestimmt man die perfekte Clusteranzahl ?

Dendogramm (Wird erzeugt unter "Diagramme") Die X-Achse zeigt die Heterogenität bzw wie ist die Varianz in den Clustern

Elbow Kriterium

Für was für Cluster würde man sich hier entscheiden und wieso ?

Für 5,4,3 und 4,5 da beide in sich homogene cluster sind 

Was  zeigt das Elbowkriterium ?

Was ist die Fehlerquadratsumme ?

Die Fehlerquadratsumme zeigt den Abstand der Beobachtungspunkte von Mittelwert. Jedes Cluster hat einen Mittelwert, dann wird berrechnet wie stark die einzelnen Werte davon abweichen

Dort wo der knick ist , dort ist die Anzahl der Cluster

Was macht man nachdem man die Anzahl der Cluster herausgefunden hat ?

Man geht auf speichern, einzelne Lösung und gibt die anzahl Cluster ein