Quantitative Datenanalyse

Quantitative Datenanalyse

Quantitative Datenanalyse


Kartei Details

Karten 113
Sprache Deutsch
Kategorie Mathematik
Stufe Universität
Erstellt / Aktualisiert 17.02.2020 / 17.02.2020
Weblink
https://card2brain.ch/box/20200217_quantitative_datenanalyse
Einbinden
<iframe src="https://card2brain.ch/box/20200217_quantitative_datenanalyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was bedeutet Univariat und wie ist dies Einzuordnen ?

In der Mathematik bezeichnet univariat eine Gleichung, einen Ausdruck oder eine Funktion, die jeweils nur von einer Variablen abhängen. Im Gegensatz dazu wird der Begriff multivariat verwendet, wenn ein Ausdruck von mehr als einer Variablen abhängt.

Wie können bei Univariaten Gleichungen die Lage ermittelt werden ?

  • Modus 
  • Median
  • Arrithmetisches Mittel

Wie wird der Modus ermittelt ?

Der Modus, auch Modalwert genannt, ist ein Lageparameter in der deskriptiven Statistik. Er ist definiert als der häufigste Wert, der in der Stichprobe vorkommt.

Was ist der Median ?

In der Statistik ist der Median – auch Zentralwert genannt – ein Mittelwert und Lageparameter. Der Median der Messwerte einer Urliste ist derjenige Messwert, der genau „in der Mitte“ steht, wenn man die Messwerte der Größe nach sortiert.

 

--> 50% der Fläche sind links , 50% der Fläche sind rechts auf X-Achse

Was ist das Arrithmetische Mittel ?

Summe/n

Was für Streungsparameter gibt es bei Univariaten Statistiken ?

Spannweite 

Varianz

Standardabweichungen

Was ist die Variant und wie wird diese Berrechnet ?

Beschreibt die Streuung der einzelnen Werte um den Mittelwert

-Mittlere Quadratische Abweichung vom Mittelwert = Varianz= Wie weit ist eine Zahlenreihe im Durchschnitt vom Mittelwert entfernt= streuung um den Mittelwert

-Standardabweichung= Wurzel aus der Varianz--> bsp die preise weichen um durchschnitt um 23Euro vom Mittel ab

 

Was sind Bivariate Analysen und wie unterscheiden sich diese zu Univariaten ?

Bei univariaten Verfahren werden die Merkmalsausprägungen von einer Variablen betrachtet , wohingegen bei bivariaten Verfahren die Beziehungen zwischen zwei Variablen untersucht werden.

Dabei unterscheiden wir zwischen deskriptiven und induktiven Verfahren.[…]

Deskriptive (oder beschreibende) Verfahren befassen sich mit der Aufbereitung und Auswertung der untersuchten Stichprobe.

Induktive Verfahren nehmen Verallgemeinerungen bzw. Schlüsse von der Stichprobe auf die zugrundeliegende Grundgesamtheit vor

Was für deskriptive/Induktive Analysevarianten gibt es ?

Deskriptiv Bivariat--> Korrelation und Regression

Induktiv Bivariat-->T-test, chi^2, 

Deskriptiv Univariat--> Häufigkeit, Lage und Streuparameter

Induktiv Univariat-->T-test,

Was sagt der Korrelationskoeffizient aus ?

Wie bereits erwähnt, misst der Korrelationskoeffizient die Stärke eines linearen Zusammenhangs zwischen zwei Variablen

Was ist der Chi^2 Test und wozu wird dieser gebraucht ?

Der Pearson Chi-Quadrat-Test testet, ob zwischen zwei kategorialen Variablen ein Zusammenhang besteht. Dabei werden die beobachteten Häufigkeiten mit theoretisch erwarteten Häufigkeiten verglichen. Danach werden die Stärke und die Richtung des Zusammenhangs ermittelt

Dieser Chi-Quadrat-Test wird auch als "Kontingenzanalyse" bezeichnet und auch wenn von "Kreuztabellen" gesprochen wird, kommt meist dieser Test zum Zuge.

Die Fragestellung des Pearson Chi-Quadrat-Tests wird oft so verkürzt:
"Gibt es einen Zusammenhang zwischen zwei kategorialen Variablen? Falls ja, wie stark ist dieser Zusammenhang?"

Wie zeigt sich die Chi^2 Formel ?

(Beobachtete -erwartete)^2(erwartete Wahrscheinlichkeit)

Was zeigt der T-Test auf?

Stichprobe im Vergleich zur Grundgesamtheit

Was ist die typische Vorgehensweise beim Erstellen der Fragebögen ?

Editierung der Fragebögen 

Codierung der Fragebögen  

Dateneingabe 1

Fehlerkontrolle  

Ergänzung fehlender Daten 

Gewichtung

Sie haben die Kundenzufriedenheit auf einer Skala von 1 bis 5 gemessen, wobei 1 ‘sehr unzufrieden’ und 5 ‘sehr zufrieden’ bedeutet. Zusätzlich haben Sie die Antwortoption ‘keine Angabe’ angeboten. In einer weiteren Frage haben Sie Kunden, die zwischen 1 und 3 geantwortet haben, nach den Gründen Ihrer Unzufriedenheit gefragt. Hier haben Sie folgende Antwortoptionen angeboten (Mehrfachauswahl): ‘Preis’, ‘Qualität’, ‘Service’ sowie ‘Sonstiges’ (inkl. Nennung). Wie könnte hierfür ein Codeplan aussehen?

Was für typisch Fehler können entstehen ?

Fehler durch Werte, die nicht im Codeplan sind •

Fehler durch Werte, die logisch nicht konsistent sind •

Fehler durch Ausreisser

Was ist der Unterschied zwischen Datenansicht und Variablenansicht

Variablenansicht zeigt: 

• Name •

Typ inkl. Spaltenformat und Dezimalstellen •

Variablenlabel

• Wertelabels

• Messniveau

• Fehlende Werte

Datenanssicht

Zeigt die Werte für die Variablen

Wie kann man Univariate Analysien in SPSS durchführen ?  Deskriptive Häufigkeiten ?

Analysieren--> Deskriptive Statistik--> Häufigkeiten--> Variablen auswählen--> Unter Statistiken die Lage und Streumasse auswählen

Wie kann in SPSS die deskriptive Analyse durchgeführt werden ? Univariate

NALYSIEREN-DESKRIPTIVE STATISTIKENDESKRIPTIVE STATISTIK-Unter OPTIONEN die entsprechenden Lage- und Streumasse auswählen; keine Häufigkeiten möglich

Wie kann man bi Variate analysen durchfüheren ? Korrelation --> Bi Variate analyse

ANALYSIEREN-KORRELATION-BIVARIAT-Variablen auswählen-In OPTIONEN Umgang mit fehlenden Werten festlegen: • Paarweiser Fallausschluss • Listenweiser Fallausschluss

Wie kann der Chi^2Test in SPSS interpretiert werden ? bi variate analyse

Interpretation: Der Chi-Quadrat-Wert liegt bei 1.169; bei 6 Freiheitsgraden ergibt sich eine asymptotische Signifikanz von 0.978, d.h. die Sicherheitswahrscheinlichkeit liegt bei 0.022 (oder 2.2%); es gibt keinen signifikanten Zusammenhang zwischen den beiden Variablen

Wie kann der Chi quadratstest in spss durchgeführt werden ?

ANALYSIEREN-DESKRIPTIVE STATISTIKENKREUZTABELLEN- Zu untersuchende Variablen auswählen-In STATISTIKEN Chi-Quadrat auswählen-In ZELLEN erwartete Häufigkeiten auswählen

Wie geht man in SPSS vor um T-Tests durchzuführen (Bivariate analysen)

ANALYSIERENMITTELWERTE VERGLEICHENT-TEST BEI UNABHÄNGIGEN STICHPROBEN

Test- und Gruppenvariable festlegen

Zwei Gruppen über Wertelabels auswählen

 

Wie kann man folgende NPS/ Zufriedenheits T-Test interpretieren

Interpretation: Die Nullhypothese, dass die Varianzen in beiden Gruppen gleich sind, wird verworfen; es muss der t-Wert in der zweiten Zeile interpretiert werden; der t-Wert liegt bei -11.995; es ergibt sich eine asymptotische Signifikanz von 0.000, d.h. die Sicherheitswahrscheinlichkeit liegt bei 99.9%; es gibt einen systematischen Unterschied zwischen den beiden Variablen

Merke: Falls die Sig (einseitig) bei Varianzen sind gleich --> 0.00 sind muss der der T-Test bei Varianzen sind nicht gleich angeschaut werden.

Was sind die Variablenskalen bei Bi-Variaten analysen ?

Zeige beispiele für explorativ, deskriptiv und induktiv auf

Zeichne alle multivariaten Analyseverfahren auf inklusive (Abhängige und unabhängige Variablen typen)

Beschreibe in eigenen Worten was die Lineare Regressionsanalyse ist ? Für was sie geeignet ist ? Und wie sie eingesetzt wird ?

Die Regressionsanalyse ist ein ausserordentlich vielseitiges und flexibles Analyseverfahren, das sowohl für die Beschreibung und Erklärung von Zusammenhängen als auch für die Durchführung von Prognosen grosse Bedeutung besitzt. Sie ist damit sicherlich das wichtigste und am häufigsten angewendete multivariate Analyseverfahren. Insbesondere kommt sie in Fällen zur Anwendung, wenn Wirkungsbeziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen untersucht werden sollen. Mit Hilfe der Regressionsanalyse können derartige Beziehungen quantifiziert und damit weitgehend exakt beschrieben werden. Ausserdem lassen sich mit ihrer Hilfe Hypothesen über Wirkungsbeziehungen prüfen und auch Prognosen erstellen. Die Regressionsanalyse ist prinzipiell anwendbar, wenn sowohl die abhängige als auch die unabhängigen Variablen metrisches Skalenniveau besitzen.

Fülle den Steckbrief aus

Was sind die 3 Typischen Anwendungsbereich einer linearen Regression ?

Ursachenanalysen Wie stark ist der Einfluss der unabhängigen Variablen auf die abhängige Variable? •

Wirkungsprognosen Wie verändert sich die abhängige Variable bei einer Änderung der unabhängigen Variablen? •

Zeitreihenanalysen Wie verändert sich die abhängige Variable im Zeitverlauf?

Was für eine Formel ist dies ? für was stehen die koeffizienten

Wie sieht die Formel für eine Multivariate Regressionsanalyse aus ?

Wie kann eine Regressionsfunktion geschätzt werden ?

 

Formuliere eine Multivariate Regressionsanalyse an einem Praxisbeispiel

AV: Absatzmenge

UV: Aussendienstmitarbeiter, Preis , Werbebudget, Mailings

Mit welchen 2 faktoren kann eine Regressionsfunktion überprüft werden ?

R^2 und F-Test

Wie setzt sich ein R^2 zusammen ?

Erklärte Streuung / Gesamtstreuung

 

Je grösser die erklärte streung, je kleiner die Gesamtstreuung desto näher ist der Wert bei 1

Wie kann mit dem F-Test eine Regressionsfunktion überprüft werden ?

Nullhypothese definieren H0 : β1 = β2 = … = βJ = 0 (0 Hypo--> kein Einfluss der Faktoren)

• Empirischen F-Wert berechnen

• Signifikanzniveau festlegen

• Empirischen und theoretischen F-Wert vergleichen

• Nullhypothese annehmen oder ablehnen

Wie kann im SPSS eine lineare Regressionsfunktion geprüft werden ?

ANALYSIEREN-REGRESSION-LINEAR

Abhängige und unabhängige Variable auswählen

EINSCHLUSS berücksichtigt alle unabhängigen Variablen gleichzeitig

Was ist der unterschied zwischen R^2 und korrigiertem R-Wert ? Wo sieht man den F-wert und das Signifikanzniveau ?

Wie können in einer Regressionsanalyse die koeffizienten geprüft werden ?

T-Test der koeffizienten

Was ist vorannahme bei lineare regressionsanalysen ?

Das Modell ist richtig spezifiziert

• Zwischen den unabhängigen Variablen besteht keine lineare Abhängigkeit (Multikollinearität)

• Die Störgrössen haben den Erwartungswert Null

• Es besteht keine Korrelation zwischen den unabhängigen Variablen und der Störgrösse

• Die Störgrössen haben eine konstante Varianz (Homoskedastizität)

• Die Störgrössen sind nicht korreliert (Autokorrelation) • Die Störgrössen sind normalverteilt