Quantitative Datenanalyse
Quantitative Datenanalyse
Quantitative Datenanalyse
Fichier Détails
Cartes-fiches | 113 |
---|---|
Langue | Deutsch |
Catégorie | Mathématiques |
Niveau | Université |
Crée / Actualisé | 17.02.2020 / 17.02.2020 |
Lien de web |
https://card2brain.ch/box/20200217_quantitative_datenanalyse
|
Intégrer |
<iframe src="https://card2brain.ch/box/20200217_quantitative_datenanalyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was bedeutet Univariat und wie ist dies Einzuordnen ?
In der Mathematik bezeichnet univariat eine Gleichung, einen Ausdruck oder eine Funktion, die jeweils nur von einer Variablen abhängen. Im Gegensatz dazu wird der Begriff multivariat verwendet, wenn ein Ausdruck von mehr als einer Variablen abhängt.
Wie können bei Univariaten Gleichungen die Lage ermittelt werden ?
- Modus
- Median
- Arrithmetisches Mittel
Wie wird der Modus ermittelt ?
Der Modus, auch Modalwert genannt, ist ein Lageparameter in der deskriptiven Statistik. Er ist definiert als der häufigste Wert, der in der Stichprobe vorkommt.
Was ist der Median ?
In der Statistik ist der Median – auch Zentralwert genannt – ein Mittelwert und Lageparameter. Der Median der Messwerte einer Urliste ist derjenige Messwert, der genau „in der Mitte“ steht, wenn man die Messwerte der Größe nach sortiert.
--> 50% der Fläche sind links , 50% der Fläche sind rechts auf X-Achse
Was ist das Arrithmetische Mittel ?
Summe/n
Was für Streungsparameter gibt es bei Univariaten Statistiken ?
Spannweite
Varianz
Standardabweichungen
Was ist die Variant und wie wird diese Berrechnet ?
Beschreibt die Streuung der einzelnen Werte um den Mittelwert
-Mittlere Quadratische Abweichung vom Mittelwert = Varianz= Wie weit ist eine Zahlenreihe im Durchschnitt vom Mittelwert entfernt= streuung um den Mittelwert
-Standardabweichung= Wurzel aus der Varianz--> bsp die preise weichen um durchschnitt um 23Euro vom Mittel ab
Was sind Bivariate Analysen und wie unterscheiden sich diese zu Univariaten ?
Bei univariaten Verfahren werden die Merkmalsausprägungen von einer Variablen betrachtet , wohingegen bei bivariaten Verfahren die Beziehungen zwischen zwei Variablen untersucht werden.
Dabei unterscheiden wir zwischen deskriptiven und induktiven Verfahren.[…]
Deskriptive (oder beschreibende) Verfahren befassen sich mit der Aufbereitung und Auswertung der untersuchten Stichprobe.
Induktive Verfahren nehmen Verallgemeinerungen bzw. Schlüsse von der Stichprobe auf die zugrundeliegende Grundgesamtheit vor
Was für deskriptive/Induktive Analysevarianten gibt es ?
Deskriptiv Bivariat--> Korrelation und Regression
Induktiv Bivariat-->T-test, chi^2,
Deskriptiv Univariat--> Häufigkeit, Lage und Streuparameter
Induktiv Univariat-->T-test,
Was sagt der Korrelationskoeffizient aus ?
Wie bereits erwähnt, misst der Korrelationskoeffizient die Stärke eines linearen Zusammenhangs zwischen zwei Variablen
Was ist der Chi^2 Test und wozu wird dieser gebraucht ?
Der Pearson Chi-Quadrat-Test testet, ob zwischen zwei kategorialen Variablen ein Zusammenhang besteht. Dabei werden die beobachteten Häufigkeiten mit theoretisch erwarteten Häufigkeiten verglichen. Danach werden die Stärke und die Richtung des Zusammenhangs ermittelt
Dieser Chi-Quadrat-Test wird auch als "Kontingenzanalyse" bezeichnet und auch wenn von "Kreuztabellen" gesprochen wird, kommt meist dieser Test zum Zuge.
Die Fragestellung des Pearson Chi-Quadrat-Tests wird oft so verkürzt:
"Gibt es einen Zusammenhang zwischen zwei kategorialen Variablen? Falls ja, wie stark ist dieser Zusammenhang?"
Wie zeigt sich die Chi^2 Formel ?
(Beobachtete -erwartete)^2(erwartete Wahrscheinlichkeit)
Was zeigt der T-Test auf?
Stichprobe im Vergleich zur Grundgesamtheit
Was ist die typische Vorgehensweise beim Erstellen der Fragebögen ?
Editierung der Fragebögen
Codierung der Fragebögen
Dateneingabe 1
Fehlerkontrolle
Ergänzung fehlender Daten
Gewichtung
Sie haben die Kundenzufriedenheit auf einer Skala von 1 bis 5 gemessen, wobei 1 ‘sehr unzufrieden’ und 5 ‘sehr zufrieden’ bedeutet. Zusätzlich haben Sie die Antwortoption ‘keine Angabe’ angeboten. In einer weiteren Frage haben Sie Kunden, die zwischen 1 und 3 geantwortet haben, nach den Gründen Ihrer Unzufriedenheit gefragt. Hier haben Sie folgende Antwortoptionen angeboten (Mehrfachauswahl): ‘Preis’, ‘Qualität’, ‘Service’ sowie ‘Sonstiges’ (inkl. Nennung). Wie könnte hierfür ein Codeplan aussehen?
Was für typisch Fehler können entstehen ?
Fehler durch Werte, die nicht im Codeplan sind •
Fehler durch Werte, die logisch nicht konsistent sind •
Fehler durch Ausreisser
Was ist der Unterschied zwischen Datenansicht und Variablenansicht
Variablenansicht zeigt:
• Name •
Typ inkl. Spaltenformat und Dezimalstellen •
Variablenlabel
• Wertelabels
• Messniveau
• Fehlende Werte
Datenanssicht
Zeigt die Werte für die Variablen
Interpretation: Die Nullhypothese, dass die Varianzen in beiden Gruppen gleich sind, wird verworfen; es muss der t-Wert in der zweiten Zeile interpretiert werden; der t-Wert liegt bei -11.995; es ergibt sich eine asymptotische Signifikanz von 0.000, d.h. die Sicherheitswahrscheinlichkeit liegt bei 99.9%; es gibt einen systematischen Unterschied zwischen den beiden Variablen
Merke: Falls die Sig (einseitig) bei Varianzen sind gleich --> 0.00 sind muss der der T-Test bei Varianzen sind nicht gleich angeschaut werden.
Beschreibe in eigenen Worten was die Lineare Regressionsanalyse ist ? Für was sie geeignet ist ? Und wie sie eingesetzt wird ?
Die Regressionsanalyse ist ein ausserordentlich vielseitiges und flexibles Analyseverfahren, das sowohl für die Beschreibung und Erklärung von Zusammenhängen als auch für die Durchführung von Prognosen grosse Bedeutung besitzt. Sie ist damit sicherlich das wichtigste und am häufigsten angewendete multivariate Analyseverfahren. Insbesondere kommt sie in Fällen zur Anwendung, wenn Wirkungsbeziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen untersucht werden sollen. Mit Hilfe der Regressionsanalyse können derartige Beziehungen quantifiziert und damit weitgehend exakt beschrieben werden. Ausserdem lassen sich mit ihrer Hilfe Hypothesen über Wirkungsbeziehungen prüfen und auch Prognosen erstellen. Die Regressionsanalyse ist prinzipiell anwendbar, wenn sowohl die abhängige als auch die unabhängigen Variablen metrisches Skalenniveau besitzen.
Was sind die 3 Typischen Anwendungsbereich einer linearen Regression ?
Ursachenanalysen Wie stark ist der Einfluss der unabhängigen Variablen auf die abhängige Variable? •
Wirkungsprognosen Wie verändert sich die abhängige Variable bei einer Änderung der unabhängigen Variablen? •
Zeitreihenanalysen Wie verändert sich die abhängige Variable im Zeitverlauf?
Mit welchen 2 faktoren kann eine Regressionsfunktion überprüft werden ?
R^2 und F-Test
Wie kann mit dem F-Test eine Regressionsfunktion überprüft werden ?
Nullhypothese definieren H0 : β1 = β2 = … = βJ = 0 (0 Hypo--> kein Einfluss der Faktoren)
• Empirischen F-Wert berechnen
• Signifikanzniveau festlegen
• Empirischen und theoretischen F-Wert vergleichen
• Nullhypothese annehmen oder ablehnen
Was ist vorannahme bei lineare regressionsanalysen ?
Das Modell ist richtig spezifiziert
• Zwischen den unabhängigen Variablen besteht keine lineare Abhängigkeit (Multikollinearität)
• Die Störgrössen haben den Erwartungswert Null
• Es besteht keine Korrelation zwischen den unabhängigen Variablen und der Störgrösse
• Die Störgrössen haben eine konstante Varianz (Homoskedastizität)
• Die Störgrössen sind nicht korreliert (Autokorrelation) • Die Störgrössen sind normalverteilt