Statistik und R
Thema Statistik bis zum 23.3.18
Thema Statistik bis zum 23.3.18
Set of flashcards Details
Flashcards | 26 |
---|---|
Language | Deutsch |
Category | Computer Science |
Level | University |
Created / Updated | 23.03.2018 / 24.03.2018 |
Weblink |
https://card2brain.ch/box/20180323_statistik_und_r
|
Embed |
<iframe src="https://card2brain.ch/box/20180323_statistik_und_r/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Create or copy sets of flashcards
With an upgrade you can create or copy an unlimited number of sets and use many more additional features.
Log in to see all the cards.
Überprüfungsbefehl ob Eingabe geklappt hat
view(Datei)
Metrische Dateneingabe
x=c(17,14,3,2)
Nominale Dateneingabe
x=factor(c("blau","rot",....)
Dichotome Dateneingabe
x=factor(c("Ja", "Ja", "Nein"))
Ordinaledaten Reihenfolge einfügen
1. daten=c("feucht", "nass", "feucht", "nass", "trocken", "trocken"
2. Reihenfolge=c("nass", "feucht", "trocken")
3. x=factor(daten, levels=reihenfolge)
Zugriff auf die Spalten eines data.frame
Kaese$Sorte
$ vermeiden
attach(Kaese)
Kaese$Naehrwert
Was ist das Ziel einer Regressions Analyse?
Beziehung zwischen abhängigen Variabeln einer oder mehreren Variabeln zu modellieren
Datenstruktur anzeigen
str(Datei)
Was sind Residuen?
Die strecke vom einzelnen Mewwert zur trendgerade "Zufahrtsstrasse"
hhWie Zeichne ich eine Trendgerade
1. attach(baum)
2. trend=lm(baum$Hoehe~baum$Dicke)
3. abline( trend, col="blue")
trend=lm(abh. Variabel~unabh. Variabel)
Wie kann ich die einzelnen Parameter der gleichung herausholen um damit weiterzurecnen?
b=trend$coefficients[1]
a=trend$coefficients[2]
Was ist ein Problem der linearen Regression?
Die Extrapolation weit über den Messbereich hinaus ist höchst gefährlich. so ist ein baumstamm also um 1cm dicker als eim amdere. dam ost er um 0.13 höher. Heiss tein Baumstamm mit Dicke 0 ist 18.34 meter gross.
Wofür steht der Korrelations-Koeffizient r?
Er sagt mir ob meine Gerade gut ist - also ob meine Daten nahe genug beieinander liegen oder ob sie zu weit umher streuen.
Was bedeutet der Korrelation koeffizient r wenn...
.. positives r?
..negatives r?
.. r=0?
..r=I1I
..r=I0,4I - I0.7I
..r=I0.7I - I1I
.. positives r? = Steigende Trendgerade
..negatives r? = fallende Trendgerade, Anti Korrelation,
.. r=0? = Keinerlei Korrelation ( keine sinnvolle gerade oder horizontale) gleiches y zu jedem x
..r=I1I = Perfekte Korrelation
..r=I0,4I - I0.7I = schwache Korrelation
..r=I0.7I - I1I = schwache Korrelation
Welcher Korrelations Koeffizient wird bei metrischen Daten genommen
Pearson K.k
Definition von Kovarianz
Mass für linearen Zusammenhang zweier Variabeln.Sie gibt die Richtung zwischen zwei Variabeln an über die Stärke wird jedoch keine Aussage getroffen. Um einen Zusammenhang vergleichbar zu machen muss die Kovarianz normiert werden.
dies geschieht mit dem Pearson K.
Was ist de Pearson K.
Mass für die Stärke der linearen Abhängigkeit zweier statistischer Variabeln
Wie wende ich die pearsonschen Korrelationsfaktor an?
cor(x,y,method="pearson")
cor(x,y)
Wofür benötigt man den Spearmann-Korrrelationskoeffizienten?
Berrechnet nicht zwiscchen den Daten selbst sondern zwischen ihren korrigierten Rängen. Dies kommt vorallem bei ordinalen Daten vor da mann keine metrischen grössenangaben nutzen kann.
Vom gleichen Rang spricht man wen mehrere Daten sich den gleichen Rang teilen
Wobei handelt es sich bei der Nullhypothese?
Wie unterscheidet sich der koefffizien von null bei einer regression? Oder anderst: p wert ist die wajrscheinlichkeit der nullhypothese.
Wobei handelt es sicvh genau bwi einer nullhypothese?
Es gibt keinen zusammenhang zwischen den variabeln
Was bedeutet p wert wenn..
P <0.05
P <0.01
P <0.001
Signifikant
Sehr signifikant
Hoch signifilant
Je kleiner p desto warsheinlicher das es einen linearen zusammenhang gibt
Notation in binominalverteilung
N = anzahl ereignisse in kette
K = anz erfolge
p= etfolgsesrsh Im einzelnen ereignis
P= gesamtwarsh einer kette für k erfolge aud n ereignissen
-
- 1 / 26
-