Data Statistik
HSLU Dozenten Birnbaumer Büchel
HSLU Dozenten Birnbaumer Büchel
Kartei Details
Karten | 28 |
---|---|
Sprache | Deutsch |
Kategorie | Mathematik |
Stufe | Andere |
Erstellt / Aktualisiert | 22.03.2020 / 03.04.2020 |
Weblink |
https://card2brain.ch/box/20200322_data_statistik
|
Einbinden |
<iframe src="https://card2brain.ch/box/20200322_data_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Wie importiert man numpy? Was ist es?
import numpy as np
Es liefert ein 3D Array.
Wie importiert man Matplotlib? Was ist es?
import matplotlib.pyplot as plt
Bibliothek um Plots zu Zeichnen.
wie importiert man pandas? was ist es?
import pandas as pd
Pandas offeriert Datenstrukturen und Möglichkeiten, diese zu Manipulieren.
Was ist scipy? Wie importiert man es?
import scipy.stats as st
Bibliothek zur Manipulation von Verteilungen
Wie erzeugt man einen Numpy-Array?
arr = np.array([2,3,4,-8,10])
Wie erzeugt man ein Array mit Zahlen zwischen "start" und "stop" mit insgesamt "num" Positionen?
np.linspace(start=1, stop=2, num=4)
Wie erzeugt man ein Array mit Zahlen von (und mit) "start" bis (ohne) "stop" mit "step"-Grossen Schritten dazwischen?
np.arange(start=1, stop=4, step=0.6)
Wie zeige ich den Wert eines Quantiles eines Numpy-Arrays an?
(Beispiel mit 2.5% und 97.5% Quantile)
Was bedeutet es?
np.percentile(arr, q=[2.5, 97.5])
Den Wert, damit 2.5% der Stichproben gleich oder kleiner sind als der Wert.
Was ist der Median? Wie wird er berechent?
Der Median ist der Wert, wo die Hälfte der Beobachtungen unterhalb sind und die andere Hälfte Oberhalb.
[1,2,3,4,5,6,7,8,9] -> Median ist 5
series.median()
Ungerade Zahl ist gut zum Ausrechnen, bei Gerader Zahl durchschnitt nehmen.
Wie zählt man die Anzahl Werte in einem numpy Array, die grösser sind als x?
np.sum(arr > x)
Wie berechnet man die Korrelationsmatrix für zwei numpy-Arrays?
np.corrcoef(arr_x, arr_y)
Wie erstellt man ein Numpy Array, mit Grösse "size" und zufälligen Werten?
arr = np.random.choice(arr, size=100)
Wie erstellt man ein Pandas Series Array? Wie mit einer Indexierung?
series = pd.Series([33,34,35])
mit Indexierung: series = pd.Series(
[33,34,35],
index=("Hasan", "Rico", "Urs")
)
Wie berechnet man die Summe der Elemente eines Series-Arrays?
series.sum()
Wie berechnet man das Produkt der Elemente eines Series-Arrays?
series.prod()
Wie berechnet man den Durchschnitt (arythmetisches Mittel) aller Element eines Series-Arrays?
series.mean()
Welche Lageparameter und welche Streuungsparamter gibt es?
Lageparameter: Wo liegen die Beobachtungen auf der Mess-Skala?
1) Arithmetisches Mittel 2) Median 3) Quantile
Streuungsparameter: Wie streuen die Daten um ihre mittlere Lage?
1) Empirische Varianz 2) Standartabweichung 3) Quartilsdiferenz
Was ist die Streuung? Wie wird sie gemessen?
Wie sich die Daten um den Mittwelwert verteilen. Empirische Varianz und empirische Standardabweichung.
Was ist der Median?
Datensatz nach Grösse anordnen, Wert in der Mitte ist Median (ungerade Anzahl). Bei gerader Anzahl: Mittelwert der beiden mittigen Beobachtungen.
series.median()
Median ist Robust, d.h durch extreme Beobachtungen nicht so sehr beeinflusst.
Was ist ein Quartil?
Anlog wie Median. Unteres Quartil: 25% der Werte kleiner und 75% der Werte grösser als dieser Wert
Oberes Quartil: 75% der Werte kleiner und 25% der Werte grösser.
Was ist die Quartilsdifferenz?
oberes Quartil - unteres Quartil
je kleiner, umso näher liegt Hälfte aller Werte um den Median, umso kleiner die Streuung.
series.quantile(q=0.25, interpolation="midpoint")
Was ist ein Quantil?
Gleiches Prinzip wie Median oder Quartil, aber auf jede Prozentzahl.
Welche graphische Darstellungen gibt es?
-Eindimensionales Streudiagramm
-Histogramm
-Boxplot
Was ist ein Residuum?
Abstand zwischen Messpunkt und Regressionsgerade
Was ist die empirische Korrelation?
- Dimensionslose Zahl zwischen -1 und 1
- Misst Stärke und Richtung der linearen Abhänigkeit zwischen Daten x und y
- frame.corr()