Data Statistik

HSLU Dozenten Birnbaumer Büchel

HSLU Dozenten Birnbaumer Büchel


Kartei Details

Karten 28
Sprache Deutsch
Kategorie Mathematik
Stufe Andere
Erstellt / Aktualisiert 22.03.2020 / 03.04.2020
Weblink
https://card2brain.ch/box/20200322_data_statistik
Einbinden
<iframe src="https://card2brain.ch/box/20200322_data_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Wie importiert man numpy? Was ist es?

import numpy as np

Es liefert ein 3D Array.

Wie importiert man Matplotlib? Was ist es?

 

import matplotlib.pyplot as plt

Bibliothek um Plots zu Zeichnen. 

wie importiert man pandas? was ist es?

import pandas as pd

Pandas offeriert Datenstrukturen und Möglichkeiten, diese zu Manipulieren. 

Was ist scipy? Wie importiert man es?

import scipy.stats as st

Bibliothek zur Manipulation von Verteilungen

Wie erzeugt man einen Numpy-Array?

 

arr = np.array([2,3,4,-8,10])

 

Wie erzeugt man ein Array mit Zahlen zwischen "start" und "stop" mit insgesamt "num" Positionen?

np.linspace(start=1, stop=2, num=4)

Wie erzeugt man ein Array mit Zahlen von (und mit) "start" bis (ohne) "stop" mit "step"-Grossen Schritten dazwischen?

np.arange(start=1, stop=4, step=0.6)

Wie zeige ich den Wert eines Quantiles eines Numpy-Arrays an?

(Beispiel mit 2.5% und 97.5% Quantile)

Was bedeutet es?

np.percentile(arr, q=[2.5, 97.5])

Den Wert, damit 2.5% der Stichproben gleich oder kleiner sind als der Wert.

Was ist der Median? Wie wird er berechent?

Der Median ist der Wert, wo die Hälfte der Beobachtungen unterhalb sind und die andere Hälfte Oberhalb.

[1,2,3,4,5,6,7,8,9] -> Median ist 5

series.median()

Ungerade Zahl ist gut zum Ausrechnen, bei Gerader Zahl durchschnitt nehmen.

Wie zählt man die Anzahl Werte in einem numpy Array, die grösser sind als x?

np.sum(arr > x)

Wie berechnet man die Korrelationsmatrix für zwei numpy-Arrays?

np.corrcoef(arr_x, arr_y)

Wie erstellt man ein Numpy Array, mit Grösse "size" und zufälligen Werten?

arr = np.random.choice(arr, size=100)

Wie erstellt man ein Pandas Series Array? Wie mit einer Indexierung?

series = pd.Series([33,34,35])

mit Indexierung: series = pd.Series(

[33,34,35],

index=("Hasan", "Rico", "Urs")

)

Wie berechnet man die Summe der Elemente eines Series-Arrays?

series.sum()

Wie berechnet man das Produkt der Elemente eines Series-Arrays?

series.prod()

Wie berechnet man den Durchschnitt (arythmetisches Mittel) aller Element eines Series-Arrays?

series.mean()

Welche Lageparameter und welche Streuungsparamter gibt es?

Lageparameter: Wo liegen die Beobachtungen auf der Mess-Skala?

1) Arithmetisches Mittel 2) Median 3) Quantile

Streuungsparameter: Wie streuen die Daten um ihre mittlere Lage?

1) Empirische Varianz 2) Standartabweichung 3) Quartilsdiferenz

Was ist das Arithmetische Mittel? Wie wird es mit Panda Series berechnet?

series.mean()

Was ist die Streuung? Wie wird sie gemessen?

Wie sich die Daten um den Mittwelwert verteilen. Empirische Varianz und empirische Standardabweichung.

Was ist die Empirische Varianz? Was ist die empirische Standardabweichung?

Empirsische Varianz Var(x) und Standardabweichung ssind Messwerte für die Streuung von Daten. Sind diese Werte hoch, ist auch die Streuung hoch.

series.var() und series.std()

Was ist der Median?

Datensatz nach Grösse anordnen, Wert in der Mitte ist Median (ungerade Anzahl). Bei gerader Anzahl: Mittelwert der beiden mittigen Beobachtungen. 

series.median()

Median ist Robust, d.h durch extreme Beobachtungen nicht so sehr beeinflusst. 

Was ist ein Quartil?

Anlog wie Median. Unteres Quartil: 25% der Werte kleiner und 75% der Werte grösser als dieser Wert

Oberes Quartil: 75% der Werte kleiner und 25% der Werte grösser. 

 

Was ist die Quartilsdifferenz?

oberes Quartil - unteres Quartil

je kleiner, umso näher liegt Hälfte aller Werte um den Median, umso kleiner die Streuung.

series.quantile(q=0.25, interpolation="midpoint")

Was ist ein Quantil?

Gleiches Prinzip wie Median oder Quartil, aber auf jede Prozentzahl. 

 

Was ist die Schiefe?

Welche graphische Darstellungen gibt es?

-Eindimensionales Streudiagramm 

-Histogramm

-Boxplot

 

Was ist ein Residuum?

Abstand zwischen Messpunkt und Regressionsgerade

Was ist die empirische Korrelation?

  • Dimensionslose Zahl zwischen -1 und 1
  • Misst Stärke und Richtung der linearen Abhänigkeit zwischen Daten x und y
  • frame.corr()