modellevaluation


Kartei Details

Karten 42
Sprache Deutsch
Kategorie Mathematik
Stufe Universität
Erstellt / Aktualisiert 12.06.2017 / 17.06.2017
Weblink
https://card2brain.ch/box/20170612_lek20modellevaluationlek21
Einbinden
<iframe src="https://card2brain.ch/box/20170612_lek20modellevaluationlek21/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Wofür brauchen wir Masse der Modellgüte (goodnes of fit)?

um zu sagen, wie gut die ergebnisse der schätzverfahren an die daten angepasst sind

welches ist das häufigste bestimmtheitsmass für lineare regressionsmodelle mit ols-schätzung?

r^2, seltener auch rmse

welches mass der modellgüte wird für logistische regressionsmodelle verwendet?

oft pseudo-r^2

welches mass der modellgüte wird für vergleiche zwischen verschiedenen (=non-nested) modellen verwendet?

aic oder bic

was drücken pre-masse aus?

um wie viel sich der vorhersagefehler bei kenntnis mind. eine prädiktors reduziert (proportional reductio of error).

welche werte dürfen verwendet werden, wenn man bei der vorhersage die potentiellen prädiktoren nich tkennt (naives modell)?

werte der abhängigen variable Y

wie lautet das pre-mass für diskrete variablen, und welche werte verwendet es?

goodman and kruskals gamma verwendet die am häufigsten besetzte kategorie von Y (modalkategorie).

welcher wert steht bei einem regressionsmodell anstelle der modalkategorie?

der durchschnitt von y (konstante)

wofür steht pre-mass?

porportionales fehlerreduktionsmass

welche frage beantwortet das pre-mass r^2?

wie gut erklärt unsere geschätzte regressionsfunktion die abhängige variable?

was erklärt r^2?

welcher anteil der gesamtstreuung in der abhängigen variable y durch die unabhängige(n) variable(n) erklärt werden kann.

welche werte kann r^2 annehmen?

von 0 (kein zusammenhang) bis 1 (perfekt linearer zusammenhang)

was ist das problem bei der multiplen regrsssion bzw. sst (sum of squares)?

sst bleibt auch bei hinzunahme weiterer UV konstant.

was ist das problem bei der multiplen regression bzw. SSE (sum of squared residuals)?

sie erhöht sich bei hinzunahme von UVs nicht. das verleitet dazu, zu viele UVs reinzunehmen.

für welche modelle eignet sich r^2 nicht und weshalb?

modelle mit unterschiedlicher anzahl UVs, weil r^s bei hinzunahme von UVs nicht geringer wird.

was sind freiheitsgrade?

anzahl beobachtungen minus zu schätzende koeffizienten

was korrigiert der korrigierte determinationskoeffizient r^2 (mit flachem dächli über dem r)?

er belohnt die persimonität (sparsamkeit) und korrigiert nach massgabe der freiheitsgrade

woraus vesteht die korrektur des korrigierten determinationskoeffizienten r-strichli^2?

ein anteil (regressoren/freiheitsgrade) der erklärten varianz wird abgezogen

wann ist der abzug des korrigierten determinationskoeffizienten r-strichli^2 klein?

wenn r^2 hoch ist und im vergleich zu den regressoren viele beobachtungen vorliegen.

was sind regressoren?

UV

wann kann sich r-strichli^2 bei UV-hinzunahme verringern?

wenn koeffizienten nicht mindestens einen t-wert von 1 aufweisen

wann fällt r-strichli^2 auch mal negativ aus?

falls r^2 nahe o ist oder die modellgüte miserabel ist relativ zur anzahl frieheitsgrade

was ist der zweck der regressionsanalyse?

möglichst genaue schätzung von parametern und die statistische inferenz

wann dürfen r-strichli-^2 verglichen werden?

bei der selben AV (UVs dürfen variieren)

was ist entscheidend für einen vergleich zwischen mehreren r-strichli-^2?

sst muss immer gleich viel betragen

wofür steht rmse?

root mean squared error, also quadratwurzel des mse.

was gibt rmse (root mean squared error) an?

wie stark eine prognose im durchschnitt vond en tatsächlichen beobachtungswerten abweicht.

wie steht die grösse von rmse zur anpassung des modells?

je grösser rmse, desto schlechter die anpassung des modells --> je kleinerer rmse, desto besser

wan ist ein modell verschachtelt?

wenn es eine teilmenge eines anderen modells ist und aus einem anderen durch null-restriktionen hervorgeht.

wie sett sich sst zusammen?

ssr + sse

wie lautet die alternativhypothese des F-tests?

mindestens ein beta-i ist ungleich null.

wofür steht sse?

sum of squared error. fehlerquadratsumme.

wann ist sse des restringierten modell grösser als sse des vollen (nicht-restringierten) moells?

wenn die hinzugenommenen regressoren eine signifikante erklärungskraft haben

was tun, wenn zwei konkurrierende modelle nicht ineinander verschachtelt sind?

vergleich der aic- oder bic-werte der modelle.

was ist ein informationskriterium?

ein kriterium zur auswahl eines modells.

was ist die idee hinter ockham's razor?

dass ein modell nicht unnötig komplex sein soll (parimonie) aber ine möglichst hohe abpassungsgüte hat

anhand wovon wird komplexität erhoben?

anzahl parameter

was verwendet informationskriterien als anpassungsgüte?

maximale warscheinlichkeit (likelihood) oder minimale varianz der residuen.

welche zwei interpretationen ergeben sich ais den zwei unterschiedlichen anapssungsgüten?

1. modell mit höchsten werten (parameterzahl strafend abgezogen) 2. modell mit niedrigstem wert (parameterzahl wird strafend addiert)

was ist konservativer, bic oder ais?

bic