Vorlesung Methoden 6 - WiSe
Vorlesung Methoden 6 - WiSe
Vorlesung Methoden 6 - WiSe
Kartei Details
Karten | 22 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 18.01.2020 / 04.02.2023 |
Weblink |
https://card2brain.ch/box/20200118_vorlesung_methoden_6_wise
|
Einbinden |
<iframe src="https://card2brain.ch/box/20200118_vorlesung_methoden_6_wise/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Lernkarteien erstellen oder kopieren
Mit einem Upgrade kannst du unlimitiert Lernkarteien erstellen oder kopieren und viele Zusatzfunktionen mehr nutzen.
Melde dich an, um alle Karten zu sehen.
Geben Sie jeweils Beispiele, mit welchen Parametern man die drei Hauptgütekriterien messbar machen kann.
- Objektivität: Standardisierung der Durchführung, Auswertung und Interpretation
- Reliabilität: Konsistenzkoeffizienten, Paralleltest-Koeffizienten, Retest-Koeffizienten
- Validität: z.B. Kriteriumsvalidität (Vorhersage und Übereinstimmung)
Nennen Sie fünf grundsätzliche Möglichkeiten der quantitativen Messung.
- Zählen
- Urteilen
- Testen
- Befragen
- Beobachten
Was versteht man unter Indexbildung und welche Möglichkeiten hierbei gibt es?
Messwert für komplexes Merkmal (z.B. Aufsatzqualität bestehend aus verschiedenen Teilmerkmalen wie Rechtschreibung, Ausdruck, Inhalt etc.): gewichtet/ungewichtet, additiv/multiplikativ etc.
Geben Sie Beispiele für Bereiche, bei denen menschliche Urteile valider als apparative Messergebnisse sein können.
Stimmqualität, Weinqualität, künstlerisches Vermögen
Nennen und beschreiben Sie drei Rangordnungsverfahren.
1. Direkte Rangordnung (mit oder ohne Verbundränge): schwierig bei vielen Objekten, weniger genau als Paarvergleich
2. Methode der sukzessiven Intervalle: wenn zu viele Objekte --> in Untergruppen sortieren lassen
3. Law of categorial judgement: Nimmt (normalverteilte) Fluktuationen von Beurteilungen an: schwankende Rangkategoriegrenzen
- Verfahren: mehrere Rangurteile erheben (within/between subjects), z-standardisierte relative Häufigkeiten lassen sich dann sogar in Intervallskalenniveau „hochskalieren“
Welcher Verfahrensunterschied besteht zwischen law of categorial vs. comparative judgement? Was ist beiden Verfahren gemeinsam?
Law of comparative judgement (Thurstone, 1927):
Annahme: Empfindungsstärken um wahren Wert normalverteilt
Erstellung einer Intervallskala über z-standardisierte relative Häufigkeiten (kleinster z-Wert wird auf Null gesetzt)
Unterschiede:
- einmal Beurteilungen und einmal Empfindungsstärken
- letzteres basierend auf Paarvergleich und ersters auf Rangordnungen
- letzteres: Präferenzhäufigkeiten werden in relative Häufigkeiten transformiert und diese in z-Werte
Wie kommt man beim Dominanzpaarvergleich zu indirekten Rangordnungen?
Dominanzpaarvergleich: Vorlage von je zwei Objekten: „Welches dominiert (hinsichtlich eines Merkmals, z.B. Schönheit)?“
--> Dominanzmatrix
Optimal: vollständiger Paarvergleich
Nachteil: kann bei vielen Objekten ausufern, besonders „mit Messwiederholung“ bzgl. individueller Paarvergleiche
indirekte Rangordnung --> ergibt sich aus Anzahl der „Dominanzen“, verlässlicher als direkte Rangordnung
Was sind zirkuläre Triaden bzw. intransitive Urteile?
- zirkuläre Triaden: (A>B, B>C, aber C>A)
- intransitive Urteile (A>B, aber B>A)
Welcher Unterschied besteht zwischen Konkordanz und Konsistenz?
Konsistenz: Widerspruchsfreiheit der Einzelurteile eines Beurteilers
Konkordanz: Übereinstimmung zwischen Beurteilern
Wie funktioniert prinzipiell ein Ähnlichkeitspaarvergleich, und was ist der prinzipielle Unterschied zum Dominanzpaarvergleich?
- Ähnlichkeitspaarvergleich: Beurteilt werden soll globale Ähnlichkeit zwischen zwei Objekten (oder Paaren von Objekten), um relevante Merkmalsdimensionen nicht vorwegzunehmen, sondern erst zu extrahieren, z.B. MDS (mehrdimensionale Skalierung), NMDS (non-metrische MDS)
Beispiel: Ähnlichkeitsurteile bzgl. Berufe ergibt dreidimensionale Struktur (Unabhängigkeit, Prestige, Skill)
- Unterschied zum Dominanzpaarvergleich: Nicht Ähnlichkeit, sondern Dominanz hinsichtlich eines Merkmals steht im Vordergrund
Warum zählt die SDT zu den Urteilsverfahren?
SDT als Urteilsverfahren zur Trennung von sensorischer Diskriminationsfähigkeit (d‘) und Reaktionsschwelle (bias)
Welche Entscheidungen muss man bei der Konstruktion von Ratingskalen treffen?
- uni - oder bipolar
- Verankerung: numerisch/verbal/symbolisch
- graphisches Rating?
- Stufenanzahl (viel/wenig, gerade/ungerade)
Inwiefern müssen bei Ratingskalen Urteilsfehler beachtet werden?
Halo-Effekt, Milde/Härte, Extrem- oder zentrale Tendenz, Primacy/Recency, Ähnlichkeit/Kontrast zwischen Rater/Ratee, Self-Serving-Bias, Baseline-Error/Neglect (bei Auftretenswahrscheinlichkeiten)
Was ist ein semantisches Differential, und wo kann man es gebrauchen?
- spezifisches Ratingverfahren zur Erfassung von konnotativer Bedeutungen von Objekten (Einordnung eines Begriffes mit zwei sich gegenüberstehenden Adjektiven als Anker, z.B. weich - hart)
- wird zum Beispiel bei Grid-Technik in der Persönlichkeitspsychologie verwendet
Skizzieren Sie kurz den Unterschied zwischen KTT und PTT.
KTT (=Klassische Testtheorie)
- Testergebnis = wahre Merkmalsausprägung bei Person plus unabhängiger/unsystematischer Messfehler --> die meisten Tests beruhen auf KTT
PTT (=Probabilistische Testtheorie)
- Wahrscheinlichkeit einer Itemantwort basiert auf latent vorhandener Merkmalsdimension („Welche Merkmalsausprägung ist bei bestimmten Itemantworten am wahrscheinlichsten?“)
-->Betonung des engen Zusammenhangs zwischen Item-Lösungswahrscheinlichkeit und Person-Fähigkeit: logistische item characteristic curves (s. Abb.)
-->PTT-basierte Tests sind oft besser, da Hintergrundannahmen besser geprüft werden (Tauglichkeit der Items bzgl. ihres diagnostischen Werts)
-->gut nutzbar bei variabler Itemschwierigkeitsowie für adaptives Testen
Was ist der Unterschied zwischen einer Thurstone- vs. Likert-Saka?
Thurstone: Experten erhalten ausgewählte Items zu einer Dimension (z.B. „Ich besuche die Vorlesung nur sehr ungerne“, „Ich schaffe es vor lauter Interesse kaum, am Ende den Saal zu verlassen“) und sollen diese jeweils auf einer Skala von -5 bis +5 (Vorlesung gefällt gar nicht bis Vorlesung gefällt ausgezeichnet) einstufen. Jedes Item erhält so einen Mittelwert (= Skalenwert), Items mit hoher Standardabweichung (z.B. s > 1,5) werden entfernt. Der Wert einer mit dieser Skala getesteten Person entspricht der Summe der Skalenwerte der bejahten Items.
Likert: Behauptungen werden gesammelt und je von Eichstichprobe (statt Experten) bezüglich Skala von 1-5 („trifft eindeutig zu“ … „trifft eindeutig nicht zu“) eingestuft, wenig trennscharfe Items werden aussortiert (ansonsten ähnlich zu Thurstone)
Mit welchen Parametern kann man Testskalengüte und Itemgüte beurteilen?
Testskalengüte:
- interne Konsistenz/Homogenität (Iteminterkorrelation)
- Dimensionalität (z.B. Faktorenanalyse)
Itemgüte:
- Itemschwierigkeit (Anteil korrekter Lösungen)
- Trennschärfe (Korrelation Item-Gesamtscore)
- Cronbach's alpha (= Maß für die interne Konsistenz)
Was ist eine Skalogramm-Analyse?
- Verfahren, das sukzessive überprüft, inwieweit Ja/Nein-Antworten die Forderungen der Eindimensionalität eines Merkmals erfüllen
- erfordert, dass (z.B. zu mind. 90%) eine Person mit höherer Merkmalsausprägung mind. diejenigen Items löst/bejaht, die eine Person mit geringerer Ausprägung löst/bejaht
Welche Entscheidungen muss man bei der Konstruktion einer Befragung treffen?
- Mündlich: Standardisierungsgrad; hart / weich(bzgl. Autorität des Befragers), Face-to-face vs. Telfon; Einzel / Gruppe
- Schriftlich: Fragenauswahl; Fragenformulierung; Fragebogenaufbau; Postalisch / Mail;
Was ist die Delphi-Methode?
= hochstrukturierte Gruppenkommunikation zur Optimierung der Problemlösung (Vorteil gegenüber Gruppendiskussion/Brainstorming durch Anonymisierung der Beiträge und Verhinderung von Priming-Effekten, die zur Beitragseinengung führen)
= systematisches, mehrstufiges Befragungsverfahren mit Rückkopplung und Schätzmethode
Welche Entscheidungen muss man bei der Planung einer Beobachtungsstudie treffen?
- Alttagsbeobachtung vs. systematische Beobachtung (frei/(halb-)standardisiert
- Beobachtungskriterien: Relevanz, Definitionen, Protokoll
- teilnehmend/nicht teilnehmend
- offen/verdeckt
- Selbst-/Fremdbeobachtung
- Ereignis-/Zeitstichprobe
Beschreiben Sie typische Selektionsfehler beim Messen und ihre Konsequenzen.
-Abweichungen von Linearität (--> Möglichkeit bei Auswahl statistischer Modelle und Verfahren beachten)
-Ausreißer (Ursache: Methode der kleinsten Quadrate --> Lösung: Statistik, die nicht auf quadrierten Abweichungen beruht)
-Unterbrochene Verteilung:
Extremgruppen führen zu Überschätzung eines Zusammenhangs (ODER
Range-Einschränkungen können zur Unterschätzung von Effekten führen
(prinzipiell ist auch eine Überschätzung denkbar)
- Einschränkung des Wertebereichs (siehe oben)
- Heterogene Unterstichproben
-
- 1 / 22
-