Lernkartei Vorlesung Methoden 6

Karten	22
Sprache	Deutsch
Kategorie	Psychologie
Stufe	Universität
Erstellt / Aktualisiert	18.01.2020 / 04.02.2023
Weblink	https://card2brain.ch/box/20200118_vorlesung_methoden_6_wise
Einbinden	<iframe src="https://card2brain.ch/box/20200118_vorlesung_methoden_6_wise/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Geben Sie jeweils Beispiele, mit welchen Parametern man die drei Hauptgütekriterien messbar machen kann.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

- Objektivität: Standardisierung der Durchführung, Auswertung und Interpretation

- Reliabilität: Konsistenzkoeffizienten, Paralleltest-Koeffizienten, Retest-Koeffizienten

- Validität: z.B. Kriteriumsvalidität (Vorhersage und Übereinstimmung)

Nennen Sie fünf grundsätzliche Möglichkeiten der quantitativen Messung.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

- Zählen

- Urteilen

- Testen

- Befragen

- Beobachten

Was versteht man unter Indexbildung und welche Möglichkeiten hierbei gibt es?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Messwert für komplexes Merkmal (z.B. Aufsatzqualität bestehend aus verschiedenen Teilmerkmalen wie Rechtschreibung, Ausdruck, Inhalt etc.): gewichtet/ungewichtet, additiv/multiplikativ etc.

Geben Sie Beispiele für Bereiche, bei denen menschliche Urteile valider als apparative Messergebnisse sein können.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Stimmqualität, Weinqualität, künstlerisches Vermögen

Nennen und beschreiben Sie drei Rangordnungsverfahren.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

1. Direkte Rangordnung (mit oder ohne Verbundränge): schwierig bei vielen Objekten, weniger genau als Paarvergleich

2. Methode der sukzessiven Intervalle: wenn zu viele Objekte --> in Untergruppen sortieren lassen

3. Law of categorial judgement: Nimmt (normalverteilte) Fluktuationen von Beurteilungen an: schwankende Rangkategoriegrenzen
- Verfahren: mehrere Rangurteile erheben (within/between subjects), z-standardisierte relative Häufigkeiten lassen sich dann sogar in Intervallskalenniveau „hochskalieren“

Welcher Verfahrensunterschied besteht zwischen law of categorial vs. comparative judgement? Was ist beiden Verfahren gemeinsam?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Law of comparative judgement (Thurstone, 1927):
Annahme: Empfindungsstärken um wahren Wert normalverteilt
Erstellung einer Intervallskala über z-standardisierte relative Häufigkeiten (kleinster z-Wert wird auf Null gesetzt)

Unterschiede:

- einmal Beurteilungen und einmal Empfindungsstärken

- letzteres basierend auf Paarvergleich und ersters auf Rangordnungen

- letzteres: Präferenzhäufigkeiten werden in relative Häufigkeiten transformiert und diese in z-Werte

Wie kommt man beim Dominanzpaarvergleich zu indirekten Rangordnungen?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Dominanzpaarvergleich: Vorlage von je zwei Objekten: „Welches dominiert (hinsichtlich eines Merkmals, z.B. Schönheit)?“

--> Dominanzmatrix

Optimal: vollständiger Paarvergleich

Nachteil: kann bei vielen Objekten ausufern, besonders „mit Messwiederholung“ bzgl. individueller Paarvergleiche

indirekte Rangordnung --> ergibt sich aus Anzahl der „Dominanzen“, verlässlicher als direkte Rangordnung

Was sind zirkuläre Triaden bzw. intransitive Urteile?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

- zirkuläre Triaden: (A>B, B>C, aber C>A)

- intransitive Urteile (A>B, aber B>A)

Welcher Unterschied besteht zwischen Konkordanz und Konsistenz?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Konsistenz: Widerspruchsfreiheit der Einzelurteile eines Beurteilers

Konkordanz: Übereinstimmung zwischen Beurteilern

Wie funktioniert prinzipiell ein Ähnlichkeitspaarvergleich, und was ist der prinzipielle Unterschied zum Dominanzpaarvergleich?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

- Ähnlichkeitspaarvergleich: Beurteilt werden soll globale Ähnlichkeit zwischen zwei Objekten (oder Paaren von Objekten), um relevante Merkmalsdimensionen nicht vorwegzunehmen, sondern erst zu extrahieren, z.B. MDS (mehrdimensionale Skalierung), NMDS (non-metrische MDS)
Beispiel: Ähnlichkeitsurteile bzgl. Berufe ergibt dreidimensionale Struktur (Unabhängigkeit, Prestige, Skill)

- Unterschied zum Dominanzpaarvergleich: Nicht Ähnlichkeit, sondern Dominanz hinsichtlich eines Merkmals steht im Vordergrund

Warum zählt die SDT zu den Urteilsverfahren?

SDT als Urteilsverfahren zur Trennung von sensorischer Diskriminationsfähigkeit (d‘) und Reaktionsschwelle (bias)

Welche Entscheidungen muss man bei der Konstruktion von Ratingskalen treffen?

- uni - oder bipolar

- Verankerung: numerisch/verbal/symbolisch

- graphisches Rating?

- Stufenanzahl (viel/wenig, gerade/ungerade)

Inwiefern müssen bei Ratingskalen Urteilsfehler beachtet werden?

Halo-Effekt, Milde/Härte, Extrem- oder zentrale Tendenz, Primacy/Recency, Ähnlichkeit/Kontrast zwischen Rater/Ratee, Self-Serving-Bias, Baseline-Error/Neglect (bei Auftretenswahrscheinlichkeiten)

Was ist ein semantisches Differential, und wo kann man es gebrauchen?

- spezifisches Ratingverfahren zur Erfassung von konnotativer Bedeutungen von Objekten (Einordnung eines Begriffes mit zwei sich gegenüberstehenden Adjektiven als Anker, z.B. weich - hart)

- wird zum Beispiel bei Grid-Technik in der Persönlichkeitspsychologie verwendet

Skizzieren Sie kurz den Unterschied zwischen KTT und PTT.

KTT (=Klassische Testtheorie)

- Testergebnis = wahre Merkmalsausprägung bei Person plus unabhängiger/unsystematischer Messfehler --> die meisten Tests beruhen auf KTT

PTT (=Probabilistische Testtheorie)

- Wahrscheinlichkeit einer Itemantwort basiert auf latent vorhandener Merkmalsdimension („Welche Merkmalsausprägung ist bei bestimmten Itemantworten am wahrscheinlichsten?“)
-->Betonung des engen Zusammenhangs zwischen Item-Lösungswahrscheinlichkeit und Person-Fähigkeit: logistische item characteristic curves (s. Abb.)
-->PTT-basierte Tests sind oft besser, da Hintergrundannahmen besser geprüft werden (Tauglichkeit der Items bzgl. ihres diagnostischen Werts)
-->gut nutzbar bei variabler Itemschwierigkeitsowie für adaptives Testen

Was ist der Unterschied zwischen einer Thurstone- vs. Likert-Saka?

Thurstone: Experten erhalten ausgewählte Items zu einer Dimension (z.B. „Ich besuche die Vorlesung nur sehr ungerne“, „Ich schaffe es vor lauter Interesse kaum, am Ende den Saal zu verlassen“) und sollen diese jeweils auf einer Skala von -5 bis +5 (Vorlesung gefällt gar nicht bis Vorlesung gefällt ausgezeichnet) einstufen. Jedes Item erhält so einen Mittelwert (= Skalenwert), Items mit hoher Standardabweichung (z.B. s > 1,5) werden entfernt. Der Wert einer mit dieser Skala getesteten Person entspricht der Summe der Skalenwerte der bejahten Items.

Likert: Behauptungen werden gesammelt und je von Eichstichprobe (statt Experten) bezüglich Skala von 1-5 („trifft eindeutig zu“ … „trifft eindeutig nicht zu“) eingestuft, wenig trennscharfe Items werden aussortiert (ansonsten ähnlich zu Thurstone)

Mit welchen Parametern kann man Testskalengüte und Itemgüte beurteilen?

Testskalengüte:

- interne Konsistenz/Homogenität (Iteminterkorrelation)

- Dimensionalität (z.B. Faktorenanalyse)

Itemgüte:

- Itemschwierigkeit (Anteil korrekter Lösungen)

- Trennschärfe (Korrelation Item-Gesamtscore)

- Cronbach's alpha (= Maß für die interne Konsistenz)

Was ist eine Skalogramm-Analyse?

- Verfahren, das sukzessive überprüft, inwieweit Ja/Nein-Antworten die Forderungen der Eindimensionalität eines Merkmals erfüllen

- erfordert, dass (z.B. zu mind. 90%) eine Person mit höherer Merkmalsausprägung mind. diejenigen Items löst/bejaht, die eine Person mit geringerer Ausprägung löst/bejaht

Welche Entscheidungen muss man bei der Konstruktion einer Befragung treffen?

- Mündlich: Standardisierungsgrad; hart / weich(bzgl. Autorität des Befragers), Face-to-face vs. Telfon; Einzel / Gruppe

- Schriftlich: Fragenauswahl; Fragenformulierung; Fragebogenaufbau; Postalisch / Mail;

Was ist die Delphi-Methode?

= hochstrukturierte Gruppenkommunikation zur Optimierung der Problemlösung (Vorteil gegenüber Gruppendiskussion/Brainstorming durch Anonymisierung der Beiträge und Verhinderung von Priming-Effekten, die zur Beitragseinengung führen)

= systematisches, mehrstufiges Befragungsverfahren mit Rückkopplung und Schätzmethode

Welche Entscheidungen muss man bei der Planung einer Beobachtungsstudie treffen?

- Alttagsbeobachtung vs. systematische Beobachtung (frei/(halb-)standardisiert

- Beobachtungskriterien: Relevanz, Definitionen, Protokoll

- teilnehmend/nicht teilnehmend

- offen/verdeckt

- Selbst-/Fremdbeobachtung

- Ereignis-/Zeitstichprobe

Beschreiben Sie typische Selektionsfehler beim Messen und ihre Konsequenzen.

-Abweichungen von Linearität (--> Möglichkeit bei Auswahl statistischer Modelle und Verfahren beachten)

-Ausreißer (Ursache: Methode der kleinsten Quadrate --> Lösung: Statistik, die nicht auf quadrierten Abweichungen beruht)

-Unterbrochene Verteilung:

Extremgruppen führen zu Überschätzung eines Zusammenhangs (ODER

Range-Einschränkungen können zur Unterschätzung von Effekten führen
(prinzipiell ist auch eine Überschätzung denkbar)

- Einschränkung des Wertebereichs (siehe oben)

- Heterogene Unterstichproben

Vorlesung Methoden 6 - WiSe

Lernkarteien erstellen oder kopieren

Lernkarteien erstellen oder kopieren

Melde dich an, um alle Karten zu sehen.

SWITCHaai

Office 365

Edulog

Apple ID

Google