Premium Partner

HSLU DL4G HS20

Deeplearning 4 Games HS20; Special Thanks to: Cyrille Ulmi

Deeplearning 4 Games HS20; Special Thanks to: Cyrille Ulmi


Set of flashcards Details

Flashcards 124
Language Deutsch
Category Computer Science
Level University
Created / Updated 22.01.2021 / 09.01.2023
Licencing Not defined
Weblink
https://card2brain.ch/box/20210122_hslu_dl4g_hs20
Embed
<iframe src="https://card2brain.ch/box/20210122_hslu_dl4g_hs20/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was sind die Eigenschaften von endlichen-sequenziellen Spielen?

  • Eine endliche Anzahl Spieler mit einer endlichen Anzahl Aktionen
  • Die Aktionen werden sequenziell ausgewählt
  • Es wird eine endliche Anzahl Runden gespielt
  • Spätere Spieler sehen die Aktionen vorheriger Spieler
     

Wieso werden Random Walks eingesetzt? (Tree Search)
 

  • Der Suchraum ist oft zu gross für eine vollständige Suche
  • Die Idee, verglichen zu Minimax, ist, bei einer bestimmten Tiefe zu stoppen und zu raten
     

Was ist ein Information Set?

  • Ein Information Set ist eine Menge von Knoten des gleichen Spielers
  • Der Spieler kennt den vorherigen Zug nicht
  • Alle Knoten müssen die gleichen Optionen bieten
  • Sind immer aus der Sicht eines Spielers
     

Was ist die Idee hinter Monte Carlo Tree Search?
 

  • Macht einen Random Walk und spielt zufällige Simulationen
  • Versucht, in einer fixen Zeit möglichst viel des Suchraums zu entdecken
  • Am Schluss wird der vielversprechendste Spielzug ausgewählt
     

War wird unter Perfect Recall verstanden?

Perfekte Erinnerung an alle vorherigen Züge

Welche 4 Phasen gibt es bei Monte Carlo Tree Search?

  1. Selection
  2. Expansion
  3. Simulation
  4. Backpropagation
     

Was ist der Unterschied zwischen perfekter und imperfekter Information?
 

  • Unterschiedliche Strategien werden gewählt
  • Bei perfekter Information hat jeder Knoten exakt eine Option
     

Was passiert in der Selection Phase des Monte Carlo Tree Search

  • Starte beim Wurzelknoten R und wähle fortlaufend Kinderknoten
  • Stoppe, wenn du einen Knoten erreichst, der noch nicht komplett erweitert/erforscht wurde
  • Benötigt ein Kriterum für die Auswahl der Kinderknoten, sogennante tree policy