HSLU DL4G HS20
Deeplearning 4 Games HS20; Special Thanks to: Cyrille Ulmi
Deeplearning 4 Games HS20; Special Thanks to: Cyrille Ulmi
124
0.0 (0)
Set of flashcards Details
Flashcards | 124 |
---|---|
Language | Deutsch |
Category | Computer Science |
Level | University |
Created / Updated | 22.01.2021 / 09.01.2023 |
Licencing | Not defined |
Weblink |
https://card2brain.ch/box/20210122_hslu_dl4g_hs20
|
Embed |
<iframe src="https://card2brain.ch/box/20210122_hslu_dl4g_hs20/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was sind die Eigenschaften von endlichen-sequenziellen Spielen?
- Eine endliche Anzahl Spieler mit einer endlichen Anzahl Aktionen
- Die Aktionen werden sequenziell ausgewählt
- Es wird eine endliche Anzahl Runden gespielt
- Spätere Spieler sehen die Aktionen vorheriger Spieler
Wieso werden Random Walks eingesetzt? (Tree Search)
- Der Suchraum ist oft zu gross für eine vollständige Suche
- Die Idee, verglichen zu Minimax, ist, bei einer bestimmten Tiefe zu stoppen und zu raten
Was ist ein Information Set?
- Ein Information Set ist eine Menge von Knoten des gleichen Spielers
- Der Spieler kennt den vorherigen Zug nicht
- Alle Knoten müssen die gleichen Optionen bieten
- Sind immer aus der Sicht eines Spielers
Was ist die Idee hinter Monte Carlo Tree Search?
- Macht einen Random Walk und spielt zufällige Simulationen
- Versucht, in einer fixen Zeit möglichst viel des Suchraums zu entdecken
- Am Schluss wird der vielversprechendste Spielzug ausgewählt
War wird unter Perfect Recall verstanden?
Perfekte Erinnerung an alle vorherigen Züge
Welche 4 Phasen gibt es bei Monte Carlo Tree Search?
- Selection
- Expansion
- Simulation
- Backpropagation
Was ist der Unterschied zwischen perfekter und imperfekter Information?
- Unterschiedliche Strategien werden gewählt
- Bei perfekter Information hat jeder Knoten exakt eine Option
Was passiert in der Selection Phase des Monte Carlo Tree Search
- Starte beim Wurzelknoten R und wähle fortlaufend Kinderknoten
- Stoppe, wenn du einen Knoten erreichst, der noch nicht komplett erweitert/erforscht wurde
- Benötigt ein Kriterum für die Auswahl der Kinderknoten, sogennante tree policy