Monte Carlo Tree Search (MCTS)
MCTS ist ein Planungsalgorithmus, der durch zufällige Simulationen einen Entscheidungsbaum aufbaut und die vielversprechendsten Aktionen identifiziert.
MCTS baut Entscheidungsbäume durch Simulation – die Planungs-Engine hinter AlphaGo, jetzt auch für LLM-Reasoning adaptiert.
Erklärung
MCTS wiederholt vier Schritte: Selection (UCB), Expansion, Simulation (Rollout), Backpropagation. Kombiniert mit Neural Networks (AlphaGo) ersetzt der NN-Value die Simulation.
Relevanz für Marketing
MCTS ist die Planungskomponente von AlphaGo/AlphaZero und wird zunehmend für LLM-Reasoning (Tree-of-Thought) adaptiert.
Häufige Fallstricke
Rechenintensiv bei großen Branching-Faktoren. Qualität hängt von Rollout-Policy ab. Nicht geeignet für Echtzeit-Entscheidungen.
Entstehung & Geschichte
Coulom (2006) und Kocsis & Szepesvári (2006, UCT) führten MCTS ein. AlphaGo (DeepMind, 2016) machte MCTS weltberühmt. AlphaZero (2017) nutzte MCTS + Self-Play ohne menschliche Daten.
Abgrenzung & Vergleiche
Monte Carlo Tree Search (MCTS) vs. Minimax
Minimax durchsucht den gesamten Baum (exakt, aber langsam); MCTS sampelt und fokussiert auf vielversprechende Pfade – skaliert besser.