Question 1

Was ist Self-Play?

Accepted Answer

Self-Play ist eine RL-Trainingsmethode, bei der ein Agent gegen Kopien seiner selbst spielt, um durch Wettbewerb stetig besser zu werden. Der Agent generiert seine eigenen Trainings-Gegner, die mit ihm mitwachsen. Dies erzeugt einen natürlichen Curriculum von einfach zu schwer und kann zu übermenschlicher Leistung führen.

Question 2

Wie funktioniert Self-Play?

Accepted Answer

Der Agent generiert seine eigenen Trainings-Gegner, die mit ihm mitwachsen. Dies erzeugt einen natürlichen Curriculum von einfach zu schwer und kann zu übermenschlicher Leistung führen.

Question 3

Warum ist Self-Play wichtig für Marketing?

Accepted Answer

Self-Play ermöglichte AlphaGo/AlphaZero und wird zunehmend für LLM-Training genutzt (Debate, Constitutional AI).

Question 4

Was sind häufige Fehler bei Self-Play?

Accepted Answer

Kann in lokalen Optima steckenbleiben (Rock-Paper-Scissors-Zyklen). Nicht-transitive Strategien. Hoher Compute-Bedarf.

Question 5

Woher kommt Self-Play?

Accepted Answer

Tesauro (1995, TD-Gammon) war ein früher Erfolg. AlphaGo (DeepMind, 2016) und AlphaZero (2017) demonstrierten Self-Play in Go, Schach und Shogi. OpenAI Five (2019) für Dota 2.

Question 6

Was ist der Unterschied zwischen Self-Play und Reinforcement Learning?

Accepted Answer

Self-Play und Reinforcement Learning sind verwandte Konzepte im Bereich der KI und des Marketings. Self-Play ist eine RL-Trainingsmethode, bei der ein Agent gegen Kopien seiner selbst spielt, um durc...

Self-Play

Erklärung

Relevanz für Marketing

Häufige Fallstricke

Entstehung & Geschichte

Abgrenzung & Vergleiche

Self-Play vs. Supervised Learning from Games

Weiterführende Ressourcen

Verwandte Services

Verwandte Begriffe