Reinforcement Learning – Belohnung maximieren und Verlust minimieren. Es gibt Belohnungen und Verluste, die mit Aktionen (Zuständen, dem, was gerade passiert) verbunden sind.