Vorschauausschnitt. Vollzugang erhalten
Reinforcement Learning 2014 Sutton Barto