Wie Selbstlernende System ticken

Reinforcement Learning steht für verstärkendes Lernen und beflügelt die Phantasie in Bezug auf humanoïden Robotern, welche künftig die Welt beherrschen. Davon sind wir aber weit entfernt. Bekannt wurde diese Technik durch Siege von Computern gegen Weltmeister im Schach- und Go-Spiel. Robotik ist in der Industrie bereits lange ein Thema. Heute ist Deep Reinforcement Learning eine der führenden Methoden für die Umsetzung dieses Themas in der Praxis. Man denke nur an das autonome Fahren. Dabei werden Gigabytes an Daten – generiert von zahlreichen Sensoren – in Echtzeit verarbeitet, um die notwendigen Entscheidungen zu treffen. Wir werden - mithilfe der OpenAI Gym Bibliothek - abschließend ein klassisches Problem aus der Regelungstechnik lösen.