Στοχαστικές Διεργασίες & Βελτιστοποίηση στη Μηχανική Μάθηση: Δυναμικός Προγραμματισμός με Μεθόδους Monte Carlo

(i) Μάθηση Χρονικών Διαφορών (Temporal-Difference Learning)
(ii) Στοχαστικός Αλγόριθμος Q-Learning

Loading the player...

Βασίλης Μάγκλαρης - maglaris@netmode.ntua.gr

Σχολή Ηλεκτρολόγων Μηχ. & Μηχ. Υπολογιστών Ε.Μ.Π.

Slides