(i) Μάθηση Χρονικών Διαφορών (Temporal-Difference Learning) (ii) Στοχαστικός Αλγόριθμος Q-Learning
Βασίλης Μάγκλαρης - maglaris@netmode.ntua.gr
Σχολή Ηλεκτρολόγων Μηχ. & Μηχ. Υπολογιστών Ε.Μ.Π.
Slides