Στοχαστικές Διεργασίες & Βελτιστοποίηση στη Μηχανική Μάθηση: Ενισχυτική Μάθηση με Προσεγγιστικές Μεθόδους

(i) Μάθηση Χρονικών Διαφορών, TD (Temporal Difference) Learning
(ii) Στοχαστικός Αλγόριθμος Q-Learning
(iii) Κατανεμημένη Υλοποίηση Ενισχυτικής Μάθησης
(iv) Αλγόριθμος Bellman-Ford, Δρομολόγηση BGP στο Internet

Loading the player...

Βασίλης Μάγκλαρης - maglaris@netmode.ntua.gr

Σχολή Ηλεκτρολόγων Μηχ. & Μηχ. Υπολογιστών Ε.Μ.Π.

Slides