Ενισχυτική Μάθηση με Προσεγγιστικές Μεθόδους – 16/04/2023

(i) Μάθηση Χρονικών Διαφορών, TD Learning, (ii) Στοχαστικός Αλγόριθμος Q Learning, (iii) Κατανεμημένη Υλοποίηση Ενισχυτικής Μάθησης, (iv) Αλγόριθμος Bellman Ford, Δρομολόγηση BGP στο Internet

Loading the player...

Βασίλης Μάγκλαρης - maglaris@netmode.ntua.gr

Σχολή Ηλεκτρολόγων Μηχ. & Μηχ. Υπολογιστών Ε.Μ.Π.

Slides