Κατανεμημένη Στατιστική Σχεσιακή Μάθηση από Χρονικά Δεδομένα με χρήση του Parameter Server

  • MScBSc
  • Γνώσεις τεχνικών μηχανικής μάθησης, πολύ καλές γνώσεις προγραμματισμού.
  • Γνώσεις αναπαράστασης γνώσης και συμπερασμού.
  • Alexandros Artikis Nikos Katzouris George Paliouras
  • a.artikis [at] iit.demokritos.gr
  • Complex Event Recognition

Η Στατιστική Σχεσιακή Μάθηση (Statistical Relational Learning) συνδυάζει τη λογική με τη θεωρία πιθανοτήτων και τις τεχνικές της μηχανικής μάθησης με σκοπό την αυτόματη κατασκευή μοντέλων πρόβλεψης από δεδομένα, τα οποία είναι κατανοητά από ανθρώπους και επιτρέπουν την εξαγωγή νέας γνώσης από τα δεδομένα, ενώ ταυτόχρονα είναι ανθεκτικά στο θορύβο και την αβεβαιότητα. Τέτοια μοντέλα έχουν συνήθως τη μορφή μιας λογικής θεωρίας (συνόλου λογικών κανόνων), όπου ο κάθε κανόνας έχει μια παράμετρο/βάρος, αντιπροσωπευτικό της ποιότητάς του, δηλαδή της συνεισφοράς του στην προβλεπτική ισχύ του μοντέλου. Σε αντίθεση με τις κλασικές μεθόδους μηχανικής μάθησης, όπου συνήθως έχουμε ένα σταθερό σύνολο χαρακτηριστικών (features) και θέλουμε να βελτιστοποιήσουμε τις παραμέτρους ενός μοντέλου που συνδυάζει αυτά τα χαρακτηριστικά για να κάνει προβλέψεις, στην Στατιστική Σχεσιακή Μάθηση το ζητούμενο είναι η ταυτόχρονη εκμάθηση της δομής του μοντέλου (των λογικών κανόνων) και των παραμέτρων του (των βαρών των κανόνων), συνδυάζοντας μεθόδους μάθησης λογικής δομής, με μεθόδους βελτιστοποίησης παραμέτρων από το χώρο του statistical & deep learning, όπως π.χ. διάφορες εκδοχές του Gradient Descent. Η κλιμάκωση των βασικών μεθόδων της Στατιστικής Σχεσιακής Μάθησης στους τεράστιους όγκους δεδομένων, ή ακόμη και σε ροές (streams) δεδομένων, που χαρακτηρίζουν πολλές πραγματικές εφαρμογές, απαιτεί την ανάπτυξη μεθόδων κατανεμηνέμης μάθησης, ικανών να διαμοιράζουν τον υπολογιστικό φόρτο σε πολλούς επεξεργαστικούς κόμβους. Σκοπός της προτεινόμενης εργασίας είναι η μελέτη του συνδυασμού του Parameter Server, μιας πολύ διαδεδομένης, κυρίως στο χώρο του deep learning, προσέγγισης στην κατανεμημένη βελτιστοποίηση των παραμέτρων ενός μοντέλου, με υπάρχουσες μεθόδους Στατιστικής Σχεσιακής Μάθησης. Στόχος είναι η κλιμάκωση υπάρχοντων τεχνικών μάθησης σε μεγάλους όγκους/ροές δυναμικών δεδομένων χρονικής φύσης. Ένα παράδειγμα εφαρμογής που θα μελετηθεί στη διάρκεια της εργασίας είναι η εποπτεία θαλάσσιων περιοχών μέσω κατανεμημένης κατασκευής μοντέλων μηχανικής μάθησης από ροές δεδομένων στιγμάτων πλοίων (vessel position signals), με στόχο την πρόβλεψη/αποφυγή ατυχημάτων και την ταυτοποίηση παράνομων ενεργειών στην ανοιχτή θάλασσα.

 

Ενδεικτική Βιβλιογραφία:

– Katzouris N, Michelioudakis E., Artikis A. and Paliouras G., (2018) Online Learning of Weighted Relational Rules for Complex Event Recognition, European Conference on Machine Learning (ECML-PKDD).

– Katzouris N., Artikis A. and Paliouras G. (2019), Parallel Online Event Calculus Learning for Complex Event Recognition, Future Generation Computer Systems, Vol. 94, pp. 468-478.

– Li, Mu, et al., Scaling distributed machine learning with the parameter server (2014) 11th Symposium on Operating Systems Design and Implementation.

Skip to content