πιθανότητες / στατιστική

Αναγνώριση και πρόβλεψη σύνθετων γεγονότων με αυτόματα

Τα συστήματα αναγνώρισης γεγονότων δέχονται ως είσοδο ροές δεδομένων επί των οποίων προσπαθούν να εντοπίσουν ενδιαφέροντα μοτίβα, με βάση κάποιους κανόνες που έχει ορίσει ο χρήστης. Τέτοια συστήματα έχουν μελετηθεί και αναπτυχθεί σε διάφορα ερευνητικά πεδία, όπως αυτά της Τεχνητής Νοημοσύνης, των Κατανεμημένων Συστημάτων και της Τεχνολογίας Λογισμικού. Ως επόμενο βήμα μετά την αναγνώριση καθεαυτή θεωρείται και η δυνατότητα για πρόβλεψη γεγονότων πριν αυτά συμβούν κι εντοπιστούν από το σύστημα αναγνώρισης. Σκοπός αυτής της εργασίας είναι η ανάπτυξη ενός συστήματος αναγνώρισης γεγονότων καθώς και πιθανοτικής πρόβλεψής τους. Ως βάση του συστήματος θα χρησιμοποιηθεί ο φορμαλισμός των αυτομάτων και διάφορων παραλλαγών τους, όπως τα συμβολικά αυτόματα.

Αναλόγως των ενδιαφερόντων του φοιτητή, η εργασία μπορεί να κινηθεί προς διάφορες κατευθύνσεις, όπως (ενδεικτικά) οι παρακάτω:

  • Ανάπτυξη ενός μεταγλωττιστή για τη μετάφραση κανόνων σε αυτόματα.
  • Επέκταση των εκφραστικών δυνατοτήτων των συμβολικών αυτομάτων.
  • Εφαρμογή της θεωρίας των μαρκοβιανών αλυσίδων σε συμβολικά αυτόματα.
  • Σύγκριση διαφορετικών συστημάτων πρόβλεψης γεγονότων (π.χ., πιθανοτικά συμβολικά αυτόματα σε σχέση με πιθανοτικά προθεματικά δέντρα).

Ενδεικτική βιβλιογραφία:

Βαθιά μάθηση για την ομαδοποίηση καιρικών δεδομένων

Ο καιρός είναι ένα πολύπλοκο, μη-γραμμικό σύστημα που είναι δύσκολο να αναλυθεί μέσω παραδοσιακών αλγορίθμων μηχανικής μάθησης. Ταυτόχρονα όμως, είναι χρήσιμος σε πληθώρα ερευνητικών και πρακτικών εφαρμογών, όπως στην αντιμετώπιση έκτακτων αναγκών, στην πρόβλεψη συμπεριφοράς κλπ. Ο προσδιορισμός αντιπροσωπευτικών τύπων καιρού βάσει αλγορίθμων βαθιάς μάθησης έχει αποδειχθεί αποτελεσματικός σε ορισμένες εφαρμογές, αλλά χρειάζεται περισσότερη εργασία για να επιτευχθεί μια πιο γενική και παραμετροποιήσιμη λύση.

Αυτή η εργασία θα μελετήσει την εφαρμογή τεχνικών βαθιάς μάθησης για την ομαδοποίηση καιρικών δεδομένων, βασιζόμενη σε προηγούμενες εργασίες που έχουν διεξαχθεί στο ΕΚΕΦΕ «Δημόκριτος». Θα υποδείξει και θα υλοποιήσει νέες προσεγγίσεις στο πρόβλημα λαμβάνοντας υπόψη τη γεωγραφική θέση καθώς και τα χρονικά χαρακτηριστικά του καιρού. Θα υλοποιήσει πρωτότυπα μοντέλα και θα τεκμηριώσει την αποτελεσματικότητά τους χρησιμοποιώντας καιρικά δεδομένα μεγάλης κλίμακας.

Automated evaluation of generated headlines

This project deals with developing a platform for the automated evaluation of headlines. The platform will contain several metrics, which will give a score for each generated headline given its document and gold-standard headlines (manually created). The platform may include existing metrics (like Rouge), extended metrics (which integrate several existing approaches and based on the existing ones), and novel metrics (which will be elaborated during the project).

Additional Keywords: Headline generation, ROUGE, text similarity, summarization, KL-divergence, VSM, word embedding

Επεξεργασία Υπέρυθρων Υπερφασματικών Εικόνων

Αυτή η εργασία αποτελεί μια εφαρμογή μεθόδων τηλεπισκόπησης. Συγκεκριμένα θα γίνει ανάλυση υπερφασματικών δεδομένων Long-Wavelength Infrared (LWIR 7,8–11,5 µm) σε συνδυασμό με ορθοφωτογραφίες (RGB) υψηλής ανάλυσης (τής ίδιας περιοχής). Δίνονται και περιοχές με γνωστή ταξινόμηση (training/evaluation sets).
Η εργασία περιλαμβάνει βιβλιογραφική έρευνα μεθόδων supervised classification, επεξεργασία δεδομένων με προγράμματα GIS ή/και MATLAB και επιλογή συνδυασμού μεθόδων για την καλύτερη ταξινόμηση.
Εφόσον τα αποτελέσματα παρουσιάζουν ενδιαφέρον, η εργασία θα δημοσιευθεί σε διεθνές επιστημονικό περιοδικό ή συνέδριο.

Υπολογισμός και ανάλυση τιμών εδαφικής υγρασίας

Η υγρασία του έδάφους είναι απαραίτητη παράμετρος στα συστήματα πρόγνωσης πλημμυρών και ξηρασίας καθώς και στα μοντέλα εκτίμησης υδρολογικών παραμέτρων. Το SMOS (Soil Moisture and Ocean Salinity) δορυφορικό σύστημα καταγράφει την ‘θερμοκρασία φωτεινότητας’, που αντιστοιχεί στην εκπεμπόμενη ακτινοβολία των μικροκυμάτων η οποία μπορεί να συσχετιστεί με την υγρασία του εδάφους
Αντικείμενο της εργασίας είναι η επεξεργασία εικόνων SMOS για τον υπολογισμό της εδαφικής υγρασίας πριν και μετά την εμφάνιση πλημμυρικών φαινομένων.

Κατηγοριοποίηση βιολογικών δεδομένων χρησιμοποιώντας τεχνικές μεταφοράς μάθησης

Ένα από τα ανοιχτά προβλήματα της βιοπληροφορικής, είναι η αυτόματη πρόβλεψη γονιδίων (αλληλουχία νουκλεοτιδίων που κωδικοποιεί πρωτεΐνες). Πιο συγκεκριμένα, οι ερευνητές προσπαθούν να προβλέψουν τις θέσεις που αντιστοιχούν στην αρχή και το τέλος των γονιδίων σε ένα γονιδίωμα. Οι θέσεις αυτές είναι γνωστές ως σήματα ματίσματος (splice sites). Διάφορες τεχνικές της μηχανικής μάθησης έχουν χρησιμοποιηθεί για το συγκεκριμένο πρόβλημα. Παρόλα αυτά, η απόκτηση των επισημειωμένων δεδομένων που είναι αναγκαία για να εφαρμοστούν οι τεχνικές επιβλεπόμενης μάθησης, αποτελεί μια σημαντική πρόκληση, καθώς το κόστος είναι πολύ μεγάλο. Μία από τις προσεγγίσεις για την αντιμετώπιση αυτού του προβλήματος είναι η μεταφορά μάθησης (transfer learning). Στόχος της παρούσας εργασίας είναι η εφαρμογή και επέκταση τεχνικών μεταφοράς μάθησης σε βιολογικά δεδομένα, με στόχο την εύρεση των λεγόμενων σημάτων ματίσματος (splice sites) σε έναν οργανισμό, έχοντας δεδομένα εκπαίδευσης από κάποιον διαφορετικό οργανισμό.

Ανάπτυξη στοχαστικού συστήματος αναγνώρισης γεγονότων από δεδομένα

Τα συστήματα αναγνώρισης συμβολικών γεγονότων/συμπεριφορών από δεδομένα έχουν μελετηθεί και αναπτυχθεί σε διάφορα ερευνητικά πεδία, όπως αυτά της Τεχνητής Νοημοσύνης, των Κατανεμημένων Συστημάτων και της Τεχνολογίας Λογισμικού. Για παράδειγμα, έχουν αναπτυχθεί συστήματα που επιβλέπουν την λειτουργία μέσων μαζικής μεταφοράς και αναγνωρίζουν “ενδιαφέρουσες” συμπεριφορές που λαμβάνουν χώρα, όπως η οδήγηση ενος λεωφορείου με μη οικολογικό τρόπο. Τα δεδομένα εισόδου ενος συστήματος αναγνώρισης γεγονότων προέρχονται απο διάφορους αισθητήρες (π.χ. κάμερες, μικρόφωνα, θερμόμετρα, αισθητήρες θέσης, κλπ.) οι οποίοι συχνά παρουσιάζουν σφάλματα. Συνεπώς, τα δεδομένα εισόδου είναι πολύ συχνά εσφαλμένα ή ελλειπή. Για να αντιμετωπιστεί αυτό το πρόβλημα, στο πλαίσιο της εργασίας θα αναπτυχθεί στοχαστικό σύστημα αναγνώρισης γεγονότων.

Ενδεικτική Βιβλιογραφία:

Skarlatidis A., Artikis A., Filippou J. and Paliouras G. A Probabilistic Logic Programming Event Calculus, Journal of Theory and Practice of Logic Programming (TPLP), 2014.
http://users.iit.demokritos.gr/~a.artikis/publications/artikis-TPLP.pdf

Syndicate content

© 2018 - Institute of Informatics and Telecommunications | National Centre for Scientific Research "Demokritos"

Terms of Service and Privacy Policy