μηχανική μάθηση

Εκτίμηση τρισδιάστατης θέσης αντικειμένου για αλληλεπίδραση με ρομποτικό βραχίονα.

Η αλληλεπίδραση ενός ρομποτικού βραχίονα με αντικείμενα στο περιβάλλον του εξαρτάται από την αναγνώριση και τον εντοπισμό της θέσης των αντικειμένων. Απώτερος στόχος της αποτύπωσης των αντικειμένων στο χώρο είναι η εξεύρεση κατάλληλης κίνησης από το βραχίονα για την προσέγγιση του επιθυμητού αντικειμένου, η αλληλεπίδραση του βραχίονα με αυτό καθώς και η αποφυγή άλλων αντικειμένων. Σκοπός της εργασίας είναι η ολοκλήρωση υπαρχόντων μεθόδων που βασίζονται αποκλειστικά σε πληροφορία από RGBD κάμερες με το ROS (Robot Operating System).

Η εργασία δίνει την ευκαιρία στον φοιτητή να χρησιμοποιήσει εξαιρετικά προηγμένες ρομποτικές πλατφόρμες και να πειραματιστεί με τεχνολογίες αιχμής στην ρομποτική. Επιπλέον, θα του δοθεί η ευκαιρία να εξοικειωθεί με την συλλογή και επεξεργασία δεδομένων.

Απαιτείται καθημερινή παρουσία στο ΕΚΕΦΕ Δημόκριτος, εργάσιμες ημέρες και ώρες, κατά την διάρκεια της πειραματικής φάσης της εργασίας.

Εκτίμηση θέσης και πορείας χεριού για συνεργασία ανρθρώπου-ρομπότ.

Η ασφαλής και αποδοτική συνεργασία ανρθώπου-ρομπότ (Human-Robot Collaboration) απαιτεί την εκτίμηση θέσης και πορείας του ανθρώπινου χεριού. Παρά την εξέλιξη των σχετικών μεθόδων σε εφαρμογές όπως: εικονική πραγματικότητα, αναγνώριση κινήσεων στη νοηματική, αποκατάσταση ασθενών και ρομποτική, η εκτίμηση της θέσης και της πορείας του χεριού παραμένει ένα δύσκολο πρόβλημα, ειδικά αν η πρωτογενής πληροφορία προέρχεται μόνο από RGBD κάμερες. Σκοπός της εργασίας είναι ανάπτυξη σχετικών μεθόδων και η ολοκλήρωσή τους στο περιβάλλον του ROS (Robot Operating System).

Η διπλωματική δίνει την ευκαιρία στον φοιτητή να χρησιμοποιήσει εξαιρετικά προηγμένες ρομποτικές πλατφόρμες και να πειραματιστεί με τεχνολογίες αιχμής στην ρομποτική. Επιπλέον, θα του δοθεί η ευκαιρία να εξοικειωθεί με την συλλογή και επεξεργασία δεδομένων που αφορούν την ανθρώπινη συμπεριφορά.

Απαιτείται καθημερινή παρουσία στο ΕΚΕΦΕ Δημόκριτος, εργάσιμες ημέρες και ώρες, κατά την διάρκεια της πειραματικής φάσης της διπλωματικής.

Automatic Summarization of Game Reviews

The goals of this project is to parse all user reviews of an online game publishing platform for a particular game, and to produce a human-readable summary. Beyond standard methods for evaluating the consistency or readability of the summaries, comparisons of summaries of different games (e.g. within the same genre, in different genres, between games with overwhelmingly positive or overwhelmingly negative reviews). The project can be further expanded by producing summaries of user reviews of all games within the same genre (or having the same tags), or by using Steam's built-in game evaluation (e.g. Overwhelmingly Negative) to influence the tone and focus of the review.

Αναγνώριση και πρόβλεψη σύνθετων γεγονότων με αυτόματα

Τα συστήματα αναγνώρισης γεγονότων δέχονται ως είσοδο ροές δεδομένων επί των οποίων προσπαθούν να εντοπίσουν ενδιαφέροντα μοτίβα, με βάση κάποιους κανόνες που έχει ορίσει ο χρήστης. Τέτοια συστήματα έχουν μελετηθεί και αναπτυχθεί σε διάφορα ερευνητικά πεδία, όπως αυτά της Τεχνητής Νοημοσύνης, των Κατανεμημένων Συστημάτων και της Τεχνολογίας Λογισμικού. Ως επόμενο βήμα μετά την αναγνώριση καθεαυτή θεωρείται και η δυνατότητα για πρόβλεψη γεγονότων πριν αυτά συμβούν κι εντοπιστούν από το σύστημα αναγνώρισης. Σκοπός αυτής της εργασίας είναι η ανάπτυξη ενός συστήματος αναγνώρισης γεγονότων καθώς και πιθανοτικής πρόβλεψής τους. Ως βάση του συστήματος θα χρησιμοποιηθεί ο φορμαλισμός των αυτομάτων και διάφορων παραλλαγών τους, όπως τα συμβολικά αυτόματα.

Αναλόγως των ενδιαφερόντων του φοιτητή, η εργασία μπορεί να κινηθεί προς διάφορες κατευθύνσεις, όπως (ενδεικτικά) οι παρακάτω:

  • Ανάπτυξη ενός μεταγλωττιστή για τη μετάφραση κανόνων σε αυτόματα.
  • Επέκταση των εκφραστικών δυνατοτήτων των συμβολικών αυτομάτων.
  • Εφαρμογή της θεωρίας των μαρκοβιανών αλυσίδων σε συμβολικά αυτόματα.
  • Σύγκριση διαφορετικών συστημάτων πρόβλεψης γεγονότων (π.χ., πιθανοτικά συμβολικά αυτόματα σε σχέση με πιθανοτικά προθεματικά δέντρα).

Ενδεικτική βιβλιογραφία:

Βαθιά μάθηση για την ομαδοποίηση καιρικών δεδομένων

Ο καιρός είναι ένα πολύπλοκο, μη-γραμμικό σύστημα που είναι δύσκολο να αναλυθεί μέσω παραδοσιακών αλγορίθμων μηχανικής μάθησης. Ταυτόχρονα όμως, είναι χρήσιμος σε πληθώρα ερευνητικών και πρακτικών εφαρμογών, όπως στην αντιμετώπιση έκτακτων αναγκών, στην πρόβλεψη συμπεριφοράς κλπ. Ο προσδιορισμός αντιπροσωπευτικών τύπων καιρού βάσει αλγορίθμων βαθιάς μάθησης έχει αποδειχθεί αποτελεσματικός σε ορισμένες εφαρμογές, αλλά χρειάζεται περισσότερη εργασία για να επιτευχθεί μια πιο γενική και παραμετροποιήσιμη λύση.

Αυτή η εργασία θα μελετήσει την εφαρμογή τεχνικών βαθιάς μάθησης για την ομαδοποίηση καιρικών δεδομένων, βασιζόμενη σε προηγούμενες εργασίες που έχουν διεξαχθεί στο ΕΚΕΦΕ «Δημόκριτος». Θα υποδείξει και θα υλοποιήσει νέες προσεγγίσεις στο πρόβλημα λαμβάνοντας υπόψη τη γεωγραφική θέση καθώς και τα χρονικά χαρακτηριστικά του καιρού. Θα υλοποιήσει πρωτότυπα μοντέλα και θα τεκμηριώσει την αποτελεσματικότητά τους χρησιμοποιώντας καιρικά δεδομένα μεγάλης κλίμακας.

Σημασιολογική βαθιά μάθηση (2 εργασίες)

Η βαθιά μάθηση (deep learning) είναι μια μεθοδολογία μηχανικής μάθησης (machine learning) που επικεντρώνεται στην ανάπτυξη βαθιών νευρωνικών δικτύων. Τα νευρωνικά δίκτυα έχουν αποδειχθεί τόσο αποτελεσματικά όσο και ευέλικτα, σε τομείς όπως η ταξινόμηση, η ομαδοποίηση, η παραγωγή συνθετικών αλλά αληθοφανών δεδομένων, κ.α. Συνεπώς, μπορούν να θεωρηθούν ολοκληρωμένα ως προς τη δυνατότητα ανάπτυξης μεγάλης γκάμας εφαρμογών. Παρά τη χρησιμότητά τους όμως, έχουν μια σειρά από ελαττώματα όπως είναι η δυσκολία κατανόησης και τεκμηρίωσης του τρόπου λειτουργίας τους, η δυσκολία εκμάθησής τους που απαιτεί χρονοβόρα και επαναληπτική εργασία, κλπ. Η υλοποίηση νευρωνικών λύσεων θα μπορούσε να γίνει πιο αποτελεσματική αν υπήρχαν υπηρεσίες που να επέτρεπαν σε χρήστες τη μελέτη άλλων αλγορίθμων και μοντέλων. Αυτό μπορεί να επιτευχθεί μόνο στη βάση μιας κοινής γλώσσας ικανής να περιγράψει σχετικούς αλγορίθμους βαθιάς μάθησης με αρκετή λεπτομέρεια. Χρειάζονται επίσης εργαλεία για την αυτοματοποίηση της διαδικασίας εξαγωγής γνώσης και την καθοδήγηση του τελικού χρήστη.

Έργασία 1: θα κάνει χρήση οντολογιών και σχετικών τεχνολογιών διαχείρισης δεδομένων για να περιγράψει σύνθετους αλγορίθμους βαθιάς μάθησης. Επιπλέον, θα δημιουργήσει μια βάση γνώσεων (knowledge-base) όπως και πρωτότυπο λογισμικό για την εξαγωγή γνώσης από νέους και διαθέσιμους αλγόριθμους ανοικτού κώδικα.

Έργασία 2: θα δημιουργήσει μία εφαρμογή Web που θα μπορούν να συμβουλεύονται χρήστες που αναπτύσσουν αλγόριθμους βαθιάς μάθησης. Η πρωτότυπη εφαρμογή θα επιτρέπει την αποθήκευση νέων αλγορίθμων βαθιάς μάθησης βάσει κατάλληλης οντολογίας, και θα είναι σε θέση να παράσχει απαντήσεις σε σχετικά ερωτήματα χρηστών.

ΔΥΝΑΜΙΚΑ ΡΥΘΜΙΖΟΜΕΝΕΣ ΣΥΝΟΨΕΙΣ ΤΡΟΧΙΑΣ ΑΝΤΙΚΕΙΜΕΝΩΝ

Με την πρόοδο της τεχνολογίας (κινητές συσκευές, GPS, RFID, κ.ά.) είναι πλέον δυνατή η παρακολούθηση του γεωγραφικού στίγματος μεγάλου πλήθους κινούμενων αντικειμένων (λ.χ., αυτοκινήτων, πλοίων, αεροπλάνων) σε πραγματικό χρόνο με την μορφή ρεύματος δεδομένων (data stream). Ωστόσο, μεγάλα τμήματα της τροχιάς (trajectory) τέτοιων αντικειμένων συχνά εξελίσσονται σχεδόν σε ευθεία γραμμή και με πρακτικά σταθερή ταχύτητα. Επομένως, η συσσώρευση γεωγραφικών στιγμάτων κατά μήκος αυτών των τμημάτων περιττεύει, ενώ ο υπερβολικός όγκος τους μπορεί να δυσχεράνει σημαντικά την έγκαιρη παροχή απαντήσεων σε ερωτήματα (λ.χ. ποια πλοία κινήθηκαν κοντά στο λιμάνι κατά το τελευταίο δεκάλεπτο). Γι’ αυτόν τον λόγο, πρόσφατα έχει προταθεί η δημιουργία συνόψεων κάθε τροχιάς, ανιχνεύοντας σε πραγματικό χρόνο χαρακτηριστικά σημεία (critical points) της εξελισσόμενης πορείας κάθε αντικειμένου. Τέτοια σημεία που δηλώνουν λ.χ. στάση, στροφή ή αργή κίνηση ενός μεμονωμένου αντικειμένου μπορούν να εντοπισθούν βάσει κανόνων που ελέγχουν μεταβολές στο διάνυσμα της ταχύτητάς του. Πειραματικές μελέτες έδειξαν ότι με προσεκτική παραμετροποίηση, ακόμη κι αν απορριφθεί σχεδόν το 99% των πρωτογενών στιγμάτων, η τροχιά μπορεί να ανασυντεθεί με αρκετά ικανοποιητική ακρίβεια βάσει μόνο των χαρακτηριστικών στιγμάτων, επιταχύνοντας σημαντικά την επεξεργασία ερωτημάτων και την online αναγνώριση πιο σύνθετων φαινομένων (λ.χ. πλοία που προσεγγίζουν το ένα το άλλο).

Στόχος της διπλωματικής εργασίας είναι η περαιτέρω βελτίωση της ποιότητας των παραγομένων συνόψεων στα πλαίσια ενός συστήματος που θα διαχειρίζεται τροχιές αντικειμένων με χρήση λογισμικών για μεγάλα δεδομένα (λ.χ. Apache Flink, Kafka, Spark). Η μελέτη προβλέπεται να κινηθεί σε δύο κύριους άξονες:

• Δυνατότητα δυναμικών ρυθμίσεων στις τιμές των παραμέτρων που επηρεάζουν την αναγνώριση των χαρακτηριστικών σημείων. Λ.χ., το κατώφλι της ταχύτητας για την ανίχνευση αργής κίνησης θα πρέπει να ορίζεται διαφορετικά, ανάλογα με τον τύπο του κινούμενου αντικειμένου (π.χ. άλλο κατώφλι για δεξαμενόπλοιο και άλλο ένα μικρό αλιευτικό σκάφος). Επίσης, η γεωγραφική περιοχή στην οποία κινείται κάποιο αντικείμενο μπορεί να επιβάλλει συγκεκριμένους περιορισμούς (λ.χ. όριο ταχύτητας) που τώρα δεν λαμβάνονται υπ’ όψιν. Απλές τεχνικές μηχανικής μάθησης θα μπορούσαν να εφαρμοστούν προκειμένου κάθε αντικείμενο να «μαθαίνει» βάσει του μοτίβου της κινήσεώς του για να μπορεί να προσαρμόζει αναλόγως τις εκάστοτε παραμέτρους.
• Μολονότι οι δραστικά συμπιεσμένες τροχιές καταφέρνουν να αποδώσουν πολύ καλά την κίνηση των αντικειμένων, αρκετά συχνά τυχαίνει να απορρίπτουν στίγματα που θα μπορούσαν να είναι χρήσιμα για την ανίχνευση πιο σύνθετων φαινομένων (λ.χ. πλοία εν κινήσει). Όταν λοιπόν απαιτείται κάτι τέτοιο, ο αλγόριθμος θα πρέπει να μπορεί να «χαλαρώνει» τον βαθμό συμπίεσης, τηρώντας περισσότερα στίγματα με κατάλληλη ρύθμιση στις παραμέτρους ή ακόμη και απενεργοποιώντας προσωρινά κάποιους κανόνες ανίχνευσης χαρακτηριστικών σημείων.

Αυτόματος εντοπισμός γλωσσικών δεικτών (δομών και χαρακτηριστικών) ως μέσων έγκαιρης διάγνωσης και πρόγνωσης της νόσου Alzheimer σε πρώιμο στάδιο και συγγενών διαταραχών: Μία διαγλωσσική μελέτη.

Με την παρούσα εργασία θα γίνει προσπάθεια να εντοπιστούν με υπολογιστικές μεθόδους γλωσσικοί δείκτες στον προφορικό και στο γραπτό λόγο των ασθενών σε πρώιμο στάδια της νόσου Alzheimer. Σκοπός της εργασίας αυτής είναι ο αυτόματος εντοπισμός καθολικών/διαγλωσσικών αλλά και ειδικότερων γλωσσικών δομών στις οποίες αναγωρίζονται "αποκλίσεις" από την υγιή γλωσσική χρήση και οι οποίες θα βοηθούσαν στην πρόβλεψη αλλά και στη διάγνωση της νόσου Alzheimer και άλλων συγγενών ασθενειών.

Λέξεις κλειδιά
Μηχανική μάθηση (Ταξινόμηση Κειμένων, Επιλογή Χαρακτηριστικών), Γλωσσολογία (Σημασιολογία, Μορφολογία, Σύνταξη), Υπολογιστική Γλωσσολογία, Εξαγωγή πληροφορίας

Ενδεικτική Βιβλιογραφία:
1. Fraser, K., Meltzer, J., & Rudzicz, F. (2016). Linguistic features identify Alzheimer's disease in narrative speech. Journal of Alzheimer's disease 49, 407-422.
2. Rentoumi, V., Raoufian, L., Ahmed, S., de Jager, C. A., & Garrard, P. (2014). Features and machine learning classification of connected speech samples from patients with autopsy proven Alzheimer's disease with and without additional vascular pathology. Journal of Alzheimer's Disease, 42(s3), S3-S17.

Βελτιστοποίηση ερωτημάτων σε κατανεμημένες βάσεις δεδομένων

Τα ανοικτά δεδομένα στο Linked Open Data cloud και τον Σημασιολογικό
Ιστό έχουν πλέον φτάσει τους όγκους και τους αριθμούς χρηστών
επιβάλλουν την εφαρμογή τεχνικών βελτιστοποίησης. Πως μπορούν, όμως,
να βελτιστοποιηθούν ερωτήματα στο αποκεντρωμένο περιβάλλον του Web of
Data χωρίς καμία γνώση των στατιστικών στοιχείων που απαιτούνται; Η
διπλωματική θα εξερευνήσει τρόπους να δημιουργηθούν και συντηρηθούν τα
απαραίτητα στατιστικά παρατηρώντας τις απαντήσεις του endpoint σε
προηγούμενα ερωτήματα, δίνοντας την ευκαιρία για πειραματισμό με
τεχνολογίες αιχμής στην μηχανική μάθηση και την τεχνητή νοημοσύνη και
τις εφαρμογές τους στην διαχείριση κατανεμημένων δεδομένων πολύ
μεγάλης κλίμακας.

Δεν απαιτείται καθημερινή παρουσία στο ΕΚΕΦΕ "Δημόκριτος"
αλλά μόνο τακτικές συναντήσεις επίβλεψης.

Ενδεικτική βιβλιογραφία

Katerina Zamani, Angelos Charalambidis, Stasinos Konstantopoulos,
Nickolas Zoulis, Efi Mavroudi,
"Workload-Aware Self-Tuning Histograms for the Semantic Web".
Trans. Large-Scale Data- and Knowledge-Centered Systems 28, Sep 2016.
[Zenodo: 159131]

Angelos Charalambidis, Antonis Troumpoukis and Stasinos
Konstantopoulos, "SemaGrow: Optimizing Federated SPARQL
queries". In Proceedings SEMANTICS 2015, Vienna,
September 2015.

Aνάλυση Υπερφασματικών (Hyperspectral) δεδομένων

Αυτή η εργασία αποτελεί μια εφαρμογή μεθόδων τηλεπισκόπησης. Συγκεκριμένα θα γίνει ανάλυση υπερφασματικών δεδομένων Long-Wavelength Infrared (LWIR 7,8–11,5 µm) σε συνδυασμό με ορθοφωτογραφίες (RGB) υψηλής ανάλυσης (τής ίδιας περιοχής). Δίνονται και περιοχές με γνωστή ταξινόμηση (training/evaluation sets).
Η εργασία περιλαμβάνει βιβλιογραφική έρευνα μεθόδων supervised classification, επεξεργασία δεδομένων με προγράμματα GIS ή/και MATLAB και επιλογή συνδυασμού μεθόδων για την καλύτερη ταξινόμηση.
Εφόσον τα αποτελέσματα παρουσιάζουν ενδιαφέρον, η εργασία θα δημοσιευθεί σε διεθνές επιστημονικό περιοδικό ή συνέδριο.

Syndicate content

© 2018 - Institute of Informatics and Telecommunications | National Centre for Scientific Research "Demokritos"

Terms of Service and Privacy Policy