μηχανική μάθηση

ΔΥΝΑΜΙΚΑ ΡΥΘΜΙΖΟΜΕΝΕΣ ΣΥΝΟΨΕΙΣ ΤΡΟΧΙΑΣ ΑΝΤΙΚΕΙΜΕΝΩΝ

Με την πρόοδο της τεχνολογίας (κινητές συσκευές, GPS, RFID, κ.ά.) είναι πλέον δυνατή η παρακολούθηση του γεωγραφικού στίγματος μεγάλου πλήθους κινούμενων αντικειμένων (λ.χ., αυτοκινήτων, πλοίων, αεροπλάνων) σε πραγματικό χρόνο με την μορφή ρεύματος δεδομένων (data stream). Ωστόσο, μεγάλα τμήματα της τροχιάς (trajectory) τέτοιων αντικειμένων συχνά εξελίσσονται σχεδόν σε ευθεία γραμμή και με πρακτικά σταθερή ταχύτητα. Επομένως, η συσσώρευση γεωγραφικών στιγμάτων κατά μήκος αυτών των τμημάτων περιττεύει, ενώ ο υπερβολικός όγκος τους μπορεί να δυσχεράνει σημαντικά την έγκαιρη παροχή απαντήσεων σε ερωτήματα (λ.χ. ποια πλοία κινήθηκαν κοντά στο λιμάνι κατά το τελευταίο δεκάλεπτο). Γι’ αυτόν τον λόγο, πρόσφατα έχει προταθεί η δημιουργία συνόψεων κάθε τροχιάς, ανιχνεύοντας σε πραγματικό χρόνο χαρακτηριστικά σημεία (critical points) της εξελισσόμενης πορείας κάθε αντικειμένου. Τέτοια σημεία που δηλώνουν λ.χ. στάση, στροφή ή αργή κίνηση ενός μεμονωμένου αντικειμένου μπορούν να εντοπισθούν βάσει κανόνων που ελέγχουν μεταβολές στο διάνυσμα της ταχύτητάς του. Πειραματικές μελέτες έδειξαν ότι με προσεκτική παραμετροποίηση, ακόμη κι αν απορριφθεί σχεδόν το 99% των πρωτογενών στιγμάτων, η τροχιά μπορεί να ανασυντεθεί με αρκετά ικανοποιητική ακρίβεια βάσει μόνο των χαρακτηριστικών στιγμάτων, επιταχύνοντας σημαντικά την επεξεργασία ερωτημάτων και την online αναγνώριση πιο σύνθετων φαινομένων (λ.χ. πλοία που προσεγγίζουν το ένα το άλλο).

Στόχος της διπλωματικής εργασίας είναι η περαιτέρω βελτίωση της ποιότητας των παραγομένων συνόψεων στα πλαίσια ενός συστήματος που θα διαχειρίζεται τροχιές αντικειμένων με χρήση λογισμικών για μεγάλα δεδομένα (λ.χ. Apache Flink, Kafka, Spark). Η μελέτη προβλέπεται να κινηθεί σε δύο κύριους άξονες:

• Δυνατότητα δυναμικών ρυθμίσεων στις τιμές των παραμέτρων που επηρεάζουν την αναγνώριση των χαρακτηριστικών σημείων. Λ.χ., το κατώφλι της ταχύτητας για την ανίχνευση αργής κίνησης θα πρέπει να ορίζεται διαφορετικά, ανάλογα με τον τύπο του κινούμενου αντικειμένου (π.χ. άλλο κατώφλι για δεξαμενόπλοιο και άλλο ένα μικρό αλιευτικό σκάφος). Επίσης, η γεωγραφική περιοχή στην οποία κινείται κάποιο αντικείμενο μπορεί να επιβάλλει συγκεκριμένους περιορισμούς (λ.χ. όριο ταχύτητας) που τώρα δεν λαμβάνονται υπ’ όψιν. Απλές τεχνικές μηχανικής μάθησης θα μπορούσαν να εφαρμοστούν προκειμένου κάθε αντικείμενο να «μαθαίνει» βάσει του μοτίβου της κινήσεώς του για να μπορεί να προσαρμόζει αναλόγως τις εκάστοτε παραμέτρους.
• Μολονότι οι δραστικά συμπιεσμένες τροχιές καταφέρνουν να αποδώσουν πολύ καλά την κίνηση των αντικειμένων, αρκετά συχνά τυχαίνει να απορρίπτουν στίγματα που θα μπορούσαν να είναι χρήσιμα για την ανίχνευση πιο σύνθετων φαινομένων (λ.χ. πλοία εν κινήσει). Όταν λοιπόν απαιτείται κάτι τέτοιο, ο αλγόριθμος θα πρέπει να μπορεί να «χαλαρώνει» τον βαθμό συμπίεσης, τηρώντας περισσότερα στίγματα με κατάλληλη ρύθμιση στις παραμέτρους ή ακόμη και απενεργοποιώντας προσωρινά κάποιους κανόνες ανίχνευσης χαρακτηριστικών σημείων.

Αυτόματος εντοπισμός γλωσσικών δεικτών (δομών και χαρακτηριστικών) ως μέσων έγκαιρης διάγνωσης και πρόγνωσης της νόσου Alzheimer σε πρώιμο στάδιο και συγγενών διαταραχών: Μία διαγλωσσική μελέτη.

Με την παρούσα εργασία θα γίνει προσπάθεια να εντοπιστούν με υπολογιστικές μεθόδους γλωσσικοί δείκτες στον προφορικό και στο γραπτό λόγο των ασθενών σε πρώιμο στάδια της νόσου Alzheimer. Σκοπός της εργασίας αυτής είναι ο αυτόματος εντοπισμός καθολικών/διαγλωσσικών αλλά και ειδικότερων γλωσσικών δομών στις οποίες αναγωρίζονται "αποκλίσεις" από την υγιή γλωσσική χρήση και οι οποίες θα βοηθούσαν στην πρόβλεψη αλλά και στη διάγνωση της νόσου Alzheimer και άλλων συγγενών ασθενειών.

Λέξεις κλειδιά
Μηχανική μάθηση (Ταξινόμηση Κειμένων, Επιλογή Χαρακτηριστικών), Γλωσσολογία (Σημασιολογία, Μορφολογία, Σύνταξη), Υπολογιστική Γλωσσολογία, Εξαγωγή πληροφορίας

Ενδεικτική Βιβλιογραφία:
1. Fraser, K., Meltzer, J., & Rudzicz, F. (2016). Linguistic features identify Alzheimer's disease in narrative speech. Journal of Alzheimer's disease 49, 407-422.
2. Rentoumi, V., Raoufian, L., Ahmed, S., de Jager, C. A., & Garrard, P. (2014). Features and machine learning classification of connected speech samples from patients with autopsy proven Alzheimer's disease with and without additional vascular pathology. Journal of Alzheimer's Disease, 42(s3), S3-S17.

Βελτιστοποίηση ερωτημάτων σε κατανεμημένες βάσεις δεδομένων

Τα ανοικτά δεδομένα στο Linked Open Data cloud και τον Σημασιολογικό
Ιστό έχουν πλέον φτάσει τους όγκους και τους αριθμούς χρηστών
επιβάλλουν την εφαρμογή τεχνικών βελτιστοποίησης. Πως μπορούν, όμως,
να βελτιστοποιηθούν ερωτήματα στο αποκεντρωμένο περιβάλλον του Web of
Data χωρίς καμία γνώση των στατιστικών στοιχείων που απαιτούνται; Η
διπλωματική θα εξερευνήσει τρόπους να δημιουργηθούν και συντηρηθούν τα
απαραίτητα στατιστικά παρατηρώντας τις απαντήσεις του endpoint σε
προηγούμενα ερωτήματα, δίνοντας την ευκαιρία για πειραματισμό με
τεχνολογίες αιχμής στην μηχανική μάθηση και την τεχνητή νοημοσύνη και
τις εφαρμογές τους στην διαχείριση κατανεμημένων δεδομένων πολύ
μεγάλης κλίμακας.

Δεν απαιτείται καθημερινή παρουσία στο ΕΚΕΦΕ "Δημόκριτος"
αλλά μόνο τακτικές συναντήσεις επίβλεψης.

Ενδεικτική βιβλιογραφία

Katerina Zamani, Angelos Charalambidis, Stasinos Konstantopoulos,
Nickolas Zoulis, Efi Mavroudi,
"Workload-Aware Self-Tuning Histograms for the Semantic Web".
Trans. Large-Scale Data- and Knowledge-Centered Systems 28, Sep 2016.
[Zenodo: 159131]

Angelos Charalambidis, Antonis Troumpoukis and Stasinos
Konstantopoulos, "SemaGrow: Optimizing Federated SPARQL
queries". In Proceedings SEMANTICS 2015, Vienna,
September 2015.

Aνάλυση Υπερφασματικών (Hyperspectral) δεδομένων

Αυτή η εργασία αποτελεί μια εφαρμογή μεθόδων τηλεπισκόπησης. Συγκεκριμένα θα γίνει ανάλυση υπερφασματικών δεδομένων Long-Wavelength Infrared (LWIR 7,8–11,5 µm) σε συνδυασμό με ορθοφωτογραφίες (RGB) υψηλής ανάλυσης (τής ίδιας περιοχής). Δίνονται και περιοχές με γνωστή ταξινόμηση (training/evaluation sets).
Η εργασία περιλαμβάνει βιβλιογραφική έρευνα μεθόδων supervised classification, επεξεργασία δεδομένων με προγράμματα GIS ή/και MATLAB και επιλογή συνδυασμού μεθόδων για την καλύτερη ταξινόμηση.
Εφόσον τα αποτελέσματα παρουσιάζουν ενδιαφέρον, η εργασία θα δημοσιευθεί σε διεθνές επιστημονικό περιοδικό ή συνέδριο.

Αναγνώριση συγγραφέα (author identification) στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης

H στυλομετρία (computational stylometry) έχει ως στόχο να ανακτήσει χρήσιμα χαρακτηριστικά κειμένων από το ύφος της γραφής, με στόχο την αυτόματη ταξινόμησή τους ως προς τον συγγραφέα τους. Η υφολογική πληροφορία εξάγεται μέσω της ανάλυσης του κειμένου με τεχνολογίες επεξεργασίας φυσικής γλώσσας, με την αυτόματη ανάλυση της διακύμανσης των γλωσσικών χαρακτηριστικών.
Υπάρχουσες στατιστικές τεχνικές αναγνωρίζουν με επιτυχία την ταυτότητα του συγγραφέα, το φύλο, τη μητρική γλώσσα , ακόμη και αν ένας συγγραφέας έχει άνοια. Πρόσφατα έχει υπάρξει αυξανόμενο ενδιαφέρον για την εφαρμογή μεθόδων αναγνώρισης συγγραφέα στα κοινωνικά δίκτυα, π.χ. ανίχνευση εθνικότητας συγγραφέα στα μέσα κοινωνικής δικτύωσης, φύλου και ηλικίας. Στα κοινωνικά δίκτυα, η στυλομετρία αποτελεί πολύ μεγάλη πρόκληση. Οι δημοσιεύσεις στα κοινωνικά δίκτυα γίνονται συνήθως μέσω tweets, σχόλιων, blogs, κλπ. Η μη τυπική χρήση της γλώσσας είναι συχνό φαινόμενο σε τέτοιου είδους δημοσιεύσεις, και καθιστά δύσκολη την επεξεργασία φυσικής γλώσσας. Επίσης, με δεδομένη την ταχύτητα με την οποία δημοσιεύεται νέο περιεχόμενο, η ανάγκη για σταδιακή επανεκπαίδευση του αλγόριθμου μηχανικής μάθησης καθίσταται απαραίτητη, προκειμένου να λάβει υπόψη του νέες παραλλαγές της χρήσης της γλώσσας που συνδέονται με τα διάφορα χαρακτηριστικά του κειμένου.
Η έρευνα σε αυτόν τον τομέα είναι ακόμα στα αρχικά της στάδια και οι περισσότερες υπάρχουσες προσεγγίσεις εστιάζουν μόνο σε ένα ή δύο χαρακτηριστικά, όπως η ηλικία και / ή το φύλο.
Ο στόχος της παρούσας εργασίας είναι μελετηθεί ο χώρος της αναγνώρισης συγγραφέα στα κοινωνικά δίκτυα και να προταθούν νέες προσεγγίσεις, οι οποίες θα λαμβάνουν υπόψη τη φύση των δεδομένων, με έμφαση στην συνεχή παραγωγή νέου περιεχομένου.

Κατηγοριοποίηση βιολογικών δεδομένων χρησιμοποιώντας τεχνικές μεταφοράς μάθησης

Ένα από τα ανοιχτά προβλήματα της βιοπληροφορικής, είναι η αυτόματη πρόβλεψη γονιδίων (αλληλουχία νουκλεοτιδίων που κωδικοποιεί πρωτεΐνες). Πιο συγκεκριμένα, οι ερευνητές προσπαθούν να προβλέψουν τις θέσεις που αντιστοιχούν στην αρχή και το τέλος των γονιδίων σε ένα γονιδίωμα. Οι θέσεις αυτές είναι γνωστές ως σήματα ματίσματος (splice sites). Διάφορες τεχνικές της μηχανικής μάθησης έχουν χρησιμοποιηθεί για το συγκεκριμένο πρόβλημα. Παρόλα αυτά, η απόκτηση των επισημειωμένων δεδομένων που είναι αναγκαία για να εφαρμοστούν οι τεχνικές επιβλεπόμενης μάθησης, αποτελεί μια σημαντική πρόκληση, καθώς το κόστος είναι πολύ μεγάλο. Μία από τις προσεγγίσεις για την αντιμετώπιση αυτού του προβλήματος είναι η μεταφορά μάθησης (transfer learning). Στόχος της παρούσας εργασίας είναι η εφαρμογή και επέκταση τεχνικών μεταφοράς μάθησης σε βιολογικά δεδομένα, με στόχο την εύρεση των λεγόμενων σημάτων ματίσματος (splice sites) σε έναν οργανισμό, έχοντας δεδομένα εκπαίδευσης από κάποιον διαφορετικό οργανισμό.

Αναγνώριση ανθρώπινης συμπεριφοράς μέσω ανάλυσης κινούμενης εικόνας βάθους

Τα τελευταία χρόνια, με την ραγδαία εξάπλωση των συσκευών ηλεκτρονικών παιχνιδιών έχουν αναπτυχθεί νέοι τρόποι επικοινωνίας ανθρώπου-μηχανής. Για τον σκοπό αυτό, και πιο συγκεκριμένα για την ανάλυση κινήσεων κατά την διαδικασία του παιχνιδιού, οι κλάσσικές μηχανές καταγραφής εικόνας/ήχου, έχουν επεκταθεί με νέες τεχνικές, όπως αυτή της καταγραφής του βάθους. Πιο χαρακτηριστικός είναι ο αισθητήρας Kinect, που χρησιμοποιείται στην κονσόλα παιχνιδιών Xbox της Microsoft. Η συγκεκριμένη συσκευή καταγραφής, εκτός από "κλασσική" RGB εικόνα (και βίντεο), μπορεί επίσης να καταγράψει "εικόνες βάθους", στις οποίες οι τιμή του κάθε pixel μεταφράζεται σε μία προσέγγιση της απόστασης του αντικειμένου από την κάμερα. Όπως είναι αναμενόμενο, ο νέος αυτός τύπος καταγραφής εικόνας έχει ανοίξει νέους ορίζοντες στην επιστημονική περιοχή της ανάλυσης (κινούμενης ή στατικής) εικόνας.

Στόχοι της συγκεκριμένης εργασίας θα είναι:
- Η μελέτη των πιο βασικών μεθόδων αναγνώρισης ανθρώπινης συμπεριφοράς (με έμφαση σε είδη κινήσεων, όπως περπάτημα, τρέξιμο κτλ), τόσο με "κλασσικές" μεθόδους, όσο και με μεθόδους που βασίζονται σε εικόνες βάθους.
- Υλοποίηση μεθόδων αναγνώρισης συμπεριφοράς με χρήση του αισθητήρα Kinect σε κάποια γλώσσα προγραμματισμού (Processing, C++, Python)
- Καταγραφή δεδομένων για πειραματικούς σκοπούς και εξαγωγή πειραματικών αποτελεσμάτων.

Μεταφορά γνώσης σε συστήματα αναγνώρισης γεγονότων απο δεδομένα.

Tα συστήματα αναγνώρισης συμβολικών γεγονότων/συμπεριφορών από δεδομένα έχουν μελετηθεί και αναπτυχθεί σε διάφορα ερευνητικά πεδία, όπως αυτά της Τεχνητής Νοημοσύνης, των Κατανεμημένων Συστημάτων και της Τεχνολογίας Λογισμικού. Για παράδειγμα, έχουν αναπτυχθεί συστήματα που επιβλέπουν την λειτουργία μέσων μαζικής μεταφοράς και αναγνωρίζουν “ενδιαφέρουσες” συμπεριφορές που λαμβάνουν χώρα, όπως η οδήγηση ενος λεωφορείου με μη οικολογικό τρόπο. Η βάση γνώσης “ενδιαφερουσών” συμπεριφορών που έχει αναπτυχθεί σε μία εφαρμογή μπορεί να χρησιμοποιηθεί με κάποιες τροποποιήσεις σε παρόμοιες εφαρμογές. Για παράδειγμα, η βάση γνώσης “ενδιαφερουσών” συμπεριφορών του συστήματος επίβλεψης των μέσων μαζικής μεταφοράς μίας πόλης μπορεί να χρησιμοποιηθεί, πιθανότατα με κάποιες αλλαγές, για το σύστημα επίβλεψης των μέσων μαζικής μεταφοράς μίας άλλης πόλης. Οι αλλαγές στη βάση γνώσης έχουν να κάνουν με τις διαφορές στην υποδομή των δυο πόλεων (π.χ. διαφορές στα δεδομένα εισόδου των δυο συστημάτων). Στο πλαίσιο της εργασίας θα αναπτυχθεί αλγόριθμος μεταφοράς βάσεων γνώσης “ενδιαφέρουσων” συμπεριφορών. Οι βάσεις γνώσης θα είναι εκφρασμένες στο Λογισμό Πράξης (Event Calculus), μία γλώσσα λογικού προγραμματισμού που επιτρέπει την αναπαράσταση γεγονότων και των αποτελεσμάτων τους.

Ενδεικτική Βιβλιογραφία:

Artikis A., Sergot M. and Paliouras G. An Event Calculus for Event Recognition. IEEE Transactions on Knowledge and Data Engineering (TKDE), 2014.
http://users.iit.demokritos.gr/~a.artikis/publications/artikis-TKDE14.pdf

D. Hu and Q. Yang. Transfer Learning for Activity Recognition via Sensor Mapping. IJCAI 2011. http://www.cse.ust.hk/~qyang/Docs/2011/ijcai2011_hh.pdf

Εκμάθηση στρατηγικών διαλόγου σε πραγματικό χρόνο για προσαρμοζόμενα διαλογικά συστήματα

Τα προσαρμοζόμενα διαλογικά συστήματα είναι η εξέλιξη των "στατικών" διαλογικών συστημάτων. Μπορούν να προσαρμόζονται στο χρήστη και στο γενικότερο περιβάλλον τους με διάφορους τρόπους, όπως για παράδειγμα να αναγνωρίζουν και να εκφράζουν συναισθήματα, να χρησιμοποιούν διάφορους "τύπους" γλώσσας (αργκό/απλή κτλ) ανάλογα με το επίπεδο γνώσεων του χρήστη κ.α.. Ένα σημαντικό κομμάτι ενός προσαρμοζόμενου διαλογικού συστήματος είναι η εκμάθηση του τι πρέπει να πει στο χρήστη για να ικανοποιήσει τους στόχους του. Τα τελευταία χρόνια γίνεται προσπάθεια αυτόματης εκμάθησης στρατηγικών διαλόγου, και στην εργασία αυτή θα επικεντρωθούμε στην εκμάθηση στρατηγικών σε πραγματικό χρόνο, με σκοπό το σύστημα να μαθαίνει καθώς αλληλεπιδρά με τους χρήστες.

Χαρακτηρισμός ακμών σε κοινωνικά δίκτυα

Σε κοινωνικά δίκτυα του είδους facebook, twitter κτλ., η φύση των συνδέσμων μεταξύ των μελών τους είναι τις περισσότερες φορές αδιευκρίνηστη. Για παράδειγμα, δεν είναι γνωστό αν δύο άτομα-κόμβοι που συνδέονται είναι φίλοι, συνεργάτες, ή βρίσκονται σε σχέση προϊσταμένου-υφισταμένου. Όμως αυτή η πληροφορία θα ήταν καθοριστικής σημασίας σε πολλούς τομείς συμπεριλαμβανομένης της διαφήμισης. Συνήθως τα μέλη ενός κοινωνικού δικτύου δεν χαρακτηρίζουν ρητά κάθε ακμή ή χαρακτηρίζουν μόνο ένα υποσύνολο τους αν το επιτρέπει η δομή του δικτύου. Οπότε τίθεται το θέμα του αυτόματου χαρακτηρισμού τους. Σε αυτή την κατεύθυνση μπορούν, μεταξύ των άλλων, να χρησιμοποιηθούν τεχνικές ημιεπιβλεπόμενης μάθησης. Το δεδομένα τα οποία θα αποτελέσουν αντικείμενο ανάλυσης της εργασίας προέρχονται από δίκτυα συγγραφέων άρθρων, το σύνολο email της Enron κ.α.

Syndicate content

© 2018 - Institute of Informatics and Telecommunications | National Centre for Scientific Research "Demokritos"