αναγνώριση προτύπων

Dynamics of Bi-partite topological-functional gene expression networks

The distribution of genes in eukaryotic genomes is highly non-random as genes involved in the same functional pathways tend to be clustered in the linear genome. This functional-spatial clustering is reflected upon the gene expression program with regions of the genome being enriched in highly-expressed genes. At the level of functional activation, a variety of tools allows us to assess the significance of processes, functions and pathways given a set of deregulated genes⁠. Nevertheless, there is a growing need for such methods to incorporate positional information, as it is reasonable to assume that functional and spatial regulation are tightly related. In order to broaden our understanding of the dynamics that underlie the whole process, we study the extent of interplay between these two levels of gene regulation in time. More specifically, given a genome-wide gene expression profile, we create bi-partite networks connecting topological (contiguous genomic regions, chromosomal bands, Topologically-associated domains etc) with functional (GO terms, Pathways etc) entities based on combined over-representations of deregulated genes. These networks represent, however, static snapshots of gene expression profiles at a given time point and so we seek to employ analysis of networks from multiple time points in order to define: a) patterns of network evolution (e.g. expansion or contraction of subnetworks, creation of cliques etc) b) nodes of particular importance in the evolution of the networks c) general properties of the dynamics of the process.

ΔΥΝΑΜΙΚΑ ΡΥΘΜΙΖΟΜΕΝΕΣ ΣΥΝΟΨΕΙΣ ΤΡΟΧΙΑΣ ΑΝΤΙΚΕΙΜΕΝΩΝ

Με την πρόοδο της τεχνολογίας (κινητές συσκευές, GPS, RFID, κ.ά.) είναι πλέον δυνατή η παρακολούθηση του γεωγραφικού στίγματος μεγάλου πλήθους κινούμενων αντικειμένων (λ.χ., αυτοκινήτων, πλοίων, αεροπλάνων) σε πραγματικό χρόνο με την μορφή ρεύματος δεδομένων (data stream). Ωστόσο, μεγάλα τμήματα της τροχιάς (trajectory) τέτοιων αντικειμένων συχνά εξελίσσονται σχεδόν σε ευθεία γραμμή και με πρακτικά σταθερή ταχύτητα. Επομένως, η συσσώρευση γεωγραφικών στιγμάτων κατά μήκος αυτών των τμημάτων περιττεύει, ενώ ο υπερβολικός όγκος τους μπορεί να δυσχεράνει σημαντικά την έγκαιρη παροχή απαντήσεων σε ερωτήματα (λ.χ. ποια πλοία κινήθηκαν κοντά στο λιμάνι κατά το τελευταίο δεκάλεπτο). Γι’ αυτόν τον λόγο, πρόσφατα έχει προταθεί η δημιουργία συνόψεων κάθε τροχιάς, ανιχνεύοντας σε πραγματικό χρόνο χαρακτηριστικά σημεία (critical points) της εξελισσόμενης πορείας κάθε αντικειμένου. Τέτοια σημεία που δηλώνουν λ.χ. στάση, στροφή ή αργή κίνηση ενός μεμονωμένου αντικειμένου μπορούν να εντοπισθούν βάσει κανόνων που ελέγχουν μεταβολές στο διάνυσμα της ταχύτητάς του. Πειραματικές μελέτες έδειξαν ότι με προσεκτική παραμετροποίηση, ακόμη κι αν απορριφθεί σχεδόν το 99% των πρωτογενών στιγμάτων, η τροχιά μπορεί να ανασυντεθεί με αρκετά ικανοποιητική ακρίβεια βάσει μόνο των χαρακτηριστικών στιγμάτων, επιταχύνοντας σημαντικά την επεξεργασία ερωτημάτων και την online αναγνώριση πιο σύνθετων φαινομένων (λ.χ. πλοία που προσεγγίζουν το ένα το άλλο).

Στόχος της διπλωματικής εργασίας είναι η περαιτέρω βελτίωση της ποιότητας των παραγομένων συνόψεων στα πλαίσια ενός συστήματος που θα διαχειρίζεται τροχιές αντικειμένων με χρήση λογισμικών για μεγάλα δεδομένα (λ.χ. Apache Flink, Kafka, Spark). Η μελέτη προβλέπεται να κινηθεί σε δύο κύριους άξονες:

• Δυνατότητα δυναμικών ρυθμίσεων στις τιμές των παραμέτρων που επηρεάζουν την αναγνώριση των χαρακτηριστικών σημείων. Λ.χ., το κατώφλι της ταχύτητας για την ανίχνευση αργής κίνησης θα πρέπει να ορίζεται διαφορετικά, ανάλογα με τον τύπο του κινούμενου αντικειμένου (π.χ. άλλο κατώφλι για δεξαμενόπλοιο και άλλο ένα μικρό αλιευτικό σκάφος). Επίσης, η γεωγραφική περιοχή στην οποία κινείται κάποιο αντικείμενο μπορεί να επιβάλλει συγκεκριμένους περιορισμούς (λ.χ. όριο ταχύτητας) που τώρα δεν λαμβάνονται υπ’ όψιν. Απλές τεχνικές μηχανικής μάθησης θα μπορούσαν να εφαρμοστούν προκειμένου κάθε αντικείμενο να «μαθαίνει» βάσει του μοτίβου της κινήσεώς του για να μπορεί να προσαρμόζει αναλόγως τις εκάστοτε παραμέτρους.
• Μολονότι οι δραστικά συμπιεσμένες τροχιές καταφέρνουν να αποδώσουν πολύ καλά την κίνηση των αντικειμένων, αρκετά συχνά τυχαίνει να απορρίπτουν στίγματα που θα μπορούσαν να είναι χρήσιμα για την ανίχνευση πιο σύνθετων φαινομένων (λ.χ. πλοία εν κινήσει). Όταν λοιπόν απαιτείται κάτι τέτοιο, ο αλγόριθμος θα πρέπει να μπορεί να «χαλαρώνει» τον βαθμό συμπίεσης, τηρώντας περισσότερα στίγματα με κατάλληλη ρύθμιση στις παραμέτρους ή ακόμη και απενεργοποιώντας προσωρινά κάποιους κανόνες ανίχνευσης χαρακτηριστικών σημείων.

Επιρροή σε πολυ-σχεσιακά δίκτυα

Η εύρεση των χρηστών με την μεγαλύτερη επιρροή σε ένα κοινωνικό δίκτυο έχει επιτευχθεί σε σημαντικό βαθμό με αλγορίθμους που εντοπίζουν τους «κεντρικότερους» χρήστες. Όμως οι σχετικοί αλγόριθμοι έχουν δοκιμαστεί κυρίως σε δίκτυα όπου υπάρχει μόνο μία σχέση μεταξύ των χρηστών, π.χ. σχέση φιλίας. Απο την άλλη μεριά, ένα δίκτυο μπορεί να περιλαμβάνει πολλές σχέσεις μεταξύ των χρηστών, π.χ. κάποιοι συνδέονται με φιλικές σχέσεις, άλλοι είναι συνεργάτες, κάποιοι φοίτησαν στο ίδιο σχολείο κτλ. Σκοπός της εργασίας είναι η εύρεση των χρηστών με τη μεγαλύτερη επιρροή σε ένα πολυ-σχεσιακό δίκτυο. Προβλέπεται ότι θα βασιστούμε σε τεχνικές επιβλεπόμενης μάθησης.

Ανάλυση ποιότητας αστικού ηχοτοπίου με χρήση μεθόδων ανάλυσης ήχου και αναγνώρισης προτύπων

Σκοπός της συγκεκριμένης εργασίας είναι η μελέτη και υλοποίηση ενός συστήματος το οποίο αυτόματα απαντάει στην ερώτηση "Πόσο ποιοτικός είναι ο ήχος σε εξωτερικούς αστικούς χώρους"; Ο όρος "ποιοτικός" σχετίζεται με την υποκειμενική αίσθηση ενόχλησης ή ευχαρίστησης που δίνει ένα σύνολο ήχων σε συγκεκριμένους ανθρώπους.

Το CIL έχει ήδη συγκεντρώσει δεδομένα μέσω mobile εφαρμογών (λεπτομέρειες εδώ: http://users.iit.demokritos.gr/~tyianak/soundscape/).

Τα επόμενα βήματα για την ολοκλήρωση της συγκεκριμένης προσπάθειας είναι:
1) συγκέντρωση μεγάλου όγκου δεδομένων και επισημειώσεων μέσω μιας διαδικασίας croudsourcing (η εφαρμογή ήδη υπάρχει)
2) εκπαίδευση αυτομάτων μεθόδων αναγνώρισης προτύπων για την εκτίμηση της ποιότητας του ηχοτοπίου
3) εξαγωγή αυτοματοποιημένων long-term στατιστικών, trends και παρατηρήσεων από τα συσσωρευμένα annotations και μετρήσεις. Π.χ. "το ηχοτοπίο έχει χειροτερεύσει σημαντικά στα πάρκα και παιδικές χαρές των νοτίων προαστίων το 2015 σε σχέση με το 2014"

Μία πτυχιακή εργασία μπορεί να επικεντρωθεί στα βήματα (1) και (2) ή στα βήματα (1) και (3)

Επεξεργασία Υπέρυθρων Υπερφασματικών Εικόνων

Αυτή η εργασία αποτελεί μια εφαρμογή μεθόδων τηλεπισκόπησης. Συγκεκριμένα θα γίνει ανάλυση υπερφασματικών δεδομένων Long-Wavelength Infrared (LWIR 7,8–11,5 µm) σε συνδυασμό με ορθοφωτογραφίες (RGB) υψηλής ανάλυσης (τής ίδιας περιοχής). Δίνονται και περιοχές με γνωστή ταξινόμηση (training/evaluation sets).
Η εργασία περιλαμβάνει βιβλιογραφική έρευνα μεθόδων supervised classification, επεξεργασία δεδομένων με προγράμματα GIS ή/και MATLAB και επιλογή συνδυασμού μεθόδων για την καλύτερη ταξινόμηση.
Εφόσον τα αποτελέσματα παρουσιάζουν ενδιαφέρον, η εργασία θα δημοσιευθεί σε διεθνές επιστημονικό περιοδικό ή συνέδριο.

Ανάλυση εικόνων μικροσκοπίας σάρωσης ηλεκτρονικής δέσμης για την ανίχνευση ακμών νανοδομών και χαρακτηρισμό των διαστάσεων και της τραχύτητάς της

Οι διαστάσεις και γενικότερα οι γεωμετρικές ιδιότητες των νανοδομών που χρησιμοποιούνται σε διάφορες περιοχές της νανοτεχνολογίας επηρεάζουν σημαντικά τη φυσικοχημική συμπεριφορά τους. Κατά συνέπεια η ακριβής μέτρηση τους είναι απαραίτητη για τον έλεγχο των ιδιοτήτων των νανοδομών και την επίτευξη της επιθυμητής συμπεριφοράς τους. Μία από τις πιό συνήθεις μεθόδους εικονισμού των νανοδομών σε μια επιφάνεια είναι οι εικόνες κάτοψης μικροσκοπίου σάρωσης ηλεκτρονικής δέσμης (Scanning Electron Microscope, SEM) στις οποίες τα όρια των δομών απεικονίζονται με ακμές αυξημένης φωτεινότητας.
Η μετάβαση από τον εικονισμό στη μετρολογία των διαστάσεων και της γεωμετρίας των νανοδομών απαιτεί την ακριβή ανίχνευση των ακμών και τον χαρακτηρισμό της γεωμετρίας τους. Αυτός ακριβώς είναι ο σκοπός αυτής της διπλωματικής: η εφαρμογή μεθόδων ανίχνευσης και εντοπισμού ακμών σε εικόνες νανοδομών και ο χαρακτηρισμός της τραχύτητάς τους. Οι νανοδομές που θα μελετηθούν θα χρησιμοποιηθούν για την κατασκευή στοιχείων νανοτρανζίστορ σε ολοκληρωμένα κυκλώματα. Οι προκλήσεις που πρέπει να αντιμετωπισθούν είναι ο αυξημένος θόρυβος των εικόνων που προέρχεται από την ευασθησία των νανοδομών στην ηλεκτρνική δέσμη του μικροσκοπίου και η υψηλή ακρίβεια που απαιτείται στον χαρακτηρισμό των διαστάσεων και της τραχύτητας των νανοδομών δεδομένης της ευαίσθητης εξάρτησης από αυτές της λειτουργίας και απόδοσης των τρανζίστορ.

Επιλογή κατάλληλης μετρολογίας νανοδομημένων επιφανειών με χρήση μεθόδων μηχανικής μάθησης

Μία από τις βασικές ιδιαιτερότητες της μίκρο και νανοτεχνολογίας είναι ο εξαιρετικά κρίσιμος ρόλος της επιφανειακής μορφολογίας των νανοδομών στη λειτουργία και απόδοση των διατάξεων που τις περιέχουν. Αυτό έχει οδηγήσει σε αυξημένο ενδιαφέρον για τη μέτρηση και το χαρακτηρισμό της μορφολογίας και ταχύτητας των επιφανειών. Στη βιβλιογραφία έχουν προταθεί δεκάδες σχετικές παράμετροι και μετρικές, χωρίς ωστόσο να είναι εύκολο για τον χρήστη μιάς συγκεκριμένης επιφάνειας να αποφασίσει ποιά/ές από αυτές τις παραμέτρους είναι η/οι πιό κρίσιμη/ες στη συγκεκριμένη εφαρμογή που επιδιώκει.
Σκοπός της διπλωματικής αυτής είναι να χρησιμοποιήσει μεθόδους της μηχανικής μάθησης που θα διευκολύνουν την επιλογή της πιό κατάλληλης παραμέτρου για τη μετρολογία επιφανειών λαμβάνοντας υπόψη τη συγκεκριμένη εφαρμογή τους. Αυτή μπορεί να είναι είτε επιφάνειες σμυριδόχαρτων που χρησιμοποιούνται στη λείανση άλλων επιφανειών είτε επιφάνειες πλαστικών στις οποίες εναποτίθεται επιλεκτικά βιολογικό υλικό (πρωτεϊνες, κύτταρα κλπ.).

Χαρακτηρισμός του βαθμού οργάνωσης νανοδομημένων επιφανειών υλικών με τη χρήση μεθόδων γράφων ν-γραμμάτων

Στη νανοτεχνολογία συχνά χρησιμοποιούνται νανοδομημένες επιφάνειες που παρουσιάζουν αυτο-οργάνωση δηλ. σχεδόν περιοδική μορφολογία. Παρά τον κρίσιμο ρόλο της αυτο-οργάνωσης στις ιδιότητες των επιφανειών και τη λειτουργία των νανοδιατάξεων που τις περιέχουν, δεν υπάρχει ως σήμερα ικανοποιητικός ποσοτικός χαρακτηρισμός της. Η δυσκολία έγκειται στο γεγονός ότι σχεδόν πάντα η αυτο-οργάνωση είναι προσεγγιστική και αναμεμιγμένη με τυχαία χαρακτηριστικά που δεν μπορούν εύκολα να χαρακτηρισθούν και αξιολογηθούν.
Στη διπλωματική αυτή θα διερευνηθεί η δυνατότητα της μεθόδου γράφων με ν-γράμματα να περιγράψει το βαθμό οργάνωσης μιάς σχεδόν περιοδικής επιφάνειας διακρίνοντας τη σχετική βαρύτητας της περιοδικής από την τυχαία συνιστώσα της. Για το σκοπό αυτό θα χρησιμοποιηθούν επιφάνειες που έχουν παραχθεί τόσο αλγοριθμικά στον υπολογιστή με ελεγχόμενο βαθμό και είδος τυχαιότητας όσο και στο εργαστήριο μετά από επεξεργασία πλάσματος αερίου και μέτρησής τους με μικροσκόπιο ατομικής δύναμης.

Αναγνώριση συγγραφέα (author identification) στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης

H στυλομετρία (computational stylometry) έχει ως στόχο να ανακτήσει χρήσιμα χαρακτηριστικά κειμένων από το ύφος της γραφής, με στόχο την αυτόματη ταξινόμησή τους ως προς τον συγγραφέα τους. Η υφολογική πληροφορία εξάγεται μέσω της ανάλυσης του κειμένου με τεχνολογίες επεξεργασίας φυσικής γλώσσας, με την αυτόματη ανάλυση της διακύμανσης των γλωσσικών χαρακτηριστικών.
Υπάρχουσες στατιστικές τεχνικές αναγνωρίζουν με επιτυχία την ταυτότητα του συγγραφέα, το φύλο, τη μητρική γλώσσα , ακόμη και αν ένας συγγραφέας έχει άνοια. Πρόσφατα έχει υπάρξει αυξανόμενο ενδιαφέρον για την εφαρμογή μεθόδων αναγνώρισης συγγραφέα στα κοινωνικά δίκτυα, π.χ. ανίχνευση εθνικότητας συγγραφέα στα μέσα κοινωνικής δικτύωσης, φύλου και ηλικίας. Στα κοινωνικά δίκτυα, η στυλομετρία αποτελεί πολύ μεγάλη πρόκληση. Οι δημοσιεύσεις στα κοινωνικά δίκτυα γίνονται συνήθως μέσω tweets, σχόλιων, blogs, κλπ. Η μη τυπική χρήση της γλώσσας είναι συχνό φαινόμενο σε τέτοιου είδους δημοσιεύσεις, και καθιστά δύσκολη την επεξεργασία φυσικής γλώσσας. Επίσης, με δεδομένη την ταχύτητα με την οποία δημοσιεύεται νέο περιεχόμενο, η ανάγκη για σταδιακή επανεκπαίδευση του αλγόριθμου μηχανικής μάθησης καθίσταται απαραίτητη, προκειμένου να λάβει υπόψη του νέες παραλλαγές της χρήσης της γλώσσας που συνδέονται με τα διάφορα χαρακτηριστικά του κειμένου.
Η έρευνα σε αυτόν τον τομέα είναι ακόμα στα αρχικά της στάδια και οι περισσότερες υπάρχουσες προσεγγίσεις εστιάζουν μόνο σε ένα ή δύο χαρακτηριστικά, όπως η ηλικία και / ή το φύλο.
Ο στόχος της παρούσας εργασίας είναι μελετηθεί ο χώρος της αναγνώρισης συγγραφέα στα κοινωνικά δίκτυα και να προταθούν νέες προσεγγίσεις, οι οποίες θα λαμβάνουν υπόψη τη φύση των δεδομένων, με έμφαση στην συνεχή παραγωγή νέου περιεχομένου.

Αναγνώριση μοτίβων κίνησης εμποδίων στην αυτόνομη πλοήγηση ρομποτικής πλατφόρμας

Η αποφυγή δυναμικών εμποδιών εξασφαλίζει την ακεραιότητα τόσο της
ρομποτικής πλατφόρμας όσο και των ανθρώπων και υλικού που δρουν στον
ίδιο χώρο. Σκοπός της διπλωματικής είναι η ανάπτυξη μεθόδου για
εντοπισμό κινούμενων εμποδίων με βάση τους αισθητήρες της ρομποτικής
πλατφόρμας (αποστασιόμετρα και κάμερες) και αναγνώριση μοτίβων κίνησης
του εμποδίου. Μία τέτοια μέθοδος επιτρέπει, για παράδειγμα, τον
υπολογισμό αποτελεσματικών ελιγμών αποφυγής.

Η διπλωματική μπορεί να επεκτείνει το σχετικό σύστημα που έχει
αναπτυχθεί στο εργαστήριο ή να δοκιμάσει νέα προσέγγιση στο πρόβλημα.

Η διπλωματική δίνει την ευκαιρία στον φοιτητή να χρησιμοποιήσει
εξαιρετικά προηγμένες ρομποτικές πλατφόρμες και να πειραματιστεί με
τεχνολογίες αιχμής στην ρομποτική.

Απαιτείται καθημερινή παρουσία στο ΕΚΕΦΕ Δημόκριτος, εργάσιμες ημέρες
και ώρες, τουλάχιστον κατά την διάρκεια της πειραματικής φάσης της
διπλωματικής.

Ενδεικτική βιβλιογραφία

Theodoros Varvadoukas, Ioannis Giotis, Stasinos Konstantopoulos,
Detecting Human Patterns in Laser Range Data. In: Proceedings of the
20th European Conference on AI (ECAI 2012)
. Montpellier, France, 27-31
August 2012.

Syndicate content

© 2018 - Institute of Informatics and Telecommunications | National Centre for Scientific Research "Demokritos"

Terms of Service and Privacy Policy