Επέκταση πύλης ενημέρωσης με μεθόδους αυτόματης συντήρησης των κανόνων εξαγωγής πληροφορίας από τις ειδησεογραφικές πηγές

Printer-friendly versionSend by email
Qualifications Required: 
Γνώσεις προγραμματισμού, κατά προτίμηση σε Java.
Qualifications Desired: 
Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας ή/και διαδικτυακού προγραμματισμού.

Στο Εργαστήριο έχει αναπτυχθεί μία εξατομικευμένη πύλη ενημέρωσης από τον Παγκόσμιο Ιστό η οποία συλλέγει ειδήσεις από διάφορες πηγές και τις παρέχει εξατομικευμένα στους χρήστες της. Για το σκοπό αυτό, η πύλη χρησιμοποιεί κανόνες εξαγωγής της πληροφορίας από της πηγές. Οι κανόνες αυτοί υλοποιούνται ως κανονικές εκφράσεις, ο οποίες εφαρμόζονται στο κείμενο των ιστοσελίδων και εξάγουν την ενδιαφέρουσα πληροφορία, π.χ. τον τίτλο της είδησης. Ένα από τα βασικά προβλήματα είναι η συντήρηση αυτών των κανόνων για πολλές πηγές οι οποίες μεταβάλουν τον τρόπο παρουσίασης της πληροφορίας στον χρόνο. Στόχος της εργασίας είναι η ανάπτυξη μεθόδων αυτόματου εντοπισμού αυτών των αλλαγών και ενημέρωσης των κανόνων εξαγωγής πληροφορίας με μεθόδους μηχανικής μάθησης.

Administration

© 2018 - Institute of Informatics and Telecommunications | National Centre for Scientific Research "Demokritos"

Terms of Service and Privacy Policy