Επέκταση πύλης ενημέρωσης με μεθόδους αυτόματης συντήρησης των κανόνων εξαγωγής πληροφορίας από τις ειδησεογραφικές πηγές

  • MScBSc
  • Γνώσεις προγραμματισμού, κατά προτίμηση σε Java.
  • Γνώσεις μηχανικής μάθησης ή/και γλωσσικής τεχνολογίας ή/και διαδικτυακού προγραμματισμού.
  • Anastasia Krithara George Paliouras
  • akrithara [at] iit.demokritos.gr
  • The AI Lab

Description:

Στο Εργαστήριο έχει αναπτυχθεί μία εξατομικευμένη πύλη ενημέρωσης από τον Παγκόσμιο Ιστό η οποία συλλέγει ειδήσεις από διάφορες πηγές και τις παρέχει εξατομικευμένα στους χρήστες της. Για το σκοπό αυτό, η πύλη χρησιμοποιεί κανόνες εξαγωγής της πληροφορίας από της πηγές. Οι κανόνες αυτοί υλοποιούνται ως κανονικές εκφράσεις, ο οποίες εφαρμόζονται στο κείμενο των ιστοσελίδων και εξάγουν την ενδιαφέρουσα πληροφορία, π.χ. τον τίτλο της είδησης. Ένα από τα βασικά προβλήματα είναι η συντήρηση αυτών των κανόνων για πολλές πηγές οι οποίες μεταβάλουν τον τρόπο παρουσίασης της πληροφορίας στον χρόνο. Στόχος της εργασίας είναι η ανάπτυξη μεθόδων αυτόματου εντοπισμού αυτών των αλλαγών και ενημέρωσης των κανόνων εξαγωγής πληροφορίας με μεθόδους μηχανικής μάθησης.
Skip to content