• Γνώσεις προγραμματισμού (προτίμηση σε Python), Γνώσεις μηχανικής μάθησης
  • Εξοικείωση με εργαλεία ανάλυσης φυσικής γλώσσας και μηχανικής μάθησης
  • Konstantinos Bougiatiotis Anastasia Krithara
  • bogas.ko [at] gmail.com
  • The AI Lab
Description:

Την σημερινή εποχή υπάρχουν μεγάλες συλλογές κειμένων που περιέχουν βιοϊατρική πληροφορία κυρίως σημειώσεις γιατρών (clinical notes), ηλεκτρονικές εγγραφές ασθενών (electronic health records) και βιοϊατρικη βιβλιογραφία. Ιδιαίτερα με την τάση για ψηφιοποίηση των δεδομένων και την ραγδαία αύξηση των δημοσιεύσεων σε επιστημονικά περιοδικά, δημιουργείται ένας συνεχόμενα αυξανόμενος όγκος δεδομένων με πλούσια πληροφορία. Αυτό καθιστά επιτακτική την ανάγκη δημιουργίας εργαλείων αυτόματης εξόρυξης πληροφορίας.

Στο πλαίσιο αυτής της εργασίας θα επικεντρωθούμε στις παραπάνω κειμενικές συλλογές και σε εργαλεία αναγνώριοσης βιοϊατρικων οντοτήτων (biomedical Named Entity Recognition-NER) και εξόρυξης σχέσεων (relation extraction). Ο σκοπός της εργασίας είναι διττός:

– Αφ’ενός η συγκέντρωση των διαφορετικών εργαλείων, σύγκριση τους και  δημιουργία πλατφόρμας για πειραματισμό με αυτές

– Αφ’ετέρου η δημιουργία νέων συστημάτων που είτε στηρίζονται σε ήδη υπάρχοντα, είτε συνδυάζουν πολλαπλές προσεγγίσεις ή βασίζονται σε νεώτερες μεθόδους deep learning.

 

Indicative Bibliography:

  • Campos, D., Matos, S., & Oliveira, J. L. (2012). Biomedical named entity recognition: a survey of machine-learning tools. Theory and Applications for Advanced Text Mining, 175-195.
Skip to content