Σχετικά με αυτό το σεμινάριο

Η αξία των αριθμών στην ταξινόμηση κλινικών κειμένων

όνομα

Irena Spasic

Πανεπιστήμιο

Πανεπιστήμιο του Κάρντιφ

πανεπιστημιακή πόλη υποδοχής

Κάρντιφ, Ηνωμένο Βασίλειο

ημερομηνία

10/10/2024

χρόνος

3:30 μμ

τοποθεσία

Online

Περίληψη

Το κλινικό κείμενο περιλαμβάνει συχνά αριθμούς διαφόρων τύπων και μορφών. Ωστόσο, οι περισσότερες τρέχουσες προσεγγίσεις ταξινόμησης κειμένου δεν εκμεταλλεύονται αυτούς τους αριθμούς. Η παρούσα μελέτη έχει ως στόχο να αποδείξει ότι η χρήση αριθμών ως χαρακτηριστικών μπορεί να βελτιώσει σημαντικά την απόδοση των μοντέλων ταξινόμησης κειμένου. Η μελέτη αυτή καταδεικνύει επίσης τη δυνατότητα εξαγωγής τέτοιων χαρακτηριστικών από κλινικό κείμενο. Χρησιμοποιήθηκε μάθηση χωρίς επίβλεψη για τον εντοπισμό προτύπων χρήσης αριθμών σε κλινικό κείμενο. Τα μοτίβα αυτά αναλύθηκαν χειροκίνητα και μετατράπηκαν σε κανόνες αντιστοίχισης μοτίβων. Η εξαγωγή πληροφοριών χρησιμοποιήθηκε για την ενσωμάτωση αριθμών ως χαρακτηριστικών σε ένα μοντέλο αναπαράστασης εγγράφων. Αξιολογήσαμε μοντέλα ταξινόμησης κειμένου που εκπαιδεύτηκαν σε αυτή την αναπαράσταση. Τα πειράματά μας πραγματοποιήθηκαν με δύο μοντέλα αναπαράστασης εγγράφων (μοντέλο διανυσματικού χώρου και μοντέλο ενσωμάτωσης λέξεων) και δύο μοντέλα ταξινόμησης (μηχανές διανυσμάτων υποστήριξης και νευρωνικά δίκτυα). Τα αποτελέσματα έδειξαν ότι ακόμη και μια χούφτα αριθμητικών χαρακτηριστικών μπορεί να βελτιώσει σημαντικά τις επιδόσεις ταξινόμησης κειμένου. Καταλήγουμε στο συμπέρασμα ότι οι συνήθως χρησιμοποιούμενες αναπαραστάσεις εγγράφων δεν αναπαριστούν τους αριθμούς με τρόπο που οι αλγόριθμοι μηχανικής μάθησης να μπορούν να τους αξιοποιήσουν αποτελεσματικά ως χαρακτηριστικά. Παρόλο που αποδείξαμε ότι η παραδοσιακή εξαγωγή πληροφοριών μπορεί να είναι αποτελεσματική στη μετατροπή των αριθμών σε χαρακτηριστικά, απαιτείται περαιτέρω έρευνα σε επίπεδο κοινότητας για τη συστηματική ενσωμάτωση της αναπαράστασης των αριθμών στη διαδικασία ενσωμάτωσης λέξεων.

 

Σχετικά με τον ομιλητή

Η Irena Spasić είναι καθηγήτρια Πληροφορικής στο Πανεπιστήμιο του Κάρντιφ. Έλαβε το διδακτορικό της δίπλωμα στην επιστήμη των υπολογιστών από το Πανεπιστήμιο του Σάλφορντ, Ηνωμένο Βασίλειο, το 2004. Μετά από θέσεις στα Πανεπιστήμια του Βελιγραδίου, του Σάλφορντ και του Μάντσεστερ, εντάχθηκε στη Σχολή Επιστήμης Υπολογιστών και Πληροφορικής του Κάρντιφ το 2010 και έγινε τακτική καθηγήτρια το 2016. Ήταν συνδιευθύντρια του Data Innovation Research Institute και συνιδρύτρια του UK Healthcare Text Analytics Research Network. Το 2020 εξελέγη μέλος της Learned Society of Wales, της εθνικής ακαδημίας τεχνών και επιστημών. Τα ερευνητικά της ενδιαφέροντα περιλαμβάνουν την εξόρυξη κειμένου, την αναπαράσταση γνώσης, τη μηχανική μάθηση και τη διαχείριση πληροφοριών με εφαρμογές στην υγειονομική περίθαλψη, τις βιοεπιστήμες και τις κοινωνικές επιστήμες.

 

Μοιραστείτε το σεμινάριο: