Ηλεκτρονική Διάθεση Μαθήματος
Μαθησιακά Αποτελέσματα
Γνωστικά: Οι φοιτητές αποκτούν εξειδικευμένη γνώση επάνω στην επεξεργασία κειμένων, τις διανυσματικές αναπαραστάσεις λέξεων και την ανάλυση κειμένων με στατιστικά γλωσσικά μοντέλα, με τον αφελή ταξινομητή Bayes με κρυφά Μαρκοβιανά μοντέλα και με νευρωνικά δίκτυα (εμπρόσθιας τροφοδότησης, αναδρομικά, μετασχηματιστές). Επιπλέον εμβαθύνουν σε διάφορες εργασίες ανάλυσης κειμένων, όπως ανάλυση συναισθήματος, ταξινόμηση λέξεων σε μέρη του λόγου, απόσπαση πληροφορίας, μηχανική μετάφραση, απάντηση ερωτήσεων και αυτόματη περίληψη.
Δεξιότητες: Οι φοιτητές αποκτούν εξοικείωση με διάφορες βιβλιοθήκες ανάλυσης δεδομένων κειμένου στη γλώσσα Python, όπως NLTK, spaCy και HuggingFace.
Περιεχόμενο Μαθήματος
Επεξεργασία κειμένου, μοντελοποίηση γλώσσας με ν-γράμματα λέξεων, ταξινομητές κειμένου, διανυσματική σημασιολογία, νευρωνικά δίκτυα και νευρωνικά μοντέλα γλώσσας, χαρακτηρισμός ακολουθιών, επεξεργασία ακολουθιών με αναδρομικά νευρωνικά δίκτυα, μηχανική μετάφραση και μοντέλα κωδικοποίησης-αποκωδικοποίησης, εφαρμογές (απόσπαση πληροφορίας, απάντηση ερωτήσεων, αυτόματη περίληψη).