Ηλεκτρονική Διάθεση Μαθήματος
Μαθησιακά Αποτελέσματα
Με την ολοκλήρωση του μαθήματος, οι φοιτήτριες/τές θα είναι σε θέση:
• να κατανοούν βασικές έννοιες της Υπολογιστικής Γλωσσολογίας.
• να αναγνωρίζουν κυρίαρχες γλωσσολογικές θεωρίες σε πιο τεχνικά περιβάλλοντα.
• να αναλύουν (υπολογιστικά) την Αγγλική και Ελληνική γλώσσα σε διάφορα επίπεδα.
• να κατακτήσουν θεωρητικές και υπολογιστικές δεξιότητες στην επεξεργασία γλώσσας.
• να ακολουθούν τις βασικές τάσεις μιας συνεχώς εξελισσόμενης επιστημονικής περιοχής.
• να ερμηνεύουν ποικίλα φαινόμενα προσεγγίζοντάς τα υπολογιστικά.
Περιεχόμενο Μαθήματος
Η Υπολογιστική Γλωσσολογία αποτελεί διαθεματική επιστημονική ειδικότητα που συνδυάζει τη Γλωσσολογία, την Πληροφορική, την Ψυχολογία και τη Γνωσιακή Επιστήμη. Κύριος στόχος του μαθήματος είναι η εξοικείωση των φοιτητριών/τών με σημαντικά και σύγχρονα ερευνητικά ερωτήματα και θεωρητικές προσεγγίσεις στο πεδίο της Υπολογιστικής Γλωσσολογίας με τη χρήση ποικίλων εργαλείων και εφαρμογών. Ταυτόχρονα, το μάθημα θα εισάγει τις/τους φοιτήτριες/τές στην κωδικοποίηση της γλώσσας μέσω βασικού προγραμματισμού, ενώ επίσης θα παρουσίασει πρόσφατες τεχνικές κειμενικής επεξεργασίας και σημασιολογικής αναπαράστασης λεξικών σημασιών.
Στο πλαίσιο αυτό, θα διερευνήσουμε από υπολογιστική σκοπιά σημαντικά ζητήματα από τα γλωσσικά επίπεδα καλύπτοντας μια ευρεία θεματολογία, που περιλαμβάνει την Αναγνώριση και Σύνθεση Ομιλίας, τους Γραμματικούς Φορμαλισμούς, την Προτασιακή και Κατηγορηματική Λογική, την Επεξεργασία Φυσικής Γλώσσας και τη Μηχανική Μετάφραση. Σε όλη αυτή τη διερεύνηση, καίριας σημασίας θα είναι η μεθοδολογία της εμπειρικής γλωσσολογικής ανάλυσης και επεξεργασίας φυσικής γλώσσας με τη συνδρομή υπολογιστικών εργαλείων, εφαρμογών, ασκήσεων και θεωριών.
Επιπλέον, θα αναφερθούμε σε ειδικότερα θεωρητικά και τεχνικά θέματα, όπως τα n-grams μοντέλα, οι περιβαλλοντικά ελεύθερες γραμματικές, η μορφοσυντακτική ετικετοποίηση (tagging), η διανυσματική σημασιολογική, οι δημιουργοί σωμάτων κειμένων και συμφραστικών πινάκων, πάντα μέσω ασκήσεων και εργασιών που αποσκοπούν στη χρήση από μέρους των φοιτητριών/τών ποικίλων πρακτικών εργαλείων, σωμάτων κειμένων και διαφόρων άλλων προκατασκευασμένων αλγορίθμων.
Λέξεις Κλειδιά
βασικός προγραμματισμός, αναγνώριση-σύνθεση ομιλίας, επεξεργασία φυσικής γλώσσας, μηχανική μετάφραση
Επιπρόσθετη βιβλιογραφία για μελέτη
Main Coursebook
Jurafsky and Martin (2000, 2007, 2017). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (1st, 2nd, 3rd edition). Prentice Hall. (https://web.stanford.edu/~jurafsky/slp3/)
Supplementary Reading
Roark B. & Sproat R. (2007). Computational Approaches to Morphology and Syntax. Oxford: Oxford University Press.
Manning & Schütze (1999). Foundations of Statistical Natural Language Processing. MIT Press.
Bird S., Klein E. & Loper E. (2009). Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. O’ Reilly Media.
Καρασίμος, Α. (2011). Υπολογιστική Επεξεργασία της Αλλομορφίας στην Παραγωγή Λέξεων της Νέας Ελληνικής. Διδακτορική Διατριβή. σσ. 305. Πανεπιστήμιο Πατρών: Τμήμα Φιλολογίας. DOI: 10.13140/RG.2.1.1570.7926
Supplementary Bibliography
Basirat A., Faili H. & Nivre J. (2015). A statistical model for grammar mapping. Natural Language Engineering 22 (2): 215–255.
Goldsmith, J. (2000). Linguistica: An Automatic Morphological Analyzer. In A. Okrent and J. Boyle (Eds.) The Proceedings from the Main Session of the Chicago Linguistic Society's Thirty-sixth Meeting, pp. 1-36.
Hammarström, H. & Borin, L. (2011). Unsupervised learning of morphology. Computational Linguistics, 37(2), pp. 309–350.
Maletti A. (2017). Survey: Finite-state technology in natural language processing. Theoretical Computer Science 679, pp. 2–17.