ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΟΜΙΛΙΑΣ

Πληροφορίες Μαθήματος
ΤίτλοςΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΟΜΙΛΙΑΣ / DISCRETE-TIME SPEECH PROCESSING
ΚωδικόςNDM-07-02
ΣχολήΘετικών Επιστημών
ΤμήμαΠληροφορικής
Κύκλος / Επίπεδο1ος / Προπτυχιακό, 2ος / Μεταπτυχιακό
Περίοδος ΔιδασκαλίαςΧειμερινή
Υπεύθυνος/ηΚωνσταντίνος Κοτρόπουλος
ΚοινόΌχι
ΚατάστασηΕνεργό
Course ID40002974

Πρόγραμμα Σπουδών: ΠΠΣ-Τμήμα Πληροφορικής (2019-σήμερα)

Εγγεγραμμένοι φοιτητές: 18
ΚατεύθυνσηΤύπος ΠαρακολούθησηςΕξάμηνοΈτοςECTS
ΓΕΝΙΚΗ ΚΑΤΕΥΘΥΝΣΗΥΠΟΧΡΕΩΤΙΚΟ ΚΑΤΑ ΕΠΙΛΟΓΗ745

Πληροφορίες Τάξης
ΤίτλοςΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΟΜΙΛΙΑΣ
Ακαδημαϊκό Έτος2020 – 2021
Περίοδος ΤάξηςΧειμερινή
Διδάσκοντες μέλη ΔΕΠ
Ώρες Εβδομαδιαία4
Class ID
600176704
Τύπος Μαθήματος 2016-2020
  • Υποβάθρου
Τύπος Μαθήματος 2011-2015
Γενικού Υποβάθρου
Τρόπος Παράδοσης
  • Πρόσωπο με πρόσωπο
Ηλεκτρονική Διάθεση Μαθήματος
Erasmus
Το μάθημα προσφέρεται και σε φοιτητές προγραμμάτων ανταλλαγής.
Γλώσσα Διδασκαλίας
  • Ελληνικά (Διδασκαλία, Εξέταση)
  • Αγγλικά (Διδασκαλία, Εξέταση)
Προαπαιτήσεις
Γενικές Προαπαιτήσεις
Προϋποτίθεται προγραμματιστική ικανότητα. Πλην της αυτονόητης κατανόησης εννοιών και τεχνικών από τα Σήματα-Συστήματα, Ψηφιακή Επεξεργασία Σήματος, Επεξεργασία Στοχαστικού Σήματος, Αναγνώριση Προτύπων, προηγούμενη έκθεση σ' ένα μάθημα Μερικών Διαφορικών Εξισώσεων βοηθά στη γρηγορότερη αφομοίωση των εννοιών και την επιτυχέστερη τριβή με το αντικείμενο
Μαθησιακά Αποτελέσματα
Γνώσεις: Εξοικείωση με τεχνικές βραχυχρόνιας επεξεργασίας σημάτων. Έκθεση σε στοιχειώδεις γνώσεις της επιστήμης της ομιλίας. Θεμελίωση της ανάλυση γραμμικής πρόβλεψης. Κατανόηση των τεχνικών εξαγωγής χαρακτηριστικών γνωρισμάτων για την αντιμετώπιση του προβλήματος αναγνώρισης ομιλίας υπό το πρίσμα της αναγνώρισης προτύπων. Δεξιότητες: Θεμελίωση υποβάθρου για τη σπουδή της αναγνώρισης και σύνθεσης ομιλίας και τριβής με τη γλωσσική τεχνολογία. Απόκτηση των αναγκαίων αναλυτικών και προγραμματιστικών δεξιοτήτων. Κριτική αξιοποίηση γνώσεων από το σύνολο του προπτυχιακού προγράμματος σπουδών στην επεξεργασία της ομιλίας. Ανάπτυξη συστήματος αναγνώρισης μεμονωμένων λέξεων από τον προφορικό λόγο.
Γενικές Ικανότητες
  • Εφαρμογή της γνώσης στην πράξη
  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
  • Προσαρμογή σε νέες καταστάσεις
  • Λήψη αποφάσεων
  • Αυτόνομη εργασία
  • Παραγωγή νέων ερευνητικών ιδεών
  • Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης
Περιεχόμενο Μαθήματος
Ανατομία και φυσιολογία του συστήματος παραγωγής ομιλίας. Φωνητική και φωνολογία. Μοντελοποίηση του συστήματος παραγωγής ομιλίας. Βραχυχρόνια επεξεργασία ομιλίας. Ανάλυση Γραμμικής Πρόβλεψης. Ανάλυση χάσματος (cepstral analysis). Δυναμική χρονική κλιμάκωση (dynamic time warping).
Λέξεις Κλειδιά
Φωνητική, Παραγωγή Ομιλίας, Βραχυχρόνια Επεξεργασία Ομιλίας, Ανάλυση Γραμμικής Πρόβλεψης, Χασματική Ανάλυση, Δυναμική Χρονική Κλιμάκωση
Τύποι Εκπαιδευτικού Υλικού
  • Σημειώσεις
  • Διαφάνειες
  • Βιβλίο
Χρήση Τεχνολογιών Πληροφορίας και Επικοινωνιών
Χρήση Τ.Π.Ε.
  • Χρήση Τ.Π.Ε. στη Διδασκαλία
  • Χρήση Τ.Π.Ε. στην Εργαστηριακή Εκπαίδευση
  • Χρήση Τ.Π.Ε. στην Επικοινωνία με τους φοιτητές
Περιγραφή
Διαφάνεις σε ηλεκτρονική μορφή, MATLAB demos.
Οργάνωση Μαθήματος
ΔραστηριότητεςΦόρτος ΕργασίαςECTSΑτομικάΟμαδικάErasmus
Διαλέξεις60
Μελέτη και ανάλυση βιβλίων και άρθρων15
Φροντιστήριο15
Εκπόνηση μελέτης (project)30
Συγγραφή εργασίας / εργασιών15
Εξετάσεις15
Σύνολο150
Αξιολόγηση Φοιτητών
Περιγραφή
α1. Η παρακολούθηση των διαλέξεων και η ενεργός συμμετοχή σ' αυτές είναι υποχρεωτική. Ανεκτός αριθμός απουσιών: το πολύ 30% του συνολικού εκπαιδευτικού προγράμματος. Υπέρβαση του ανεκτού αριθμού απουσιών συνεπάγεται αυτομάτως την αποτυχία του φοιτητή στο μάθημα. α2. Στο μάθημα προσφέρονται υποχρεωτικές βιβλιογραφικές και προγραμματιστικές εργασίες. Οι βιβλιογραφικές εργασίες αφορούν τη συγγραφή δοκιμίων σχετικών με τις διάφορες φάσεις της ψηφιακής επεξεργασίας του σήματος της ομιλίας, των διαδικασιών αναγνώρισης ομιλίας και ομιλητών καθώς και της στατιστικής μοντελοποίησης της γλώσσας. Οι προγραμματιστικές ασκήσεις αφορούν την ανάπτυξη εφαρμογών σχετικών με την μοντελοποίηση του συστήματος παραγωγής ανθρώπινης ομιλίας, την κατάτμηση σήματος ομιλίας, την προέμφαση, την εφαρμογή βραχυχρόνιων μετασχηματισμών, την ανάλυση γραμμικής πρόβλεψης, την ομομορφική επεξεργασία του σήματος ομιλίας, τη δυναμική χρονική κλιμάκωση. Οι φοιτητές καλούνται να αναπτύξουν κώδικα σε MATLAB ή python. Σε κάθε φοιτητή ανατίθεται μια (1) βιβλιογραφική και μια (1) συναφής προγραμματιστική εργασία. Η ανακοίνωση της ανάθεσης εργασιών στους φοιτητές γίνεται στη σελίδα του μαθήματος στον ΠΗΛΕΑ http://pileas.csd.auth.gr. α3. Στο μάθημα οργανώνονται δύο γραπτές πρόοδοι υπό τον τύπο σύντομων απαντήσεων σε 10-15 ερωτήματα/προβλήματα που καλύπτουν τη διδαχθείσα ύλη. Η πρώτη πρόοδος οργανώνεται την 8η εβδομάδα και η δεύτερη πρόοδος εντός της εξεταστικής περιόδου. Ο τελικός βαθμός προκύπτει κατά 10% από την αξιολόγηση της βιβλιογραφικής εργασίας, 50% από την αξιολόγηση της υπολογιστικής εργασίας και την παρουσίαση των αποτελεσμάτων της και 40% από τις επιδόσεις στις γραπτές προόδους. Οι φοιτητές προάγονται, εφόσον ο τελικός βαθμός είναι μεγαλύτερος ή ίσος του πέντε (5). Λεπτομέρειες επί της διαδικασίας παρατίθενται στον ΠΗΛΕΑ, οι οποίες καταργούν κάθε άλλη ρύθμιση.
Μέθοδοι Αξιολόγησης Φοιτητών
  • Γραπτή Εξέταση με Ερωτήσεις Σύντομης Απάντησης (Διαμορφωτική, Συμπερασματική)
  • Γραπτή Εργασία (Διαμορφωτική, Συμπερασματική)
  • Δημόσια Παρουσίαση (Διαμορφωτική, Συμπερασματική)
  • Γραπτή Εξέταση με Επίλυση Προβλημάτων (Διαμορφωτική, Συμπερασματική)
Βιβλιογραφία
Βιβλιογραφία μαθήματος (Εύδοξος)
Rabiner, L. R., and Schafer, R. W. (επιμ. μτφ. Α. Πικράκης) «Ψηφιακή Επεξεργασία Φωνής», Broken Hill Publishers LTD, Λευκωσία Κύπρος 2012. McClellan J., Schafer R., Yoder M. (μτφ. Ε. Ζ. Ψαράκης) «Θεμελιώδεις Έννοιες της Επεξεργασίας Σημάτων», Εκδόσεις Άγγελος Γκότσης, Πάτρα 2006
Επιπρόσθετη βιβλιογραφία για μελέτη
Σημειώσεις σε ηλεκτρονική μορφή του διδάσκοντος και επιμέλεια διαφανειών από διδασκαλία αντίστοιχου μαθήματος σε πανεπιστήμια του εξωτερικού. Ενδεικτικoί τίτλοι. Πλήρης κατάλογος στην ιστοσελίδα του μαθήματος: J. R. Deller, J. G. Proakis, and J. H. L. Hansen, Discrete-Time Processing of Speech Signals. New York, Ν.Y.: Wiley-IEEE, 1999. D. Jurafsky and J. H. Martin, Speech and Language Processing, 2/e. Upper Saddle River, N.J.: Pearson Education-Prentice Hall, 2009. T. F. Quartieri, Discrete-Time Speech Signal Processing: Principles and Practice. Upper Saddle River, N.J.: Pearson Education-Prentice Hall, 2002. X. Huang, A. Acero, and H. -S. Hon, Spoken Language Processing. Upper Saddle River, N.J.: Pearson Education-Prentice Hall, 2001. L. R. Rabiner and R. W. Schafer, Theory and Applications of Digital Speech Processing. Upper Saddle River, N.J.: Pearson Education-Prentice Hall, 2011. T. Dutoit and F. Marques, Applied Signal Processing. A MATLAB-Based Proof of Concept. New York, N.Y.: Springer, 2009 (πρόσβαση στο e-book μέσω του www.lib.auth.gr)
Τελευταία Επικαιροποίηση
07-12-2020