Ηλεκτρονική Διάθεση Μαθήματος
Μαθησιακά Αποτελέσματα
1.θα γνωρίζει τα κύρια ιδρύματα που λειτουργούν σε εθνικό και διεθνές επίπεδο και τις πηγές δεδομένων τους (π.χ. Eurostat, ΕΚΤ, ΔΝΤ, ΔΟΕ, BIS, ΟΗΕ, ΟΟΣΑ, Παγκόσμια Τράπεζα).
2.θα κατανοεί και θα είναι σε θέση να χρησιμοποιεί με κριτικό τρόπο διαφορετικά είδη πηγών δεδομένων, όπως απογραφές, δειγματοληπτικές έρευνες - διασταύρωσης, διαχρονικές -, διοικητικές πηγές, μεγάλα δεδομένα.
3.θα μπορεί να κατανοεί τα μεθοδολογικά ζητήματα που σχετίζονται με ορισμένους ειδικούς τομείς των επίσημων στατιστικών και να ερμηνεύει σωστά τις επίσημες στατιστικές.
4.θα είναι σε θέση να εφαρμόσει μεθόδους κατάλληλες για την παραγωγή και ανάλυση δεδομένων στο συγκεκριμένο πεδίο.
5.θα έχει τη γνώση και ικανότητα εφαρμογής ειδικών στατιστικών μεθόδων, μεθόδων δειγματοληψίας, μεθόδων αντιμετώπισης μη απόκρισης και χαμένων τιμών.
6.θα γνωρίζει πως να κάνει χρήση στατιστικών προγραμμάτων όπως R ή SPSS.
7.θα έχει την ικανότητα να παρουσιάζει δεδομένα με αποτελεσματικό τρόπο σε διαφορετικά είδη ακροατηρίων.
8.θα γνωρίζει τα διάφορα διαθέσιμα εργαλεία διάδοσης και παρουσίασης των δεδομένων και των μεταδεδομένων (πίνακες, διαγράμματα σε στατικό και δυναμικό web-based περιβάλλον κ.λπ.
Περιεχόμενο Μαθήματος
Βασικές έννοιες στους εθνικούς λογαριασμούς. Βασικές έννοιες στη δημογραφία, τους ορισμούς, τα ερευνητικά ερωτήματα και το πλαίσιο της δημογραφίας και της δημογραφικής έρευνας. Εισαγωγή στις τεχνικές δημογραφικής ανάλυσης. στοιχεία της περιόδου και της συλλογικής ανάλυσης. δημογραφικά ποσοστά, δείκτες και μέτρα. Πηγές δεδομένων (απογραφή, ζωτικά στατιστικά στοιχεία, δειγματοληπτικές έρευνες) και σφάλματα στα δημογραφικά δεδομένα. Πληθυσμιακή αλλαγή και δομή. ανάλυση δεδομένων μετανάστευσης. Πυραμίδες πληθυσμού, παράγοντες που επηρεάζουν την ηλικιακή κατανομή του πληθυσμού. κοινωνικοοικονομικές και δημογραφικές επιπτώσεις της γήρανσης του πληθυσμού. Προβλέψεις και προβολές πληθυσμού. Βασικές έννοιες, σύγχρονη θεωρία και πρακτική των αριθμών δεικτών ως μέσο σύγκρισης των τιμών και των ποσοτήτων.
Εισαγωγή δεδομένων από Ευρωπαϊκές βάσεις δημογραφικών δεδομένων (Big Data). Καθαρισμός και προετοιμασία δεδομένων (Tidying data), μέθοδοι αντιμετώπισης μη απόκρισης (nonresponders) και μέθοδοι απόδοσης ελλειπόντων τιμών (missing values) με διαδικασίες στάθμισης και πολλαπλής απόδοσης (weights and multiple imputation), υπολογισμός εκτιμητών, στατιστική ανάλυση και έλεγχοι υποθέσεων σε δεδομένα δειγματοληπτικών ερευνών. Οι διαδικασίες Complex Samples Procedures του λογισμικού IBM Statistics SPSS και οι βιβλιοθήκες tidyr, stringr, lubridate, Hmisc, mice, survey, nlme, lme4, dplyr, shiny, surveyoutliers, tabplot, survey, eurostat, RcmdrPlugin.sampling , cbsodataR , censusapi του λογισμικού R στο περιβάλλον του RStudio. Παρουσίαση – οπτικοποίηση δεδομένων και αποτελεσμάτων με τη βιβλιοθήκη ggplot2.
Λέξεις Κλειδιά
μεγάλα δεδομένα, Tidying data, χαμένες τιμές, πολλαπλή απόδοση χαμένων τιμών, δειγματοληπτικά δεδομένα, R, RStudio, IBM Statistics SPSS
Επιπρόσθετη βιβλιογραφία για μελέτη
1. Särndal, C., B. Swensson, and J. Wretman. 1992. Model Assisted Survey Sampling. New York: Springer-Verlag.
2. Lumley, T. 2010. Complex Surveys A Guide to Analysis Using R. John Wiley & Sons, Inc., Hoboken, New Jersey.
3. IBM SPSS Complex Samples 21. IBM Corporation, 1989 – 2012.
4. Rubin B. D. 1987. Multiple Imputation for Nonresponse in Surveys. John Wiley & Sons, Inc., Hoboken, New Jersey.
5. Stef van Buuren . 2012. Flexible Imputation of Missing Data. CRC Press,Taylor & Francis Group, Boca Raton.
6. Särndal, Lundström. 2005. Estimation in Surveys with Nonresponse. John Wiley & Sons Ltd, West Sussex, UK.
7. Bethlehem J., Cobben F., Schouten B. 2011. Handbook of Nonresponse in Household Surveys. John Wiley & Sons, Inc., Hoboken, New Jersey.