ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗΣ ΜΕΓΑΛΩΝ ΔΕΔΟΜΕΝΩΝ

Πληροφορίες Μαθήματος
ΤίτλοςΤΕΧΝΟΛΟΓΙΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗΣ ΜΕΓΑΛΩΝ ΔΕΔΟΜΕΝΩΝ / TECHNOLOGIES FOR BIG DATA MANAGEMENT AND ANALYTICS
ΚωδικόςIS-27
ΣχολήΘετικών Επιστημών
ΤμήμαΠληροφορικής
Κύκλος / Επίπεδο2ος / Μεταπτυχιακό
Περίοδος ΔιδασκαλίαςΧειμερινή
Υπεύθυνος/ηΑπόστολος Παπαδόπουλος
ΚοινόΌχι
ΚατάστασηΕνεργό
Course ID600000820

Πληροφορίες Τάξης
ΤίτλοςΤΕΧΝΟΛΟΓΙΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗΣ ΜΕΓΑΛΩΝ ΔΕΔΟΜΕΝΩΝ
Ακαδημαϊκό Έτος2016 – 2017
Περίοδος ΤάξηςΧειμερινή
Διδάσκοντες μέλη ΔΕΠ
Ώρες Εβδομαδιαία3
Class ID
600039941
Τύπος Μαθήματος 2016-2020
  • Επιστημονικής Περιοχής
  • Ανάπτυξης Δεξιοτήτων
Τύπος Μαθήματος 2011-2015
Ειδικού Υποβάθρου / Κορμού
Τρόπος Παράδοσης
  • Πρόσωπο με πρόσωπο
Ηλεκτρονική Διάθεση Μαθήματος
Γλώσσα Διδασκαλίας
  • Ελληνικά (Διδασκαλία, Εξέταση)
  • Αγγλικά (Διδασκαλία, Εξέταση)
Μαθησιακά Αποτελέσματα
1. Οι φοιτητές θα αποκτήσουν σημαντικές γνώσεις σε τεχνικές επεξεργασίας και ανάλυσης μεγάλων δεδομένων. 2. Θα μπορούν αν εργαστούν σε ομάδες 3. Θα αποκτήσουν μεγαλύτερη αυτοπεποίθηση παρουσιάζοντας τη δουλειά τους στην τάξη 4. Θα έρθουν σε επαφή με σύγχρονες τεχνικές μεγάλων δεδομένων που χρησιμοποιούνται που έχουν μεγάλη ζήτηση και στη Βιομηχανία.
Γενικές Ικανότητες
  • Εφαρμογή της γνώσης στην πράξη
  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
  • Αυτόνομη εργασία
  • Ομαδική εργασία
  • Παραγωγή νέων ερευνητικών ιδεών
Περιεχόμενο Μαθήματος
- Εισαγωγή στα Μεγάλα Δεδομένα (Big Data) και στην Επιστήμη Δεδομένων (Data Science), βασικές έννοιες και προκλήσεις - Η πλατφόρμα Hadoop, βασικά και προχωρημένα θέματα. - Το οικοσύστημα του Hadoop: HDFS, Hbase, Pig, Hive - NoSQL databases - Θεωρητικά στοιχεία σχετικά με MapReduce και σχεδίαση αλγορίθμων - Η γλώσσα προγραμματισμού Scala. - Η πλατφόρμα Spark, βασικά και προχωρημένα θέματα. - Streaming, SQL, Machine Learning, GraphΧ: οι βασικές βιβλιοθήκες. - Διερεύνηση δεδομένων με το εργαλείο R πάνω από Spark. - Σχεδίαση αλγορίθμων σε Spark. - Βάσεις δεδομένων γράφων (graph databases) - Άλλα συστήματα: Giraph, GraphLab, Hama, BlinlkDB
Λέξεις Κλειδιά
μεγάλα δεδομένα, επεξεργασία δεδομένων, εξόρυξη από μεγάλα δεδομένα, ανάλυση δεδομένων
Τύποι Εκπαιδευτικού Υλικού
  • Διαφάνειες
  • Βιβλίο
Χρήση Τεχνολογιών Πληροφορίας και Επικοινωνιών
Χρήση Τ.Π.Ε.
  • Χρήση Τ.Π.Ε. στη Διδασκαλία
  • Χρήση Τ.Π.Ε. στην Εργαστηριακή Εκπαίδευση
  • Χρήση Τ.Π.Ε. στην Επικοινωνία με τους φοιτητές
  • Χρήση Τ.Π.Ε. στην Αξιολόγηση των Φοιτητών
Οργάνωση Μαθήματος
ΔραστηριότητεςΦόρτος ΕργασίαςECTSΑτομικάΟμαδικάErasmus
Διαλέξεις391,3
Μελέτη και ανάλυση βιβλίων και άρθρων1003,3
Εκπόνηση μελέτης (project)551,8
Συγγραφή εργασίας / εργασιών321,1
Σύνολο2267,5
Αξιολόγηση Φοιτητών
Μέθοδοι Αξιολόγησης Φοιτητών
  • Γραπτή Εξέταση με Ερωτήσεις Εκτεταμένης Απάντησης (Συμπερασματική)
  • Γραπτή Εργασία (Διαμορφωτική, Συμπερασματική)
  • Δημόσια Παρουσίαση (Διαμορφωτική, Συμπερασματική)
  • Γραπτή Εξέταση με Επίλυση Προβλημάτων (Συμπερασματική)
  • Έκθεση / Αναφορά (Διαμορφωτική, Συμπερασματική)
Βιβλιογραφία
Επιπρόσθετη βιβλιογραφία για μελέτη
H. Karau, A. Konwinski, P. Wendell, M. Zaharia: Learning Spark, O' Reilly, 2015. N. Lynch: Distributed algorithms, Morgan Kaufmann, 1996. I. Robinson, J. Webber, E. Eifrem: Graph databases, O' Reilly, 2013. S. Ryza, U. Laserson, S Owen, J. Wills: Advanced analytics with Spark, O'Reilly, 2015. R. Schutt, C. O'Neil: Doing Data Science, O' Reilly, 2014. C.A. Varela, G. Agha: Programming distributed computing systems: a foundational approach, The MIT Press, 2013.
Τελευταία Επικαιροποίηση
16-10-2015