Εξόρυξη Γνώσης από Μεγάλα Σύνολα Δεδομένων

Πληροφορίες Μαθήματος
ΤίτλοςΕξόρυξη Γνώσης από Μεγάλα Σύνολα Δεδομένων / Mining from Massive Datasets
ΚωδικόςDWS203
ΣχολήΘετικών Επιστημών
ΤμήμαΠληροφορικής
Κύκλος / Επίπεδο2ος / Μεταπτυχιακό
Περίοδος ΔιδασκαλίαςΕαρινή
Υπεύθυνος/ηΑπόστολος Παπαδόπουλος
ΚοινόΝαι
ΚατάστασηΕνεργό
Course ID600016262

Πρόγραμμα Σπουδών: ΠΜΣ ΕΠΙΣΤΗΜΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ (2018 έως σήμερα) ΠΦ

Εγγεγραμμένοι φοιτητές: 17
ΚατεύθυνσηΤύπος ΠαρακολούθησηςΕξάμηνοΈτοςECTS
ΚΟΡΜΟΣΥποχρεωτικό Κατ' Επιλογήν217,5

Πληροφορίες Τάξης
ΤίτλοςΕξόρυξη Γνώσης από Μεγάλα Σύνολα Δεδομένων
Ακαδημαϊκό Έτος2019 – 2020
Περίοδος ΤάξηςΕαρινή
Διδάσκοντες μέλη ΔΕΠ
Ώρες Εβδομαδιαία3
Ώρες Συνολικά39
Class ID
600153652
Τύπος Μαθήματος 2016-2020
  • Επιστημονικής Περιοχής
  • Ανάπτυξης Δεξιοτήτων
Τύπος Μαθήματος 2011-2015
Ειδικού Υποβάθρου / Κορμού
Τρόπος Παράδοσης
  • Πρόσωπο με πρόσωπο
Ηλεκτρονική Διάθεση Μαθήματος
Γλώσσα Διδασκαλίας
  • Ελληνικά (Διδασκαλία, Εξέταση)
  • Αγγλικά (Διδασκαλία, Εξέταση)
Μαθησιακά Αποτελέσματα
1. Οι φοιτητές θα αποκτήσουν σημαντικές γνώσεις σε τεχνικές επεξεργασίας και ανάλυσης μεγάλων δεδομένων. 2. Θα μπορούν αν εργαστούν σε ομάδες 3. Θα αποκτήσουν μεγαλύτερη αυτοπεποίθηση παρουσιάζοντας τη δουλειά τους στην τάξη 4. Θα έρθουν σε επαφή με σύγχρονες τεχνικές μεγάλων δεδομένων που χρησιμοποιούνται που έχουν μεγάλη ζήτηση και στη Βιομηχανία.
Γενικές Ικανότητες
  • Εφαρμογή της γνώσης στην πράξη
  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
  • Αυτόνομη εργασία
  • Ομαδική εργασία
  • Παραγωγή νέων ερευνητικών ιδεών
Περιεχόμενο Μαθήματος
- Εισαγωγή στα Μεγάλα Δεδομένα (Big Data) και στην Επιστήμη Δεδομένων (Data Science), βασικές έννοιες και προκλήσεις - Η πλατφόρμα Hadoop, βασικά και προχωρημένα θέματα. - Το οικοσύστημα του Hadoop: HDFS, Hbase, Pig, Hive - NoSQL databases - Θεωρητικά στοιχεία σχετικά με MapReduce και σχεδίαση αλγορίθμων - Η γλώσσα προγραμματισμού Scala. - Η πλατφόρμα Spark, βασικά και προχωρημένα θέματα. - Streaming, SQL, Machine Learning, GraphΧ: οι βασικές βιβλιοθήκες. - Διερεύνηση δεδομένων με το εργαλείο R πάνω από Spark. - Σχεδίαση αλγορίθμων σε Spark. - Βάσεις δεδομένων γράφων (graph databases) - Άλλα συστήματα: Giraph, GraphLab, Hama, BlinlkDB
Λέξεις Κλειδιά
μεγάλα δεδομένα, επεξεργασία δεδομένων, εξόρυξη από μεγάλα δεδομένα, ανάλυση δεδομένων
Τύποι Εκπαιδευτικού Υλικού
  • Διαφάνειες
  • Βιβλίο
Χρήση Τεχνολογιών Πληροφορίας και Επικοινωνιών
Χρήση Τ.Π.Ε.
  • Χρήση Τ.Π.Ε. στη Διδασκαλία
  • Χρήση Τ.Π.Ε. στην Εργαστηριακή Εκπαίδευση
  • Χρήση Τ.Π.Ε. στην Επικοινωνία με τους φοιτητές
  • Χρήση Τ.Π.Ε. στην Αξιολόγηση των Φοιτητών
Οργάνωση Μαθήματος
ΔραστηριότητεςΦόρτος ΕργασίαςECTSΑτομικάΟμαδικάErasmus
Διαλέξεις39
Μελέτη και ανάλυση βιβλίων και άρθρων100
Εκπόνηση μελέτης (project)55
Συγγραφή εργασίας / εργασιών32
Σύνολο226
Αξιολόγηση Φοιτητών
Μέθοδοι Αξιολόγησης Φοιτητών
  • Γραπτή Εξέταση με Ερωτήσεις Εκτεταμένης Απάντησης (Συμπερασματική)
  • Γραπτή Εργασία (Διαμορφωτική, Συμπερασματική)
  • Δημόσια Παρουσίαση (Διαμορφωτική, Συμπερασματική)
  • Γραπτή Εξέταση με Επίλυση Προβλημάτων (Συμπερασματική)
  • Έκθεση / Αναφορά (Διαμορφωτική, Συμπερασματική)
Βιβλιογραφία
Επιπρόσθετη βιβλιογραφία για μελέτη
H. Karau, A. Konwinski, P. Wendell, M. Zaharia: Learning Spark, O' Reilly, 2015. N. Lynch: Distributed algorithms, Morgan Kaufmann, 1996. I. Robinson, J. Webber, E. Eifrem: Graph databases, O' Reilly, 2013. S. Ryza, U. Laserson, S Owen, J. Wills: Advanced analytics with Spark, O'Reilly, 2015. R. Schutt, C. O'Neil: Doing Data Science, O' Reilly, 2014. C.A. Varela, G. Agha: Programming distributed computing systems: a foundational approach, The MIT Press, 2013.
Τελευταία Επικαιροποίηση
31-01-2020