Εξόρυξη Γνώσης

General

Course Contents

  • Εισαγωγή στις τεχνικές εξόρυξης δεδομένων. α) δεδομένα, β) προβλήματα, γ) εφαρμογές, δ) γενικές τεχνικές ανάλυσης και επεξεργασίας δεδομένων.
  • Προ-επεξεργασία δεδομένων: α) καθαρισμός δεδομένων, β) μετασχηματισμός δεδομένων,
  • Συσταδοποίηση (clustering): α) εισαγωγή στη συσταδοποίηση, β) μέτρα αποστάσεων, γ) k-means, δ) ιεραρχική συσταδοποίηση.
  • Κατηγοριοποίηση δεδομένων (Classification): α) εισαγωγή, β) δέντρα αποφάσεων (decision trees) γ) στατιστικές τεχνικές, δ) overfitting, γ) missing values, δ) δείκτες αποτίμησης μοντέλου, ε) άλλα είδη κατηγοριοποιητών (ταξινομητές με κανόνες, kκοντινότεροι γείτονες (k-nearest neighbors) στ) αλγόριθμοι κατηγοριοποίησης σε πολυδιάστατα δεδομένα χρονοσειρών, ζ) εύρεση συσχετισμών σε σχεσιακά δεδομένα.
  • Κανόνες συσχέτισης (association rules) : a) στοιχειοσύνολα (item sets) β)υποστήριξη (support) β) εμπιστοσύνη (confidence), γ) ο αλγόριθμος a-priori
  • Τεχνικές μείωσης διαστάσεων: Αλγόριθμοι επιλογής χαρακτηριστικών α) wrappers , β) filters, γ) embedded.
  • Εξόρυξη γνώσης από Αποθήκες Δεδομένων (Data Warehouses)
  • Εφαρμογές: εφαρμογή των τεχνικών εξόρυξης δεδομένων σε προβλήματα βιοϊατρικής, σε δεδομένα επιχειρήσεων, σε εικόνες, κείμενο και στο διαδίκτυο.
  • Google Analytics, Bussiness Analytics

Educational Goals

Σκοπός του μαθήματος είναι να εισάγει τον φοιτητή στις βασικές έννοιες …

Με την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής/τρια θα είναι σε θέση:

  • Να αναλύει την…
  • Να περιγράφει τις…
  • Να κατανοεί το…
  • Να συγκρίνει τα…

General Skills

  • Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
  • Ομαδική Εργασία
  • Σχεδιασμός και Διαχείριση Δεδομένων Μεγάλου Όγκου
  • Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης

Teaching Methods

Θεωρητική από έδρας διδασκαλία με συζήτηση και ενεργή συμμετοχή των φοιτητών. Κατά τη διάρκεια του μαθήματος γίνονται παρουσιάσεις σε power point.

Εργαστηριακές Ασκήσεις. Ηλεκτρονικό υλικό για τους αλγορίθμους Εξόρυξης Γνώσης.

Επίλυση Ασκήσεων.

Επίδειξη στο προβολικό και χρήση πίνακα.

Use of ICT means

Χρήση εξειδικευμένου λογισμικού. Υποστήριξη Μαθησιακής διαδικασίας μέσω της ηλεκτρονικής πλατφόρμας eclass (eclass.informatics.teicm.gr).

Ηλεκτρονικές Ασκήσεις Αυτοαξιολόγησης.

Επικοινωνία με φοιτητές μέσω e-mail και της ιστοσελίδας του μαθήματος.

Teaching Organization

ActivitySemester workload
Διαλέξεις26
Ασκήσεις Πράξης13
Εργαστηριακές Ασκήσεις13
Συγγραφή εργαστηριακών αναφορών13
Αυτοτελής Μελέτη Φοιτητή60
Total125

Students Evaluation

Ο τελικός βαθμός του μαθήματος διαμορφώνεται κατά 60% από τον βαθμό του θεωρητικού μέρους και κατά 40% από τον βαθμό του εργαστηριακού.

  1. Η γραπτή τελική εξέταση του θεωρητικού μέρους περιλαμβάνει:
    • Ερωτήσεις πολλαπλής επιλογής
    • Επίλυση προβλημάτων εφαρμογής των γνώσεων που αποκτήθηκαν.
    • Ερωτήσεις σύντομης απάντησης
    • Συγκριτική αξιολόγηση στοιχείων θεωρίας.
  2. Η εξέταση των ασκήσεων του εργαστηρίου περιλαμβάνει:
    • Την αξιολόγηση των εργαστηριακών δεξιοτήτων που αποκτήθηκαν μέσω εξέτασης των εργαστηριακών αναφορών κατά την οποία γίνεται και χρήση του εργαστηριακού εξοπλισμού (30%).
    • Γραπτή τελική εξέταση/εργασία (70%)

 

Recommended Bibliography

Συγγράμματα μέσω του συστήματος ΕΥΔΟΞΟΣ

  1. P.N. Tan, M. Steinbach, V. Kumar. Εισαγωγή στην Εξόρυξη Δεδομένων, Εκδόσεις Τζιόλα, 2009. (Introduction to Data Mining, Addison Wesley, 2006 ) (Εύδοξος)
  2. M. H. Dunham. Data Mining: Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα,Εκδόσεις Νέων Τεχνολογιών, 2004 (Data Mining: Introductory and Advanced Topics, Prentice Hall, 2003) (Εύδοξος)

Συγγράμματα που διανέμονται μέσω της ηλεκτρονικής σελίδας του μαθήματος

  1. Α.ΤΣΙΜΠΙΡΗΣ, Εξόρυξη Γνώσης – Εργαστηριακές ασκήσεις, Σέρρες, 2018.

Συμπληρωματική προτεινόμενη βιβλιογραφία

  1. J. Han, M. Kamber, J. Pei. Data Mining : Concepts and Techniques (3rd edition), Morgan Kaufmann, 2011.
  2. M. Kantardzic. Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-IEEE Press, 2002.
  3. I.H. Witten, E. Frank, M.A. Hall. Data Mining: Practical Machine Learning Tools and Techniques, (3rd edition), Morgan Kaufmann, 2011
  4. Μ. Βαζυργιάννης και Μ. Χαλκίδη. Εξόρυξη Γνώσης από Βάσεις Δεδομένων, και τον Παγκόσμιο Ιστό, – Γιώργος Δαρδανός, 2005
  5. 7. Α. Νανόπουλος, Ι. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη και τις Αποθήκες Δεδομένων, Εκδόσεις Νέων Τεχνολογιών, 2008