Introduction
Dalende verkopen? Weglopende klanten? Een toename aan fraude bij transacties? Valt daar dan echt niets aan te doen?
Natuurlijk wel! Alles begint bij het inzicht proberen verzamelen waarom deze fenomenen zich voordoen. Gelukkig is daar data mining voor.
In deze opleiding leer je de basisprincipes van data mining, in theorie en in de praktijk. Tijdens deze cursus leer je hoe je waardevolle inzichten kunt halen uit grote hoeveelheden gegevens.
Leerdoelen
Vaardigheden:
Het kunnen toepassen van de verschillende technieken van data mining, zoals classification, regression, APriori, clustering en K-means.
Het kunnen gebruiken van het tool Weka voor data mining oefeningen en voorbeelden.
Het kunnen uitvoeren van preprocessing oefeningen in Weka.
Het kunnen evalueren van een model met verschillende technieken.
Kennis:
Begrip van de definitie van data mining en de toepassingen hiervan.
Kennis van verschillende technieken en mogelijkheden van data mining, zoals classification, regression, APriori, clustering en K-means.
Begrip van de werking van data mining en de verschillende methodes die gebruikt kunnen worden.
Kennis van hoe verschillende technieken geëvalueerd kunnen worden.
Attitude:
Openstaan voor nieuwe technologieën en innovaties op het gebied van data mining.
Het belang erkennen van het begrijpen en analyseren van data.
Het ontwikkelen van een kritische houding ten opzichte van de resultaten en de betrouwbaarheid van data mining.
Programma
In deze cursus Data Mining worden de volgende onderwerpen behandeld:
Definitie van data mining en voorbeelden van wat we ermee kunnen doen.
Gebruik van het Weka hulpmiddel voor voorbeelden en oefeningen.
Preprocessing oefeningen in Weka.
Uitleg over hoe data mining werkt en welke technieken kunnen worden gebruikt voor verschillende taken.
Bespreking van verschillende evaluatiemogelijkheden van een model.
Uitgebreide uitleg van de volgende technieken:
Classificatie: voorspellen van welke klasse een individu behoort.
Regressie: voorspellen van de numerieke waarde van een variabele voor een individu.
APriori algoritme: leren van correlaties en relaties in een database met veel transacties.
Clustering: groeperen van individuen op basis van hun gelijkenissen zonder specifiek doel.
Bespreking van de twee clustering methodes:
K-means: de populatie wordt verdeeld in K groepen.
Hiërarchische clustering: een hiërarchie van clusters wordt opgebouwd.