Leertraject

Deep Dive in Algoritmes

We need to go deeper!

  • 2 dagen
  • Gevorderd

Introduction

"Data is de nieuwe olie." De meeste mensen hebben dit wel eens gehoord.

De meeste mensen beseffen ook dat, net zoals ruwe olie niet nuttig is als je in een auto wilt rijden, het beschikbaar hebben van tonnen gegevens op zich niet nuttig is om je bedrijf vooruit te helpen. Het gaat erom je gegevens te gebruiken om inzichten te verkrijgen. En handelen naar deze inzichten voegt waarde toe aan uw bedrijf.

Datamining is het proces waarbij inzichten worden gehaald uit grote datasets. Datamining combineert statistiek, machinaal leren en databases. Maar datamining is verre van 'gewoon magie'. In deze cursus bespreken we de innerlijke werking van 10 van de meest gebruikte dataminingalgoritmen en laten we u precies zien wat er onder de motorkap gebeurt.

Leerdoelen

Vaardigheden:

  • In staat zijn om een beslisboom classifier te construeren met behulp van het ID3-algoritme.

  • Creëren van clusters van objecten met behulp van het K-means algoritme.

  • Gegevens in twee klassen in te delen met behulp van het SVM algoritme.

  • Leren van associatieregels met behulp van het APriori algoritme.

  • Werken met onvolledige gegevens met behulp van het Verwachtingsmaximalisatie algoritme.

  • Uitvoeren van linkanalyse en het bepalen van het relatieve belang van objecten binnen een netwerk met behulp van het PageRank algoritme.

  • Construeren van een classifier met behulp van het AdaBoost algoritme.

  • Uitvoeren van classificatie met behulp van het kNN-algoritme.

  • Classificatie uitvoeren met de Naive Bayes familie van algoritmen.

Kennis:

  • Kennis van datamining en de verschillende taken en doelen die daarbij horen.

  • Begrip van de evaluatie van modellen bij datamining.

  • Kennis van de top 10 algoritmen voor datamining, inclusief hun toepassingen en verschillen.

Attitude:

  • Een nieuwsgierige en leergierige houding ten opzichte van datamining en de verschillende algoritmen.

  • Een kritische en analytische houding bij het evalueren van de uitkomsten van de algoritmen.

  • Een open houding ten opzichte van het gebruik van nieuwe tools en technologieën bij datamining, zoals Weka en Orange Canvas.

Programma

We beginnen deze cursus met een samenvatting van het doel en de verschillende taken bij datamining. Aangezien datamining tot doel heeft een model te vinden, hebben we het ook over het evalueren van zo'n model.

De volgende hoofdstukken bespreken de volgende top 10 algoritmen voor datamining:

  • ID3 construeert een classifier in de vorm van een beslisboom. Daartoe krijgt ID3 een reeks gegevens die dingen vertegenwoordigen die al geclassificeerd zijn. Dit algoritme is de voorloper van het C4.5-algoritme.

  • K-means creëert k groepen uit een verzameling objecten zodat de groepsleden meer op elkaar lijken. Het is een populaire clusteranalysetechniek voor het verkennen van een dataset.

  • Support vector machines (SVM) leert een hypervlak om gegevens in twee klassen in te delen. Op hoog niveau voert SVM een soortgelijke taak uit als C4.5, behalve dat SVM helemaal geen beslissingsbomen gebruikt.

  • Het APriori algoritme leert associatieregels en wordt toegepast op een database met een groot aantal transacties. Association rule learning is een dataminingtechniek voor het leren van correlaties en relaties tussen variabelen in een database.

  • Expectiation-maximization wordt meestal gebruikt als een clusteralgoritme (zoals k-means) voor ontdekking van kennis (knowledge discovery). Het expectation-maximization-algoritme is een natuurlijke generalisatie van maximum likelihood-schatting bij onvolledige gegevens.

  • PageRank is een algoritme voor linkanalyse, ontworpen om het relatieve belang te bepalen van bepaalde objecten die binnen een netwerk van objecten met elkaar verbonden zijn.

  • AdaBoost is een boosting-algoritme dat een classifier construeert. Boosting is een algoritme voor ensembleleren dat meerdere leeralgoritmen (bv. beslissingsbomen) combineert. Het doel is een ensemble of groep zwakke leerders te nemen en deze te combineren tot één sterke leerder.

  • kNN, of k-Nearest Neighbors, is een classificatiealgoritme. Het verschilt echter van de eerder beschreven classificeerders omdat het een luie leerling is.

  • Naive Bayes is niet één algoritme, maar een familie van classificatiealgoritmen met één gemeenschappelijke aanname: Elk kenmerk van de geclassificeerde gegevens moet onafhankelijk zijn van alle andere kenmerken gezien de klasse

In de hele cursus gebruiken we de tools Weka en Orange Canvas om de dataminingalgoritmen te illustreren.

Praktische informatie

  • Nederlands of Engels

  • Standaardduur: 2 dagen

FAQ

Waaruit bestaat de prijs van de opleiding?

De prijs voor deze opleiding is een all-in prijs. Dat betekent wel degelijk alles inclusief: de lesgever voor de klassikale sessies, alle lesmaterialen, alle opdrachtomschrijvingen en feedbackmomenten. Wij rekenen de kostprijs voor een Master Channel abonnement niet mee in de prijs. Dat krijg je er dus volledig gratis bovenop!

Het abonnement dat je van ons krijgt als je je inschrijft voor de track is exact hetzelfde als wanneer je apart voor The Master Channel inschrijft. Kortom, je kan helemaal gratis alle cursussen volgen (naast die van de track) die op The Master Channel worden aangeboden.

Wordt er individuele feedback gegeven over de opdrachten?

Absoluut. Je kan je oplossingen altijd aan de lesgever bezorgen. Ook op het online platform waarop we samenwerken is het super eenvoudig om bestanden uit te wisselen met elkaar.

Wat houdt de zelfstudie in?

Bij The Master Labs Academy vertrekken we altijd vanuit een blended learning aanpak. Dat betekent dat je een combinatie doorloopt van zelfstudie momenten en klassikale sessies.

Die zelfstudie momenten zijn vrij uiteenlopend. Soms wordt er van je verwacht dat je tussen twee klassikale sessies door een online cursus volgt op The Master Channel (zoals de "How to find a better problem to solve"-cursus). In andere modules zou het kunnen dat je een kleine opdracht moet voorbereiden die je dan tijdens de volgende klassikale sessie met de lesgever behandelt.

Bij elke track geven we een indicatie van hoeveel tijd je zal spenderen aan de zelfstudie momenten.

Worden de klassieke sessies online of offline gegeven?

Op dit moment gaan alle klassikale sessies nog online door. Dat maakt het makkelijker voor mensen uit alle hoeken van het land om aan te sluiten.

Wat is het verschil met een e-learning cursus?

Goeie vraag! Het verschil is dat de track verder gaat dan enkel een online cursus. Zo krijg je bovenop de online cursus in meerdere klassikale sessies de kans om de tools en technieken die je leert toe te passen in oefeningen en realistische situaties. Ons doel is om zeker te zijn dat je op het einde van de track in staat bent alles dat je hebt geleerd ook toe te passen in je eigen situatie.

Je kan de track dus beschouwen als een all-in solution!

Wat houden de klassikale sessies in?

Onze tracks zijn helemaal gericht op een balans tussen theorie en praktijk. Het idee is dat je op het einde van de track niet alleen de kennis hebt, maar vooral de vaardigheden! In de klassikale sessies oefen je de technieken en tools in die je doorheen de track bijleert.

Welke topics er in elk van die modules worden behandeld, lees je in op de detail pagina van de track.

Zijn er opleidingssubsidies waarvan ik gebruik kan maken?

Jazeker! Onze opleidingen zijn erkend door de Vlaamse overheid.

Je kan dus gebruik maken van de KMO-portefeuille. Dit is een subsidie voor opleiding en advies voor Vlaamse kmo's en vrije beroepen. Werk je bij een kleine onderneming (<50 werknemers)? Dan geniet je van 30% steun. Een middelgrote onderneming (<250 werknemers) krijgt 20%. Telkens met een maximum van 7500 euro per jaar.

Hoe vraag ik mijn KMO portefeuille subsidie aan?

Eens je met ons een overeenkomst ondertekend hebt voor een opleiding, dan kan je online een projectaanvraag indienen. Dit kan tot 14 kalenderdagen na de start van de prestaties (opleiding, project, cursus).

De stappen die je moet volgen vind je hier.

Start met leren, contacteer ons

Stuur ons een bericht+32 495 19 36 97