Introduction
Dat elke organisatie over tonnen data beschikt weten we al langer dan vandaag; dat slechts enkelen weten hoe ze ervan kunnen profiteren ook.
In deze opleiding maak je kennis met het het volledige data science-domein. Je leert eerst het generieke data science proces dat de volgende acht stappen bevat: de vraag begrijpen, de data vinden, de data opslaan, de data opschonen, de data verkennen, de data diepgaand analyseren, de data visualiseren en het verhaal vertellen.
Voor elke stap introduceren we tools, technieken, methoden, talen en deliverables, zoals OpenRefine, PowerBI, OLAP, OLTP, ID3, C4.5, ...
Tegen de tijd dat je deze cursus hebt voltooid, heb je een goed begrip van hoe data science jou kan helpen om waarde te creëren aan je organisatie.
Leerdoelen
Vaardigheden:
In staat zijn om gegevens te vinden, op te slaan, op te schonen, te verkennen, diepgaand te analyseren en te visualiseren.
Vermogen om te werken met verschillende soorten databases en tools zoals R en PowerBI.
Kennis:
Begrijpen wat het data science proces inhoudt en hoe het kan worden toegepast om inzicht te krijgen in gegevens.
Kennis hebben van statistische concepten en methoden, zoals gemiddelde, variantie, standaarddeviatie, scheefheid, kurtosis en correlatie.
Kennis hebben van Business Intelligence (bijv. OLAP, OLTP en ETL) en Data Mining (bijv. generalisatie, overfitting, ID3, C4.5 en K-means).
Inzicht hebben in best-practices voor het visualiseren en presenteren van gegevens.
Attitudes:
Nieuwsgierige houding ten opzichte van de uitkomsten en mogelijke verklaringen voor de geobserveerde patronen.
Flexibele houding bij het aanpassen van de analysemethoden en -technieken op basis van de resultaten.
Verantwoordelijke houding ten opzichte van de privacy en beveiliging van de data.
Programma
Het data science proces
De vraag begrijpen, de data vinden, de data opslaan, de data opschonen, de data verkennen, de data diepgaand analyseren, de data visualiseren en het verhaal vertellen
De vraag begrijpen
Wat kan je allemaal uit je data leren? Welk soort vragen wil je kunnen beantwoorden?
Vind de gegevens
Maak kennis met open data, Google Zoeken, Google Public Data, OCR en webscraping.
Sla de gegevens op
Kom in aanraking met verschillende soorten databases (hiërarchisch, netwerk, relationeel, sleutelwaarde, document, kolomgericht en grafiek).
Opschonen van de data (ook wel data pre-processing genoemd)
Opschonen, integreren, transformeren, verkleinen en discretiseren. We introduceren ook OpenRefine als een hulpmiddel om je gegevens op te schonen.
Verken de gegevens
Leer de basisprincipes van statistiek (gemiddelde, variantie, standaarddeviatie, scheefheid, kurtosis en correlatie). Verder introduceren we R, een gratis softwareomgeving voor statistische berekeningen en tekenen van grafieken.
Analyseer de gegevens diepgaand
In dit hoofdstuk gaan we dieper in op Business Intelligence (bijv. OLAP, OLTP en ETL) en Data Mining (bijv. generalisatie, overfitting, ID3, C4.5 en K-means).
Visualiseer de resultaten
Leer de best-practices om de data te visualiseren en gebruik PowerBI om je resultaten te visualiseren.
Vertel het verhaal
We hebben data gevonden, opgeschoond, geanalyseerd en gevisualiseerd, maar hoe vertellen we ons verhaal aan de stakeholders? Best-practices worden besproken op basis van het succes-acroniem (Simple, Unexpected, Concrete, Credible, Emotional, Story).
Praktische informatie
Nederlands of Engels
Standaardduur: 2 dagen