Data Analytics

Data analytics zijn de intelligente algoritmes om waarde uit data te halen. Dit betekent dat zij als doel hebben iets te concluderen uit data: b.v. om te voorspellen, te clusteren of buitenliggers te vinden. Er bestaan heel erg veel verschillende algoritmes in allerlei soorten en smaken (van simpele statistiek tot en met deep learning).

Statistiek

Dit is de klassieke statistiek die bestaat uit stochastiek, kansrekening, normale verdelingen, correlaties, variatie analyse en design of experiments.

Supervised learning

Supervised learning gebruikt een gelabelde dataset om nieuwe punten te voorspellen. De meest gebruikte vormen hierbij zijn classificatie en regressie.

Unsupervised learning

Unsupervised learning wordt gebruikt om uit zichzelf dingen uit data te halen (dus zonder gelabelde data). Voorbeelden hiervan zijn clustering en anomalie detectie.

1. Dataset

Identificeer je dataset

  • Identificeer je dataset
  • Bepaal design¬† en response variables
  • Importeren vanaf elk format

2. Doel

Bepaal het doel

  • Wat is de gewenste doel en nauwkeurigheid?
  • Classificatie, voorspelling, clustering, statistiek
  • Selecteer geschikt algoritme

3. Algoritme

Ontwikkel het algoritme

  • Schrijf de logica voor het algoritme
  • Train het model (in geval van machine learning)
  • Test de functionele werking

4. Evalueer

Evalueer de nauwkeurigheid

  • Bepaal de statistische nauwkeurigheid en precisie
  • Laat een stuk data eruit om te voorspellen (machine learning)
  • Herhaal het proces als het niet voldoende is

Meer informatie?

Is uw interesse gewekt en bent u benieuwd wat wij voor u kunnen betekenen? Wij komen graag in contact met u!