Het bronmateriaal om een data visualisatie te maken bestaat uit cijfers. Hierbij kan het gaan om enorme hoeveelheden data die op een goede manier geordend en geïnterpreteerd moeten worden.
Om deze gegevens of data te verzamelen heb je de statistiek. De statistiek houdt zich bezig met het verzamelen, bewerken, interpreteren en presenteren van deze data. Voor mijn afstudeeropdracht hoef ik me gelukkig alleen te verdiepen in de beschrijvende statistiek. Dat wil zeggen dat je telt ‘hoeveel slagers er in dorp D zijn, hoeveel kippen in streek S, hoeveel molens in land L, hoeveel mannen in vereniging V en hoeveel lijders aan ziekte Z in ziekehuis X’

[1]. Deze gegevens worden vervolgens gepresenteerd in tabellen, grafieken en diagrammen.
Gegevens worden geordend en gereduceerd, indien gewenst vertaald naar kengetallen (= een samenvatting van een kenmerk door één bepaalde eigenschap ervan te benadrukken[2]). In overzichtelijke tabellen, grafieken en figuren worden ten slotte de gegevens gepresenteerd. Een belangrijk deel van het werk van het Centraal Bureau voor de Statistiek betreft dit deelgebied.

  • Het beheren van een enorme bak vol data (bedrijven en overheden hebben hier door de jaren heen vaak enorm veel van verzameld) heet data warehousing.
  • En data mining is het ontdekken van betekenisvolle patronen in deze data.
  • Data visualisatie is hierbij het in beeld brengen, het visueel communiceren is van deze data.

Bronnen
1. Statistiek en de statistieken. Dr. Ewald Vervaet. Struktuur en genese, 2004, vol.17, p.26-54.
2. Wat is onderzoek? Nel Verhoeven. Uitgeverij Boom. 2004 – 2005.