De keuze voor een visualisatie optie bepaald de uiteindelijke interpretatie van de data. Neem bijvoorbeeld de kaart visualisatie van John Snow. Door het weergeven van de sterfgevallen door cholera op een kaart van London kon hij inzichtelijk maken dat een waterbron in Broad Street de mogelijke bron van besmetting was. Op zich een knap stukje werk want men had toendertijd geen inzicht in de manier waarop de ziekte werd overgebracht.


snowmap_1854.jpg
Uit het document ‘On the mode of communication of cholera‘ van Snow heb ik cijfers uit ‘Table I. exhibits the chronological features of this terrible outbreak of cholera.’ ingevoerd in Many Eyes. Daaruit blijkt dat zodra het aantal besmettingen met fatale afloop en het aantal sterfgevallen op een tijdslijn bekeken worden de besmettingen/sterfgevallen al aan het afnemen waren voordat de handel verwijderd werd.
cholera_chart.png
Tufte zegt hierover (Visual Explanations) dat doordat Snow door eerdere onderzoeken al een idee had dat een waterput een mogelijke besmettingsbron zou kunnen zijn hij gericht op zoek is gegaan naar data om dit ook inzichtelijk te maken. Door zeer grondig en nauwkeurig gegevens te verzamelen over de locatie van de sterfgevallen, deze te analyseren, te ordenen en op een kaart te visualiseren kon hij aantonen dat de mensen ook daadwerkelijk water uit de bron in Broad Street gedronken hadden.
Daarnaast heeft hij ook onderzoek gedaan naar het tegenovergestelde gegeven namelijk naar de mensen die als potentiële gebruiker van de waterput besmet hadden moeten worden maar die uiteindelijk niet besmet zijn. Zoals een naastgelegen brouwerij waar de arbeiders omdat ze een bepaalde hoeveelheid van hun eigen brouwsel mochten drinken bijna niet besmet werden. Of een naastgelegen ‘Work house’ die zijn eigen bron had.
Ook keek jij verder dan de radius rondom de bron. Hij kwam erachter dat meisjes die verder weg woonden en dus stierven op een locatie ver van de bron verwijderd daar wel in de buurt naar school gingen.
De methode waarop Snow zijn gegevens verzamelden waren, naast een goed idee op het juiste moment, volgens Tufte de bron van het succes. Het onderzoek van Snow kenmerkte zich door:

  1. het plaatsen van dat in een geschikte omgeving (plattegrond) waardoor de impact van de gegevens versterkt werden,
  2. hij maakte kwantitatieve vergelijkingen en stelde zich de fundamentele statistische vraag ‘Vergeleken met wat?’ (work house en brouwerij die wel in de gevarenzone liggen maar praktisch geen besmettingen kennen),
  3. hij dacht na over alternatieve verklaringen en tegengestelde zaken (een dodelijk slachtoffer dat veel verder weg woonde, al in maanden niet in de buurt was geweest maar iemand dagelijks één fles water liet brengen gevuld bij de bron in Broad Street),
  4. assesment van mogelijke fouten in de getoonde nummers in een grafiek (zijn begeleidende tekst handelde o.a. over mogelijke onnauwkeurigheden in de onderzoeksresultaten).

Kortom de manier van visualiseren maar dus ook de verzamelde gegevens zijn van invoed op de uiteindelijk conclusies die aan visualisaties ontleend kunnen worden.
Gerelateerde links: