Recently in Data en visualisatie Category


Knowledge cartographies / Trailer from Marco Quaggiotto on Vimeo.

ATLAS is an interface prototype being developed at the Politecnico di Milano for the exploration of research resources.
ATLAS lets the user list his bio-bibliographic resources in a shared environment and access them through many different maps and representations.
The interface becomes therefore an Atlas of knowledge cartographies, designed to show a complex environment through the overlapping of different images.
For more information, see knowledgecartography.org/

In Nederland is de eerste besmetting van de Mexikaanse griep geregistreerd bij mensen die niet in het buitenland zijn geweest. Ze zijn dus besmet geraakt binnen Nederland. Ik ben daarom eens op zoek gegaan naar visualisaties die in dit thema als onderwerphebben.

Map_20090608_0800.png
Bron: http://www.who.int/


WHO_ Influenza A(H1N1)_ Interactive Map Report-1.jpg
Bron: WHO interactieve kaart


swineflu.jpg
Bron: http://swinemap.org/


Swine Flu Center - Swine Flu Pandemic, Swine Flu Deaths, Swine Influenza, H1N1 virus, Ah1n1.jpg
Bron: http://www.webmd.com/


npr.jpg
Bron: NPR. Confirmed Cases Of Swine Flu Across The Globe.


swine_flu.jpg
Bron: Associated Press

swine_flu-1.jpg
Bron: Associated Press

swine_flu-2.jpg
Bron: Associated Press


Swine Flu Cases Map - Interactive Graphic - NYTimes.com.jpg
Bron: The New York Times.
Hier kun je dankzij een interactieve tijdlijn de ontwikkeling volgen.


pandemic-influenza.jpg
Bron: Virology Blog


slide01.gif
Flu viruses mutate over time causing small changes to proteins on their surface called antigens. If the immune system has met a particular strain of the virus before, it is likely to have some immunity; but if the antigens are new to the immune system, it will be weakened.
slide02.gif
The influenza A virus can mutate in two different ways; antigenic drift, in which existing antigens are subtly altered, and antigenic shift, in which two or more strains combine. Antigenic drift causes slight flu mutations year on year, from which humans have partial, but not complete, immunity. By contrast, the new strain of H1N1 appears to have originated via antigenic shift in Mexican pigs.
slide03-1.gif
The name "swine flu" is a slight misnomer as it is believed pigs acted as a mixing pot for several flu strains, containing genetic material from pigs, birds and humans. Most humans have never been exposed to some of the antigens involved in the new strain of flu, giving it the potential to cause a pandemic.
slide04.gif
The new virus has made the jump from pigs to humans and has demonstrated it can also pass from human to human. This is why it is demanding so much attention from health authorities. The virus passes from human to human like other types of flu, either through coughing, sneezing, or by touching infected surfaces, although little is known about how the virus acts on humans.
Bron: BBC


mappingtheoutbreak.jpg
mappingtheoutbreak-1.jpg
Bron: BBC News


slidesbbc.gif
Bron: BBC


Gráficos en ELPAÍS.com.jpg

Gráficos en ELPAÍS.com-1.jpg

Gráficos en ELPAÍS.com-2.jpg
Bron: El Pais


EU_Map_big.jpg
Bron: ECDC

Data visualisaties zijn afhankelijk van goede betrouwbare bronnen met geverifieerd cijfermateriaal. Op Opendataoverheid Wiki vind je een overzicht van Nederlandse data bronnen gevonden.

Gerelateerde informatie:
HackdeOverheid. 13 juni van 10.00-18.00 in het Volkskrantgebouw.
'Hackers' gaan spelen met overheidsdata. Webwereld. Vrijdag 29 mei 2009. Ernst-Jan Hamel.
Handreiking Open OverheidsData

Recentelijk is het boek Invisible Vision: Could Science learn from the Arts? van Sabine Wildevuur verschenen. Aanleiding voor de Waag om een avond te organiseren waar verschillende mensen vanuit verschillende invalshoeken bekijken of er een meerwaarde is wanneer kunstenaars natuurlijke of medische processen visualiseren. En kan de wetenschap daarvan kan leren.

Meer informatie op Berichten uit de Society en wijde omtrek >

Datum en locatie
Woensdagavond 24 juni 2009,
tijd 20.00 -22.00 uur.
Theatrum Anatomicum
Nieuwmarkt 4,
1012 CR Amsterdam

De avond is ook live te volgen via het streamingkanaal KillerTV.nl

Het boek Invisible Vision. Could science learn from the arts is te bestellen bij de uitgeverij Bohn Stafleu en van Loghum.

AUTEUR S.E. Wildevuur
ISBN 9789031351015
PRIJS 69.50
LEVERBAARHEID leverbaar

...pas dan kan er nieuwe informatie ontstaan. Wat ontstaan is als een hobbyproject van drie piloten om hun eigen vluchten te registreren is uitgegroeid tot een professioneel platform voor piloten. Door het combineren en visualiseren van vrij beschikbare commerciële vluchtgegevens zijn alle vliegbewegingen op een kaart te volgen.

flightaware.jpg

FlightAware. Live Flight Tracking.
• Ars Technica: Monster mashup: mapping every plane in the air, Nate Anderson, 27 mei 2009

Data visualisatie wordt steeds meer een hot topic...
CSI serie 2009 aflevering 14:

csi_alibi2.jpg

...he has no alibi between 12:00 and 2:30...

csi_alibi.jpg

.

Jeffrey Veen gaat in deze video aan de hand van voorbeelden dieper in op het geven van betekenis aan grote hoeveelheden data door het toevoegen van metadata en labels. Hij laat zien dat je als vormgever ook betekenis kunt geven door het gedoseerd toevoegen van versieringen zoals kleur, typografie en vorm. En dat er een evenwicht moet zijn tussen versiering en betekenis.
Tussendoor...
- haalt hij nog een quote van Minard aan:

The aim of my carte figurative is ... to convey promptly to the eye relation not given quickly by numbers requiring mental calculations.

- geeft hij een paar tips:
  • remove everything that isn't telling the story
  • enable people to find their stories
  • create tools to let people manipulate their own data
  • provide filters (like Gapminder) to enable clarity in the data


- en geeft hij een overzicht van punten geleerd bij het maken van visualisaties op basis van Google Analytics.

Gerelateerde informatie
Zijn presentatieschermen zijn als PDF te downloaden >
Online staan nog meer video- en online schermpresentaties gegeven tijdens UX Week 2008.

Links
UX Week
Adaptive Path op Vimeo

(Tip: Peter Bogaards)

JoAnn Kuchera-Morin demos the AlloSphere, a new way to see, hear and interpret scientific data. Dive into the brain, feel electron spin, hear the music of the elements ... and detect previously unseen patterns that could lead to new discoveries. Video on TED.com ©TED

OECDregionalstatistics.jpg

URL: http://stats.oecd.org/OECDregionalstatistics/

De OECD, de organisatie voor economische samenwerking en ontwikkeling, heeft haar online data-visualisatie platform vernieuwd. Je kunt er bestaande economische data filteren en op verschillende manieren (interactieve kaart, scatterplot, geanimeerde tijdslijn, parallelle geografische panelen) visualiseren. Ook kun je je eigen datasets uploaden waardoor patronen zichtbaar worden.

De doelstelling van de eXplorer is om belangrijke regionale patronen en trends zichtbaar te maken.

Meer informatie:
• OECD: Regional Statistics and Indicators
OECD launches new OECD eXplorer: web-tool for analysing regional statistics

Gerelateerde informatie:
• Latebytes: Nieuwe manieren om globale statistische data te presenteren
• Latebytes: Intelligente legenda's

De Malofiej Awards, bekend over de hele wereld als de 'Pulitzer Prijzen voor Infographic Design', is een jaarlijkse, internationale wedstrijd voor print en online informatie graphics. De wedstrijd is vernoemd naar de Argentijnse vormgever/infographer Alejandro Malofiej (1938-87) wiens werk het meest gekenmerkt wordt door eenvoud, toepasselijkheid en creativiteit. Hij werkte voor de Argenteinse krant "La Opinión" vanaf het begin van de jaren 1960 tot zijn dood in 1987.

Het doel van de Awards is het in de spotlight brengen van creatieve en informatieve hoogstandjes in de visuele journalistiek. Duizenden infographics worden elk jaar ingeleverd voor de wedstrijd. Deze worden, binnen een breed scala van categorieën, beoordeeld door een internationale jury van professionele en academische deskundigen op het gebied van gedrukte en digitale media.

Op de Infographicsnews blog vind je een overzicht van de winnaars van de Malofiej 17 (2008) Awards.

De Peter Sullivan Award ('Best of Show') is naar de New York Times gegaan voor 'The Ebb and Flow of Movies: Box Office Receipts 1986 -- 2008'.

TheEbbandFlowofMovies.jpg

De Miguel Urabayen prijs voor de beste kaart ging ook naar de NYTimes voor de Electoral Explorer.

ElectoralExplorer.jpg

Nederland heeft dit jaar twee prijzen in de wacht weten te slepen. De Volkskrant heeft een zilveren medaille gewonnen in de categorie 'Features' met de infographic 'Wie herdenken wij morgen' gemaakt door Remy Jon-Ming.

RJM_003_dodenherdenking.jpg

Een andere zilveren medaille ging naar Schwandt infographics voor de interactieve Ecoson, Groene Stroom graphic.

Links:

Data gehaald uit Twitter (= een gratis internetdienst waar mensen in real time korte berichten met elkaar kunnen uitwisselen) wordt binnen de Social Collider van Sascha Pohflepp en Karsten Schmidt gevisualiseerd. Je kunt zoeken op gebruiker, onderwerp of trend. Berichten die 'resoneren' worden op de horizontale lijn met elkaar gelinkt, andere zwakken af naar beneden.

Wat precies het criterium is om te behoren tot de 'resonerende' groep is mij niet helemaal duidelijk maar het concept is sterk. Op deze manier kunnen er patronen in de communicatie ontdekt worden die anders verborgen blijven.

Gerelateerde informatie:
Chrome Experiments. Not your mother's JavaScript.
Sascha Pohflepp
Karsten Schmidt
Toxi's Photostream


Primal Source (video documentation) from haque d+r on Vimeo.

Primal Source, het visualiseren van lijfelijk data.
Daar had ik best wel eens even willen staan gillen...
Input: menselijke stemmen
Output: licht, kleuren en patronen
Url: Haque, design & research, Primal Source

Iedereen die ooit gebruik heeft gemaakt van het Parijse Metropolitain kan zich de grote routeborden bij de ingangen van de stations en op de perrons herinneren. Deze waren, in tegenstelling tot die van de London Tube, een redelijke geografische weergave.

paris-map-metro-big.gif

Zie hieronder de daadwerkelijke geografische ligging van de stations:

Paris_Metro_map.gif

Toch heeft Harry Beck vlak na WOII twee ontwerpen gepresenteerd aan de Fransen. Deze hebben de ontwerpen waarbij de geografische werkelijkheid volledig is losgelaten afgekeurd.

Pas in 2000 heeft de RATP plattegronden ontwikkeld die recht doen aan het gedachtegoed van Beck. De plattegronden zijn overzichtelijk en helder vormgegeven.

metro.gif

Maar heeft nog tot 2008 geduurd voordat ook de routeborden bij de ingangen van de stations en op de perrons zijn vervangen. Lees meer hierover op de site van Creative Review Harry Beck: The Paris Connection >

Related links:
Plan Interactif des transports en Ile-de-France
Different viewpoints of information (Latebytes)
Met dank aan Peter Bogaards voor de tip

Het online tijdschrift verzameld en toont innovatieve visualisaties van data waardoor complexe informatie vereenvoudigd weergegeven wordt. Het thema van Visualisations #2 is circels.

cover.jpg

Visualisation Vol2 - Circles-1.jpg

Visualisation Vol2 - Circles.jpg

000210-2317.jpg

Definitie: "Intense, Simple, Word-Sized Graphics"
© Edward Tufte

jQuery Sparklines.jpg

jQuery Sparklines: a jQuery plugin that generates sparklines (small inline charts) directly in the browser using data supplied either inline in the HTML, or via javascript.

Zowel de Financial Times als het NRC hebben een interactieve kaart die de economische crisis in Europa in beeld brengt ontwikkeld. Beide gebruiken ze voor de data een verschillende bron waardoor cijfers niet gelijk zijn.

ft_europeaneconomicforecast.jpg

De FT heeft een duidelijk them met een 'economic forecast'. Ze gebruiken de beeldtaal die hoort bij weerkaarten. De gebruikte datasets zijn tijd en bruto nationaal inkomen (een veelgebruikte maat voor de omvang van een economie).
Doordat de iconen net iets anders betekenen dan waar ze oorspronkelijk voor bedoeld zijn is het lastig interpreteren wat nu precies bedoeld wordt met de iconen. De legenda is een onmisbaar element. Een overzicht over lange periode is niet op te roepen.

nrc_economischecrisisEU.jpg

Het NRC biedt beduidend meer gegevens aan. Heeft naast een datakaart ook diagrammen om ontwikkelingen zichtbaar te maken. Het is niet direct duidelijk welke onderdelen klikbaar zijn. Doordat ze werken met verschillende basis vormen kunnen we hier wel verschillende jaren vergelijken.
Toch is het jammer dat er, naast de datakaart, niet gekozen is voor een tijdreeks die staatsschuld, economische groei, werkloosheid en begrotingstekort in één keer zichtbaar had gemaakt. Die had een beter overzicht van de economische ontwikkelingen in de Europese Unie kunnen geven dan nu het geval is.

Kunstenaars, techneuten en filmmakers creëren op internet voortdurend nieuwe manieren om de werkelijkheid in kaart te brengen en wijzen ons op onverwachte, triviale en shockerende aspecten van ons bestaan. Tijdens dit Doclab debat worden hoogtepunten uit het programma, waaronder o.a. de webdocumentaire Gaza|Sderot, besproken en presenteert Mediamatic de resultaten van de Any Media Workshop.

Tijdens het Doclab debat op 27 november werden o.a. hoogtepunten uit het programma besproken door Yuri Engelhardt en Raul Nino Zambrano, presenteerde Serge van Schie de creatieve toepassingen van Photosynth en bespraken Alexandre Brachet en Serge Godrey hoe de indrukwekkende webdocumentaire Gaza/Sderot tot stand is gekomen.

Een compleet overzicht van alle visuele uitingen rondom Obama's verkiezingsstrijd gemaakt door Information Design Studio.
Er zitten een paar prachtige uitingen tussen:

XPLANED_Obama_Fundraising_72.jpg
© http://www.xplane.com/obama/

decision-tree.jpg
© The New Yrok Times, 18 april 2009

brainstem1.jpg

partsofbrain1.jpg

Courtesy of Neurons Firing

Het Interface Design Team van de universiteit van toegepaste wetenschappen in Potsdam heeft een online applicatie ontwikkeld waarbinnen je door verschillende ontwerp patronen kunt browsen. Het is een ware schat aan informatie over problemen en mogelijke oplossingen die er zijn op het gebied van interface, interactie elementen en schermontwerp.

patternBrowser.jpg

Gerelateerde links
http://www.welie.com/patterns/
http://developer.yahoo.com/ypatterns/
http://interface.fh-potsdam.de/infodesignpatterns/patterns.php

prognosebevolkingsontwikkelingpergemeente.gif
Bron: http://www.ruimtelijkplanbureau.nl/

Een bijna gelijke grafiek 'Bevolkingsgroei per gemeente, 2007-2025' met een andere kleurstelling, schaalverdeling en periode ziet er zo uit:

2621g1.gif
Bron: http://www.cbs.nl/

In een oogopslag is duidelijk hoe de informatie door middel van kleurgebruik gemanipuleerd kan worden.

Een grafiek kan relaties tussen voorwerpen in beeld brengen. Het kan een verzameling knopen en lijnen die paren verbinden in beeld brengen. Een voorbeeld:
333px-6n-graf.svg.png

Deze manier wordt bijvoorbeeld gebruikt bij het in beeld brengen van sociale netwerken, bij het schetsen van elektrische schema's en in de cartografie. Je kunt hiermee ook database modellen in kaart brengen. We zetten bijvoorbeeld Django modellen met behulp van Python om naar Graphviz DOT files. GraphViz (= Graph Visualization Software) is [simpel gesteld] de software die gebruikt maakt van de DOT taal om wiskundige berekeningen te visualiseren.

Het brengt de onderliggende relaties prachtig in beeld:
DjangoGraphViz.png

Meer informatie:
~ Converting Django models into Graphviz DOT files
~ Graphviz - Graph Visualization Software
~ Django extensie: GraphModels

Some background information on the Did You Know? presentation.

IDFADOCLAB.jpg

Van 20 tot en met 30 november is er weer het International Documentary Film Festival Amsterdam. Dit jaar richt ze zich met het nieuwe programmaonderdeel Doclab op de relatie tussen nieuwe media en documentaire. Het hoofdthema is datavisualisatie. Zelf zeggen ze hierover:

De hoeveelheid beschikbare data is gigantisch en het wordt steeds makkelijker en verleidelijker om er daar iets te doen. Dit zien we vooral terug in de opkomst van het fenomeen 'datavisualisatie' onder wetenschappers, webdesigners, mediakunstenaars en, in toenemende mate, documentairemakers (denk bijvoorbeeld aan het succes van Al Gore's als 'powerpoint-documentaire' omschreven An Inconvenient Truth).

Binnen Doclab onderzoekt IDFA hoe datavisualisaties de meest absurde, ontluisterende, triviale en onverwachte aspecten van de werkelijkheid in kaart brengen. Het programma, dat bestaat uit films, websites en interactieve projecten, toont een selectie van de meest tot de verbeelding sprekende datavisualisaties van de afgelopen jaren en onderzoekt hoe deze zich verhouden tot hedendaagse documentaire cinema en crossmedia.

[Website] Idfa Doclab 2008 [Datavisualization & Documentary]. Het interactieve programma is ook gratis te bekijken op een groot scherm in de Cineac, tegenover Tuschinski.

De kracht van een data visualisatie

Een bak cijfers vertalen naar een visuele weergave kan ervoor zorgen dat statistische data beter gecommuniceerd wordt. Grafieken zijn zoals Tufte (1997), een bekende auteur op het gebied van analytisch ontwerp, zegt 'instruments for reasoning'. Voordat het zover is zullen echter eerst een paar stappen genomen moeten worden. Ervan uitgaande dat de bak met data al verzameld is moet er gekeken worden welke cijfers met elkaar in verband kunnen worden gebracht. Is er een ontwikkeling in tijd, zijn er verschillen, is er een stijgende of dalende lijn in te ontdekken etcetra. Door deze data te rangschikken en te ordenen kunnen deze patronen zichtbaar gemaakt worden. Ontwikkelingen, schommelingen hierin, de frequentie hiervan, onderlinge relaties en een totaaloverzicht kunnen in beeld gebracht worden.

Data moet, volgens Tufte (1997), zo in beeld gebracht worden dat

  • vergelijkingen (het vergelijken van 2 of meer variabelen),
  • verspreidingen (hoe vaak verschillende waardes van één of meer variabelen voorkomen),
  • samenstellingen,
  • ontwikkelingen (variabelen door de tijd heen) en
  • onderliggende relaties zichtbaar gemaakt kunnen worden.

Dr. Andrew V. Abela (2006), een professor in marketing en marktonderzoek aan de Catholic University of America in Washington, gaat uit van 4 mogelijkheden: vergelijkingen, onderliggende relaties, verspreidingen en samenstellingen. Visueel is dit te zien in zijne 'Chart Suggestions--A Thought-Starter'.

ChartSuggestions.jpg

Dit artikel is een kort overzicht van een paar hoogtepunten uit de geschiedenis. Het is een samenvatting van alle artikelen die al eerder door mij gepubliceerd zijn op deze blog. En is bedoeld als een summier maar compleet overzicht met onderstaande conclusie als resultaat:

Conclusie

Wanneer je de ontwikkelingen in datavisualisatie vergelijkt met die van de maatschappij zie je dat er vooral grote ontwikkelingen op het gebied van data visualisatie plaats vonden vlak na grote overgangen in de maatschappij.

Vlak na het industriële tijdperk bijvoorbeeld, eind 18e - begin 19e eeuw, was er een enorme opbloei van data visualisatie.

En sinds het post-industriële tijdperk de opkomst van de personal computer (In 1983 introduceerde IBM zijn eerste Personal Computer in Nederland.) zie je een toename de verschillende visualisatie technieken (wordclouds, treemaps, spreadplots).

Vandaag de dag volgen zowel de technologische als maatschappelijk ontwikkelingen elkaar in hoog tempo op. Computers worden steeds sneller, hebben steeds meer rekenkracht om ingewikkelde berekeningen uit te voeren. Het delen van informatie, het participeren hierin, rijke internet applicaties is steeds meer een gemeengoed. Het valt buiten de scope van mijn artikel om in te gaan op de huidige enorme technologische ontwikkeling maar het zal zeker van grote invloed zijn op de datavisualisatie en het presenteren van gegevens. Het is een goed moment om nu te gaan kijken naar de nieuwe mogelijkheden.

Stani Michiels (eerder genoemd in 'Informatie op een munt') heeft een uitleg over het ontstaan van de herdenkingsmunt online gezet.

Links:
De uitgebreide beschrijving van het ontwerp door ontwerper Stani Michiels.
How to make money with free software... by Stani Michiels.

NYTimes_VisualizationLab.gif

A specially for The New York Times developed version of Many Eyes can be used to create visualizations using data from today's news. Users of the website will be able to visualize and comment on information and data sets presented by the NYTimes. They can share those visualizations with others and create topic hubs where people can discuss specific subjects.

Why is the Times working with IBM to distribute Many Eyes on NYTimes.com? Like the creators of Many Eyes at IBM's Visual Communication Lab, The Times believes that users could bring their insight to the process of interpreting data and information and discovering new and innovative ways of presenting them. Just as readers' comments on articles and blogs enhance our journalism, these visualizations - and the sparks they generate - can take on new value in a social setting and become a catalyst for discussion.

The New York Times Visualization Lab

Personally I think it's positive that users can see visualizations of data. It can give more insight in the accompanying news articles. But offering users the opportunity to use that many visualization options is very distracting and leads to nothing.

VisualizationLab_ Data_sets.jpg

De meest gebruikte manier om met elkaar te communiceren is door het gebruik van woorden. Woorden die bestaan uit verschillende letters en die eenmaal samengevoegd een bepaalde betekenis krijgen.

Dat noemen we ook wel taal. De online van Dale omschrijft taal als: taal de; v(m) talen

  1. spraakklanken waarmee men zijn gedachten en gevoelens aan anderen kenbaar maakt
  2. spraakklanken ve bep. gemeenschap: de Nederlandse ~
  3. dat wat iem zegt, zijn woorden: ~ noch teken geven niets van zich laten horen
  4. (in het algem) middel om gedachten en gevoelens kenbaar te maken: gebarentaal, lichaamstaal

Vijf basisvormen

Nu zijn er, denk ik, vijf basisvormen van taal te onderscheiden.

woordtaal.pngde woordtaal, de meest gebruikte taalvorm die zowel in gesproken als geschreven vorm gebruikt wordt,
systeemtaal.pngde systeem- of cijfertaal zoals bijvoorbeeld het periodiek systeem (geschreven),
beeldtaal.pngde beeldtaal van bijvoorbeeld de statistiek of hiërogliefen (geschreven)
lichaamstaal.pngde lichaamstaal (fysiek) en
gebarentaal.pngde gebarentaal (fysiek) waarbij gedachten worden geuit door het gebruik van gebaren.

Ik wil hierbij eens wat dieper ingaan op één van deze basisvormen: de beeldtaal.

Data visualisatie is een vorm beeldtaal

Wanneer bij een woordtaal de letters woorden vormen die eenmaal samengevoegd betekenisvolle zinnen kunnen zijn dan zou je binnen de beeldtaal Bertin's 'visuele variabele': positie (x- en y-as), omvang (hoeveelheid of grootte), grijswaarde, textuur, kleurtint, oriëntatie () en vorm als letters kunnen zien die met behulp van de vier basisvormen, de woorden, (data kaarten, tijdsreeksen, plaats-tijd narrative ontwerpen en relationele grafieken) kunnen communiceren tot volledige zinnen. Het wordt pas een zin als er ook daadwerkelijk data (de betekenis) aan gekoppeld wordt.

09a.jpg

Dan Roam, 'Drawing on a Napkin'

Een deel van deze visuele variabele van Bertin kwam ik ook tegen bij Dan Roam (Digital Roam) in zijn boek Drawing on a Napkin. Zijn letters zijn basisvormen, lijnen en pijlen, mensen en objecten:

basisvormen.png

Dave Gray, XPlane

Een andere beelddenker, Dave Gray, oprichter van XPLane ('the visual thinking company'), heeft een video gemaakt van wat hij als de bouwstenen van de visuele taal ziet: "Forms, fields and flows".

De laatste tijd vallen de financiële instellingen met bosjes om. Het valt me op dat er in het nieuws veel over geschreven en gepraat wordt maar weinig gevisualiseerd. Toch kan een goede visualisatie veel verduidelijken.

vakgebiedenvisualisatie.gif

De eerst keer dat ik over Processing hoorde was toen ik de data visualisatie "De vergeten kade" van Marieke Brommersma tegenkwam die de drugsoverlast in een bepaald gebied in Amsterdam in beeld moest brengen. Het zag er visueel aantrekkelijk uit en ik was nieuwsgierig hoe ze dat bereikt had.

Adam.jpeg

Processing is de door Ben Fry en Casey Reas ontwikkelde, open-source op Java gebaseerde, programmeertaal. Het kan gebruikt worden om op een visuele manier de grondbeginselen van het programmeren onder de knie te krijgen en is vooral bedoeld om interactieve afbeeldingen, animaties mee te ontwikkelen. Om die reden zie dat het in toenemende mate gebruikt wordt voor data visualisaties.

Een mooi voorbeeld komt van Kars Alfrink, een freelance interactie ontwerper, laat stap voor stap in een blogartikel zien hoe hij met behulp van onder andere Processing een interactieve kaart met reistijden ontwikkeld.

2761843373_343812a73d.jpg

Meer voorbeelden van wat met Processing mogelijk is kun je vinden op de tentoonstellingspagina of op de projectpagina van Ben Fry.

tt_varnelis.jpg Kazys Varnelis en Leah Meisterlin hebben een artikel over het ontwerpen van intelligente kaarten [1] geschreven. Ze vergelijken hierin de klassieke papieren kaart die alleen ruimtelijke informatie laat zien met de online plattegrond applicaties zoals Google Maps die ons de goede richting geeft.

"We gebruiken tegenwoordig GPS (Global Positioning System) om onze routes uit te stippelen. En Google mash-ups en geotagging maken het mogelijk om onze persoonlijke kaarten te maken. Het is het tijdperk van de intelligente kaarten..."

tt_varnelis_1.jpg

Afgelopen zaterdag (21 juni 2008) is in het Parool een uitgebreid artikel verschenen over de publicaties 'Kijken achter de cijfers' en 'Criminogeniteitsbeeld Amsterdam 2008'.

art_xlarge_3668.jpg

Onderzoekers hebben voor het eerst tot op wijkniveau in kaart gebracht waar in Amsterdam het risico op criminaliteit het grootst is - en door welke factoren. Nieuw is dat niet zozeer is gekeken naar de misdaadcijfers, maar juist naar omstandigheden die criminaliteit in de hand werken: het aantal laagopgeleide ouders in een buurt, allochtonen, krappe huizen, uitvallers op school. Lees verder op de site van het Parool.

Gerelateerde informatie
Dienst Onderzoek en Statistiek. Publicaties: Kijken achter de Cijfers.
Vrije Universiteit Amsterdam. Onderzoekspublicaties: Kijken achter de cijfers en criminogeniteitsbeeld.

De visualisatie, Code_swarm genoemd, toont een overzicht van de bijdragen van verschillende personen aan de ontwikkeling van software door de tijd heen. Een bijdrage is wanneer een persoon een verandering aanbrengt in de code of in een document en deze toevoegt aan de centrale bewaarplaats. Zowel ontwikkelaars als documenten worden als bewegende objecten weergegeven. Zodra een ontwikkelaar een document bewerkt licht het op en verschuift naar de ontwikkelaar. De document zijn kleurgecodeerd, afhankelijk van of het code is of gewoon tekst. Wanneer gedurende een langere periode documenten niet wijzigen of ontwikkelaars geen bijdrage leveren vervagen ze naar de achtergrond. Een histogram onderaan laat zien wat er eerder is gebeurd.

Het project is ontwikkeld door Michael Ogawa met behulp van de prgrammeertaal Processing. De broncode is opensource en is te vinden op http://code.google.com/p/codeswarm.

De meest toegankelijke visualisatie is die van Guido van Rossum met betrekking tot de ontwikkeling van Python.

code_swarm - Python on Vimeo.jpg code_swarm - Python on Vimeo-2.jpg code_swarm - Python on Vimeo-1.jpg


code_swarm - Python from Michael Ogawa on Vimeo.

Meer informatie kun je vinden op de projectpagina.

* Organic information visualization, coined by Ben Fry, is a different approach to information visualization. It eschews traditional data confinement in space and lets the elements play together in freeform and unpredictable ways.

iTunes-2.png De dagelijkse doses informatie die we voorgeschoteld krijgen neemt nog steeds toe. Het gevolg hiervan is dat we steeds meer willen onthouden. Gereedschappen zoals de personal digital assistant (PDA) die ons daar bij kunnen ondersteunen vinden dan ook gretig hun weg op de markt. Een van de eerst was de Psion Organiser, iets later kreeg je de Apple Newton en de Palm Pilot. In 2007 kwamen daar de Apple iPhone en de iPod touch bij. Afgelopen maadag 9 juni was de keynote speech van Steve Jobs waarin de iPhone 3G geïntroduceerd werd. En vol bewondering heb ik gekeken naar de applicaties ontwikkeld door derden voor dit apparaat. Mark Williams van Modality presenteerden er bijvoorbeeld Netter's Anatomy voor de iPhone, een atlas van de menselijke anatomy in zakformaat.

Een grote hoeveelheid informatie wordt geordend, overzichtelijk en met prachtige medische illustraties aangeboden voor interactieve weergave op een wanna-have platform met touchscreen. Het omzetten van informatie naar kennis, het uit je hoofd leren van alle onderdelen van het menselijk lichaam moet zo toch veel leuker zijn. Je kunt leren terwijl je op de trein wacht, gewoon van je telefoon.

watwaswaarNl_Page_1.png

In het Parool van afgelopen zaterdag werd in een klein bericht een nieuwe webapplicatie genoemd waar je historische informatie over elke plek in Nederland kunt vinden. Of zoals ze zelf zeggen:

Speur naar historische kaarten of foto's van bijvoorbeeld je eigen leefomgeving. WatWasWaar.nl geeft snel en overzichtelijk toegang tot een groot aantal, soms unieke collecties, van Nederlandse erfgoedinstellingen. Het materiaal is zeer divers, overal anders en wordt continu aangevuld.

Toch leuk om te weten dat de grond onder ons kantoor in de Beurs van Berlage twee eeuwen geleden nog water was. De consequenties van bouwen op deze basis zijn nog steeds zichtbaar door dynamische scheurstructuren op onze muren...

WatWasWaar-1.png

VisNetw.png

Op uitnodiging van Yuri Engelhardt (Yuri, thanks, I really appreciated it) zijn Paul en ik gisteren naar de Waag gegaan om de zeven interactieve projecten te bekijken die ontwikkeld zijn door de multidisciplinaire teams van de UvA en de MAHKU. Elk vijfkoppig team bestaat uit drie technisch ontwikkelaars (UvA), twee media analisten (Uva) en een grafisch ontwerper (MAHKU).

Na een introductie van Waag Society en Media Gilde passeerden de zeven projecten in korte presentaties de revue:

  1. Vriendjespolitiek.net waar je door middel van je Hyves profiel kunt kijken welke politieke partijen het beste bij je passen.
  2. MatchMaker waarbij de persoonlijke profielen gepubliceerd binnen het sociale netwerk Hyves gematched worden naar overeenkomst interesses.
  3. Data Body die door visualisaties mensen bewust willen maken van hun gepubliceerde profielen door deze te vergelijken met andere profielen. Dankzij Data Body kun je vaststellen in hoeverre jou profiel op MySpace afwijkend is van de statistische massa.
  4. LoOSN combineert met behulp van data verkregen via Alexa een wereldkaart, wereldtalen en de verschillende sociale netwerken. In de applicatie krijg je bijvoorbeeld te zien welke talen in welke landen gesproken worden, in welke sociale netwerken deze talen gesproken worden.
  5. Friendscape haalt de data uit Hyves en presenteert gedeelde foto's op een 3D grid waarbij op de ene as de namen zijn uitgezet, op de andere de maanden. Foto's zijn gestapeld op de kruisingen van de x- en de ij-as. Hoe hoger een stapel hoe meer foto's.
  6. Kaboom die een alternatieve manier (op kleur of op tags) biedt om visueel door de afbeeldingen te browsen. Dit project deed me denken aan IBM's experimentele Query By Image Content (QBIC) zoektechnologie. Kaboom maakt een histogram van een plaatje en vergelijkt dit met het histogram van andere plaatjes om zo te kunnen matchen.
  7. En als laatste A tags life die trends in beeld brengt door het koppelen van geplaatste Flickr foto's aan bekeken Flickr foto's.

Meer informatie over de projecten is te lezen op de site van Masters of Media.

Het waren zeven vlotte presentaties van young professionals in een warm Theatrum Anatomicum en dit artikel doet ze zeker te kort. Een ding is zeker, het combineren van de verschillende specialisaties heeft tot een hele mooie synergie geleid.

Betrokken opleidingen

Gerelateerde informatie

Invitation_21_May_2008.jpg Morgen (woensdag 21 mei) worden in het Theatrum Anatomicum van de Waag (Nieuwmarkt 4, Amsterdam) 7 innovatieve visualisatieprojecten gepresenteerd onder de noemer 'Visualizing the Network'. Hierbij worden beelden gebruikt om door online sociale netwerken te 'navigeren' en op een nieuwe manier informatie te onttrekken aan het net. Initiatiefnemers zijn de UvA en de MaHKU. Toegang is gratis.

Bron
site Waag Society

Een 'design pattern' is een systematische beschrijving over een optimale toepassing van vaardigheden. Uitgangspunt is altijd de meest effectieve oplossing uit de praktijk waardoor er minder complicaties bij de uiteindelijke implementaties zullen zijn.

Deze manier van beschrijven is ontwikkeld door de architect Christopher Alexander. Hij ontwikkelde een ontwerpmethode voor architecten en stedenbouwkundigen en beschreef deze in 1977 in zijn boek 'A Pattern Language: Towns, Buildings, Construction'.
In 1994 hoorde ik voor het eerst over design patterns op de @Home conferentie van Doors of Perception.
En sinds ongeveer 2000 volg ik de groei Martijn van Welie's 'A Pattern Library for Interaction Design' nauwgezet. In de loop van de tijd zijn daar ook de Design Pattern Library van Yahoo en het Web Patterns Project van U.C. Berkeley School of Information bijgekomen.

Een pattern bestaat ruwweg uit:

  • naam
  • probleem dat het patroon oplost
  • synoniemen
  • probleemomschrijving (voorbeeld wanneer patroon de oplossing zou kunnen zijn)
  • context waarop het patroon van toepassing is
  • structuur van het patroon
  • implementatie van het patroon
  • voorbeeld
  • voorbeelden gerelateerde patronen

De InfoDesign site heeft een mooie verzameling links naar relevante informatie over patterns op het web!

Nu heeft Christian Behrens als bijlage bij zijn master thesis 'The Form of Facts and Figures' een website 'Information Design Patterns' ontwikkeld waarin hij design patronen voor het visualiseren van informatie omschrijft.

skitched-20080520-114250.png

vdqi_bookcover.gif Als het goed is wordt dit het laatste artikel dat zijn oorsprong heeft in Tufte's klassieke boek 'The visual display of quantitative information'. Niet zonder spijt want het is een prachtig gebonden boek van mooie lithografische kwaliteit vol zorgvuldig gerangschikte afbeeldingen. En de grondigheid waarmee hij zijn kennis met voorbeelden omschrijft en laat zien is zeer aangenaam.

... Theory and practice in the design of data graphics, 250 illustrations of the best (and a few of the worst) statistical graphics, with detailed analysis of how to display data for precise, effective, quick analysis. ...

Tufte verdeeld het onderdeel 'theorie van grafische data visualisatie' in 5 onderdelen.

  1. Data-inkt en grafische restyling.
  2. Chart-junk: vibraties, grids en eenden.
  3. Data-inkt maximalisatie en grafische vormgeving.
  4. Multifunctionele grafische elementen.
  5. Data dichtheid en kleine veelvouden.
  6. Esthetiek en techniek in grafische data visualisatie.

'Graphical integrity' kenmerkt zich, volgens Tufte, door een zestal principes:

  1. Zorg dat de weergave van nummers, zoals daadwerkelijk gemeten binnen een grafiek, moeten gelijk zijn aan de gevisualiseerde numerieke hoeveelheden.
  2. Gebruik heldere, grondige en gedetailleerde etikettering, om grafische vervorming en dubbelzinnigheid te voorkomen.
  3. Toon variatie in data, niet in het ontwerp.
  4. Geef geld in tijdslijnen gecorrigeerd voor inflatie en in standaardeenheden weer. Dat is veelal beter dan een nominale weergave van het geld.
  5. Gebruik geen twee of driedimensionele weergave om eendimensionele data te visualiseren. Het aantal getoonde informatie-dragende dimensies mag niet het aantal dimensies in gegevens overschrijden.
  6. Laat geen data zien die buiten de context vallen.

Bij het communiceren van complexe kwantitatieve ideeën zijn er vier basisvormen te onderscheiden:

  1. data kaarten,
  2. tijdsreeksen,
  3. plaats-tijd narrative ontwerpen en
  4. relationele grafieken.

Tabellen zijn taaie kost, een rauwe opsomming van getallen. De visualisatie van de gegevens moeten 'het oog aanmoedigen' om deze data te interpreteren'. Tufte zegt dat grafische weergaven meerder functies hebben. Ze moeten

  • de data tonen;
  • voorkomen dat data vervormd wordt weergegeven of geïnterpreteerd;
  • een grote hoeveelheid cijfers op een beperkt oppervlak weergeven;
  • een coherent geheel maken van de omvangrijke data sets;
  • het oog uitnodigen om de verschillende brokken data met elkaar te vergelijken;
  • de data op verschillende niveaus onthullen, van een breed overzicht tot in het kleinste detail;
  • een duidelijke doel dienen: beschrijving, exploratie, tabuleren of decoratie;
  • nauw verweven zijn met de statistische en verbale beschrijvingen van de data set.

Uit voorgaande twee artikelen 'Subjectieve bewijsvoering' en 'De 4 grondbeginselen van een grafiek' blijkt dat wanneer de weergave van gegevens waar en onthullend moet zijn de logica van het ontwerp de logica van de analyse moet reflecteren. De juiste en rationele opeenvolging van oorzaak en gevolg moet zowel in het ontwerp als in de analyse van de data gelijk zijn. Tufte zegt hierover

Visual representation of evidence should be governed by principles of reasoning about quantitative evidence. For information displays, design reasoning must correspond to scientific reasoning. Clear and precise seeing becomes as one with clear and precise thinking.

Het principe van gecontroleerde vergelijkingen dicteert tegelijkertijd de constructie van de weergave van gegevens en schrijft voor hoe de inkt of de pixels van een grafiek zo geordend moeten worden dat context en vergelijkingen direct weerspiegeld worden. De kwaliteit van de vormgeving komt voort uit de intellectuele kwaliteit. Bovengenoemde tweeledige principes, nodig voor zowel het beredeneren van statistische bewijsvoering als voor het ontwerpen van statistische grafieken, omvatten

  1. het documenteren van bronnen en van de karakteristieken van de data,
  2. het doorlopend afdwingen van de meest geschikte vergelijkingen,
  3. het demonstreren van mechanismen van oorzaak en gevolg,
  4. deze mechanismen kwantitatief in beeld brengen,
  5. het herkennen van de inherent zijnde multivariate natuur van analytische problemen en
  6. het inspecteren en evalueren van alternatieve verklaringen.

Weergaven van informatie moeten, mits een correcte weerspiegeling van inhoud en kern van de zaak,

  • documentair,
  • de oorzaak insluitend en verklarend,
  • vergelijkend,
  • in hoeveelheden uitgedrukt,
  • multivariate [1] en
  • verklarend zijn.

Bron
Visual Explanations: Images and Quantities, Evidence and Narrative, Edward Tufte, Graphic Press, 1997. Bladzijde 53, Conclusion: Thinking and design.

[1] Defintie multivariate analyse
Verzamelnaam voor een aantal analysetechnieken die ontworpen zijn om de aard en de mate van samenhang tussen een groot aantal waarnemingen te beschrijven.
Meer algemene term: analyse, analysetechnieken. Meer specifieke term: factoranalyse. Rubriek: S24.2 wetenschappelijk onderzoek. Gevonden op thesauruszorgenwelzijn.nl

visex_bookcover.gif Op 28 januari 1986 explodeerde de Challenger door een lekkende O-ring. Onderzoek na de ramp liet zien dat dit veroorzaakt werd door een lekkende O-ring. Ingenieurs hadden de dag voor de lancering data overlegd aan de beslissingnemers dat hun advies moest onderstrepen, de dag van de lanchering zou te koud zijn om de Challenger te lanceren. Terwijl het Snow juist door de visualisatie lukte om iedereen te overtuigen ging het hier mis. Daar zijn zeker meerdere redenen dan alleen de visualisaties voor aan te wijzen. Edward Tufte concentreert zich in zijn boek 'Visual Explanations: Images and Quantities, Evidence and Narrative' vooral op de visualisatie van de data tijdens het onderzoek wat volgde na de ramp.

Hieruit komen vier principes naar voren.

De keuze voor een visualisatie optie bepaald de uiteindelijke interpretatie van de data. Neem bijvoorbeeld de kaart visualisatie van John Snow. Door het weergeven van de sterfgevallen door cholera op een kaart van London kon hij inzichtelijk maken dat een waterbron in Broad Street de mogelijke bron van besmetting was. Op zich een knap stukje werk want men had toendertijd geen inzicht in de manier waarop de ziekte werd overgebracht.

Een, in mijn ogen, prachtig stukje informatie visualisatie waar ik als kind boven weg kon dromen. De mooie letters en prachtige kleuren, de vormen van de landen. Een mooie grijze kaft met grote letters in wit en cyaan, de grote bosatlas. Op Flickr heeft Jonathan Turner een paar foto's van het binnenwerk geplaatst.

bosatlas.png

De papieren versie krijgt er een digitaal broetje bij. Noordhoff Uitgevers is bezig met het ontwikkelen van de Bosatlas Online. In september 2008 komt de eerste testversie voor het onderwijs beschikbaar.

computational_journalism.jpg

In een artikel op de site van Information Architects las ik voor het eerst over Sensemaking. Het is 'een proces waarbij gebruikt gemaakt wordt van bewuste rationele overwegingen om de situatie te her-analiseren en orde te scheppen in deze verwarring en verrassing' [1].

Op de site van information aesthetics staat een verslag van Brad Stenger over The Journalism 3G Symposium on Computation + Journalism (22-23 februari 2008) dat zeer zeker de moeite van het lezen waard is. Een van de onderwerpen was Sensemaking in Information Visualisation.

Lees verder op de site van IA >

Bron [1] Sensemaking in Expatriation: an exploration, Glanz-Martin, M.L., 2005-06-03.


Meer informatie over Sensemaking
Theorieënoverzicht Universiteit van Twente: Sensemaking:

Since Sensemaking has been under development since 1972, it cannot be explained in a few sentences. It is important to know that the project has been based on three central assumptions regarding communication practice:
  1. That it is possible to design and implement communication systems and practices that are responsive to human needs;
  2. That it is possible for humans to enlarge their communication repertoires to pursue this vision;
  3. That achieving these outcomes requires the development of communication-based methodological approaches.
Lees verder op de site van UvT >

Februari 2006 heeft Hans Rosling tijdens TED talks laten zien dat data uit verschillende bronnen gekoppeld zou kunnen worden aan visualisaties. Een belangrijk onderdeel de mogelijkheid tot zoeken niet achterwege latend. Samen met zijn zoon Ola Rosling en schoondochter Anna Rosling Rönnlund ontwikkelde hij onder de naam Trendalyzer software die internationale statistieken omzet in bewegende, interactieve en plezierige grafieken. Het doel was om begrip te kweken bij het grote publiek. En het inzicht in de wereldproblematiek te vergroten door het aanbieden van vrij toegankelijke openbare statistieken. In zijn lezingen gebruikt hij deze grafiek 'Gapminder' om wereldontwikkeling te visualiseren.

  1. Gegevensdragers bijvoorbeeld de kolommen in een staafdiagram of de cirkels in een belgrafiek.
  2. Ordeningsonderdelen bijvoorbeeld de assen, rasterlijnen of stramien.
  3. Tekst zoals titel, bijschriften, bronvermelding en legenda.

Soms komen daar de ondersteunende onderdelen zoals bijvoorbeeld de achtergrond of het kader nog bij.

Om zinvolle informatie in geordende data zichtbaar te maken kunnen deze met elkaar in verband worden gebracht. Je kunt dit doen door bijvoorbeeld het gemiddelde uit te rekenen, door het in groepen in te delen, door vergelijkingen of door verbanden te leggen. Denk hierbij aan de categorieën geografisch weer te geven (de cholera visualisatie van Snow). De statistiek kan laten zien of deze combinaties ook tot een conclusie kunnen leiden. Hiervoor kan geput worden uit een enorm aantal visualisatie mogelijkheden.

Zijn naam duikt op op de meest onverwachte momenten. Als mede-initiatiefnemer van Ted [1], auteur [2], vormgever, bedenker van de term 'informatie architect'. en als architect.

Ik hoorde, als beginnend vormgever, voor het eerst over Richard Saul Wurman bij een opdracht tot het ontwerpen van formulieren voor een grote organisatie. Een senior collega gaf mij vijf mogelijkheden om te starten met orde te brengen in de berg van informatie die op mijn bureau lag. Als houvast vertelde hij over het LATCH principe.

  1. Location
  2. Alphabetical
  3. Time
  4. Category
  5. Hierarchy

Een bak cijfers vertalen naar een visuele weergave kan ervoor zorgen dat statistische data beter gecommuniceerd wordt. Grafieken zijn zoals Tufte, een bekende auteur op het gebied van analytisch ontwerp, zegt 'instruments for reasoning' [1]. Voordat het zover is zullen echter eerst een paar stappen genomen moeten worden. Ervan uitgaande dat de bak met data al verzameld is moet er gekeken worden welke cijfers met elkaar in verband kunnen worden gebracht. Is er een ontwikkeling in tijd, zijn er verschillen, is er een stijgende of dalende lijn in te ontdekken etcetra. Door deze data te rangschikken en te ordenen kunnen deze patronen zichtbaar gemaakt worden. Ontwikkelingen, schommelingen hierin, de frequentie hiervan, onderlinge relaties en een totaaloverzicht kunnen in beeld gebracht worden.

Het bronmateriaal om een data visualisatie te maken bestaat uit cijfers. Hierbij kan het gaan om enorme hoeveelheden data die op een goede manier geordend en geïnterpreteerd moeten worden.

Om deze gegevens of data te verzamelen heb je de statistiek. De statistiek houdt zich bezig met het verzamelen, bewerken, interpreteren en presenteren van deze data. Voor mijn afstudeeropdracht hoef ik me gelukkig alleen te verdiepen in de beschrijvende statistiek. Dat wil zeggen dat je telt 'hoeveel slagers er in dorp D zijn, hoeveel kippen in streek S, hoeveel molens in land L, hoeveel mannen in vereniging V en hoeveel lijders aan ziekte Z in ziekehuis X' [1]. Deze gegevens worden vervolgens gepresenteerd in tabellen, grafieken en diagrammen.

Gegevens worden geordend en gereduceerd, indien gewenst vertaald naar kengetallen (= een samenvatting van een kenmerk door één bepaalde eigenschap ervan te benadrukken[2]). In overzichtelijke tabellen, grafieken en figuren worden ten slotte de gegevens gepresenteerd. Een belangrijk deel van het werk van het Centraal Bureau voor de Statistiek betreft dit deelgebied.

  • Het beheren van een enorme bak vol data (bedrijven en overheden hebben hier door de jaren heen vaak enorm veel van verzameld) heet data warehousing.
  • En data mining is het ontdekken van betekenisvolle patronen in deze data.
  • Data visualisatie is hierbij het in beeld brengen, het visueel communiceren is van deze data.

Bronnen
1. Statistiek en de statistieken. Dr. Ewald Vervaet. Struktuur en genese, 2004, vol.17, p.26-54.
2. Wat is onderzoek? Nel Verhoeven. Uitgeverij Boom. 2004 - 2005.

Terwijl ik bij amoebe toch echt aan iets heel anders denk blijkt het ook een diagram type te zijn. Het wordt vooral gebruikt binnen de ecologische wereld om de resultaten van een onderzoek en de prognoses of scenario's te visualiseren: het Amoebe-diagram.

amoebe.png

amoebe_diagram.gif

Amoebe-diagram met diverse bodembiologische gegevens (Breure et al., 2003b).

amoebe-diagram.gif

Elke gekleurde taartpunt representeert een specifieke bodembiologische parameter. De grootte van de taartpunt geeft aan hoeveel de biologische parameter verschilt met die van een gekozen referentie (buitenste zwarte cirkel). Het binnenste zwarte gebied geeft aan waar een ernstig kwaliteitstekort dreigt. Bron: Referenties voor bodemecosystemen: evaluatie van functies en ecologische diensten (PDF).

De sociale betrokkenheid die zichtbaar werd bij Neurath, Arvtz, Reidemeister en Alma zien we ook terug op andere wetenschappelijke gebieden. Binnen de sociale wetenschappen ontwikkelde zich de sociale geografie. In feite werd de aardrijkskunde gecombineerd met de menswetenschappen. Het ging bijvoorbeeld niet meer alleen over de stad maar ook over de bewegingen van de stedelingen binnen deze ruimte. Het gaat tussen om de interactie tussen mens en ruimte. Aandachtsgebieden kunnen naast steden ook dorpen zijn. Ook verkeer, handel en toerisme hebben duidelijk een ruimtelijke dimensie. Landschapsvormen en aardoppervlakte worden buiten beschouwing gelaten.

Al eerder, in 1854, maakte de Engelse arts John Snow een kaart waarop alle sterfgevallen in een bepaalde buurt in London zichtbaar waren. Daaruit bleek dat een waterpomp in Broad Street de bron van besmetting was.

Snow-cholera-map-1.jpg

Picture 1.png De Universiteit van Amsterdam heeft in haar collectie een Cholerakaart van Amsterdam van J. Texeira de Mattos een iets latere datum (1866) waarin de verspreiding van cholera en het aantal sterfgevallen in 50 buurten van Amsterdam zichtbaar is gemaakt. [Ga naar de beeldbank van de UvA voor een zoomable versie].

In deze kaart hebben ze een cirkel als tijdseenheid gebruikt. Elke week staat voor één stuk. De zwarte cijfers geven het totaal van de bevolking in die wijk in mei 1866 aan en de verhouding sterfgetallen per 1000 inwoners.

cholera_3.gif legenda_cholera.gif

Een veel recenter voorbeeld is het aantal moskeeën per plaats in de provincies Noord-Holland en Flevoland (2005) van Nijeholt [1].

601px-Noord_holland_moskeeën_figuratief.png

Kaart van de agglomeratie Amsterdam, bestaand en ontworpen, ca. 1960. Bron: Collecties. Universiteit van Amsterdam.

img0045.gif

Bronnen
1. Source: Handboek Geo-visualisatie, author: Nijeholt. Source of the data: ((CBS-data according to 'De Bosatlas') according to the 'NRC'): Magazine 'M' (attachment of the NRC-Handelsblad dd december 2007, pag. 55. Subject: 'Wij staan op de kaart'.)
2. Beelddatabank Kaarten & atlassen. UvA.
3. Kaarten, atlassen en globes: collectie in vogelvlucht. UvA.
5. Van Taarten en balken. Kerstnummer Grafisch Nederland 1996.

Zo rond 1920, vlak na de eerste wereldoorlog, wilde Otto Neurath (Oostenrijks filosoof, econoom en socioloog; 1882 - 1945) het grote publiek over allerlei ontwikkelingen op sociaal en economisch gebied voorlichten. Hiervoor organiseerde hij tentoonstellingen waarbij regelmatig aantrekkelijke presentatiemiddelen zoals driedimensionale diagrammen gebruikt. Hiervoor werkte hij samen met Marie Reidemeister (1898 - 1968) die het cijfermateriaal geschikt maakte voor grafische bewerking. Stelregel hierbij was dat één symbool één specifieke waarde had. Een grotere waarde werd weergegeven door meer symbolen en niet door een groter symbool.

Neurath.gif

Terwijl statistische visualisaties voorheen vooral hun oorsprong vonden binnen de wetenschap veranderde dit dankzij Neurath en Gerd Arntz (kunstenaar; 1900 - 1988). In 1926, na een ontmoeting tussen beide mannen, gaat Arntz symbolen ontwikkelen welke toegepast worden in diagrammen.

Kunstwerk van Arntz
1934~Das_Dritte_Reich_(Gerd_Arntz).jpg

Deze manier van beeldstatistiek is bekend als 'De Weense methode'. Willem Sandberg (1897 - 1984; grafisch ontwerper, directeur Stedelijk Museum (SM) in Amsterdam) die toentertijd psychologie studeerde in Wenen naar Nederland heeft er zorg voor gedragen dat deze methode naar Nederland kwam.

Maar ook Peter Alma (1886 - 1969) raakte vanwege de enorme maatschappelijke betrokkenheid geïnteresseerd in de beeldstatistiek. Na tekenaar te zijn geweest voor Neurath heeft hij na terugkeer in Amsterdam zelfs een atelier voor beeldstatistiek (1933) opgericht.

NLST1961.jpg MML04.jpg

Door het opkomend socialisme waren Neurath, Reidemeister en Arntz genoodzaakt Oostenrijk te verlaten en naar Nederland te vluchten. En in 1934 stichtte Neurath in Den Haag samen met Reidemeister de Internationale Stichting voor Beeldpaedagogie, het Mundaneum op.

In 1942 richtte Neurath samen met zijn vrouw Marie het ISOTYPE (International System of TYpographic Picture Education) instituut op.

Neurath1936c0149.11.jpg

15.jpg

T1_N112_A6_Isotype-Neurath.jpg

Bronnen:
1. Tentoonstelling Gert Arntz. Ontwerpwerk.
2. Otto Neurath. Wikipedia.
3. Text - Bild - Interface. Otto Neurath und die Merkmale des visuellen Kommunikationsdesigns, zum Vortrag im Rahmen der "Unplugged Heads" at the Institut für neue Medien, Frankfurt (2 December 1997). Frank Hartmann.
4. Otto Neurath. Special Dossiers. Künst = Kaptial.
5. ISOTYPE institue. http://www.fulltable.com/iso/

Binnen de officiële statistische diensten die eind 19e eeuw werden opgericht waren er heel wat ambtenaren die experimenteerden met het visueel weergeven van hun cijfermateriaal. Daarbij maakte Luigi Perozzo, een italiaan, grote indruk met zijn driedimensionale bevolkingsdiagrammen (stereogrammen).

Perozzo1.jpg
Statistica Grafica - Della rappresentazione grafica di una collettività di individui nella successione del tempo, e in particolare dei diagrammi a tre coordinate - Memoria di Luigi Perozzo. Annali di Statistica, Serie 2, Vol. 12, 1880, pp.1-16. (Ministero d'Agricoltura, Industria e Commercio, Direzione di Statistica)

Op de x-as staat de leeftijd (oud = dichtbij, jong = achteraan), op de ij-as het aantal individuen en op de z-as staan de jaartallen. Het uiteindelijke resultaat ziet er goed uit en is functioneel. Het is direct duidelijk dat de mens door de jaren heen ouder wordt en dat de bevolking toeneemt.

Op het moment dat de maatschappij overging van het handmatig vervaardigen van goederen naar het machinaal vervaardigen en de industriële revolutie een feit was werd het voor landen essentieel om meer inzicht te krijgen in de cijfers omtrent de bevolking. Het is een tijd waarin de ontwikkelingen enorm snel gaan.

Duitse fabriek klein.jpg

Rond 1795 vond daarom in Nederland de eerste grote volkstelling plaats. In 1830 volgde de tweede volkstelling waarbij de hulp in was geroepen van Adolphe Quételet (1796-1874), een Belgisch astronoom en mathematicus.

In deze wetenschappelijk omgeving waren kansrekening en statistiek al helemaal ingeburgerd. Quételet was de eerste die deze wetenschap ook toepaste op de sociale omgeving. Hij paste de door hem ontwikkelde methoden van kansrekening toe op bevolkingsstatistieken. Door het bepalen van de gemiddelde mens is het eenvoudig om afwijkingen zoals bijvoorbeeld crimineel gedrag beter in kaart te signaleren [1].

Inzicht in de gemiddelde borstomvang van Schotse soldaten:
image.gif

Het begrip 'gemiddelde mens' wordt toegepast in zijn meest invloedrijke publicatie 'Sur l'homme et le développement de ses facultés, ou Essai de physique sociale' uit 1835.

StatutConsulter.png

fIgMvW-StatutConsulter.png

SYxP2n-ConsulterElementNum.png

Daarnaast heeft Quételet bijgedragen aan de oprichting van de Centrale Commissie voor de Statistiek (184; na 1946: Hoge Raad voor de Statistiek) en van de Royal Statistical Society in 1835.

In dat jaar werd, mede dankzij Quételet, het 1e internationale Statistische Congres in Brussel gehouden. Toch zou het pas de 3e conferentie zijn waar de grafische weergave van statistische gegevens voor het eerst echt onder de aandacht werd gebracht. Daarbij ging het vooral om de vraag of de grafische methode wel wetenschappelijk verantwoord was.

Bronnen
1. Van Taarten en Balken. Kerstnummer Grafisch Nederland 1996.
2. Adolphe Quételet (1796-1874). FOD Economie, KMO, Middenstand en Energie. Geraadpleegd 16 april 2008.
3. Sur l'homme et le développement de ses facultés, ou Essai de physique sociale. A. Quételet. Paris : Bachelier, 1835. Online PDF.
4. Adolphe Quételet. From Wikipedia, the free encyclopedia. Geraadpleegd 16 april 2008.
5. International Statistical Institute.

Tijdens de laatste decennia heeft de data visualisatie zich ontwikkeld tot een volwassen multi-disciplinair onderzoeksgebied. Iedereen kan tegenwoordig vanaf zijn eigen computer data visualiseren via online applicaties zoals Many Eyes, Data360 en Swivel.

Er komen steeds meer interactieve statistische data systemen dankzij de programmeertalen als APL en S.

Nieuwe modellen en theorieën voor de directe manipulatie van visuele data analyses (linking, brushing, selection, focusing) worden ontwikkeld.

Er ontstaan nieuwe manieren voor het visualiseren van high-dimensional data zoals scatterplot matrix (Tukey, 1981) parallel coordinates plot (Inselberg 1985, Wegman 1990), spreadplots (Young, 1994).

scatterp.gif parallel2.gif 1471-2105-5-60-6.jpg

Visualisation vocubulary
vistatec.gif
Uit Data, vocabulary, marks, composition rules and visual perception rules

Lees meer op Milestones in the History of Thematic Cartography, Statistical Graphics,
and Data Visualization 1975-present

Na een stille periode begin 20e eeuw zien we zo rond 1950 een opleving in de ontwikkelingen binnen de data visualisatie. Reden hiervoor was onder andere de ontwikkeling van FORTRAN (The IBM Mathematical FORmula TRANslating System, 1957) een hogere programmeertaal speciaal ontwikkeld voor wetenschappelijke doeleinden.

cover.gif Het werk van John Tukey 'The future of data analysis' (1962) en 'Semiology Graphique' van Jacques Bertin waren van grote invloed.

Tegen het einde van deze periode zien we een paar grote technische veranderingen die van grote invloed zijn op de data visualisaties zoals bijvoorbeeld nieuwe software paketten, nieuwe computertalen, de computermuis, kleurenmonitoren, scanners, inktjetprinters.

Ontwikkelingen op het gebied van data analyse zoals de 'Exploratory Data Analysis' en de psychometrie zijn van grote invloed op de data visualisaties.

Gerelateerde link:
1950-1974: Re-birth of data visualization. Michael Friendly.
Exploratory Data Analysis

Zo rond 12000 BC is er een plattegrond in Mezhirich in de Ukraïne gevonden. De Konya stadsplattegrond dateert waarschijnlijk uit 6200 voor Christus. Essai d'une table poléométrique van Charles de Fourcroy dateert uit 1782. William Playfair (1759-1823) legde de basis voor de verschillende vormen van visualisatie. In het begin van de 19e eeuw zie je de statistische visualisaties en thematische plattegronden verschijnen. Minard maakt rond die tijd zijn bekende visualisatie van de tocht naar Moskou. De periode 1850 -1900 wordt dan ook gezien als de Gouden Eeuw van statische grafieken [1]. Veel grafische elementen die we nog steeds gebruiken zijn ontwikkeld in die periode.

statistiek  67 209.jpg Geheel in lijn met deze ontwikkelingen onstaan er overal in Europa officiële burau's voor onderzoek en statistiek. Het belang van numerieke informatie voor handel, industrie, vervoer en sociale planning wordt onderkend. De organisaties die zich bezighouden met het verzamelen, organiseren en analyseren van officiële statistische informatie over bevolking, handel, sociale, politieke en morele zaken verspreiden zich snel over Europa. In Nederland werd in1894 het Amsterdamse bureau voor Onderzoek en Statistiek opgericht. Het is het oudste statistische bureau van Nederland. Vijf jaar later, in 1899, werd bij Koninklijk Besluit het Centraal Bureau voor de Statistiek opgericht. In Nederland werd er nog hoofdzakelijk gewerkt met tabellen. Frankrijk, Hongarije, Duitsland en Finland werkte al veel meer met grafieken.

Continue reading Ontwikkelingen eind 18e, begin 19e eeuw.

18.jpg

Doordat de kaart van Minard zo populair is zie je dat er veel mensen zijn die deze kaart als basis voor hun veelal interactieve experimenten gebruiken. Ik noem er een paar:

t-3D-napoleon-final.jpg

Een 3D interactieve visualisatie in Flash van Prof. Menno-Jan Kraak. Hierin is tijd en ruimte tegen elkaar afgezet. Hij biedt ook het hele verhaal interactief aan waarbij de gebruiker kan kiezen welke verhaallijn hij wil volgen.

t-1812-flash-battles.jpg

De SAGE Visualisation Group van de Carnegie Mellon School of Computer Science heeft ook de verschillende datasets die in die tocht van Minard verzameld zijn gevisualiseerd.

lg-napol-sage.gif

John Schneider, Napoleon deskundige, heeft een niet interactieve maar zeer gedetailleerde kopie van de kaart nagemaakt waarbij de data volledig leesbaar zijn.

1812-2.jpg
Bron: http://www.napoleonic-literature.com/1812/1812.htm

Bronnen:
~ Re-Visions of Minard. Gallery of Data Visualization.
~ SAGE Visualisation Group. Carnegie Mellon School of Computer Science.
~ Research projecten van prof. Menno-Jan Kraak

Recentelijk heb ik me laten inspireren op het eerste Nederlandse Infographics Congres waar een paar goede presentaties een hele dag de moeite waard maakte. Met name John Grimwade (directeur Informatie Graphics bij Conde Nast's Traveler en Portfolio magazines) en Harjit Kaura (graphic designer bij BBC News Interactive) hadden prikkelende verhalen. En daarbij was Grimwade een natuurlijk verteller wat het luisteren altijd enorm veraangenaamd. Hij begon zijn verhaal met een dreigend 'dark ages of infographics'... en eindigde met de voor mij zo relevante nieuwe ontwikkelingen waarbij data visualisaties gevoed worden door live gegevens. In die hele tijdslijn welke liep via steentijd, hiëroglyfen, 12e eeuwse manuscripten, azteekse kalenders, Leonardo da Vinci, Playfair, Neuraths ISOTYPE, Nigel Holmes ontbrak natuurlijk niet de 'March to Moscow' van Minard. De, volgens Edward Tufte, 'beste statistische grafiek ooit gemaakt' (uit: The Visual Display of Quantitative Information).

Deze kaart, die berucht is om de hoeveelheid informatie (geografische locatie inclusief namen van steden en rivieren, tijd (alleen op de terugtocht), temperatuur (het onderste deel van de grafiek), route, richting van de troepen en het aantal (nog resterende) manschappen) die aangeboden wordt, uit 1869 laat de verliezen onder de manschappen (breedte van de banen), hun bewegingen (heen bovenste baan, terugtrekking onderste zwarte baan) en de buiten temperatuur tijdens de franse invasie naar Moskou (1812) zien.

Minard.png

Minard gebruikt hier een voor die tijd innovatief idee. De breedte van elementen is proportioneel en is daardoor direct te interpreteren. Dit is goed te zien in een eerdere grafiek, de Tableau Graphique, van hem uit 1844. Hierin past hij ook een ander nieuw concept (het gebruik van delen in een staafdiagram) toe. Volgens Michael Friendly (1994) is dit de voorloper van de moderne mozaïek plot [1].

tableau_graphique.jpg

Deze grafiek laat het transport van commerciële goederen door het kanaal van Cahlon naar Dijon zien. De hoogte van een staaf geven de totale kosten van transport weer. Elke staaf is gesplitst naar type product waarbij elk vlak een type product is. Je kunt direct zien welke producten de hoogste kosten van transport hebben. De plaatsen waar aangelegd kan worden zijn verdeeld naar afstand. Elke staaf heeft dus zijn eigen variabele breedte. Hoe breder de staaf hoe groter de afstand. [1, 2]

Bronnen:
1. A brief history of data visualisation. Michale Friendly. 2006.
2. Charles Joseph Minard, "Graphic Tables and Figurative Maps". Edward Tufte.

In het begin van de 19e eeuw is er een enorme toename van statistische visualisaties en thematische plattegronden. Alle vormen van data visualisaties die we nu toepassen zoals taartdiagrammen, staafdiagrammen, histogrammen, lijngrafieken, puntdiagrammen, kaartgrafieken, histogrammen en puntenwolkgrafieken vonden rond die tijd hun oorsprong. De thematische cartografie varieerde de afbeeldingen van eenvoudige kaarten tot uitgebreide atlassen. De onderwerpen werden steeds breder (economisch, sociaal, medisch, fysiek, moreel etcetera).

De eerste choropleth kaart, dat is een kaart waarin kwantitatieve ruimtelijke gegevens met behulp van de arcering of het kleuren van bepaalde gebieden of percelen wordt weergegeven, is waarschijnlijk de 'Carte de la France obscure et la France éclairée' van Charles Dupin (1826). (Bron: A brief history of data visualisation. Michael Friendly. 2006.)

Hij gebruikte hierin verschillende arceringen en zwarte en witte vlakken om de verspreiding het analfabetisme in Frankrijk weer te geven. Het ongeletterdheid is in de zwarte gebieden het hoogst.

dupin2.gif

William Playfair (1759-1823) is een van de grondleggers geweest van de lijngrafieken, staaf- en taartdiagrammen die we nu nog steeds gebruiken om statische data weer te geven. Wat je ziet is dat hij vooral eenvoudige visualisaties maakte. Het zijn vooral vergelijkingen. Er wordt geen inzicht gegeven in wat er zou gebeuren als er data zou wijzigen.

first-pie-chart.jpg

Bovenstaande figuur laat in de linkeras en -lijn per cirkel de bevolking en in de rechteras en -lijn per cirkel de belasting zien. De uitvergroting hieronder laat dit beter zien. (Bron: Florence Nightingale's Statistical Diagrams. Hugh Small.) De bedoeling is dat de helling die deze linker- en rechterlijn met elkaar verbindt de hoogte van belasting direct zichtbaar maakt. Alleen wordt de helling in deze afbeelding ook bepaald door de diameter van de cirkel. Het is in ieder geval wel zichtbaar dat de helling behorende bij 'Britain and Ireland' de andere kant op gaat. In de huidige statistische visualisaties is het een regel om nooit twee verticale assen voor verschillende waardes (bevolking en belasting) te gebruiken.

small6.jpg

In een andere afbeelding wordt het nog duidelijker hoe Playfair het gebruik van grafische vormen voor zich zag. Hij gebruikt hierin drie parallelle tijdslijnen om de prijs van graan, de wekelijkse lonen en de regerende koning over een tijdsspanne van 250 jaar (1565 tot 1820) in beeld te brengen. Zijn doelstelling was het zichtbaar maken dat arbeiders erop vooruitgegaan waren in deze periode.

playfair2.gif

Een grafische representatie van kwantitatieve data waarbij proportionele geometrische figuren (rechthoeken) gebruikt worden om demografische hoeveelheden te vergelijken. Anders gezegd de grootte van een stad of dorp wordt vertaald naar een rechthoekige vorm en over elkaar heen gelegd zodat de oppervlaktes van stedelijke gebieden vergeleken kunnen worden. In deze afbeelding zijn Londen, Praag en Parijs steden van gelijke omvang.

defourcroy3.jpg

Van Charles de Fourcroy (1782).
Meer informatie (From Palsky (1996): Des Chiffres et des Cartes, p.51-52)

Toch grappig. Struinende over het world wide web kom je veel claims tegen over de eerste plattegrond ooit gemaakt...

Volgens Infoukes dateert de oudste map van 12.000 BC en is deze gevonden in Mezhirich in de Ukraïne. De afbeelding is gegraveerd op een slagtand van een mammoet.

figure02.gif

Milestones in the History of Thematic Cartography, Statistical Graphics, and Data Visualization noemt de Catal Hyük stadsplattegrond als oudste (6.200 BC) welke te zien is in het Konya museum in Turkije.

oldest-map.jpg

Bovenstaande illustratie is een reconstructie van een muurschildering.

100B.jpeg

Bron: henry-davis.com

Het ontsluiten van statistische data via een webgebaseerde applicatie klinkt prachtig. Vooral als het zo goed gedaan wordt dat een gebruiker van deze applicatie informatie beter kan analyseren en interpreteren. Het is het onderwerp van mijn afstudeeropdracht voor mijn deeltijdstudie Informatie Management aan de Hogeschool van Amsterdam. Het komt er eigenlijk simpelweg op neer hoe we data zo kunnen combineren dat er nieuwe inzichten ontstaan. Trefwoorden zijn geautomatiseerd en veel data. Hoe prachtig is het om dan een diagram uit de 14e eeuw te bekijken waarin een onbekende astronoom de beweging van de planeten over een bepaalde periode heeft geïnventariseerd. Met de hand, zonder computers. Ik stel me zo voor bij kaarslicht, met ganzeveer, op perkament. Vol aandacht. Het visualiseren van één thema...

planeten.gif

Bron: Afbeelding Funkhouser, H.G. (1936). 'A note on a tenth century graph'. Osiris 1 (1936) pp. 260-262

Als programmeur gebruik je vaak fora en discussie omgevingen om oplossingen voor bepaalde vraagstukken te vinden. Waar iemand zich bevindt is dan niet van belang. Zolang er maar een internetverbinding mogelijk is. Toch is het ook handig om te weten of er mensen met dezelfde vaardigheden fysiek in je omgeving zijn. Voor bijvoorbeeld een Django sprint waar mensen met elkaar rond de tafel gaan zitten om gezamenlijk bugs op te lossen, functionaliteit uit te breiden of vertalingen te ontwikkelen met als doel om, in geval van Django, een framework te verbeteren.

Een geografische visualisatie van deze informatie is dan de manier om iemand inzicht te geven in wie zich in de buurt bevindt.

djangopeople_1.gif

Pratende met vrienden over het visualiseren van data is er vaak de vraag wat het dan precies inhoud, waar ik de grenzen van het onderwerp trek. Allemaal kennen ze wel de getekende uitleg bij nieuwsonderwerpen of krant. Maar is dat nou data of is dat nou informatie visualisatie?

Omdat duidelijk te maken laat ik ze dan de twee verschillende uitgangspunten zien. Zoals bijvoorbeeld de kaart die het grondwaterpeil in Nederland visueel presenteert

grondwater.gif

en de wat uitgebreidere visualisatie zoals

OS2004_Zwemmen_15863a.jpg.

Het eerste voorbeeld is een weergave die naast het weergeven van de diepte van het grondwater t.o.v. het NAP ook gebruikt zou kunnen worden voor neerslag in millimeters of voor het zichtbaar maken van welke delen onder water zouden lopen als de zeespiegel een x aantal meters zou stijgen. En ook zonder tekst is de weergave een verhaal. De bronbestanden, het uitgangspunt, zijn kale data. Door de combinatie kaart en cijfers wordt het pas informatie. Dit zie ik als data visualisatie.

In het tweede voorbeeld is de tekst onlosmakelijk verbonden met het beeld. De afbeelding versterkt de tekst. Het bronbestand waarbij geïllustreerd wordt is dus al informatie. De afbeeldingen versterkt deze informatie allen maar. Hier is sprake van informatie visualisatie.

En het spannende van data visualisatie is dat je door het combineren van verschillende data verrassende informatie kunt vinden, vooral als deze interactief is...

top10.gif Wil je weten welke informatie uit de media de gemoederen het meest bezig hielden? Probeer dan eens de site Peilend.nl. Deze site mede ontwikkeld door de UvA koppelt via het web verkregen informatie (uit o.a. Algemeen dagblad, NRC, Trouw) aan het aantal reakties op de verschillende berichten. Ook kun je zoeken naar de 10 meest genoemde steden in bijvoorbeeld de verschillende nieuwsartikelen (in- of exclusief reakties) op woensdag 6 maart.

Wil je weten welke namen het meest zijn gebruikt in de afgelopen week in alle artikelen genereert de applicatie een prachtige tagcloud voor je.

peilendnl.gif

De applicatie probeert inzicht te krijgen in de 'commentosphere' (de wereld van het reageren op nieuwsartikelen). Ze probeert hierbij vragen te beantwoorden zoals wie regaeert er, reageren ze op elkaar, in welke taal wordt er gereageerd, waar komen ze vandaan, hoe kun je een persoon achter een reaktie indentificeren, etcetera.

Het geheel is gebaseerd op de bachelor thesis 'Applied Text Analytics for Comments on News-Articles' (PDF) van Anne Schuth.

ABSTRACT
Several on-line daily newspapers offer readers the opportunity to directly comment on articles. In the Netherlands this feature is used quite often and the quality grammatically and content-wise) is surprisingly high. The paper develops techniques to collect, store, enrich and analyze these comments. After giving a high-level overview of the Dutch 'commentosphere' we zoom in on extracting the discussion structure found in flat comment threads; people not only comment on the news article, they also heavily comment on other comments, resembling discussion fora. We show how techniques from information retrieval, natural language processing and machine learning can be used to extract the 'reacts-on' relation between comments with remarkably high precision and recall.

Fundraising2008.jpg

De Huffington Post heeft een interactieve geografische applicatie ontwikkeld. Door het koppelen van data kun je inzicht krijgen in wie welke kandidaat financieel steunt, waar ze wonen, wat ze doen, of je buren doneren, wat de politieke voorkeur is van de stad waar je woont. De ethiek rondom het koppelen van data lijkt me een zeer belangrijk iets...

frank_v_ham.jpg

Onze wereld wordt steeds complexer, dynamischer en multidimensioneel. Zo ook onze communicatie. De see conferentie wordt gewijd aan nieuwe benaderingen die op het gebied van ontwerp, kunst, architectuur, multimedia en economie worden ontwikkeld om deze complexitieit te confronteren en de immense vloed van informatie om te zetten in bruikbare kennis. Sprekers van dit jaar zijn van Ben Fry, de performance kunstenaar Zachary Lieberman en Frank van Ham van het IBM Visual Communication Lab. De see conferentie wordt gehouden op 19 April 2008 in het Caligari theater in Wiesbaden.

Related links:

benfry_1.jpg

Ben Fry,
Designer, Cambridge
www.benfry.com
acg.media.mit.edu/people/fry/
www.processing.org


frankvanham_3.gif

Frank van Ham,
IBM Visual Communication Lab, Cambridge
www.research.ibm.com/visual/
www.many-eyes.com


lieberman_5.jpg

Zachary Lieberman,
Performance artist, New York
www.thesystemis.com
www.tmema.org

Wow

pictorialstats_1.jpg Zomaar, kado gekregen, een eerste editie uit '37.
Hoeveel mensen zouden hier hun kennis al uitgehaald hebben...

TL_%20De%20dag%20dat%20de%20dollar%20viel.jpg Tegenlicht van de VPRO kan zeer inspirerende afleveringen uitzenden. Het prikkelt mij regelmatig tot verder zoeken. Zo ook gisteren toen de klassieker 'De dag dat de dollar valt' nog een keer werd uitgezonden.

In een doemscenario ontwikkeld door Maarten Schinkel, financieel-economisch redacteur van NRC Handelsblad, wordt bekeken of we daadwerkelijk op een zeepbel leven. Kan de zwaar in de schulden geraakte Amerikaanse economie instorten en ons, Europeanen, meesleuren in een vrije val? Zijn de dagen van de dollar als wereldmunt geteld? En hoe realistisch is de angst voor een recessie zoals die van 1929?

Ze verweven fictie en werkelijkheid samen tot een spannende documentaire. Na afloop hiervan ben ik zelf eens gaan zoeken naar meer informatie. Zo ben ik terecht gekomen bij Treasury Direct, een amerikaanse overheidssite die inzicht geeft in de schulden van America en deze schulden heeft.

TL_debt.gif

Daar zie ik dat ze op dit moment een schuld hebben van meer dan 9 biljoen welke dagelijks schrikbarend toeneemt...

Vervolgens ben ik naar de site van de Europese Centrale Bank gegaan om te kijken wat de snel stijgende dollarkoers op dit moment is.

TL_ECBdollarkoers.gif

Met al deze informatie zie je hoe schrikbarend de schulden zijn toegenomen onder het wanbeleid van Bush. Nieuwsgierig geworden ben ik verder gaan zoeken. Heeft America deze nationale schuld ook als speerpunt in hun beleid? Zoekende op onder andere 'debats' kwam ik uit bij The New York Times waar ik een zeer effectieve visualisatie tool tegenkwam: Democratic Debate: Analyzing the Details.

Ze hebben de transcriptie van een debat gekoppeld aan een 'analyzer'. Als ik binnen de 'analyzer' zoek op 'debt' dan veranderd de achtergondkleur van de stukken tekst die mogelijk handelen over 'debt'. Daar waar de woorden 'debt' letterlijk gebruikt worden verschijnen donkere blokjes.

TL_debt.png

Zo zoeken door een debat zorgt dat je kunt focussen op kernwoorden. Welke politicus heeft het over schulden, een zwakke dollar, een ineenstortende markt, consuminderen etctera.

Probeer zelf: Democratic Debate: Analyzing the Details

Een legenda is dat gedeelte van een kaart (of een model) waarin de verschillende symbolen die gebruikt zijn uitgelegd worden. In drukwerk is het zo dat een goede legende zo min mogelijk geraadpleegd hoeft te worden. Elk symbool moet direct duidelijk zijn. De legenda is ook vast. Kleuren en vormen kunnen niet beïnvloed worden. De x- en y-assen hebben vaste waardes. Dit in tegenstelling tot de interactieve media. Daar is juist wel de mogelijkheid om kleur, vorm of waarden te wijzigen.

Even voorbijgaand aan het feit dat er een hele wetenschap (de geografie) gericht is op het ontwikkelen van goede kaarten en legenda's laat ik aan de hand van Gapminder World het grote voordeel zien.

Standaard staat deze map ingesteld op wereld, levensverwachting en inkomen.

gapminder_world_1.gif

Maar dankzij de interactieve legenda kan ik inzicht krijgen in de door mij gekozen landen, de CO2 uitstoot en de ontwikkeling hiervan sinds 1960 tot 2002. Dit laat bijvoorbeeld zien dat deze landen de uitstoot tussen 1973-1979 beduidend verminderd hadden maar dat deze nu weer enorm toeneemt. Nederland zorgt ook voor meer vervuiling dan de ons omringende landen zoals België, Engeland of Frankrijk. Doordat ik de markeer punten kon verkleinen en een spoor kon aanzetten heb ik de voor mij interessante data visueel kunnen presenteren.

gapminder_world_2.gif

De visiuele weergave is eenvoudig maar de kracht die er in deze interactieve kaart schuilt enorm. Het beïnvloeden en daarmee analyseren van data is niet alleen beperkt tot een interactieve legenda maar ook tot alle elementen gebruikt binnen deze kaart.

Sieber, Schmid and Wesmann van het Schweizer Institut für Kartografie in Zürich hebben onderzoek gedaan naar de randvoorwaarden waar interactieve legenda's aan zouden moeten voldoen: Smart legend - Smart Atlas! (PDF).

ABSTRACT Atlases are moving quickly towards multimedia, three-dimensional visualization and interactive techniques. Digital atlas maps benefit from nearly free navigation, sophisticated visualization techniques and analytical functionality. Zooming and panning, coloring, and interactive queries are standard features nowadays. But one of the most important features of every map - the legend - still lacks appropriate functionality and even good graphic design. Reviewing traditional and digital map legends, seven functional components can be extracted: visualization, navigation, analysis, dimensionality, thematic issues, general information, and layout. These seven legend components should be considered in the design process of every interactive legend. But we can go even a step further, by imagining and realizing smart functionality for the legend. In our new „smart legend" approach, the legend is defined as a central control unit of the map. We can distinguish two main feature categories of a „smart legend"; Self-acting adaptations of the legend that aim at a preferably optimal depiction of the map elements, and the range of user interaction features provided.

Links:
http://www.gapminder.org/
ETH Zürich: Institut für Kartografie
Atlas der Schweiz


Hoe kun je nou weten wie welke kennis bezit? Bijvoorbeeld doordat mensen kennis omzetten in informatie. Een onderzoek van Katy Börner, Chaomei Chen en Kevin W. Boyack geeft inzicht in hoe dit visueel zou kunnen worden weergegeven.

Visualizing knowledge domains (p 179-255) (PDF)
Katy Börner, Chaomei Chen, Kevin W. Boyack
Published Online: Jan 31 2005 8:04AM
DOI: 10.1002/aris.1440370106

figure5.jpg

A landscape view of the ACA map displayed in Figure 4. The height of a citation bar indicates the number of citations for the correspondent author. The spectrum of colors on each citation shows the time when citations were made. Authors with more than 50 citations are displayed with semi-transparent labels.

figure8.jpg

A close-up view of a few clusters along the main artery in the DCA map. The height of a bar represents the number of citations to a publication. Labels indicate articles in clusters, for example, Small73 for an article of Small in 1973. Multiple publications within the same year are not distinguished at this level. For example, Small73 includes all Small's publications in 1973.


Een ander voorbeeld heb ik op bestiario.org gevonden. Ik kan geen spaans lezen maar ik interpreteer het als een soort matrix waar je op kennisgebied zoals digitaal, audiovisueel kunt filteren. Klikkend op een persoon krijg je meer informatie over deze persoon.

bestiario.gif

Check ook eens Commetrix.

Commetrix is a Dynamic Network Visualization and Analysis Software that supports Community Moderators, Members, and Network Researchers. It provides an easy exploratory yet comprehensive access to network data and allows for:

- Extracting virtual communities in electronic communication networks
- Visualizing dynamic network lifecycles, properties, and structures
- Creating rich expert network maps from communication logs
- Searching, filtering, navigating social corpora, like e-mail, discussions
- Understanding and utilizing your social networks
- Trace dissemination of topics or properties through the network
- Extendable to all sources of network data

keywordpicture.png

Clusterednetwork3d-view2.png

Het overzichtelijk kunnen doorbladeren van veelzijdige datasstructuren is een aardige uitdaging. Moritz Stefaner heeft zijn oplossing - een 'elastische lijst' - online gezet.

20071106.jpg

Als basisdata hebben ze alle nobelprijswinnaars tussen 1901 en 2004 zoals opgenomen in de database van de Flamenco facet browser. Je kunt filteren op jaar, geslacht, land, decennium of jaar. En mocht er geen selectie mogelijk zijn dan presenteert de applicatie de meest in de buurt liggende data.

Online demo >
Een korte uitleg over Elastic lists >

De demo is gemaakt in Adobe Flash.

Een treemap is een manier om binnen een kader een hiërarchische structuur zichtbaar te maken. Het maakt patronen in data zichtbaar. Hierdoor kunnen bijvoorbeeld trends en ontwikkelingen zichtbaar worden.

Een voorbeeld van een treemap is bijvoorbeeld Newsmap, een applicatie die de patronen binnen GoogleNews zichtbaar maakt.

Picture%201.png

Een ander voorbeeld is de Gapminder World van Google.

Gapminderworld.png

Producten die gebaseerd zijn op het concept van treemaps:
Smart Money
Honeycomb van de HiveGroup
Heat Map Explorer van Labescape.
Gapminder.

Meer informatie over treemaps:
Treemap, University of Maryland
Dynamic treemap layout comparison

Treepmap.png

Boek:
Readings in Information Visualization: Using Vision to Think (Amazon)
Stuart K. Card, Jock D. Mackinlay, and Ben Shneiderman.
Morgan Kaufmann Publishers, San Francisco, CA
ISBN 1-55860-533-9

History flow is een online applicatie die op een eenvoudige wijze laat zien hoe de pagina's binnen Wikipedia door verschillende personen bewerkt worden.

5.gif

Het resultaat is dat je in één oogopslag kunt zien wie er een pagina bewerkt heeft. En door geautoriseerde personen een kleur te geven kun je ook direct zien welke externe auteurs de desbetreffende wikipedia pagina bewerkt hebben. Of welke pagina's weinig revisies hebben.

ibm2version.gif

Het op deze manier zichtbaar maken van bestaande data zorgt voor nieuw inzicht en zou prima toegepast kunnen worden binnen andere sociale netwerken dan Wikipedia. Maar je zou op deze manier ook inzicht kunnen krijgen in de toename van het aantal pagina's handelend over een bepaald onderwerp.

Bijbehorend paper over history flow:
Studying Cooperation and Conflict between Authors with history flow Visualizations

De website History Flow

En Wikipedia Map bij Discover Magazine
discover_mag2.jpg

Archief

Over dit archief

Deze pagina is het archief met recente berichten uit de Data en visualisatie categorie.

De metadata van informatie is de volgende categorie.

Lees recente content in de linker kolom of blader door het archief om alle content te vinden.

www.flickr.com
This is a Flickr badge showing public photos and videos from Amsterdam, statistisch bekeken. Make your own badge here.
Creative Commons License
This weblog is licensed under a Creative Commons License.
Powered by Movable Type 4.21-en