Vormgeven is beter dan genezen

10 basisregels bij het visualiseren van data

In een eerdere blog schreef Tom Dokter over de valkuilen van cijfers. Hierin stelt hij dat het voor controllers (en eigenlijk iedere professional) van belang is om te begrijpen dat cijfers zeker geen objectief beeld geven, hooguit een referentie. Tevens is er altijd interpretatie in het spel, waardoor (vaak tijdrovende) interpretatieverschillen continu op de loer liggen. Iedereen kan wel minimaal één moment voor de geest halen, waar een bespreking van een analyse niet ging over de uitkomsten, maar over de juistheid van de gegevens of over het ophelderen van een grafiek. Zonde van de tijd, én is vaak te voorkomen.

Dergelijke interpretatieverschillen worden namelijk vaak veroorzaakt door het, zowel bewust als onbewust, maken van verkeerde keuzen in het visualiseren van gegevens. Derhalve is het van belang om gegevens op de juiste manier te visualiseren. Maar wat is de juiste manier? Ondanks dat dit niet altijd even zwart-wit is, zijn er wel een aantal basisregels. In deze blog kijken consultants Tom Dokter en Axel van Dijk naar deze basisregels en laten zij zien wat de grootste valkuilen zijn.

---

Ben jij ook goed met cijfers en data?

Word Finance & Control Consultant bij Verhoeve, onderdeel van de Quoratio Groep! 
>> Bekijk vacatures

 

1. Maximaliseer data-inkt ratio

Over het algemeen zien wij dat professionals er geregeld kiezen voor een ‘mooie’ grafiek in plaats van een grafiek die in één oogopslag duidelijk is. Zo wordt er vaak gekozen voor veel kleur (inkt) in vergelijking met de hoeveelheid gegevens (data). Van de onderstaande twee voorbeelden is de linker, mede door de hoeveelheid inkt, direct heel opvallend. Daarentegen is het rechter voorbeeld relatief eenvoudig. Het interpreteren van de opvallende variant (links) kost de gebruiker aanzienlijk meer tijd dan het interpreteren van de simpele variant (rechts).

data inkt afb 1-1 data inkt afb 2

 

2. Gebruik contrast om data te tonen

Naast het letten op de data-inkt ratio, is het gebruik van contrast een belangrijk onderdeel in het visualiseren van data. Contrast kan nadruk leggen op het belangrijkste gedeelte van de visualisatie waardoor dit direct opvalt bij de gebruiker. Vergelijk onderstaand voorbeelden met elkaar en bepaal zelf welke beter over komt.

contrast afb 1 contrast afb 2

 

3. Beperk kleuren, gebruik varianten

Een ander belangrijk punt is het gebruik van te veel (verschillende) kleuren. Desondanks wordt het negatieve effect van te veel kleur geregeld onderschat. Kleur kan erg sterk zijn in het belichten van belangrijke aspecten, maar kan ook leiden tot een grote bonte bedoeling in een dashboard. Indien je voor kleur kiest, ga dan voor één kleur in verschillende varianten (zie het rechtervoorbeeld). Door dit door te voeren in je gehele dashboard creëer je een uniforme, rustige uitstraling. Indien je wel kiest voor verschillende kleuren, probeer deze dan zo logisch mogelijk te houden. Denk hierbij aan een kleur die bij de naam hoort (groen > peer, geel > banaan, rood > appel) en gebruik deze kleuren in het dashboard alleen als het over deze producten gaat.

kleuren en variaties afb 1 kleuren en variaties afb 2

 

4. Gebruik geen kleurverloop

Het gebruik van kleurverloop is een valkuil die we gelukkig relatief weinig tegenkomen, maar desondanks wel belangrijk vinden om te benoemen. Zoals reeds beschreven, kies je voor kleur, houd het dan zo eenvoudig mogelijk. Dit brengt de boodschap het beste over. Zie hiervoor wederom twee voorbeelden, waarbij de linker gebruikmaakt van kleurverloop en de rechter niet.

kleurverloop afb 1 V2 kleurverloop afb 2 V2

5. Vermijd 3D en “smoothing”

Het toevoegen van 3D-effecten is een van de grootste valkuilen bij het visualiseren van data. Zoals reeds vermeld, wordt er vaak gekozen voor een mooie grafiek. Het oog wil tenslotte ook wat. Echter gaat dit ten koste van de leesbaarheid. Vergelijk eens onderstaande twee voorbeelden eens. De linker springt er meteen uit en zal nagenoeg direct alle aandacht opeisen. Echter, is het allesbehalve eenvoudig om af te lezen dat er tachtig bananen verkocht zijn. Sterker nog, door het 3D-effect kan de interpretatie gewekt worden dat het meer dan tachtig bananen betreft. Daarentegen is de rechter straight to the point en vertelt meteen wat je wilt weten.

vermijd 3D en verloop afb 1 V2 vermijd 3D en verloop afb 2 V2

Een andere grote valkuil is het willen ‘smoothen’ van een grafiek. Zie hiervoor onderstaande twee voorbeelden. Links wordt er gebruik gemaakt van ‘smoothing’. Hierdoor ontstaat er een elegantere, vloeiende lijn welke grafisch mooier oogt dan de hoekige lijn rechts. Echter schuilt hier het gevaar dat het lijkt alsof de getallen in de grafiek gedurende de maanden afvlakken terwijl er per maand maar één meetpunt is. Dus er is enkel een lijn tussen twee punten (bijvoorbeeld jan en feb).Daarnaast wordt, doordat de lijn links wordt afgevlakt, het precies aflezen van de punten in de grafiek lastiger ten opzichte van rechts. Waarmee er wederom ruimte voor interpretatieverschillen ontstaat.

smoothen afb 1 smoothen afb 2

 

6. Leesbare labels

Een van de meest gemaakte fouten, welke wij tegenkomen, is het werken met onduidelijke labels. Meer dan eens worden labels verticaal of diagonaal in plaats van horizontaal onder een visualisatie gezet om ruimte te besparen. Dit maakt het voor een lezer onnodig ingewikkeld om de grafiek te lezen. daar hij of zij eerst goed moet kijken om te zien wat er nu staat. Vergelijk bijvoorbeeld de twee onderstaande visualisaties, waarbij de labels van de rechter visualisatie overduidelijk makkelijker leesbaar zijn. Logischerwijs kan de linker visualisatie onnodig tot discussie en vragen leiden. Stel dat er meerdere grafieken op een pagina staan (bijvoorbeeld in een dashboard), waarbij iemand zich focust op één van de categorieën in een specifieke grafiek. Bijvoorbeeld Banaan, dan is een van de meest gestelde vragen; “Waar staat Banaan?”.

labels afb 1 V2 labels afb 2 V2

7. Voorkom herhaling

Daarnaast laten gebruikers bij het visualiseren van data (bijvoorbeeld in Microsoft Excel of PowerBI) geregeld de standaard opties aanstaan. Hierdoor komen snel veel onnodige dubbelingen in de visualisatie te staan. Door af te wijken van de standaard weergave-opties zijn onnodige herhalingen te voorkomen en worden visualisaties eenvoudiger te interpreteren. Neem onderstaande twee voorbeelden, waarbij het rechts direct duidelijk is dat er data over meerdere jaren wordt gepresenteerd. Links zal een gebruiker uiteraard uiteindelijk dezelfde conclusie trekken. Echter heeft hij of zij hier meer tijd voor nodig daar er meer én vooral dubbele informatie wordt verschaft. Zo wordt links het jaartal vier keer herhaalt, waardoor links het onderscheid tussen 2020 en 2021 op het eerste gezicht minder duidelijk is dan rechts. Tevens wordt er links op drie verschillende manieren weergegeven dat het om maandcijfers gaat. Allereerst in de titel, daarnaast in de legenda, en tot slot staan de maanden ook in de as weergegeven. Door deze dubbelingen weg te halen wordt de visualisatie sneller én eenvoudiger te interpreteren.

herhaling afb 1 V2 herhaling afb 2 V2-1

Daarnaast wordt het voor een lezer in toenemende mate complex om de herhalingen te interpreteren op moment dat de as verder wordt uitgebreid. Stel dat er gegevens worden gepresenteerd over de afgelopen vijf of tien jaar, waar in de grafiek bevindt zich dan jaar X of Y? Een lezer zal uiteraard begrijpen dat het datapunt van acht jaar geleden zich meer in het begin van de as zal bevinden en datapunt van een jaar geleden meer op het einde van dezelfde as. Desondanks moet hij of zij een voor een de labels langs om te zien waar het betreffende datapunt zich bevindt. Het rechter voorbeeld is in die zin sneller, en bovenal eenvoudiger, te interpreteren.

 

8. Sorteer voor meer begrip

Een van de belangrijkste zaken bij het opstellen van een visualisatie is het achterhalen van de vraag. Met andere woorden “Wat is de vraag?”, “Hoe kan de vraag worden beantwoord?”, en “Wat betekent dit voor de visualisatie?”. Meer dan eens is de vraag: Wat was het best of wat was het slechtst? En hoe verhouden die uitkomsten zich tot elkaar? Denk bijvoorbeeld aan verkoopcijfers, operationele resultaten van business units en productiviteitscijfers. Vanzelfsprekend is dit stukken eenvoudiger te interpreteren indien gegevens op de juiste manier zijn gesorteerd. Zie ook onderstaande voorbeelden. Links is niet alfabetisch gesorteerd op naam én niet op aantallen. Hierdoor kost het (zeker wanneer de categorieën vele malen groter zijn) relatief veel tijd om de data te interpreteren. Rechts daarentegen geeft direct weer wat aflopend de grootste aantallen zijn. Sortering op naam had ook gekund, wanneer de focus meer ligt op de verkopen per type.

sorteer afb 1 V2 sorteer afb 2 V2

 

9. Reken zoveel mogelijk voor

Een ander belangrijk punt, wat meer dan eens achterwege wordt gelaten, is het doorrekenen van resultaten. Zie onderstaande twee voorbeelden. In het linker voorbeeld wordt de cumulatieve omzet (Actuals) gedurende het jaar vergeleken met de target omzet (Target). Gezien de geringe verschillen tussen de actuals en de target in de maanden, is het uiterst lastig om de verschillen in één oogopslag volledig en juist te interpreteren. Welke maanden is er boven dan wel onder de target gepresteerd? Wat was het verschil tussen de actuals en de target? Om deze vragen te beantwoorden, dient een lezer in dit geval zelf de verschillen te berekenen dan wel te interpreteren. Hierdoor bestaat de kans dat er een discussie wordt gevoerd over de waarneming (is er boven/onder target gepresteerd?) in plaats van het gesprek achter de cijfers (waarom is er boven/onder target gepresteerd?).

voorrekenen afb 1 V2 voorrekenen afb 2 V2

 

10. Vereenvoudig vergelijken

Dat brengt ons op het laatste punt. Zorg dat gegevens altijd eenvoudig te vergelijken te zijn. Hierin komen reeds benoemde basisregels vaak samen. Echter is dit ook een regel op zich daar er geregeld wordt gekozen voor een visualisatie waarbij alle categorieën gestaffeld worden weergegeven. Hierdoor is de grootte van de afzonderlijke categorieën uiterst lastig af te leiden uit te visualisatie. Hetgeen de vergelijking van de diverse categorieën onnodig complex maakt.

Vergelijk onderstaande voorbeelden. Beide visualisaties geven dezelfde gegevens weer, waarbij de omzet per product links alleen op totaalniveau (alle producten) eenvoudig is af te lezen. De omzet per afzonderlijk product dient de lezer zelf uit te rekenen. Ook is het lastig in te schatten wat de omzetontwikkeling per product is geweest. Neem de omzet van appels. Hier lijkt de trendlijn van februari tot juni op het eerste gezicht te stijgen. Echter stijgt deze niet en wordt dit veroorzaakt doordat de omzet van appels en bananen groeit. In het rechtervoorbeeld is er wel in één oogopslag te zien welk product de meeste omzet heeft per maand, welk product het minste en wat de omzetontwikkeling per product was.

vereenvoudig afb 1 V2 vereenvoudig afb 2 V2

 

Conclusie

Tijdrovende interpretatieverschillen liggen continu op de loer. Gesprekken gaan meer dan eens over het begrijpen van visualisaties in plaats van het verhaal achter de cijfers. Door bij het visualiseren van data rekening te houden met de basisregels en de juiste keuzen te maken, kunnen interpretatieverschillen tot een minimum worden beperkt. Kostbare tijd gaat niet langer verloren aan het interpreteren en begrijpen van visualisaties, maar wordt besteed aan het verhaal achter de cijfers. Waarmee zowel de snelheid als de kwaliteit van besluitvorming en aansturing van organisaties verhoogd. Onthoud daarom altijd de tien basisregels:

2021-05_Visual Praktische handvaten visualisaties-1800x853px

 

 

 


 

Tom Dokter & Axel van Dijk
Tom en Axel zijn beide Finance & Control consultants bij Verhoeve - onderdeel van de Quoratio Groep - en gespecialiseerd in Business Intelligence (BI) & data analytics. Zij richten zich onder andere op het effectief toepassen van data bij diverse organisatievraagstukken. Tom is in september 2020 begonnen met de Executive Master of Finance & Control / Register controller aan de Rijksuniversiteit Groningen. Axel heeft in 2020 de Post Bachelor opleiding Toegepaste Data Science for Financials afgerond.
Meer van deze auteur

Wellicht is dit ook interessant