10.2 Tvořte dobré grafy

Tvořte dobré grafy

Graf je jednou z nejpoužívanějších forem grafické reprezentace dat. Jeho pomocí dokážete snadno vizualizovat statistické výsledky tak, aby jim na první pohled každý porozuměl. Výhodou grafu je to, že umožňuje všímat si vzájemných vztahů a vlivů proměnných na jednotlivé prvky, které by vám v textu nebo tabulce mohly zůstat skryty.

Vizualizace dat prostřednictvím grafů je metoda, která je prověřená časem. O tom, jak grafy vůbec vznikly, se dozvíte v tomto videu.

Kdy je ale vůbec vhodné graf použít? Po grafu sáhněte ve chvíli, kdy chcete hodnoty porovnat, případně poukázat na jejich vzájemné vztahy a korelace (vzájemnou závislost). V případech, kdy vám jde spíše o zobrazení přesných hodnot než jejich vztahů, bude vhodnější tabulka.

V rozhodování o použití grafu hraje roli také množství dat, které chcete vizualizovat. Reprezentovat pomocí grafu hodnoty, které jsou příliš malé (např. v řádech jednotek), nejsou obsažné nebo neukazují žádné zajímavé poměry, je zbytečné. Taková data stačí vyjádřit slovně.

Tyto grafy jsou příkladem těch, jejichž použití je v práci zbytečné. Poznáte proč?

modul_10_1

Typy grafů

Existuje velké množství využitelných typů grafů. Jejich použití se liší v závislosti na tom, jaké hodnoty chcete jejich pomocí znázornit. Některé grafy se hodí pro vizualizaci procentuálního zastoupení jednotlivých prvků v celku (např. rozložení věkových skupin), jiné pro ukázku postupného vývoje (např. narůstání cen). Při volbě typu grafu se tedy nejdříve ze všeho důkladně zamyslete nad tím, co vlastně chcete jeho prostřednictvím demonstrovat.

Chci porovnat hodnoty
Představte si, že ve své práci na téma „Čtenářské preference čtenářů Knihovny Jiřího Mahena“ potřebujete vizualizovat data o tom, kolik knih z každého oddělení bylo celkem vypůjčeno za minulý rok. Jak zjistíte, který graf je pro vás ten pravý?

Prvním krokem je uvědomit si, jaká data vlastně máte. Počet knih, které si čtenáři vypůjčili, je celočíselná hodnota, lze ji snadno porovnávat s ostatními hodnotami. Zároveň víme, že neukazuje postupný vývoj, ale jen stav v určitém časovém bodě. Vhodnou volbou vizualizace tohoto typu dat je tedy sloupcový nebo pruhový (pásový) graf.

Sloupcový graf
Je jedním z nejpoužívanějších typů grafu určených pro porovnání hodnot. Skládá se ze dvou přímek xy, protínajících se v pravém úhlu. Datové hodnoty jsou pak vyjádřeny formou sloupců, jejichž délka proporcionálně odpovídá velikosti hodnot, kterou znázorňují. Sloupcový graf je poměrně přesný a je schopen pojmout i větší objemy dat.

Knihy vypůjčené z KJM za rok 2015 (v tis.) dle druhu literatury
obr_10_2

Oblíbenou obměnou sloupcového grafu je skupinový sloupcový graf, který umožňuje porovnávat také podskupiny hlavních kategorií.

Knihy vypůjčené z KJM za rok 2015 – čtenářské preference u dospělých a dětských čtenářů (v tis.)
obr_10_3

Další využitelnou variantou sloupcového grafu je skládaný sloupcový graf. Ten se hodí v případě, kdy všechny podskupiny tvoří dohromady celou hlavní kategorii (např. pokud chceme ukázat poměry mezi typy knih půjčenými jednak dětmi, jednak dospělými) – podobně jako u grafů vyjadřujících poměr, ke kterým se ještě dostaneme.

Knihy vypůjčené z KJM za rok 2015 – čtenářské preference u dospělých a dětských čtenářů (v tis.)
obr_10_4Pruhový (neboli pásový) graf
Stejně jako sloupcový také pruhový graf slouží k porovnávání dat více kategorií. Rozdíl spočívá v uspořádání prvků grafu – kategorie jsou uspořádány podél osy y, zatímco hodnoty ve formě pruhů jsou vykreslovány podél osy x. Zkrátka jedná o sloupcový graf otočený o 90 stupňů. Pruhový graf obvykle upřednostníte před sloupcovým v případech, kdy jsou popisky kategorií příliš dlouhé, nebo pokud nekladete velký důraz na posloupnost jednotlivých kategorií.

Knihy vypůjčené z KJM za rok 2015 (v tis.) dle druhu literatury
obr_10_5

Také pruhový graf nabízí několik různých variant. Skupinový pruhový a skládaný pruhový graf fungují na stejném principu jako tytéž varianty u sloupcového grafu.

Knihy vypůjčené z KJM za rok 2015 – čtenářské preference u dospělých a dětských čtenářů (v tis.)
obr_10_6

Knihy vypůjčené z KJM za rok 2015 – čtenářské preference u dospělých a dětských čtenářů (v tis.)
obr_10_7Chci ukázat poměry hodnot
V našem pomyslném výzkumu čtenářských preferencí jsme se zaměřili také na to, kolik procent registrovaných čtenářů knihovny tvoří děti do 15 let. Jaký graf nám nejlépe poslouží pro vizualizaci tohoto typu dat? Vodítko nám poskytnou opět samotná data. Víme, že chceme vizualizovat jedinou datovou řadu (typ čtenáře) a spíše než konkrétní čísla chceme ukázat vzájemný poměr dvou kategorií (děti versus dospělí). Vhodným řešením je tedy koláčový graf.

Koláčový (neboli výsečový) graf
Vyjadřuje podíl jednotlivých prvků na celku za pomoci tzv. výsečí. Může se jednat o procentuální hodnoty nebo o proporcionální rozdíly, součet všech podílů v grafu by ale měl dávat vždy 100 %. Jeden graf může vyjadřovat vždy jen jednu datovou řadu, může ale zahrnovat více kategorií, z nichž každou reprezentuje prostřednictvím jedné výseče. Výsečí by v grafu nemělo být více než osm, jinak graf ztrácí na přehlednosti a doporučuje se, aby byl místo něj využit jiný typ grafu (např. sloupcový).

Dospělí a děti v KJMobr_10_8Chci ukázat vývoj hodnot v čase
Protože jsme pro svůj výzkum získali také data o tom, kolik čtenářů bylo v knihovně registrováno za posledních pět let, rádi bychom tato data vizualizovali, abychom snáze viděli, jak se tato hodnota  za tu dobu změnila. Pro vyjádření vývoje číselné hodnoty v čase se nejlépe hodí spojnicový graf.

Spojnicový (neboli lineární) graf
Stejně jako sloupcový nebo pruhový graf se zakresluje pomocí os x a y. Hodnoty jsou sem zanášeny pomocí tzv. datových bodů, které jsou následně spojeny liniemi. Linie nám umožňují lépe srovnávat hodnoty a snáze vidět jejich růsty a poklesy.

Další výhodou spojnicového grafu oproti sloupcovému je to, že můžete s jeho pomocí vizualizovat více datových řad najednou (např. pokud byste chtěli vzájemně porovnat počty knih z jednotlivých oddělení půjčované za posledních pět let) a takto srovnávat více jevů a hledat mezi nimi souvislosti.

Vývoj počtu čtenářů KJM v letech 2011-2015
obr_10_9

Pro shrnutí účelu jednotlivých typů grafů je k dispozici zjednodušená tabulka:
Mimo tyto základní typy grafů existuje i mnoho dalších, i když se s nimi nejspíš nesetkáte tak často. Pokud si stále nevíte rady s tím, jaký typ grafu pro svá data zvolit, nebo byste rádi měli na výběr z více variant, vyzkoušejte si online nástroj Chart Chooser, který vám pomůže vybrat vhodný typ grafu podle druhu vašich dat.

.
Zásady tvorby grafů

Tvorba grafu má jasně daná pravidla, která je nutno akceptovat, pokud chcete, aby graf dával smysl a znázorňovaná data nijak nedezinterpretoval. O tom, jak se rozhodnout, jestli graf použít a jaký typ zvolit, jste se už dozvěděli. Nyní je na čase poznat zásady, které se týkají samotné tvorby grafu.

  • Přehledná vstupní data
    Prvním krokem k přehlednému grafu jsou kvalitní vstupní data. Než přejdeme k jejich vizualizaci, musíme se ujistit, že jsou kompletní, neobsahují duplicitní hodnoty a jsou konzistentní (tj. shodují se v použitých jednotkách, měřítku apod.). Často je dobré si je pro přehlednější porovnání předem seřadit, některé vizualizační nástroje to totiž po vytvoření grafu neumožňují.
  • Dobře popsaný graf
    Jak už bylo řečeno, z grafu musí být na první pohled jasné, jaká data znázorňuje. Proto by žádný graf neměl postrádat výstižný nadpis, který čtenáře stručně uvede do problematiky. Dalšími nezbytnými textovými poli grafu jsou popisky os. Bez nich nebude čtenáři jasné, co graf vlastně popisuje. Stejně tak je popisek osy místo, kam je vhodné napsat, v jakých jednotkách je hodnota uváděna, je-li to potřeba.
    .
    Nezbytnou součástí grafu je legenda. Je na vašem zvážení, jestli je vhodnější její umístění mimo graf, nebo naopak přímo ke grafickým prvkům. Tato varianta je často vhodnější, protože čtenářům usnadní orientaci v grafu a předchází problémům se vzájemnou záměnou použitých barev. Pro představu se podívejte na grafy níže. Který z nich vám připadá přehlednější?

Emise základních znečišťujících látek
obr_10_11Emise základních znečišťujících látek
obr_10_12

  • Funkčnost především
    Při tvorbě grafu platí, že méně je více. Graf by měl být především přehledný, a proto není dobré ho zbytečně zahlcovat animacemi a efekty, které jeho funkčnost nijak nezvyšují. Vyvarujte se 3D efektů, barevných pozadí a různých ilustračních obrázků. Pokud to není nezbytně nutné, nepoužívejte ani mřížky, protože ty mohou snižovat čitelnost textu.Co byste rozhodně neměli podcenit, je volba barev. Myslete na to, že ne každý bude moci užívat barevnou verzi grafu, zvlášť pokud tvoříte materiál pro tisk. Ujistěte se proto, že jsou barvy dostatečně kontrastní a budou vzájemně rozeznatelné i po vytištění na černobílé tiskárně.
  • Žádná manipulace
    Stejně jako text i vizualizace se může stát nástrojem manipulace. U grafů jste zvyklí na to, že je z nich na první pohled patrné, jak se věci mají. Často si ale neuvědomujete, že díky tomuto předpokladu lze prostřednictvím grafů velmi snadno překrucovat realitu, ať už úmyslně, nebo neúmyslně. Mezi nejčastější formy manipulace grafy patří:
  • Nedodržování proporcí
    Velikost každého prvku grafu by měla odpovídat hodnotě, která je mu vyměřena na ose. Pokud osa chybí, nemáte si jak ověřit, že proporce odpovídají, a s velikostí jednotlivých prvků se tak dá velmi snadno manipulovat, jako je tomu u ukázkového grafu. Na něm vidíte, že vzájemné proporce sloupců úplně neodpovídají hodnotám, které jsou u nich uvedeny (např. druhý sloupec rozhodně není více než dvakrát vyšší než poslední apod.).

obr_10_13

  • Podsekávání os
    Tohoto způsobu manipulace se lidé nejčastěji dopouštějí z nevědomosti. Pokud zanášíte do grafu vysoké hodnoty (např. v řádech tisíců), mnoho nástrojů počátek osy y automaticky umístí výš, aby byly lépe vidět potenciální rozdíly v hodnotách. Tento postup je naprosto v pořádku a často je dokonce nevyhnutelný. Problém nastává v momentě, kdy na tento posun čtenáře neupozorníte a on tak může graf číst špatně v domnění, že osa y začíná na nule. Rozdíly v hodnotách na ukázkovém grafu se zdají enormní, ačkoliv ve skutečnosti tak velké nejsou.

obr_10_14Na tzv. podseknutí osy (tj. počátek osy y jiné hodnoty než 0) čtenáře nejlépe upozorníte umístěním speciální značky v podobě dvou rovnoběžných čar k počátku osy y. Tak bude každý okamžitě vědět, že tento graf má číst jinak, a zamezí se jeho mylným interpretacím.
obr_10_15O dalších způsobech manipulace grafy a o tom, jak jim lze zabránit, se dočtete v příručce Tvorba efektivních grafů.

.
Nástroje pro tvorbu grafů

ChartBlocks je online nástroj dostupný v základní verzi zdarma. Umožňuje uploadování datasetů v několika datových formátech, stejně tak je možné vytvořit si nový dataset přímo v rozhraní aplikace. Nabízí všechny základní typy grafů a výběr z velmi vkusných barevných šablon. Funkcí nemá tolik jako jiné nástroje, proto se hodí spíše pro tvorbu jednodušších grafů.

Plot.ly je nástroj, který využijete, pokud chystáte grafy pro odborný text. Dává na výběr z velkého množství grafů, ke kterým poskytuje zdarma tutoriály. Má mnoho pokročilých funkcí, ovšem na úkor intuitivního ovládání. Výhodou je možnost online spolupráce a sdílení.

SciDAVis je aplikace určená pro analýzu a vizualizaci vědeckých dat. Z toho plyne, že v ní vytvoříte maximálně funkční grafy, u kterých je jednoznačně preferována přesnost před vzhledem. Proto se hodí spíše pro zpracování dat než pro jejich výslednou prezentaci. SciDAVis je nadupaný funkcemi, přičemž se snaží o co nejjednodušší ovládání. Nevýhodou je, že tento nástroj neběží online a je nutné ho nainstalovat v počítači.

POZOR! Ne všechny nástroje, ve kterých lze tvořit grafy, jsou pro jejich tvorbu skutečně vhodné. Některé neumožňují doplnění povinných prvků (jako jsou popisky os, znak pro podseknutí osy apod.) nebo mají jiná omezení. Proto neváhejte použít jiný nástroj, pokud vám ten současný z nějakého důvodu nevyhovuje.

Vizualizujte efektivně / Tvořte dobré grafy / Tvořte schémata a diagramy /
Tvorba infografiky / To-do



Diskuze: