Freitag, 14. August 2020

Wie male ich eine Statistik?

Ein Freund von mir, der im Zweitstudium Anthropologie studiert, bittet mich, eine Arbeit freundschaftskorrekturzulesen (sic). Das Thema seiner Arbeit ist die Zahlenmässige Entwicklung lilaäugiger Menschen in der Schweiz. Huch, ich wusste gar nicht, dass es lilaäugige Menschen gibt, aber schon am Anfang belehrt mich da eine Statistik anderer Tatsachen: Das sind ja ganz schön viele, und die Zahl schwankt auch stark! Das denke ich, bis ich auf die Ordinate sehe: Das sind keine Schritte in 10%, auch nicht in 1%, nicht in Promille oder 1/10 Promille, sondern in 0,01 Promille. Der oberste Wert sind also 0.1 Promille. Ich bin seiner Grafik zunächst auf den Leim gegangen. Die Schwankung nach unten 2005 kann man exakt als den Moment sehen, als die lilaäugige Grossfamilie De Holouge die Schweiz verliess, eine Schwankung nach oben 2014 war der Moment, als der lilaäugige Oberrammler Vicu Jonäch in die Geschlechtsreife kam (und da er kondomverachtend ist, eine ganze Menge Nachwuchs zeugte…)

Ich glaube nur einer Statistik, die ich selbst gefälscht habe.
So oder ähnlich soll Winston Churchill gesagt haben. Man könnte aber den Satz auch anders formulieren:
Ich glaube nur einer Statistik, die ich selbst gezeichnet habe.
Denn Fälschen und Zeichnen kommen sich sehr nahe.

Ach, hallo Faktenchecker! Bist du auch wieder dabei? Gut, ich gebe zu die Story oben ist komplett erfunden, es gibt weder den Freund, noch die Familie De Holouge, noch den sexbesessenen Vicu. Aber jetzt kommen ein paar Dinge, die es wirklich gibt:

Als ich mit meinem Blog anfing, ging die Statistik, die alle Aufrufe aller Monate anzeigt, bis 1000. Als wir diese Marke überschritten, stand die Ordinate bei 2000 und inzwischen ist sie bei 3000 gesetzt. Das macht natürlich erhebliche Unterschiede, so ist ein Einbruch, wie es im Januar 2020 einen gab (wir machten Blogferien), grafisch umso eklatanter, desto höher die y-Achse geht. Die völlig gleichen Zahlen sehen völlig anders aus. Eine monatliche Zahl von Aufrufen wie 2976 sieht eben nur solange wie das Matterhorn aus, solange wir bei 3000 liegen, ist diese Marke geknackt und die Ordinate geht bis 4000, ist das natürlich wieder Mittelfeld.

Es wäre viel eindrucksvoller, eine solche Statistik kumulierend darzustellen. Das funktioniert dann so: Im ersten Monat haben Sie 344 Aufrufe, Sie zeichnen einen 3,44 Zentimeter hohen Balken; im zweiten Monat haben Sie 488 Aufrufe, Sie zeichnen… Nein, nicht einen 4,88 Zentimeter hohen Balken, sondern einen, der 8,32 Zentimeter misst. Sie zählen immer die Aufrufe, die Sie INSGESAMT erreicht haben. Also im dritten Monat dann nicht 5,77 Zentimeter für 577 Aufrufe, sondern 14,09 Zentimeter für die 1409 Aufrufe INSGESAMT. Eine kumulierende Darstellung ist immer imposant, sie ist ein Block, ein Monument, sie ist ein Plateau, ein Brocken, sie ist wuchtig, immens und gewaltig. Denn eine kumulierende Statistik kann natürlich nie abwärts gehen oder weniger werden, sie kann höchstens oben auf hohem Niveau verweilen.

Vergleichen Sie mal im Wikipedia-Artikel über Covid 19 in der Schweiz die Todesfälle-Zeichnungen: Kumulierend ist das enorm, pro Tag ganz, ganz müde, mit wenigen Tüpflein noch im August.

Ich glaube nur einer Statistik, die ich selbst gefälscht habe.
Soll Winston Churchill gesagt haben. Man könnte aber auch schreiben:
Ich glaube nur einer Statistik, die ich selbst gezeichnet habe.
Denn Fälschen und Zeichnen sind fast das Gleiche.

Sie alle kennen diese Rätselaufgaben:
A) Gelbes Quadrat im roten Quadrat
B) Rotes Quadrat im grünen Quadrat
C) Grünes Quadrat im gelben Quadrat
Welches der inneren Quadrate ist das grösste?
Sie sind alle gleich gross. Es ist eine sogenannte optische Täuschung, die uns vorgaukelt, es lägen irgendwelche Unterschiede vor.

Sehen Sie, und genau diesen Unterschied kann man sich jetzt beim Malen einer Statistik zunutze machen: Male ich den grösseren Balken blau und den kleineren rot? Oder umgekehrt? Welche Farbe bekommt das Kreissegment von 15%? Und welche Farbe bekommt der Rest? Je nach Einfärbung werden ganz unterschiedliche Wirkungen erzielt.

Ganz besonders nett ist natürlich auch, irgendwelche Symbole zu verwenden. So könnte man die Zunahme der Vegetarier mit Gemüsehaufen darstellen, nimmt man nun aber 1% = 1 Erbse, 1% = 1 Karotte, 1% = 1 Paprika oder 1% = 1 Rosenkohl? 30 Erbsen sehen natürlich nach viel weniger aus als 30 Paprikas.

Sehen Sie sich also vor, bevor sie Statistiken überfliegen.
Denn nur ganz böse Menschen fälschen diese. Die meisten tun sie zeichnen, und dann gilt:
Ich glaube nur einer S…

 

 

 

 

 

 

Keine Kommentare:

Kommentar veröffentlichen