Bei all der merkwürdigen Nicht-Berichterstattung, manche nennen es “Lückenpresse”, ist es für den Zuseher des Geschehens eine Kernkompetenz des Medienkonsums jene Leerstellen zu entdecken, die entweder nicht berichtet, verschleiert oder gar bewußt verzerrt dargestellt werden. Im Zentrum dieser Kompetenz steht die Statistik. Denn seit Karl Marx dreht es sich darum, die Welt in Zahlen zu erfassen, d.h. zu quantifizieren. Wahrheit, so heißt es nun implizit, sei das, was sich messen läßt. Darunter leider die qualitative Erfassung der Wirklichkeit, und das nennen wir meistens Denken. In der Tat: Die Statistik ist die stumpfeste aller Abstumpfungen. Mit ihr kann man jeden Kaffeesatz zur Hl. Schrift erheben. Das selbst ist zwar eine qualitative Aussage, doch das soll uns nun nicht stören. Solche contradictiones in adiecto gehören inzwischen zum guten Ton.

Die Statistik war ursprünglich ein Instrument der Verwaltung und betraf dabei vorrangig die Ökonomie. Man zählte seine Güter, machte Inventur. Wenn man diese Daten ordnet, dann hat man eine Statistik. Falls man dann noch nicht ausgelastet ist, kann man lustige Graphen in noch lustigere Koordinatensysteme eintragen – eine Aufgabe für die Wintermonate – und damit anderen vorgaukeln, die Welt zu erklären, d.h. Schlüsse daraus zu ziehen, die scheinbar von Bedeutung sind.
Karl Marx hatte damals den entscheidenden Schritt getan, die Statistik nicht nur für Güter zu benutzen, sondern auch für Menschen. Das war der Übergang von qualitativer Soziologie, also das mit dem Denken, hin zu einer quantitativen Soziologie bzw. was man nun Sozialforschung nennt. Aber davon ein andermal.

Auch die einfachste Statistik kommt nicht ohne Denken aus. Man erfaßt Daten, ja, und ordnet sie. Das bedarf aber mindestens zweierlei Denkschritte: 1) Die Daten müssen eindeutig definiert sein. Was erfasse ich da eigentlich? 2) Die Daten müssen nach eindeutigen Kriterien geordnet werden. Unter welchem Aspekt betrachte ich die Daten? – Wenn man noch weiter gehen will, z.B. die Darstellung der Daten, braucht es daher noch einen dritten Denkschritt: 3) Wie stelle ich die Statistik dar?

Der erste Denkschritt entscheidet dabei das meiste. An ihm liegt es, ob Äpfel und Birnen miteinander verglichen werden oder nicht. Hier findet also die Art und Weise der Quantifizierung statt. Ein Ding, was gemessen werden soll, wird auf eine bestimmte Eigenschaft reduziert. Diese wird in ihrer Häufigkeit erfaßt.
Bsp.: Ich habe eine Apfelkiste. Ich messe die Anzahl der roten, grünen, gelben Äpfel. Dann habe ich nach Farbe gemessen. Das ist die Eigenschaft.
Bsp. 2: Ich habe eine Kiste mit Äpfeln und Birnen. Ich messe das Gewicht von ihnen. Die Eigenschaft Gewicht habe ich also ausgewählt.

Wenn man Daten sammelt, dann muß man sich im klaren sein, welche Eigenschaft man mißt. Denn es gibt manche Daten, die sich miteinander vergleichen lassen, weil sie eine bestimmte, gemessen Eigenschaft teilen, und es gibt Daten, die nicht miteinander vergleichbar sind, weil sie die Eigenschaft gerade nicht auffassen.

Der zweite Denkschritt knüpft an den ersten an. Nun geht es um die Strukturierung der Daten. Je nach dem kann ich mit ihnen unterschiedliche Erkenntnisse daraus gewinnen. Bekannt sind solche Ordnungen z.B. als Zusammenfassungen bzw. die Häufigkeit. Ich könnte also meine Äpfel und Birnen in kleinere Kisten sortieren und zusammenlegen, wenn sie die gleiche Maßzahl haben.
Bsp: Ich habe zehn rote, fünfzehn grüne und acht gelbe Äpfel.
Bsp. 2: Ich habe eine Kiste mit Obst <100g, eine mit 101-200g, eine mit 201-300g und eine >300g.

Je nachdem was ich gemessen habe, kann ich unterschiedliche Ordnungen machen und die Daten weiterordnen.

Ein solche erste Ordnung sind die absolute Häufigkeit, wie im Beispiel gezeigt, und die relative Häufigkeit. Bei der relativen Häufigkeit wird die Häufigkeit einer Maßzahl mit der Gesamtzahl ins Verhältnis gesetzt. Beide Ordnungen sind bei allen vollständigen Statistiken möglich. Allerdings dürfen die Daten nicht vermischt werden. Man kann nicht zwei Ordnungen durcheinander werfen.
Bsp. 3: Ich nehme drei Kisten. In eine tue ich die roten Äpfel, in die zweite alle Birnen über 200g und in die dritte den Rest hinein.
Eine solche Ordnung bringt mir rein gar nichts. Ich kann damit nichts anfangen.

Nach der Häufigkeit gibt es weitere Möglichkeiten. Dazu zählen die Maßzahlen, um die Verteilung einer Maßzahl zu beschreiben. Hierzu zählen das arithmetische Mittel, der Median, die Varianz und die Standardabweichung. Alle diese Kennzahlen einer Verteilung setzen voraus, daß die Daten geordnet sind. Das bedeutet, daß die gemessenen Daten Zahlen sind und als solche behandelt werden. Das ist leicht zu erkennen.
Bsp.: Ich nehme meine Apfelkiste. Welche Farbe hatte ein Apfel im Durchschnitt? – Es gibt keine Antwort hierauf, denn die Frage ist absurd. Farben sind keine Zahlen und daher gibt es hierzu keinen Durchschnitt.
In manchen Fällen kann man dieses Problem umgehen, indem man eine an sich qualitative Eigenschaft in eine quantitative Größe übersetze. So funktionieren z.B. Umfragen: Wie sehr stimmen sie der Aussage zu? Dann werden die Antwortmöglichkeiten quantifiziert, d.h. in Zahlen übersetzt, so daß man damit rechnen kann. Ob das sinnvoll ist, steht auf einem anderen Blatt.

Im Sinne der Medienkompetenz muß jede Statistik, die einem verzehrfertig vorgesetzt wird, auf diese beiden Denkschritte geprüft werden. Also: Was wird erhoben? Wie wird es struktiert? – Fast alle “Lügen” der “Lückenpresse” beruhen darauf, an diesen beiden Schritten unsachlich vorzugehen. Man “definiert sich seine Statistik zurecht” bis sie für die entsprechenden Zwecke mit ihr rechtfertigen kann.

Nun möchte ich ein paar Beispiel nennen:

1. Arbeitslosenquote vs. Erwerbslosenquote

Es gibt zwei Arten der Statistikführung, um Arbeitslosigkeit zu messen. In den Nachrichten, z.B. Tagesschau, wird dabei immer die Arbeitslosenquote verlesen, zumindest wenn sie Deutschland betrifft. Wenn es aber um andere Länder geht, dann wird normalerweise die Erwerbslosenquote genannt. Warum? Weil die Arbeitslosenquote geringer ist und Deutschland damit besser dazustehen scheint als andere Länder. Man vergleicht hier stets Äpfel und Birnen.
Der Hauptunterschied zwischen diesen beiden Quoten rührt daher, daß die Arbeitslosenquote nur jene Arbeitslose miteinbezieht, die arbeitslos gemeldet sind. Durch verschiedene Taschenspielertricks wird diese Zahl auch noch nach unten “korrigiert”. So zählt z.B. nicht als arbeitslos, wer an einer Maßnahme der Arbeitsagentur teilnimmt, obwohl diese Person keiner geregelten Arbeit nachgeht. Die Erwerbslosenquote dagegen zählt nicht nur die registrierten Arbeitslosen, sondern auch die nicht registrierten. Und das ist in Deutschland ein ganzer Batzen. Denn Studenten gehen bei der Arbeitslosenquote nicht in die Statistik ein, während bei der Erwerbslosenquote sie mit drin sind. Nach den internationalen Standards der ILO (international labour organisation) steht Deutschland in Sachen Arbeitslosigkeit anders da, als die Arbeitslosenquote suggeriert. Aber hierüber redet niemand.

2. Verbraucherpreisindex

Es gibt eine Statistik, die versucht, das Preisniveau der Güter zu messen und anhand der Preisänderung die Inflation zu ermitteln. Diese Statistik ist ein Preisindex. Es wird ein “ideeller Warenkorb” zusammengestellt und dann geht man in regelmäßigen Abständen “einkaufen”. Dann vergleicht man, wie sich der Kassenzettel über die Zeit verändert hat. Und je nachdem hat man dann Inflation, Deflation oder Preisstabilität.
Die mediale Strategie liegt hierbei in der Auswahl des Warenkorbes. Man hat unterschiedliche Warenkörbe. Und je nach wirtschaftlicher Änderung kann es sein, daß der eine teurer wird, der andere aber günstiger. Beispielsweise haben sich bestimmte Lebensmittel während des Lockdowns verteuert. Da aber zeitgleich der Preis für Kraftstoffe stark gefallen ist, hat sich im Index nicht viel verändert.

Der interessante Teil liegt niemals im “ideellen Warenkorb”, sondern im realen Warenkorb. Die einzig Frage lautet: Wie sieht denn mein Warenkorb aus? Denn wer kein Auto hat, den juckt der Kraftstoffpreis nicht. Und andere dagegen sind Vielfahrer und profitieren stark von niedrigeren Fahrtkosten. Wer wirklich wissen will, was Inflation für ihn selbst bedeutet, der muß seinen eigenen Warenkorb messen und evaluieren. Doch da fürchte ich, wer das tut, der wird mit einen unangenehmen Aha-Effekt aufwachen. Denn es gibt eine nicht unerheblich Differenz zwischen dem ideellen und dem realen Warenkorb.

Ein weiteres Problem liegt nicht nur in der Zusammensetzung des Warenkorbs, sondern in der Gewichtung der Güter. Wohnkosten haben einen großen Anteil am Warenkorb. Wenn diese Kosten stabil bleiben, dann können andere Güterbereiche stark steigen und doch haben sie wenig Einfluß auf den Gesamtindex. Hier gibt es also eine Verzerrung der Wahrnehmung.
Und weiter kann man nicht nur auf die relative Entwicklung des Warenkorbs schauen, sondern man muß die absolute Entwicklung ins Verhältnis zu anderen Größen setzen. Ein Faktor wäre die Einkommensentwicklung. Relative Größen in Prozent etwa sagen noch nichts aus.
Bsp: Peter bekommt ein Taschengeld von 50 € im Monat. Davon bezahlt er einen Mobilfunkvertrag mit 15 € pro Monat davon. Durch eine Anpassung des Vertrages soll er nun 1,5 € mehr zahlen, also 16,5 €. Er bespricht sich mit seinen Eltern. Sie geben ihm die 1,5 € pro Monat mehr Taschengeld. War diese Entscheidung gerecht?
In Peters Warenkorb gab es bei einem Gut eine Preissteigerung von 10% (1,5 € von 15 €). Sein Taschengeld dagegen wuchs nicht um 10 % (was 55 € wären), sondern lediglich um 3 %. Absolut betrachtet wurde die Preissteigerung kompensiert. Relativ betrachtet allerdings hat Peter ein Defizit. Je länger der falsche Ausgleich andauert, desto geringer wird der relative Abstand von Warenkorb und Einkommen.
Wir rechnen das Beispiel weiter. Peter hat dieses Taschengeld im Alter von 10 Jahren bekommen. Zusammen mit dem Vertrag war das sein Abschiedsgeschenk von der Grundschule. Peter hat nun die 10. Klasse absolviert und ist 16 Jahre alt. Jedes Jahr stieg sein Vertrag um 1,5 € und seine Eltern haben sein Taschengeld um 1,5 € erhöht.

Jahr 0: 15,00 € – 50 € – 3,34 (wieoft man den Vertrag erfüllen könnte)
Jahr 1: 16,50 € – 51,5 € – 3,12
Jahr 2: 18,00 € -53 € – 2,94
Jahr 3: 19,50 € – 54,5 € – 2,79
Jahr 4: 21,00 € – 56 € – 2,67
Jahr 5: 22,50 € – 57,5 € – 2,55
Jahr 6: 24,00 € – 59 € – 2,46

Im Jahr 0 hätte sich Peter den Vertrag 3x kaufen können und hätte noch 5 € übrig gehabt. Bereits in Jahr 2 könnte er sich den Vertrag nur noch 2x leisten. Im Jahr 14 könnte er sich den Vertrag nur noch 1x leisten. Die absolute Differenz bleibt, die relative Differenz wird im kleiner.
Das gilt, solange der Zuwachs bei Peter nicht im gleichen Verhältnis ist, wie sich seine Kosten entwickeln. Er könnte auch 2,5 € pro Jahr mehr bekommen. Dann wäre er in Jahr 4 soweit, sich den Vertrag nur noch 2x zu leisten.

Merke also: Selbst wenn absolut betrachtet der Einkommenszuwachs höher ist als der Kostenzuwachs, kann es sein, daß die Kaufkraft des Einkommens relativ zu den Kosten abnimmt.

Lügen mit Prozenten

Wo ich gerade den Verbrauchpreisindex bei Wikipedia so vor mir sehe, gilt hier noch ein Wort: Man kann mit relativen Zahlen prima verwirren.

JahrVPIpro Jahr
199170,2
199273,85,1
199377,14,5
199479,12,6
199580,51,8
199681,61,4
199783,22
1998841
199984,50,6
200085,71,4
200187,42
200288,61,4
200389,61,1
2004911,6
200592,51,6
200693,91,5
200796,12,3
200898,62,6
200998,90,3
20101001,1
2011102,12,1
2012104,12
2013105,71,5
2014106,60,9
2015106,90,3
2016107,40,5
2017109,3

Schauen wir die Zahlen an, so sehen wir ein Referenzjahr. Das ist hier 2010 und das bedeutet 100 %. Man mißt also alle Veränderung relativ zu diesem Jahr. So hat das Jahr 2000 hierzu einen Wert von 85,7 %. Das sind also 14,3 %-Punkte Differenz. Stimmt das?

Das ist eine gute Frage. Gehen wir doch einmal andersherum: Wir nehmen das Jahr 2000 als Referenzjahr und rechnen dann auf das Jahr 2010. Kommt hier wieder 14,3 % heraus?

JahrVPI[pro Jahr
2000100,01,4
2001102,02
2002103,41,4
2003104,61,1
2004106,21,6
2005107,91,6
2006109,61,5
2007112,12,3
2008115,02,6
2009115,30,3
2010116,61,1
2011119,12,1
2012121,42
2013123,31,5
2014124,40,9
2015124,70,3
2016125,40,5
2017125,4

Oh, jetzt steht wir ja bei 116,6 %, also einer Differenz von 16,6 %-Punkten. Das sind immerhin 2,3 %-Prozentpunkte mehr als in der anderen Statistik. Wie ist das möglich? Die Antwort ist eine Mathematikbeobachtung der Mittelstufe. Das Verhältnis von Grundwert und Prozentwert führt zu zwei Ergebnissen. Je nachdem was im Nenner und was im Zähler steht gibt es zwei Prozentsätze. Der höhere Wert ist dabei immer der Schluß vom Prozentwert auf den Grundwert und nicht vom Grundwert auf den Prozentwert. Das haben wir hier auch gesehen. Zuerst war das Jahr 2010 der Grundwert und 2000 der Prozentwert (14,3 %-Punkte). Dann war 2000 der Grundwert und 2010 der Prozentwert (16,6 %-Punkte). Wir haben einfach Nenner und Zähler vertauscht.

Man merke: Je “jünger” das Referenzjahr, desto geringer ist der Prozentsatz im Vergleich zu einem “älteren” Referenzjahr.