Graphische Darstellungen von Daten die man aus Fernsehen, Zeitungen und Präsentationen kennt sind nur die Spitze des Eisbergs: Interaktive Daten­visualisierungen eröffnen völlig neue Möglichkeiten komplexe Daten verständlich und handhabbar zu machen.

Der bandbreitenstärkste Kanal der menschlichen Wahrnehmung ist unser Sehvermögen. Bereits lange bevor die modernen Kognitionswissenschaften diese Annahme belegten, wusste die Menschheit sich diesen Aspekt zunutze zu machen, um mit komplexen Daten umzugehen: Das Sichtbarmachen von Informationen, also deren ‚Visualisierung‘, existiert in verschiedensten Formen seit Jahrtausenden. Eine der bekanntesten Anwendungen ist die Geographie, die uns einen Überblick über die Welt gibt, und diesen mit weiteren Informationen wie Wetter oder Demographie anreichern kann. Auch natürliche Phänomene wie die Planetenbewegung, mathematische Konzepte z.B. aus der Geometrie oder wirtschaftliche Systeme können durch graphische Aufbereitung viel verständlicher gemacht werden.

Visualisierung im Wandel der Zeit: Babylonische Weltkarte (5. Jhd. v. Chr.) [1], Ibn al-Shatir's Sichtungen Merkurs (14. Jhd.) [2], William Playfair's Exporte und Importe nach und aus Dänemark und Norwegen (1786) [3]

Auch heutzutage finden sich derlei statische Diagramme in Zeitungen und Fernsehen und sind ein fester Bestandteil von Geschäftsberichten und -präsentationen. In den letzten Jahren haben auch sogenannte ‚Infographiken‘, die plakative Daten mit simplen Diagrammen und Typographie kombinieren, weite Verbreitung im Internet gefunden. All diese Ansätze sind statisch und kommen nur mit kleinen Datenmengen zurecht. Da unsere Datenmengen im Augenblick aber tendenziell eher explodieren als sich auf Diagramm-kompatible Größen zu schrumpfen stellt dies ein echtes Problem statischer Visualisierungen dar. Simplifizierung und entsprechende Banalisierung der Wirklichkeit sind die Folge.

Allgegenwärtige Datengrafiken: Microsoft Excel bietet vielfältige Diagrammfunktionen, Wikibon: The Real World of Big Data [4], Fox News' kreative Deutung von Prozentangaben [5]

Computer sind nicht nur der Grund für die aktuelle Datenexplosion. Sie bieten auch die Chance, neuartige Werkzeuge für den Umgang damit zu werden. Das Feld der interaktiven Datenvisualisierungen hat in den letzten Jahren gezeigt, wie eine menschliche Schnittstelle dazu aussehen kann. Dynamisch generierte Graphen, die sich an die Bedürfnisse des Benutzers anpassen lassen und auch bei enormen Datenmengen nicht kapitulieren, bieten einen völlig neuen Einblick in unsere Welt. Sie kombinieren die Stärken von Maschine (Verarbeitung, Berechnungen) und Mensch (Intuition, Mustererkennung) und geben uns die Chance, die Komplexität unserer Datenmengen handhabbar zu machen.

Interaktive Datenvisualisierungen: Weltweite Lebensqualität im OECD Better Life Index [6], die aktuelle globale Twitter-Aktivität bei Tweetping [7], der Wind über den Vereinigten Staaten in Wind Map [8]

Wie funktioniert Visualisierung?

Der prinzipielle Prozess statischer und interaktiver Visualisierung basiert darauf, jedes (relevante) Attribut der Daten einer sogenannten ‚visuellen Variable‘ zuzuordnen [9]. Visuelle Variablen sind zum Beispiel Position, Größe, Orientierung, Form, Farbe, Füllmuster, etc. Unsere visuelle Wahrnehmung ist unterschiedlich gut auf diese Kategorien abgestimmt, sodass es uns beispielsweise deutlich leichter fällt, Objekte anhand ihrer Position zu unterscheiden als anhand ihres Füllmusters. Dementsprechend werden die wichtigsten Attribute der Daten normalerweise auf leicht zu lesende Variablen übertragen, während weitere Attribute die weniger aussagekräftigen Variablen nutzen müssen.

Hier ein Beispiel um das Konzept von visuellen Variablen zu verdeutlichen: Sagen wir wir arbeiten mit einem Datensatz der Aktienkursverlauf, die Branche und die Mitarbeiteranzahl verschiedener Unternehmen enthält. Die zeitliche Entwicklung der Unternehmenswerte ist für uns am interessantesten, sodass wir die zwei ‚wertvollsten‘ verfügbaren Variablen (horizontale und vertikale Position) dafür nutzen, um horizontal die Zeit und vertikal den jeweiligen Aktienkurs anzutragen. Um den Kursverlauf einer Firma leichter zu verfolgen können, zeichnen wir Verbindungslinien zwischen den jeweiligen Punkten und damit eine Linie pro Firma. Unsere beiden verbleibenden Variablen (Branche und Mitarbeiterzahl) weisen wir entsprechend weniger leicht zu lesenden Variablen zu: Branche, als rein kategorischer Datentyp, erhält eine Farblegende (Industrie = grün, Dienstleistung = rot, etc) und für die Mitarbeiterzahl wird die Dicke der Linien genutzt. Durch diese Zuordnung lässt sich die wichtigste Information (Kursverlauf über die Zeit) leicht ablesen, während andere Muster, wie die Kursverläufe großer Unternehmen oder Firmen bestimmter Branchen, zusätzlich verfügbar sind.

Einfaches Visualisierungsbeispiel: Ein Börsendatenset wird in eine Grafik verwandelt, indem bestimmte Attribute der Daten in entsprechende visuelle Variablen umgewandelt werden. Aktienkurs einer Firma zu einem bestimmten Datum verwandelt sich in Position auf dem Bildschirm, die Mitarbeiterzahl wird zur Größe der Kreise bzw. Dicke der Linien und die Branche gibt Kreisen und Linien eine bestimmte Farbe.

Auch bei interaktiven Visualisierungen bleibt dieses Grundkonzept unverändert. Allerdings können diese deutlich größere Datenmengen immer noch sinnvoll präsentieren, da sie an die jeweiligen Bedürfnisse des Nutzers anpassbar sind: Unübersichtliche Datenmengen lassen sich durchsuchen und filtern. Bestimmte Attribute können priorisiert und damit die Zuordnung zu visuellen Variablen geändert werden. Größe und Komplexität der Visualisierung können sich an die Bildschirmgröße anpassen. Echtzeitdaten können einen Graph immer auf dem Laufenden halten. Da interaktive Visualisierungen dynamisch generiert werden, kommen zusätzlich neue visuelle Variablen wie Animationen hinzu. Interaktive Visualisierungen geben uns also eine bessere Chance mit den Herausforderungen unserer explodierenden Datenarsenale umzugehen.

Anwendungen

Interaktive Visualisierungen finden sich in diversen Bereichen, die Nutzung lässt sich aber grob in die Bereiche Datenexploration, Präsentation und den Sonderfall von Visualisierungen als Interfaceseinteilen.

Datenexploration

Visualisierungen sind ein guter erster Einstiegspunkt in jeden Datensatz. Konfrontiert mit endlosen Zahlenreihen, eröffnen Visualisierungen die Chance, ein Gefühl für die Daten zu bekommen und zu verstehen, welche Muster und Regeln sich darin verstecken könnten. Andere Verfahren wie die Statistik leisten ähnliche Dienste, sind dabei aber ungenauer: Mehrere Datensets, die dieselben Minimal-, Maximal- und Durchschnittswerte haben, können völlig unterschiedliche Verteilungen haben. Eine graphische Darstellung der Werte bietet sowohl diese Informationen als auch ein Verständnis der Verteilung auf den ersten Blick. Komplexere Verfahren wie das maschinelle Lernen (machine learning) setzen auf automatische Analysen, doch auch hier können Erkenntnisse, die einem Menschen mit Blick auf die Daten direkt auffallen würden, untergehen.

Interaktive Visualisierungen ermöglichen zusätzlich nicht nur das schnelle Erstellen solcher Graphen aus den Daten, sondern auch die direkte Anpassung an den aktuellen Analysestand. Eine Analystin die mit einem solchen Werkzeug ausgestattet ist kann sehr schnell einen ersten Überblick über die Daten erhalten, basierend darauf Hypothesen formulieren, diese mit weiteren Graphen überprüfen und so weiter. Dieser iterative Prozess, der die Stärken von Mensch und Maschine miteinander vereint, stellt im Augenblick unsere vielversprechendste Waffe gegen die Datenflut dar. Sobald die wichtigsten Muster in einem Datensatz gesichtet wurden, können diese mit statistischen Verfahren nachgeprüft werden.

Präsentation

Nicht mehr wegzudenken sind graphische Datenaufbereitungen aus den Medien. Um die komplexen Ereignisse unserer Welt dem Leser oder Zuschauer klarzumachen ist es mit Text oft nicht getan: Gerade bei politischen oder wirtschaftlichen Themen die im Kern nur aus Zahlen bestehen, kann ein Fließtext schnell in eine unlesbare Nummernwolke degenerieren. Ebenso profitieren Geschäftsberichte und -präsentationen von einer zugänglicheren Aufbereitungen der enthaltenen Zahlen, weshalb Präsentationssoftware wie Microsoft’s Powerpoint mit reichhaltigen Funktionen für Diagramme ausgestattet ist. Aufgrund der statischen Natur dieser Grafiken, die sich entweder durch das Medium (z.B. Print) oder die Situation (z.B. Meeting) bedingt, wird jedoch die große Chance verschenkt, dem Publikum ein tieferes Verständnis der Daten zu vermitteln. Normalerweise werden solche Graphen nur dazu genutzt um eine Ansicht durchzusetzen und die eigene Botschaft zu stärken – Details gehen dabei unter.

Ein neuer Trend im Journalismus, der von Medien wie der New York Times und dem britischen Guardian getragen wird, nutzt das Internet und interaktive Visualisierungen um den Lesern einen detaillierteren Einblick in Datensätze zu ermöglichen. Dabei setzen diese Redaktionen auf einen zweigeteilten Ansatz: Zum einen erstellen sie Visualisierungen, die direkt im Webbrowser laufen und sich frei explorieren lassen. Zum anderen enthalten diese Visualisierungen aber auch so etwas wie virtuelle ‚Führungen‘ durch die Daten: Die interessantesten Aspekte der Datensets, die z.B. im Artikel besprochen werden, sind oft auch klickbar und passen die Visualisierung dann entsprechend an. Wenn z.B. von den Kursentwicklungen von Technologieunternehmen die Rede ist, kann ein Klick genau diese Unternehmen im Graph hervorheben. Die Anpassungen, die eine Analystin im explorativen Fall also selbst vornehmen müsste, sind hier vordefiniert und bieten einen leichten Einstieg in die Daten.

Visualisierungen in Online-Medien: Aufschlüsselung des britischen Finanzhaushalts [10], Facebook's Börsengang im Vergleich zu anderen Technologieunternehmen [11], eine interaktive Analyse möglicher Wahlausgänge der letztjährigen Präsidentschaftswahl in den USA [12]

Visualisierungen als Interfaces

Ein neuer Trend nutzt die Konzepte interaktiver Visualisierungen nicht als bloße Schnittstelle zwischen menschlichem Verstand und einem statischen Datensatz: Oft ist es nötig, diese Daten erst zu erzeugen, sei es als nachträgliche Erweiterung eines existierenden Datensatzes oder um komplexe Eingaben zu tätigen. Beispielsweise bietet der Fotodienst Flickr die Möglichkeit, Fotos mit fehlenden Geo-Informationen nachträglich damit auszustatten. Das Interface, was Flickr für diese Tätigkeit anbietet, zeigt eine Landkarte auf die die Fotos einfach per Drag-and-Drop gezogen werden können. Die komplexe Eingabe von Breiten- und Längengraden wird also durch simple Orientierung auf einer Karte ersetzt. Ein weiteres Beispiel ist die iPhone-App ‚Visualarm‘, die Weckfunktionen für beliebig viele Zeitpunkte anbietet. Anstatt diese Zeitpunkte alle in einer Liste darzustellen und mit Standard-Interface-Elementen eingeben zu lassen, werden sie auf einer zweidimensionalen Karte angezeigt. Je nach Klingelton erhält der Alarm ein anderes Symbol. Das Ändern der Uhrzeit besteht jetzt nur noch darin, ein solches Alarmsymbol nach oben oder unten zu verschieben. Gerade mit der Zunahme der Bekanntheit von interaktiven Visualisierungstechniken stellen derlei Konzepte deutlich einfachere Eingabemethoden für komplexe Informationen dar.

Visualisierungen als Interfaces: Grafisches Weckerstellen mit der visualarm App [13], einfaches Geotagging von Fotos in flickr [14]

Chance: Visualisierung auf mobilen Geräten

Der Wert interaktiver Visualisierungen sowohl zum Verständnis, der Präsentation als auch der Eingabe komplexer Daten erklärt ihre weite Verbreitung in den letzten Jahren. Die Chancen, dass die Datenflut plötzlich ein jähes Ende finden wird stehen schlecht, sodass wir uns wohl auch in Zukunft auf derlei Werkzeuge verlassen müssen um ihrer Herr zu werden. Gerade mit der Zunahme an persönlichen Daten, seien es Emails, Statusmeldungen aus sozialen Netzwerken oder selbst gesammelte Daten zu Sport oder Gesundheit, werden Visualisierungen auch für Privatanwender immer zentraler. Ein gutes Beispiel für diese Zunahme persönlicher Daten sind Produkte für gesundheitsbewusste Kunden, die mehr über ihren Körper erfahren wollen. Ursprünglich als ein etwas exzentrisches Hobby betrachtet, produziert dieser Health Tracking, Lifelogging oder Quantified Self genannte Trend inzwischen große Umsätze für Unternehmen wie Fitbit, Jawbone oder Withings. Tragbare und ansteckbare Sensoren zur Schrittzählung oder Schlaf- und Pulsmessung ermöglichen Datensammelei rund um die Uhr, nicht mehr nur während sportlicher Betätigung. Und eine Vielzahl weiterer Daten strömen aus den stets paraten Smartphones.

Die dadurch erzeugten Datenmengen verständlich und leicht einsehbar zu machen stellt eine besondere Herausforderung dar, besonders da die Informationen stets griffbereit und auf dem Handy dargestellt werden sollen. Interaktive Visualisierungen sind daher zentrale Elemente der jeweiligen Apps. Obwohl Visualisierungen ursprünglich für möglichst große Bildschirme entwickelt wurden (um noch das letzte Quäntchen Daten unterzubringen), zeigen sie paradoxerweise erst auf sehr kleinen Bildschirmen ihre maximale Effizienz: Sind Zahlenkolonnen auf größeren Bildschirmen schon ermüdend zu lesen und wenig aussagekräftig, macht der fehlende Platz auf Handys und der damit verbundene Scrollzwang jede Einsicht von vornherein zunichte. Visuelle Repräsentationen können zwar auch auf Handys längst nicht soviele Daten zugänglich machen wie auf Laptop- oder Desktop-Bildschirmen, stellen aber dennoch eine massive Verbesserungen im Vergleich zu den rohen Zahlen dar. Je weniger Bildschirmplatz verfügbar ist, desto besser ist ein Visualisierungsansatz für eine Anwendung geeignet.

Mobile Visualisierungen: Jawbone Up! Bewegungstracking [15], Endomondo Sporttracking [16], ansprechende Visualisierung persönlicher Daten in mem:o [17]

Ein weiterer Aspekt der Visualisierungen für mobile Szenarien prädestiniert: Mobile Anwender legen großen Wert auf Ästhetik und leichte Benutzbarkeit, was Visualisierungen direkt mitbringen. Durch richtige Gestaltung der Interaktion können sie sogar eine spielerische Note entwickeln, aller ernsthafter Repräsentation der Daten zum Trotz.

Alles in allem sind interaktive Visualisierungen also unser bestes Werkzeug um mit großen Datenmengen zu hantieren. Egal ob auf stationären Rechnern, oder auf berührungsgesteuerten Tablets und Handys, Visualisierungen werden in Zukunft allgegenwärtig sein.

Referenzen:
  1. Wikipedia: Babylonian Map []
  2. Wikipedia: Shatir500 []
  3. Wikipedia: Playfair Time series 2 []
  4. Wikibon: The Real World of Big Data []
  5. Flowing Data: Fox News Makes The Best Pie Chart. Ever. []
  6. OECD: Better Life Index []
  7. Franck Ernewein: Tweetping []
  8. Martin Wattenberg und Fernanda Viegas: Wind Map []
  9. Jacques Bertin: Semiologie Graphique (1967) []
  10. The Guardian: Public spending by UK government department 2011-12: an interactive guide []
  11. New York Times: The Facebook Offering: How It Compares []
  12. New York Times: 512 Paths to the White House []
  13. WOW Inc: visualarm []
  14. Flickr: Flickr []
  15. Jawbone: Up! []
  16. Endomondo: Endomondo []
  17. c+y: mem:o []