Warum es manchmal schwieriger ist, etwas zu faken, als es zu machen

Astronaut mit US Flagge

Eine der größten Herausforderungen für Anbieter von BI Software ist es, „gut aussehende Daten“ zu haben, um die Fähigkeiten und Möglichkeiten der Software zu demonstrieren. Das heißt, dass die Diagramme und Grafiken, die z. B. über ein Demo-Dashboard gezeigt werden, nicht repetitiv oder offenkundig zufällig aussehen sollten. Vielmehr sind subtile Nuancen, Variationen und begründbare Muster abzubilden, die die realen Unternehmensdaten besser simulieren.

Klingt nach einer einfachen Idee, wirst Du sagen. Nun, Produktentwickler kämpfen schon seit langem mit diesem Problem, und überraschenderweise gibt es noch keine Lösung aus dem Lehrbuch. Hier sprechen wir mit Jan Häbry von graphomate über seine Lösung.

Jan, erzähl uns etwas über die Plattform, an der Du arbeitest.

JH: Sicher. Ich arbeite derzeit an der Entwicklung von Visualisierungserweiterungen für das UI5-Paket von SAP. Wie viele andere UI-Frameworks hat auch UI5 enorme Möglichkeiten, die oft übersehen werden. Wir möchten daher einige Beispiel-Dashboards präsentieren, um das Interesse an UI5 und den graphomate-Erweiterungen zu wecken. Dafür brauchen wir Demodaten.

Was ist falsch daran, reale Daten zu verwenden?

JH: Generell könnten wir reale Unternehmensdaten anonymisieren, z. B. die Verkaufszahlen der Produktpalette eines großen Automobilherstellers, aber sie wären nie wirklich anonymisiert, da die eindeutigen Muster in den Daten die Identität des Kunden verraten können. Und ganz ehrlich: kein Unternehmen gibt seine Daten – auch anonymisiert – raus.

Das macht Sinn. Erzähle uns bitte etwas über das Demo-Dashboard, das Du hier hast.

JH: Dies ist ein Beispiel für ein Dashboard, das wir erstellt haben und das hierarchisch von oben nach unten und von links nach rechts gelesen werden kann.

graphomate UI5 Dashboard
graphomate UI5 Dashboard

Durch Anklicken der Datenpunkte der einzelnen Visualisierungen kannst Du die Daten für alle anderen Visualisierungen herausfiltern. Auf diese Weise lässt sich der Bericht logisch von der Übersichtsebene bis zu einer detaillierteren Ebene navigieren. Dies wird am besten in der Matrix-Visualisierung unterhalb des Haupt-Dashboards demonstriert.

graphomate UI5 Dashboard with Matrix
graphomate UI5 Dashboard with Matrix

Hier siehst Du, dass ich durch Anklicken von ‚Erträge‘ und dann des Monats April alle Details für diesen Zeitraum in meiner Matrix angezeigt bekomme.

Das sieht ziemlich raffiniert aus. Erkläre uns etwas über den Prozess der Datengenerierung, der hinter diesem Demo-Dashboard steht.

JH: Nun, zunächst einmal geht es um die schiere Masse an Daten, die für dieses Dashboard benötigt werden. Es gibt acht verschiedene Dimensionen mit bis zu zwölf Merkmalen in jeder Dimension. Wollten wir einen Datensatz erstellen, der in allen möglichen Filterzuständen eine wohlgeformte Visualisierung aufweist, bräuchten wir in unserem Fall fast 400.000 Datenpunkte. Diese von Hand zu erstellen, ist natürlich nicht praktikabel.

Wir haben uns zwei mögliche Lösungen angesehen.

Lösung 1: Generiere Daten nach dem Zufallsprinzip.

Ein Problem bei zufällig generierten Daten besteht darin, dass sie, wenn sie auf höheren Ebenen aggregiert werden, möglicherweise keinen einheitlichen Wertebereich mehr aufweisen. Dies kann zu sehr unschönen Diagrammen führen und den Betrachter vom eigentlichen Thema ablenken. Diese Visualisierung zeigt zum Beispiel einen großen Ausreißer, der im wirklichen Leben nicht vorkommen würde.

graphomate column chart with outlier
graphomate column chart with outlier

Lösung 2: Erweitere Ist-Daten um sinnolle Perspektiven.

Da es sich hier nur um ein Demo-Dashboard handelt, wurden die verfügbaren Pfade und Funktionen künstlich eingeschränkt, z. B. liefern nur die Monate Januar und Juli in dieser speziellen Visualisierung aussagekräftige Werte. Auf diese Weise kann in einer Präsentation dennoch eine konsistente Geschichte erzählt werden, ohne dass die Datenmenge im Hintergrund außer Kontrolle gerät.

Für diese Lösung verwendeten wir eine Stichprobe realer Daten aus den Vorjahren, die wir in ein Modell einspeisten, das die Schwankungen und Muster in diesen Daten auf spätere Jahre übertrug. Mathematische Formeln wie Zuweisungs- und Planungsfunktionen wurden verwendet, um die realen Daten zu imitieren. Das Endergebnis ist ein ästhetisch ansprechender und realistischer aussehender Datensatz.

Das ist eine großartige Arbeit. Jetzt, wo Du eine funktionierende Demo hast, erzähl uns doch mal, warum du bei der Präsentation eines Produkts so viel Wert auf Details legst.

JH: Das ist eigentlich ganz einfach. Indem wir demonstrieren, wie ein Dashboard erstellt werden kann, um aussagekräftige Visualisierungen zu liefern, die auf bestimmte Unternehmen zugeschnitten sind, helfen wir potenziellen Kunden, die Leistungsfähigkeit dieser Plattformen und Erweiterungen zu erkennen. Die Art der Daten, die Unternehmen für ihre BI-Analyseplattformen erzeugen, ist äußerst komplex und vielfältig. Indem wir etwas schaffen, das diesen realen Daten sehr ähnlich ist, können wir Vertrauen in die Fähigkeiten unserer Dienstleistungen schaffen.

Vielen Dank. Wir sind gepannt, wie die Entwicklung von Datensimulation weitergeht.

ccbync

This file is licenced under the Creative Commons-Licence.