RSS
Statistische Oberflächen in 2D und 2.5D

Statistiken mit Pseudo-3D-Effekten

Statistische Berechnungen auf Grundlage von Polygonen/ Linien / Punkten, welche in einer räumlichen Datenbank vorliegen

von Anne-Kathrin Reuschel und Hans-Rudolf Bär

Statistische Darstellungen werden benötigt, um eine große Anzahl von Objekten darzustellen, welche zudem noch starke Ballungen aufweisen, denn die Lesbarkeit der Karten ist ab einer gewissen Dichte der Objekte nicht mehr gegeben. Statistische Ansätze versuchen, sich von der Darstellung von einzelnen Objekten zu lösen. Die Frage, wo welche Schauplätze aus einzelnen Texten zu finden sind, tritt in den Hintergrund zu Gunsten der übergeordneten Frage nach der »Dichte« des literarischen Raumes, die sich typischerweise aus einer größeren Anzahl von Schauplätzen oder Texten ergibt.

Seit Entwicklungsbeginn des »Literarischen Atlas Europas« werden die Daten nicht mehr in beliebige Excel-Tabellen geschrieben, sondern über eine umfangreiche Eingabemaske erfasst und in einer räumlichen Datenbank (PostgreSQL + PostGIS) abgespeichert. Hier befinden sich nun die in einer kohärenten Struktur gehaltenen räumlichen Daten mitsamt den Zusatzinformationen.

In anderer Weise als bei der Analyse der Geographie der Literatur des Vierwaldstättersees werden die Schauplätze und Handlungszonen nicht mehr nur als Punkte und Ellipsen erfasst, sondern als beliebige Polygone, Punkte und Linien, die den Schauplatz so genau wie möglich erfassen (immer auch mit dem Wissen, dass es keine scharfen Abgrenzungen geben kann).

Weiterhin wurde ein Set literaturtheoretischer Kategorien gebildet, aus denen sich der geographische Raum der Fiktion zusammensetzt: (Schauplätze, projizierte Räume, Handlungszonen, Marker und Wege).

Die Methodik der Berechnung der Dichte der Schauplätze, welche auf einer einfachen Interpolation von Punkten und Ellipsen beruhte, wurde deshalb dem neuen Datenmodell angepasst und erweitert. In Abb.1 sind die Inputdaten für die Analysen der Modellregion Prag zu sehen, welche hier in einer direkten graphischen Umsetzung zu sehen sind: Punkte, Linien und Flächen, welche Schauplätze und projizierte Räume in unterschiedlichen räumlichen Ausdehnungen zeigen.

Abb. 1: Direkte graphische Umsetzung aller Schauplätze und projizierter Räume (Punkte, Linien, Flächen) als der räumlichen Datenbank, welche aus Datenbasis dient

Abb. 1: Direkte graphische Umsetzung aller Schauplätze und projizierter Räume (Punkte, Linien, Flächen) als der räumlichen Datenbank, welche als Datenbasis dient


Anforderungen an die Darstellung der Dichte

  • Einbeziehung von Punkt-, Linien- und Flächendaten
  • Annäherung an die erfasste Form, um eine möglichst genaue Abschätzung der Dichte zu erlangen
  • Die dargestellten Objekt sind weiterhin ungewichtet (oder anders gesagt: sie werden als gleich wichtig betrachtet, thematisch und flächenmässig) und tragen zur Gesamtdichte den gleichen Anteil bei
  • Effiziente Berechnung um eine interaktive Anwendung zu ermöglichen
Methodik

Berechnung

Ansätze für räumliche Dichteberechnungen von Punktdaten existieren seit längerem. Eine weitere erwähnenswerte Methode ist hier die Gittermethode, welche auf dem Auszählen von Punkten basiert, die innerhalb der Zellen eines regelmässig angeordneten Gitters liegen. Diese Methode eignet sich besonders für jene Fälle, bei denen die Anzahl der Datenpunkte sehr hoch ist. Kritisch ist die Wahl der Gittergrösse: wird sie zu klein gewählt, entstehen viele leere Zellen; wird sie zu groß festgelegt, resultiert eine grobmaschige Darstellung.

Die Methode des Moving Windows [Gatrell 1995 el al.] löst diese Probleme mindestens teilweise. Anstelle des fixen Gitters tritt ein beliebig platzierbares Fenster, welches für jede Position eine Punktdichte ermittelt. Damit lassen sich feinmaschige Darstellungen realisieren; allerdings sind Stufenbildungen nicht zu verhindern, wenn sich beim Verschieben des Fensters die Anzahl der erfassten Punkte plötzlich ändert. Grund dafür ist der »harte« Übergang bei der Verschiebung des Fensters, weil die Lage von Punkten innerhalb des Fensters unberücksichtigt bleibt.

Ein weiterer, verfeinerter Ansatz versucht nun die Position von Punkten innerhalb des Fensters einzubeziehen. Die unter dem Namen Kernel Estimation bekannte Methode [Silberman 1986] gewichtet Punkte im Zentrum des Fensters stärker als jene am Rand. Dadurch verschwinden abrupte Änderungen und es entsteht eine Oberfläche mit einem kontinuierlichen Verlauf. Man kann sich auch vorstellen, dass die Datenpunkte nicht im mathematischen Sinn Punkte ohne Ausdehnung sind, sondern eine bestimmte Größe aufweisen (was auf Schauplätze angewendet auch plausibel erscheint). Die Datenpunkte erfahren dann eine Gewichtung, die dem Anteil der Fläche innerhalb der Gitterzelle entspricht.

Von der »Dichte des literarischen Raumes« sprechen zu wollen, ist kaum korrekt, solange nicht die flächenhaften Handlungszonen einbezogen sind. Die Reduktion der flächenhaften Polygone auf einen Punkt, eine Kreisfläche oder allenfalls eine (ausgerichtete) Ellipse wäre ein erster Lösungsansatz, welcher jedoch der detaillierten Aufnahme der Handlungszonen kaum gerecht würde.

Die Ausdehnung der Methode der Kernel Estimation auf flächenhafte Elemente basiert auf dem folgenden Vorgehen: In einem ersten Schritt erfolgt eine Vereinfachung der Formen, indem die konvexe Hülle des Polygons berechnet wird. Dadurch verschwinden zwar allfällige Einbuchtungen oder Hohlräume innerhalb eines Polygons, doch ermöglicht dies erst die Anwendung der Kernel-Funktion. Da die Polygone oft ein kantiges Aussehen haben, drängt sich eine Glättung der Formen auf, was durch ein Buffering (Puffer) der Polygone realisiert wurde. Der Dreiecksfächer, der durch den Zentrumspunkt und die Stützpunkte der geglätteten Polygone entsteht, wird anschließend für die Anwendung der Kernel-Funktion benutzt.

Visualisierung

Einen großen Einfluss auf das Ergebnis der Dichteberechnung hat die Wahl der Bandbreite, ein freier Parameter, welcher hier durch visuelle Inspektion gewählt wurde (siehe auch Bär et al. (2011) – in diesem Aufsatz wird der Einfluss der Bandbreite anhand von vielen Bildbeispielen abgewogen und beschrieben). In Abb. 2 ist das Ergebnis der Kernel-Estimation Methode zu sehen, für die Bandbreite wurden 50 Pixel (315m) gewählt. Verglichen mit den ersten Ergebnissen ist hier der Einfluss der Polygone deutlich zu erkennen: Die Formen der Dichteflächen sind nicht mehr konzentrisch, sondern werden geprägt durch die Ausdehnung der erfassten Vielecke, welche für diese Abbildung durch Ellipsen approximiert wurden. Analog zum ersten Versuch wurden die Ergebnisse klassiert und mit einer sequentiellen Farbskala dargestellt.

Abb. 2: Visualisierung der Dichte durch Kernel-Estimation und einer Bandbreite von 50px (315m) von literarisch verwendeten Orte in Prag

Abb. 2: Visualisierung der Dichte durch Kernel-Estimation und einer Bandbreite von 50 Pixeln (315m) von literarisch verwendeten Orte in Prag

 

Abgeleitete Darstellung: Darstellung mit Schattierungen

Alternativ zum 3D-Blockbild haben wir hier mit einer weiteren sehr anschaulichen Darstellung experimentiert: dreidimensionale Schattierungseffekte wurden mit so genannten Shader-Programmen erzeugt, welche direkt auf der Grafikkarte ausgeführt werden (für eine systematische Untersuchung solcher 3D-Effekte in der 2D-Kartographie, siehe Bibliographie: Cron 2011). Abb. 3 zeigt das Ergebnis: ein plastischer Eindruck entsteht durch eine nordwestliche Beleuchtung der berechneten Oberfläche.

Abb.3: 3D Effekte: Schattierte Oberfläche der Schauplatzdichte am Beispiel analysierter Daten der Modellregion Prag

Abb.3: 3D-Effekte: Schattierte Oberfläche der Schauplatzdichte am Beispiel analysierter Daten der Modellregion Prag

Verweise:

Baer, H. R. (2011), Hurni, L.: Improved Density Estimation for the Visualisation of Spatial Uncertainty in Fiction. In: The Cartographic Journal, special issue Cartographies of Fictional Worlds, 48.4 (2011), 95-102.

Cron, J. (2011):  3D-Effekte in der 2D-Kartografie. Systematische Untersuchung und automatisierte Symbolisierung der Kartenelemente, Masterarbeit Paris Lodron-Universität Salzburg. URL: www.ika.ethz.ch/teaching/weitere_arbeiten/2011_ma_cron_report.pdf (view date: 10.April 2012)

Gatrell, A. C. (1996) et. al.: Spatial Point Pattern Analysis and Its Application in Geographical Epidemiology, in: Transactions of the Institute of British Geographers, New Series, Vol. 21, No. 1 (1996), pp. 256-274.

Silverman, B. W. (1986): Density Estimation for Statistics and Data Analysis, Chapman & Hall/CRC Monographs on Statistics & Applied Probability

Hinterlasse einen Kommentar