Strukturierte Datenmengen

Man findet an einigen Stellen im Internet überraschend große Datenmengen mit freiem Zugang. Auf den ersten Blick können die Daten unüberschaubar wirken. Wenn sie sortiert sind und einzelnen Teilen bestimmte Datentypen erkennbar zugeordnet sind, wenn sie vielleicht sogar schon in Tabellenform vorliegen, kann man von strukturierten Datenmengen sprechen. Besonders leicht fällt der Zugang, wenn es Dateien vom Typ .csv oder .txt sind. Grundlage für das Einlesen der Daten ist das Modul numpy und dort besonders die Methode genfromtxt().

Das Modul numpy

Um mit den Daten arbeiten zu können, muss man sie zunächst einlesen und anschließend auf Datensätze und einzelnen Daten zugreifen können. Zum Einlesen wird die Methode Numpy.genfromtxt() verwendet. Die Methode liest Tabellen aus Textdateien ein und erzeugt dabei ein Array mit allen Datenreihen und den einzelnen Elementen jeder Reihe.

data = Numpy.genfromtxt('datensammlung.csv', delimiter=',')
print(data) # ggfs. zur Überprüfung, ob die Daten angekommen sind. 
# -> [[1,2,3], [4,5,6], [7,8,9]]

Zugreifen kann man sowohl auf einzelne Elemente als auch auf Teilmengen, also quasi Reihen und Spalten. Jede Liste beginnt mit dem Index 0. Das bedeutet, auf das erste Element wird mit dem Index 0 zugegriffen.

data[0][0]    -> 1
data[1]       -> [4,5,6]
data[1][1:]   -> [5,6]
data[:,1]     -> [2,5,8] zweites Element jeder Reihe

Das Anlegen für Listen oder Arrays funktioniert in Python mit der Schreibung von Klammern. Das Hinzufügen von neuen Elementen durch append(Wert).

data[3] = []
data[3][0] = 10
data[3].append(11)
data[3] = [10,11,12]

Das vorgestellte Beispiel nochmals in Code.

Beispiel 1: Temperaturen am Südpol

Die Klimaänderung in den Polargebieten ist ein spannendes Fachgebiet. Die Temperaturen am Südpol sind erstaunlich, weil sie im Minusbereich einer großen Schwankung zwischen antarktischem Sommer und antarktischem Winter unterliegen. Die Daten stammen vom NCAR/UCAR National Center for Atmospheric Research.

Aufgabe

Stelle dar, wie sich die Jahresdurchschnittstemperatur in den verschiedenen Stationen der Antarktis seit Mitte des 20. Jhdts entwickelt hat.

Beispiel 2: Eisdecke am Nordpol

Die Eisdecke am Nordpol hat eine Bedeutung für den Klimawandel, weil eine große Eisfläche mehr Sonnenlicht in den Weltraum zurückwirft als eine kleinere oder geschrumpfte Eisfläche. Es ist also bedenklich, wenn im Sommer mehr Eis schmilzt als im Winter neu entsteht. Anhand der frei zugänglichen Daten des National Snow and Ice Data Center bei der University of Colorado kann man solche Entwicklungen nachvollziehen.

Der folgende Programmcode stellt die Entwicklung des Wintereises (Januar) im Vergleich zum Jahresdurchschnitt dar.

Aufgabe

Binde die Entwicklung der Eisfläche im Sommer (August = Spalte 9) in das Diagramm ein.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.