Datenbanken 29.03.2010, 10:28 Uhr

Studieren beim Sortieren

Deutsche Forscher haben bei einem internationalen Wettbewerb einen Weltrekord bei der energieeffizienten Sortierung von Daten erzielt.
Wer Daten geschickt sortiert, kann Energie sparen
Neben ihrem Programm "EcoSort" setzen die Informatiker des Karlsruhe Institute of Technology (KIT) und der Goethe-Universität Frankfurt dabei auf Atom-CPUs sowie Solid State Disks.
"Das ist zunächst ein Proof-of-Concept, bei dem wir uns auf die wesentlichen Probleme konzentrieren", sagt Ulrich Meyer, Professor für Algorithm Engineering der Frankfurter Uni. Für industrielle Anwendungen wären von Fall zu Fall kleinere Anpassungen erforderlich, die jedoch keine prinzipiellen Hürden darstellen würden. Interessant ist eine energieeffiziente Sortierung von Daten etwa für Suchmaschinen und Datenbanken.
Bei ihrem Rekordansatz müssen die Informatiker mit vergleichsweise geringer Rechenleistung auskommen, da sie eigentlich für Netbooks gedachte Atom-CPUs statt stromhungriger Serverprozessoren nutzen. Doch ihre hocheffizienten EcoSort-Algorithmen konnten das wettmachen. Weiters bieten SSDs gegenüber Festplatten gleich einen doppelten Vorteil, da sie schneller und dennoch stromsparender sind.

Server bald überflüssig?

Insgesamt konnte damit ein Energieeffizienz-Rekord erzielt werden, was aus Sicht der Forscher auch klassische Server infrage stellt. "Auf lange Sicht sollten viele kleine, sparsame und kooperierende Systeme die bislang üblichen schwergewichtigen ersetzen", sagt Peter Sanders, Informatikprofessor am KIT. Der Sortierungs-Rekord bekräftigt somit auch denn Sinn von Experimenten mit Atom-basierten Serverlösungen, wie sie beispielsweise Microsofts Forschungsabteilung Cloud Computing Futures durchführt.
Konkret konnten die Informatiker beim international etablierten Soft Benchmark Rekorde in drei "JouleSort"-Kategorien für unterschiedliche Datenmengen aufstellen. Selbst bei der Sortierung von einem Terabyte an Daten wurden nur 0,2 Kilowattstunden an Strom verbraucht. Allerdings wurden dabei nur Datensätze mit fester Grösse und Schlüssellänge sortiert.
"Diese Annahmen helfen etwa bei der Parallelisierung, die Lasten ohne grossen Aufwand gleichmässig zu verteilen", erklärt Meyer. Doch für die Übertragbarkeit der Rekordmethode auf allgemeinere Problemstellungen sollte das kein wesentliches Hindernis sein. Der Informatiker verweist diesbezüglich auf andere Soft-Benchmark-Kategorien, bei denen die Sortiergeschwindigkeit im Vordergrund steht. Die jeweiligen Rekordwerte für die vereinfachte und die allgemeine Problemstellung liegen dort sehr eng beieinander.



Das könnte Sie auch interessieren