« Projekte

Bitte aktivieren Sie JavaScript in Ihren Browsereinstellungen, um das Forschungsportal nutzen zu können.

Sie verwenden einen sehr veralteten Browser und können Funktionen dieser Seite nur sehr eingeschränkt nutzen. Bitte aktualisieren Sie Ihren Browser. http://www.browser-update.org/de/update.html

Query Acceleration Techniques in Co-Processor-Accelerated Main-memory Database Systems

Projektleiter:

Prof. Dr. Gunter Saake

Projektbearbeiter:

Dr.-Ing. David Broneske

Finanzierung:

Haushalt; 31.08.2019 bis 31.03.2022

Das Projekt adressiert den aktuellen Schwerpunkt von Analysen in Hauptspeicherdatenbanken auf moderner Hardware: Heterogenität der Prozessoren und deren Einbindung in die Anfrageverarbeitung. Aufgrund der Vielzahl von Optimierungen und Varianten von Algorithmen und unbegrenzte Anzahl an Anwendungsfällen, ist das Erstellen des perfekten Anfrageplanes nahezu unmöglich.
Ziel der Habilitation ist es, (1) einen umfassenden Katalog von vielversprechenden Algorithmenvarianten aufzustellen, (2) eine optimale Auswahl der Varianten im Zuge der übergeordneten Anfrageoptimierung zu erlangen, (3) als auch Lastverteilung im Co-Prozessorbeschleunigten System zu erreichen.

Der Variantenkatalog umfasst als weitere Dimensionen sowohl die Ausführung auf den spaltenorientierten Daten, als auch unter Nutzung von speziellen Indexstrukturen und beinhaltet unterschiedliche Ergebnisrepräsentationen. Aus allen möglichen Dimension wird dann eine Abstraktionsschicht entwickelt, sodass ein Algorithmus unabhängig von dessen Optimierungen definiert werden kann. Dadurch soll jede Variante effizient, mit wenig redundantem Code generiert und ausgeführt werden können.
Aufgrund des enormen Variantenraumes bestehend aus den Dimensionen der Varianten inklusive dem Einfluss der ausführenden Prozessoren ist die Wahl einer auszuführenden Variante nicht trivial. Ziel ist es hier lern-basierte Methoden in Hinblick auf die Eignung zur Algorithmenauswahl gegenüber zu stellen, um valide Entscheidungen zu treffen. Die zu treffenden Entscheidungen sollen des Weiteren auch ausgeweitet werden auf das Erstellen von Indexen als auch der Datenverteilung in Ziel (3).
Die Lastenverteilung in Co-Prozessorbeschleunigten Systemen wird durch den Grad der Parallelisierung beeinflusst. Dieser Grad teilt sich in mehrere Dimensionen, da Datenbankoperationen in kleinere Funktionseinheiten (sog. Primitive) aufteilen können. Diese Primitive können entweder auf dem ganzen Datenbestand laufen oder partitioniert ausgeführt werden. All diese Optimierungspotentiale (unterschiedliche Granularitätsstufen und Partitionierungsgrößen) müssen analysiert und optimal gewählt werden, um unter der gegebenen und zukünftigen Anfragelast eine angemessene Performanz zu ermöglichen. Ziel ist es, ein Modell lernen zu lassen, um optimale Verteilungen und optimierte Pläne zu erstellen. Wichtig ist hierbei, dass das Modell auch Rückschlüsse auf dessen Entscheidungen zulässt, um eine Generalisierbarkeit zu erreichen.

The project addresses the current focus of analyses in main memory databases on modern hardware: heterogeneity of processors and their integration into query processing. Due to the multitude of optimizations and variants of algorithms and unlimited number of use cases, creating the perfect query plan is almost impossible.
The aim of the habilitation is (1) to establish a comprehensive catalog of promising algorithm variants, (2) to achieve an optimal selection of variants in the course of the higher-level query optimization, (3) and to achieve load balancing in the co-processor-accelerated system.

The variant catalog includes as further dimensions both the execution on the column-oriented data, as well as using special index structures and contains different result representations. An abstraction layer is then developed from all possible dimensions so that an algorithm can be defined independently of its optimizations. This should allow each variant to be generated and executed efficiently and with little redundant code
Due to the enormous variant space consisting of the dimensions of the variants including the influence of the executing processors, the choice of a variant to be executed is not trivial. The aim here is to compare learning-based methods with regard to their suitability for algorithm selection in order to make valid decisions. The decisions to be made should also be extended to the creation of indexes as well as the data distribution in objective (3).
The load distribution in co-processor accelerated systems is influenced by the degree of parallelization. This degree is divided into several dimensions, as database operations can be divided into smaller functional units (so-called primitives). These primitives can either run on the entire database or be partitioned. All these optimization potentials (different granularity levels and partitioning sizes) must be analyzed and optimally selected to enable adequate performance under the given and future query load. The aim is to let a model learn in order to create optimal distributions and optimized plans. It is important that the model also allows conclusions to be drawn about its decisions in order to achieve generalizability.

UN Nachhaltigkeitsziele

weitere Informationen zu den UN Nachhaltigkeitszielen

Kontakt

Prof. Dr. Gunter Saake

Otto-von-Guericke-Universität Magdeburg

Fakultät für Informatik

Institut für Technische und Betriebliche Informationssysteme

Universitätsplatz 2

39106

Magdeburg

Tel.:+49 391 6758800

saake(at)iti.cs.uni-magdeburg.de

weitere Projekte

Die Daten werden geladen ...

Query Acceleration Techniques in Co-Processor-Accelerated Main-memory Database Systems

Projektleiter:

Prof. Dr. Gunter Saake

Projektbearbeiter:

Dr.-Ing. David Broneske

Finanzierung:

Haushalt; 31.08.2019 bis 31.03.2022

Der Variantenkatalog umfasst als weitere Dimensionen sowohl die Ausführung auf den spaltenorientierten Daten, als auch unter Nutzung von speziellen Indexstrukturen und beinhaltet unterschiedliche Ergebnisrepräsentationen. Aus allen möglichen Dimension wird dann eine Abstraktionsschicht entwickelt, sodass ein Algorithmus unabhängig von dessen Optimierungen definiert werden kann. Dadurch soll jede Variante effizient, mit wenig redundantem Code generiert und ausgeführt werden können.
Aufgrund des enormen Variantenraumes bestehend aus den Dimensionen der Varianten inklusive dem Einfluss der ausführenden Prozessoren ist die Wahl einer auszuführenden Variante nicht trivial. Ziel ist es hier lern-basierte Methoden in Hinblick auf die Eignung zur Algorithmenauswahl gegenüber zu stellen, um valide Entscheidungen zu treffen. Die zu treffenden Entscheidungen sollen des Weiteren auch ausgeweitet werden auf das Erstellen von Indexen als auch der Datenverteilung in Ziel (3).
Die Lastenverteilung in Co-Prozessorbeschleunigten Systemen wird durch den Grad der Parallelisierung beeinflusst. Dieser Grad teilt sich in mehrere Dimensionen, da Datenbankoperationen in kleinere Funktionseinheiten (sog. Primitive) aufteilen können. Diese Primitive können entweder auf dem ganzen Datenbestand laufen oder partitioniert ausgeführt werden. All diese Optimierungspotentiale (unterschiedliche Granularitätsstufen und Partitionierungsgrößen) müssen analysiert und optimal gewählt werden, um unter der gegebenen und zukünftigen Anfragelast eine angemessene Performanz zu ermöglichen. Ziel ist es, ein Modell lernen zu lassen, um optimale Verteilungen und optimierte Pläne zu erstellen. Wichtig ist hierbei, dass das Modell auch Rückschlüsse auf dessen Entscheidungen zulässt, um eine Generalisierbarkeit zu erreichen.

Kontakt

Prof. Dr. Gunter Saake

Otto-von-Guericke-Universität Magdeburg

Fakultät für Informatik

Institut für Technische und Betriebliche Informationssysteme

Universitätsplatz 2

39106

Magdeburg

Tel.:+49 391 6758800

saake(at)iti.cs.uni-magdeburg.de

weitere Projekte

Die Daten werden geladen ...