« Projekte

Bitte aktivieren Sie JavaScript in Ihren Browsereinstellungen, um das Forschungsportal nutzen zu können.

Sie verwenden einen sehr veralteten Browser und können Funktionen dieser Seite nur sehr eingeschränkt nutzen. Bitte aktualisieren Sie Ihren Browser. http://www.browser-update.org/de/update.html

Drift Mining

Projektleiter:

Prof. Myra Spiliopoulou

Projektbearbeiter:

Krempl

Finanzierung:

Haushalt; 01.10.2011 bis 30.09.2016

Im klassischen Data Mining werden historische Daten untersucht, um Wissen über die Verteilung und Beziehung zwischen Variablen zu gewinnen.Eine als Concept Drift bekannte Herausforderung sind Veränderung in den Verteilungen und Beziehungen der Daten über die Zeit. Eine vielfach angewendete Strategie besteht in derwiederholten Anwendung von Mining Verfahren auf immer neueren Daten.Dieser Ansatz erfordert jedoch die Verfügbarkeit einer ausreichenden Anzahl von aktuellen Daten um ein Modell neu zu lernen oder zumindest anzupassen.
Speziell in einigen Anwendungsgebieten des überwachten Lernens, wenn Prognosen über Ereignisse in weiter Zukunft getroffen werden sollen, wie beispielsweisein der Kreditrisikoschätzung für Kredite mit langer Laufzeit, stehen jedochnur Daten zu den erklärenden Variablen zur Verfügung, nicht jedoch zu den abhängigen Variablen.
Ziel dieses Projektes ist es, diese fehlenden Daten durch Wissen über diegenaue Art von Veränderungen in den Verteilungen und Beziehungen der Variablenzu kompensieren. Hierfür werden Modelle über die Zusammenhänge von Verteilungsveränderungen (Drift)in den Variablen über die Zeit formuliert und an historischen Daten geprüft.Für dieses Drift Mining werden lediglich Daten benötigt, deren Veränderungsmuster dem aktueller Daten entsprechen,die Aktualität ihrer tatsächlichen Verteilung ist hingegen nicht kritisch.Somit können für diese Aufgabe historische Daten verwenden werden, welche für klassische Modelle,welche die Verteilung und Beziehung der Variablen direkt schätzen, nicht mehr verwendet werden können.Ein Nebenprodukt dieser Forschung ist die Entwicklung von Methoden zum besseren Verständnis von Veränderungen in den Verteilungen von Daten.
Teilaufgaben im Rahmen des Projektes sind:A. Methoden zur Analyse von Drift auf einfachen und multiplen DatenströmenB. Adaptive Klassifikationsstrategien für den Umgang mit Verification Latency in sich verändernden DatenströmenC. Active Learning Strategien für sich verändernde Datenströme

In classical data mining, historical data is examined in order to gain knowledge about the distribution and relationship between variables, a challenge known as concept drift is the change in the distributions and relationships of the data over time. A frequently used strategy is to repeatedly apply mining methods to newer and newer data, but this approach requires the availability of a sufficient amount of current data to re-learn or at least adapt a model.
Especially in some application areas of supervised learning, when predictions about events in the distant future are to be made, such as credit risk estimation for loans with long maturities, only data on the explanatory variables are available, but not on the dependent variables.
The aim of this project is to compensate for this lack of data with knowledge about the exact nature of changes in the distributions and relationships of the variables. For this purpose, models of the correlations of distributional changes (drift) in the variables over time are formulated and tested on historical data.For this drift mining, only data are required whose change patterns correspond to the current data, but the timeliness of their actual distribution is not critical.Thus, historical data can be used for this task, which can no longer be used for classical models that directly estimate the distribution and relationship of the variables.A by-product of this research is the development of methods for a better understanding of changes in the distributions of data.
Sub-tasks within the project are:A. Methods for analyzing drift on simple and multiple data streamsB. Adaptive classification strategies for dealing with verification latency in changing data streamsC. Active learning strategies for changing data streams
This text was translated with DeepL on 28/11/2025

Schlagworte

Active Learning, Credit Scoring, Drift Mining, Multiple Data Streams, Verification Latency

UN Nachhaltigkeitsziele

weitere Informationen zu den UN Nachhaltigkeitszielen

Kooperationen im Projekt

Karl-Franzens-Universität Graz

Kontakt

Prof. Myra Spiliopoulou

Otto-von-Guericke-Universität Magdeburg

Fakultät für Informatik

Institut für Technische und Betriebliche Informationssysteme

Universitätsplatz 2

39106

Magdeburg

Tel.:+49 391 6758967

weitere Projekte

Die Daten werden geladen ...

Drift Mining

Projektleiter:

Prof. Myra Spiliopoulou

Projektbearbeiter:

Krempl

Finanzierung:

Haushalt; 01.10.2011 bis 30.09.2016

Schlagworte

Active Learning, Credit Scoring, Drift Mining, Multiple Data Streams, Verification Latency

Kooperationen im Projekt

Karl-Franzens-Universität Graz

Kontakt

Prof. Myra Spiliopoulou

Otto-von-Guericke-Universität Magdeburg

Fakultät für Informatik

Institut für Technische und Betriebliche Informationssysteme

Universitätsplatz 2

39106

Magdeburg

Tel.:+49 391 6758967

weitere Projekte

Die Daten werden geladen ...