« Projekte
Sie verwenden einen sehr veralteten Browser und können Funktionen dieser Seite nur sehr eingeschränkt nutzen. Bitte aktualisieren Sie Ihren Browser. http://www.browser-update.org/de/update.html
OSCAR: Ensemble-Methoden und Methoden des aktiven Lernens für die Klassifikation von Meinungsströmen
Projektbearbeiter:
Niemann
Finanzierung:
Deutsche Forschungsgemeinschaft (DFG) ;
Im Zeitalter von WEB 2.0 werden in sozialen Medien Meinungen zu fast jedem Thema hochgeladen - zu Ereignissen, Produkten, Diskursen. "Opinion Mining" wird genutzt, um Erkenntnisse zur Einstellung von Menschen zu diesen Themen abzuleiten. Mit der Zeit treten aber Änderungen auf: die positive/negative Einstellung zu einem Produkt kann sich ändern, ebenso die Einstellung zu bestimmten Aspekten, die Wahl der Wörter und die diskutierten Aspekte selbst. In OSCAR werden die Arbeitsgruppe KMD der Otto-von-Guericke-Universität Magdeburg, in Kooperation mit der Leibnitz-Universität Hannover, Mining Methoden für Meinungsströme entwickeln, die Veränderungen erkennen und abgeleitete Modelle anpassen.

Als Erstes werden wir Veränderungen im Vokabular behandeln. Meinungen sind Texte; in Text-Mining bilden die Wörter im Vokabular den Dimensionsraum. Veränderungen des Dimensionsraums bedeuten, dass ein im alten Dimensionsraum gelerntes Modell ungültig wird. Es ist aber unpraktisch, ein Modell jedesmal neu abzuleiten, wenn ein neues Wort erscheint. In OSCAR werden wir die Historie der Popularität und Polarität von jedem beobachteten Wort speichern, die Wechselwirkung von Wortpolarität und Dokumentpolarität über die Zeit beleuchten und die Wichtigkeit von Wörtern zu jedem Zeitpunkt berechnen. Wir werden ein zeitpunktbezogenes Vokabular aus wichtigen Wörtern bilden, und Methoden entwickeln, die graduell das Modell auf das evolvierende Vokabular anpassen.

Im zweiten Teil werden wir den Bedarf nach vorklassifizierten Meinungen reduzieren. Datenstromklassifikatoren nehmen an, dass eine fachkundige Person jederzeit verfügbar ist, um jede ankommende Dateninstanz in eine Klasse zuzuordnen. Diese Annahme wird durch "aktive Lernmethoden" beseitigt: diese Methoden fordern eine Klassenzuordnung nur für jene ankommende Instanzen, die am Meisten zur Erhöhung der Modellqualität beitragen. Bisherige aktive Lernmethoden gehen von einem gleichbleibenden Dimensionsraum aus. In OSCAR werden wir aktive Lernmethoden für einen Meinungsstrom mit sich veränderndem Vokabular entwickeln.

Im dritten Teil werden wir mehrere Arten von Veränderung simultan behandeln. Wir werden Ensemble-Techniken nutzen. Wir werden manche Ensemble-Mitglieder so gestalten, dass sie Modelle bei Veränderungen im Vokabular anpassen; andere Mitglieder werden Veränderungen in den Diskussionsthemen erkennen; weitere Mitglieder werden auf zeitbedingte Veränderungen, wie periodische Phänomene reagieren. Wir werden zudem an der Koordination der Ensemble-Mitglieder arbeiten, um eine graduelle Adaption des Gesamtmodells zu gewährleisten.

Wir werden eine vollständige Umgebung mit Methoden und koordinierenden Komponenten entwickeln. Letztere sind unter anderem für den Austausch von Informationen zwischen Ensemble-Mitgliedern und aktiven Lernmethoden zuständig.

Wir werden OSCAR auf reellen Daten evaluieren, vorwiegend aus Twitter: wir werden untersuchen, wie sich das Vokabular und die Themen zu ausgewählten Objekten (Produkten, Ereignissen) ändern und das Meinungsbild zu jedem Objekt beeinflussen.

Schlagworte

Data Mining, Ensemble-Methoden, Evolution der Daten, Evolution des Vokabulars, Klassifikation in Datenströmen, Meinungsströme, Mining auf Meinungsströme, aktives Lernen auf Datenströme

Kooperationen im Projekt

Kontakt

weitere Projekte

Die Daten werden geladen ...