« Projekte
Sie verwenden einen sehr veralteten Browser und können Funktionen dieser Seite nur sehr eingeschränkt nutzen. Bitte aktualisieren Sie Ihren Browser. http://www.browser-update.org/de/update.html
Center for Dynamic Systems (CDS) - Teilprojekt 2.1 "ChemLitX: Algorithmische Extraktion und Exploration von Wissen über chemische (Kunststoffrecycling-) Prozesse aus der wissenschaftlichen Literatur"
Projektbearbeiter:
Dipl.-Inf. Stefan Langer
Finanzierung:
EU - EFRE Sachsen-Anhalt ;
 
EUROPÄISCHE UNION - EFRE -  Europäischer Fonds für regionale Entwicklung
Center for Dynamic Systems (CDS) ZS/2023/12/182075
Projektbereich 2 Digitalisierung


Hintergrund
Der Übergang zu nachhaltigen und zirkulären Produktionsprozessen erfordert die Erforschung neuartiger chemischer Reaktionswege, die von erneuerbaren Rohstoffen über energieeffiziente und CO₂-arme Syntheseprozesse zu umweltfreundlichen Produkten führen. Die Identifikation solcher Reaktionswege setzt voraus, dass das kollektive chemische Wissen der Welt methodisch, systematisch und gezielt durchsucht und strukturiert wird. Dieses Wissen wächst rasant: Seit seiner Gründung im Jahr 2017 enthält die Plattform ChemRxiv (https://chemrxiv.org/) bereits etwa 30.000 wissenschaftliche Artikel im Bereich der Chemie. Hinzu kommen Fachzeitschriften wie das International Journal of Molecular Sciences, das allein im

Jahr 2022 über 16.400 wissenschaftliche Artikel veröffentlichte, von denen etwa 30–35 % aus dem Bereich der Biochemie stammen. Angesichts dieser enormen Menge an Publikationen, die kontinuierlich weiter wächst, ist eine manuelle Analyse kaum noch umsetzbar.
In den letzten Jahren gab es bedeutende Fortschritte im Bereich von Sprachverarbeitungstechnologien (Natural Language Processing, NLP), insbesondere durch die Entwicklung von transformer-basierten Systemen. Das tiefe „Textverständnis“ der daraus resultierenden großen Sprachmodelle (Large Language Models, LLM) kann auch genutzt werden, um wissenschaftliche Literatur zu analysieren und das enthaltene Wissen in strukturierter und aufbereiteter Form bereitzustellen.

Ziele
ChemLitX zielt darauf ab, ein Werkzeug zur Extraktion von Wissen über chemische Reaktionen aus der wissenschaftlichen Literatur zu entwickeln. Es erstellt eine eigene Wissensdatenbank und bietet eine Webanwendung namens ChemLitX Lens, die:
  1. relevante Textstellen in PDF-Dokumenten markiert,
  2. Stellen oder Konzepte mit anderen Dokumenten oder Datenquellen verknüpft,
  3. eine intelligente Suche nach ähnlichen Reaktionen integriert und einfache Antworten auf Fragen auf Basis des Literaturkorpus bereitstellt.

Das Projekt ist von großer Bedeutung für die Teilcluster von SmartProSys (https://smartprosys.ovgu.de/) und bietet neben Unterstützungsmöglichkeiten für potenzielle Partner in der Industrie auch zahlreiche zukünftige Interaktionen mit anderen wissenschaftlichen Partnern aus den Bereichen Mathematik, Informatik, Chemie und Wirtschaft.
Kontakt

weitere Projekte

Die Daten werden geladen ...