Multi-Agent Reinforcement Learning for Deadlock Handling among Autonomous Mobile Robots
Projektleiter:
Finanzierung:
Fördergeber - Sonstige;
Diese Dissertation untersucht den Einsatz von Multi-Agent-Reinforcement-Learning (MARL)
zur Handhabung von Deadlocks in Intralogistiksystemen, die auf autonome mobile Roboter
(AMR) setzen. AMRs erhöhen die betriebliche Flexibilität, steigern jedoch auch das Risiko
von Deadlocks, die den Systemdurchsatz und die Zuverlässigkeit mindern. Bestehende Ansätze
vernachlässigen oft die Behandlung von Deadlocks in der Planungsphase und stützen sich auf
starre Steuerungsregeln, die sich nicht an dynamische Betriebsbedingungen anpassen.
Diese Arbeit entwickelt eine strukturierte Methodik zur Integration von MARL in die Logistikplanung
und Betriebssteuerung. Dazu werden Referenzmodelle eingeführt, die deadlock-fähige
Multi-Agent-Pathfinding-Probleme (MAPF) explizit berücksichtigen und eine systematische
Bewertung von MARL-Strategien ermöglichen. Mit gitterbasierten Umgebungen und externer
Simulationssoftware werden traditionelle Deadlock-Strategien mit MARL-basierten Ansätzen
verglichen, wobei der Fokus auf den Algorithmen PPO und IMPALA in verschiedenen Trainings und
Ausführungsmodi liegt.
Die Ergebnisse zeigen, dass MARL-Strategien, insbesondere in Kombination mit zentralisiertem
Training und dezentraler Ausführung (CTDE), in komplexen, überlasteten Umgebungen
regelbasierte Verfahren übertreffen. In einfacheren Umgebungen oder bei ausreichendem Bewegungsspielraum bleiben regelbasierte Ansätze aufgrund ihres geringeren Rechenaufwands
konkurrenzfähig. Diese Resultate verdeutlichen, dass MARL eine flexible und skalierbare Lösung
zum Umgang mit Deadlocks in dynamischen Intralogistikszenarien bietet, jedoch eine sorgfältige
Anpassung an den jeweiligen Anwendungsfall erfordert.
zur Handhabung von Deadlocks in Intralogistiksystemen, die auf autonome mobile Roboter
(AMR) setzen. AMRs erhöhen die betriebliche Flexibilität, steigern jedoch auch das Risiko
von Deadlocks, die den Systemdurchsatz und die Zuverlässigkeit mindern. Bestehende Ansätze
vernachlässigen oft die Behandlung von Deadlocks in der Planungsphase und stützen sich auf
starre Steuerungsregeln, die sich nicht an dynamische Betriebsbedingungen anpassen.
Diese Arbeit entwickelt eine strukturierte Methodik zur Integration von MARL in die Logistikplanung
und Betriebssteuerung. Dazu werden Referenzmodelle eingeführt, die deadlock-fähige
Multi-Agent-Pathfinding-Probleme (MAPF) explizit berücksichtigen und eine systematische
Bewertung von MARL-Strategien ermöglichen. Mit gitterbasierten Umgebungen und externer
Simulationssoftware werden traditionelle Deadlock-Strategien mit MARL-basierten Ansätzen
verglichen, wobei der Fokus auf den Algorithmen PPO und IMPALA in verschiedenen Trainings und
Ausführungsmodi liegt.
Die Ergebnisse zeigen, dass MARL-Strategien, insbesondere in Kombination mit zentralisiertem
Training und dezentraler Ausführung (CTDE), in komplexen, überlasteten Umgebungen
regelbasierte Verfahren übertreffen. In einfacheren Umgebungen oder bei ausreichendem Bewegungsspielraum bleiben regelbasierte Ansätze aufgrund ihres geringeren Rechenaufwands
konkurrenzfähig. Diese Resultate verdeutlichen, dass MARL eine flexible und skalierbare Lösung
zum Umgang mit Deadlocks in dynamischen Intralogistikszenarien bietet, jedoch eine sorgfältige
Anpassung an den jeweiligen Anwendungsfall erfordert.
Publikationen
Die Daten werden geladen ...
Die Daten werden geladen ...
Die Daten werden geladen ...
Kontakt
M.Sc. Marcel Müller
Otto-von-Guericke-Universität Magdeburg
Institut für Engineering von Produkten und Systemen
Universitätsplatz 2
39106
Magdeburg
Tel.:+49 391 6757035
weitere Projekte
Die Daten werden geladen ...
