Du analysierst LLM-basierte Klassifizierungsmethoden und bereinigst Daten. Zudem erstellst du Prozessanalysen und ordnest theoretische Grundlagen ein, während du Ergebnisse validierst und Handlungsempfehlungen ausarbeitest.
Anforderungen
- •Studium der Informatik oder eines vergleichbaren Studiengangs
- •Grundlegende Kenntnisse der Programmiersprache Python
- •Gute Kenntnisse in Maschinelles Lernen oder Softwareentwicklung
- •Kenntnisse eines Deep Learning Frameworks wie TensorFlow oder Keras wünschenswert
- •Hohes Maß an Eigeninitiative und strukturierter Arbeitsweise
Deine Aufgaben
- •Vergleichende Analyse von LLM-basierten Klassifizierungsmethoden
- •Datenanalyse und Datenbereinigung durchführen
- •IST-Prozessanalyse erstellen
- •Theoretische Grundlagen einordnen
- •Validierung der Ergebnisse durchführen
- •Handlungsempfehlungen aussprechen
Deine Vorteile
Einblick in Forschung der Energiebranche
Zugang zu Expertennetzwerken
Verpflichtung zur Charta der Vielfalt
Option auf Weiterbeschäftigung
Flexible Arbeitszeitgestaltung
Original Beschreibung
Ort:
Kassel
Datum:
15.05.2025
# Wissenschaftliche Abschlussarbeit - Fraunhofer x 50Hertz
**Du möchtest die Umsetzung der Energiewende mitgestalten und an der Schnittstelle von Wissenschaft und Wirtschaft arbeiten?**
**Was Du bei uns tust**
Im Rahmen einer gemeinsamen Abschlussarbeit bieten das Fraunhofer IEE und 50Hertz die Möglichkeit, an einer hochaktuellen Fragestellung mitzuarbeiten:
**Vergleichende Analyse LLM-basierter Klassifizierungsmethoden von Schadensmeldung zur Aufbereitung semi-strukturierter Instandhaltungsdaten** – Steigerung der Datenqualität von Schadensmeldungen zur Implementierung datengetriebener Entscheidungsprozesse im Netzbetrieb der 50Hertz Transmission GmbH.
**Problemstellung:**
Das digitale System „MAFID“ bei 50Hertz unterstützt die Instandhaltung und das Assetmanagement durch die Planung, Dokumentation und Auswertung von Maßnahmen an technischen Anlagen. Ein zentrales Problem stellt die unpräzise Kategorisierung von Schäden dar: Etwa ein Drittel der knapp 20.000 Schadensmeldungen ist mit „Sonstiges“ oder „Nicht zugeordnet“ gekennzeichnet, obwohl oft passende Kategorien vorhanden wären. Dies beeinträchtigt sowohl die operative Instandhaltungsplanung als auch strategische Analysen im Assetmanagement.
**Zielstellung und Themenaspekte:**
**Entwicklung und vergleichende Analyse verschiedener LLM-basierter Ansätze zur Klassifikation von Schadensmeldungen nach Schadenscodes und Steigerung der Datenqualität von Schadensmeldungen.**
Zur Bearbeitung dieser Zielstellung sollten weiterhin folgende Themenfelder bzw. Leitfragen beantwortet werden:
1. Datenanalyse und -bereinigung
* Wie viele der Schadensmeldungen weisen den Schadenscode "Sonstige-Sonstige" bzw. „Nicht zugeordnet“ auf?
* Lassen sich Muster mit Blick auf bestimmte Betriebsmittel oder den verantwortlichen Arbeitsplatz erkennen?
* Welche Schadenscodes eines Betriebsmittels lassen sich zu sinnvollen Schadenscodegruppen zusammenfassen (Beispiel: "Ölstand" vs. "Ölstand und Dichtigkeit")?
2. IST- Prozessanalyse
* Was sind Schwächen im aktuellen Prozess der Erfassung von Mangelmeldungen, die zu einer verminderten Datenqualität führen könnten?
3. Grundlagentheoretische Einordnung
* Welche LLM-basierten Klassifizierungsansätze existieren, um unstrukturierte Textinformationen in strukturierte Schadenscodes zu überführen?
* Wie lassen sich Schadenscodes mit wenig Trainingsbeispielen zuordnen (z.B. durch Few-Shot/Zero-Shot-Learning-Ansätze)?
* Was sind die Vor- und Nachteile der Ansätze mit Blick auf den betrachteten Anwendungsfall bzw. die verfügbare Datenlage und -struktur?
4. Validierung
* Anwendung ausgewählter Ansätze/Modelle zum Training mit verfügbaren Trainingsdaten bzw. Adaption auf das zugrundeliegende Problemfeld
* Vergleichende Analyse der Ansätze und Modelle unter Verwendung geeigneter Evaluierungsmetriken
5. Handlungsempfehlungen
* Welcher der validierten Ansätze ist unter Berücksichtigung der Validierungsergebnisse sowie weiterer Faktoren (Komplexität, Bedarf an Trainingsdaten, Integrationsfähigkeit, etc.) am geeignetsten zur Lösung der beschriebenen Problemstellung?
* Wie wird die Machbarkeit der Integration entwickelter Lösungsansätze in den Bestandsprozess und unter Berücksichtigung der IT-Infrastruktur eingeschätzt?
* Was sind mögliche Handlungsempfehlungen zur kontinuierlichen Verbesserung der Datenqualität?
**Was Du mitbringst**
* Studium der Informatik, Mathematik, Energietechnik oder eines vergleichbaren Studiengangs
* Grundlegende Kenntnisse der Programmiersprache Python
* Gute Kenntnisse in mindestens einem der folgenden Bereiche: Maschinelles Lernen, Datenanalyse, Softwareentwicklung, Natural Language Processing, Large Language Models
* Kenntnisse eines Deep Learning Frameworks (z. B. PyTorch, PyTorch Lightning, TensorFlow oder Keras) sind wünschenswert
* Hohes Maß an Eigeninitiative und selbstständiger, strukturierter Arbeitsweise
**Was Du erwarten kannst**
* Einblick in anwendungsorientierte Forschung der Energiebranche mit direkter Relevanz für Industrie und Gesellschaft
* Zugang zu Expertennetzwerken in der Energiewirtschaft und Forschung
* Verpflichtung zur Charta der Vielfalt – Wir fördern aktiv Vielfalt und Inklusion in allen Bereichen
* Option auf eine Weiterbeschäftigung (z. B. als wissenschaftliche Hilfskraft oder für eine Promotion)
* Flexible und individuelle Anpassung der Arbeitszeit an Vorlesungs- und Klausurzeiten sowie die Möglichkeit zur Arbeit im Home-Office oder im modernen Institutsgebäude mit New Work Konzept in zentraler Lage
Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt.
Im Rahmen der Abschlussarbeit besteht außerdem die Möglichkeit als wissenschaftliche Hilfskraft, mit einem dir passenden Stundenumfang (40 bis 80 Stunden) tätig zu sein. Die Stelle ist zunächst auf 12 Monate befristet, wobei wir eine längerfristige Zusammenarbeit anstreben. Ausnahmen für eine kürzere Laufzeit sind grundlegende betriebliche Gründe, der persönliche Wunsch des Studierenden oder das Ende des Studiums. Die Vergütung richtet sich nach der Gesamtbetriebsvereinbarung zur Beschäftigung der Hilfskräfte.
Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft.
Fragen zu dieser Position beantwortet Dir gerne:
* Herr Stefan Faulstich (Telefon +49 (0) 561 7294-253)
* Herr Dr. Bastian Schäfermeier (Telefon: +49 (0) 561 7294 1626)
Kennziffer: 79772 Bewerbungsfrist: 30.06.2025