Skip to content
Neuer Job?Nejo!

Dein persönlicher KI-Karriere-Agent

FRFraunhofer-Gesellschaft

Masterarbeit: Evaluation von Vision-Language Models zur Erfassung sozial situativer Kontexte in industriellen Umgebungen – Benchmark-Entwicklung & Modellvergleich(m/w/x)

Augsburg
Vollzeit, TeilzeitWerkstudentVor Ort
AI/ML

Entwicklung eines Benchmarks und Vergleichs von Vision-Language Models zur Erfassung sozial situativer Kontexte in industriellen Umgebungen. Programmierkenntnisse in Python und erste Erfahrungen mit multimodalen KI-Modellen erforderlich. Hoher Gestaltungsspielraum und flexible Arbeitszeiten.

Anforderungen

  • Studium in Ingenieurswissenschaften oder Informatik
  • Programmierkenntnisse in Python
  • Erste Erfahrungen mit multimodalen KI-Modellen (Vision-Language Models, LLMs) oder Bildverarbeitung
  • Interesse an Mensch-Roboter-Interaktion und sozialer Robotik
  • Zuverlässige und selbstständige Arbeitsweise

Aufgaben

  • Literaturrecherche zu Vision-Language Models (VLMs) durchführen
  • Recherche zu bestehenden VLM-Benchmarks durchführen
  • Recherche zu Methoden der Human-Human-Interaction (HHI) Erkennung durchführen
  • Recherche zu Methoden der Human-Object-Interaction (HOI) Erkennung durchführen
  • Entwicklung einer Annotationsstrategie für sozial situative Szenen
  • Entwicklung einer Taxonomie für sozial situative Szenen (Interaktionsmuster, Ansprechbarkeit, Tätigkeitskontext, soziale Normen)
  • Auswahl eines Annotationstools (z. B. CVAT)
  • Einrichtung eines Annotationstools (z. B. CVAT)
  • Annotation eines industriellen Bilddatensatzes (4 Branchen) mit mehreren Annotierenden
  • Bestimmung des Inter-Annotator-Agreements
  • Systematischer Vergleich lokaler VLMs (z. B. LLaVA, InternVL2, Qwen2-VL) auf einem NVIDIA Jetson Orin AGX
  • Prompt-Engineering für den Vergleich lokaler VLMs
  • Analyse der Prompt-Sensitivität
  • Auswertung der Ergebnisse
  • Wissenschaftliche Dokumentation der Ergebnisse

Ausbildung

  • Bachelor-Abschluss

Sprachen

  • Deutschverhandlungssicher

Tools & Technologien

  • Python
  • multimodalen KI-Modellen (Vision-Language Models, LLMs)
  • Bildverarbeitung

Benefits

Flexibles Arbeiten

  • Flexible Arbeitszeiten

Modernes Büro

  • Hervorragende Ausstattung

Lockere Unternehmenskultur

  • Sympathisches, motiviertes Team

Sinnstiftende Arbeit

  • Hoher Gestaltungsspielraum
Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Fraunhofer-Gesellschaft erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Gefällt dir diese Stelle?

Beta

Dein Career Agent findet täglich ähnliche Jobs für dich.


  • XITASO GmbH

    Masterand - Semantic 4D Occupancy Forecasting(m/w/x)

    Vollzeit/TeilzeitPraktikumnur vor Ort
    Karlsruhe, Augsburg, Berlin, Erlangen, Ingolstadt, Krumbach (Schwaben), Leipzig
  • Fraunhofer-Gesellschaft

    Studienarbeit/ Bachelorarbeit/ Masterarbeit: VLA-basierte Robotermanipulation(m/w/x)

    Vollzeit/TeilzeitWerkstudentnur vor Ort
    Augsburg
  • Everllence

    Abschlussarbeit: Unsupervised Learning für Anomalie Detektion in Zeitreihendaten(m/w/x)

    VollzeitPraktikumnur vor Ort
    Augsburg
  • Fraunhofer-Gesellschaft

    Wissenschaftliche:r Mitarbeiter:in im Bereich KI-Basierte Robotik(m/w/x)

    Vollzeit/TeilzeitBefristeter Vertragnur vor OrtJunior
    Augsburg
  • Fraunhofer-Gesellschaft

    Studienarbeit/ Bachelorarbeit: Dynamische Sicherheitszonen in der flexiblen Produktion(m/w/x)

    Vollzeit/TeilzeitPraktikumnur vor Ort
    Augsburg
Alle 100+ ähnlichen Jobs ansehen

Diese Jobs könnten dich auch interessieren