Skip to content
New Job?Nejo!

Your personal AI career agent

FRFraunhofer-Gesellschaft

Masterarbeit: Evaluation von Vision-Language Models zur Erfassung sozial situativer Kontexte in industriellen Umgebungen – Benchmark-Entwicklung & Modellvergleich(m/w/x)

Augsburg
Full-time, Part-timeWorking StudentOn-site
AI/ML

Entwicklung eines Benchmarks und Vergleichs von Vision-Language Models zur Erfassung sozial situativer Kontexte in industriellen Umgebungen. Programmierkenntnisse in Python und erste Erfahrungen mit multimodalen KI-Modellen erforderlich. Hoher Gestaltungsspielraum und flexible Arbeitszeiten.

Requirements

  • Studium in Ingenieurswissenschaften oder Informatik
  • Programmierkenntnisse in Python
  • Erste Erfahrungen mit multimodalen KI-Modellen (Vision-Language Models, LLMs) oder Bildverarbeitung
  • Interesse an Mensch-Roboter-Interaktion und sozialer Robotik
  • Zuverlässige und selbstständige Arbeitsweise

Tasks

  • Literaturrecherche zu Vision-Language Models (VLMs) durchführen
  • Recherche zu bestehenden VLM-Benchmarks durchführen
  • Recherche zu Methoden der Human-Human-Interaction (HHI) Erkennung durchführen
  • Recherche zu Methoden der Human-Object-Interaction (HOI) Erkennung durchführen
  • Entwicklung einer Annotationsstrategie für sozial situative Szenen
  • Entwicklung einer Taxonomie für sozial situative Szenen (Interaktionsmuster, Ansprechbarkeit, Tätigkeitskontext, soziale Normen)
  • Auswahl eines Annotationstools (z. B. CVAT)
  • Einrichtung eines Annotationstools (z. B. CVAT)
  • Annotation eines industriellen Bilddatensatzes (4 Branchen) mit mehreren Annotierenden
  • Bestimmung des Inter-Annotator-Agreements
  • Systematischer Vergleich lokaler VLMs (z. B. LLaVA, InternVL2, Qwen2-VL) auf einem NVIDIA Jetson Orin AGX
  • Prompt-Engineering für den Vergleich lokaler VLMs
  • Analyse der Prompt-Sensitivität
  • Auswertung der Ergebnisse
  • Wissenschaftliche Dokumentation der Ergebnisse

Education

  • Bachelor's degree

Languages

  • GermanBusiness Fluent

Tools & Technologies

  • Python
  • multimodalen KI-Modellen (Vision-Language Models, LLMs)
  • Bildverarbeitung

Benefits

Flexible Working

  • Flexible Arbeitszeiten

Modern Office

  • Hervorragende Ausstattung

Informal Culture

  • Sympathisches, motiviertes Team

Purpose-Driven Work

  • Hoher Gestaltungsspielraum
Find the original job posting in its most current version here. Nejo automatically captured this job from the website of Fraunhofer-Gesellschaft and processed the information on Nejo with the help of AI for you. Despite careful analysis, some information may be incomplete or inaccurate. Please always verify all details in the original posting! Content and copyrights of the original posting belong to the advertising company.

Like this job?

Beta

Your Career Agent finds similar jobs for you every day.


  • XITASO GmbH

    Masterand - Semantic 4D Occupancy Forecasting(m/w/x)

    Full-time/Part-timeInternshipOn-site
    Karlsruhe, Augsburg, Berlin, Erlangen, Ingolstadt, Krumbach (Schwaben), Leipzig
  • Fraunhofer-Gesellschaft

    Studienarbeit/ Bachelorarbeit/ Masterarbeit: VLA-basierte Robotermanipulation(m/w/x)

    Full-time/Part-timeWorking StudentOn-site
    Augsburg
  • Everllence

    Abschlussarbeit: Unsupervised Learning für Anomalie Detektion in Zeitreihendaten(m/w/x)

    Full-timeInternshipOn-site
    Augsburg
  • Fraunhofer-Gesellschaft

    Wissenschaftliche:r Mitarbeiter:in im Bereich KI-Basierte Robotik(m/w/x)

    Full-time/Part-timeTemporary contractOn-siteJunior
    Augsburg
  • Fraunhofer-Gesellschaft

    Studienarbeit/ Bachelorarbeit: Dynamische Sicherheitszonen in der flexiblen Produktion(m/w/x)

    Full-time/Part-timeInternshipOn-site
    Augsburg
View all 100+ similar jobs