Skip to content
Neuer Job?Nejo!

Die KI-Suchmaschine für Jobs

ALAleph Alpha

Senior Performance Engineer- Pretraining(m/w/x)

Heidelberg
Vollzeitmit HomeofficeSenior
AI/ML
Data Science

You will drive the efficiency of large-scale LLM training by optimizing systems from the kernel level up, ensuring massive GPU clusters reach their full performance potential.

Anforderungen

  • Proficiency in Python and PyTorch
  • Engineering background in parallel or distributed systems
  • Experience with modern machine learning techniques
  • Deep understanding of CUDA programming model
  • Experience in distributed programming with APIs
  • Experience analyzing profiling traces
  • Regular on-site collaboration in Heidelberg
  • Contributions to distributed training frameworks
  • Familiarity with low-precision training formats
  • Understanding of NCCL, NVSHMEM, or IPC
  • Track record of optimizing transformer training
  • Experience with NVIDIA Blackwell architecture

Aufgaben

  • Engineer systems for large-scale foundation model training
  • Maximize hardware utilization on massive GPU clusters
  • Eliminate bottlenecks from Python to GPU kernels
  • Profile training loops using PyTorch and Nsight
  • Identify system- and kernel-level performance bottlenecks
  • Configure and tune composite parallelism strategies
  • Optimize load balance and communication-to-computation trade-offs
  • Partner with researchers to design hardware-efficient architectures

Berufserfahrung

ca. 4 - 6 Jahre

Ausbildung

Bachelor-AbschlussODERMaster-Abschluss

Sprachen

Englischverhandlungssicher

Tools & Technologien

PythonPyTorchCUDANCCLMPIPyTorch ProfilerNvidia NsightTorchTitanMegatron-LMDeepSpeedMXFP4MXFP8NVSHMEMCUDA IPCNVIDIA Blackwell

Benefits

Flexibles Arbeiten

  • Flexible working hours
  • Hybrid working model

Attraktive Vergütung

  • Competitive salary
  • Equity package

Mehr Urlaubstage

  • 30 days of paid vacation

Gesundheits- & Fitnessangebote

  • Fitness and wellness offerings

Mentale Gesundheitsförderung

  • Mental health support

Firmenfahrrad

  • JobRad Bike Lease

Betriebliche Altersvorsorge

  • Subsidized company pension plan

Öffi Tickets

  • Subsidized Germany-wide transportation ticket

Moderne Technikausstattung

  • Budget for technical equipment
Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Aleph Alpha erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.
Noch nicht perfekt?
100+ Ähnliche Jobs in Heidelberg
  • accredia placement GmbH

    MLOps Engineer(m/w/x)

    VollzeitRemoteBerufserfahren
    Ludwigshafen am Rhein
  • SAP

    Principal Machine Learning Expert/ Development Architect(m/w/x)

    Vollzeitmit HomeofficeSenior
    Walldorf
  • Buhl Data Service GmbH

    Senior AI / Data Science Engineer(m/w/x)

    Vollzeitmit HomeofficeSenior
    Mannheim
  • Aleph Alpha

    Senior AI Researcher- Reinforcement learning(m/w/x)

    Vollzeitmit HomeofficeSenior
    Heidelberg
  • botario GmbH

    Senior Python Engineer - Voice AI Platform(m/w/x)

    Vollzeitmit HomeofficeSenior
    Mainz, Berlin, München, Mannheim, Bremen
100+ Alle ähnlichen Jobs ansehen

Nejo ist eine KI – Ergebnisse können unvollständig sein oder Fehler enthalten

Diese Jobs könnten dich auch interessieren