Skip to content
Neuer Job?Nejo!

Die KI-Suchmaschine für Jobs

BLBlack Forest Labs

Member of Technical Staff - Training Cluster Engineer(m/w/x)

Freiburg im Breisgau
VollzeitVor OrtBerufserfahren
AI/ML

You design and maintain ML training clusters, ensuring their performance and security. By collaborating with research teams, you translate their computational needs into effective infrastructure solutions.

Anforderungen

  • Production experience managing SLURM clusters
  • Hands-on experience with Docker or similar container runtimes
  • Proven track record managing GPU clusters
  • Understanding of distributed training patterns
  • Experience with Kubernetes for containerized workloads
  • Experience with high-performance interconnects
  • Track record of managing 1000+ GPU training runs
  • Familiarity with high-performance storage solutions
  • Experience running hybrid training/inference infrastructure
  • Strong scripting skills in Python and Bash

Aufgaben

  • Design and maintain large-scale ML training clusters
  • Deploy SLURM for distributed workload orchestration
  • Implement node health monitoring systems
  • Automate failure detection and recovery workflows
  • Ensure cluster availability with cloud providers
  • Monitor performance with colocation partners
  • Establish security best practices for ML infrastructure
  • Build developer-facing tools and APIs for ML workflows
  • Collaborate with ML research teams on infrastructure needs

Berufserfahrung

ca. 1 - 4 Jahre

Ausbildung

Abgeschlossene BerufsausbildungODERBachelor-AbschlussODERMaster-Abschluss

Sprachen

Englischverhandlungssicher

Tools & Technologien

SLURMDockerKubernetesInfiniBandRoCENCCLPythonBash
Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Black Forest Labs erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.
Noch nicht perfekt?
100+ Ähnliche Jobs in Freiburg im Breisgau
  • Black Forest Labs

    Member of Technical Staff - Large scale data infrastructure(m/w/x)

    Vollzeitnur vor OrtSenior
    Freiburg im Breisgau
  • Prior Labs

    MLOps / ML Systems Engineer(m/w/x)

    Vollzeitnur vor OrtSenior
    Berlin, Freiburg im Breisgau
  • Prior Labs

    ML Engineer, Cloud Platform(m/w/x)

    Vollzeitnur vor OrtBerufserfahren
    ab 140.000 / Jahr
    Berlin, Freiburg im Breisgau
  • Prior Labs

    ML Engineer, Foundation Model(m/w/x)

    Vollzeitnur vor OrtBerufserfahren
    ab 120.000 / Jahr
    Berlin, Freiburg im Breisgau
  • Black Forest Labs

    Developer Relations Engineer(m/w/x)

    Vollzeitnur vor OrtBerufserfahren
    Freiburg im Breisgau
100+ Alle ähnlichen Jobs ansehen

Nejo ist eine KI – Ergebnisse können unvollständig sein oder Fehler enthalten

Diese Jobs könnten dich auch interessieren