Skip to content
Neuer Job?Nejo!

Dein persönlicher KI-Karriere-Agent

NENebius

Senior ML Engineer - Token Factory(m/w/x)

Berlin
Vollzeitmit HomeofficeSenior
AI/ML
Data Science

Optimizing LLM inference performance, implementing novel speculative decoding architectures at cloud computing provider for global AI. Experience profiling GPU workloads and GPU memory hierarchy understanding required. Flexible working arrangements.

Anforderungen

  • Understanding of machine learning foundations
  • Experience profiling GPU workloads
  • Understanding of GPU memory hierarchy
  • Familiarity with LLM architectures
  • Understanding of neural network training
  • Strong software engineering skills
  • Experience with deep learning frameworks
  • Proficiency in CI/CD and versioning
  • Strong communication and leadership abilities
  • Experience with open-source inference engines
  • Experience with kernel languages
  • Track record of delivering products
  • Experience developing large distributed systems
  • Open-source projects showcasing engineering prowess
  • Excellent command of English language

Aufgaben

  • Identify LLM inference bottlenecks
  • Drive production speedups
  • Maximize performance for LLM architectures
  • Support and optimize inference engines
  • Implement novel speculative decoding architectures
  • Optimize dense and MoE components
  • Contribute to open-source inference engines
  • Design low-precision training pipelines
  • Productionize FP8 and NVFP4 inference
  • Improve throughput and cost-efficiency

Berufserfahrung

  • ca. 4 - 6 Jahre

Ausbildung

  • Bachelor-AbschlussODER
  • Master-Abschluss

Sprachen

  • Englischverhandlungssicher

Tools & Technologien

  • Nsight
  • PyTorch profiler
  • Python
  • CI/CD
  • vLLM
  • SGLang
  • TensorRT-LLM
  • Triton
  • Cute
  • CUTLASS
  • CUDA

Benefits

Flexibles Arbeiten

  • Flexible working arrangements

Attraktive Vergütung

  • Competitive salary

Sonstige Vorteile

  • Comprehensive benefits package

Karriere- und Weiterentwicklung

  • Professional growth opportunities

Lockere Unternehmenskultur

  • Dynamic and collaborative work environment
Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Nebius erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

  • Nebius

    Senior Backend Developer (Token Factory)(m/w/x)

    Vollzeitmit HomeofficeSenior
    Berlin
  • FactoryPal

    Senior Machine Learning Engineer(m/w/x)

    Vollzeitmit HomeofficeSenior
    Berlin
  • RepRisk AG

    Senior Machine Learning Engineer(m/w/x)

    Vollzeitmit HomeofficeSenior
    Berlin
  • AUTO1 Group

    Senior Machine Learning Platform/Ops Engineer(m/w/x)

    Vollzeitmit HomeofficeSenior
    Berlin
  • ZDF Sparks GmbH

    Senior AI Engineer(m/w/x)

    Vollzeitmit HomeofficeSenior
    Berlin
Alle 100+ ähnlichen Jobs ansehen

Nejo ist eine KI – Ergebnisse können unvollständig sein oder Fehler enthalten

Diese Jobs könnten dich auch interessieren