NV
NVIDIA
Gestern

HPC and AI Software Architect(m/w/x)

Vollzeit
Berufserfahren
AI/ML Job
Keine Angabe
Zürich

In this role, you will design scalable software systems for AI training and inference while optimizing performance. You will collaborate with AI framework teams and contribute to hardware design, ensuring efficient data movement and enhancing communication libraries.

Lass KI die perfekten Jobs für dich finden!

Lade deinen CV hoch und die Nejo-KI findet passende Stellenangebote für dich.

Anforderungen

  • Ph.D. or equivalent industry experience in computer science, computer engineering, or a closely related field
  • 2+ years of experience in systems programming, parallel or distributed computing, or high-performance data movement
  • Strong programming background in C++, Python, and ideally CUDA or other GPU programming models
  • Practical experience with AI frameworks (e.g., PyTorch, TensorFlow) and familiarity with communication libraries
  • Experience in designing or optimizing software for high-throughput, low-latency systems
  • Strong collaboration skills in a multi-national, interdisciplinary environment
  • Expertise with NCCL, Gloo, UCX, or similar libraries used in distributed AI workloads
  • Background in networking and communication protocols, RDMA, collective communications, or accelerator-aware networking
  • Deep understanding of large model training, inference serving at scale, and associated communication bottlenecks
  • Knowledge of quantization, tensor/activation fusion, or memory optimization for inference
  • Familiarity with infrastructure for deployment of LLMs or transformer-based models, including sharding, pipelining, or hybrid parallelism
Doktor / Ph.D.

Berufserfahrung

2 Jahre

Deine Aufgaben

  • Design and prototype scalable software systems for distributed AI training and inference
  • Optimize throughput, latency, and memory efficiency
  • Develop and evaluate enhancements to communication libraries like NCCL, UCX, and UCC
  • Collaborate with AI framework teams to improve communication backend integration and performance
  • Co-design hardware features to accelerate data movement for inference and model serving
  • Contribute to the evolution of runtime systems and AI-specific protocol layers

Tools & Technologien

C++PythonCUDAPyTorchTensorFlowNCCLGlooUCX

Sprachen

Englischverhandlungssicher

Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens NVIDIA erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Ähnliche Jobs direkt in deine Inbox?

Noch nicht perfekt?
100+ Ähnliche Jobs in Zürich
  • NVIDIA Switzerland AG
    Principal Software Architect, GPU Networking Research(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • NVIDIA
    Deep Learning Solutions Architect – Inference Optimization(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • NVIDIA Switzerland AG
    Research Scientist, ML Systems - PhD New College Grad(m/w/x)
    Vollzeit
    Berufserfahren
    Keine Angabe
    Zürich
  • NVIDIA
    Senior Software Developer(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • Dentsply Sirona
    Senior Software Architect(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich