NV
NVIDIA
25 Tage

Deep Learning Solutions Architect – Inference Optimization(m/w/x)

Vollzeit
Senior
AI/ML Job
Data Science
Keine Angabe
Zürich

In this role, you will engage with key customers to deliver tailored AI solutions while optimizing performance on advanced GPU systems. Your work will involve collaboration across teams and gathering insights to drive product development.

Lass KI die perfekten Jobs für dich finden!

Lade deinen CV hoch und die Nejo-KI findet passende Stellenangebote für dich.

Anforderungen

  • MS/PhD or equivalent experience in Computer Science, Data Science, Electrical/Computer Engineering, Physics, Mathematics, or other Engineering fields
  • 5+ years work or research experience with Python, C++, or other software development
  • Work experience and knowledge of modern NLP including understanding of transformer, state space, diffusion, MOE model architectures
  • Understanding of key libraries used for NLP/LLM training and/or deployment
  • Proficient with DevOps tools including Docker, Kubernetes, and Singularity
  • Demonstrated experience in running and debugging large-scale distributed deep learning training or inference processes
  • Experience working with larger transformer-based architectures for NLP, CV, ASR, or other
  • Applied NLP technology in production environments
  • Enthusiasm for collaborating with various teams and departments
  • Self-starter with demeanor for growth and passion for continuous learning
Master-Abschluss
ODER
Doktor / Ph.D.

Berufserfahrung

5 Jahre

Deine Aufgaben

  • Work directly with key customers to understand their technology
  • Provide optimal AI solutions for customer needs
  • Analyze and optimize performance on GPU architecture systems
  • Support optimization of large-scale inference pipelines
  • Collaborate with Engineering, Product, and Sales teams
  • Develop and plan suitable solutions based on customer requirements
  • Gather customer feedback to enhance product features
  • Conduct proof-of-concept evaluations

Tools & Technologien

TRT LLMvLLMSGLangPythonC++Megatron-LMNeMoDeepSpeedTensorRT-LLMTriton Inference ServerDockerKubernetesSingularity

Sprachen

Englischverhandlungssicher

Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens NVIDIA erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Ähnliche Jobs direkt in deine Inbox?

Noch nicht perfekt?
100+ Ähnliche Jobs in Zürich
  • NVIDIA Switzerland AG
    Principal Software Architect, GPU Networking Research(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • Red Hat (Switzerland) SARL
    Senior Machine Learning Engineer - Red Hat Inference(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • NVIDIA
    Senior Software Developer(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • RepRisk AG
    Senior AI Engineer(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • Databricks
    Delivery Solutions Architect(m/w/x)
    Vollzeit
    mit Homeoffice
    Senior
    Keine Angabe
    Zürich