Skip to content
Neuer Job?Nejo!

Dein persönlicher KI-Karriere-Agent

TETether

Senior AI Inference Engineer(m/w/x)

Lugano
VollzeitRemoteSenior
AI/ML

Optimizing C++ systems for AI inference runtime at a fintech firm for digital asset tokenization. Strong Llama.cpp and ggml inference engine experience required. Remote work.

Anforderungen

  • Excellent C++ programming skills
  • Javascript experience (bonus)
  • Strong Llama.cpp and ggml inference engine experience
  • Good deep learning concepts and model architectures understanding
  • Experience with transformers, LLMs, Diffusion models
  • Ability to rapidly assimilate new technologies and techniques
  • Degree in Computer Science, AI, Machine Learning, or related field
  • Solid track record in AI R&D
  • Javascript/Typescript experience
  • Understanding of p2p technology difficulties, nuances, and importance
  • Experience with Vulkan, Metal, or OpenCL
  • Experience productionizing models

Aufgaben

  • Manage C++ systems for AI inference.
  • Ensure fast, reliable, and predictable model execution.
  • Engineer runtime quality for AI models.
  • Optimize startup behavior and memory pressure.
  • Balance throughput and latency.
  • Ensure long-session stability.
  • Define and evolve core inference abstractions.
  • Deploy machine learning models to edge devices.
  • Utilize llama.cpp, ggml, and onnx frameworks.
  • Collaborate with researchers on model development.
  • Assist with coding and training models.
  • Transition models from research to production.
  • Integrate AI features into existing products.

Berufserfahrung

  • ca. 4 - 6 Jahre

Ausbildung

  • Bachelor-Abschluss

Sprachen

  • Englischverhandlungssicher

Tools & Technologien

  • C++
  • Javascript
  • Llama.cpp
  • ggml
  • transformers
  • LLMs
  • Diffusion models
  • Typescript
  • p2p technology
  • Vulkan
  • Metal
  • OpenCL

Benefits

Flexibles Arbeiten

  • Remote work
Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Tether erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

  • lastminute.com

    Head of Data Platform Engineering(m/w/x)

    Vollzeitmit HomeofficeManagement
    Chiasso
  • ABB AG

    R&D Senior Engineer Firmware(m/w/x)

    Vollzeitmit HomeofficeSenior
    Quartino
  • Jobtome

    Senior Site Reliability Engineer(m/w/x)

    VollzeitRemoteSenior
    Mendrisio
  • Tether Operations Limited

    Technical Product Manager - Hadron(m/w/x)

    VollzeitRemoteSenior
    Lugano
  • Jobtome

    Senior Backend Developer(m/w/x)

    VollzeitRemoteSenior
    Mendrisio
Alle 50+ ähnlichen Jobs ansehen

Nejo ist eine KI – Ergebnisse können unvollständig sein oder Fehler enthalten

Diese Jobs könnten dich auch interessieren