TE
Tether Operations Limited
13 Stunden

AI Research Engineer - Reinforcement Learning(m/w/x)

Vollzeit
Remote
Berufserfahren
AI/ML Job
Data Science
Keine Angabe
Lugano

In this role, you will drive innovation in reinforcement learning by developing cutting-edge algorithms and optimizing decision-making processes. Your day-to-day responsibilities will involve running experiments, curating training datasets, and collaborating with teams to enhance AI performance in real-world applications.

Lass KI die perfekten Jobs für dich finden!

Lade deinen CV hoch und die Nejo-KI findet passende Stellenangebote für dich.

Anforderungen

  • Degree in Computer Science or related field
  • PhD in NLP, Machine Learning, or related field
  • Solid track record in AI R&D with good publications
  • Proven experience with large-scale reinforcement learning experiments
  • Experience with online RL techniques such as GRPO
  • Deep understanding of reinforcement learning algorithms
  • Expertise in enhancing policy stability, exploration, and sample efficiency
  • Strong expertise in PyTorch and relevant RL frameworks
  • Practical experience in developing RL pipelines
  • Demonstrated ability to apply empirical research to RL challenges
  • Proficiency in designing robust evaluation frameworks
Bachelor-Abschluss
ODER
Doktor / Ph.D.

Berufserfahrung

ca. 1 – 4 Jahre

Deine Aufgaben

  • Develop and implement advanced reinforcement learning algorithms
  • Establish performance targets for reward maximization and policy stability
  • Build, run, and monitor controlled reinforcement learning experiments
  • Track key performance indicators and document results
  • Identify and curate high-quality simulation environments and training datasets
  • Set measurable criteria to enhance learning processes
  • Debug and optimize the reinforcement learning pipeline
  • Analyze computational efficiency and learning performance metrics
  • Address issues like reward signal noise and policy divergence
  • Collaborate with cross-functional teams to integrate reinforcement learning agents
  • Define success metrics for real-world performance improvements
  • Ensure continuous monitoring and iterative refinements

Tools & Technologien

PyTorch

Sprachen

Englischverhandlungssicher

Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Tether Operations Limited erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Ähnliche Jobs direkt in deine Inbox?

Noch nicht perfekt?
31 Ähnliche Jobs in Lugano
  • Tether Operations Limited
    AI Research Engineer - Pre training(m/w/x)
    Vollzeit
    Remote
    Senior
    Keine Angabe
    Lugano
  • Tether Operations Limited
    Senior AI Engineer - Data & Infrastructure for Multimodal Models(m/w/x)
    Vollzeit
    Remote
    Senior
    Keine Angabe
    Lugano
  • Tether Operations Limited
    Lead AI Inference Engineer(m/w/x)
    Vollzeit
    Remote
    Senior
    Keine Angabe
    Lugano
  • Jobtome
    Senior Site Reliability Engineer(m/w/x)
    Vollzeit
    Remote
    Senior
    Keine Angabe
    Mendrisio
  • Jobtome
    Senior Backend Developer(m/w/x)
    Vollzeit
    Remote
    Senior
    Keine Angabe
    Mendrisio