AI Research Engineer - Reinforcement Learning(m/w/x)

Vollzeit

Remote

Berufserfahren

AI/ML Job

Data Science

Keine Angabe

Lugano

Nejo KI-Zusammenfassung

In this role, you will drive innovation in reinforcement learning by developing cutting-edge algorithms and optimizing decision-making processes. Your day-to-day responsibilities will involve running experiments, curating training datasets, and collaborating with teams to enhance AI performance in real-world applications.

Lass KI die perfekten Jobs für dich finden!

Lade deinen CV hoch und die Nejo-KI findet passende Stellenangebote für dich.

Anforderungen

•Degree in Computer Science or related field
•PhD in NLP, Machine Learning, or related field
•Solid track record in AI R&D with good publications
•Proven experience with large-scale reinforcement learning experiments
•Experience with online RL techniques such as GRPO
•Deep understanding of reinforcement learning algorithms
•Expertise in enhancing policy stability, exploration, and sample efficiency
•Strong expertise in PyTorch and relevant RL frameworks
•Practical experience in developing RL pipelines
•Demonstrated ability to apply empirical research to RL challenges
•Proficiency in designing robust evaluation frameworks

Bachelor-Abschluss

ODER

Doktor / Ph.D.

Berufserfahrung

ca. 1 – 4 Jahre

Deine Aufgaben

•Develop and implement advanced reinforcement learning algorithms
•Establish performance targets for reward maximization and policy stability
•Build, run, and monitor controlled reinforcement learning experiments
•Track key performance indicators and document results
•Identify and curate high-quality simulation environments and training datasets
•Set measurable criteria to enhance learning processes
•Debug and optimize the reinforcement learning pipeline
•Analyze computational efficiency and learning performance metrics
•Address issues like reward signal noise and policy divergence
•Collaborate with cross-functional teams to integrate reinforcement learning agents
•Define success metrics for real-world performance improvements
•Ensure continuous monitoring and iterative refinements

Tools & Technologien

PyTorch

Sprachen

Englisch – verhandlungssicher

Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Tether Operations Limited erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Ähnliche Jobs direkt in deine Inbox?

Noch nicht perfekt?

31 Ähnliche Jobs in Lugano

Tether Operations Limited
AI Research Engineer - Pre training(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Lugano
Tether Operations Limited
Senior AI Engineer - Data & Infrastructure for Multimodal Models(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Lugano
Tether Operations Limited
Lead AI Inference Engineer(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Lugano
Jobtome
Senior Site Reliability Engineer(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Mendrisio
Jobtome
Senior Backend Developer(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Mendrisio

Über Tether Operations Limited

Industrie: FinancialServices

The company pioneers a global financial revolution with blockchain solutions, enabling secure and instant digital token transactions.

Ähnliche Jobs direkt in deine Inbox?

Noch nicht perfekt?

31 Ähnliche Jobs in Lugano

Tether Operations Limited
AI Research Engineer - Pre training(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Lugano
Tether Operations Limited
Senior AI Engineer - Data & Infrastructure for Multimodal Models(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Lugano
Tether Operations Limited
Lead AI Inference Engineer(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Lugano
Jobtome
Senior Site Reliability Engineer(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Mendrisio
Jobtome
Senior Backend Developer(m/w/x)
Vollzeit
Remote
Senior
Keine Angabe
Mendrisio