Neuer Job?Nejo!

Dein persönlicher KI-Karriere-Agent

ALAleph Alpha

vor 3 Monaten

Senior AI Researcher- Reinforcement learning(m/w/x)

Heidelberg

Vollzeitmit HomeofficeSenior

AI/ML

Nejo KI-Zusammenfassung

Jetzt bewerben

Large-scale experiments and code-base maintenance for general-purpose model methodology at AI lab with 50+ researchers. Proven experience in multi-node LLM training and RL theory required. Virtual Stock Option Plan, 30 days vacation.

Anforderungen

Deep understanding of Reinforcement Learning theory
Experience with multi-node LLM training
Familiarity with statistical evaluation methods
Ability to analyze evaluation environments
Strong Python and ML tooling skills
Willingness to relocate or travel
PhD in RL or equivalent research
Contributions to top-tier RL venues
Experience evaluating LLM models

Aufgaben

Shape and improve underlying RL methodology
Maintain a high-quality training code-base
Conduct large-scale reinforcement learning experiments
Derive hypotheses from experimental results
Iterate on implementation and methodology
Execute large-scale LLM training runs
Analyze evaluation scores in depth
Propose and implement performance improvements
Maximize performance on internal benchmarks
Identify and implement novel multi-turn RL approaches
Stay current with bleeding-edge RL research
Identify and resolve training infrastructure bottlenecks
Optimize RL loops for large-scale training
Partner with post-training teams on feedback
Convert raw feedback into actionable training signals
Ensure RL iterations improve downstream performance

Berufserfahrung

ca. 4 - 6 Jahre

Ausbildung

Doktor / Ph.D.

Sprachen

Englisch – verhandlungssicher

Tools & Technologien

Python
torch distributed
LLM
ML tooling

Benefits

Flexibles Arbeiten

Flexible working hours
Hybrid working model

Attraktive Vergütung

Virtual Stock Option Plan

Mehr Urlaubstage

30 days paid vacation

Gesundheits- & Fitnessangebote

Fitness & wellness offerings

Mentale Gesundheitsförderung

Mental health support

Betriebliche Altersvorsorge

Subsidized company pension plan

Öffi Tickets

Subsidized transportation ticket

Sonstige Zulagen

Technical equipment budget

Firmenfahrrad

JobRad Bike Lease

Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Aleph Alpha erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Gefällt dir diese Stelle?

Beta

Dein Career Agent findet täglich ähnliche Jobs für dich.

Noch nicht perfekt?

Aleph Alpha
Senior AI Researcher - Pre-training Data(m/w/x)
Vollzeitmit HomeofficeSenior
Heidelberg
Aleph Alpha
Senior AI Software Engineer – Model Training(m/w/x)
Vollzeitmit HomeofficeSenior
Heidelberg, Berlin
Aleph Alpha
Senior AI Software Engineer - Model Evaluation(m/w/x)
Vollzeitmit HomeofficeSenior
Heidelberg
Aleph Alpha
Senior AI Engineer – Pre-training Data(m/w/x)
Vollzeitmit HomeofficeSenior
Heidelberg
Buhl Data Service GmbH
Senior AI / Data Science Engineer(m/w/x)
Vollzeitmit HomeofficeSenior
Mannheim

Alle 100+ ähnlichen Jobs ansehen

ALAleph Alpha

vor 3 Monaten