DE
DeepMind
3 Stunden

Research Scientist, Frontier(m/w/x)

Vollzeit
Berufserfahren
AI/ML Job
Data Science
Keine Angabe
Zürich

In this role, you will lead the development of cutting-edge post-training strategies for AI models, focusing on enhancing reasoning and instruction-following capabilities. You will collaborate across teams to ensure high-quality performance across different modalities.

Lass KI die perfekten Jobs für dich finden!

Lade deinen CV hoch und die Nejo-KI findet passende Stellenangebote für dich.

Anforderungen

  • PhD in machine learning, artificial intelligence, or computer science or equivalent practical experience
  • Strong background in Large Language Models, Reinforcement Learning, or preference learning
  • Research interest in aligning AI systems with human feedback and utility
  • Familiarity with experiment design and analyzing large-scale user data
  • Strong coding and communication skills
  • Experience with RLHF or DPO
  • Experience building or improving reward models and conducting human evaluation studies
  • Proven track record of publications in top-tier conferences
  • Experience with Chain-of-Thought reasoning research or process-based supervision
  • Deep understanding and experience training models from scratch or using self-play/self-improvement techniques
Doktor / Ph.D.

Berufserfahrung

ca. 1 – 4 Jahre

Deine Aufgaben

  • Design and validate novel post-training pipelines for frontier-class models
  • Lead research into next-generation Reward Models
  • Investigate new architectures for Reward Modeling
  • Reduce reward hacking in preference data
  • Improve signal-to-noise ratios in preference data
  • Develop innovative methods to enhance internal reasoning capabilities
  • Focus on correctness and logic in multi-step tasks
  • Revamp and optimize RL prompts and feedback mechanisms
  • Create robust mechanisms to convert user signals into training data
  • Collaborate across teams to apply advanced recipes to various model sizes and modalities

Sprachen

Englischverhandlungssicher

Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens DeepMind erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

Ähnliche Jobs direkt in deine Inbox?

Noch nicht perfekt?
100+ Ähnliche Jobs in Zürich
  • Lakera
    Senior Research Engineer - Security Foundation Models(m/w/x)
    Vollzeit
    Senior
    Keine Angabe
    Zürich
  • Lakera
    Research Internship(m/w/x)
    Praktikum
    Vollzeit
    Keine Angabe
    Zürich
  • Intrinsic
    Research Scientist, Deep Learning(m/w/x)
    Vollzeit
    Berufserfahren
    Keine Angabe
    Zürich
  • NVIDIA Switzerland AG
    Research Scientist, ML Systems - PhD New College Grad(m/w/x)
    Vollzeit
    Berufserfahren
    Keine Angabe
    Zürich
  • DeepMind
    Research Engineer(m/w/x)
    Vollzeit
    Berufserfahren
    Keine Angabe
    Zürich