Skip to content
Neuer Job?Nejo!

Die KI-Suchmaschine für Jobs

WOWorkato

Senior Infrastructure Engineer - Observability(m/w/x)

Berlin, Frankfurt am Main, München
VollzeitVor OrtSenior

Designing and scaling production logging, metrics, and tracing stacks across multiple data centers and Kubernetes clusters. 8+ years industry experience with hands-on production observability systems required. Building infrastructure for an AI-powered orchestration platform.

Anforderungen

  • 8+ years industry experience
  • Solid hands-on production experience with observability systems
  • Strong plus: familiarity with OpenTelemetry, Kafka, Vector, VictoriaMetrics
  • Experience with logging pipelines: design, deployment, refactoring
  • Understanding of distributed tracing and SPM
  • Experience with Kubernetes cluster lifecycle management (EKS preferred)
  • Practical knowledge of storage trade-offs for observability data
  • Experience using AI to automate infrastructure or observability tasks
  • Familiarity with AI-assisted tooling selection and workflow integration
  • Experience with MCP (custom or open-source implementations)
  • Background in cloud account or environment migrations
  • Experience preparing infrastructure for compliance/audit processes
  • Understanding network architecture, troubleshooting, incident resolution, Post-mortems
  • Experience with containers and Kubernetes (installation, configuration of operators)
  • Basic knowledge of Python, Golang, Java
  • Good communication and collaboration skills
  • Interest in modern big distributed storage technologies, architectures
  • Good Spoken English for technical discussions
  • Balance of hands-on and analytical approaches

Aufgaben

  • Design, deploy, and maintain production observability stacks (logs, metrics, traces)
  • Scale observability infrastructure across multiple data centers and Kubernetes clusters
  • Manage logging pipeline architecture and refactoring efforts
  • Improve distributed tracing coverage
  • Drive distributed tracing adoption across engineering teams
  • Manage EKS upgrades, node exporters, agents, and collectors
  • Automate operational tasks to reduce toil and improve system stability
  • Ensure compliance and audit readiness for access controls, data handling, and pipeline integrity
  • Evaluate and adopt new observability tooling

Berufserfahrung

  • 8 Jahre

Ausbildung

  • Bachelor-AbschlussODER
  • Master-Abschluss

Sprachen

  • Englischverhandlungssicher

Tools & Technologien

  • OpenTelemetry
  • Kafka
  • Vector
  • VictoriaMetrics
  • vmagent
  • alerting rules
  • Kubernetes
  • EKS
  • Containers
  • Python
  • Golang
  • Java
  • AI
  • MCP
Die Originalanzeige dieses Stellenangebotes in der aktuellsten Version findest du hier. Nejo hat diesen Job automatisch von der Website des Unternehmens Workato erfasst und die Informationen auf Nejo mit Hilfe von KI für dich aufbereitet. Trotz sorgfältiger Analyse können einzelne Informationen unvollständig oder ungenau sein. Bitte prüfe immer alle Angaben in der Originalanzeige! Inhalte und Urheberrechte der Originalanzeige liegen beim ausschreibenden Unternehmen.

  • Workato

    Senior Infrastructure Engineer /DevOps(m/w/x)

    Vollzeitnur vor OrtSenior
    Berlin, Frankfurt am Main, München
  • Perplexity

    Senior Backend/Infrastructure Engineer - Search(m/w/x)

    Vollzeitnur vor OrtSenior
    Berlin
  • Nebius

    Senior Site Reliability Engineer — AI Studio (Inference Platform)(m/w/x)

    Vollzeitnur vor OrtSenior
    Berlin
  • Nebius

    Technical Product Manager - AI Cloud Observability(m/w/x)

    Vollzeitnur vor OrtSenior
    Berlin
  • SAP

    T2/T3 DevOps Engineer for Sovereign Cloud Onsite / ApeiroRA / EU AI Projects(m/w/x)

    Vollzeit/Teilzeitnur vor OrtSenior
    Berlin, Garching bei München, Dresden, St. Leon-Rot
Alle 100+ ähnlichen Jobs ansehen

Nejo ist eine KI – Ergebnisse können unvollständig sein oder Fehler enthalten

Diese Jobs könnten dich auch interessieren