Facendo parte di un team di assistenza e riportando al suo Operations Team Leader, sarete responsabili della stabilità e della qualità del servizio fornito ai nostri clienti, lavorando in un ambiente esigente in termini di sicurezza e disponibilità. Sarà inoltre responsabile di garantire l'affidabilità, le prestazioni e l'evoluzione delle nostre applicazioni e dei servizi cloud.
MISSIONI :
In qualità di Site Reliability Engineer (SRE), avrete le seguenti responsabilità:
Progettazione e sviluppo dell'infrastruttura
- Progettare, implementare e aggiornare la nostra infrastruttura cloud (principalmente AWS) in linea con i principi di alta disponibilità e scalabilità.
- Implementare e mantenere le nostre soluzioni Infrastructure as Code tramite Terraform e CloudFormation.
- Ottimizzazione dell'architettura dei container Docker e dell'orchestrazione Kubernetes per massimizzare le prestazioni e la resilienza.
- Partecipare attivamente alla scelta di un'architettura tecnica con un approccio cloud-nativo.
Affidabilità e prestazioni del sistema
- Definire, implementare e monitorare SLI, SLO e SLA per tutti i nostri servizi critici.
- Implementare una strategia di osservabilità completa (monitoraggio, logging, alerting, tracing).
- Analizzare le prestazioni delle applicazioni e ottimizzare le risorse per migliorare l'esperienza dell'utente.
- Effettuare analisi post-incidente (post-mortem senza colpevoli) e implementare i miglioramenti individuati
- Introdurre pratiche di Chaos Engineering per testare in modo proattivo la resilienza dei sistemi.
Automazione ed eccellenza operativa
- Sviluppare e mantenere pipeline CI/CD robuste e sicure (GitLab CI, Jenkins)
- Automatizzare sistematicamente le attività ricorrenti per ridurre la fatica operativa.
- Produrre una documentazione tecnica chiara, pertinente e accessibile per facilitare l'inserimento e gli interventi.
Sicurezza e governance
- Collaborare con il team di sicurezza per implementare le migliori pratiche nell'infrastruttura.
- Garantire che le implementazioni siano conformi agli standard di sicurezza e ai requisiti normativi.
- Mantenere un sistema sicuro di gestione degli accessi e delle identità
- Partecipare agli audit tecnici e contribuire al miglioramento continuo dei processi di sicurezza.
Competenze tecniche :
- Solida conoscenza delle architetture IT, dei sistemi UNIX/Linux e delle reti IP.
- Competenze avanzate in infrastrutture virtualizzate (VMWare, Hyper-V)
- Conoscenza di almeno un linguaggio di programmazione o scripting (Python, Bash, Powershell, PHP, Go ecc.)
- Buona conoscenza di Git, CI/CD (GitLab) e degli strumenti Docker
- Conoscenza di almeno una tecnologia IAC come Puppet, Chef, Salt, Ansible e Terraform.
- Esperienza nel monitoraggio e nella gestione delle prestazioni dei servizi IT.
Competenze linguisticheFluidità nell'inglese e nel francese scritti e parlati.
Esperienza prevista:
- Esperienza significativa (minimo 10 anni) in ingegneria di produzione e cloudOps.
- Buona conoscenza degli ambienti cloud pubblici (Azure, AWS, GCP), esperienza con le tecnologie di supervisione e monitoraggio (Nagios, ELK, Prometheus, Grafana, ecc.).
Aree di competenza:
- Esperienza nelle pratiche DevOps per applicazioni Cloud Native (idealmente con Kubernetes).
- Conoscenza di un linguaggio di scripting o di programmazione e di almeno una tecnologia infrastructure-as-code.
Competenze attese :
Capacità di lavorare in un ambiente dinamico, adattabilità e forti capacità organizzative.
Ulteriori vantaggi:
- Certificazioni pertinenti in ambito cloud, DevOps o sicurezza.
- Esperienza nell'implementazione di pratiche di Site Reliability Engineering (SRE).
- Partecipazione a progetti open source o contributi alla comunità tecnologica.
Sceglieteci per :
- La nostra posizione di leader in un settore in rapida crescita
- Assistenza e coaching da parte di colleghi esperti
- La nostra organizzazione innovativa, che vi consentirà di progredire all'interno del Gruppo
- I nostri sistemi di allenamento tecnico e funzionale
- I nostri eventi collaborativi
- Il nostro programma di cooptazione e mobilità
- Il nostro programma di qualità della vita lavorativa (telelavoro, servizi per i dipendenti, impegni di CSR, ecc.)
- E sempre: partecipazione agli utili, assicurazione mutualistica/malattia, carta TR, comitato sociale ed economico, RTT, ecc.
- Se sei alla ricerca di una vita professionale gratificante, vieni a costruire la tua carriera in Cloud Temple!
- La vostra passione, il vostro impegno e il vostro successo verranno valorizzati
Cloud Temple si impegna a promuovere la diversità. Questa posizione è aperta a lavoratori disabili con pari competenze.
-
Localizzazione :
- Lione
- Salaire : Secondo la scala attuale
- Esperienza : Minimo 10 anni
- Tipo di contratto : CONTRATTO A TEMPO INDETERMINATO