Celem projektu jest zapewnienie wysokiej dostępności, niezawodności i skalowalności międzynarodowej platformy e-commerce obsługującej miliony użytkowników dziennie. Projekt ma umożliwić szybkie wdrażanie nowych funkcjonalności bez zakłóceń w działaniu serwisu, jednocześnie redukując ryzyko awarii i przestojów.

Zakres zadań:

  • definiowanie oraz współtworzenie wskaźników SLI i SLO dla usług produkcyjnych,
  • budowanie i rozwijanie systemów obserwowalności (monitoring, alerting, metryki, logi),
  • analiza scenariuszy awarii oraz opracowywanie działań zapobiegawczych i naprawczych,
  • tworzenie i aktualizacja runbooków oraz procedur operacyjnych,
  • redukowanie pracy operacyjnej, która nie wnosi wartości — automatyzacja, optymalizacja procesów,
  • udział w procesach zarządzania incydentami,
  • ścisła współpraca z zespołami deweloperskimi i produktowymi w modelu DevOps,
  • wspieranie zespołów w podejmowaniu decyzji dotyczących architektury, wdrażania i stabilności systemów.

  • min. 5-letnie doświadczenia na podobnym stanowisku,
  • doświadczenie w zarządzaniu incydentami w środowisku produkcyjnym publicznie dostępnej usługi online,
  • asertywność, bardzo dobre umiejętności komunikacyjne oraz zdolność prowadzenia zespołów i doradzania w kwestiach stabilności produkcyjnej,
  • doświadczenie w programowaniu i tworzeniu skryptów,
  • znajomość usług serverless jednego z dostawców chmury (AWS, Azure lub GCP),
  • bardzo dobra znajomość narzędzi monitoringu: Datadog, New Relic, Dynatrace, Prometheus, Grafana,
  • doświadczenie z narzędziami CI/CD: GitHub, Azure DevOps, GitLab, Jenkins,
  • znajomość technologii konteneryzacji i mikroserwisów: Docker, Kubernetes,
  • zaawansowana znajomość j. angielskiego.

W Stackmine zajmujemy się pełnym cyklem tworzenia rozwiązań IT z obszarów aplikacji webowych, desktop oraz mobile. Realizacja projektów obejmuje wiodące technologie służące do wytwarzania oprogramowania w obszarze back-end (JAVA, C#, Python, C++, Node.js, Scala, PHP,) oraz front-end (Angular, React, Vue). Dodatkowo posiadamy doświadczenie w budowaniu zespołów z niszowymi kompetencjami np. Golang. Ponadto oferujemy szerokie doświadczenie sektorowe, co pozwala nam z sukcesem realizować projekty dla branż wymagających domenowej wiedzy.