Poszukujemy doświadczonego Data Engineer'a, który dołączy do zespołu naszego klienta i będzie odpowiedzialny za projektowanie, rozwój oraz utrzymanie wysoce skalowalnych i wydajnych rozwiązań Big Data. Idealny kandydat powinien posiadać silne umiejętności techniczne w zakresie PySpark oraz doświadczenie w pracy z platformą Google Cloud Platform (GCP).

Zakres obowiązków

  • Projektowanie, rozwój i utrzymanie pipeline'ów danych w oparciu o PySpark i GCP
  • Optymalizacja wydajności i skalowalności rozwiązań Big Data
  • Współpraca z zespołem Data Science i innymi działami biznesowymi
  • Monitorowanie i rozwiązywanie problemów związanych z infrastrukturą danych
  • Wdrażanie najlepszych praktyk w zakresie inżynierii danych

  • Zatrudnienie na podstawie umowy B2B na czas nieokreślony
  • Możliwość pracy w 100% zdalnie
  • Dołączysz do nowoczesnej firmy z solidną pozycją na rynku
  • Firma zapewnia nowoczesny sprzęt, oprogramowanie i konfigurację
  • Możliwość pracy w elastycznych godzinach
  • Profesjonalne doradztwo i wsparcie w rozwoju kariery od doświadczonego zespołu specjalistów 1dea
  • Cenimy sobie koleżeńskość, otwartość, szacunek, wzajemną pomoc i wsparcie w rozwijaniu kompetencji zarówno własnych, jak i kolegów i koleżanek z zespołu
  • Wspieramy kulturę kreatywności. Każdy członek zespołu ma możliwość proponowania własnych pomysłów i rozwiązań, a jego głos jest zawsze brany pod uwagę.

Wymagania

  • Solidne doświadczenie w programowaniu w PySpark (3+ lat)
  • Umiejętność zarządzania klastrami Spark
  • Bardzo dobra znajomość Google Cloud Platform (GCP)
  • Doświadczenie w implementacji kompleksowych pipeline'ów danych
  • Płynna znajomość języka angielskiego w mowie i piśmie na poziomie B2+

Mile widziane

  • Znajomość innych narzędzi i technologii Big Data (np. Hadoop, Kafka, Airflow)
  • Doświadczenie w pracy z bazami danych (SQL, NoSQL)
  • Umiejętność pracy z narzędziami do wizualizacji danych (np. Tableau, Power BI)
  • Znajomość metodologii DevOps i CI/CD