(Senior) Data Engineer

Company:  Mirakl - Labs
Location: Bordeaux
Closing Date: 05/08/2024
Salary: £40 - £60 Per Annum
Type: Temporary
Job Requirements / Description
A propos du job La solution SaaS Mirakl est le moteur des marketplaces des plus importants e-commerçants à travers le monde. Cette solution gère et produit de gros volumes de données qui présentent des challenges extrêmement intéressants pour les spécialistes de la donnée (produits, commandes, clients, niveaux de stock, prix, messages, appels API, données de navigation, séries temporelles, données géolocalisées etc.). En tant que (Senior) Data Engineer au sein de l’équipe Data Mirakl, vos principales missions seront de : contribuer à l'enrichissement de la Data Platform (ETL) améliorer la robustesse de nos pipelines de production pour nos applications Machine Learning (inférence real time etc.) Intégré(e) dans une équipe de spécialistes de la donnée (data engineers, machine learning engineers, data scientists, data analysts), vous êtes un des acteurs clés pour garantir la place de Mirakl comme solution dominante sur son marché. Notre stack et nos outils Apache Spark, Kafka, AWS, Databricks, Python, Airflow, Mlflow, Tensorflow, Delta lake, Superset, Kubernetes, Redshift, SQL, Terraform, Ansible Au quotidien, vous allez : Participer à la définition et à l’implémentation d’une architecture performante, robuste, scalable et aux coûts maîtrisés pour nos applications Spark ainsi que pour nos pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow) Accompagner les Data Scientists lors de leur mise en production (relecture de code, pair programming) et mettre en place les best practices Optimiser et améliorer la CI/CD de l’équipe en collaboration avec l’équipe SRE Assurer la montée en compétence des membres de l’équipe sur les sujets de MLOps et Data Engineering Réfléchir à la meilleure façon d'intégrer les données Google Analytics dans la data platform Partager ses connaissances et présenter les travaux devant toutes les équipes Labs Ce qu’on peut vous apporter : Des projets data driven, divers et variés (traitements massifs d’images, de textes, time series etc.) pour des produits différents de Mirakl Une culture orientée sur la veille technologique Des projets qui ont un vrai impact business devant être déployés sur des centaines de clients dans un contexte multilingue Quelques exemples de sujets en cours : Enrichissement des données produit à partir des images et des descriptions Modération automatique des produits Mapping automatique des données produit Identification des produits à fort potentiels Détection de comportements frauduleux Sentiment analysis sur les messages échangés entre clients et vendeurs et dans les évaluations Détermination de prix optimaux Monitoring de la qualité de service des vendeurs Des applications d’inférence en synchrone de nos modèles de ML Vous aimerez ce job si : Vous êtes passionné(e) par la data et les technologies modernes permettant d'en tirer partie Vous vous intéressez à la data science et avez des connaissances générales sur les algorithmes de Machine Learning Vous avez un background en développement et avez évolué dans un environnement Data Vous avez a minima 4 ans d’expérience en environnement Machine Learning et/ou Data Vous avez mis en production avec succès des applications Big Data faisant appel à du Machine Learning, du NLP, du traitement d’images dans des projets d'envergure, à fort volume de données Votre maîtrisez Python, êtes un pro des frameworks data de la fondation Apache et êtes à l'aise dans un environnement AWS Vous maîtrisez au moins un outil d’orchestration (Airflow, Data Pipeline ou tout autre outil similaire) Vous présentez vos travaux de manière simple et accessible Vous faîtes preuve d'un bon relationnel et vous aimez mentorer des collaborateurs Vous parlez couramment anglais et français Les plus pour le poste : Vous avez une expérience significative dans le domaine du e-commerce Vous avez déjà mis en place un Data Lake, Data Warehouse ou une Data Platform Vous avez déployé des applicatifs en environnement Kubernetes Vous avez mis en place des pipelines d'ingestion de données avec une approche CDC à l'aide de Debezium ou autre Vous maîtrisez Java/Scala #J-18808-Ljbffr
Apply Now
Share this job
Mirakl - Labs
  • Similar Jobs

  • Senior Data Engineer (F/M)

    Bordeaux
    View Job
  • Data Engineer Senior - F/M/X

    Bordeaux
    View Job
  • Data engineer (senior) - h/f/x

    Bordeaux
    View Job
  • Senior Big Data Engineer – BORDEAUX, FRANCE – Internet

    Bordeaux
    View Job
  • Data Engineer BI

    Bordeaux
    View Job
An unhandled exception has occurred. See browser dev tools for details. Reload 🗙