Company:
Mirakl - Labs
Location: Bordeaux
Closing Date: 05/08/2024
Salary: £40 - £60 Per Annum
Type: Temporary
Job Requirements / Description
A propos du job
La solution SaaS Mirakl est le moteur des marketplaces des plus importants e-commerçants à travers le monde. Cette solution gère et produit de gros volumes de données qui présentent des challenges extrêmement intéressants pour les spécialistes de la donnée (produits, commandes, clients, niveaux de stock, prix, messages, appels API, données de navigation, séries temporelles, données géolocalisées etc.).
En tant que (Senior) Data Engineer au sein de l’équipe Data Mirakl, vos principales missions seront de :
contribuer à l'enrichissement de la Data Platform (ETL)
améliorer la robustesse de nos pipelines de production pour nos applications Machine Learning (inférence real time etc.)
Intégré(e) dans une équipe de spécialistes de la donnée (data engineers, machine learning engineers, data scientists, data analysts), vous êtes un des acteurs clés pour garantir la place de Mirakl comme solution dominante sur son marché.
Notre stack et nos outils
Apache Spark, Kafka, AWS, Databricks, Python, Airflow, Mlflow, Tensorflow, Delta lake, Superset, Kubernetes, Redshift, SQL, Terraform, Ansible
Au quotidien, vous allez :
Participer à la définition et à l’implémentation d’une architecture performante, robuste, scalable et aux coûts maîtrisés pour nos applications Spark ainsi que pour nos pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow)
Accompagner les Data Scientists lors de leur mise en production (relecture de code, pair programming) et mettre en place les best practices
Optimiser et améliorer la CI/CD de l’équipe en collaboration avec l’équipe SRE
Assurer la montée en compétence des membres de l’équipe sur les sujets de MLOps et Data Engineering
Réfléchir à la meilleure façon d'intégrer les données Google Analytics dans la data platform
Partager ses connaissances et présenter les travaux devant toutes les équipes Labs
Ce qu’on peut vous apporter :
Des projets data driven, divers et variés (traitements massifs d’images, de textes, time series etc.) pour des produits différents de Mirakl
Une culture orientée sur la veille technologique
Des projets qui ont un vrai impact business devant être déployés sur des centaines de clients dans un contexte multilingue
Quelques exemples de sujets en cours :
Enrichissement des données produit à partir des images et des descriptions
Modération automatique des produits
Mapping automatique des données produit
Identification des produits à fort potentiels
Détection de comportements frauduleux
Sentiment analysis sur les messages échangés entre clients et vendeurs et dans les évaluations
Détermination de prix optimaux
Monitoring de la qualité de service des vendeurs
Des applications d’inférence en synchrone de nos modèles de ML
Vous aimerez ce job si :
Vous êtes passionné(e) par la data et les technologies modernes permettant d'en tirer partie
Vous vous intéressez à la data science et avez des connaissances générales sur les algorithmes de Machine Learning
Vous avez un background en développement et avez évolué dans un environnement Data
Vous avez a minima 4 ans d’expérience en environnement Machine Learning et/ou Data
Vous avez mis en production avec succès des applications Big Data faisant appel à du Machine Learning, du NLP, du traitement d’images dans des projets d'envergure, à fort volume de données
Votre maîtrisez Python, êtes un pro des frameworks data de la fondation Apache et êtes à l'aise dans un environnement AWS
Vous maîtrisez au moins un outil d’orchestration (Airflow, Data Pipeline ou tout autre outil similaire)
Vous présentez vos travaux de manière simple et accessible
Vous faîtes preuve d'un bon relationnel et vous aimez mentorer des collaborateurs
Vous parlez couramment anglais et français
Les plus pour le poste :
Vous avez une expérience significative dans le domaine du e-commerce
Vous avez déjà mis en place un Data Lake, Data Warehouse ou une Data Platform
Vous avez déployé des applicatifs en environnement Kubernetes
Vous avez mis en place des pipelines d'ingestion de données avec une approche CDC à l'aide de Debezium ou autre
Vous maîtrisez Java/Scala
#J-18808-Ljbffr
Share this job
Mirakl - Labs
Useful Links