This position is no longer open for applications

Data Engineer /IA

Data Engineer /IA (CF-34298150) Paris, France

Salaire: €60000 - €70000 an + compétitif

X



Principaux défis:

La donnée analysée par nos algorithmes et nos plateformes est essentiellement de la donnée textuelle. Nous mobilisons donc essentiellement des techniques de NLP, aujourd’hui grandement renouvelées par l’IA générative et les LLM. En tant que Data Ingénieur vous serez amené à déployer les algorithmes développés par les Data Scientists, à contribuer à leur amélioration et à assurer la maintenance des algorithmes et des services en production.

Vous aurez notamment à faire évoluer et à maintenir une architecture RAG, à développer et à maintenir les algorithmes d’ingestion et de nettoyage de données. Vous assurerez aussi le développement et la maintenance de services data interne comme l’analyse automatique des consultations, le suivi de la performance de nos campagnes d’acquisition et le suivi des métriques d’engagement sur nos plateformes.

Un des principaux défis actuellement est l'accélération du rythme d’innovation dans le domaine de l’IA générative qui nécessite une veille et une remise en cause permanente. Malgré ce progrès constant, les LLM restent des technologies récentes et transformer les progrès annoncés en applications concrètes, fiables et utiles reste un défi. Vous devrez donc tester et valider les nouvelles fonctionnalités permises par les avancées technologiques des LLM.

Nous restons une petite équipe, les Data Scientists seront donc aussi en mesure de développer une bonne partie des applications et vous travaillerez en étroite collaboration avec eux. Mais vous serez en charge de la fiabilité et de la maintenabilité des applications data.

Stack technique:

L’équipe data travaille exclusivement en python. Les algorithmes sont développés et entraînés avec les librairies standard (scikit-learn, spacy, nltk, transformers, langchain). Les analyses et les algorithmes de Data Science s’appuient sur une plateforme de collecte de données basée sur Kafka et analysable en Spark.

Nos applications sont déployées par containerisation en Docker. Nous bénéficions aussi d’une intégration continue basée sur Gitlab. Une connaissance pratique de ces technologies est un plus.

Modalités pratiques:

Date de début : à partir de Septembre 2024

Type decontrat : CDI

Localisation : Paris centre 

Télétravail: 4 jours de présentiel par mois



Vous avez plusieurs années d’expérience en développement d’application data. Les pipelines data n’ont plus de secret pour vous.

Python est votre deuxième langue maternelle, vous maîtrisez les librairies standards, vous connaissez les librairies classiques utilisées en data-science et en IA (pandas, sklearn, spacy, transformers, langchain ou llamaindex). Les bases de données n’ont pas de secrets pour vous et vous êtes à l’aise autant en SQL qu’en noSQL.

Vous êtes à l’aise avec les technologies de mise en production notamment Docker. Vous aimez tester de nouvelles librairies, intégrer de nouvelles API. Idéalement, vous avez déjà développé une application intégrant un LLM.

Vous aimez travailler en équipe dans un contexte agile. Vous aimez expérimenter pour trouver de nouvelles approches puis industrialiser vos projets pour les pérenniser.

Vous voulez rejoindre une équipe data innovante et dynamique et une aventure start-up dédiée à un projet de transformation de la société.

We are an international company, speaking english is mandatory


;