Stage Data Scientist (H/F) - Boulogne-Billancourt
propos de GERS DATA :
Filiale du Groupe CEGEDIM, GERS DATA est spécialisée dans la collecte,
l’agrégation et l’analyse de données dans le secteur de la santé.
GERS DATA offre une très large gamme de solutions aux
acteurs de l’industrie pharmaceutique (grossistes / groupements / laboratoires
/ pharmacies).
En tant que partenaire de confiance des acteurs de la santé,
GERS DATA contribue à l'amélioration de la connaissance du marché
pharmaceutique et à l'optimisation des performances des acteurs du secteur.
GERS DATA, filiale du groupe Cegedim met à disposition les statistiques de vente des médicaments et produits de santé, conçoit et réalise des études et des outils à la pointe des technologies les plus innovantes.
Au sein d’un département en plein essor, votre objectif principal sera de concevoir et implémenter un algorithme de prévision des
ventes hebdomadaires des produits pharmaceutiques sur un horizon d’une semaine
et d’un mois.
Ce projet s'inscrit dans un contexte opérationnel lié à la
production d'indicateurs statistiques sur les ventes en pharmacie, souvent
perturbée par des flux de données incomplets ou retardés.
L’objectif est de pallier ces aléas en développant un modèle
robuste de prévision et d’interpolation des données manquantes.
Vos Missions :
1. Analyse exploratoire des données :
- Exploration des tendances globales et des schémas récurrents dans les séries temporelles.
- Segmentation des séries pour détecter des patterns spécifiques ou saisonniers.
2. Gestion de la qualité des données :
- Identification des anomalies, valeurs manquantes ou incohérences dans les séries temporelles.
- Complétion des données historiques avec des modèles d’interpolation adaptés.
3. Développement des modèles de prévision :
- Modèles de séries temporelles unitaires, utilisés comme référence pour des approches plus complexes.
- Modèles d’apprentissage supervisé, exploitant les séries temporelles multiples et intégrant un feature engineering avancé.
4. Mise en place de métriques et d’indicateurs d’évaluation pour suivre les performances des modèles.
5. Rédaction d’un rapport et de supports de présentation pour communiquer les résultats.
Ce stage s’inscrit dans le cadre
d’une formation Bac+ 4 ou Bac+ 5 en Data Science, IA, Statistiques,
Mathématiques, Informatique ou équivalent.
Les qualités requises sont les
suivantes :
·
Esprit d’analyse et de synthèse
·
Maîtrise de Python et SQL.
·
Connaissances en machine learning.
·
La connaissance des séries temporelles est un
plus.
·
Intérêt pour les problématiques de Data Science
dans le secteur de la distribution.
Stage d'une durée 6 mois.
Poste basé à Boulogne-Billancourt.
Pourquoi nous rejoindre ?
·
Intégration dans une unité de production de données en
pleine activité.
- Collaboration avec des experts en Data Science et des spécialistes du
secteur pharmaceutique.
- Accès à une base de
données interne, offrant une source exclusive et spécialisée en données de
distribution pharmaceutique.
- Un projet de bout en bout, de la conception à la mise en production.