Voté le job le plus sexy du 21e siècle par la Harvard Business Review, le Data Scientist est la nouvelle star du recrutement tech !

Au delà d’un simple “buzzword”, ce métier de la donnée apporte un véritable avantage concurrentiel aux entreprises, en leur permettant d’optimiser leurs activités et de prendre des décisions éclairées.

Cet expert technique maîtrise aussi bien les rouages du code que ceux des statistiques, de l’intelligence artificielle et du machine learning. Grâce à ces compétences, il pourra construire des modèles d’analyse et de prédiction dans le but de répondre à une problématique business 🔮

Pour autant, ce recrutement doit répondre à une véritable stratégie plutôt qu’à un effet de mode. Découvrez, dans cet article, les clés d’un recrutement de Data Scientist réussi !

Bien préparer le recrutement de profils Data

C’est un fait souvent ignoré … Le Data Scientist n’a pas le monopole de la donnée. D’autres professions évoluent à ses côtés comme celles de Data Analyst et de Data Engineer.

Pour naviguer parmi ces spécialisations, il faut d’abord comprendre l’utilisation faite de la donnée en entreprise.

Comprendre les usages de la donnée en entreprise

La Data Science, c’est quoi exactement ? Il s’agit tout simplement de l’ensemble des stratégies pour étudier, comprendre et utiliser la donnée au sein d’une organisation.

Prenons quelques exemples sectoriels d’utilisation de la Data Science dans :

  • L’industrie financière, pour prédire les fluctuations des marchés ;
  • La logistique, pour calculer les chemins les plus rapides et rentables pour les transporteurs ;
  • La publicité, pour cibler une audience de façon très précise (démographie, habitudes de consommation…) ;
  • La recherche médicale pour construire des modèles variés à des fins de tests ;
  • La traduction automatique de médias grâce à l’intelligence artificielle et à des bases de données disponibles de nombreuses langues ;
  • Les places de marché avec la création de moteurs de recommandation, se basant sur les comportements des utilisateurs (comme Malt).

Pour mener à bien leurs missions, les professionnels de la donnée (Data Scientist, Data Engineer ou Data Analyst) doivent détenir un bagage technique fort en statistiques, programmation (code), machine learning et/ou intelligence artificielle.

Une des branches de la Data Science permet de traiter un volume très large de données : il s’agit du Big Data.

Vous avez certainement entendu parlé de ce terme, qui désigne une donnée d’un certain genre (répondant aux “5 V”) :

#1 : Volume

La quantité de données doit être très élevée pour que l’on puisse parler de Big Data.

On peut penser aux requêtes sur les réseaux sociaux par exemple. Imaginez la quantité d’actions opérées par les utilisateurs qui aiment, commentent et partagent des contenus sur Facebook, Instagram ou encore YouTube. Ces interactions sont autant de données à traiter côté serveur !

#2 : Vélocité

Les données de la Big Data sont nombreuses sur de très courtes périodes de temps.

Reprenons l’exemple de YouTube. Plus de 500 heures de vidéos sont mises en ligne, sur la plateforme, chaque minute !

#3 : Variété 

Les données de la Big Data sont variées : ainsi, les images, textes, fichiers, vidéos, requêtes … proviennent d’une multitude d’utilisateurs.

#4 : Véracité

Au regard du large volume d’information qui compose le Big Data, les données ne sont pas toujours exactes ni propres. Il faut accepter cette imperfection, et tenter de travailler en connaissance des biais potentiels.

#5 : Valeur 

La donnée doit avoir une valeur : elle doit être exploitable pour répondre à des objectifs d’optimisation, de prédiction ou d’analyse et trouver des usages spécifiques.

La Big Data peut sembler intimidante, surtout si votre organisation traite un faible volume de données au quotidien. Pour autant, il ne faut pas faire l’amalgame avec la Data Science, dont les usages sont plus accessibles.

Si vous n’avez pas encore d’idées sur l’utilisation des données par votre équipe, pensez à recruter un consultant spécialiste de la donnée afin de créer un plan d’action.

Le recrutement d’un Data Scientist, Data Analyst ou Data Engineer ne sera pertinent que lorsque vous aurez un plan d’action concret !

Préparer sa donnée en amont de l’arrivée d’un Data Scientist

Voici le parcours de la donnée, au sein d’une démarche de Data Science :

Data Acquisition : les données sont collectées et stockées (via des serveurs, bases de données, APIs, logs et repositories)

Data Preparation : cette étape consiste à nettoyer et à préparer la donnée. Cela prend du temps (typographies des attributs, inconsistance des “datatypes”, valeurs dupliquées). Puis, ces ensembles de données (dataset) sont transformés (avec des logiciels comme Talend ou Informatica)

Data Analysis : à ce stade, l’équipe s’accorde sur les variables et types de données à utiliser pour répondre à un problème ou à un objectif spécifique.

Data Modeling : le Data Scientist va ensuite construire un ou plusieurs modèles en utilisant les statistiques (tels que des arbres à décision) le machine learning (avec des algorithmes) et l’intelligence artificielle. La maîtrise de Python ou R est recommandée.

Visualization et Communication : les résultats de la modélisation des données sont présentés dans des rapports, tableaux ou dashboards. Il est ainsi plus facile – pour des profils non techniques – de se servir de la Data.

Déploiement : en dernier lieu, le modèle qui a fait ses preuves en pré-production est déployé (connecté au reste des applications) pour pouvoir traiter et analyser les données en temps réel.

S’en suivent des tâches de maintenance, analyse des performances et itérations du modèle. La démarche de Data Science est continue !

Le Data Scientist n’a pas le monopole de ces différentes tâches, qu’il convient d’ailleurs de séparer. Il faut donc prévoir une équipe diversifiée, étant donnée l’ampleur du travail :

  • le Data Engineer sera chargé de la manipulation et du traitement des données ;
  • le Data Analyse réalisera l’analyse descriptive et exploratoire des données ; 
  • le Data Scientist s’occupera de la modélisation des données et du déploiement d’algorithmes de machine learning. 

Constituer son équipe de professionnels de la Data Science

Quels sont les professionnels capables de déployer votre stratégie en Data Science ?

Recruter un Data analyst pour travailler la donnée et répondre à des problématiques business précises

Le Data Analyst se concentre sur un périmètre restreint : il fait parler la donnée pour prendre des décisions sur des sujets déterminés à l’avance.

Ce professionnel a des connaissances fines sur les différents types de données (provenant par exemple de l’utilisation d’un produit, de performances business, de clients via un CRM…).

La Big Data n’a aucun secret pour lui : il est capable de tirer des conclusions sur l’évolution, la stagnation ou la régression d’une entreprise à partir d’un large volume de données, et de dégager des bilans ou propositions pour améliorer les résultats.

Au quotidien, il se sert d’outils comme Hadoop, Spark, Matlab, Excel ou Python. Malgré son profil orienté business, le Code ne lui fait pas peur, les statistiques non plus ! Un socle technique est donc nécessaire pour accéder à ce poste.

Recruter un Data engineer pour construire une infrastructure de gestion de la donnée

Le Data Engineer intervient au démarrage d’un projet. Cet expert en génie logiciel est responsable de la construction d’un système permettant de mobiliser la donnée facilement.

Il est en charge du développement, du test et de la maintenance des “frames” de data (bases de données et systèmes de traitement de cette donnée).

Son expertise couvre le champ de la R&D, la construction d’un prototype (POC) à des fins de test, et le déploiement d’une solution à l’échelle.

Il utilise des langages de code tels que Python et R mais connaît également les plateformes de Cloud (Google Cloud, Amazon Web Services, etc…).

Recruter un Data scientist pour interpréter la donnée grâce à la construction de modèles

Le Data Scientist développe des modèles pour donner du sens à de larges volumes de données.

Son champ d’action est large et varié. Il possède des compétences approfondies en statistique multivariée, en intelligence artificielle (machine learning et deep learning), en analyse prédictive et en programmation / code.

Le Data Scientist est en charge de développer, en interne, des solutions prédictives (algorithmes) pour anticiper certaines performances et ainsi apporter de la valeur ajoutée aux services et produits de l’entreprise.

Enfin, le Data Scientist est responsable du reporting auprès de l’équipe business (chef d’entreprise, board, directeurs, C-suite) afin de présenter les avancées réalisées grâce à la maîtrise de la Data. Il est, en quelques sortes, l’ambassadeur de la donnée dans son organisation.

Data Scientist Data Analyst Data Engineer
Data Architecture
Data Collection
Data Preparation
Statistiques
Code (Langage de programmation)
Génie Logiciel
Data Visualization et Communication
Machine Learning
Intelligence artificielle
Présentation business

En réalité, les profils que vous rencontrerez ne rentreront peut-être pas dans ces cases, de façon exacte.

À vous de rédiger une fiche de poste (pour le recrutement d’un salarié) ou un brief technique (s’il s’agit d’un recrutement de freelance) afin d’identifier le professionnel en mesure de vous accompagner.

Enfin, ne sous-estimez pas la charge de travail liée à votre démarche de Data Science. Peut-être aurez-vous besoin d’une équipe pluri-disciplinaire (Data Scientist, Data Engineer ET Data Analyst), ou de plusieurs talents se partageant un même périmètre d’action.

Analyser les besoins de son entreprise pour un recrutement aligné

Tout d’abord, songez aux livrables dont vous avez besoin. S’agit-il de la construction de “frames” ? De l’analyse de votre Data ? De l’utilisation du machine learning ?

Ensuite, à partir de ces livrables, déclinez les technologies (langages de programmation, framework, logiciels) à maîtriser pour relever le défi !

Enfin, calculez l’investissement nécessaire par rapport à vos ambitions. Notez qu’un profil de Data Scientist facture, en moyenne, 590€ HT / jour en freelance.

Le temps passé par votre nouvelle recrue dépendra du niveau de développement envisagé (démarrage d’un projet à partir de zéro, poursuite de travaux déjà bien entamés, passation suite à un départ …). Cependant, il s’agira toujours d’un projet long. À titre d’exemple, les missions de Data Science via Malt ont une durée moyenne de 30 jours.

Réussir le recrutement d’un Data Scientist

Attendre le bon moment pour recruter un profil Data

Le rôle du Data Scientist n’est pas d’indiquer ce qu’il faut faire avec la donnée. Les objectifs et grands enjeux doivent être identifiés avant son arrivée.

De plus, la data doit être prête, c’est à dire collectée en quantités suffisantes et stockée de façon à être mobilisée avec aisance.

La Data doit être de qualité, et pertinente par rapport aux conclusions que vous souhaitez en tirer.

Enfin, assurez-vous d’avoir le feu vert – côté budgétaire – pour le recrutement de votre Data Scientist. Le coût est élevé, et la mission longue. Vous devez prévoir un budget solide.

Recruter un bon Data Scientist : les compétences et soft skills indispensables

Aux premiers abords, il semblerait que le Data Scientist soit un mouton à 5 pattes.

Peut-on vraiment recruter un professionnel maîtrisant à la fois les aspects techniques liés à la donnée, et comprenant les enjeux business ?

La réponse est oui ! Cependant, il faut savoir repérer les bons Data Scientists et agir vite. La demande est forte, les candidats sont peu nombreux.

En effet, il existe une véritable guerre des talents autour des métiers de la Data. En général, ces profils sont des ingénieurs ayant un peu de séniorité.

Il existe des parcours, en école d’ingénieur ou de développement web, dédiés à la Data. D’autres professionnels se forment au fil des missions, en ayant tout de même un bagage technique important.

Il doit aussi avoir un esprit d’analyse et de synthèse, s’intéresser aux produits et services de son entreprise et comprendre son marché afin d’explorer la donnée de façon pertinente. Enfin, il doit savoir travailler en équipe. Un Data Scientist ne peut travailler seul, étant donnée l’ampleur de sa tâche.

Plus que les diplômes, il faut faire attention aux compétences. Un Data Scientist doit savoir coder (Python, R…), mobiliser des statistiques et des algorithmes, construire des modèles grâce au machine learning et à l’intelligence artificielle …

10 points clés à retenir pour recruter rapidement un Data Scientist

  • Identifier des usages pour la Data dans son entreprise.

  • Disposer de données de qualité

  • Rattacher la démarche de Data Science à un objectif business.

  •  Débuter par un plan d’action / une stratégie (avec un consultant en Data Science).

  • Rédiger une liste de livrables souhaités.

  • Décliner les compétences (Statistiques, Code, Machine Learning, Intelligence Artificielle…)  et les métiers recherchés (Data Scientist, Data Engineer, Data Analyst …).

  • Écrire un brief détaillé (pour freelances) ou une fiche de poste (pour salariés).

  • Prévoir un budget réaliste : le recrutement d’un Data Scientist coûte cher. Cependant, il ne faut pas oublier le potentiel retour sur investissement, qui rend l’opération rentable le plus souvent. 

  • Recruter les bons profils (adéquation entre le besoin et les compétences).

  • Être rapide dans le recrutement : les Data Scientists sont peu nombreux, leurs disponibilités sont limitées.