TRANSFORM'IT
MENU

Dans sa série d’articles «Thinking like a Data Scientist», Bill Schmarzo, CTO Big Data Practice chez EMC, nous livre le résultat d’une réflexion qu’il a mené pendant plusieurs mois, afin d’apporter de la matière à son cours “Big Data MBA” qu’il dispense à l’université San Francisco School of Management.

Son étude se distingue d’autres approches, plus classiques, qui se réfèrent aux processus et techniques de statistiques et de data mining. Des disciplines qu’il juge insuffisantes pour permettre à une équipe de Data Scientists d’être vraiment efficace. D’après lui, la Data Science ne peut pas s’affranchir de l’aide des spécialistes métiers pour mieux comprendre les décisions à prendre, les hypothèses à tester et les prédictions dont le business a besoin pour s’améliorer et accélérer son activité.

Il en conclut donc que la clé serait d’apprendre à l’utilisateur métier à «  penser comme un Data Scientist ». Pour y parvenir, il nous propose une approche en 6 phases qu’il décrit au cours de deux articles Blog :

Thinking Like A Data Scientist – Part I & Part II

Methode-data scientist

Étape 1 : Identifier les Projets Métier Prioritaires

Rappelons que le rôle du Data scientist est de traiter et valoriser la donnée pour l’entreprise. Son objectif : identifier de nouvelles variables pour mieux prédire et optimiser les performances du business. Mais quelles performances faut-il monitorer ? Pour le savoir, il faut d’abord identifier les Projets Métier Prioritaires. Il s’agit selon Bill Schmarzo d’initiatives inter-fonctionnelles à 9 mois ou un an, qui s’avèrent essentielles pour l’entreprise. Ces initiatives qui doivent notamment être documentées, doivent aussi être portées par un sponsor dans l’équipe de direction métier. Enfin, elles doivent respecter un calendrier défini et déboucher sur un objectif de gain financier mesurable.

Étape 2 : Identifier des Entités Stratégiques

Il s’agit d’entités métiers qui sont partie prenantes dans le cadre des initiatives métier. Elles revêtent une importance cruciale dans le déroulement de la pensée Data Scientist puisqu’elles sont au centre de l’analyse : C’est pour ces dernières qu’à termes il faudra identifier de nouvelles idées et pistes de performance business. Il peut s’agir par exemple, de Clients, de Patients, d’Employés, de Produits, de Magasins, de Véhicules, d’Eoliennes…

Étape 3 : Construire des Recommandations Valides

Il s’agit dans cette phase de déterminer les axes de réflexion quant aux Initiatives Métier selon trois perspectives :

  • Descriptive – Comprendre ce qui s’est passé.

Dans le domaine de la grande distribution, il va s’agir par exemple de présenter une vision globale des ventes, de les classifier, de les regrouper et d’établir des corrélations,

  • Prédictive – Prévoir ce qui pourrait se passer.

On passe maintenant à une étape qui consiste à projeter une vision sur la base de la phase l‘exploration des données. La prévision des ventes à venir permet par exemple d’anticiper les processus de commande,

  • Prescriptive – Emettre des recommandations.

La suite logique des deux premières perspectives, après l’exploration des données et la démarche de prédiction, est d’entreprendre des prescriptions. C’est la phase de l’analyse des données qui induit l’action. La chute anticipée des ventes d’un produit peut amener à revoir sa politique tarifaire ou son packaging  par exemple.

Au travers de ces trois phases, nous avons évoqué les étapes qui permettent à un spécialiste métier de s’approprier la logique d’un Data Scientist.

Les 3 prochaines étapes vous donneront des techniques pour identifier de nouvelles variables à monitorer afin de mieux prédire la performance du business.

data scientist-analytics

Étape 4 : Décomposer l’Analyse

Ce type d’analyse a pout but de spécifier les questions des spécialistes métier, puis de les transcrire en requêtes pour découvrir de nouvelles sources de données, de nouvelles dimensions, de nouveaux axes d’analyses … Ceci en mode « brainstorming ». C’est à dire, en toute créativité, sans se censurer.

Les facteurs d’influence des ventes d’un constructeur automobile seront plus clairs en procédant notamment à une décomposition de ces ventes par secteurs géographiques, par région, ou par concession et par vendeur  mais aussi selon un découpage chronologique…

Étape 5 : Pondérer avec un “Score”

Le « scoring », fait référence à une technique de regroupement de dimensions et d’attributs qui peuvent être combinés afin de les rendre plus prédictifs. Cette méthode est particulièrement employée dans les métiers de la finance.

Étape 6 : Boucler la Boucle

Dans cette dernière phase, il s’agit de formaliser et délivrer les recommandations qui vont orienter les métiers à prendre les meilleures décisions, sur la base de l’étude approfondie des données.

« Think like a data scientist »

Il est incontestable que le travail du Data Scientist est un atout majeur dans le processus analytique d’une organisation, mais un défi encore trop souvent ignoré réside dans l’aptitude des utilisateurs métier à « penser comme un Data Scientist ». Cette approche permet de garantir une meilleure collaboration au sein de l’équipe chargée de l’analyse des data et de là, conduit à de meilleures prédictions, à de meilleures prescriptions pour en final, apporter une réelle valeur au métier.

click2tweet-data-sciencist-best-practice

Pour découvrir plus en détail la méthodologie de BILL SCHMARZO, reportez-vous à ses deux articles : Thinking Like A Data Scientist – Part I & Part II

Et vous, à quel degré avez-vous intégré les données et l’analytique dans votre business ? N’hésitez pas à échanger dans les commentaires.

Pour aller plus loin :

Des questions ? > contactez moi via Linkedin ou Twitter

Découvrez l’infographie interactive > Penser comme un Data Scientist



Frederic Jacquet

Architecte avant-ventes dans l’équipe Global Accounts, Fred a rejoint EMC en 2014. Son expérience résulte d’un parcours de Marketing Produits, Consultant avant-ventes, Directeur Technique, Evangéliste ou Architecte au sein de sociétés comme IBM, Business Objects et Teradata. Fred y a acquis une solide expérience des technologies Base de données et ETL / Data Intégration et s’est spécialisé dans les domaines du Datawarehousing et du Big Data. Sa mission auprès de grands comptes EMC, est de les accompagner dans leurs initiatives de transformation de leur IT vers la 3eme plateforme.

COMMENTAIRES