fbpx

Le fossé entre la Data Science et l’entreprise

Pourquoi les projets de Data Science échouent-ils plus souvent qu’ils ne réussissent ?

Le terme « Data scientist » n’existait pas il y a quelques temps de cela dans le jargon de l’analyse de données, et pourtant il est considéré de nos jours comme l’un des travail « les plus sexy du 21e siècle » ! L’exploration des quantités de données en data science ont toujours fasciné et continueront de le faire pendant de nombreuses années à venir. Tout au long de ce voyage, j’ai vu de nombreux projets s’envoler et s’effondrer à différentes étapes. La citation de VentureBeat de 2019 reste toujours vraie : « 87 % des projets de science des données ne parviennent jamais à la production », et il y a plusieurs raisons qui nécessitent une intervention sérieuse et des correctifs, pour améliorer ce nombre.

Dans les dernières prédictions de Gartner, il y a plusieurs points qui méritent d’être notés en data science :

  1. D’ici 2025, 80 % des organisations cherchant à développer leur activité numérique échoueront car elles n’adopteront pas une approche moderne de la gouvernance des données et de l’analyse (Gartner, 2021)
  2. D’ici 2022, seulement 20 % des informations analytiques produiront des résultats commerciaux (Gartner, 2019)
  3. D’ici 2025, 80 % des initiatives de gouvernance des données et de l’analyse axées sur les résultats commerciaux, plutôt que sur les normes de données, seront considérées comme des capacités commerciales essentielles (Gartner, 2021)
  4. D’ici 2024, le degré d’effort manuel requis pour le processus de révision des contrats sera réduit de moitié dans les entreprises qui adoptent des solutions avancées d’analyse des contrats (Gartner, 2021)
  5. D’ici 2023, 50 % des directeurs du numérique dans les entreprises sans directeur des données (CDO) devront devenir le CDO de facto pour réussir (Gartner, 2021)

Jetez un œil à la différence entre les points 2 et 3, l’énorme écart entre l’impact de l’analyse de données sur les résultats commerciaux explique pourquoi les organisations devraient corriger leurs capacités d’analyse de données dès que possible.

Cela m’a amené à explorer les 5 principales raisons pour lesquelles les projets d’analyse de données échouent et comment combler cet écart. Ce sera une révélation pour vous et votre organisation d’examiner ces retraits et de réévaluer.

Le considérer comme un projet plutôt que comme un produit/livrable

La plupart des organisations considèrent les initiatives de science des données comme des projets et jamais comme un produit. De tels scénarios font de la place pour des projets laissés-pour-compte. Sans paysage de produit approprié, le projet est poussé dans une zone d’échec à très haut risque. Ces projets perdent de leur importance très rapidement peu de temps après leur déploiement en raison de causes telles que :

  • Les parties prenantes se désintéressent ou les utilisateurs finaux n’adoptent pas votre résultat
  • Aucune boucle de rétroaction et aucune mise à jour de la solution existante
  • Déséquilibre dans l’équipe de développement, ne conduisant à aucune maintenance et support futurs
  • Aucune valeur pour les défis commerciaux actuels

Lorsque l’organisation considère la science des données comme un produit, elle s’intègre profondément dans les stratégies, les initiatives axées sur la valeur et la présence dans toutes les unités commerciales. De telles organisations auront une culture profondément enracinée de prise de décision basée sur les données.

Manque d’organisation transversale

L’analyse des données et les résultats commerciaux ne peuvent être efficaces sans le soutien organisationnel, à la fois de la part des cadres supérieurs et intermédiaires. Tout le monde devrait parcourir la courbe de maturité de l’analyse de données, de l’analyse descriptive à l’analyse prescriptive (en d’autres termes : du tableau de bord aux résultats prédictifs comme la probabilité que mon client cesse d’utiliser mon produit) pour apprécier et comprendre la valeur générée par les données analytiques. Lorsque la courbe d’apprentissage prend plus de temps ou s’interrompt, c’est là que la chaîne de valeur est perdue et que les projets ne parviennent pas à démontrer un sens à l’organisation.

Une communication efficace avec les parties prenantes non techniques est nécessaire à toutes les étapes du développement du produit pour avoir un développement durable. Cela nécessite l’art du « Data storytelling » pour donner un récit puissant à l’approche et à la valeur qu’elle génère par ces décisions.

Disponibilité / Compréhension des données

C’est l’un des problèmes les plus courants pour toute équipe d’analyse et produit là-bas. Il a toujours besoin d’une paire d’yeux magiques d’un data scientist pour voir les données de la bonne manière et afin de les inclure dans le pipeline de données. Les données peuvent être une tâche difficile à organiser, collecter, créer ou acheter.

Même après l’avoir surmonté et rendu accessible, vous rencontrerez la prochaine série de barrages routiers :

  1. Y a-t-il un biais dans les données ?
  2. Est-il éthique et légal d’utiliser les données aux fins prévues ?
  3. Quelle est la bonne façon de trancher et de découper les données pour obtenir des résultats descriptifs ?
  4. Y a-t-il un impact temps et d’autres facteurs?
  5. Comment nettoyer les données à cette fin ?
  6. En matière de Machine Learning, comment étiqueter correctement les données pour minimiser les erreurs et les biais ?
  7. La plus grande menace de toutes : comment sécuriser les données et bien les gérer ? Selon Gartner d’ici 2024, la plupart des organisations tenteront des programmes de partage de données basés sur la confiance, mais seulement 15 % réussiront et surpasseront leurs pairs sur la plupart des mesures commerciales.

Produit sans moteur de valeur

Au début de toute nouvelle initiative en data science, il est toujours important d’examiner l’approche et les résultats commerciaux autant que possible pour arriver au bon plan. De nombreux modèles d’apprentissage automatique sont déployés et restent sous la forme d’un numéro dans la base de données, ce qui constitue alors un aperçu précieux pour l’entreprise. Après de nombreuses itérations de commentaires et d’ajustement des résultats, lorsque l’entreprise se rend compte qu’elle ne peut plus utiliser ces résultats, que ce soit à cause d’une nouvelle stratégie ou d’un nouvel outil ou pour toute autre raison, la prédiction s’estompera sans que personne n’utilise ou ne mette à jour ce.

Lorsque le produit génère une grande valeur et est bien connecté au système en aval, il y a toujours un retour du système en aval pour parfaire le résultat. Des compétences telles que l’écoute sociale, le cas échéant, feront une énorme différence pour le produit en étant pertinentes pour les pratiques commerciales. 

Mot d’or : La valeur d’épuisement est une indication de la diminution de la durée de vie du produit.

Le Data scientist

Parfois, un mauvais data scientist lui-même peut être un défi pour le projet et de nombreuses raisons sont liées à ce problème.

  1. Une moindre compréhension des connaissances commerciales

La première et principale étape pour tout scientifique des données consiste à comprendre le contexte du problème et comment la solution pourrait l’aider. Sans cette connaissance, la solution entre dans une flaque d’eau et devient plus salissante au fur et à mesure qu’elle progresse.

  1. Capacité du “storytelling” des données avec et sans visualisation

Suivez la règle magique de “Parler, Expliquer et Dessiner” lorsque vous parlez aux parties prenantes. Plus l’interaction avec les parties prenantes augmente la confiance dans les résultats et meilleur sera l’impact. Un vide se crée lorsque la chaîne se brise, ce qui entraîne une faible confiance dans la solution.

  1. Problème de ML difficile et approche adaptée

Approche trop complexe adaptée à un problème simple ou résumer le problème en un énoncé trop simplifié et essayer de le résoudre. Les deux seront vicieux et doivent être traités avec le bon poids en alignement avec les parties prenantes.

  1. Ne pas trouver le bon talent
    L’expérience, la compréhension du domaine, l’aisance dans l’utilisation des données et des outils comptent le plus pour résoudre un problème business complexe.

Alors comment devenir un bon Data Scientist opérationnel en entreprise ? Le Bootcamp Data Full Stack vous forme à devenir Data Scientist en 3 mois !

Merci pour votre lecture ! Si vous souhaitez lire nos prochains articles autour de la Data Science, vous pouvez nous suivre sur Facebook, LinkedIn et Twitter pour être notifié lorsqu’un nouvel article est publié

Cet article a été inspiré par : The gap between Data science and the Organization de Shreepada Shivananda