Dans les années 1990, l’ingénieur en informatique et le « quant » de Wall Street étaient les métiers en vogue dans le monde des affaires. Aujourd’hui, ce sont les data scientists les plus prisés.

Lorsque Jonathan Goldman a pris son poste en juin 2006 chez LinkedIn, le site de networking professionnel, l’entreprise ressemblait encore à une start-up. La société comptait un peu moins de 8 millions de comptes, et ce nombre augmentait rapidement, les membres existants invitant leurs amis et collègues à les rejoindre. Mais les utilisateurs ne cherchaient pas à établir des liens avec les personnes déjà présentes sur le site au rythme prévu par les dirigeants. Il semblait manquer quelque chose à l’expérience sociale. Comme l’a dit un responsable de LinkedIn, « c’était comme arriver à la réception d’une conférence et réaliser que vous ne connaissez personne. Alors vous restez dans un coin à siroter votre boisson – et vous partez probablement tôt. »

Goldman, docteur en physique à Stanford, était intrigué par les liens qu’il voyait se créer et par la richesse des profils des utilisateurs. Tout cela a donné lieu à des données désordonnées et à une analyse difficile, mais à mesure qu’il a commencé à explorer les liens entre les gens, il a commencé à voir des possibilités. Il a commencé à élaborer des théories, à tester ses intuitions et à trouver des modèles qui lui ont permis de prédire dans quels réseaux un profil donné allait atterrir. Il pouvait imaginer que de nouvelles fonctionnalités tirant parti de l’heuristique qu’il développait pourraient apporter de la valeur aux utilisateurs. Mais l’équipe d’ingénieurs de LinkedIn, prise par les défis de la mise à l’échelle du site, ne semblait pas intéressée. Certains collègues ont ouvertement rejeté les idées de Goldman. Pourquoi les utilisateurs auraient-ils besoin que LinkedIn détermine leurs réseaux à leur place ? Le site dispose déjà d’un importateur de carnet d’adresses capable de récupérer toutes les connexions d’un membre.

Heureusement, Reid Hoffman, cofondateur et PDG de LinkedIn à l’époque (aujourd’hui président exécutif), avait foi dans le pouvoir de l’analyse en raison de ses expériences chez PayPal, et il avait accordé à Goldman un degré élevé d’autonomie. Il avait notamment donné à Goldman un moyen de contourner le cycle traditionnel de lancement des produits en publiant de petits modules sous forme de publicités sur les pages les plus populaires du site.

Grâce à l’un de ces modules, Goldman a commencé à tester ce qui se passerait si l’on présentait aux utilisateurs des noms de personnes avec lesquelles ils n’avaient pas encore établi de liens mais qu’ils semblaient susceptibles de connaître – par exemple, des personnes qui avaient partagé leurs mandats dans des écoles et des lieux de travail. Pour ce faire, il a créé une publicité personnalisée qui affichait les trois meilleures nouvelles correspondances pour chaque utilisateur, en fonction du contexte saisi dans son profil LinkedIn. En quelques jours, il était évident que quelque chose de remarquable était en train de se produire. Le taux de clics sur ces annonces était le plus élevé jamais observé. Goldman a continué à affiner la façon dont les suggestions étaient générées, en incorporant des idées de réseautage telles que la « fermeture du triangle » – la notion selon laquelle si vous connaissez Larry et Sue, il y a de fortes chances que Larry et Sue se connaissent aussi. Goldman et son équipe ont également réduit à un clic l’action nécessaire pour répondre à une suggestion.

La pénurie de data scientists devient une contrainte sérieuse dans certains secteurs.

Il n’a pas fallu longtemps aux hauts responsables de LinkedIn pour y déceler une opportunité et en faire une fonctionnalité standard. C’est à ce moment-là que les choses ont vraiment décollé. Les annonces « People You May Know » ont atteint un taux de clics de 30 % supérieur à celui obtenu par d’autres incitations à visiter plus de pages sur le site. Elles ont généré des millions de nouvelles pages vues. Grâce à cette seule fonctionnalité, la trajectoire de croissance de LinkedIn s’est nettement infléchie à la hausse.

Une nouvelle “race”

Goldman est un bon exemple de ce nouvel acteur clé dans les organisations : le « data scientist ». Il s’agit d’un professionnel de haut niveau ayant la formation et la curiosité nécessaires pour faire des découvertes dans le monde du big data. Ce titre n’existe que depuis quelques années. (Il a été inventé en 2008 par l’un d’entre nous, D.J. Patil, et Jeff Hammerbacher, alors responsables respectifs des efforts en matière de données et d’analyse chez LinkedIn et Facebook). Mais des milliers de data scientists travaillent déjà dans des start-ups et des entreprises bien établies. Leur apparition soudaine sur la scène économique reflète le fait que les entreprises sont désormais aux prises avec des informations dont la variété et le volume sont sans précédent. Si votre entreprise stocke plusieurs pétaoctets de données, si les informations les plus critiques pour votre activité se présentent sous d’autres formes que des lignes et des colonnes de chiffres, ou si la réponse à votre question la plus importante implique un « mashup » de plusieurs efforts analytiques, vous avez une opportunité de big data.

L’enthousiasme actuel pour le big data se concentre en grande partie sur les technologies qui permettent de le maîtriser, notamment Hadoop (le cadre le plus largement utilisé pour le traitement des systèmes de fichiers distribués) et les outils open-source connexes, l’informatique en nuage et la visualisation des données. Bien qu’il s’agisse de percées importantes, il est au moins aussi important de disposer de personnes possédant les compétences nécessaires.

Merci pour votre lecture ! Si vous souhaitez lire nos prochains articles autour de la Data Science, vous pouvez nous suivre sur Facebook, LinkedIn et Twitter pour être notifié lorsqu’un nouvel article est publié

Cet article a été inspiré par : Data Scientist: The Sexiest Job of the 21st Century de Global Tech Council