La tribune légèrement modifiée publiée hier sur Doc News
Les articles, dossiers, tables rondes et conférences sur le Big Data se sont multipliés depuis quelques mois. De plus en plus de sociétés s’emparent du phénomène de mode pour revendiquer leur expertise du sujet. Pourtant, le concept reste flou et personne ne sait vraiment ce que recouvre l’expression « Big Data ». Cette expression n’est pas suffisamment bien définie et cela génère des fantasmes parfois bien éloignés de la réalité de l’exploitation des données.
Le problème, c’est qu’il y a désormais beaucoup d’attentes autour du Big Data. Peut-être même trop… Comme souvent dans les révolutions technologiques, il y a beaucoup de sur-promesses et de raccourcis dans les discours. Il y a même un côté « boite noire » magique qui ne sert pas vraiment les intérêts à long terme de l’exploitation des données. C’est dommage car il est vrai que les données se multiplient et il est vrai qu’il faut apprendre à les collecter, à les extraire, à les exploiter et à les interpréter. Et surtout, il est vrai que cela génère du business et de la rentabilité : des chercheurs du MIT ont récemment réalisé une étude sur 330 entreprises. Elle montre clairement que les entreprises qui exploitent intelligemment les données ont en moyenne une productivité supérieure de 5% et une rentabilité supérieure de 6 % par rapport à leurs concurrentes (Harvard Business Review de Novembre).
Mais le flou est entretenu et personne ne sait vraiment de quelles données on parle quand on parle de « Big Data ». Mais de toutes bien sûr ! Comme si on pouvait traiter de la même manière :
- les données provenant des outils de tracking : sites web fréquentés, pages visitées, mots-clés recherchés… ;
- les données provenant de l’analyse textuelle et/ou sémantique du contenu des réseaux sociaux : qui parle de quoi ? Que dit-on de bien ou de mal sur un évènement, une personne, une idée, un lieu, une marque ? Quels sont les thèmes les plus commentés par telle communauté ? Etc. ;
- les données provenant de la géolocalisation via une adresse IP ou un GPS : qui est où et pour faire quoi… ;
- les données provenant de trackeurs divers : borne météo, trafic routier… ;
- les données provenant de dispositifs CRM : comportement d’achat d’un client via sa carte de fidélité (fréquence et panier moyen, types de produits achetés…), satisfaction d’un client via le callcenter … ;
- les données provenant des requêtes réalisées sur Google ou sur d’autres dispositifs online de recherche ;
- les données sociaux-économiques provenant de diverses organisations publiques (open data) ou privées (mégabases par exemple) ;
- et sans doute encore beaucoup d’autres sources !
Certaines de ces données sont nominatives et liées à une identité bien déterminée, d’autres sont statistiques, d’autres encore sont liées à un identifiant (cookie, DNS…). Ces données sont complétement hétérogènes. Elles ne sont pas organisées de la même manière, n’ont pas les mêmes rythmes de réactualisation, pas la même durée de viabilité, etc. Surtout, elles ne font pas référence aux mêmes types de réalités et ne signifient parfois pas grand-chose sorties de leur contexte de création et/ou d’usage.
Il y a aussi beaucoup de confusion autour des objectifs et des finalités du « Big Data » :
- Qualifier et donc mieux connaitre une population de consommateurs (les jeunes urbains boivent de la vodka) OU de contacts identifiés (Jean-François C boit de la Vodka).
- Prédire les comportements d’une cible marketing : la probabilité d’acheter un produit, de cliquer sur un lien, de s’engager pour une marque (la probabilité que Jean-François C accepte une invitation pour une soirée est élevée).
- Identifier des caractéristiques explicatives d’un comportement : quel est le profil des acheteurs de tel produit (Jean-François C qui achète de la vodka a moins de 30 ans, se connecte souvent à un site dédié à l’actualité de la musique électro, utilise beaucoup Shazam…) ;
- Mettre en place des systèmes automatiques de diffusion de messages ciblés (trigger, automation marketing…) : envoi automatique d’une offre commerciale à un client localisé près d’une boutique (Jean-François C reçoit un coupon pour une boisson gratuite lorsqu’il est à proximité d’une boite de nuit).
- Optimiser l’organisation et/ou la logistique et/ou les rayonnages d’une chaine de magasin et/ou d’un site e-commerce : mieux placer les produits pour vendre plus (Mettre du Red Bull à côté des bouteilles de Vodka… bon… pas besoin de Big Data pour le savoir, c’est juste pour la compréhension de l’article !)
- Vous faire découvrir que votre fille est enceinte (un américain aurait découvert que sa fille de 16 ans était enceinte de 3 mois car il avait reçu des bons de réduction pour des couches culottes de la part de la chaine de supermarchés Target. C’est le story telling du Big Data !)
- Et bien d’autres encore.
Les données explosent. Leur Volume, leur Variété et la Vitesse à laquelle elles sont renouvelées modifient profondément la manière de les collecter, de les exploiter et de les interpréter. Le champ des possibles est extraordinaire notamment pour le marketing. Le marketing de demain exploitera de plus en plus les data pour mieux connaître les consommateurs et permettre une interaction personnalisée et en temps réel entre eux et la marque. Mais nous sommes aujourd’hui très loin du graal promis par beaucoup d’enchanteurs du Big Data. Certains marketeurs se prennent pour des magiciens et cela n’est pas bon, ni pour les marques, ni pour les prestataires (dont certains font du « Big Data » depuis 15 à 20 ans sans le savoir), ni pour le marché en général. Il y a un potentiel extraordinaire dans l’exploitation de la data, à condition de bien distinguer les données, les objectifs et du coup les expertises !
Il est plus qu’urgent de revenir à certains fondamentaux. A cet égard, il me semble essentiel de rappeler plusieurs points clés :
- Toutes les sociétés n’ont pas forcément le même intérêt à exploiter le « Big Data ». En tout cas pas de la même manière. Plus une société est digitale, plus elle vend de produits différents et plus elle s’adresse à un nombre important de clients, plus elle pourra profiter des expertises de la data pour optimiser son marketing. Tout le monde n’est pas Amazon !
- Conséquence : chaque projet « Big Data » ne peut être qu’unique et nécessite une compréhension forte du marché adressé, des objectifs poursuivis et des données disponibles. La boite noire magique est un leurre. C’est avant tout un projet qui demande une phase d’analyse puis d’intégration, un projet qui prend du temps, des ressources (humaines, soft, hard…) et qui a donc un coût.
- Plutôt que de « Big Data », il me semble préférable de parler tout simplement de data management (collecte et gestion de données), d’analytique (analyse des données), de business intelligence (mise en place de reporting décisionnels), de datamining (exploration approfondie des données), de visualisation (représentation graphique des données), etc. C’est plus précis et cela recouvre des savoir-faire, des expertises et des prestations déterminés.
- Pour être exploitable au sein du marketing opérationnel, les données ont besoin d’être sélectionnées, homogénéisées et structurées. Cela nécessite la mise en place d’un Master Data Management qui garantit l’unicité des contacts et la disponibilité des données utiles. Nous sommes loin de la nature chaotique du « Big Data » qui est incompatible avec l’efficacité business.
- Les technologies exploitant le NoSQL, qui ont rendu possible l’exploitation de très grands volumes de données, sont pleines d’avenir. Mais elles ne remplaceront pas les algorithmes et les technologies classiques des bases de données relationnelles plus structurées. Ces technologies ne sont pas alternatives, elles sont complémentaires. Tout comme le cerveau droit a besoin du cerveau gauche, c’est de la complémentarité des deux qu’émergera l’intelligence et l’efficience.
- Même si le NoSQL a formidablement accéléré la rapidité de traitement des données, attention à ne pas tomber dans les mêmes travers que les premiers programmes CRM. Ils accumulaient en effet des volumes gigantesques de données inutiles car elles n’ont en définitive jamais été exploitées.
- Il ne faut pas négliger les aspects juridiques et éthiques de l’exploitation des données. Les limites à l’exploitation marketing des data ne sont pas technologiques mais sociétales et éthiques. A ce titre, si les discours sur le « Big Data » font rêver les marketeurs, elles font peur aux consommateurs et du coup au législateur, voire aux éditeurs de software (Windows 8 bloque par défaut certains cookies). Raison de plus pour ne pas aller trop loin dans les fantasmes.
- Enfin et surtout l’analytique et a fortiori les « Big Data » ne remplacent pas la vision et l’intuition du manager. Dans l’exploitation des données, la qualité principale reste de savoir poser les bonnes questions. Les ordinateurs de leur côté ne savent que répondre aux questions qu’on leur pose.
Pour conclure, j’utiliserais la métaphore du lagon que j’emprunte à Pierre Bellanger dans un texte sur la « marque sociale ». Le lagon est comme un lac calme et serein en pleine mer car plus ou moins protégé par une barrière de corail. Il y a cependant, et c’est important, des échanges entre le lagon et la mer. Le lagon, c’est l’ensemble des données collectées et structurées nécessaires aux besoins d’une organisation et/ou à la réalisation d’objectifs. La mer, ce sont toutes les données disponibles, c’est le « Big Data », c’est riche mais chaotique et inexploitable en tant que tel. Entre les deux, les dispositifs de data management forment la barrière corallienne nécessaire à l’exploitation opérationnelle des données. De la mer vers le lagon, on passe d’un amas chaotique à l’organisation puis à l’intelligence. C’est l’objet du data management et du datamining : collecter et organiser les données pour trouver un ordre là où il n’y avait que chaos. Cela veut dire identifier des causes, trouver des variables explicatives, déterminer des liens que l’on pourra exploiter ensuite de manière opérationnelle. Le « Big Data » n’a aucun intérêt si l’on ne reconnait pas la nécessité de ce travail de fond. De fait, chaque entreprise doit avoir à cœur de mettre en place son lagon de données et veiller à ne pas se noyer dans le « Big Data ». Le « Big Data » est une opportunité à condition de savoir en extraire de l’ordre, de l’efficacité, bref, de la valeur ! A ce titre, il serait plus opportun de parler de « Valued Data » car c’est bien cela qui intéresse les organisations : non pas la donnée pour la donnée mais la donnée utile, la donnée comme moyen de parvenir à ses fins et non comme fin en soi.