DANS UN RAPPORT FONDATEUR RÉDIGÉ EN 2011, LE CABINET MCKINSEY VOYAIT DANS LE BIG DATA “LA NOUVELLE FRONTIÈRE DE L’INNOVATION, DE LA CONCURRENCE ET DE LA PRODUCTIVITÉ”. LE CONTEXTE DE CRISE MONDIALE AIDANT, LE CONCEPT EST TANTÔT PRÉSENTÉ COMME LA “POTION MAGIQUE” CENSÉE GUÉRIR TOUS LES MAUX DE NOS ÉCONOMIES, TANTÔT COMME UN SCENARIO DE SCIENCE-FICTION, OÙ LES MACHINES ET LA TECHNOLOGIE EN GÉNÉRAL PRENDRAIENT LE POUVOIR SUR L’HOMME.
Le big data – littéralement données de masse – est l’ensemble des pratiques et des technologies émergentes qui permettent de gérer et d’analyser simultanément de très gros volumes de données numériques complexes.
Vous avez dit big data ?
Il y a deux types de données : celles générées par les humains (envoyer un e-mail, tenir un blog, écrire un commentaire sur Facebook ou Twitter…) et celles – moins connues, bien que tout aussi importantes – générées par les machines de toutes sortes : terminaux bancaires, smartphones, machines industrielles… La communication de machine à machine (M to M) se banalise, ouvrant la voie à des applications innovantes, telles que la maintenance prédictive. À titre d’exemple, les data centers de Total analysent au fil de l’eau les données de production grâce à des capteurs intégrés dans les installations pétrolières du groupe. La nature immatérielle des données de masse et les volumes en jeu font du “big data” un phénomène qui nourrit le fantasme et entretient la confusion et la méfiance du public.
Une révolution sociologique plus que technologique
Volume, variété, vitesse des données, sont les trois critères couramment avancés pour définir le phénomène big data. c’est la fameuse “règle des 3V”. Un raccourci un peu rapide, car cela laisse à penser que l’enjeu de la Data est uniquement technologique. Or il n’en est rien. Les techniques utilisées pour analyser les big data ne sont que le prolongement du business analytics et du business intelligence, deux disciplines qui existent depuis longtemps. Ce qui se cache derrière l’expression « Big Data », c’est la prise de conscience générale, amorcée en 2012, de l’importance stratégique des données et des changements majeurs qu’elles vont induire sur les organisations. Jusqu’à présent, la gestion de données était au service du business : c’était une simple fonction support, que les managers utilisaient pour éclairer leur lanterne et orienter les choix stratégiques. Aujourd’hui, les choses s’inversent : la data devient une ressource stratégique. Il en résulte un bouleversement de nos business models, dans lesquels c’est la fonction data et ses extraordinaires possibilités qui vont tirer l’activité des entreprises et créer de la valeur.
L’ère du data-driven business
Les applications émergentes sont innombrables : à terme, toutes les fonctions de l’entreprise, tous les secteurs d’activité seront impactés. Les premiers concernés sont la distribution, dont les bases clients et les historiques d’achats recèlent un énorme potentiel, ou la banque-assurance, pour mieux prendre en compte le risque dans la détermination du prix des contrats, en le corrélant avec la météo par exemple. Sans oublier la santé : le big data permet d’accélérer la recherche (études épidémiologiques, séquençage du génome…). Pour les entreprises, le big data porte la promesse d’énormes gains d’efficacité. L’exemple le plus immédiat est la fonction marketing, avec des répercussions sur le chiffre d’affaires et les parts de marché. On peut désormais croiser les données sociologiques avec celles de la GRC et les opinions issues des réseaux sociaux.
CHIFFRES CLÉS
• le marché mondial du big data devrait peser 23,8 Mds $ en 2016, avec un taux de croissance attendu de 31,7 % par an (IDC mars 2013) • le big data représenterait 8 % du PIB européen en 2020 (AFDEL février 2013) • les services financiers,la santé et le secteur public ont constitué plus de 55 % du marché du big data en 2012 (Rapport de Transparency Market Research) • 4 millions d’emplois créés dans le monde par le big data d’ici à 2015 (Gartner).
Par Kevin Carillo,
Enseignant à TBS, spécialiste des systèmes d’information et du traitement statistique