Image : Jack Moreh, source
L’exploitation du Big Data ou mégadonnées est aujourd’hui présent dans presque tous les secteurs d’activité : du marketing à l’industrie du sport. Le production rapide de grands volumes de données variées est inhérent à notre usage toujours plus croisant du numérique. La donnée concerne naturellement les métiers de l’information. Mais quels sont les rôles des professionnel·le·s de l’information dans l’utilisation du Big Data ?
Les caractéristiques du Big Data
La définition du concept varie encore beaucoup selon les auteurs. Toutefois, le Big Data ou mégadonnées est souvent définit selon ses 3 caractéristiques principales. Il s’agit des 3V : Volume, Variété, Vélocité. Le volume indique une quantité de données si grande que les outils informatiques standards n’ont pas les capacités nécessaires à leur traitement. La variété caractérise le Big Data par la coexistence de données hétérogènes provenant de sources disparates. Le troisième V fait référence au flux continu de la production des mégadonnées. Certain.e.s auteurs définissent le concept de Big Data avec des caractéristiques supplémentaires telles que la valeur ou la validité.
Technologies et méthodes d’analyse du Big Data
Le Big Data, par ses caractéristiques, nécessite des capacités technologiques et des méthodes de traitement spécifiques. La définition du concept est donc davantage complète ainsi : « Big Data is the Information asset characterised by such a High Volume, Velocity and Variety to require specific Technology and Analytical Methods for its transformation into Value. » (De Mauro, Greco et Grimaldi 2016) Concernant l’aspect technologique, on peut par exemple citer le Cloud Computing ou les bases de données NoSQL pour le stockage des mégadonnées. Quant aux méthodes d’analyse du Big Data, il s’agit par exemple des techniques de data visualisation, le partitionnement de données ou encore le machine learning. Le Big Data englobe donc les technologies et les méthodes d’analyse nécessaires au traitement de grandes quantités de données variées et produites en continu. Les spécialistes de l’information ont la capacité d’intervenir sur ces différents aspects.
Mettre à disposition des ressources nécessaires pour comprendre le Big Data
Les spécialistes de l’information, pour continuer à remplir leur rôle de mise à disposition de ressources pertinentes auprès du public, doivent connaître les enjeux et les implications technologiques du traitement des mégadonnées. Parce que le Big Data concerne tous les individus, les professionnel.le.s de l’information peuvent exercer le rôle de médiateur.trice pour «[…] participer à l’éveil de l’internaute citoyen » (Touitou 2017). Face à ce concept complexe, l’expertise des bibliothécaires ou documentalistes de répondre aux besoins des usagers par des données fiables est essentielle.
Participer à la conception et mise en place de projets exploitant le Big Data
Une bonne connaissance des ses enjeux, ses technologies et ses potentiels de traitement est un atout pour le.a spécialiste de l’information afin de participer à l’élaboration de projets incluant le Big Data dans les organisations publiques ou privées. Comme pour un grand nombre d’enjeux actuels dans les métiers de l’information, afin de collaborer et apporter sa propre expertise, le.a professionnel.le de l’information doit être capable de dialoguer avec d’autres spécialistes, tels que les informaticien.ne.s ou les data scientists.
Apporter son expertise dans le traitement des données
L’expertise des spécialistes de l’information concernant le traitement des données sont nécessaires pour aborder la complexité du Big Data. La connaissance des enjeux éthiques et juridiques concernant les données ainsi que les connaissances d’organisation, de description et de préservation de l’information sont des compétences demandées pour son exploitation.
Auteur : Jack Moreh, source
Étudier le Big Data en sciences de l’information
Même si le traitement des mégadonnées concerne davantage des disciplines telles que l’informatique ou les mathématiques, l’étude des enjeux liées au Big Data dans les sciences de l’information est pertinente. Malgré la complexité du concept, les spécialistes de l’information peuvent apporter une expertise pertinente : « Developing students’ understanding of big data’s reach, as well as the almost limitless potential for its analysis and application, is a growing necessity for educators concerned with students’ information literacy and future earning potential. » (Fowler, Godin et Geddy 2016). Bien qu’elles semblent terrifiantes au premier abord, les mégadonnées sont donc une curiosité à explorer pour un.e professionnel.le de l’information.
Bibliographie
BELLOT, Patrice et ESPINASSE, Bernard, 2017. Introduction au Big Data – Opportunités, stockage et analyse des mégadonnées. Techniques d’ingénieur, technologies de l’information. 10 février 2017.
COLLET-Thireau, Katell et THOMAS, Jean-Paul, 2015. Big Data et Open Data : quel impact pour les professionnels de l’information ?, I2D – Information, données et documents [en ligne]. 2015/4 Vol. 53, p. 9-10. [Consulté le 11 novembre 2018]. Disponible à l’adresse : https://www.cairn.info/revue-i2d-information-donnees-et-documents-2015-4-page-9.htm
DA SYLVA, Lyne, 2017. Les données et leurs impacts théoriques et pratiques sur les professionnels de l’information. Documentation et bibliothèques. Volume 63, numéro 4, octobre–décembre 2017,p. 5–34. ISSN 0315-2340
DE MAURO, Andrea, GRECO, Marco et GRIMALDI, Michele, 2016. A formal definition of Big Data based on its essentiel features. Library Review. Vol. 65, no 3, pp. 122-135. ISSN 0024-2535
FOWLER, Brad, GODIN, Joy et GEDDY, Margaret, 2016. Teaching Case, introduction to NoSQL in a Traditional Database Course. Journal of Information Systems Education. Printemps 2016. Vol. 27, no 2, pp. 99-103. ISSN 1055-3096
TOUITOU, Cécile, 2017. Olivier Ertzscheid L’appétit des géants ». Bulletin des bibliothèques de France (BBF). No 13, pp. 148-149. [Consulté le 11 novembre 2018]. Disponible à l’adresse : http://bbf.enssib.fr/consulter/bbf-2017-13-0148-002
WAQAR, Ahmed et KANWAL, Ameen, 2017. Defining big data and measuring its associated trends in the field of information and library management. Library Hi Tech News. No 9, pp. 21-24. ISSN 0741-9058