Si je vous montre cette image d’un cercle coloré, que voyez-vous ? Une œuvre-d’art abstraite ? La ligne de vie d’un arbre centenaire ? La coupe d’une pierre précieuse ? D’une certaine manière, toutes ces réponses ne sont pas essentiellement fausses. En effet, ces différentes entités contiennent en elles-mêmes un certain nombre d’informations que l’on pourra traduire par des données.
La donnée, c’est notre nouvelle monnaie. C’est aussi grâce à elle que l’on peut retirer des informations et les transformer en connaissances. Mais pour pouvoir produire de bonnes connaissances à partager, il faut aussi savoir récolter les données et, surtout, les mettre en images. Un nouveau domaine a vu ainsi le jour : la data visualisation.
Le cercle et la représentation des données
Représenter le savoir sous forme de diagrammes circulaires, comme dans le cas de notre exemple, n’est cependant pas nouveau, comme le montre l’ouvrage The Book of Circles publié par Manuel Lima en 2017. Depuis les Sumériens jusqu’à Nintendo, ce livre retrace de multiples visualisations du savoir sous forme de cercles, en passant par des domaines très variés comme la mode, la technologie, l’art, l’astronomie, la physique et bien d’autres.
Cinemetrics, les données de films sous forme de cercle
Parmi les différentes sphères présentes dans ce livre, figure une analyse visuelle du film The Shining (1980, Stanley Kubrick) par Frederic Brodbeck. Réalisé dans le cadre de son projet de Bachelor à la Royal Academy of Arts intitulé « Cinemetrics », le travail de Brodbeck consiste en une analyse de différentes données tirées de films pour créer, comme il le précise sur son site, un « visual fingerprint ». Le résultat consiste en une sorte de carte d’identité visuelle d’un film sous forme de cercle.
Vous l’aurez donc compris, l’image présentée plus haut fait partie des résultats du travail de Brodbeck. Il s’agit du film The Royal Tenenbaums (2001, Wes Anderson). Les données récoltées dans le cadre de ce travail sont tirées du film analysé : la structure du montage, les couleurs, le son et le mouvement. Le code permettant de décortiquer les longs-métrages avec Python, créé par Brodbeck, est disponible sur Github. Voici une vidéo réalisée par Brodbeck explicitant le travail d’analyse réalisé par le logiciel :
Le rendu final de cette analyse de données filmiques permet à chaque personne de comparer les films entre eux. Avec la structure en cercle et les couleurs, nous pouvons distinctement observer les différentes nuances utilisées pour chaque film, l’intensité du montage et de la bande-sonore. Il est aussi intéressant de pouvoir mettre l’une à côté de l’autre chaque visualisation des films d’un même réalisateur, comme c’est le cas pour ceux de Wes Anderson dans la vidéo.
Cinemetrics : un bon exemple de visualisation de données ?
Le projet « Cinemetrics » est une approche pertinente de la visualisation de données filmiques. En effet, un film est un produit contenant de nombreuses informations réunies sous forme d’images consécutives qu’il est impossible d’appréhender dans son ensemble dans un temps réduit par l’être humain. Créer et posséder un code capable de le faire nous offre la capacité d’affiner notre regard sur les œuvres cinématographiques. Ce projet permet également d’appréhender l’objet film comme producteur de données en tant que tel, plutôt que de considérer uniquement les métadonnées : titre, réalisateur, date de sortie, genre, acteurs, etc.
Dans le cas du travail de Brodbeck, les différentes qualités d’une bonne visualisation de données sont remplies. Les données (data) du film, le montage, le mouvement, le son, les couleurs, sont complètes et croisées. Elles sont représentées sous une forme familière (le cercle) et raconte une histoire (story) : la forme permet ainsi une certaine visualisation d’une narration. De plus, le résultat final est compréhensible et il permet une comparaison avec les autres produits. Il est aussi facilement intégrable à toute une culture ancienne et contemporaine de représentation du savoir sous forme de cercle (shareability). Cependant, une critique pourrait être faite sur la familiarité de la forme finale : même si cette dernière peut rappeler la forme d’une bobine, il est impossible de déterminer qu’il s’agit d’un film sans une légende.
Généralisation de la visualisation des données de films
Le travail de Brodbeck permet de mettre en avant la pertinence des longs-métrages de fiction comme sources de données à exploiter. Il n’est cependant le seul à l’avoir fait. Le site Towards Data Science propose un package nommé ChromaR sur R qui permet d’extraire des données de couleurs d’un film pour en faire une visualisation de la narration par les couleurs. Le code du package est également disponible sur Github. Les résultats peuvent prendre différentes formes, parmi lesquelles des tableaux sous forme de lignes. De nouveau, ce travail permet de comparer visuellement, par exemple, les différents films d’un réalisateur : ceux de Hayao Miyazaki dans l’image ci-dessous :
Les deux exemples cités plus haut, et bien d’autres, montrent à quel point nous pouvons être créatifs/créatives dans la représentation graphique de données. La visualisation de données est importante face à l’immensité des données générées chaque jour, mais elle prouve également à quel point la donnée peut être belle. Pour mettre en avant les qualités et la richesse de ces données, il est donc nécessaire d’apporter un peu de créativité pour produire des représentations visuelles qui viendront simplifier et enrichir les informations générées par les données, les transformant ainsi en connaissances efficaces et durables.
Sources principales
BESSON, Vanessa, BISCHOFF, Sébastien, CRAUSAZ, Eléonore, LATIFI, Edmond. Données, Information, Connaissance [document Powerpoint]. 26 novembre 2020.
Support de cours : Cours « M3C2 Séminaires », Haute école de gestion de Genève, Master en Sciences de l’information, année académique 2020-2021
BRODBECK, Frederic. Cinemetrics [en ligne]. [Sans date]. [Consulté le 28 novembre 2020]. Disponible à l’adresse : http://cinemetrics.fredericbrodbeck.de/
BUONOCORE, Tommaso. « Exploring chromatic storytelling in movies with R ». Towards Data Science. 8 avril 2019. [Consulté le 28 novembre 2020]. Disponible à l’adresse : https://towardsdatascience.com/exploring-chromatic-storytelling-with-r-part-1-8e9ddf8d4187
Qu’est-ce que la visualisation des données ? Infogram [en ligne]. [Sans date]. [Consulté le 28 novembre 2020]. Disponible à l’adresse: https://infogram.com/fr/page/visualisation-des-donnees
THOMPSON, Katy, 2017. « A short guide to Cinemetrics ». Mapping Contemporary Cinema [en ligne]. [Consulté le 29 novembre 2020]. Disponible à l’adresse : http://www.mcc.sllf.qmul.ac.uk/?p=1859
Laisser un commentaire