Comment faire parler ses données avec la data visualisation ?

Data Architecture 3 janvier 2019

Un tableur Excel ou une base de données SQL de plusieurs millions de lignes, un compte de webanalyse (Google Analytics, Adobe Analytics, etc.) qui a récolté plusieurs années de données sur votre site… À l’état brut, il est impossible de lire et d’utiliser cette donnée. Heureusement, la data visualisation, ou visualisation de données (aussi appelée dataviz), est là pour vous aider à y voir plus clair !

Qu’est-ce que la data visualisation ?

La visualisation de données est une discipline qui consiste à représenter graphiquement un ensemble de données afin de transmettre des informations. Pas encore très clair ? Prenons un exemple concret. La liste des déclarations de pertes d’objets à la SNCF depuis 2014 (accessible librement et gratuitement en ligne) se traduit par un fichier Excel de plus de 800 000 lignes. Mais comment savoir quel a été le type d’objet le plus porté disparu ? En l’état et sans retraitement de la donnée, c’est impossible.

On peut, dans un premier temps, traiter ce fichier Excel à l’aide d’un logiciel de traitement de données comme Tableau, ce qui donne le résultat ci-dessous (voir deuxième partie de l’article pour plus d’informations). La donnée est agrégée et déjà beaucoup lisible : on peut assez rapidement constater que la bagagerie est le type d’objet le plus porté disparu.

data-visualisation

 

Mais il y a plus rapide encore. En passant à une représentation visuelle des données avec ce diagramme circulaire, également généré avec le logiciel Tableau, on voit en un seul coup d’oeil que la bagagerie est le type d’objet qui a le plus été signalé perdu avec 29 % des déclarations :

Le processus détaillé ci-dessus est la définition même de la data visualisation : le passage de la donnée brute à une représentation visuelle de cette donnée. Cette représentation prend le plus souvent la forme de graphiques classiques : histogrammes, diagrammes, courbes, bulles… Mais toute forme de visualisation est valable tant qu’elle est adaptée au message à transmettre, comme des cartographies, cartes de chaleur, diagrammes Sankey, etc.

La data visualisation, pour quoi faire et pour qui ?

Avec l’augmentation exponentielle des volumes de données récoltées et la croissance  du nombre d’indicateurs à suivre, il est devenu très facile de se noyer dans cet océan d’informations. Il est donc essentiel d’accéder rapidement à l’information utile.

La data visualisation permet ainsi de :

– Rendre accessible à chacun la complexité de la donnée en la synthétisant

– Apporter des réponses à des questions quand l’information se trouve dans les données

– Mettre en valeur un message à communiquer et appuyer sa démonstration

Bref, quand on cherche une aiguille dans une botte de foin, la dataviz, c’est la possibilité d’agrandir cette aiguille et la rendre instantanément visible. Magique, non ? Et cette magie opère à tous les échelons dans une entreprise, des fonctions les plus opérationnelles aux plus stratégiques. Voici deux exemples d’application de la data visualisation en entreprise :

  • Pour une agence qui opère la gestion de multiples campagnes SEA pour le compte d’un annonceur, la représentation graphique des données d’Auction Insight de Google Ads (qui renseignent pour une campagne donnée sa position dans les enchères et sa part d Impression reçue ainsi que celles des concurrents qui enchérissent sur le même périmètre) permet de voir instantanément quelles campagnes nécessitent d’être optimisées afin d’assurer une position dominante face à la concurrence.
  • Pour une direction de la communication, la simple représentation graphique de l’évolution du trafic sur le site ou des requêtes génériques sur un moteur de recherche liées à son activité (par exemple les requêtes de type “comment m’assurer ?” pour une compagnie d’assurance) permet d’identifier rapidement les pics de trafic et éventuellement des phénomènes de saisonnalité, et ainsi contribuer à élaborer le plan de communication annuel.

Data visualisation : quels outils pour mettre en forme vos données ?

Pour visualiser ses données, de multiples solutions existent, qui se distinguent par leur puissance, leurs fonctionnalités et leur objectif d’utilisation. Il est tout à fait possible de travailler avec Excel par exemple : de nombreux types de visualisations sont disponibles, mais les capacités de connexion et traitement sont trop limitées pour travailler avec des plateformes tierces ou des bases de données volumineuses. Des outils bien plus adaptés existent, comme Qlik, Spotfire ou encore Power BI. De notre expérience, nous retenons deux outils en particulier : Tableau et Data Studio.

1. Tableau, pour explorer la donnée

Tableau est un logiciel payant d’informatique décisionnelle (ou Business Intelligence). Ses grandes forces sont :

  • son nombre de connecteurs, qui permet d’être relié à plus d’une soixantaine de sources différentes (du fichier Excel à la base MySQL en passant par Google BigQuery, Google Analytics, Oracle ou encore Salesforce)
  • ses capacités de transformation, qui permettent de retravailler les sources de données ou de joindre plusieurs sources entre elles (via jointure ou blending)
  • sa puissance de traitement, grâce aux très nombreuses fonctions (plus de 160) et à la rapidité de calcul
  • son nombre de visualisations différentes : plus de 22, et il est possible de créer ses propres visualisations

Tableau est un outil idéal pour explorer la donnée et il permet aussi de construire des tableaux de bord (ou dashboards, c’est-à-dire des rapports qui synthétisent les performances ou l’activité, le plus souvent à l’aide de dataviz) très complets pour capitaliser sur sa puissance de traitement.

2. Data Studio, pour montrer et partager la donnée de manière interactive

Data Studio est une solution de visualisation gratuite disponible en ligne, qui fait partie de la suite Google Marketing Platform. Ses principales qualités sont :

  • sa connexion native avec les outils Google (Google Analytics, Google Ads, Search Ads 360, Campaign Manager, etc.), grâce à laquelle on peut disposer des données en temps réel
  • son accessibilité, due à ses fonctionnalités de partage qui permettent à plusieurs utilisateurs de travailler en même temps sur un seul fichier – à la manière des outils Google Drive – ou de partager immédiatement le document à d’autres personnes
  • sa prise en main, avec une interface très simple d’utilisation qui permet de créer et personnaliser très facilement tous les différents types de visualisations
  • son interactivité, puisqu’il est possible de filtrer instantanément n’importe quelle visualisation

C’est un outil idéal pour construire des dashboards rapidement et facilement partageables autant en interne qu’en externe. Voici un exemple d’une visualisation sous Data Studio qui donne à voir d’une façon interactive l’exemple pris en début d’article.

Cliquez sur l’icône en bas à droite pour le plein écran !

Vous l’aurez compris, la data visualisation est essentielle pour représenter la donnée de manière compréhensible, afin d’extraire et de mettre en valeur les informations nécessaires pour répondre à des problématiques spécifiques. À tous les niveaux de l’entreprise, bien visualiser ses données, c’est mieux piloter ses opérations et/ou mieux comprendre son business !

Vous reprendrez bien une tasse de thé ?