Visualisation de données : quelques bonnes pratiques

Visualisation de données : quelques bonnes pratiques

Le dernier article de Sébastien présentait un cas de graphique particulièrement difficile à lire. En effet, un diagramme de Venn à quatre ensembles représente un bon exemple d’une représentation graphique qui a un peu mal tourné.

Les bonnes pratiques en visualisation de données constituent un sujet très à la mode par les temps qui courent. Et pas seulement en sciences. Cela intéresse autant les journalistes que les analystes en intelligence d’affaires. La foule était d’ailleurs assez hétéroclite lors de la première rencontre de Visualisation Montréal en août dernier où plus de 100 personnes étaient présentes! Et le ebook gratuit qui a été lancé lors de la rencontre s’adresse autant aux débutants de tous les domaines.

Même si le type de données diffère selon les domaines (on n’a pas beaucoup de cartes géographiques interactives en bioinformatique!), les principes de base pour créer une représentation réussie restent les mêmes.

Je suis tombée sur un éditorial intéressant de Nicolas Rougier, récemment publié dans Plos One, qui résume plusieurs bonnes pratiques en dix règles simples.

Les voici (en traduction libre) :

  1. Connaissez votre public
  2. Identifiez votre message
  3. Adaptez vos figures au médium utilisé
  4. Les sous-titres ne sont pas optionnels
  5. Ne faites pas confiance aux paramètres par défaut
  6. Utilisez la couleur efficacement
  7. Ne trompez pas le lecteur
  8. Évitez les abus (Chartjunk)
  9. Le message passe avant la beauté
  10. Utilisez les bons outils.

Les règles 1 et 2 méritent leur place en haut de la liste.  Il est essentiel d’avoir un message clair en tête pour créer une représentation graphique captivante.  Et ce message doit être clair pour nous, mais aussi pour notre public cible.

 

À vrai dire, surcharger  un graphe et laisser le lecteur s’arranger avec ce trop plein d’informations est beaucoup plus facile à faire que de définir clairement un message et de le présenter efficacement. Je parle ici par expérience! Prendre le temps de se demander quelles informations sont pertinentes pour appuyer l’histoire que les données ont à raconter mène généralement à un résultat beaucoup plus intéressant.  Ici, la paresse ne paie pas!

Allez lire l’article, cela pourrait vous sauver du temps et des efforts dans le futur!

Et si vous voulez vous  inspirer (et/ou en apprendre plus), consultez les travaux d’Edward Tufte et de John Tukey, deux pionniers dans le domaine.  Edward Tufte a, entre autres,  introduit le concept du ratio « données-vs-encre » et a contribué significativement à l’avancement du domaine.

Plus proche de nous, le site web de Martin Krzywinski, le créateur des diagrammes Circos vaut aussi la peine d’être consulté. Bonne lecture!!

ncomms4600-f2

Figure1. Diagramme Circos provenant de l’article de Diana Paola Granados et al.

By | 2017-04-29T17:23:28+00:00 31 octobre 2014|Categories: Visualisation de données|0 Commentaires

About the Author:

Mon parcours a débuté en biochimie, mais c ’est en bioinformatique que je m ’amuse depuis plusieurs années : que ce soit en analysant et visualisant des données en R, en construisant des outils web interactifs en javascript ou en explorant des algorithmes d ’apprentissage automatique en python.

Laisser un commentaire