{"id":834,"date":"2014-10-20T12:48:55","date_gmt":"2014-10-20T16:48:55","guid":{"rendered":"http:\/\/bioinfo.iric.ca\/?p=834"},"modified":"2019-06-05T10:29:11","modified_gmt":"2019-06-05T14:29:11","slug":"diagrammes-de-venn-un-cauchemar-pour-la-visualisation-de-donnees","status":"publish","type":"post","link":"https:\/\/bioinfo.iric.ca\/fr\/diagrammes-de-venn-un-cauchemar-pour-la-visualisation-de-donnees\/","title":{"rendered":"Diagrammes de Venn: un cauchemar  pour la visualisation de donn\u00e9es"},"content":{"rendered":"<p>J&rsquo;ai r\u00e9cemment lu un <a href=\"http:\/\/genomebiology.com\/content\/14\/3\/R30\" target=\"_blank\" rel=\"noopener noreferrer\">article<\/a> introduisant un aligneur (<em>read mapper<\/em>) tr\u00e8s inspirant pour les donn\u00e9es de s\u00e9quen\u00e7age d&rsquo;ARN (<em>RNA-Seq<\/em>). \u00a0Dans la pr\u00e9sentation de leurs r\u00e9sultats, les auteurs ont voulu comparer le\u00a0nombre de jonctions d&rsquo;\u00e9pissage d\u00e9tect\u00e9es par quatre aligneurs diff\u00e9rents; leur but \u00e9tant de montrer le chevauchement entre leur m\u00e9thode et les diff\u00e9rentes m\u00e9thodes existantes. Ils ont choisi de pr\u00e9senter ces donn\u00e9es sous la forme d&rsquo;un diagramme de Venn (voir la figure 1). Je suis rest\u00e9 plusieurs minutes \u00e0 fixer cette mosa\u00efque color\u00e9e&#8230; sans en retirer beaucoup d&rsquo;informations.<\/p>\n<div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 hundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-overflow:visible;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-one-full fusion-column-first fusion-column-last fusion-column-no-min-height\" style=\"--awb-bg-size:cover;--awb-margin-bottom:0px;\"><div class=\"fusion-column-wrapper fusion-flex-column-wrapper-legacy\">\n<div id=\"attachment_449\" style=\"width: 1010px\" class=\"wp-caption alignnone\"><a href=\"http:\/\/www.bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/example_venn.png\"><img decoding=\"async\" aria-describedby=\"caption-attachment-449\" class=\"wp-image-449 size-large\" src=\"http:\/\/www.bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/example_venn-1024x759.png\" alt=\"Exemple d'un diagramme de Venn \u00e0 quatre ensembles\" width=\"1000\" height=\"741\" srcset=\"https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/example_venn-300x222.png 300w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/example_venn-1024x759.png 1024w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/example_venn.png 1036w\" sizes=\"(max-width: 1000px) 100vw, 1000px\" \/><\/a><p id=\"caption-attachment-449\" class=\"wp-caption-text\"><strong>Figure 1: \u00a0Exemple d&rsquo;un diagramme de Venn \u00e0 quatre ensembles.<\/strong> Reproduction de la figure 4b de <em>Genome Biology<\/em>, <strong>14<\/strong>(3):R30, 2013.<\/p><\/div>\n<p>Quels aligneurs pr\u00e9sentent le plus de similitudes dans leurs pr\u00e9dictions de jonctions? Est-ce qu&rsquo;il y a un aligneur dont les r\u00e9sultats diff\u00e8rent plus particuli\u00e8rement des autres (<em>outlier<\/em>)? Tentez de r\u00e9pondre \u00e0 ces questions en utilisant le diagramme de Venn reproduit \u00e0 la figure 1.<\/p>\n<p>J&rsquo;ai sorti les nombres de la figure et essay\u00e9 de construire une repr\u00e9sentation alternative facilitant l&rsquo;exploration des r\u00e9sultats. La figure 2 montre une version rudimentaire de cet essai. Au premier coup d&rsquo;oeil, il est facile de voir que 65% des jonctions sont identifi\u00e9es par les quatre aligneurs (bonne nouvelle!). Tophat est\u00a0plut\u00f4t marginal; CRAC, GSNAP et MapSplice ayant plus de 86% de jonctions en commun. Seulement une petite fraction des jonctions sont uniques \u00e0 chaque\u00a0aligneur (1-2%). MapSplice semble \u00eatre le plus conservateur des quatre (seulement 815 jonctions uniques).<\/p>\n<div class=\"fusion-clearfix\"><\/div><\/div><\/div><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-one-full fusion-column-first fusion-column-last fusion-column-no-min-height\" style=\"--awb-bg-size:cover;--awb-margin-bottom:0px;\"><div class=\"fusion-column-wrapper fusion-flex-column-wrapper-legacy\">\n<div id=\"attachment_451\" style=\"width: 1010px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/www.bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/revenn.png\"><img decoding=\"async\" aria-describedby=\"caption-attachment-451\" class=\"wp-image-451 size-large\" src=\"http:\/\/www.bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/revenn-1024x706.png\" alt=\"Exploration du diagramme de Venn. Ces nombres sont ais\u00e9ment calcul\u00e9s par la fonction &quot;sommeprod&quot; de votre tabulateur pr\u00e9f\u00e9r\u00e9.\" width=\"1000\" height=\"689\" srcset=\"https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/revenn-300x206.png 300w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/revenn-1024x706.png 1024w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2014\/05\/revenn.png 1586w\" sizes=\"(max-width: 1000px) 100vw, 1000px\" \/><\/a><p id=\"caption-attachment-451\" class=\"wp-caption-text\"><strong>Figure 2: \u00a0Exploration du diagramme de Venn.<\/strong> Ces nombres sont ais\u00e9ment calcul\u00e9s par la fonction \u00ab\u00a0sommeprod\u00a0\u00bb de votre tabulateur pr\u00e9f\u00e9r\u00e9.<\/p><\/div>\n<p>Cette repr\u00e9sentation alternative prend un peu plus d&rsquo;espace (quand il y a plus de deux cat\u00e9gories) et est fondamentalement moins color\u00e9e, mais elle atteint l&rsquo;objectif principal: permettre au lecteur de comprendre les donn\u00e9es! La prochaine fois, avant de lancer Venny (<a href=\"http:\/\/bioinfogp.cnb.csic.es\/tools\/venny\/\" target=\"_blank\" rel=\"noopener noreferrer\">ici<\/a>), demandez-vous si le diagramme de Venn est vraiment le moyen le plus convenable de montrer le chevauchement observ\u00e9 dans vos donn\u00e9es.<div class=\"fusion-clearfix\"><\/div><\/div><\/div><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>J&rsquo;ai r\u00e9cemment lu un article introduisant un aligneur (read mapper) tr\u00e8s inspirant pour les donn\u00e9es de s\u00e9quen\u00e7age d&rsquo;ARN (RNA-Seq). \u00a0Dans la pr\u00e9sentation de leurs r\u00e9sultats, les auteurs ont voulu comparer le\u00a0nombre de jonctions d&rsquo;\u00e9pissage d\u00e9tect\u00e9es par quatre aligneurs diff\u00e9rents; leur but \u00e9tant de montrer le chevauchement entre leur m\u00e9thode et les diff\u00e9rentes m\u00e9thodes existantes. Ils ont choisi de pr\u00e9senter ces donn\u00e9es sous la forme d&rsquo;un diagramme de Venn (voir la figure 1). Je suis rest\u00e9 plusieurs minutes \u00e0 fixer cette <a href=\"https:\/\/bioinfo.iric.ca\/fr\/diagrammes-de-venn-un-cauchemar-pour-la-visualisation-de-donnees\/\"> [&#8230;]<\/a><\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":false,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[41,27,44],"tags":[],"class_list":["post-834","post","type-post","status-publish","format-standard","hentry","category-bioinformatique","category-statistiques","category-visualisation-de-donnees"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/834","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/comments?post=834"}],"version-history":[{"count":11,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/834\/revisions"}],"predecessor-version":[{"id":58593,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/834\/revisions\/58593"}],"wp:attachment":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/media?parent=834"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/categories?post=834"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/tags?post=834"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}