{"id":548,"date":"2014-09-12T11:05:00","date_gmt":"2014-09-12T15:05:00","guid":{"rendered":"http:\/\/bioinfo.iric.ca\/?p=548"},"modified":"2016-11-08T09:30:17","modified_gmt":"2016-11-08T14:30:17","slug":"enrichissements-et-test-exact-de-fisher","status":"publish","type":"post","link":"https:\/\/bioinfo.iric.ca\/fr\/enrichissements-et-test-exact-de-fisher\/","title":{"rendered":"Enrichissements et test exact de Fisher"},"content":{"rendered":"<p>En travaillant sur un ensemble de donn\u00e9es AML (leuc\u00e9mie aigu\u00eb my\u00e9lo\u00efde), je suis tomb\u00e9 sur un g\u00e8ne <em>X<\/em>. Lorsque son expression est haute, une mutation dans le g\u00e8ne <em>Y<\/em> est pr\u00e9sente dans 50% des \u00e9chantillons (cette mutation n&rsquo;\u00e9tant pr\u00e9sente que dans 20% de l&rsquo;ensemble de donn\u00e9es). Y aurait-il un lien entre ces deux observations?<\/p>\n<p>Et si on y mettait des chiffres: des 131 \u00e9chantillons de l&rsquo;ensemble de donn\u00e9es, 28 ont une mutation dans le g\u00e8ne <em>Y<\/em>, 6 expriment hautement le g\u00e8ne <em>X<\/em> et 3 poss\u00e8dent ces deux caract\u00e9ristiques. La table de contingence (ci-dessous) sert \u00e0 repr\u00e9senter la distribution de ces caract\u00e9ristiques:<\/p>\n<table width=\"430\" cellspacing=\"5\" cellpadding=\"2\" align=\"center\">\n<tbody align=\"center\">\n<tr>\n<td><\/td>\n<td>Mutation dans\u00a0<em>Y<\/em><\/td>\n<td>Pas de mutation dans\u00a0<em>Y<\/em><\/td>\n<td>Total<\/td>\n<\/tr>\n<tr>\n<td>Haute expression de\u00a0<em>X<\/em><\/td>\n<td><strong>3<\/strong><\/td>\n<td>3<\/td>\n<td><strong>6<\/strong><\/td>\n<\/tr>\n<tr>\n<td>Basse expression de\u00a0<em>X<\/em><\/td>\n<td>25<\/td>\n<td>100<\/td>\n<td>125<\/td>\n<\/tr>\n<tr>\n<td>Total<\/td>\n<td><strong>28<\/strong><\/td>\n<td>103<\/td>\n<td>131<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>\nL&rsquo;histoire se complique: seulement 6 \u00e9chantillons pr\u00e9sentent une haute expression du g\u00e8ne <em>X<\/em>.<br \/>\nSupposons maintenant que le fait de voir un peu plus d&rsquo;\u00e9chantillons pr\u00e9sentant les deux caract\u00e9ristiques dans notre jeu de donn\u00e9es soit le fruit du hasard.  Une pure co\u00efncidence.  \u00c0 quelle fr\u00e9quence cette co\u00efncidence se produirait-elle si on assume que la fr\u00e9quence de la mutation dans <em>Y<\/em> est \u00e9gale entre les deux groupes pr\u00e9sentant une basse et haute expression de <em>X<\/em>? <\/p>\n<p> Cette probabilit\u00e9 correspond \u00e0 la <em>p-value<\/em> calcul\u00e9e par un test de Fisher dans R:<\/p>\n<pre>&gt; <strong>fisher.test (matrix (c(3, 3, 25, 100), nrow=2, byrow=T))<\/strong>\r\n\r\nFisher's Exact Test for Count Data\r\n\r\ndata: matrix(c(3, 3, 25, 100), nrow = 2)\r\np-value = 0.1116\r\nalternative hypothesis: true odds ratio is not equal to 1\r\n95 percent confidence interval:\r\n0.4982704 31.2702870\r\nsample estimates:\r\nodds ratio\r\n3.944561<\/pre>\n<p>Il y a deux nombres qui nous int\u00e9ressent dans ce r\u00e9sultat. La <em>p-value<\/em>, qui est de 0.1116, signifie qu&rsquo;il y a 11\u00a0% de chances d&rsquo;observer ce type de divergence entre les deux groupes en l&rsquo;absence d&rsquo;une r\u00e9elle diff\u00e9rence. Le <em>odds ratio<\/em> ou rapport de chances (parfois\u00a0rapport de cotes), estime l&rsquo;ampleur de l&rsquo;enrichissement. En combinant ces deux informations, nous concluons que malgr\u00e9 l&rsquo;observation de pr\u00e8s de 4 fois plus de mutations dans le groupe pr\u00e9sentant une sur-expression du g\u00e8ne <em>X<\/em> (1:1 vs 1:4), nous ne pouvons pas rejeter l&rsquo;hypoth\u00e8se que ces observations soient\u00a0dues \u00e0 une co\u00efncidence.<\/p>\n<p>Il faut faire attention, cependant, car ces donn\u00e9es ne supportent pas l&rsquo;absence de diff\u00e9rences. En fait, nous ne pouvons m\u00eame pas confirmer que le rapport de chances (odds ratio) est de moins de 4:<\/p>\n<pre>&gt; <strong>fisher.test (matrix (c(3, 3, 25, 100), nrow=2, byrow=T), or=4, alt=\"less\")<\/strong>\r\n\r\nFisher's Exact Test for Count Data\r\n\r\ndata: matrix(c(3, 3, 25, 100), nrow = 2, byrow = T)\r\np-value = 0.6555\r\nalternative hypothesis: true odds ratio is less than 4\r\n95 percent confidence interval:\r\n0.00000 23.04848\r\nsample estimates:\r\nodds ratio\r\n3.944561<\/pre>\n<p>On dit parfois que les statistiques peuvent nous raconter n&rsquo;importe quelle histoire\u2026. \u00a0Ici, les statistiques restent pourtant r\u00e9solument muettes!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En travaillant sur un ensemble de donn\u00e9es AML (leuc\u00e9mie aigu\u00eb my\u00e9lo\u00efde), je suis tomb\u00e9 sur un g\u00e8ne X. Lorsque son expression est haute, une mutation dans le g\u00e8ne Y est pr\u00e9sente dans 50% des \u00e9chantillons (cette mutation n&rsquo;\u00e9tant pr\u00e9sente que dans 20% de l&rsquo;ensemble de donn\u00e9es). Y aurait-il un lien entre ces deux observations? Et si on y mettait des chiffres: des 131 \u00e9chantillons de l&rsquo;ensemble de donn\u00e9es, 28 ont une mutation dans le g\u00e8ne Y, 6 expriment hautement le <a href=\"https:\/\/bioinfo.iric.ca\/fr\/enrichissements-et-test-exact-de-fisher\/\"> [&#8230;]<\/a><\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":false,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[41,27],"tags":[],"class_list":["post-548","post","type-post","status-publish","format-standard","hentry","category-bioinformatique","category-statistiques"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/548","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/comments?post=548"}],"version-history":[{"count":12,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/548\/revisions"}],"predecessor-version":[{"id":568,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/548\/revisions\/568"}],"wp:attachment":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/media?parent=548"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/categories?post=548"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/tags?post=548"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}