{"id":964,"date":"2014-12-08T15:48:48","date_gmt":"2014-12-08T20:48:48","guid":{"rendered":"http:\/\/bioinfo.iric.ca\/?p=964"},"modified":"2014-12-08T15:49:54","modified_gmt":"2014-12-08T20:49:54","slug":"trafiquer-le-test-exact-de-fisher-pour-les-besoins-du-biologiste","status":"publish","type":"post","link":"https:\/\/bioinfo.iric.ca\/fr\/trafiquer-le-test-exact-de-fisher-pour-les-besoins-du-biologiste\/","title":{"rendered":"Trafiquer le test exact de Fisher pour les besoins du biologiste"},"content":{"rendered":"<p class=\"p1\">Le test exact de Fisher est largement utilis\u00e9 en bioinformatique.  Il est d&rsquo;ailleurs \u00e0 la base d&rsquo;un grand nombre d&rsquo;outils recherchant des enrichissements pour des ensembles de g\u00e8nes ou des voies biologiques.   Je n&rsquo;introduirai pas le test en tant que tel dans cet article car plusieurs l&rsquo;ont d\u00e9j\u00e0 fait (commencez <a href=\"http:\/\/fr.wikipedia.org\/wiki\/Test_exact_de_Fisher\">ici<\/a>!).  Je vais plut\u00f4t me concentrer sur l&rsquo;incompatibilit\u00e9 qui existe parfois entre ce que calcule le test et ce qui est requis par les biologistes.<\/p>\n<p class=\"p1\">Dans le test exact de Fisher, l&rsquo;hypoth\u00e8se nulle est qu&rsquo;il <strong>n&rsquo;y a pas<\/strong> d&rsquo;enrichissement entre les variables \u00e9tudi\u00e9es.  Lorsqu&rsquo;on utilise ce test avec des nombres \u00e9lev\u00e9s (comme le nombre de g\u00e8nes dans le g\u00e9nome humain ou le nombre de cat\u00e9gories disponibles dans <i>Gene Ontology<\/i>), il est assez fr\u00e9quent de trouver de l\u00e9gers enrichissements d\u00e9sign\u00e9s comme tr\u00e8s significatifs.  Dans ces cas-l\u00e0, le r\u00e9sultat du test devient tr\u00e8s difficile \u00e0 interpr\u00e9ter.  En effet, que faire avec un enrichissement de 2% retournant une <i>p-value<\/i> de 0.0001? <\/p>\n<p class=\"p1\"> Il existe une variante du test qui change l&rsquo;hypoth\u00e8se nulle en posant que l&rsquo;enrichissement est plus petit qu&rsquo;une valeur donn\u00e9e.  Cette variante utilise la distribution hyperg\u00e9om\u00e9trique non-centrale de Fisher (<a href=\"http:\/\/en.wikipedia.org\/wiki\/Fisher's_noncentral_hypergeometric_distribution\"><i>Fisher&rsquo;s non-central hypergeometric distribution<\/i><\/a>) et est disponible dans R.  Le param\u00e8tre <code>\"or\"<\/code>, pass\u00e9 \u00e0 la fonction <code>fisher.test<\/code>, permet d&rsquo;utiliser ce test.  Cette variante permet de v\u00e9rifier si les donn\u00e9es supportent un enrichissement significativement <strong>sup\u00e9rieur \u00e0 une valeur seuil<\/strong> pr\u00e9-d\u00e9finie (pr\u00e9f\u00e9rablement choisie en fonction de sa signification biologique).  Vous trouverez la documentation concernant la fonction en R <a href=\"https:\/\/stat.ethz.ch\/R-manual\/R-devel\/library\/stats\/html\/fisher.test.html\">ici<\/a>.<\/p>\n<p>Les deux tests ont \u00e9t\u00e9 appliqu\u00e9s \u00e0 l&rsquo;exemple fictif suivant : <\/p>\n<pre><em>&gt; data \r\n     [,1] [,2]\r\n[1,] 1100 8900\r\n[2,] 1000 9000\r\n\r\n<em>&gt; fisher.test (data, alt=\"greater\")<\/em>\r\n\r\n\tFisher's Exact Test for Count Data\r\n\r\ndata:  data\r\n<strong>p-value = 0.01119<\/strong>\r\nalternative hypothesis: true odds ratio is greater than 1\r\n95 percent confidence interval:\r\n 1.029899      Inf\r\nsample estimates:\r\nodds ratio \r\n  1.112353 \r\n\r\n<em>&gt; fisher.test (data, <strong>or=1.25<\/strong>, alt=\"greater\")<\/em>\r\n\r\n\tFisher's Exact Test for Count Data\r\n\r\ndata:  data\r\n<strong>p-value = 0.9946<\/strong>\r\nalternative hypothesis: true odds ratio is greater than 1.25\r\n95 percent confidence interval:\r\n 1.029899      Inf\r\nsample estimates:\r\nodds ratio \r\n  1.112353 \r\n<\/em><\/pre>\n<p>Ce type de test avec seuil offre une r\u00e9ponse int\u00e9ressante au probl\u00e8me \u00e9nonc\u00e9 r\u00e9cemment dans mon article intitul\u00e9 \u00ab\u00a0<a href=\"https:\/\/bioinfo.iric.ca\/fr\/2014\/10\/dois-je-calculer-une-p-value\/\">Dois-je calculer une <i>p-value<\/i>?\u00a0\u00bb<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Le test exact de Fisher est largement utilis\u00e9 en bioinformatique. Il est d&rsquo;ailleurs \u00e0 la base d&rsquo;un grand nombre d&rsquo;outils recherchant des enrichissements pour des ensembles de g\u00e8nes ou des voies biologiques. Je n&rsquo;introduirai pas le test en tant que tel dans cet article car plusieurs l&rsquo;ont d\u00e9j\u00e0 fait (commencez ici!). Je vais plut\u00f4t me concentrer sur l&rsquo;incompatibilit\u00e9 qui existe parfois entre ce que calcule le test et ce qui est requis par les biologistes. Dans le test exact de <a href=\"https:\/\/bioinfo.iric.ca\/fr\/trafiquer-le-test-exact-de-fisher-pour-les-besoins-du-biologiste\/\"> [&#8230;]<\/a><\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":false,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[41,42,27],"tags":[62],"class_list":["post-964","post","type-post","status-publish","format-standard","hentry","category-bioinformatique","category-biologie","category-statistiques","tag-statistiques"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/964","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/comments?post=964"}],"version-history":[{"count":12,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/964\/revisions"}],"predecessor-version":[{"id":978,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/964\/revisions\/978"}],"wp:attachment":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/media?parent=964"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/categories?post=964"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/tags?post=964"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}