Statistiques

Permutations

Supposons que vous ayez ces deux groupes de données : g1 <- c(55, 65, 58) g2 <- c(12, 18, 32) Nous voulons savoir si ces deux groupes appartiennent à la même distribution ou sont considérés comme deux groupes différents. Nous serions probablement tenté, pour élucider la question, d'appliquer un test de Student, le test-t. t.test(g1, g2) ## Welch Two Sample t-test ## ## data: g1 and g2 ## t = 5.8366, df = 2.9412, p-value = 0.01059 ## alternative hypothesis: [...]

By |2017-04-30T10:07:23-04:0016 octobre 2015|Categories: Analyse de données, R, Statistiques|0 Commentaires

N’ignorez pas les avertissements!

Maintenant que vous utilisez R régulièrement, je suis certaine que vous avez remarqué que, parfois, R vous parle. Lorsque vous faites quelque chose d'erroné, R répond avec un message écrit en rouge dans la console. Combien d'entre vous lisent réellement ces messages d'erreur? Si vous prenez le temps de les lire attentivement, vous verrez qu'ils vous informent du problème survenu. Prenons cet exemple: > sum(c('1','3','4','4')) Error in sum(c("1", "3", "4", "4")) : invalid 'type' (character) of argument R vous indique [...]

By |2017-04-30T16:26:10-04:003 septembre 2015|Categories: R, Statistiques|1 commentaire

Les graphes de Kaplan-Meier

Lorsqu'on travaille avec des données liées au cancer, un de nos objectifs est parfois de trouver des caractéristiques (mutation, information clinique, expression génique, ...) associées au prognostic, i.e. des caractéristiques reliées à l'évolution probable de la maladie. Si c'est aussi l'un de vos objectifs, vous aurez à faire une analyse de survie.  Les analyses de survie sont constituées d'un ensemble de méthodes qui essaient de modéliser à quel moment un événement d'intérêt apparaîtra (temps d'apparition), cet événement étant souvent le [...]

By |2016-11-08T09:30:14-04:0019 février 2015|Categories: Bioinformatique, Statistiques|Tags: |0 Commentaires

Trafiquer le test exact de Fisher pour les besoins du biologiste

Le test exact de Fisher est largement utilisé en bioinformatique. Il est d'ailleurs à la base d'un grand nombre d'outils recherchant des enrichissements pour des ensembles de gènes ou des voies biologiques. Je n'introduirai pas le test en tant que tel dans cet article car plusieurs l'ont déjà fait (commencez ici!). Je vais plutôt me concentrer sur l'incompatibilité qui existe parfois entre ce que calcule le test et ce qui est requis par les biologistes. Dans le test exact de [...]

By |2014-12-08T15:49:54-04:008 décembre 2014|Categories: Bioinformatique, Biologie, Statistiques|Tags: |0 Commentaires

Diagrammes de Venn: un cauchemar pour la visualisation de données

J'ai récemment lu un article introduisant un aligneur (read mapper) très inspirant pour les données de séquençage d'ARN (RNA-Seq).  Dans la présentation de leurs résultats, les auteurs ont voulu comparer le nombre de jonctions d'épissage détectées par quatre aligneurs différents; leur but étant de montrer le chevauchement entre leur méthode et les différentes méthodes existantes. Ils ont choisi de présenter ces données sous la forme d'un diagramme de Venn (voir la figure 1). Je suis resté plusieurs minutes à fixer cette [...]

By |2019-06-05T10:29:11-04:0020 octobre 2014|Categories: Bioinformatique, Statistiques, Visualisation de données|0 Commentaires