Sébastien, Author at IRIC's Bioinformatics Platform

Une implémentation en javascript de la version non centrée du test exact de Fisher

Mon article précédent expliquait pourquoi la version non-centrée du test exact de Fisher est plus appropriée dans la plupart des cas rencontrés en bio-informatique. Je poursuis en présentant maintenant une implémentation de ce test en Javascript qui pourrait facilement être intégrée à une interface web. Même si le Javascript est un langage très mal adapté à l'implémentation de méthodes statistiques, j'espère que cet article présentera tous les détails nécessaires pour simplifier l'implémentation de ce test dans d'autres langages, selon les besoins. À tout le moins, [...]

By Sébastien|2017-04-29T17:50:55+00:009 janvier 2017|Categories: Analyse de données, Statistiques|Tags: javascript, test|0 Commentaires

Le(s) langage(s) en bio-informatique

La question que l'on me pose le plus souvent concernant la bio-informatique est malheureusement celle qui conduit aux discussions les moins productives auxquelles j'ai participé : Quel langage de programmation devrais-je utiliser en bio-informatique ? Comprenez-moi bien, dans un pub autour d'une bière, cette discussion entre membres de l'intelligentsia nerd est des plus divertissantes... mais l'illumination survit rarement jusqu'au lendemain. Ceci dit, j'aimerais partager ici la réponse que j'ai affinée au fil des ans. Elle est basée sur le développement de [...]

By Sébastien|2017-04-29T16:59:12+00:0018 avril 2016|Categories: Bioinformatique|Tags: débutant|0 Commentaires

Effectuer une PCA sur les données de Leucégène

GEO est une source extrêmement riche de données de profils transcriptionnels, mais télécharger et préparer ces données constituent bien souvent un obstacle pour les apprentis bioinformaticiens. La démonstration qui suit devrait faciliter vos premiers pas, j'utiliserai le jeu de données de Leucégène. Une fois ces données chargées et prêtes à être utilisées dans R, je présenterai une perspective simplifiée mais pratique de l'utilisation de la PCA (Principal Component Analysis) pour faire de l'analyse exploratoire d'un ensemble de profiles transcriptionnels. Chargement des données [...]

By Sébastien|2017-04-29T23:05:37+00:0016 novembre 2015|Categories: Analyse de données, R|Tags: expression de gènes, PCA|0 Commentaires

Trafiquer le test exact de Fisher pour les besoins du biologiste

Le test exact de Fisher est largement utilisé en bioinformatique. Il est d'ailleurs à la base d'un grand nombre d'outils recherchant des enrichissements pour des ensembles de gènes ou des voies biologiques. Je n'introduirai pas le test en tant que tel dans cet article car plusieurs l'ont déjà fait (commencez ici!). Je vais plutôt me concentrer sur l'incompatibilité qui existe parfois entre ce que calcule le test et ce qui est requis par les biologistes. Dans le test exact de [...]

By Sébastien|2014-12-08T15:49:54+00:008 décembre 2014|Categories: Bioinformatique, Biologie, Statistiques|Tags: Statistiques|0 Commentaires

Diagrammes de Venn: un cauchemar pour la visualisation de données

J'ai récemment lu un article introduisant un aligneur (read mapper) très inspirant pour les données de séquençage d'ARN (RNA-Seq). Dans la présentation de leurs résultats, les auteurs ont voulu comparer le nombre de jonctions d'épissage détectées par quatre aligneurs différents; leur but étant de montrer le chevauchement entre leur méthode et les différentes méthodes existantes. Ils ont choisi de présenter ces données sous la forme d'un diagramme de Venn (voir la figure 1). Je suis resté plusieurs minutes à fixer cette [...]

By Sébastien|2019-06-05T10:29:11+00:0020 octobre 2014|Categories: Bioinformatique, Statistiques, Visualisation de données|0 Commentaires

lemieuxs

About Sébastien

Une implémentation en javascript de la version non centrée du test exact de Fisher

Le(s) langage(s) en bio-informatique

Effectuer une PCA sur les données de Leucégène

Trafiquer le test exact de Fisher pour les besoins du biologiste

Diagrammes de Venn: un cauchemar pour la visualisation de données