lemieuxs

About Sébastien

Informaticien de formation, j'occupe mon temps à faire parler les données biologiques… tous les moyens sont bons!

Une implémentation en javascript de la version non centrée du test exact de Fisher

Mon article précédent expliquait pourquoi la version non-centrée du test exact de Fisher est plus appropriée dans la plupart des cas rencontrés en bio-informatique. Je poursuis en présentant maintenant une implémentation de ce test en Javascript qui pourrait facilement être intégrée à une interface web. Même si le Javascript est un langage très mal adapté à l'implémentation de méthodes statistiques, j'espère que cet article présentera tous les détails nécessaires pour simplifier l'implémentation de ce test dans d'autres langages, selon les besoins. À tout le moins, [...]

By | 2017-01-16T09:25:09+00:00 9 janvier 2017|Categories: Javascript, Statistiques, Test|0 Commentaires

Le(s) langage(s) en bio-informatique

La question que l'on me pose le plus souvent concernant la bio-informatique est malheureusement celle qui conduit aux discussions les moins productives auxquelles j'ai participé : Quel langage de programmation devrais-je utiliser en bio-informatique ? Comprenez-moi bien, dans un pub autour d'une bière, cette discussion entre membres de l'intelligentsia nerd est des plus divertissantes... mais l'illumination survit rarement jusqu'au lendemain. Ceci dit, j'aimerais partager ici la réponse que j'ai affinée au fil des ans. Elle est basée sur le développement de [...]

By | 2016-11-08T09:30:05+00:00 18 avril 2016|Categories: Bioinformatique|0 Commentaires

Effectuer une PCA sur les données de Leucégène

GEO est une source extrêmement riche de données de profils transcriptionnels, mais télécharger et préparer ces données constituent bien souvent un obstacle pour les apprentis bioinformaticiens. La démonstration qui suit devrait faciliter vos premiers pas, j'utiliserai le jeu de données de Leucégène. Une fois ces données chargées et prêtes à être utilisées dans R, je présenterai une perspective simplifiée mais pratique de l'utilisation de la PCA (Principal Component Analysis) pour faire de l'analyse exploratoire d'un ensemble de profiles transcriptionnels. Chargement des données [...]

By | 2016-11-08T09:30:08+00:00 16 novembre 2015|Categories: Data Analysis, R|0 Commentaires

Trafiquer le test exact de Fisher pour les besoins du biologiste

Le test exact de Fisher est largement utilisé en bioinformatique. Il est d'ailleurs à la base d'un grand nombre d'outils recherchant des enrichissements pour des ensembles de gènes ou des voies biologiques. Je n'introduirai pas le test en tant que tel dans cet article car plusieurs l'ont déjà fait (commencez ici!). Je vais plutôt me concentrer sur l'incompatibilité qui existe parfois entre ce que calcule le test et ce qui est requis par les biologistes. Dans le test exact de [...]

By | 2014-12-08T15:49:54+00:00 8 décembre 2014|Categories: Bioinformatique, Biologie, Statistiques|Tags: |0 Commentaires

Dois-je calculer une « p-value »?

Le besoin d'appliquer des statistiques appropriées en génomique a été bien documenté.  Plusieurs approches statistiques astucieuses ont été mises au point et de nombreux logiciels ont été développés (certains gratuits et très performants).  Malgré tout, je reçois fréquemment la visite d'un étudiant ou chercheur qui se demande s'il doit rapporter la magnitude d'un effet (ex. le gène X est sur-exprimé 4.5 fois dans la condition A vs B) ou le niveau de signification statistique de cette magnitude (ex. le gène X est [...]

By | 2016-11-08T09:30:16+00:00 14 octobre 2014|Categories: Statistiques|0 Commentaires