boucherg

About Geneviève

Mon parcours a débuté en biochimie, mais c ’est en bioinformatique que je m ’amuse depuis plusieurs années : que ce soit en analysant et visualisant des données en R, en construisant des outils web interactifs en javascript ou en explorant des algorithmes d ’apprentissage automatique en python.

Un mot concernant la variabilité non désirée

Toutes les expériences d'expression génique sont influencées par plusieurs variables. Il y a celle qui nous intéresse (la variable d'intérêt) et...les autres.   Ces autres variables (d'origine technique ou biologique), introduisent de la variabilité dans les données. Et elle passe  souvent inaperçue. Prenons une expérience où nous voulons étudier comment un traitement affecte l'expression des gènes.  Le traitement est donc la variable d'intérêt et elle est au coeur de l'expérience.  Mais toutes différences dans les instruments utilisés, dans la façon de [...]

By |2018-07-31T21:49:09+00:0024 juillet 2018|Categories: Bioinformatique|0 Commentaires

Comprendre comment fonctionne kallisto

En 2016,  Bray et al. ont introduit une nouvelle méthode basée sur les k-mers pour estimer l'abondance des isoformes dans les données de RNA-Seq.  La méthode s'appelle kallisto.  Comparée aux méthodes existantes, pour une précision de résultat comparable, kallisto est plus rapide et plus efficace en mémoire ce qui constitue une amélioration significative.  En fait, kallisto est capable de quantifier l'expression d'un échantillon en l'espace d'une vingtaine de minutes au lieu de prendre plusieurs heures.  Comme cette méthode est légère et conviviale, [...]

Pensez comme un ordinateur

Supposons que tous vos résultats pour un projet donné sont conservés dans des fichiers Excel nommés exp1.xlsx, exp2_20170708.xlsx, exp_prolif_072017.xlsx, et ainsi de suite. Supposons aussi que le contenu du fichier exp1.xlsx ressemble à ceci : Ce fichier est très convivial pour un humain, mais pas pour un ordinateur. Disons qu'un jour, vous décidez (ou votre patron décide) que vous avez besoin d'une base de données pour organiser vos résultats plutôt que de les conserver dans vingt-six fichiers Excel différents. Si [...]

By |2018-02-08T13:33:20+00:006 février 2018|Categories: Bioinformatique, Biologie|0 Commentaires

Un exemple utilisant multiprocessing et plus

Récemment, j'ai eu à chercher une structure chimique donnée dans une liste de structures. En utilisant les librairies python de chimie informatique pybel et rdkit, je suis facilement arrivée à faire cette recherche, mais celle-ci prenait beaucup trop de temps à mon goût. En me demandant comment l'accélérer, je me suis souvenue de l'article de blog de Jean-Philippe intitulé "Faites travailler vos CPUs !". J'ai donc décidé de suivre ses instructions et de faire travailler mes CPUs! But Trouver une [...]

By |2017-12-11T12:56:26+00:0011 décembre 2017|Categories: Bioinformatique, Informatique, Performance|0 Commentaires

Mégadonnées, gros défi – partie 2

Cet article est la suite de mon précédent article sur les mégadonnées. Il n'a pas engendré de discussion virtuelle enflammée sur le sujet, mais j'étais très heureuse de recevoir quelques commentaires sur la situation dans d'autres domaines de la bio-informatique. Protéomique Mathieu Courcelles, bio-informaticien à la plate-forme de protéomique, explique que la protéomique utilisant la spectrométrie de masse a toujours généré des "mégadonnées". Donc, l'expression n'est pas très utilisée dans le domaine puisqu'elle n'a rien de nouveau. Comme il le [...]

By |2017-08-18T13:24:37+00:0018 août 2017|Categories: Analyse de données|Tags: , |1 commentaire