Documentez votre travail par l’ajout de paramètres à vos scripts shell

À un certain moment dans votre carrière de bioinformaticien, vous aurez à écrire des scripts shell, c'est inévitable ! Alors discutons d'une stratégie qui vous permettra à la fois de rendre vos scripts ré-utilisables et de garder une trace des paramètres utilisés pour générer une série de résultats. (Avertissement: les procédures décrites ci-bas ont été testées à l'aide du shell BASH, des modifications pourraient s'avérer nécessaires si vous utilisez un shell différent.) Il existe plusieurs techniques pour passer des paramètres [...]

By |2018-08-14T14:29:36+00:0014 août 2018|Categories: Bioinformatique|0 Commentaires

Un mot concernant la variabilité non désirée

Toutes les expériences d'expression génique sont influencées par plusieurs variables. Il y a celle qui nous intéresse (la variable d'intérêt) et...les autres.   Ces autres variables (d'origine technique ou biologique), introduisent de la variabilité dans les données. Et elle passe  souvent inaperçue. Prenons une expérience où nous voulons étudier comment un traitement affecte l'expression des gènes.  Le traitement est donc la variable d'intérêt et elle est au coeur de l'expérience.  Mais toutes différences dans les instruments utilisés, dans la façon de [...]

By |2018-07-31T21:49:09+00:0024 juillet 2018|Categories: Bioinformatique|0 Commentaires

Comprendre comment fonctionne kallisto

En 2016,  Bray et al. ont introduit une nouvelle méthode basée sur les k-mers pour estimer l'abondance des isoformes dans les données de RNA-Seq.  La méthode s'appelle kallisto.  Comparée aux méthodes existantes, pour une précision de résultat comparable, kallisto est plus rapide et plus efficace en mémoire ce qui constitue une amélioration significative.  En fait, kallisto est capable de quantifier l'expression d'un échantillon en l'espace d'une vingtaine de minutes au lieu de prendre plusieurs heures.  Comme cette méthode est légère et conviviale, [...]

Pensez comme un ordinateur

Supposons que tous vos résultats pour un projet donné sont conservés dans des fichiers Excel nommés exp1.xlsx, exp2_20170708.xlsx, exp_prolif_072017.xlsx, et ainsi de suite. Supposons aussi que le contenu du fichier exp1.xlsx ressemble à ceci : Ce fichier est très convivial pour un humain, mais pas pour un ordinateur. Disons qu'un jour, vous décidez (ou votre patron décide) que vous avez besoin d'une base de données pour organiser vos résultats plutôt que de les conserver dans vingt-six fichiers Excel différents. Si [...]

By |2018-02-08T13:33:20+00:006 février 2018|Categories: Bioinformatique, Biologie|0 Commentaires

Un exemple utilisant multiprocessing et plus

Récemment, j'ai eu à chercher une structure chimique donnée dans une liste de structures. En utilisant les librairies python de chimie informatique pybel et rdkit, je suis facilement arrivée à faire cette recherche, mais celle-ci prenait beaucup trop de temps à mon goût. En me demandant comment l'accélérer, je me suis souvenue de l'article de blog de Jean-Philippe intitulé "Faites travailler vos CPUs !". J'ai donc décidé de suivre ses instructions et de faire travailler mes CPUs! But Trouver une [...]

By |2017-12-11T12:56:26+00:0011 décembre 2017|Categories: Bioinformatique, Informatique, Performance|0 Commentaires