Comprendre comment fonctionne kallisto

En 2016,  Bray et al. ont introduit une nouvelle méthode basée sur les k-mers pour estimer l'abondance des isoformes dans les données de RNA-Seq.  La méthode s'appelle kallisto.  Comparée aux méthodes existantes, pour une précision de résultat comparable, kallisto est plus rapide et plus efficace en mémoire ce qui constitue une amélioration significative.  En fait, kallisto est capable de quantifier l'expression d'un échantillon en l'espace d'une vingtaine de minutes au lieu de prendre plusieurs heures.  Comme cette méthode est légère et conviviale, [...]

By | 2018-03-29T07:03:44+00:00 28 mars 2018|Categories: Analyse de données, Analyse de données, Bioinformatique|0 Commentaires

Pensez comme un ordinateur

Supposons que tous vos résultats pour un projet donné sont conservés dans des fichiers Excel nommés exp1.xlsx, exp2_20170708.xlsx, exp_prolif_072017.xlsx, et ainsi de suite. Supposons aussi que le contenu du fichier exp1.xlsx ressemble à ceci : Ce fichier est très convivial pour un humain, mais pas pour un ordinateur. Disons qu'un jour, vous décidez (ou votre patron décide) que vous avez besoin d'une base de données pour organiser vos résultats plutôt que de les conserver dans vingt-six fichiers Excel différents. Si [...]

By | 2018-02-08T13:33:20+00:00 6 février 2018|Categories: Bioinformatique, Biologie|0 Commentaires

Un exemple utilisant multiprocessing et plus

Récemment, j'ai eu à chercher une structure chimique donnée dans une liste de structures. En utilisant les librairies python de chimie informatique pybel et rdkit, je suis facilement arrivée à faire cette recherche, mais celle-ci prenait beaucup trop de temps à mon goût. En me demandant comment l'accélérer, je me suis souvenue de l'article de blog de Jean-Philippe intitulé "Faites travailler vos CPUs !". J'ai donc décidé de suivre ses instructions et de faire travailler mes CPUs! But Trouver une [...]

By | 2017-12-11T12:56:26+00:00 11 décembre 2017|Categories: Bioinformatique, Informatique, Performance|0 Commentaires

Le surapprentissage et la régularisation

Cette série d'articles sur l'apprentissage machine ne serait complète sans y couvrir le surapprentissage et la régularisation. Le surapprentissage L'une des difficultés rencontrée lors de l'application de techniques d'apprentissage machine est le surapprentissage. Plus les techniques utilisées sont puissantes (grand nombre de paramètres libres), plus nous sommes susceptibles au surapprentissage. Lors du surapprentissage, le modèle diverge du principe du rasoir d'Occam en augmentant si bien son niveau de complexité qu'il finit par essentiellement mémoriser chaque détails de l'ensemble d'entraînement. Un modèle [...]

By | 2017-10-30T12:54:24+00:00 30 octobre 2017|Categories: Analyse de données, Apprentissage automatique|0 Commentaires

Laissez-le errer… Libérer votre code !

Aujourd'hui, j'ai pensé faire quelque chose de légèrement différent et discuter un peu sur les attentes que l'on peut avoir à rendre son code public. Je me suis dit qu'il serait intéressant d'interviewer un membre de notre groupe qui possède une solide expérience dans ce type d'activité, Tariq Daouda, afin de tirer profit de ses expériences passées. Alors, sans plus attendre, on se jette à l'eau ! JP: Bonjour Tariq, je suis bien content que tu aies accepté cette invitation. [...]

By | 2017-10-20T13:23:27+00:00 16 octobre 2017|Categories: Informatique|Tags: , |0 Commentaires