Bioinformatique

Pensez comme un ordinateur

Supposons que tous vos résultats pour un projet donné sont conservés dans des fichiers Excel nommés exp1.xlsx, exp2_20170708.xlsx, exp_prolif_072017.xlsx, et ainsi de suite. Supposons aussi que le contenu du fichier exp1.xlsx ressemble à ceci : Ce fichier est très convivial pour un humain, mais pas pour un ordinateur. Disons qu'un jour, vous décidez (ou votre patron décide) que vous avez besoin d'une base de données pour organiser vos résultats plutôt que de les conserver dans vingt-six fichiers Excel différents. Si [...]

By | 2018-02-08T13:33:20+00:00 6 février 2018|Categories: Bioinformatique, Biologie|0 Commentaires

Un exemple utilisant multiprocessing et plus

Récemment, j'ai eu à chercher une structure chimique donnée dans une liste de structures. En utilisant les librairies python de chimie informatique pybel et rdkit, je suis facilement arrivée à faire cette recherche, mais celle-ci prenait beaucup trop de temps à mon goût. En me demandant comment l'accélérer, je me suis souvenue de l'article de blog de Jean-Philippe intitulé "Faites travailler vos CPUs !". J'ai donc décidé de suivre ses instructions et de faire travailler mes CPUs! But Trouver une [...]

By | 2017-12-11T12:56:26+00:00 11 décembre 2017|Categories: Bioinformatique, Informatique, Performance|0 Commentaires

Tutoriels de réduction de dimensionalité: 1- Analyse de composantes principales

Comprendre la réduction de dimensionalité Si vous utilisez de larges jeux de données (transcriptomes, séquençage de génome, protéomes), tôt ou tard, vous tomberez sur quelque chose qui porte le nom "d'analyse de composantes principales" (Principal Components Analysis, en anglais, abrévié PCA). PCA est une méthode de réduction de dimensionalité, une famille large de méthodes qui font exactement ce que leur nom dit: elles réduisent la dimensionalité. Mais qu'est-ce que ça veut dire? Qu'est-ce qu'une dimension et pourquoi on voudrait les [...]

Flux de données et programmation réactive

Qu'est-ce que tout cela ? ReactiveX est la combinaison des meilleures idées du modèle observateur, du modèle itérateur et de la programmation fonctionnelle. À l'aide des librairies Rx, vous pouvez aisément: - Créer des flux de données ou d'évènements à partir de sources diverses comme des fichiers ou des services web - Fusionner ou transformer ces flux grâce à divers opérateurs - Souscrire aux flux et "réagir" à leurs émissions pour produire de nouvelles données L'intérêt pour la programmation réactive [...]

Filtrer des SNPs à l’aide de pyGeno

En parcourant le contenu de notre blogue en plein croissance (beau travail, collègues !), je me rends compte qu'aucun de nous n'a encore publié un article en rapport avec la fantastique ressource bioinformatique qu'est pyGeno (qui plus est, un logiciel maison). Il se trouve qu'en plus d'être mon tour de publier un article, je dois justement faire usage de pyGeno afin de générer un jeu de données, quelle merveilleuse coïncidence ! Je concentrerai cet article sur l'écriture d'un SNP filter, [...]

By | 2017-04-29T17:55:25+00:00 9 décembre 2016|Categories: Bioinformatique, Python|Tags: , |0 Commentaires