JPLaverdure

About Jean-Philippe

Bien qu'originellement formé en biologie moléculaire, j'ai vite réalisé que mon coeur appartenait à la bioinformatique ! (Comment peut-on être confronté à un HMM et ne pas tomber en amour ?). Je passe le gros des mes journées à écrire du Python mais je dois admettre que je commence à apprécier mes escapades occasionnelles en R.
Rockin' out at the platform !

Traitement parallèle facile avec R

Poursuivant sur ma lancée d'exploration de code à haute performance, regardons aujourd'hui comment ajouter du traitement parallèle dans vos scripts R. Bien que plusieurs options existent pour paralléliser le traitement de vos données, concentrons nous sur quelque chose de très facile à mettre en place pour commencer. Il y a quelques temps, j'ai eu à écrire un script ayant pour but de rouler un grand nombre de regressions logistiques (à l'aide du package glm) dans un effort de modélisation de [...]

By |2016-03-14T16:22:33-05:0014 mars 2016|Categories: Performance, R|Tags: |0 Commentaires

Arguments de « grep » que tout bioinformaticien devrait connaitre

Le shell, ainsi que la myriade d'outils en ligne de commande qu'il nous offre est un grand ami lorsque vient le temps de manipuler des fichiers de données. Et soyons francs, manipuler des fichiers, c'est une bonne partie du travail d'un bioinformaticien. Cependant, puisque nous avons rarement le temps de survoler l'ensemble des arguments offerts par les différents programmes d'Unix, je me suis dit que je vous présenterais mes préférés de l'utilitaire grep. Je prends pour acquis que tout le [...]

By |2017-04-29T17:09:17-05:0027 novembre 2015|Categories: Analyse de données, Scripts|Tags: , |0 Commentaires

Faites travailler vos CPUs !

Si vous êtes comme moi, vous avez sûrement réalisé que, par défaut, les scripts python que l'on écrit n'utilisent qu'une portion de la puissance computationnelle à notre disposition.. Vous vous êtes sûrement dit: J'ai pourtant payé une somme rondelette pour un CPU à 4 coeurs ! Mais qu'est-ce qui se passe ? Bien que la plupart des CPUs modernes comportent plusieurs coeurs, le code que l'on écrit doit aussi être formatté adéquatement afin d'en tirer pleinement avantage. Alors explorons ensemble [...]

By |2017-04-12T12:00:21-05:0012 juillet 2015|Categories: Performance, Python|Tags: |0 Commentaires

Gestion des versions du contenu d’une BD avec SQLAlchemy

Une des fonctionnalités phare requises d'un SGL est la sauvegarde de l'historique des changements appliqués aux données storées dans la base de données sous-jacente. Ceci peut représenter une fonctionnalité non triviale à implémenter et/ou déployer et il existe certainement plusieurs visions de la forme que cette implémentation devrait prendre. Heureusement pour tous les fans de SQLAlchemy, une solution prête à l'usage est suggérée sur la page des exemples de l'ORM (en anglais seulement). Bien que la page d'exemple suggère différents [...]

By |2017-04-29T17:27:37-05:005 octobre 2014|Categories: Database, Informatique, Python|Tags: , , , |0 Commentaires