boucherg

About Geneviève

Mon parcours a débuté en biochimie, mais c ’est en bioinformatique que je m ’amuse depuis plusieurs années : que ce soit en analysant et visualisant des données en R, en construisant des outils web interactifs en javascript ou en explorant des algorithmes d ’apprentissage automatique en python.

Une tâche, trois façons

Il y a habituellement plus d'une façon d'accomplir une tâche donnée. Certaines sont meilleures que d'autres, plusieurs sont équivalentes. Décider laquelle utiliser dépend bien souvent du temps de calcul, de la facilité d'utilisation et/ou de nos préférences et compétences personnelles. Supposons que j'aie une matrice contenant des milliers de positions pour un chromosome donné avec les colonnes suivantes : Nom_de_l'élément, Début, Fin. Toutes les positions se rapportent à un même chromosome et la taille des éléments est variable. Pour une [...]

By |2017-05-01T10:17:05+00:0015 janvier 2015|Categories: Bioinformatique, R|0 Commentaires

Visualisation de données : quelques bonnes pratiques

Le dernier article de Sébastien présentait un cas de graphique particulièrement difficile à lire. En effet, un diagramme de Venn à quatre ensembles représente un bon exemple d'une représentation graphique qui a un peu mal tourné. Les bonnes pratiques en visualisation de données constituent un sujet très à la mode par les temps qui courent. Et pas seulement en sciences. Cela intéresse autant les journalistes que les analystes en intelligence d'affaires. La foule était d'ailleurs assez hétéroclite lors de la [...]

By |2017-04-29T17:23:28+00:0031 octobre 2014|Categories: Visualisation de données|0 Commentaires

Les symboles de gènes, un défi

Un jour, c'est presque certain, vous aurez entre les mains une liste de noms de gènes désuets.  Vous vous direz sûrement que les mettre à jour est une tâche facile.  En apparences, peut-être! Parce qu'il y a le mot "bio" dans bioinformaticien,  je dirais que mettre à jour les symboles de gènes me rappelle le cycle futile.  Selon la définition de  Wikipedia (dont voici ma traduction libre), un cycle futile se produit quand deux voies métaboliques sont actives simultanément mais avec deux [...]

By |2016-11-08T09:30:17+00:0029 septembre 2014|Categories: Bioinformatique, Biologie|0 Commentaires

RStudio et le contrôle de versions

Un système de contrôle de versions est simplement une façon de suivre les modifications effectuées dans un fichier au fil du temps. Je parie que vous utilisez déjà un système de contrôle de versions sans même le savoir! Lorsque vous faites une copie d'un script avant de le modifier et que vous le renommez v2 par exemple, vous utilisez un système de contrôle de versions. Quoique fonctionnel, votre système manuel peut bien vite s'avérer pénible à gérer. C'est pourquoi ça [...]

By |2017-05-01T10:29:27+00:0010 juin 2014|Categories: R|Tags: , , |0 Commentaires

python et pandas

La réputation de R n'est plus à faire. C'est un language incontournable surtout pour la visualisation de données. Mais il lui arrive d'être un petit peu lent. Particulièrement lors du traitement de gros ensembles de données. Si vous n'avez pas besoin de générer de graphes sensationels ou que vous n'avez pas le temps d'attendre, il existe une alternative en python pour rapidement manipuler des données. Le module pandas (Python Data Analysis Library) offre un moyen d'aisément manipuler des données directement [...]

By |2017-04-29T17:24:31+00:0017 avril 2014|Categories: Analyse de données, Python|Tags: , |0 Commentaires
Go to Top