Bioinformatique

Lecture de tableaux: charger des données dans R sans soucis

La première chose que j'ai appris à faire dans R est de charger un tableau de données. D'habitude, l'aventure R commence avec l'aide d'une personne plus expérimentée qui vous montre comment charger vos données dans le logiciel. Typiquement, la commande requise s'apparente à : data<-read.table("~/dossier/datafile.txt") Vous allez sûrement ajouter plusieurs autres paramètres aux parenthèses, tels que "row.names=0" ou "header=TRUE" ou, "sep="\t"", pour s'assurer que le fichier est lu correctement. Cette manière de fonctionner est parfaitement correcte pour de petits jeux de [...]

By |2017-04-29T17:15:34+00:005 février 2015|Categories: Bioinformatique, R|Tags: |2 Comments

Une tâche, trois façons

Il y a habituellement plus d'une façon d'accomplir une tâche donnée. Certaines sont meilleures que d'autres, plusieurs sont équivalentes. Décider laquelle utiliser dépend bien souvent du temps de calcul, de la facilité d'utilisation et/ou de nos préférences et compétences personnelles. Supposons que j'aie une matrice contenant des milliers de positions pour un chromosome donné avec les colonnes suivantes : Nom_de_l'élément, Début, Fin. Toutes les positions se rapportent à un même chromosome et la taille des éléments est variable. Pour une [...]

By |2017-05-01T10:17:05+00:0015 janvier 2015|Categories: Bioinformatique, R|0 Commentaires

Trafiquer le test exact de Fisher pour les besoins du biologiste

Le test exact de Fisher est largement utilisé en bioinformatique. Il est d'ailleurs à la base d'un grand nombre d'outils recherchant des enrichissements pour des ensembles de gènes ou des voies biologiques. Je n'introduirai pas le test en tant que tel dans cet article car plusieurs l'ont déjà fait (commencez ici!). Je vais plutôt me concentrer sur l'incompatibilité qui existe parfois entre ce que calcule le test et ce qui est requis par les biologistes. Dans le test exact de [...]

By |2014-12-08T15:49:54+00:008 décembre 2014|Categories: Bioinformatique, Biologie, Statistiques|Tags: |0 Commentaires

Diagrammes de Venn: un cauchemar pour la visualisation de données

J'ai récemment lu un article introduisant un aligneur (read mapper) très inspirant pour les données de séquençage d'ARN (RNA-Seq).  Dans la présentation de leurs résultats, les auteurs ont voulu comparer le nombre de jonctions d'épissage détectées par quatre aligneurs différents; leur but étant de montrer le chevauchement entre leur méthode et les différentes méthodes existantes. Ils ont choisi de présenter ces données sous la forme d'un diagramme de Venn (voir la figure 1). Je suis resté plusieurs minutes à fixer cette [...]

By |2019-06-05T10:29:11+00:0020 octobre 2014|Categories: Bioinformatique, Statistiques, Visualisation de données|0 Commentaires

Les symboles de gènes, un défi

Un jour, c'est presque certain, vous aurez entre les mains une liste de noms de gènes désuets.  Vous vous direz sûrement que les mettre à jour est une tâche facile.  En apparences, peut-être! Parce qu'il y a le mot "bio" dans bioinformaticien,  je dirais que mettre à jour les symboles de gènes me rappelle le cycle futile.  Selon la définition de  Wikipedia (dont voici ma traduction libre), un cycle futile se produit quand deux voies métaboliques sont actives simultanément mais avec deux [...]

By |2016-11-08T09:30:17+00:0029 septembre 2014|Categories: Bioinformatique, Biologie|0 Commentaires
Go to Top