Visualisation de données : quelques bonnes pratiques

Le dernier article de Sébastien présentait un cas de graphique particulièrement difficile à lire. En effet, un diagramme de Venn à quatre ensembles représente un bon exemple d'une représentation graphique qui a un peu mal tourné. Les bonnes pratiques en visualisation de données constituent un sujet très à la mode par les temps qui courent. Et pas seulement en sciences. Cela intéresse autant les journalistes que les analystes en intelligence d'affaires. La foule était d'ailleurs assez hétéroclite lors de la [...]

By |2017-04-29T17:23:28+00:0031 octobre 2014|Categories: Visualisation de données|0 Commentaires

Diagrammes de Venn: un cauchemar pour la visualisation de données

J'ai récemment lu un article introduisant un aligneur (read mapper) très inspirant pour les données de séquençage d'ARN (RNA-Seq).  Dans la présentation de leurs résultats, les auteurs ont voulu comparer le nombre de jonctions d'épissage détectées par quatre aligneurs différents; leur but étant de montrer le chevauchement entre leur méthode et les différentes méthodes existantes. Ils ont choisi de présenter ces données sous la forme d'un diagramme de Venn (voir la figure 1). Je suis resté plusieurs minutes à fixer cette [...]

By |2019-06-05T10:29:11+00:0020 octobre 2014|Categories: Bioinformatique, Statistiques, Visualisation de données|0 Commentaires

Dois-je calculer une « p-value »?

Le besoin d'appliquer des statistiques appropriées en génomique a été bien documenté.  Plusieurs approches statistiques astucieuses ont été mises au point et de nombreux logiciels ont été développés (certains gratuits et très performants).  Malgré tout, je reçois fréquemment la visite d'un étudiant ou chercheur qui se demande s'il doit rapporter la magnitude d'un effet (ex. le gène X est sur-exprimé 4.5 fois dans la condition A vs B) ou le niveau de signification statistique de cette magnitude (ex. le gène X est [...]

By |2016-11-08T09:30:16+00:0014 octobre 2014|Categories: Statistiques|0 Commentaires

Gestion des versions du contenu d’une BD avec SQLAlchemy

Une des fonctionnalités phare requises d'un SGL est la sauvegarde de l'historique des changements appliqués aux données storées dans la base de données sous-jacente. Ceci peut représenter une fonctionnalité non triviale à implémenter et/ou déployer et il existe certainement plusieurs visions de la forme que cette implémentation devrait prendre. Heureusement pour tous les fans de SQLAlchemy, une solution prête à l'usage est suggérée sur la page des exemples de l'ORM (en anglais seulement). Bien que la page d'exemple suggère différents [...]

By |2017-04-29T17:27:37+00:005 octobre 2014|Categories: Database, Informatique, Python|Tags: , , , |0 Commentaires

Les symboles de gènes, un défi

Un jour, c'est presque certain, vous aurez entre les mains une liste de noms de gènes désuets.  Vous vous direz sûrement que les mettre à jour est une tâche facile.  En apparences, peut-être! Parce qu'il y a le mot "bio" dans bioinformaticien,  je dirais que mettre à jour les symboles de gènes me rappelle le cycle futile.  Selon la définition de  Wikipedia (dont voici ma traduction libre), un cycle futile se produit quand deux voies métaboliques sont actives simultanément mais avec deux [...]

By |2016-11-08T09:30:17+00:0029 septembre 2014|Categories: Bioinformatique, Biologie|0 Commentaires
Go to Top