Apprends-moi l’art du boxplot!

Les boxplots ou diagramme de quartiles sont partout! Les éditeurs aiment les diagrammes de quartiles. Mais demandez à quelques personnes et la plupart ne pourront même pas vous expliquer ce que représente cet amas de lignes! Récemment, j'ai voulu examiner l'expression génique entre deux échantillons pour un certain gène. Le graphique standard pour ceci est bien sûr  ***roulement de tambour***... Le boxplot! Fait intéressant #1: Saviez-vous que les diagrammes de quartiles sont également appelés "boîte moustache"*? Et si on les [...]

By |2016-11-08T09:30:17+00:0021 septembre 2014|Categories: R, Statistiques, Visualisation de données|1 commentaire

Enrichissements et test exact de Fisher

En travaillant sur un ensemble de données AML (leucémie aiguë myéloïde), je suis tombé sur un gène X. Lorsque son expression est haute, une mutation dans le gène Y est présente dans 50% des échantillons (cette mutation n'étant présente que dans 20% de l'ensemble de données). Y aurait-il un lien entre ces deux observations? Et si on y mettait des chiffres: des 131 échantillons de l'ensemble de données, 28 ont une mutation dans le gène Y, 6 expriment hautement le [...]

By |2016-11-08T09:30:17+00:0012 septembre 2014|Categories: Bioinformatique, Statistiques|0 Commentaires

RStudio et le contrôle de versions

Un système de contrôle de versions est simplement une façon de suivre les modifications effectuées dans un fichier au fil du temps. Je parie que vous utilisez déjà un système de contrôle de versions sans même le savoir! Lorsque vous faites une copie d'un script avant de le modifier et que vous le renommez v2 par exemple, vous utilisez un système de contrôle de versions. Quoique fonctionnel, votre système manuel peut bien vite s'avérer pénible à gérer. C'est pourquoi ça [...]

By |2017-05-01T10:29:27+00:0010 juin 2014|Categories: R|Tags: , , |0 Commentaires

python et pandas

La réputation de R n'est plus à faire. C'est un language incontournable surtout pour la visualisation de données. Mais il lui arrive d'être un petit peu lent. Particulièrement lors du traitement de gros ensembles de données. Si vous n'avez pas besoin de générer de graphes sensationels ou que vous n'avez pas le temps d'attendre, il existe une alternative en python pour rapidement manipuler des données. Le module pandas (Python Data Analysis Library) offre un moyen d'aisément manipuler des données directement [...]

By |2017-04-29T17:24:31+00:0017 avril 2014|Categories: Analyse de données, Python|Tags: , |0 Commentaires

Qu’est-ce qui est le plus rapide?

Bien souvent, nous faisons les choses par habitude. Lorsque nous devenons confortables, nous avons tendance à rester dans notre zone de confort et à toujours faire les choses de la même façon. C'est exactement la même chose en programmation. Jusqu'au jour où le doute nous frappe. Est-ce qu'il y aurait un moyen plus rapide d'effectuer cette tâche? Lorsque ce jour viendra (si la dite tâche est en Python), le module timeit pourra vous aider! Bien sûr, il existe d'autres moyens [...]

By |2017-05-01T10:27:06+00:002 avril 2014|Categories: Performance, Python|0 Commentaires
Go to Top