expression de gènes

Mégadonnées, gros défi

Vous avez certainement déjà entendu le mot mégadonnées. Ou "Big Data". Notamment, si vous avez lu l'article de Simon Mathien sur le site de l'IRIC. (Si vous ne l'avez pas lu, je vous encourage à le lire!) Il existe plusieurs définitions (ou interprétations) du mot mégadonnées qui sont bien résumées par les deux définitions suivantes : Data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges; (also) the branch of computing [...]

Régression logistique et GTEx

Lorsqu'on travaille avec toutes sortes de données, il arrive parfois que nous voulons prédire la valeur d'une variable qui n'est pas numérique. Dans ces cas-là, la régression logistique est tout à fait appropriée. On peut dire qu'elle est s'apparente à une régression linéaire sauf que la variable dépendante est une catégorie. Vous vous souvenez de la fonction de la régression linéaire où l'on essaie d'estimer les paramètres beta (les coefficients) qui s'ajustent le mieux la droite à nos données: \begin{equation} [...]

Effectuer une PCA sur les données de Leucégène

GEO est une source extrêmement riche de données de profils transcriptionnels, mais télécharger et préparer ces données constituent bien souvent un obstacle pour les apprentis bioinformaticiens. La démonstration qui suit devrait faciliter vos premiers pas, j'utiliserai le jeu de données de Leucégène. Une fois ces données chargées et prêtes à être utilisées dans R, je présenterai une perspective simplifiée mais pratique de l'utilisation de la PCA (Principal Component Analysis) pour faire de l'analyse exploratoire d'un ensemble de profiles transcriptionnels. Chargement des données [...]

By |2017-04-29T23:05:37+00:0016 novembre 2015|Categories: Analyse de données, R|Tags: , |0 Commentaires