Bioinformatique

Régression logistique et GTEx

Lorsqu'on travaille avec toutes sortes de données, il arrive parfois que nous voulons prédire la valeur d'une variable qui n'est pas numérique. Dans ces cas-là, la régression logistique est tout à fait appropriée. On peut dire qu'elle est s'apparente à une régression linéaire sauf que la variable dépendante est une catégorie. Vous vous souvenez de la fonction de la régression linéaire où l'on essaie d'estimer les paramètres beta (les coefficients) qui s'ajustent le mieux la droite à nos données: \begin{equation} [...]

By | 27 janvier 2017|Categories: Bioinformatique, Data Analysis, Python|0 Commentaires

Filtrer des SNPs à l’aide de pyGeno

En parcourant le contenu de notre blogue en plein croissance (beau travail, collègues !), je me rends compte qu'aucun de nous n'a encore publié un article en rapport avec la fantastique ressource bioinformatique qu'est pyGeno (qui plus est, un logiciel maison). Il se trouve qu'en plus d'être mon tour de publier un article, je dois justement faire usage de pyGeno afin de générer un jeu de données, quelle merveilleuse coïncidence ! Je concentrerai cet article sur l'écriture d'un SNP filter, [...]

By | 9 décembre 2016|Categories: Bioinformatique, Python|0 Commentaires

Introduction à cowplot, pour combiner plusieurs plots avec R

Bonjour à tous, aujourd'hui, nous allons voir une extension de la librairie ggplot2: cowplot Some helpful extensions and modifications to the 'ggplot2' package. In particular, this package makes it easy to combine multiple 'ggplot2' plots into one and label them with letters, e.g. A, B, C, etc., as is often required for scientific publications. Comme on peut le lire dans la description, cette librairie permet de créer des figures avec plusieurs graphiques (plots), mais pas uniquement. Il est aussi possible de [...]

By | 28 novembre 2016|Categories: Bioinformatique, Biologie, Data Analysis, R, Représentation grahique|0 Commentaires

Introduction à la bio-informatique dans un conteneur

Une récente tendance issue de l’informatique nuagique semble intéresser de plus en plus la communauté bio-informatique. Cette tendance est de développer et de déployer une application dans un conteneur. Ce conteneur contient non seulement l’application mais les librairies nécessaires et une version minimaliste des applications du système d’exploitation. Une fois le conteneur construit, il est immédiatement prêt à être utilisé sur un ordinateur hôte qui contient l’environnent requis pour démarrer le conteneur. Pour un développeur, ceci est très intéressant puisque [...]

By | 21 juillet 2016|Categories: Bioinformatique|0 Commentaires

Bonnes ressources pour apprendre R

Comme ce sont les vacances d'été, pourquoi ne pas en profiter pour apprendre un peu de R. Il existe d'innombrables ressources gratuites en ligne. Pour qui veut apprendre, il suffit d'y mettre le temps. Vidéos Coursera est un incontournable dans le domaine de l'apprentissage en ligne. Il existe quelques bons cours sur R sous forme de vidéo qui traitent aussi plus ou moins de génomique : https://www.coursera.org/learn/r-programming https://www.coursera.org/learn/exploratory-data-analysis https://www.coursera.org/learn/bioconductor (Bioconductor est un répertoire de modules R pour la biologie). Livres [...]

By | 11 juillet 2016|Categories: Bioinformatique, R|0 Commentaires