boucherg

About Geneviève

Mon parcours a débuté en biochimie, mais c ’est en bioinformatique que je m ’amuse depuis plusieurs années : que ce soit en analysant et visualisant des données en R, en construisant des outils web interactifs en javascript ou en explorant des algorithmes d ’apprentissage automatique en python.

Régression logistique et GTEx

Lorsqu'on travaille avec toutes sortes de données, il arrive parfois que nous voulons prédire la valeur d'une variable qui n'est pas numérique. Dans ces cas-là, la régression logistique est tout à fait appropriée. On peut dire qu'elle est s'apparente à une régression linéaire sauf que la variable dépendante est une catégorie. Vous vous souvenez de la fonction de la régression linéaire où l'on essaie d'estimer les paramètres beta (les coefficients) qui s'ajustent le mieux la droite à nos données: \begin{equation} [...]

By | 2017-01-31T08:53:45+00:00 27 janvier 2017|Categories: Bioinformatique, Data Analysis, Python|0 Commentaires

Pivoter des tables: du format long à large

En tant que bio-informaticiens, nous avons souvent à manipuler des données qui ne sont pas organisées comme nous le voudrions. Un cas souvent rencontré est l'obtention de données qui se trouvent dans un format "long" au lieu de les avoir dans le format plus habituel, "large". Pour ceux qui sont familiers avec la librairie ggplot du langage R, vous connaissez très bien le format "long". C'est le format requis par ggplot pour lui permettre de produire ses élégants graphiques. En [...]

By | 2016-11-14T15:39:40+00:00 14 novembre 2016|Categories: Python, R|0 Commentaires

Bonnes ressources pour apprendre R

Comme ce sont les vacances d'été, pourquoi ne pas en profiter pour apprendre un peu de R. Il existe d'innombrables ressources gratuites en ligne. Pour qui veut apprendre, il suffit d'y mettre le temps. Vidéos Coursera est un incontournable dans le domaine de l'apprentissage en ligne. Il existe quelques bons cours sur R sous forme de vidéo qui traitent aussi plus ou moins de génomique : https://www.coursera.org/learn/r-programming https://www.coursera.org/learn/exploratory-data-analysis https://www.coursera.org/learn/bioconductor (Bioconductor est un répertoire de modules R pour la biologie). Livres [...]

By | 2016-11-08T09:30:04+00:00 11 juillet 2016|Categories: Bioinformatique, R|0 Commentaires

Apprentissage automatique en sciences de la vie

L'apprentissage automatique est de plus en plus populaire parmi les bio-informaticiens et les biologistes. Ces algorithmes ont montré qu'ils pouvaient donner des résultats très intéressants et sont de plus en plus accessibles. Ce type de modèle peut désormais être appliqué facilement à un ensemble de données en utilisant des librairies en R ou en Python. Par exemple, la librairie Python, Scikit-learn, implémente plusieurs des algorithmes les plus connus tels que les modèles de régression, la forêt d'arbres décisionnels (Random Forest), [...]

By | 2016-11-08T09:30:05+00:00 18 mai 2016|Categories: Apprentissage automatique|0 Commentaires

Qu ’est-ce qui est le plus rapide? Version R

Quand j'ai commencé à utiliser R, il y a une dizaine d'années, la communauté d'utilisateurs était beaucoup plus petite! Il n'y avait pas de sites comme R-bloggers pour s'inspirer ni de ggplot2 pour faire de beaux graphiques. Et c'était les débuts d'une implémentation alternative de R (autre que celle de CRAN) connue sous le nom de Revolution R de la compagnie Revolution Analytics. Revolution R tentait surtout de séduire les compagnies en offrant un R plus performant et plus rapide. [...]

By | 2016-11-08T09:30:07+00:00 12 février 2016|Categories: R|0 Commentaires