boucherg

About Geneviève

Mon parcours a débuté en biochimie, mais c ’est en bioinformatique que je m ’amuse depuis plusieurs années : que ce soit en analysant et visualisant des données en R, en construisant des outils web interactifs en javascript ou en explorant des algorithmes d ’apprentissage automatique en python.

Apprentissage automatique en sciences de la vie

L'apprentissage automatique est de plus en plus populaire parmi les bio-informaticiens et les biologistes. Ces algorithmes ont montré qu'ils pouvaient donner des résultats très intéressants et sont de plus en plus accessibles. Ce type de modèle peut désormais être appliqué facilement à un ensemble de données en utilisant des librairies en R ou en Python. Par exemple, la librairie Python, Scikit-learn, implémente plusieurs des algorithmes les plus connus tels que les modèles de régression, la forêt d'arbres décisionnels (Random Forest), [...]

By |2016-11-08T09:30:05+00:0018 mai 2016|Categories: Apprentissage automatique|0 Commentaires

Qu ’est-ce qui est le plus rapide? Version R

Quand j'ai commencé à utiliser R, il y a une dizaine d'années, la communauté d'utilisateurs était beaucoup plus petite! Il n'y avait pas de sites comme R-bloggers pour s'inspirer ni de ggplot2 pour faire de beaux graphiques. Et c'était les débuts d'une implémentation alternative de R (autre que celle de CRAN) connue sous le nom de Revolution R de la compagnie Revolution Analytics. Revolution R tentait surtout de séduire les compagnies en offrant un R plus performant et plus rapide. [...]

By |2016-11-08T09:30:07+00:0012 février 2016|Categories: Performance, R|0 Commentaires

Permutations

Supposons que vous ayez ces deux groupes de données : g1 <- c(55, 65, 58) g2 <- c(12, 18, 32) Nous voulons savoir si ces deux groupes appartiennent à la même distribution ou sont considérés comme deux groupes différents. Nous serions probablement tenté, pour élucider la question, d'appliquer un test de Student, le test-t. t.test(g1, g2) ## Welch Two Sample t-test ## ## data: g1 and g2 ## t = 5.8366, df = 2.9412, p-value = 0.01059 ## alternative hypothesis: [...]

By |2017-04-30T10:07:23+00:0016 octobre 2015|Categories: Analyse de données, R, Statistiques|0 Commentaires

N’ignorez pas les avertissements!

Maintenant que vous utilisez R régulièrement, je suis certaine que vous avez remarqué que, parfois, R vous parle. Lorsque vous faites quelque chose d'erroné, R répond avec un message écrit en rouge dans la console. Combien d'entre vous lisent réellement ces messages d'erreur? Si vous prenez le temps de les lire attentivement, vous verrez qu'ils vous informent du problème survenu. Prenons cet exemple: > sum(c('1','3','4','4')) Error in sum(c("1", "3", "4", "4")) : invalid 'type' (character) of argument R vous indique [...]

By |2017-04-30T16:26:10+00:003 septembre 2015|Categories: R, Statistiques|1 commentaire

Les graphes de Kaplan-Meier

Lorsqu'on travaille avec des données liées au cancer, un de nos objectifs est parfois de trouver des caractéristiques (mutation, information clinique, expression génique, ...) associées au prognostic, i.e. des caractéristiques reliées à l'évolution probable de la maladie. Si c'est aussi l'un de vos objectifs, vous aurez à faire une analyse de survie.  Les analyses de survie sont constituées d'un ensemble de méthodes qui essaient de modéliser à quel moment un événement d'intérêt apparaîtra (temps d'apparition), cet événement étant souvent le [...]

By |2016-11-08T09:30:14+00:0019 février 2015|Categories: Bioinformatique, Statistiques|Tags: |0 Commentaires