Analyse de données

ggplot2 101 :Visualisation simple pour une analysis simple

Il est souvent plus facile d'interpréter des données biologiques lorsqu'il est possible de les visualiser à l'aide d'une représentation graphique. Cela peut être fait via l'exploitation de différentes options de ggplot2, un progiciel pour la représentation graphique en R. Dans le billet qui suit, je vous présenterai quelques-unes de mes astuces favorites pour la visualisation de données: rien de trop poussé ou complexe, parfait pour les utilisateurs avancés de R, tout comme les utilisateurs un peu plus débutants! Les extraits de [...]

By | 2017-05-19T15:09:43+00:00 19 mai 2017|Categories: Analyse de données, R, Visualisation de données|1 commentaire

Mégadonnées, gros défi

Vous avez certainement déjà entendu le mot mégadonnées. Ou "Big Data". Notamment, si vous avez lu l'article de Simon Mathien sur le site de l'IRIC. (Si vous ne l'avez pas lu, je vous encourage à le lire!) Il existe plusieurs définitions (ou interprétations) du mot mégadonnées qui sont bien résumées par les deux définitions suivantes : Data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges; (also) the branch of computing [...]

Introduction à la régression linéaire

L'objectif premier du scientifique des données (data scientist) est l'exploration de données afin d'en découvrir des relations d'intérêt. Des méthodes statistiques et d'apprentissage machine lui servent d'outils pour la découverte et la modélisation de telles relations. L'information découverte par ces méthodes peut ensuite être mise en pratique. Par exemple, en médecine clinique, l'élaboration d'un modèle prédictif basé sur des données cliniques peut servir d'outil prognostic afin de guider un traitement. Régression linéaire simple L'une des méthodes la plus simple à la disposition du scientifique des données est la régression [...]

Criblage chimique: évaluation de la sensibilité aux molécules

L’étude de la réponse cellulaire face à un composé chimique est cruciale au développement de nouvelles molécules thérapeutiques. Une telle analyse se fait généralement par expérience de criblage, où les cellules (spécifiques à une maladie, telle la leucémie) sont exposées aux composés chimiques d’intérêt pour différentes concentrations. La réponse ou la sensibilité de ces cellules est conventionnellement quantifiée par la valeur de l’IC50 ou de l’EC50. Voici quelques notions importantes à garder en tête lorsque nous analysons ces valeurs. IC50/EC50 [...]

By | 2017-04-29T16:29:23+00:00 13 février 2017|Categories: Analyse de données|Tags: |0 Commentaires

Une implémentation en javascript de la version non centrée du test exact de Fisher

Mon article précédent expliquait pourquoi la version non-centrée du test exact de Fisher est plus appropriée dans la plupart des cas rencontrés en bio-informatique. Je poursuis en présentant maintenant une implémentation de ce test en Javascript qui pourrait facilement être intégrée à une interface web. Même si le Javascript est un langage très mal adapté à l'implémentation de méthodes statistiques, j'espère que cet article présentera tous les détails nécessaires pour simplifier l'implémentation de ce test dans d'autres langages, selon les besoins. À tout le moins, [...]

By | 2017-04-29T17:50:55+00:00 9 janvier 2017|Categories: Analyse de données, Statistiques|Tags: , |0 Commentaires