ggplot2 101 :Visualisation simple pour une analysis simple

Il est souvent plus facile d'interpréter des données biologiques lorsqu'il est possible de les visualiser à l'aide d'une représentation graphique. Cela peut être fait via l'exploitation de différentes options de ggplot2, un progiciel pour la représentation graphique en R. Dans le billet qui suit, je vous présenterai quelques-unes de mes astuces favorites pour la visualisation de données: rien de trop poussé ou complexe, parfait pour les utilisateurs avancés de R, tout comme les utilisateurs un peu plus débutants! Les extraits de [...]

By | 2017-05-19T15:09:43+00:00 19 mai 2017|Categories: Analyse de données, R, Visualisation de données|0 Commentaires

Flux de données et programmation réactive

Qu'est-ce que tout cela ? ReactiveX est la combinaison des meilleures idées du modèle observateur, du modèle itérateur et de la programmation fonctionnelle. À l'aide des librairies Rx, vous pouvez aisément: - Créer des flux de données ou d'évènements à partir de sources diverses comme des fichiers ou des services web - Fusionner ou transformer ces flux grâce à divers opérateurs - Souscrire aux flux et "réagir" à leurs émissions pour produire de nouvelles données L'intérêt pour la programmation réactive [...]

Mégadonnées, gros défi

Vous avez certainement déjà entendu le mot mégadonnées. Ou "Big Data". Notamment, si vous avez lu l'article de Simon Mathien sur le site de l'IRIC. (Si vous ne l'avez pas lu, je vous encourage à le lire!) Il existe plusieurs définitions (ou interprétations) du mot mégadonnées qui sont bien résumées par les deux définitions suivantes : Data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges; (also) the branch of computing [...]

Créer un beau tableau graphique avec R

Bonjour à tous, Aujourd'hui, je vais vous parler de formattable. This package is designed for applying formatting on vectors and data frames to make data presentation easier, richer, more flexible and hopefully convey more information. Nous allons voir comment utiliser cette librairie pour interpréter nos données en un coup d'oeil, à l'aide de quelques lignes de code (vous pouvez suivre les indications ci-dessous ou aller regarder tout le code disponible sur git). Avant d'aller plus loin, j'aimerais préciser que cette [...]

By | 2017-04-29T16:26:37+00:00 30 mars 2017|Categories: R, Visualisation de données|Tags: , |0 Commentaires

Introduction à la régression linéaire

L'objectif premier du scientifique des données (data scientist) est l'exploration de données afin d'en découvrir des relations d'intérêt. Des méthodes statistiques et d'apprentissage machine lui servent d'outils pour la découverte et la modélisation de telles relations. L'information découverte par ces méthodes peut ensuite être mise en pratique. Par exemple, en médecine clinique, l'élaboration d'un modèle prédictif basé sur des données cliniques peut servir d'outil prognostic afin de guider un traitement. Régression linéaire simple L'une des méthodes la plus simple à la disposition du scientifique des données est la régression [...]