Créer un beau tableau graphique avec R

Bonjour à tous, Aujourd'hui, je vais vous parler de formattable. This package is designed for applying formatting on vectors and data frames to make data presentation easier, richer, more flexible and hopefully convey more information. Nous allons voir comment utiliser cette librairie pour interpréter nos données en un coup d'oeil, à l'aide de quelques lignes de code (vous pouvez suivre les indications ci-dessous ou aller regarder tout le code disponible sur git). Avant d'aller plus loin, j'aimerais préciser que cette [...]

Introduction à la régression linéaire

L'objectif premier du scientifique des données (data scientist) est l'exploration de données afin d'en découvrir des relations d'intérêt. Des méthodes statistiques et d'apprentissage machine lui servent d'outils pour la découverte et la modélisation de telles relations. L'information découverte par ces méthodes peut ensuite être mise en pratique. Par exemple, en médecine clinique, l'élaboration d'un modèle prédictif basé sur des données cliniques peut servir d'outil prognostic afin de guider un traitement. Régression linéaire simple L'une des méthodes la plus simple à la disposition du scientifique des données est la régression [...]

Criblage chimique: évaluation de la sensibilité aux molécules

L’étude de la réponse cellulaire face à un composé chimique est cruciale au développement de nouvelles molécules thérapeutiques. Une telle analyse se fait généralement par expérience de criblage, où les cellules (spécifiques à une maladie, telle la leucémie) sont exposées aux composés chimiques d’intérêt pour différentes concentrations. La réponse ou la sensibilité de ces cellules est conventionnellement quantifiée par la valeur de l’IC50 ou de l’EC50. Voici quelques notions importantes à garder en tête lorsque nous analysons ces valeurs. IC50/EC50 [...]

By | 2017-02-13T11:16:14+00:00 13 février 2017|Categories: Analyse de données, Data Analysis|0 Commentaires

Régression logistique et GTEx

Lorsqu'on travaille avec toutes sortes de données, il arrive parfois que nous voulons prédire la valeur d'une variable qui n'est pas numérique. Dans ces cas-là, la régression logistique est tout à fait appropriée. On peut dire qu'elle est s'apparente à une régression linéaire sauf que la variable dépendante est une catégorie. Vous vous souvenez de la fonction de la régression linéaire où l'on essaie d'estimer les paramètres beta (les coefficients) qui s'ajustent le mieux la droite à nos données: \begin{equation} [...]

By | 2017-01-31T08:53:45+00:00 27 janvier 2017|Categories: Bioinformatique, Data Analysis, Python|0 Commentaires

Une implémentation en javascript de la version non centrée du test exact de Fisher

Mon article précédent expliquait pourquoi la version non-centrée du test exact de Fisher est plus appropriée dans la plupart des cas rencontrés en bio-informatique. Je poursuis en présentant maintenant une implémentation de ce test en Javascript qui pourrait facilement être intégrée à une interface web. Même si le Javascript est un langage très mal adapté à l'implémentation de méthodes statistiques, j'espère que cet article présentera tous les détails nécessaires pour simplifier l'implémentation de ce test dans d'autres langages, selon les besoins. À tout le moins, [...]

By | 2017-01-16T09:25:09+00:00 9 janvier 2017|Categories: Javascript, Statistiques, Test|0 Commentaires