eaudemard

About Éric

Informaticien de formation, j’ai vite compris que la bioinformatique regorge d’égnimes à résoudre. Comme dans le « Sommet des dieux »(Jiro Taniguchi), il y a toujours un nouveau sommet à gravir ou un itinéraire plus direct à tenter.

Créer un beau tableau graphique avec R

Bonjour à tous, Aujourd'hui, je vais vous parler de formattable. This package is designed for applying formatting on vectors and data frames to make data presentation easier, richer, more flexible and hopefully convey more information. Nous allons voir comment utiliser cette librairie pour interpréter nos données en un coup d'oeil, à l'aide de quelques lignes de code (vous pouvez suivre les indications ci-dessous ou aller regarder tout le code disponible sur git). Avant d'aller plus loin, j'aimerais préciser que cette [...]

By | 2017-04-29T16:26:37+00:00 30 mars 2017|Categories: R, Visualisation de données|Tags: , |0 Commentaires

Introduction à cowplot, pour combiner plusieurs plots avec R

Bonjour à tous, aujourd'hui, nous allons voir une extension de la librairie ggplot2: cowplot Some helpful extensions and modifications to the 'ggplot2' package. In particular, this package makes it easy to combine multiple 'ggplot2' plots into one and label them with letters, e.g. A, B, C, etc., as is often required for scientific publications. Comme on peut le lire dans la description, cette librairie permet de créer des figures avec plusieurs graphiques (plots), mais pas uniquement. Il est aussi possible de [...]

By | 2017-04-29T16:31:26+00:00 28 novembre 2016|Categories: R, Visualisation de données|0 Commentaires

La méthode la plus rapide pour calculer une AUC

Contexte: AUC est un acronyme pour "Area Under the (ROC) Curve". Si vous n'êtes pas familier avec les notions de courbe ROC et d'AUC, je vous suggère de commencer par ce blog post avant de continuer. Dans plusieurs projets, il m'a fallu calculer un grand nombre d'AUC. J'ai commencé par devoir en calculer 25000, puis 230000 et, maintenant, j'en suis au tour de 1,5 million. Avec autant d'AUC, le temps nécessaire pour calculer une AUC devient un paramètre critique. Je n'ai pas [...]

By | 2017-04-29T16:56:12+00:00 18 août 2016|Categories: Performance, Python, R, Statistiques|Tags: |0 Commentaires

Factoriel et log factoriel

Factoriel: Quand vous avez besoin de calculer n!, il existe plusieurs solutions:  La solution "rapide": qui utilise une boucle ou une fonction récursive:  def factorial_for(n): r = 1 for i in range(2, n + 1): r *= i return(r) def factorial_rec(n): if n > 1: return(n * factorial_rec(n - 1)) else: return(1) Ici, la multiplication séquentielle de chaque nombre va générer un nombre très grand très rapidement, ce qui n'est pas optimum. En effet, les ordinateurs sont plus rapides quand ils multiplient [...]

By | 2017-04-29T17:06:29+00:00 19 février 2016|Categories: Performance, Python|Tags: |0 Commentaires

[python] itérateur vs générateur

En python, nous retrouvons les concepts d'itérateurs et de générateurs. Vous utilisez sûrement déjà les itérateurs couramment sans même savoir comment les nommer. C'est important de savoir que ces deux concepts existent, car ils ont des répercussions différentes au niveau de la mémoire. Pour les petits programmes qui traitent de petits jeux de données, pas de problème. Mais pour les gros jeux de données, c'est autre chose. Que sont-ils au juste? Les itérateurs Quand vous parcourez les éléments d'une liste un [...]

By | 2017-04-29T17:11:30+00:00 18 septembre 2015|Categories: Performance, Python|0 Commentaires