Écart-type sur un graphe de corrélation

Un collègue m'a récemment demandé de produire une visualisation montrant l'expression différentielle des gènes entre deux échantillons (sans réplicats). En utilisant les données de RPKM, il voulait faire ressortir tous les gènes se trouvant aux extrémités de la distribution i.e. à 2 écart-types de la moyenne ou plus. Comme premier essai, j'ai calculé la distribution de fold change et l'écart-type et j'ai tracé les droites correspondantes de chaque côté de la diagonale sur un graphe en nuage de points présentant [...]

By |2017-04-29T17:01:08+00:007 avril 2016|Categories: R, Statistiques, Visualisation de données|Tags: |0 Commentaires

Parallélise ton Python !

Dans cet article, vous apprendrez ce qu'est que le multithread ou multicore, et dans quel cas utiliser l’un ou l’autre. Votre ami nerd vous parle de sa déformation professionnelle tout le temps? À vouloir paralléliser et optimiser son temps? Vous souhaitez vous aussi comprendre et gagner du temps en parallélisant vos programmes en Python? Alors cet article est pour vous! Vous allez pouvoir, grâce à une petite dose de parallélisme, de Python et de beaucoup d’amour, gagner [...]

By |2017-04-29T17:05:58+00:0031 mars 2016|Categories: Performance, Python|Tags: , |0 Commentaires

Traitement parallèle facile avec R

Poursuivant sur ma lancée d'exploration de code à haute performance, regardons aujourd'hui comment ajouter du traitement parallèle dans vos scripts R. Bien que plusieurs options existent pour paralléliser le traitement de vos données, concentrons nous sur quelque chose de très facile à mettre en place pour commencer. Il y a quelques temps, j'ai eu à écrire un script ayant pour but de rouler un grand nombre de regressions logistiques (à l'aide du package glm) dans un effort de modélisation de [...]

By |2016-03-14T16:22:33+00:0014 mars 2016|Categories: Performance, R|Tags: |0 Commentaires

Factoriel et log factoriel

Factoriel: Quand vous avez besoin de calculer n!, il existe plusieurs solutions:  La solution "rapide": qui utilise une boucle ou une fonction récursive:  def factorial_for(n): r = 1 for i in range(2, n + 1): r *= i return(r) def factorial_rec(n): if n > 1: return(n * factorial_rec(n - 1)) else: return(1) Ici, la multiplication séquentielle de chaque nombre va générer un nombre très grand très rapidement, ce qui n'est pas optimum. En effet, les ordinateurs sont plus rapides quand ils multiplient [...]

By |2017-04-29T17:06:29+00:0019 février 2016|Categories: Performance, Python|Tags: |0 Commentaires

Qu ’est-ce qui est le plus rapide? Version R

Quand j'ai commencé à utiliser R, il y a une dizaine d'années, la communauté d'utilisateurs était beaucoup plus petite! Il n'y avait pas de sites comme R-bloggers pour s'inspirer ni de ggplot2 pour faire de beaux graphiques. Et c'était les débuts d'une implémentation alternative de R (autre que celle de CRAN) connue sous le nom de Revolution R de la compagnie Revolution Analytics. Revolution R tentait surtout de séduire les compagnies en offrant un R plus performant et plus rapide. [...]

By |2016-11-08T09:30:07+00:0012 février 2016|Categories: Performance, R|0 Commentaires
Go to Top