Performance

Parallélise ton Python !

Dans cet article, vous apprendrez ce qu'est que le multithread ou multicore, et dans quel cas utiliser l’un ou l’autre. Votre ami nerd vous parle de sa déformation professionnelle tout le temps? À vouloir paralléliser et optimiser son temps? Vous souhaitez vous aussi comprendre et gagner du temps en parallélisant vos programmes en Python? Alors cet article est pour vous! Vous allez pouvoir, grâce à une petite dose de parallélisme, de Python et de beaucoup d’amour, gagner [...]

By |2017-04-29T17:05:58-04:0031 mars 2016|Categories: Performance, Python|Tags: , |0 Commentaires

Traitement parallèle facile avec R

Poursuivant sur ma lancée d'exploration de code à haute performance, regardons aujourd'hui comment ajouter du traitement parallèle dans vos scripts R. Bien que plusieurs options existent pour paralléliser le traitement de vos données, concentrons nous sur quelque chose de très facile à mettre en place pour commencer. Il y a quelques temps, j'ai eu à écrire un script ayant pour but de rouler un grand nombre de regressions logistiques (à l'aide du package glm) dans un effort de modélisation de [...]

By |2016-03-14T16:22:33-04:0014 mars 2016|Categories: Performance, R|Tags: |0 Commentaires

Factoriel et log factoriel

Factoriel: Quand vous avez besoin de calculer n!, il existe plusieurs solutions:  La solution "rapide": qui utilise une boucle ou une fonction récursive:  def factorial_for(n): r = 1 for i in range(2, n + 1): r *= i return(r) def factorial_rec(n): if n > 1: return(n * factorial_rec(n - 1)) else: return(1) Ici, la multiplication séquentielle de chaque nombre va générer un nombre très grand très rapidement, ce qui n'est pas optimum. En effet, les ordinateurs sont plus rapides quand ils multiplient [...]

By |2017-04-29T17:06:29-04:0019 février 2016|Categories: Performance, Python|Tags: |0 Commentaires

Qu ’est-ce qui est le plus rapide? Version R

Quand j'ai commencé à utiliser R, il y a une dizaine d'années, la communauté d'utilisateurs était beaucoup plus petite! Il n'y avait pas de sites comme R-bloggers pour s'inspirer ni de ggplot2 pour faire de beaux graphiques. Et c'était les débuts d'une implémentation alternative de R (autre que celle de CRAN) connue sous le nom de Revolution R de la compagnie Revolution Analytics. Revolution R tentait surtout de séduire les compagnies en offrant un R plus performant et plus rapide. [...]

By |2016-11-08T09:30:07-04:0012 février 2016|Categories: Performance, R|0 Commentaires

[python] itérateur vs générateur

En python, nous retrouvons les concepts d'itérateurs et de générateurs. Vous utilisez sûrement déjà les itérateurs couramment sans même savoir comment les nommer. C'est important de savoir que ces deux concepts existent, car ils ont des répercussions différentes au niveau de la mémoire. Pour les petits programmes qui traitent de petits jeux de données, pas de problème. Mais pour les gros jeux de données, c'est autre chose. Que sont-ils au juste? Les itérateurs Quand vous parcourez les éléments d'une liste un [...]

By |2017-04-29T17:11:30-04:0018 septembre 2015|Categories: Performance, Python|0 Commentaires