Informatique

Tutoriels de réduction de dimensionalité: 1- Analyse de composantes principales

Comprendre la réduction de dimensionalité Si vous utilisez de larges jeux de données (transcriptomes, séquençage de génome, protéomes), tôt ou tard, vous tomberez sur quelque chose qui porte le nom "d'analyse de composantes principales" (Principal Components Analysis, en anglais, abrévié PCA). PCA est une méthode de réduction de dimensionalité, une famille large de méthodes qui font exactement ce que leur nom dit: elles réduisent la dimensionalité. Mais qu'est-ce que ça veut dire? Qu'est-ce qu'une dimension et pourquoi on voudrait les [...]

Transferts réseau rapides?

Récemment, tout le monde s'est mis à utiliser différents outils dans le but d'optimiser de gros transferts de données de, vers et entre super-ordinateurs. Historiquement, nous avons vu des outils tels que FDT, BBCP qui essayaient de surpasser la performance obtenue par les autres méthodes de transfert classique, comme scp, rsync, ftp, etc. Un outil en particulier est en train de gagner en popularité et est déployé sur la plupart des super-ordinateurs : GridFTP et son interface, Globus. L'interface [...]

By |2017-04-29T17:02:01+00:0012 octobre 2016|Categories: Informatique, Performance|Tags: , |0 Commentaires

Accélérer l’accès aléatoire aux disques

Lorsqu'on utilise un logiciel qui doit accéder à des données sur disque de manière aléatoire, il est généralement reconnu que les disques SSD (solid state drive) offrent une meilleure performance; les disques SAS étant moins efficaces et les disques SATA étant les pires. Toutefois, les disques SSD à grande capacité de stockage étant relativement dispendieux, lorsque l'on traite de larges ensembles de données, nous nous retrouvons souvent à travailler sur les plus abordables et communs disques SATA. J'ai récemment expérimenté [...]

By |2017-04-29T17:02:18+00:004 août 2016|Categories: Informatique, Performance|0 Commentaires

Réalise ton potentiel Bash

Le meilleur outil du bio-informaticien est sans doute son interpréteur. Bien que plusieurs l'aient déjà dompté, il arrive souvent à certains débutants de se retrouver à répéter péniblement certaines séquences lorsqu'il existe une solution plus rapide (il m'arrive encore de me retrouver dans la même situation!). Jetons un coup d'oeil aux commandes et raccourcis de l'interpréteur de commandes Bash les plus utilisées. Cette liste ne tente aucunement d'énumérer toutes les fonctionalités de Bash mais plutôt de regrouper certains raccourcis clef qui pourront possiblement économiser un [...]

By |2017-04-29T22:56:21+00:0026 mai 2016|Categories: Informatique, Scripts|0 Commentaires

Gestion des versions du contenu d’une BD avec SQLAlchemy

Une des fonctionnalités phare requises d'un SGL est la sauvegarde de l'historique des changements appliqués aux données storées dans la base de données sous-jacente. Ceci peut représenter une fonctionnalité non triviale à implémenter et/ou déployer et il existe certainement plusieurs visions de la forme que cette implémentation devrait prendre. Heureusement pour tous les fans de SQLAlchemy, une solution prête à l'usage est suggérée sur la page des exemples de l'ORM (en anglais seulement). Bien que la page d'exemple suggère différents [...]

By |2017-04-29T17:27:37+00:005 octobre 2014|Categories: Database, Informatique, Python|Tags: , , , |0 Commentaires
Go to Top