Scripts

L’algorithme de descente de gradient

L'algorithme de descente de gradient est un algorithme itératif ayant comme but de trouver les valeurs optimales des paramètres d'une fonction donnée. Il tente d'ajuster ces paramètres afin de minimiser la sortie d'une fonction de coût face à un certain jeux de données. Cet algorithme est souvent utilisé en apprentissage machine dans le cadre de régressions non linéaires puisqu'il permet de rapidement trouver une solution approximative à des problèmes très complexes. Mon dernier article, Introduction à la régression linéaire, fait mention [...]

Réalise ton potentiel Bash

Le meilleur outil du bio-informaticien est sans doute son interpréteur. Bien que plusieurs l'aient déjà dompté, il arrive souvent à certains débutants de se retrouver à répéter péniblement certaines séquences lorsqu'il existe une solution plus rapide (il m'arrive encore de me retrouver dans la même situation!). Jetons un coup d'oeil aux commandes et raccourcis de l'interpréteur de commandes Bash les plus utilisées. Cette liste ne tente aucunement d'énumérer toutes les fonctionalités de Bash mais plutôt de regrouper certains raccourcis clef qui pourront possiblement économiser un [...]

By | 2017-04-29T22:56:21+00:00 26 mai 2016|Categories: Informatique, Scripts|0 Commentaires

Arguments de « grep » que tout bioinformaticien devrait connaitre

Le shell, ainsi que la myriade d'outils en ligne de commande qu'il nous offre est un grand ami lorsque vient le temps de manipuler des fichiers de données. Et soyons francs, manipuler des fichiers, c'est une bonne partie du travail d'un bioinformaticien. Cependant, puisque nous avons rarement le temps de survoler l'ensemble des arguments offerts par les différents programmes d'Unix, je me suis dit que je vous présenterais mes préférés de l'utilitaire grep. Je prends pour acquis que tout le [...]

By | 2017-04-29T17:09:17+00:00 27 novembre 2015|Categories: Analyse de données, Scripts|Tags: , |0 Commentaires

Manipuler de gros fichiers

À la plateforme, je fais régulièrement des analyses de données de séquençage de nouvelle génération (Next Generation Sequencing ou NGS). L'une des questions qui revient fréquemment chez mes clients est : comment ouvrir les fichiers de séquences générés? Considérant l'énorme taille de ces fichiers (souvent plusieurs millions de lignes) et, par conséquent, l'espace qu'ils requièrent en mémoire, ils ne devraient pas être ouverts d'une quelconque façon, ils devraient plutôt être processés. La plupart des programmes conçus pour traiter les données [...]

By | 2017-04-30T12:51:58+00:00 1 octobre 2015|Categories: Analyse de données, Scripts|Tags: , |1 commentaire