seguinj

About Jonathan

Le cadet de la plateforme. Je passe mes journées à perfectionner mes compétences en apprentissage machine, coder en Python et faire de l'escalade (sans ordre particulier).

L’algorithme de descente de gradient

L'algorithme de descente de gradient est un algorithme itératif ayant comme but de trouver les valeurs optimales des paramètres d'une fonction donnée. Il tente d'ajuster ces paramètres afin de minimiser la sortie d'une fonction de coût face à un certain jeux de données. Cet algorithme est souvent utilisé en apprentissage machine dans le cadre de régressions non linéaires puisqu'il permet de rapidement trouver une solution approximative à des problèmes très complexes. Mon dernier article, Introduction à la régression linéaire, fait mention [...]

Introduction à la régression linéaire

L'objectif premier du scientifique des données (data scientist) est l'exploration de données afin d'en découvrir des relations d'intérêt. Des méthodes statistiques et d'apprentissage machine lui servent d'outils pour la découverte et la modélisation de telles relations. L'information découverte par ces méthodes peut ensuite être mise en pratique. Par exemple, en médecine clinique, l'élaboration d'un modèle prédictif basé sur des données cliniques peut servir d'outil prognostic afin de guider un traitement. Régression linéaire simple L'une des méthodes la plus simple à la disposition du scientifique des données est la régression [...]

Réseau de neurones « Siamois » avec Mariana 1.0

Mariana fut introduit précédemment sur ce blog en mai par Geneviève dans son article Apprentissage automatique en sciences de la vie. Présentement à la version 1.0rc3 sur github, le lancement de la version 1.0 stable de Mariana approche maintenant à grands pas. Cette nouvelle version représente un remaniement de code important et ajoute plusieurs nouvelles fonctionnalités (une liste complète des changements incorporés dans la version 1.0 est disponible ici). Je profite de cette occasion pour présenter une petite capsule sur l'extension des fonctionnalités de [...]

By | 2017-04-29T16:53:00+00:00 7 novembre 2016|Categories: Apprentissage automatique, Python|Tags: , , |0 Commentaires

Réalise ton potentiel Bash

Le meilleur outil du bio-informaticien est sans doute son interpréteur. Bien que plusieurs l'aient déjà dompté, il arrive souvent à certains débutants de se retrouver à répéter péniblement certaines séquences lorsqu'il existe une solution plus rapide (il m'arrive encore de me retrouver dans la même situation!). Jetons un coup d'oeil aux commandes et raccourcis de l'interpréteur de commandes Bash les plus utilisées. Cette liste ne tente aucunement d'énumérer toutes les fonctionalités de Bash mais plutôt de regrouper certains raccourcis clef qui pourront possiblement économiser un [...]

By | 2017-04-29T22:56:21+00:00 26 mai 2016|Categories: Informatique, Scripts|0 Commentaires

Création de données génomiques synthétiques

L'application de méthodes statistiques forme une grande partie de la bio-informatique. En plus de méthodes classiques, certaines techniques d'apprentissage machine (notamment, des techniques de clustering telles k-means) sont aussi régulièrement appliquées sur des données cliniques et biologiques. Quelques-unes de ces techniques telles les réseaux de neurones ont récemment connu un grand succès en reconnaissance d'images et traitement du langage naturel. Malheureusement, ces techniques performent mal sur de petits jeux de données ayant un grand nombre de dimensions, un type de jeux de données fréquemment rencontré à la plateforme. L'introduction [...]

By | 2017-04-29T23:02:12+00:00 7 janvier 2016|Categories: Bioinformatique, Python|Tags: , |0 Commentaires