seguinj

About Jonathan

Le cadet de la plateforme. Je passe mes journées à perfectionner mes compétences en apprentissage machine, coder en Python et faire de l'escalade (sans ordre particulier).

Le surapprentissage et la régularisation

Cette série d'articles sur l'apprentissage machine ne serait complète sans y couvrir le surapprentissage et la régularisation. Le surapprentissage L'une des difficultés rencontrée lors de l'application de techniques d'apprentissage machine est le surapprentissage. Plus les techniques utilisées sont puissantes (grand nombre de paramètres libres), plus nous sommes susceptibles au surapprentissage. Lors du surapprentissage, le modèle diverge du principe du rasoir d'Occam en augmentant si bien son niveau de complexité qu'il finit par essentiellement mémoriser chaque détails de l'ensemble d'entraînement. Un modèle [...]

By | 2017-10-30T12:54:24+00:00 30 octobre 2017|Categories: Analyse de données, Apprentissage automatique|0 Commentaires

L’algorithme de descente de gradient

L'algorithme de descente de gradient est un algorithme itératif ayant comme but de trouver les valeurs optimales des paramètres d'une fonction donnée. Il tente d'ajuster ces paramètres afin de minimiser la sortie d'une fonction de coût face à un certain jeux de données. Cet algorithme est souvent utilisé en apprentissage machine dans le cadre de régressions non linéaires puisqu'il permet de rapidement trouver une solution approximative à des problèmes très complexes. Mon dernier article, Introduction à la régression linéaire, fait mention [...]

Introduction à la régression linéaire

L'objectif premier du scientifique des données (data scientist) est l'exploration de données afin d'en découvrir des relations d'intérêt. Des méthodes statistiques et d'apprentissage machine lui servent d'outils pour la découverte et la modélisation de telles relations. L'information découverte par ces méthodes peut ensuite être mise en pratique. Par exemple, en médecine clinique, l'élaboration d'un modèle prédictif basé sur des données cliniques peut servir d'outil prognostic afin de guider un traitement. Régression linéaire simple L'une des méthodes la plus simple à la disposition du scientifique des données est la régression [...]

Réseau de neurones « Siamois » avec Mariana 1.0

Mariana fut introduit précédemment sur ce blog en mai par Geneviève dans son article Apprentissage automatique en sciences de la vie. Présentement à la version 1.0rc3 sur github, le lancement de la version 1.0 stable de Mariana approche maintenant à grands pas. Cette nouvelle version représente un remaniement de code important et ajoute plusieurs nouvelles fonctionnalités (une liste complète des changements incorporés dans la version 1.0 est disponible ici). Je profite de cette occasion pour présenter une petite capsule sur l'extension des fonctionnalités de [...]

By | 2017-04-29T16:53:00+00:00 7 novembre 2016|Categories: Apprentissage automatique, Python|Tags: , , |0 Commentaires

Réalise ton potentiel Bash

Le meilleur outil du bio-informaticien est sans doute son interpréteur. Bien que plusieurs l'aient déjà dompté, il arrive souvent à certains débutants de se retrouver à répéter péniblement certaines séquences lorsqu'il existe une solution plus rapide (il m'arrive encore de me retrouver dans la même situation!). Jetons un coup d'oeil aux commandes et raccourcis de l'interpréteur de commandes Bash les plus utilisées. Cette liste ne tente aucunement d'énumérer toutes les fonctionalités de Bash mais plutôt de regrouper certains raccourcis clef qui pourront possiblement économiser un [...]

By | 2017-04-29T22:56:21+00:00 26 mai 2016|Categories: Informatique, Scripts|0 Commentaires