Apprentissage automatique

Le surapprentissage et la régularisation

Cette série d'articles sur l'apprentissage machine ne serait complète sans y couvrir le surapprentissage et la régularisation. Le surapprentissage L'une des difficultés rencontrée lors de l'application de techniques d'apprentissage machine est le surapprentissage. Plus les techniques utilisées sont puissantes (grand nombre de paramètres libres), plus nous sommes susceptibles au surapprentissage. Lors du surapprentissage, le modèle diverge du principe du rasoir d'Occam en augmentant si bien son niveau de complexité qu'il finit par essentiellement mémoriser chaque détails de l'ensemble d'entraînement. Un modèle [...]

By | 2017-10-30T12:54:24+00:00 30 octobre 2017|Categories: Analyse de données, Apprentissage automatique|0 Commentaires

Une semaine d’apprentissage profond

Du 21 au 25 août se tenait la toute première édition de l'École d'été francophone en apprentissage profond donnée par IVADO et le MILA. Le but de cette semaine était de "[donner aux] participants les bases théoriques et pratiques nécessaires à comprendre le domaine [de l'apprentissage profond] ". Quelques membres de la plateforme et moi-même avons participé à ces cinq jours de formation. Je dois être bien honnête, l'apprentissage profond me faisait un peu peur les premières fois que j'ai [...]

By | 2017-09-22T13:45:58+00:00 22 septembre 2017|Categories: Apprentissage automatique, Informatique|0 Commentaires

L’algorithme de descente de gradient

L'algorithme de descente de gradient est un algorithme itératif ayant comme but de trouver les valeurs optimales des paramètres d'une fonction donnée. Il tente d'ajuster ces paramètres afin de minimiser la sortie d'une fonction de coût face à un certain jeux de données. Cet algorithme est souvent utilisé en apprentissage machine dans le cadre de régressions non linéaires puisqu'il permet de rapidement trouver une solution approximative à des problèmes très complexes. Mon dernier article, Introduction à la régression linéaire, fait mention [...]

Tutoriels de réduction de dimensionalité: 1- Analyse de composantes principales

Comprendre la réduction de dimensionalité Si vous utilisez de larges jeux de données (transcriptomes, séquençage de génome, protéomes), tôt ou tard, vous tomberez sur quelque chose qui porte le nom "d'analyse de composantes principales" (Principal Components Analysis, en anglais, abrévié PCA). PCA est une méthode de réduction de dimensionalité, une famille large de méthodes qui font exactement ce que leur nom dit: elles réduisent la dimensionalité. Mais qu'est-ce que ça veut dire? Qu'est-ce qu'une dimension et pourquoi on voudrait les [...]

Réseau de neurones « Siamois » avec Mariana 1.0

Mariana fut introduit précédemment sur ce blog en mai par Geneviève dans son article Apprentissage automatique en sciences de la vie. Présentement à la version 1.0rc3 sur github, le lancement de la version 1.0 stable de Mariana approche maintenant à grands pas. Cette nouvelle version représente un remaniement de code important et ajoute plusieurs nouvelles fonctionnalités (une liste complète des changements incorporés dans la version 1.0 est disponible ici). Je profite de cette occasion pour présenter une petite capsule sur l'extension des fonctionnalités de [...]

By | 2017-04-29T16:53:00+00:00 7 novembre 2016|Categories: Apprentissage automatique, Python|Tags: , , |0 Commentaires