Le surapprentissage et la régularisation

Cette série d'articles sur l'apprentissage machine ne serait complète sans y couvrir le surapprentissage et la régularisation. Le surapprentissage L'une des difficultés rencontrée lors de l'application de techniques d'apprentissage machine est le surapprentissage. Plus les techniques utilisées sont puissantes (grand nombre de paramètres libres), plus nous sommes susceptibles au surapprentissage. Lors du surapprentissage, le modèle diverge du principe du rasoir d'Occam en augmentant si bien son niveau de complexité qu'il finit par essentiellement mémoriser chaque détails de l'ensemble d'entraînement. Un modèle [...]

By | 2017-10-30T12:54:24+00:00 30 octobre 2017|Categories: Analyse de données, Apprentissage automatique|0 Commentaires

Laissez-le errer… Libérer votre code !

Aujourd'hui, j'ai pensé faire quelque chose de légèrement différent et discuter un peu sur les attentes que l'on peut avoir à rendre son code public. Je me suis dit qu'il serait intéressant d'interviewer un membre de notre groupe qui possède une solide expérience dans ce type d'activité, Tariq Daouda, afin de tirer profit de ses expériences passées. Alors, sans plus attendre, on se jette à l'eau ! JP: Bonjour Tariq, je suis bien content que tu aies accepté cette invitation. [...]

By | 2017-10-20T13:23:27+00:00 16 octobre 2017|Categories: Informatique|Tags: , |0 Commentaires

Une semaine d’apprentissage profond

Du 21 au 25 août se tenait la toute première édition de l'École d'été francophone en apprentissage profond donnée par IVADO et le MILA. Le but de cette semaine était de "[donner aux] participants les bases théoriques et pratiques nécessaires à comprendre le domaine [de l'apprentissage profond] ". Quelques membres de la plateforme et moi-même avons participé à ces cinq jours de formation. Je dois être bien honnête, l'apprentissage profond me faisait un peu peur les premières fois que j'ai [...]

By | 2017-09-22T13:45:58+00:00 22 septembre 2017|Categories: Apprentissage automatique, Informatique|0 Commentaires

Mégadonnées, gros défi – partie 2

Cet article est la suite de mon précédent article sur les mégadonnées. Il n'a pas engendré de discussion virtuelle enflammée sur le sujet, mais j'étais très heureuse de recevoir quelques commentaires sur la situation dans d'autres domaines de la bio-informatique. Protéomique Mathieu Courcelles, bio-informaticien à la plate-forme de protéomique, explique que la protéomique utilisant la spectrométrie de masse a toujours généré des "mégadonnées". Donc, l'expression n'est pas très utilisée dans le domaine puisqu'elle n'a rien de nouveau. Comme il le [...]

By | 2017-08-18T13:24:37+00:00 18 août 2017|Categories: Analyse de données|Tags: , |0 Commentaires

L’algorithme de descente de gradient

L'algorithme de descente de gradient est un algorithme itératif ayant comme but de trouver les valeurs optimales des paramètres d'une fonction donnée. Il tente d'ajuster ces paramètres afin de minimiser la sortie d'une fonction de coût face à un certain jeux de données. Cet algorithme est souvent utilisé en apprentissage machine dans le cadre de régressions non linéaires puisqu'il permet de rapidement trouver une solution approximative à des problèmes très complexes. Mon dernier article, Introduction à la régression linéaire, fait mention [...]