seguinj

About Jonathan

Le cadet de la plateforme. Je passe mes journées à perfectionner mes compétences en apprentissage machine, coder en Python et faire de l'escalade (sans ordre particulier).

Introduction à la régression linéaire

L'objectif premier du scientifique des données (data scientist) est l'exploration de données afin d'en découvrir des relations d'intérêt. Des méthodes statistiques et d'apprentissage machine lui servent d'outils pour la découverte et la modélisation de telles relations. L'information découverte par ces méthodes peut ensuite être mise en pratique. Par exemple, en médecine clinique, l'élaboration d'un modèle prédictif basé sur des données cliniques peut servir d'outil prognostic afin de guider un traitement. Régression linéaire simple L'une des méthodes la plus simple à la disposition du scientifique des données est la régression [...]

Réseau de neurones « Siamois » avec Mariana 1.0

Mariana fut introduit précédemment sur ce blog en mai par Geneviève dans son article Apprentissage automatique en sciences de la vie. Présentement à la version 1.0rc3 sur github, le lancement de la version 1.0 stable de Mariana approche maintenant à grands pas. Cette nouvelle version représente un remaniement de code important et ajoute plusieurs nouvelles fonctionnalités (une liste complète des changements incorporés dans la version 1.0 est disponible ici). Je profite de cette occasion pour présenter une petite capsule sur l'extension des fonctionnalités de [...]

By | 2016-11-15T13:51:48+00:00 7 novembre 2016|Categories: Analyse de données, Apprentissage automatique, Python|0 Commentaires

Réalise ton potentiel Bash

Le meilleur outil du bioinformaticien est sans doute son interpréteur. Bien que plusieurs l'aient déjà dompté, il arrive souvent à certains débutants de se retrouver à répéter péniblement certaines séquences lorsqu'il existe une solution plus rapide (il m'arrive encore de me retrouver dans la même situation!). Jetons un coup d'oeil aux commandes et raccourcis de l'interpréteur de commandes Bash les plus utilisées. Cette liste ne tente aucunement d'énumérer toutes les fonctionalités de Bash mais plutôt de regrouper certains raccourcis clef qui pourront possiblement économiser un [...]

By | 2016-11-08T09:30:05+00:00 26 mai 2016|Categories: Non classifié(e), Scripts|0 Commentaires

Création de données génomiques synthétiques

L'application de méthodes statistiques forme une grande partie de la bio-informatique. En plus de méthodes classiques, certaines techniques d'apprentissage machine (notamment, des techniques de clustering telles k-means) sont aussi régulièrement appliquées sur des données cliniques et biologiques. Quelques-unes de ces techniques telles les réseaux de neurones ont récemment connu un grand succès en reconnaissance d'images et traitement du langage naturel. Malheureusement, ces techniques performent mal sur de petits jeux de données ayant un grand nombre de dimensions, un type de jeux de données fréquemment rencontré à la plateforme. L'introduction [...]

By | 2016-11-08T09:30:07+00:00 7 janvier 2016|Categories: Analyse de données, Bioinformatique, Data Analysis, Python|0 Commentaires

Paramètres mutables par défaut en Python

Récemment, tout en débogant un morceau de code Python à la plateforme, nous sommes tombés sur une particularité du langage Python. Prenons cette fonction comme exemple : def foo(bar=[]):     bar.append('a') return bar Intuitivement, ce morceau de code peut sembler retourner la liste ['a'] à chaque appel de la fonction foo(). Mais ce n'est pas le cas: >>>foo() ['a'] >>>foo() ['a','a'] >>>foo() ['a','a','a'] Comme nous pouvons le constater, la liste n'est pas réinitialisée mais conserve plutôt ses valeurs auxquelles on ajoute un [...]

By | 2016-11-08T09:30:10+00:00 7 août 2015|Categories: Python|0 Commentaires