Analyse de données

Bootstraps et intervalles de confiance

Lors de l'analyse des données, vous pourriez vouloir ajuster (fitter) un type de courbe spécifique à un ensemble de données particulier. Ce type d'analyse peut nous éclaircir sur la relation entre deux (ou plusieurs...) paramètres quantifiables. L'object principal de cet article n'est pas le comment de l'ajustement-même, mais plutôt l'évaluation de sa qualité i.e. comment calculer un intervalle de confiance autour d'une courbe ajustée. Cela étant dit, je vous montrerai comment faire un ajustement simple en utilisant différentes librairies R, mais je [...]

By |2017-04-29T18:30:53+00:0029 septembre 2016|Categories: Analyse de données, R, Statistiques|Tags: |0 Commentaires

SciPy et les régressions logistiques

Il arrive souvent que l'on veuille voir s'il existe une une relation quelconque entre les points d'un jeu de données. Lorsqu'il est question de régressions linéaires, celles-ci peuvent être facilement visualisées avec Seaborn, une librairie Python visant l'exploration et la visualisation plutôt que l'analyse statistique. Quant aux régressions logistiques, SciPy est un bon outil à utiliser lorsque nous n'avons pas notre propre script d'analyse. Regardons le paquet optimisation 'optimize'                        from [...]

By |2017-04-29T16:58:18+00:009 juin 2016|Categories: Analyse de données, Python|Tags: , , , |0 Commentaires

Facteurs à considérer pour l’interprétation de vos données de protéomique

** Collaboration spéciale de la part de la plateforme de protéomique ** Suite à l'analyse de votre échantillon par spectrométrie de masse, vous recevez généralement vos résultats sous forme d’une liste de protéines. Lors du traitement des données, certains facteurs influencent quelles protéines se retrouveront dans la liste finale. Fig. 1 Approche ascendante. Figure modifiée provenant de Angel et al. (2011)   Commençons d’abord par expliquer brièvement comment cette liste de protéines est obtenue. L’approche de protéomique ascendante [...]

By |2017-04-29T17:08:27+00:007 décembre 2015|Categories: Analyse de données|Tags: |0 Commentaires

Arguments de « grep » que tout bioinformaticien devrait connaitre

Le shell, ainsi que la myriade d'outils en ligne de commande qu'il nous offre est un grand ami lorsque vient le temps de manipuler des fichiers de données. Et soyons francs, manipuler des fichiers, c'est une bonne partie du travail d'un bioinformaticien. Cependant, puisque nous avons rarement le temps de survoler l'ensemble des arguments offerts par les différents programmes d'Unix, je me suis dit que je vous présenterais mes préférés de l'utilitaire grep. Je prends pour acquis que tout le [...]

By |2017-04-29T17:09:17+00:0027 novembre 2015|Categories: Analyse de données, Scripts|Tags: , |0 Commentaires

Effectuer une PCA sur les données de Leucégène

GEO est une source extrêmement riche de données de profils transcriptionnels, mais télécharger et préparer ces données constituent bien souvent un obstacle pour les apprentis bioinformaticiens. La démonstration qui suit devrait faciliter vos premiers pas, j'utiliserai le jeu de données de Leucégène. Une fois ces données chargées et prêtes à être utilisées dans R, je présenterai une perspective simplifiée mais pratique de l'utilisation de la PCA (Principal Component Analysis) pour faire de l'analyse exploratoire d'un ensemble de profiles transcriptionnels. Chargement des données [...]

By |2017-04-29T23:05:37+00:0016 novembre 2015|Categories: Analyse de données, R|Tags: , |0 Commentaires