Analyse de données

Permutations

Supposons que vous ayez ces deux groupes de données : g1 <- c(55, 65, 58) g2 <- c(12, 18, 32) Nous voulons savoir si ces deux groupes appartiennent à la même distribution ou sont considérés comme deux groupes différents. Nous serions probablement tenté, pour élucider la question, d'appliquer un test de Student, le test-t. t.test(g1, g2) ## Welch Two Sample t-test ## ## data: g1 and g2 ## t = 5.8366, df = 2.9412, p-value = 0.01059 ## alternative hypothesis: [...]

By |2017-04-30T10:07:23+00:0016 octobre 2015|Categories: Analyse de données, R, Statistiques|0 Commentaires

Manipuler de gros fichiers

À la plateforme, je fais régulièrement des analyses de données de séquençage de nouvelle génération (Next Generation Sequencing ou NGS). L'une des questions qui revient fréquemment chez mes clients est : comment ouvrir les fichiers de séquences générés? Considérant l'énorme taille de ces fichiers (souvent plusieurs millions de lignes) et, par conséquent, l'espace qu'ils requièrent en mémoire, ils ne devraient pas être ouverts d'une quelconque façon, ils devraient plutôt être processés. La plupart des programmes conçus pour traiter les données [...]

python et pandas

La réputation de R n'est plus à faire. C'est un language incontournable surtout pour la visualisation de données. Mais il lui arrive d'être un petit peu lent. Particulièrement lors du traitement de gros ensembles de données. Si vous n'avez pas besoin de générer de graphes sensationels ou que vous n'avez pas le temps d'attendre, il existe une alternative en python pour rapidement manipuler des données. Le module pandas (Python Data Analysis Library) offre un moyen d'aisément manipuler des données directement [...]

By |2017-04-29T17:24:31+00:0017 avril 2014|Categories: Analyse de données, Python|Tags: , |0 Commentaires

lifelines (ou comment faire des analyses de survie en Python)

Depuis quelques semaines, je fais beaucoup d’analyse de survie. Je ne suis pas une experte dans ce domaine. J’ai appris la base en participant à un groupe d’étude organisé à l’interne. À chaque rencontre, nous approfondissions la matière du livre "Survival Analysis. A Self-Learning Text" de David G. Kleinbaum et Mitchel Klein. À la fin du livre, il y a du code pour aider les débutants à faire leurs premières analyses en SAS, Stata, SPSS et … R! J’ai donc [...]

By |2017-04-29T17:19:24+00:0024 mars 2014|Categories: Analyse de données, Python, Statistiques|Tags: |0 Commentaires
Go to Top