Mise en forme de fichiers de données pour Circos avec R

Lorsqu'il est question de générer une image Circos, la mise en forme des données est une des étapes les plus importantes. Voici quelques points clés pouvant vous aider à éviter le redoutable ***CIRCOS ERROR***. Tous les fichiers de données doivent être en format texte, c'est-à-dire avoir une extension .txt et utiliser une tabulation comme séparateur.  R s'avère très utile pour générer les fichiers dans le format requis.  Avec l'aide de R,  je peux générer un fichier myData.txt qui par la suite, sera incorporé dans [...]

Permutations

Supposons que vous ayez ces deux groupes de données : g1 <- c(55, 65, 58) g2 <- c(12, 18, 32) Nous voulons savoir si ces deux groupes appartiennent à la même distribution ou sont considérés comme deux groupes différents. Nous serions probablement tenté, pour élucider la question, d'appliquer un test de Student, le test-t. t.test(g1, g2) ## Welch Two Sample t-test ## ## data: g1 and g2 ## t = 5.8366, df = 2.9412, p-value = 0.01059 ## alternative hypothesis: [...]

By |2017-04-30T10:07:23+00:0016 octobre 2015|Categories: Analyse de données, R, Statistiques|0 Commentaires

Manipuler de gros fichiers

À la plateforme, je fais régulièrement des analyses de données de séquençage de nouvelle génération (Next Generation Sequencing ou NGS). L'une des questions qui revient fréquemment chez mes clients est : comment ouvrir les fichiers de séquences générés? Considérant l'énorme taille de ces fichiers (souvent plusieurs millions de lignes) et, par conséquent, l'espace qu'ils requièrent en mémoire, ils ne devraient pas être ouverts d'une quelconque façon, ils devraient plutôt être processés. La plupart des programmes conçus pour traiter les données [...]

[python] itérateur vs générateur

En python, nous retrouvons les concepts d'itérateurs et de générateurs. Vous utilisez sûrement déjà les itérateurs couramment sans même savoir comment les nommer. C'est important de savoir que ces deux concepts existent, car ils ont des répercussions différentes au niveau de la mémoire. Pour les petits programmes qui traitent de petits jeux de données, pas de problème. Mais pour les gros jeux de données, c'est autre chose. Que sont-ils au juste? Les itérateurs Quand vous parcourez les éléments d'une liste un [...]

By |2017-04-29T17:11:30+00:0018 septembre 2015|Categories: Performance, Python|0 Commentaires

N’ignorez pas les avertissements!

Maintenant que vous utilisez R régulièrement, je suis certaine que vous avez remarqué que, parfois, R vous parle. Lorsque vous faites quelque chose d'erroné, R répond avec un message écrit en rouge dans la console. Combien d'entre vous lisent réellement ces messages d'erreur? Si vous prenez le temps de les lire attentivement, vous verrez qu'ils vous informent du problème survenu. Prenons cet exemple: > sum(c('1','3','4','4')) Error in sum(c("1", "3", "4", "4")) : invalid 'type' (character) of argument R vous indique [...]

By |2017-04-30T16:26:10+00:003 septembre 2015|Categories: R, Statistiques|1 commentaire
Go to Top