{"id":3886,"date":"2018-02-06T07:53:54","date_gmt":"2018-02-06T12:53:54","guid":{"rendered":"http:\/\/bioinfo.iric.ca\/?p=3886"},"modified":"2018-02-08T13:33:20","modified_gmt":"2018-02-08T18:33:20","slug":"pensez-comme-un-ordinateur","status":"publish","type":"post","link":"https:\/\/bioinfo.iric.ca\/fr\/pensez-comme-un-ordinateur\/","title":{"rendered":"Pensez comme un ordinateur"},"content":{"rendered":"<p>Supposons que tous vos r\u00e9sultats pour un projet donn\u00e9 sont conserv\u00e9s dans des fichiers Excel nomm\u00e9s exp1.xlsx, exp2_20170708.xlsx, exp_prolif_072017.xlsx, et ainsi de suite. Supposons aussi que le contenu du fichier exp1.xlsx ressemble \u00e0 ceci :<\/p>\n<p><img decoding=\"async\" class=\"aligncenter size-large wp-image-3878\" src=\"https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-1024x318.png\" alt=\"\" width=\"1024\" height=\"318\" srcset=\"https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-200x62.png 200w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-300x93.png 300w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-400x124.png 400w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-600x186.png 600w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-768x238.png 768w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-800x248.png 800w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-1024x318.png 1024w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM-1200x372.png 1200w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-3.40.49-PM.png 1690w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p>Ce fichier est tr\u00e8s convivial pour un humain, mais pas pour un ordinateur. Disons qu&rsquo;un jour, vous d\u00e9cidez (ou votre patron d\u00e9cide) que vous avez besoin d&rsquo;une base de donn\u00e9es pour organiser vos r\u00e9sultats plut\u00f4t que de les conserver dans vingt-six fichiers Excel diff\u00e9rents. Si tous vos fichiers ressemblent \u00e0 exp1.xlsx tel que d\u00e9crit plus haut, vous allez avoir besoin d&rsquo;investir une quantit\u00e9 de temps non n\u00e9gligeable \u00e0 nettoyer vos donn\u00e9es avant m\u00eame de commencer \u00e0 penser au sch\u00e9ma de votre base de donn\u00e9es. Ce travaille de nettoyage\u00a0 vaut aussi si vous voulez analyser vos donn\u00e9es dans R, par exemple.<\/p>\n<p>Dans l&rsquo;exemple ci-haut, plusieurs \u00e9l\u00e9ments repr\u00e9sentent un d\u00e9fi pour un script informatique :<\/p>\n<ul>\n<li>les valeurs num\u00e9riques m\u00e9lang\u00e9es \u00e0 du texte;<\/li>\n<li>la couleur des cellules qui repr\u00e9sente quelque chose;<\/li>\n<li>les diff\u00e9rents mots utilis\u00e9s pour d\u00e9signer les contr\u00f4les.<\/li>\n<\/ul>\n<p>Concernant l&rsquo;exp\u00e9rience m\u00eame, avec si peu d&rsquo;information dans le fichier ou dans le nom du fichier, il est difficile de savoir dans quel contexte les r\u00e9sultats ont \u00e9t\u00e9 g\u00e9n\u00e9r\u00e9s (type d&rsquo;exp\u00e9rience, concentrations des compos\u00e9s, type d&rsquo;\u00e9chantillons, m\u00e9thode pour calculer l&rsquo;IC50, etc.). Vous avez bien s\u00fbr les r\u00e9sultats importants, les IC50, mais sans les m\u00e9tadonn\u00e9es associ\u00e9es, ces r\u00e9sultats ne sont pas tr\u00e8s informateurs. Vous connaissez s\u00fbrement toutes les conditions qui y sont associ\u00e9es, mais ce n&rsquo;est pas n\u00e9cessairement le cas de vos collaborateurs.<\/p>\n<p>Alors pourquoi ne pas adopter de bonnes habitudes d\u00e8s le d\u00e9part? Par exemple :<\/p>\n<ul>\n<li>toujours garder un fichier structur\u00e9, lisible par un ordinateur contenant les m\u00e9tadonn\u00e9es. Ce fichier devrait \u00eatre plac\u00e9 avec les fichiers de r\u00e9sultats. Il devrait d\u00e9crire l&rsquo;exp\u00e9rience (types d&rsquo;\u00e9chantillons, concentrations, etc) ainsi que le contenu des fichiers de r\u00e9sultats. Les noms de colonnes devraient \u00eatre expliqu\u00e9s s&rsquo;ils ne sont pas suffisant par eux-m\u00eames pour d\u00e9crire le contenu de la colonne. \u00ab\u00a0IC50 4c\u00a0\u00bb, \u00e7a veut dire quoi 4c?;<\/li>\n<li>utiliser un vocabulaire contr\u00f4l\u00e9 et uniforme pour permettre l&rsquo;utilisation des valeurs de texte par la suite. \u00ab\u00a0Quality Control\u00a0\u00bb devrait \u00eatre utilis\u00e9 partout;<\/li>\n<li>ne pas utiliser de couleur ou du formatage de texte (gras, italique) pour repr\u00e9senter de l&rsquo;information. Une nouvelle colonne appel\u00e9e \u00ab\u00a0Method\u00a0\u00bb contenant le nom de la m\u00e9thode utilis\u00e9e ou une nouvelle colonne appel\u00e9e \u00ab\u00a0Used Model2 Graphpad\u00a0\u00bb pourrait \u00eatre cr\u00e9\u00e9e pour indiquer quelles valeurs d&rsquo;IC50 ont \u00e9t\u00e9 calcul\u00e9es avec le mod\u00e8le 2 de Graphpad. Ces cellules peuvent demeurer color\u00e9es en autant que l&rsquo;information soit aussi pr\u00e9sente sous forme de valeur (0 ou 1 par exemple);<\/li>\n<li>ne pas m\u00e9langer les valeurs num\u00e9rique et les valeurs texte dans une m\u00eame colonne. Essayer de calculer la moyenne de la colonne IC50 dans Excel&#8230; Vous comprendrez ce que je veux dire!<\/li>\n<li>penser comme un ordinateur! Les ordinateurs ne prennent pas de d\u00e9cisions (du moins, pas encore!) et ils ne peuvent pas tout deviner. Donc, soyez pr\u00e9cis et ne laissez pas de place \u00e0 l&rsquo;interpr\u00e9tation.<\/li>\n<\/ul>\n<p>Voici \u00e0 quoi ressemblerait exp1.xlsx apr\u00e8s quelques modifications pour le rendre plus convivial pour un ordinateur. Il devrait \u00eatre renomm\u00e9 IC50_cellLineX_20170710_GBoucher_1.xlsx et \u00eatre associ\u00e9 \u00e0 son fichier de m\u00e9tadonn\u00e9es.<\/p>\n<p><img decoding=\"async\" class=\"aligncenter size-large wp-image-3880\" src=\"https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-1024x284.png\" alt=\"\" width=\"1024\" height=\"284\" srcset=\"https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-200x55.png 200w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-300x83.png 300w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-400x111.png 400w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-600x166.png 600w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-768x213.png 768w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-800x222.png 800w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-1024x284.png 1024w, https:\/\/bioinfo.iric.ca\/wpbioinfo\/wp-content\/uploads\/2018\/01\/Screen-Shot-2018-01-28-at-4.06.37-PM-1200x332.png 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p>Le fichier est encore utilisable et plaisant pour les humains. Donc, si vous pouvez, essayez d&rsquo;adopter ces bonnes pratiques d\u00e8s le d\u00e9part!<\/p>\n<p>En fait, les bonnes pratiques existent dans tous les domaines. Dans certains domaines, il est obligatoire de s&rsquo;y conformer. Pensez notamment aux modes op\u00e9ratoires normalis\u00e9s (\u00ab\u00a0Standard Operating Procedures\u00a0\u00bb ou SOPs) existant dans les laboratoires de recherche clinique ou pharmaceutique. Dans d&rsquo;autres domaines, les bonnes pratiques sont fortement encourag\u00e9es mais ne sont pas toujours appliqu\u00e9es. N\u00e9anmoins, elles facilitent les choses lors des collaborations ou lorsque l&rsquo;on doit revisiter un vieux projet.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Supposons que tous vos r\u00e9sultats pour un projet donn\u00e9 sont conserv\u00e9s dans des fichiers Excel nomm\u00e9s exp1.xlsx, exp2_20170708.xlsx, exp_prolif_072017.xlsx, et ainsi de suite. Supposons aussi que le contenu du fichier exp1.xlsx ressemble \u00e0 ceci : Ce fichier est tr\u00e8s convivial pour un humain, mais pas pour un ordinateur. Disons qu&rsquo;un jour, vous d\u00e9cidez (ou votre patron d\u00e9cide) que vous avez besoin d&rsquo;une base de donn\u00e9es pour organiser vos r\u00e9sultats plut\u00f4t que de les conserver dans vingt-six fichiers Excel diff\u00e9rents. Si <a href=\"https:\/\/bioinfo.iric.ca\/fr\/pensez-comme-un-ordinateur\/\"> [&#8230;]<\/a><\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[41,42],"tags":[],"class_list":["post-3886","post","type-post","status-publish","format-standard","hentry","category-bioinformatique","category-biologie"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/3886","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/comments?post=3886"}],"version-history":[{"count":14,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/3886\/revisions"}],"predecessor-version":[{"id":3914,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/posts\/3886\/revisions\/3914"}],"wp:attachment":[{"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/media?parent=3886"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/categories?post=3886"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bioinfo.iric.ca\/fr\/wp-json\/wp\/v2\/tags?post=3886"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}