class: title-slide, inverse .pull-left[ # La description d'un jeu de données ## ### Facundo Muñoz<br/>facundo.munoz@cirad.fr<br/> ![](img/CirBlanc_L230px.png) ] .pull-right[ <!-- ![](https://www.nodegraph.se/wp-content/uploads/2018/03/what-is-metadata-nodegraph-qlik.jpg) --> ] ??? --- layout: true <a class="footer-link" href="https://umr-astre.pages.mia.inra.fr/training/notions_stats/">Notions de base en statistiques - umr-astre.pages.mia.inra.fr/training/notions_stats/</a> --- class: inverse, middle, center .quote[ .pull-right[ » Votre collaborateur les plus important êtes vous-même dans le passé. Mais il ne répond pas à vos é-mails. ] ] --- # Principes 1. Pouvoir __transmettre__ des données avec toute les infos nécessaires pour travailler avec 2. Éviter des __erreurs__ d'interprétation ??? "Transmettre" à une autre personne ou à soit même dans le futur ! "Votre collaborateur le plus important c'est vous même dans le passé, mais il ne répond pas aux é-mails --- # Méta-données - Ficher Readme / Lisez-moi .small[Description succinte du projet, la source des données et méthodes de collecte, le contexte, les objectifs, références, contactes, etc.] -- - Description de variables (_data-dictionary_) .small[ - Le nom de la variable tel qu'il apparaît - Version du nom adaptée pour visualisations - Type de variable (catégorielle, quantitative, etc.) - Unités de mesure - Rang possible de variation, valeurs possibles, - Description ] --- background-image: url(https://www.tandfonline.com/na101/home/literatum/publisher/tandf/journals/content/utas20/2018/utas20.v072.i01/00031305.2017.1375989/20180424-01/images/medium/utas_a_1375989_f0009_b.gif) background-position: center background-size: 600px # Dictionnaire de données C'est en soi un jeu de données !! E.g. : --- # Conclusions - Très __vagues suggestions__, plusieurs choix et options - Peu importe le __système__ ou les outils : - Fichiers de texte associés - Dêpot avec des métadonnées intégrées (e.g. [Cirad Dataverse](https://dataverse.cirad.fr/)) - Formats spécifiques - Plan de Gestion de Données (e.g. [DMP OPIDoR](https://dmp.opidor.fr/)) - Choisir un et respecter les __principes__ --- # Références - Karl W. Broman & Kara H. Woo (2018). Data organisation in Spreadsheets. _The American Statistician_, 72:1, 2-10, [DOI: 10.1080/00031305.2017.1375989](https://doi.org/10.1080/00031305.2017.1375989) ??? --- class: middle # Merci! Diapositives créées à l'aide du package R [**xaringan**](https://github.com/yihui/xaringan). En s'appuyant sur [remark.js](https://remarkjs.com), [**knitr**](https://yihui.org/knitr), et [R Markdown](https://rmarkdown.rstudio.com). <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" /></a><br />Ce(tte) œuvre est mise à disposition selon les termes de la <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr">Licence Creative Commons Attribution - Partage dans les Mêmes Conditions 4.0 International</a>.