class: title-slide, inverse .pull-left[ # Les échelles de mesure des variables ## ### Facundo Muñoz<br/>facundo.munoz@cirad.fr<br/> ![](img/CirBlanc_L230px.png) ] .pull-right[ ![](img/S3.2_types_fig-1.jpeg) ] ??? --- layout: true <a class="footer-link" href="https://umr-astre.pages.mia.inra.fr/training/notions_stats/">Notions de base en statistiques - umr-astre.pages.mia.inra.fr/training/notions_stats/</a> --- # Exemple Quelle classification feriez vous des variables suivantes ? - __`id_subject`__ : identificateur de l'individu (1, 2, 3, ...) - __`species`__ : espèce (bovin, caprin, ovin) - __`n_ticks`__ : nombre de tiques sur le corps - __`weight`__ : poids de l'individu - __`clinical_score`__ : évaluation clinique au jour 7 (1 - pas de symptômes, 2 - fièvre légère, 3 - hémorragie) - __`outcome`__ : statut au jour 7 (vivant, mort) ??? Imaginons une expérience dans laquelle on recueille les variables suivantes pour un certain nombre d'animaux. Je vous laisse 3' pour définir des groupes et classer les variables. --- # Classification conventionnelle ![](img/S3.2_types_fig-1.jpeg) .footnote[nomenclature : nominale = catégorielle] --- # Lexique | Variable quantitative | Variable qualitative | |-----------------------|----------------------| | numérique | nominale | | continue | catégorielle | | échelle | facteur | --- # Les variables __quantitatives__ .center[ ![:scale 63%](https://raw.githubusercontent.com/allisonhorst/stats-illustrations/master/other-stats-artwork/continuous_discrete.png) ] .credit[[Artwork by @allison_horst](https://github.com/allisonhorst/stats-illustrations)] ??? __Y a t'il toujours des valeurs possibles entre deux valeurs quelconque ?__ __D'autres exemples de chaque un de ces échelles de mesure ?__ --- # Les variables __qualitatives__ .center[ ![:scale 80%](https://raw.githubusercontent.com/allisonhorst/stats-illustrations/master/other-stats-artwork/nominal_ordinal_binary.png) ] .credit[[Artwork by @allison_horst](https://github.com/allisonhorst/stats-illustrations)] ??? __On ne peut pas faire une moyenne avec__ pas de sens (sauf, peut-être, avec les binaires codées comme 0/1). Classement dans une course : on peut dire que le premier arrivé a été plus rapide que le second, mais on ne sait pas de combien. Les différences entre catégories n'ont pas de magnitude. Les binaires sont un cas particulier des nominales (ou des ordinales) qui parfois se distingue spécifiquement par son ubiquité. __D'autres exemples de chaque un de ces échelles de mesure ?__ --- # La classification n'est pas toujours évident ## ni unique - La variable __age__, mesurée en années, est-elle _continue_ ou plutôt _discrète_ ? -- - Un __score clinique__ peut être considéré comme __discret__ -- .center[ ## Ça dépend des __hypothèses__ et de l'__utilisation__ qu'on fait ] ??? Mesure de la production du cacaoiers (entre 3 et 10 ans) dépend plutôt des variations environnementales et chaque année est intépendante. La différence entre _pas de symptômes_ et _fièvre légère_ est la même qu'entre _fièvre légère_ et _hémorragie_ ? Pas claire, mais parfois on présente un score clinique comme un score entre 1 et 5 ou 1 = pas de symptomes et 5 = mort et implicitement on induit une sorte de quantification. --- # Quelques élements d'attention - Pas de rélation stricte entre la __codification__ de la variable (texte/numérique) et l'__échelle de mesure__ Les variables __qualitatives__ sont souvent codées en __texte__ (e.g. nom de l'espèce) mais il peuvent être numériques (e.g. score clinique) - Ne pas confondre __résolution de mesure__ avec __discretitude__ ??? Mésurer l'age en ans, mais il est possible d'avoir 26.26 ans. --- # Exercice - Ouvrir le jeu de données _Clinical Trial_ dans __jamovi__ - Repérer les __symboles__ (icônes) associés à chaque type de variable - La classification automatique n'est peut-être pas le plus pertinent. Changeriez-vous quelque chose ? - Classez les variables de votre jeu de données, et intégrez l'info dans les métadonnées Discutons les questions et doutes --- # Références - Open classrooms. [Découvrez les 4 types de variables](https://openclassrooms.com/fr/courses/4525266-decrivez-et-nettoyez-votre-jeu-de-donnees/4725615-decouvrez-les-4-types-de-variables) ??? --- class: middle # Merci! Diapositives créées à l'aide du package R [**xaringan**](https://github.com/yihui/xaringan). En s'appuyant sur [remark.js](https://remarkjs.com), [**knitr**](https://yihui.org/knitr), et [R Markdown](https://rmarkdown.rstudio.com). <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" /></a><br />Ce(tte) œuvre est mise à disposition selon les termes de la <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr">Licence Creative Commons Attribution - Partage dans les Mêmes Conditions 4.0 International</a>.