class: title-slide, inverse .pull-left[ # Les rôles des variables ## ### Facundo Muñoz<br/>facundo.munoz@cirad.fr<br/> ![](img/CirBlanc_L230px.png) ] .pull-right[ ![](https://miro.medium.com/max/875/0*GaEAXG0i_3f5FIFD.png) ] ??? --- layout: true <a class="footer-link" href="https://umr-astre.pages.mia.inra.fr/training/notions_stats/">Notions de base en statistiques - umr-astre.pages.mia.inra.fr/training/notions_stats/</a> --- # Quelles variables _expliquent_ et quelles _sont expliquées_ ? <table> <thead> <tr> <th style="text-align:right;"> ID </th> <th style="text-align:left;"> drug </th> <th style="text-align:left;"> therapy </th> <th style="text-align:right;"> mood.gain </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> placebo </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 0.5 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:left;"> placebo </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 0.3 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:left;"> placebo </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 0.1 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:left;"> anxifree </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 0.6 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:left;"> anxifree </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 0.4 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:left;"> anxifree </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 0.2 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:left;"> joyzepam </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 1.4 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:left;"> joyzepam </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 1.7 </td> </tr> <tr> <td style="text-align:right;"> 9 </td> <td style="text-align:left;"> joyzepam </td> <td style="text-align:left;"> no.therapy </td> <td style="text-align:right;"> 1.3 </td> </tr> <tr> <td style="text-align:right;"> 10 </td> <td style="text-align:left;"> placebo </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 0.6 </td> </tr> <tr> <td style="text-align:right;"> 11 </td> <td style="text-align:left;"> placebo </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 0.9 </td> </tr> <tr> <td style="text-align:right;"> 12 </td> <td style="text-align:left;"> placebo </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 0.3 </td> </tr> <tr> <td style="text-align:right;"> 13 </td> <td style="text-align:left;"> anxifree </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 1.1 </td> </tr> <tr> <td style="text-align:right;"> 14 </td> <td style="text-align:left;"> anxifree </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 0.8 </td> </tr> <tr> <td style="text-align:right;"> 15 </td> <td style="text-align:left;"> anxifree </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 1.2 </td> </tr> <tr> <td style="text-align:right;"> 16 </td> <td style="text-align:left;"> joyzepam </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 1.8 </td> </tr> <tr> <td style="text-align:right;"> 17 </td> <td style="text-align:left;"> joyzepam </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 1.3 </td> </tr> <tr> <td style="text-align:right;"> 18 </td> <td style="text-align:left;"> joyzepam </td> <td style="text-align:left;"> CBT </td> <td style="text-align:right;"> 1.4 </td> </tr> </tbody> </table> ??? Dans cet exemple, nous allons travailler sur des données fictives d'un essai clinique dans lequel vous testez un nouvel antidépresseur appelé __Joyzepam__. Afin d’établir un test équitable de l’efficacité du médicament, l’étude comprend __trois médicaments distincts__ à administrer. L’un est un __placebo__ et l’autre est un antidépresseur / médicament anti-anxiété appelé Anxifree. Un groupe de 18 participants souffrant de dépression modérée à sévère est recruté pour votre test initial. Comme les médicaments sont parfois administrés conjointement avec une thérapie psychologique, votre étude comprend 9 personnes qui suivent une thérapie cognitivo-comportementale (TCC) et 9 dont ce n’est pas le cas. Les participants sont assignés au hasard (selon la procédure du double aveugle, bien sûr) à un traitement, de sorte qu’il y a 3 personnes en TCC et 3 personnes sans traitement pour chacun des 3 médicaments. Un psychologue évalue l’humeur de chaque personne après trois mois de traitement avec chaque drogue, et l’amélioration globale de l’humeur de chaque personne est évaluée sur une échelle allant de -5 à +5. --- # Causalité ? - Oui, mais pas forcement ni toujours - Dépend plutôt des __objectifs de l'étude__ - Qu'est-ce qu'on __peut mesurer__ plus facilement et qu'est-ce que qu'on veut pouvoir __prédire__ avec ??? - S'il y a une rélation de causalité (traitement -> résultat) alors c'est claire. - Ej., données éléctorales : enquêtes et résultats. On veut prédire les résultats à partir des enquêtes mais pas de causalité. - Ou bien des proxys (des choses accéssibles associées à des choses inaccéssibles) --- # Lexique ## Variable _explicative_ predicitve, indépendante, covariable ## Variable _à expliquer_ réponse, dépendante, résultat --- # Notation $$ Y = f(X_1, X_2, \ldots, X_p) + \text{Erreur}$$ - Les variations des variables `\(X_1\)`, `\(X_2\)`, `\(\ldots\)`, `\(X_p\)` _expliquent_ __en partie__ les variations dans la variable réponse `\(Y\)`. - _Erreur_ est un mauvais terme pour __variation individuelle__, ou variation __non expliquée__ par les covariables `\(X_\cdot\)`, ou encore, __variation résiduelle__ - Quand on attribue une distribution de probabilité à la variation individuelle (et peut-être à la fonction `\(f\)`) ceci est un __modèle statistique__ ??? On utilise typiquement `\(Y\)` pour la variable réponse et `\(X\)` pour les variables explicatives La distinction reflète la position qu'elles occupent dans le modèle. Notons que parfois on appelle _modèle_ a la fonction des variables (e.g. une droite) --- # Exemple <img src="S3.1_roles_files/figure-html/mood-gain-1-1.png" width="90%" /> ??? Voici une représentation graphique des données observées --- # Exemple <img src="S3.1_roles_files/figure-html/mood-gain-2-1.png" width="90%" /> ??? Notre __modèle__ établie que l'amélioration de l'humour à 3 mois de traitement dépend (est une fonction de) la drogue administrée --- # Exemple <img src="S3.1_roles_files/figure-html/mood-gain-3-1.png" width="90%" /> ??? Et puis, chaque observation individuelle... --- # Exemple <img src="S3.1_roles_files/figure-html/mood-gain-4-1.png" width="90%" /> ??? ... est le résultat de la valeur correspondante à la drogue plus une certaine variation produite par d'autres facteurs individuelles (à part la drogue) --- # Références - [Le « rôle » des variables : prédicteurs et résultats](https://jmeunierp8.github.io/ManuelJamovi/s2.html#s2_4) dans _Apprentissage des statistiques avec Jamovi : Un tutoriel pour les étudiants en psychologie et autres débutants. Danielle Navarro, David Foxcroft, Jean-Marc Meunier (Trad). 2020. ??? --- class: middle # Merci! Diapositives créées à l'aide du package R [**xaringan**](https://github.com/yihui/xaringan). En s'appuyant sur [remark.js](https://remarkjs.com), [**knitr**](https://yihui.org/knitr), et [R Markdown](https://rmarkdown.rstudio.com). <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" /></a><br />Ce(tte) œuvre est mise à disposition selon les termes de la <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr">Licence Creative Commons Attribution - Partage dans les Mêmes Conditions 4.0 International</a>.