Les rôles des variables

class: title-slide, inverse

.pull-left[
# Les rôles des variables

### Facundo Muñoz<br/>facundo.munoz@cirad.fr<br/>

![](img/CirBlanc_L230px.png)
]
.pull-right[
![](https://miro.medium.com/max/875/0*GaEAXG0i_3f5FIFD.png)
]
???

---
layout: true

<a class="footer-link" href="https://umr-astre.pages.mia.inra.fr/training/notions_stats/">Notions de base en statistiques - umr-astre.pages.mia.inra.fr/training/notions_stats/</a>

---
# Quelles variables _expliquent_ et quelles _sont expliquées_ ?

<table>
 <thead>
  <tr>
   <th style="text-align:right;"> ID </th>
   <th style="text-align:left;"> drug </th>
   <th style="text-align:left;"> therapy </th>
   <th style="text-align:right;"> mood.gain </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:right;"> 1 </td>
   <td style="text-align:left;"> placebo </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 0.5 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 2 </td>
   <td style="text-align:left;"> placebo </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 0.3 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 3 </td>
   <td style="text-align:left;"> placebo </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 0.1 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 4 </td>
   <td style="text-align:left;"> anxifree </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 0.6 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 5 </td>
   <td style="text-align:left;"> anxifree </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 0.4 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 6 </td>
   <td style="text-align:left;"> anxifree </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 0.2 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 7 </td>
   <td style="text-align:left;"> joyzepam </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 1.4 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 8 </td>
   <td style="text-align:left;"> joyzepam </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 1.7 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 9 </td>
   <td style="text-align:left;"> joyzepam </td>
   <td style="text-align:left;"> no.therapy </td>
   <td style="text-align:right;"> 1.3 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 10 </td>
   <td style="text-align:left;"> placebo </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 0.6 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 11 </td>
   <td style="text-align:left;"> placebo </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 0.9 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 12 </td>
   <td style="text-align:left;"> placebo </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 0.3 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 13 </td>
   <td style="text-align:left;"> anxifree </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 1.1 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 14 </td>
   <td style="text-align:left;"> anxifree </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 0.8 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 15 </td>
   <td style="text-align:left;"> anxifree </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 1.2 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 16 </td>
   <td style="text-align:left;"> joyzepam </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 1.8 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 17 </td>
   <td style="text-align:left;"> joyzepam </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 1.3 </td>
  </tr>
  <tr>
   <td style="text-align:right;"> 18 </td>
   <td style="text-align:left;"> joyzepam </td>
   <td style="text-align:left;"> CBT </td>
   <td style="text-align:right;"> 1.4 </td>
  </tr>
</tbody>
</table>

???

Dans cet exemple, nous allons travailler sur des données fictives d'un essai clinique dans lequel vous testez un nouvel antidépresseur appelé __Joyzepam__.

Afin d’établir un test équitable de l’efficacité du médicament, l’étude comprend __trois médicaments distincts__ à administrer.

L’un est un __placebo__ et l’autre est un antidépresseur / médicament anti-anxiété appelé Anxifree. Un groupe de 18 participants souffrant de dépression modérée à sévère est recruté pour votre test initial. Comme les médicaments sont parfois administrés conjointement avec une thérapie psychologique, votre étude comprend 9 personnes qui suivent une thérapie cognitivo-comportementale (TCC) et 9 dont ce n’est pas le cas. Les participants sont assignés au hasard (selon la procédure du double aveugle, bien sûr) à un traitement, de sorte qu’il y a 3 personnes en TCC et 3 personnes sans traitement pour chacun des 3 médicaments. Un psychologue évalue l’humeur de chaque personne après trois mois de traitement avec chaque drogue, et l’amélioration globale de l’humeur de chaque personne est évaluée sur une échelle allant de -5 à +5.

---
# Causalité ?

- Oui, mais pas forcement ni toujours

- Dépend plutôt des __objectifs de l'étude__

- Qu'est-ce qu'on __peut mesurer__ plus facilement et qu'est-ce que qu'on veut pouvoir __prédire__ avec

???

- S'il y a une rélation de causalité (traitement -> résultat) alors c'est claire.

- Ej., données éléctorales : enquêtes et résultats. On veut prédire les résultats à partir des enquêtes mais pas de causalité.

- Ou bien des proxys (des choses accéssibles associées à des choses inaccéssibles)

---
# Lexique

## Variable _explicative_

predicitve, indépendante, covariable

## Variable _à expliquer_

réponse, dépendante, résultat

---
# Notation

$$ Y = f(X_1, X_2, \ldots, X_p) + \text{Erreur}$$

- Les variations des variables `$X_1$`, `$X_2$`, `$\ldots$`, `$X_p$` _expliquent_ __en partie__ les variations dans la variable réponse `$Y$`.

- _Erreur_ est un mauvais terme pour __variation individuelle__, ou variation __non expliquée__ par les covariables `$X_\cdot$`, ou encore, __variation résiduelle__

- Quand on attribue une distribution de probabilité à la variation individuelle (et peut-être à la fonction `$f$`) ceci est un __modèle statistique__

???

On utilise typiquement `$Y$` pour la variable réponse et
`$X$` pour les variables explicatives

La distinction reflète la position qu'elles occupent dans le modèle.

Notons que parfois on appelle _modèle_ a la fonction des variables (e.g. une droite)

---
# Exemple

???

Voici une représentation graphique des données observées

---
# Exemple

???

Notre __modèle__ établie que l'amélioration de l'humour à 3 mois de traitement
dépend (est une fonction de) la drogue administrée

---
# Exemple

???

Et puis, chaque observation individuelle...

---
# Exemple

???

... est le résultat de la valeur correspondante à la drogue plus une certaine
variation produite par d'autres facteurs individuelles (à part la drogue)

---
# Références

- [Le « rôle » des variables : prédicteurs et résultats](https://jmeunierp8.github.io/ManuelJamovi/s2.html#s2_4) dans
_Apprentissage des statistiques avec Jamovi : Un tutoriel pour les étudiants en psychologie et autres débutants.
Danielle Navarro, David Foxcroft, Jean-Marc Meunier (Trad). 2020.

???

---
class: middle

# Merci!

Diapositives créées à l'aide du package R [**xaringan**](https://github.com/yihui/xaringan).

En s'appuyant sur [remark.js](https://remarkjs.com), [**knitr**](https://yihui.org/knitr), et [R Markdown](https://rmarkdown.rstudio.com).

<a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" /></a><br />Ce(tte) œuvre est mise à disposition selon les termes de la <a rel="license" href="https://creativecommons.org/licenses/by-sa/4.0/deed.fr">Licence Creative Commons Attribution -  Partage dans les Mêmes Conditions 4.0 International</a>.