Intro à marginaleffects
Présentation:
https://arelbundock.com/precrisa.html
Code pour l’atelier:
https://arelbundock.com/precrisa.R
Données:
marginaleffects
modelsummary
tinytable
countrycode
tinytable
modelsummary
R
est incohérent
\[ P_{X=1}=Pr(Y=1|X=1) \]
Peu de nuances:
Kahneman & Tversky (1979), Nickerson (2004), etc.
Odds (chances):
\[ \frac{P_{X=1}}{1 - P_{X=1}} \]
\[ P_{X=1}=Pr(Y=1|X=1) \]
Peu de nuances:
Kahneman & Tversky (1979), Nickerson (2004), etc.
Odds ratio:
\[ \frac{P_{X=1}}{1 - P_{X=1}} / \frac{P_{X=0}}{1 - P_{X=0}} \]
Demand for, and Impact of, Learning HIV Status. American Economic Review.
RCT dans les zones rurales du Malawi
(1) | |
---|---|
(Intercept) | -1.297 |
(0.176) | |
incentive | 2.005 |
(0.100) | |
age | 0.010 |
(0.003) | |
distance [Medium] | 0.193 |
(0.132) | |
distance [Short] | 0.484 |
(0.126) | |
Num.Obs. | 2825 |
AIC | 3041.4 |
BIC | 3071.1 |
Log.Lik. | -1515.693 |
F | 103.281 |
RMSE | 0.42 |
\(P_{X=1}\)=Difficile
Impossible:
\[\ln \left[ \left (\frac{P_{X=1}}{1-P_{X=1}}\right ) / \left (\frac{P_{X=0}}{1-P_{X=0}} \right ) \right]\]
¯\_(ツ)_/¯
(1) | |
---|---|
(Intercept) | -1.297 |
(0.176) | |
incentive | 2.005 |
(0.100) | |
age | 0.010 |
(0.003) | |
distance [Medium] | 0.193 |
(0.132) | |
distance [Short] | 0.484 |
(0.126) | |
Num.Obs. | 2825 |
AIC | 3041.4 |
BIC | 3071.1 |
Log.Lik. | -1515.693 |
F | 103.281 |
RMSE | 0.42 |
Focus: Quantités statistiques intuitives
marginaleffects
📦Guichet unique pour l’interprétation des modèles statistiques et d’apprentissage automatique :
Livre en ligne gratuit avec plus de 30 chapitres et études de cas :
marginaleffects
📦Peut-on rejeter l’hypothèse nulle qu’un coefficient – ou une fonction de coefficients – est égal à une valeur \(H_0\)?
hypotheses()
Coefficients logit:
(Intercept) incentive age distanceMedium distanceShort
-1.297433301 2.005157150 0.009644433 0.192817773 0.484206558
Pertinent? Probablement pas. Flexible? Oui!
marginaleffects
Applicable pour comparer toutes les quantités estimées par la librairie:
Résultat prédit par un modèle sur une échelle spécifiée pour une combinaison donnée de valeurs des variables prédictrices.
“fitted values”
predictions()
, avg_predictions()
, plot_predictions()
\[\beta_1 + \beta_2 X + \beta_3 Z\]
\[P(Y=1) = \phi (\beta_1 + \beta_2 X + \beta_3 Z),\]
Où \(\phi\) est la fonction logistique :
\[P(Y=1) = \frac{1}{1 + e^{-(\beta_1 + \beta_2 X + \beta_3 Z)}}\]
\[ P(Result=1) = \phi (\beta_1 + \beta_2 Incentive + \beta_3 Age + \beta_4 Medium + \beta_5 Short)\\ \]
Prédiction (fitted value):
\[ \widehat{P(Result=1)} = \phi (\hat{\beta}_1 + \hat{\beta}_2 \cdot 1 + \hat{\beta}_3 \cdot 30 + \hat{\beta}_4 \cdot 0 + \hat{\beta}_5 \cdot 1), \]
predictions()
et datagrid()
Estimate Pr(>|z|) S 2.5 % 97.5 %
0.818 <0.001 324.3 0.796 0.838
0.798 <0.001 198.3 0.770 0.823
0.852 <0.001 179.6 0.822 0.878
0.795 <0.001 177.1 0.766 0.822
0.853 <0.001 173.6 0.823 0.879
--- 2815 rows omitted. See ?avg_predictions and ?print.marginaleffects ---
0.729 <0.001 60.7 0.684 0.769
0.315 <0.001 22.4 0.256 0.381
0.738 <0.001 68.1 0.694 0.777
0.240 <0.001 47.0 0.191 0.297
0.253 <0.001 47.0 0.204 0.307
Calculer les prédictions pour 2825 :
Prendre leur moyenne :
Ou :
by
Est-ce que la probabilité prédite moyenne de récupérer son résultat est la même dans le groupe “Short” et le groupe “Long”?
plot_predictions()
Linéaire, GLM, GAM, Multi-niveau, Bayesien, etc.
Comparer les prédictions faites par un modèle pour différentes valeurs d’une variable explicative (p. ex., diplômés du collège vs. autres) :
Exemples: Contrastes, différences, rapports de risque (risk ratios), cotes (odds), hausse (lift), etc.
comparisons()
, avg_comparisons()
, plot_comparisons()
Supposons:
Nombreuses quantités d’intérêt :
Les quantités mentionnées plus haut sont conditionnelles.
Estimés différents pour différentes valeurs des prédicteurs. Ex: La “Risk Difference” pour un homme de 30 ans est différente de celle pour une femme de 50 ans.
Il faut définir les valeurs des variables de contrôle qui nous intéressent. Comme avec les prédictions.
En moyenne, est-ce que passer de 0 à 1 sur la variable incentive
augmente la probabilité de result=1
?
Un individu de 30 ans qui habite à près du centre :
\[\hat{Y}_{I=1, A=30, D=S} - \hat{Y}_{I=0, A=30, D=S}\]
Estimate Std. Error z Pr(>|z|) S 2.5 % 97.5 %
0.441 0.0216 20.4 <0.001 305.4 0.399 0.484
0.451 0.0213 21.1 <0.001 326.6 0.409 0.493
0.415 0.0247 16.8 <0.001 209.0 0.367 0.464
0.452 0.0213 21.2 <0.001 329.4 0.410 0.494
0.414 0.0249 16.6 <0.001 204.0 0.365 0.463
--- 2815 rows omitted. See ?avg_comparisons and ?print.marginaleffects ---
0.463 0.0196 23.6 <0.001 405.8 0.425 0.502
0.459 0.0214 21.4 <0.001 335.1 0.417 0.501
0.463 0.0199 23.3 <0.001 395.3 0.424 0.502
0.461 0.0192 24.0 <0.001 420.6 0.423 0.499
0.463 0.0194 23.9 <0.001 416.8 0.425 0.500
Term: incentive
Comparison: 1 - 0
Estimate Std. Error z Pr(>|z|) S 2.5 % 97.5 %
0.449 0.0209 21.5 <0.001 338.3 0.408 0.489
Term: incentive
Comparison: mean(1) - mean(0)
aka:
distance Estimate Std. Error z Pr(>|z|) S 2.5 % 97.5 %
Long 0.461 0.0199 23.1 <0.001 390.8 0.422 0.500
Medium 0.457 0.0208 22.0 <0.001 353.9 0.417 0.498
Short 0.439 0.0216 20.3 <0.001 302.3 0.397 0.481
Term: incentive
Comparison: mean(1) - mean(0)
Estimate Std. Error z Pr(>|z|) S 2.5 % 97.5 %
0.450 0.0208 21.6 <0.001 340.8 0.409 0.490
0.448 0.0209 21.5 <0.001 337.6 0.407 0.489
Term: incentive
Comparison: mean(1) - mean(0)
aka:
Quel est l’effet d’une augmentation de age
de…
Exemple de différents contrastes avec la variable distance
:
\[\frac{\hat{Y}_{I=1, A=30, D=S}}{\hat{Y}_{I=0, A=30, D=S}}\]
\[\log\left(\frac{\hat{Y}_{I=1,A=30,D=S}}{1 - \hat{Y}_{I=1,A=30,D=S}}\right) - \log\left(\frac{\hat{Y}_{I=0,A=30,D=S}}{1 - \hat{Y}_{I=0,A=30,D=S}}\right)\]
Effet de traitement moyen pour les individus à différentes distance
:
Effet de traitement moyen pour les individus à différentes distance
:
Est-ce que l’effet de incentive
est plus fort pour ceux qui habitent loin (Long
) que pour ceux qui habitent près (Short
)?
\[\beta_1 - \beta_3 = 0\]
Oui!
plot_comparisons()
: 1 conditionQuel est l’“effet” de incentive
sur result
, à différents niveaux de distance
?
https://arelbundock.com/precrisa.R