Efectos de Tratamiento
El modelo de los efectos de tratamiento, también conocido como modelo de resultados potenciales, modelo de Neyman-Rubin o modelo contrafactual, nos permite inferir la relación causal entre dos variables, y . En el modelo, es la variable de tratamiento, y la variable de respuesta (la variable endógena).
Una complicación del modelo de Neyman-Rubin es que tiene, al menos, dos resultados potenciales, uno de los cuales es observable y el otro no. Los resultados no observables se conocen como contrafactuales; esto es, aquellos que representan el resultado de una situación que no ha ocurrido, o, en otras palabras, contraria a la situación observada. Por ejemplo, consideremos el caso de un trasplante al corazón. Aquí el tratamiento es el trasplante mismo, y los resultados (desenlaces) posibles son que el individuo que lo recibe sane o muera. Imaginemos que el individuo recibe el trasplante y vive. Para poder medir el efecto causal del tratamiento, es decir para saber si el individuo vive como resultado del trasplante, necesitaríamos saber qué hubiera pasado si este mismo individuo, en el mismo periodo de tiempo, no recibe el tratamiento y, como consecuencia, muere. Este último resultado es el contrafactual.
En este post estaremos utilizando los siguientes paquetes de R:
# Instalar paquetes si es necesario
# install.packages("tidyverse")
# install.packages("Hmisc")
# Leer paquetes
library(tidyverse)
## ── Attaching packages ──────────────── tidyverse 1.3.0 ──
## ✓ ggplot2 3.3.2 ✓ purrr 0.3.4
## ✓ tibble 3.0.1 ✓ dplyr 1.0.0
## ✓ tidyr 1.1.0 ✓ stringr 1.4.0
## ✓ readr 1.3.1 ✓ forcats 0.5.0
## ── Conflicts ─────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(Hmisc)
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
##
## Attaching package: 'Hmisc'
## The following objects are masked from 'package:dplyr':
##
## src, summarize
## The following objects are masked from 'package:base':
##
## format.pval, units
Formalización del modelo
Para formalizar el modelo de de los efectos de tratamiento, supongamos que, aunque el tratamiento podría ser en diferentes intensidades y, al mismo tiempo, los resultados podrían ser múltiples, es una variable binaria, de tal forma que:
donde indica la unidad -ésima. El grupo de unidades tratadas se conoce como grupo de tratamiento, y el grupo de unidades no tratadas se conoce como grupo de control}*. En nuestro ejemplo de arriba, la variable tomará el valor de si la persona recibe un trasplante de corazón y en caso contrario. Además, para cada unidad , la variable de respuesta, , puede tomar dos resultados potenciales:
donde en nuestro ejemplo sería una persona que no recibe el trasplante y muere, y sería una persona que recibe el tratamiento y sana. Otra forma de relacionar la variable de respuesta con los resultados potenciales es mediante la fórmula:
En esta última ecuación, el elemento se conoce como el efecto de tratamiento}* para la unidad (es decir, el efecto del trasplante en nuestro ejemplo), que denotaremos como . Específicamente:
de tal forma que:
Como hemos dicho, uno de los principales problemas del modelo de Neyman-Rubin es que, aunque existen dos resultados potenciales para cada unidad , solo uno de ellos es observable. Este es el problema fundamental de la inferencia causal. En particular, cuando , es observable y no. En cambio, cuando , es observable y no. Los resultados no observables son los contrafactuales. Por ejemplo, ¿qué pasa si a una persona con trasplante y sana no se le aplica el tratamiento? Y ¿qué pasa si a una persona sin trasplante y muerta se le aplica el tratamiento?
Debido al problema fundamental de la inferencia causal, el cual desde el punto de vista práctico implica que no podemos calcular para cada unidad , resulta más conveniente hacer una estimación del efecto causal analizando las propiedades estadísticas del efecto de tratamiento. La medida más utilizada para esto es el efecto de tratamiento promedio, el cual denotaremos por y está definido como:
Lo anterior implica que el no es más que la diferencia entre el efecto promedio sobre el grupo de tratamiento y el efecto promedio sobre el grupo de control. Desde el punto de vista funcional, un estimador del , que llamaremos es:
donde y se refieren al número de unidades en el grupo de tratamiento y en el grupo de control, respectivamente.
Otro indicador que se acostumbra estimar en la práctica es el efecto de tratamiento sobre los tratados, el cual no es más que el efecto de tratamiento promedio condicional a que se ha recibido el tratamiento. Este lo denotaremos como y se calcula como:
Nota que el primer término en el es plenamente identificable a partir de las observaciones. Esto es porque no es más que el resultado promedio para el grupo de tratamiento dado que recibieron el tratamiento. El segundo término, en cambio, es un caso contrafactual que representa el resultado promedio para el grupo de control dado que recibieron el tratamiento. Naturalmente este caso no es observable. Sin embargo, puede demostrarse que si las personas tratadas se han elegido de manera aleatoria (de tal forma que y son independientes de ) el segundo término del puede estimarse con su análogo: , de tal forma que:
Naturalmente, encontrar casos en los que la selección de las unidades en los grupos de tratamiento y de control sea completamente aleatoria es muy complicado. Intentemos imaginar, por ejemplo, si la selección de personas quienes reciben un trasplante de corazón es completamente aleatoria, o si resulta aleatorio que una persona participe en alguna campaña de salud. Por lo general, estas personas se autoseleccionan, lo que genera cierto sesgo en la estimación del y del .
Ejemplo: Proyecto STAR
Un ejemplo muy interesante de experimento aleatorio es el Proyecto STAR, el cual se llevó a cabo en Tennessee, Estados Unidos, entre 1985 y 1989. En este experimento, una muestra de niños desde kindergarten hasta tercer año de educación primaria se asignaron aleatoriamente en clases de diferentes tipos: 1) clases pequeñas con 13-17 alumnos, 2) clases regulares con 22-25 alumnos, y 3) clases regulares que cuentan con un profesor asistente, además del profesor titular. El objetivo del estudio fue medir el desempeño de los alumnos en cada uno de los tres tipos de clases. Este es, claramente, un tipo de análisis en el que podemos medir el efecto del tratamiento, donde el tratamiento puede definirse como la asignación de un alumno a un grupo pequeño y el resultado es el desempeño del estudiante, medido este como un promedio de sus calificaciones en matemáticas, ciencias e idioma extranjero.
db <- read_csv("https://raw.githubusercontent.com/amosino/courses--econometria/master/econometria_salud/econometria_salud--datos/STARData.csv")
## Warning: Missing column names filled in: 'X1' [1]
## Parsed with column specification:
## cols(
## .default = col_double()
## )
## See spec(...) for full column specifications.
De esta base de datos tomemos solamente el puntaje total (totalscore), la cual, como hemos dicho, es la variable que nos indica el rendimiento escolar de los niños y la asignación del alumno a un grupo regular o uno reducido (small). Esta no es más que una variable dummy que vale si el niño fue asignado a un grupo pequeño y de otra forma; esta es la variable de tratamiento. Si el tratamiento tiene éxito, esperamos que el puntaje promedio sea mayor cuando .
vars <- c("totalscore","small")
db_regular <- db[which(db$small==0),vars]
db_small <- db[which(db$small==1),vars]
Como primer paso, hacemos un resumen estadístico de la variable totalscore para cada una de las submuestras. Estas submuestras pueden calcularse como sigue:
db_regular <- db[which(db$small==0),vars]
db_small <- db[which(db$small==1),vars]
El comando describe() nos ayuda a ver con detalle la variable de interés:
describe(db_regular)
## db_regular
##
## 2 Variables 4048 Observations
## --------------------------------------------------------------------------------
## totalscore
## n missing distinct Info Mean Gmd .05 .10
## 4048 0 365 1 918.2 79.71 815.0 834.0
## .25 .50 .75 .90 .95
## 868.0 911.5 959.0 1010.0 1050.0
##
## lowest : 635 680 711 719 727, highest: 1203 1206 1229 1231 1253
## --------------------------------------------------------------------------------
## small
## n missing distinct Info Mean Gmd
## 4048 0 1 0 0 0
##
## Value 0
## Frequency 4048
## Proportion 1
## --------------------------------------------------------------------------------
describe(db_small)
## db_small
##
## 2 Variables 1738 Observations
## --------------------------------------------------------------------------------
## totalscore
## n missing distinct Info Mean Gmd .05 .10
## 1738 0 330 1 931.9 85.46 820.0 839.0
## .25 .50 .75 .90 .95
## 878.0 924.0 980.8 1034.0 1073.0
##
## lowest : 747 756 763 764 768, highest: 1181 1191 1203 1206 1253
## --------------------------------------------------------------------------------
## small
## n missing distinct Info Mean Gmd
## 1738 0 1 0 1 0
##
## Value 1
## Frequency 1738
## Proportion 1
## --------------------------------------------------------------------------------
Para este ejemplo, en el modelo de los efectos de tratamiento no es más que la calificación promedio para los niños en clases regulares y la calificación promedio para los niños en clases reducidas. Dado que la asignación de niños en los grupos ha sido aleatoria, tenemos entonces que:
y que: Es decir, el rendimiento en las clases pequeñas es más alto que en las clases numerosas. La diferencia promedio es de 13.74 puntos.
Entonces, en el caso en que las unidades del grupo de tratamiento y del grupo de control han sido seleccionadas aleatoriamente, lo único que nos interesa es estimar el efecto de tratamiento promedio. Como veremos, sin embargo, las cosas se ponen mucho más interesantes cuando existen otras variables que podrían ayudar a explicar mejor la relación causal entre y . Estas variables, conocidas como , serán analizadas en la siguiente sección.
El modelo de regresión lineal
Para ver el papel que juega el modelo de regresión lineal en el cálculo de los efectos de de tratamiento, consideremos el modelo:
donde nos indica el rendimiento escolar del niño i-ésimo, y es una variable dummy —de tratamiento— tal que:
Este modelo puede estimarse por el método de los mínimos cuadrados ordinarios (MCO). El resultado puede expresarse como:
donde y son los coeficientes estimados y el valor esperado estimado de la variable . Si existe una diferencia entre el promedio de niños en grupos pequeños y niños en grupos regulares, el valor del coeficiente tendría que ser (estadísticamente) diferente de cero. De hecho, en caso de que el tratamiento tenga éxito, esperamos que el coeficiente sea positivo. La estimación puede hacerse fácilmente utilizando la función lm():
treat.m1 <- lm(totalscore~small, data=db)
summary(treat.m1)
##
## Call:
## lm(formula = totalscore ~ small, data = db)
##
## Residuals:
## Min 1Q Median 3Q Max
## -283.20 -50.94 -7.20 42.80 334.80
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 918.201 1.155 795.00 < 2e-16 ***
## small 13.741 2.107 6.52 7.61e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 73.48 on 5784 degrees of freedom
## Multiple R-squared: 0.007297, Adjusted R-squared: 0.007125
## F-statistic: 42.51 on 1 and 5784 DF, p-value: 7.609e-11
Primero, observamos que tanto la constante como el coeficiente de la variable de tratamiento son (estadísticamente) diferentes de cero. Segundo, el valor de los coeficientes estimados resulta muy familiar: el valor estimado de la constante no es más que de la sección anterior, es decir al promedio de calificaciones para los niños en el grupo de control; el coeficiente de no es más que el valor promedio del efecto de tratamiento, . Esto demuestra que el cálculo de los efectos de tratamiento pueden realizarse como en la sección anterior o bien por medio de una regresión lineal.
Sin embargo, el modelo de regresión cobra un papel protagónico en el cálculo del si suponemos que los resultados potenciales están determinados por otras variables, , además de la variable de tratamiento. Esto resulta en el efecto de tratamiento condicional a , el cual se calcula como:
y el efecto de tratamiento sobre los tratados se calcula como:
Este, al igual que en el caso no condicionado, es igual al cuando la selección de las unidades en cada grupo es completamente aleatorio.
Para ejemplificar, supongamos que el modelo es ahora:
En este caso, el resultado potencial, , depende no solo de la variable de tratamiento sino de la variable , la cual nos indica el número de años de experiencia docente del profesor del grupo. Esperamos que, entre mas experiencia tenga el profesor, mejor será el puntaje de los niños. Esto implica que el signo del coeficiente de esta variable de control debería ser positivo.
treat.m2 <- lm(totalscore~small+tchexper, data=db)
summary(treat.m2)
##
## Call:
## lm(formula = totalscore ~ small + tchexper, data = db)
##
## Residuals:
## Min 1Q Median 3Q Max
## -273.84 -51.38 -7.43 42.55 341.22
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 904.442 1.952 463.306 < 2e-16 ***
## small 14.307 2.099 6.817 1.02e-11 ***
## tchexper 1.467 0.167 8.784 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 73.08 on 5763 degrees of freedom
## (20 observations deleted due to missingness)
## Multiple R-squared: 0.02032, Adjusted R-squared: 0.01998
## F-statistic: 59.77 on 2 and 5763 DF, p-value: < 2.2e-16
Como vemos, el signo del coeficiente estimado de la variable es, efectivamente, positivo y estadísticamente significativo. Su valor indica que cada año adicional de experiencia del profesor de la clase eleva el puntaje promedio de sus alumnos en 1.467 puntos. Los resultados también muestran que el puntaje promedio para el grupo de control es de 904.442 puntos, y que el efecto de tratamiento es de 14.307 puntos. Esto implica que el puntaje promedio del grupo de tratamiento es de (904.442+14.307) 918.7484 puntos.
Por supuesto, la especificación que aquí hemos usado para modelar los efectos de tratamiento es demasiado simple. Existen otras variables que podrían utilizarse para explicar los resultados potenciales. Estas pueden entrar de forma independiente o interactuando entre ellas. Adicionalmente, no hemos considerado algunos otros problemas asociados al análisis de los efectos de tratamiento. ¿Qué pasaría, por ejemplo, si los alumnos en el experimento de Tennessee se hubieran asignado en los diferentes tipos de clase en función de su desempeño? Esta situación nos conduciría a modificar nuestro modelo, de tal forma que tomemos en cuenta un problema que, en econometría, se conoce como de endogeneidad. Esto será analizado en otro post.
Última actualización: 29-07-2020.