-
Preparación y limpieza de datos en R (1)
-
Análisis Exploratorio de Datos (1)
- Visualización
- Summary Stats
- Geolocalización
-
Diseño de experimentos (1)
- Pruebas de Poder
- Balance | T-test
-
Modelos Lineales (1)
- OLS (Ordinary Least Squares)
- LPM (Linear Probability Model)
- Robust SE
- Cluster SE
-
Resampling (Opcional)
- Jackknife
- Bootstrap
-
Estadística no paramétrica (1)
- Regresión local
- Kernel density estimation
-
Modelos no Lineales (2)
- NLLS (Non-linear least squares)
- Probit
- Logit
- Quantile regression
- Random Forest | Boosted regression (Opcional)
-
Inferencia Causal (3)
- RCT (Randomized Control Trials)
- Panel Data
- FE & RE (Fixed and Random Effects)
- DiD (Difference-in-difference)
- SCM (Synthetic Control Methods)
- NN match (Nearest-neighbor match)
- IV (Instrumental Variables)
- GMM (Generalized Method of Moments)
- CF (Control Function)
- RD (Opcional) (Regression Discontinuity)
-
Attrition (1)
- Bounds
-
Clasificación (2)
-
Métodos no supervisados
- Latent models
- EM (Expectation-Maximization)
- Clustering
- Factor Analysis
-
Métodos supervisados (Opcional)
- KNN (k-Nearest Neighbor)
- Logistic regression
- SVM (Supporting Vector Machine)
-
El objetivo de este curso es aprender métodos de inferencia causal y de estadística para resolver problemas y preguntas relacionadas con el proyecto. El enfoque será tanto teórico como práctico, y usaremos los datos del proyecto para los ejemplos. Se pretende desarrollar intuición sobre los distintos métodos, identificar bajo qué situaciones es útil usarlos y saber cómo interpretar los resultados. Dado que los coautores de Joyce están más familiarizados con STATA, ésta será la herramienta que estaremos usando, aunque también indicaré los paquetes o funciones de R.
Se deberá cumplir con una asistencia de al menos el 90%. La hora y media de la clase se puede reportar para sus horas semanales.
Como 'evaluación' se hará un mini-proyecto que realizarán de forma individual. El proyecto consistirá en explorar una(s) pregunta(s) sobre las bases que se encuentran trabajando. Dicha pregunta(s) la tienen que proponer lo antes posible, sobre sus datos o los datos que veamos en las clasecitas.
Tendrán que presentar los resultados de sus trabajos a Joyce y a mí. (El tiempo que les tome la presentación se puede contar para sus horas y estará sujeto al incentivo de 'trabajo en equipo'.) Esta presentación debe incluir lo siguiente: 1. Presentación/exploración de los datos (SS, figuras, etc) 2. Resultados - Usando una o varias de las técnicas/métodos que veremos. 3. Interpretación
Se espera que el proyecto les tome alrededor de 15-20 hrs, las cuales podrán reportar en sus horas. Si el trabajo refleja más de 15 horas se les podrá otorgar un bonus a criterio de Joyce.