sábado, 19 de diciembre de 2015

Regresión Logística. Estimación del modelo

La estimación del modelo de regresión logística se realiza por el método de máxima verosimilitud. Este método estima los valores de los parámetros b de la regresión que con mayor probabilidad pueden haber generado los valores de la variable dependiente de la muestra, si las asunciones del modelo son ciertas (las asunciones son las habituales de los modelos de regresión: que no falten variables importantes en el modelo, que no haya multicolinealidad entre las variables independientes, etc).


Se calcula una función de verosimilitud que indica cuál es la probabilidad de que para unos determinados parámetros b se hayan observado los valores muestrales. En un proceso iterativo, se van probando distintos valores de los parámetros b hasta que se encuentran los coeficientes que maximizan tal función de verosimilitud (o sea, los coeficientes que más verosímilmente corresponden a los valores muestrales): tales coeficientes serán los estimados para nuestro modelo. 

Este proceso iterativo se muestra en la salida de la instrucción logit, cuyo formato general es el siguiente:

logit variableindependiente   variabledependiente1 variabledependiente2 variabledependiente3 …


















Resultados del logit

Los resultados que proporciona STATA para el logit son similares a los de la regresión. Arriba a la derecha aparece el número de observaciones y una prueba estadística de significación del modelo basada en el χ 2 . Con un nivel de confianza del 95%, el modelo es significativo si la probabilidad que aparece es inferior a 0.05. En este caso, puede decirse que la relación entre los coeficientes del modelo y la probabilidad de haber participado alguna vez en una manifestación es significativa estadísticamente. Por último, aparece en esta columna de estadísticos el pseudo R2 . Como su propio nombre indica, es un estadístico análogo al R2 , que indica la bondad de ajuste del modelo a los datos. Aunque no tiene la inmediatez de interpretación del R2 de la regresión lineal, que directamente indica qué proporción de la varianza de la variable dependiente es explicado por el modelo, es una aproximación basada en una comparación de la verosimilitud del modelo sólo con la constante.

Pruebas de significacion del logit

Mediante la orden logit se muestran dos pruebas de significación diferentes: por un lado, el test de chi2 , que indica la significación del modelo completo (o sea, hasta qué punto la relación existente entre la variable dependiente y el conjunto de variables independientes es significativa); por otro lado, aparece el test de z para cada coeficiente, indicando hasta qué punto cada coeficiente tiene un efecto significativo en la ecuación. Adicionalmente se pueden realizar otras pruebas de hipótesis sobre los coeficientes de la ecuación: puede interesar por ejemplo saber si un coeficiente es igual a un determinado valor, o si dos coeficientes tienen el mismo efecto sobre la variable dependiente, o si el efecto de dos coeficientes diferentes es simultáneamente igual a 0.

Ejemplo Modelo Logit Stata


https://www.youtube.com/watch?v=xQ0uySZblxA



No hay comentarios:

Publicar un comentario