La estimación del modelo de regresión logística se realiza
por el método de máxima verosimilitud. Este método estima los valores de los
parámetros b de la regresión que con mayor probabilidad pueden haber generado
los valores de la variable dependiente de la muestra, si las asunciones del
modelo son ciertas (las asunciones son las habituales de los modelos de
regresión: que no falten variables importantes en el modelo, que no haya
multicolinealidad entre las variables independientes, etc).
Se calcula una función de verosimilitud que indica cuál es
la probabilidad de que para unos determinados parámetros b se hayan observado
los valores muestrales. En un proceso iterativo, se van probando distintos
valores de los parámetros b hasta que se encuentran los coeficientes que
maximizan tal función de verosimilitud (o sea, los coeficientes que más
verosímilmente corresponden a los valores muestrales): tales coeficientes serán
los estimados para nuestro modelo.
Este proceso iterativo se muestra en la salida de la
instrucción logit, cuyo formato general es el siguiente:
logit variableindependiente
variabledependiente1 variabledependiente2 variabledependiente3 …
Resultados del logit
Los resultados que proporciona STATA para el logit son
similares a los de la regresión. Arriba a la derecha aparece el número de
observaciones y una prueba estadística de significación del modelo basada en el
χ 2 . Con un nivel de confianza del 95%, el modelo es significativo si la
probabilidad que aparece es inferior a 0.05. En este caso, puede decirse que la
relación entre los coeficientes del modelo y la probabilidad de haber
participado alguna vez en una manifestación es significativa estadísticamente.
Por último, aparece en esta columna de estadísticos el pseudo R2 . Como su
propio nombre indica, es un estadístico análogo al R2 , que indica la bondad de
ajuste del modelo a los datos. Aunque no tiene la inmediatez de interpretación
del R2 de la regresión lineal, que directamente indica qué proporción de la
varianza de la variable dependiente es explicado por el modelo, es una
aproximación basada en una comparación de la verosimilitud del modelo sólo con
la constante.
Pruebas de significacion del logit
Mediante la orden logit se muestran dos pruebas de
significación diferentes: por un lado, el test de chi2 , que indica la
significación del modelo completo (o sea, hasta qué punto la relación existente
entre la variable dependiente y el conjunto de variables independientes es
significativa); por otro lado, aparece el test de z para cada coeficiente,
indicando hasta qué punto cada coeficiente tiene un efecto significativo en la
ecuación. Adicionalmente se pueden realizar otras pruebas de hipótesis sobre
los coeficientes de la ecuación: puede interesar por ejemplo saber si un
coeficiente es igual a un determinado valor, o si dos coeficientes tienen el
mismo efecto sobre la variable dependiente, o si el efecto de dos coeficientes
diferentes es simultáneamente igual a 0.
Ejemplo Modelo Logit Stata
https://www.youtube.com/watch?v=xQ0uySZblxA
No hay comentarios:
Publicar un comentario