sábado, 19 de diciembre de 2015

Odds/Odds ratio (Regresión Logística)

¿Qué es una Odds? 

Esta medida es diferente de una proporción y corresponde a una razón entre la probabilidad de experimentar un evento en relación con la probabilidad de no experimentarlo. Es, en suma, un cociente de dos probabilidades. 

Odds y estudios transversales 
Cuando se tiene en un estudio de prevalencia es posible el cálculo de una Odds, la que corresponde a:






Por ejemplo, si la prevalencia de hipertensión arterial en varones es de 12,5% la chance u Odds de prevalencia de hipertensión será:


Odds en estudios retrospectivos de casos y controles: la lógica del Odds Ratio

En un estudio de casos y controles se puede, en propiedad calcular un odds. De hecho, se puede calcular más de un Odds.

Suponga un estudio de casos y controles en el cual se estudia la relación entre un factor de riesgo y una enfermedad, en el cual se obtiene la siguiente información: 


Enfermos
Controles
Expuestos
120
75
No expuestos
80
125

200
200

Considerando al primer grupo, los sujetos enfermos, ¿Cuál es la Odds de antecedente de exposición al factor de riesgo?






Considerando al primer grupo, los sujetos controles (sanos), ¿Cuál es la Odds de antecedente de exposición al factor de riesgo?


Note que la Odds o chance de haber estado expuesto en los casos es superior a la de los controles.

En este caso particular de diseño de investigación, un cálculo que intuitivamente se desprende es el de relacionar la Odds de exposición entre casos y controles en relación con la exposición estudiada. 

Este es el concepto de "Odds Ratio" (OR) o Razón de chances:


El Odds ratio permite:

1. Reconocer la naturaleza como factor de riesgo o de protección de una exposición.
2. Identificar la magnitud o fuerza de la asociación, lo que permite hacer comparaciones.
3. Su valor es independiente de la incidencia de la condición en estudio.
4. De gran utilidad en estudios de casos y controles

Fuente: http://escuela.med.puc.cl/recursos/recepidem/IndEpi3.htm
http://escuela.med.puc.cl/recursos/recepidem/indepi5.htm

Video donde se interpretan los odds en la regresion logistica (en inglés).

Uno de los comandos para la lectura de las odds, seria: 

tabodds

Se utiliza en estudio de caso control para calcular odds ratios cuando la variable exposición tiene más de dos niveles.
Utiliza test de homogeneidad para determinar que los OR calculados son iguales entre los diferentes niveles de exposición.
Utiliza el test de tendencia asumiendo que la variable exposición tiene un orden , teniendo como hipótesis nula que no hay un incremento del OR cuando el nivel de exposición se eleva.

Videos ayuda sobre comando logistic

Se presentan tres videos ayuda, del comando logistic del canal de You Tube de STATA.

El primero utiliza el comando logistic (modelo de regresion logistica) para predecir variables binarias.


El segundo utiliza el comando logistic, para predecir con variables continuas.


Y el tercero, y ultimo video, presenta el comando logistic, pero esta vez con variables con factores (ej. raza- negra, blanca u otra).

 

Regresión Logística. Estimación del modelo

La estimación del modelo de regresión logística se realiza por el método de máxima verosimilitud. Este método estima los valores de los parámetros b de la regresión que con mayor probabilidad pueden haber generado los valores de la variable dependiente de la muestra, si las asunciones del modelo son ciertas (las asunciones son las habituales de los modelos de regresión: que no falten variables importantes en el modelo, que no haya multicolinealidad entre las variables independientes, etc).


Se calcula una función de verosimilitud que indica cuál es la probabilidad de que para unos determinados parámetros b se hayan observado los valores muestrales. En un proceso iterativo, se van probando distintos valores de los parámetros b hasta que se encuentran los coeficientes que maximizan tal función de verosimilitud (o sea, los coeficientes que más verosímilmente corresponden a los valores muestrales): tales coeficientes serán los estimados para nuestro modelo. 

Este proceso iterativo se muestra en la salida de la instrucción logit, cuyo formato general es el siguiente:

logit variableindependiente   variabledependiente1 variabledependiente2 variabledependiente3 …


















Resultados del logit

Los resultados que proporciona STATA para el logit son similares a los de la regresión. Arriba a la derecha aparece el número de observaciones y una prueba estadística de significación del modelo basada en el χ 2 . Con un nivel de confianza del 95%, el modelo es significativo si la probabilidad que aparece es inferior a 0.05. En este caso, puede decirse que la relación entre los coeficientes del modelo y la probabilidad de haber participado alguna vez en una manifestación es significativa estadísticamente. Por último, aparece en esta columna de estadísticos el pseudo R2 . Como su propio nombre indica, es un estadístico análogo al R2 , que indica la bondad de ajuste del modelo a los datos. Aunque no tiene la inmediatez de interpretación del R2 de la regresión lineal, que directamente indica qué proporción de la varianza de la variable dependiente es explicado por el modelo, es una aproximación basada en una comparación de la verosimilitud del modelo sólo con la constante.

Pruebas de significacion del logit

Mediante la orden logit se muestran dos pruebas de significación diferentes: por un lado, el test de chi2 , que indica la significación del modelo completo (o sea, hasta qué punto la relación existente entre la variable dependiente y el conjunto de variables independientes es significativa); por otro lado, aparece el test de z para cada coeficiente, indicando hasta qué punto cada coeficiente tiene un efecto significativo en la ecuación. Adicionalmente se pueden realizar otras pruebas de hipótesis sobre los coeficientes de la ecuación: puede interesar por ejemplo saber si un coeficiente es igual a un determinado valor, o si dos coeficientes tienen el mismo efecto sobre la variable dependiente, o si el efecto de dos coeficientes diferentes es simultáneamente igual a 0.

Ejemplo Modelo Logit Stata


https://www.youtube.com/watch?v=xQ0uySZblxA