martes, 6 de octubre de 2015

Valores Perdidos. Missing.

Prácticamente siempre nuestros datos serán incompletos. Es decir: tendremos observaciones para las cuales no dispondremos de toda la información de todas las variables. En esos casos hablamos de ‘casos perdidos’ o ‘valores perdidos’. Con Stata podemos trabajar con ellos de diversos modos.

Stata representa los valores perdidos con un punto (.) De este modo, el programa sabe que aquella celda es un valor perdido y que no debe considerarlo en sus cálculos. De todos modos, si queremos distinguir entre diferentes tipos de casos perdidos (no aplicable/ no sabe/ no contesta, etc) podemos usar una letra después del punto .a, .b, etc. Así, podemos definir hasta 27 tipos de valores perdidos.

Por defecto, cuando le pedimos a Stata una tabla de frecuencias de una variable, omite los valores perdidos. Esto, que en general resulta útil, a veces puede no interesarnos, puesto que pueden contener información interesante. Asi, cuando pidamos una tabla de frecuencias con el comando tabulate, si añadimos al final del comando la opción , missing el programa considerará y nos mostrará también los casos perdidos.

En cuanto a la sintaxis para observar los valores perdidos, es posible gracias a misstable (tabla de los valores perdidos).
  • misstable summarize [varlist]
  • misstable sum, all  Es posible observar los valores perdidos de todas las variables.
En una sintaxis para no tomar en cuenta los valores perdidos o missing values, se debe luego del comando y la expresion, agregar:
  • ... if !missing(variable)
  • ... if variable !=.
  • ... if variable <= . 
Esta última expresión tiene en cuenta que hay valores faltantes distintos de . , que son .a, .b, etc.

Visualización de misstable sum












Aquí observamos con misstable sum que la única variable con 5 valores perdidos es rep78






















2 comentarios:

  1. excelente, me gustaria saber como exportar los resultados a excel??

    ResponderEliminar
  2. Hola cómo puedo sumar varias variables ignorando los missing?

    ResponderEliminar