martes, 27 de octubre de 2015

Estadística descriptiva en Stata


Summarize

El comando summarize variable1 variable2 (etc.) nos aporta información del número de observaciones válidas, la media, la desviación estándar y el mínimo y máximo de las variables que nosotros especifiquemos. Se trata de la información más relevante y, a menudo, tendremos suficiente con ella. Sin embargo, si queremos un resumen más completo podemos usar la opción detail, summarize variable1 variable2, detail. Es la sintaxis para el resumen estadistico.


Stata nos aporta más información sobre el contenido y propiedades de las variables. Con este comando, obtenemos los estadísticos descriptivos como la media, la desviación estándar, mínimo y máximo, Percentiles, Varianza, Asimetría (Skewness) y Kurtosis.


Tablas de estadísticos descriptivos

El comando summarize, a efectos generales, resulta de gran utilidad para hacer resúmenes de la muestra entera. Si lo combinamos con la opción if, podemos pedir estadísticos descriptivos para las submuestras que nos interesen, y combinado con by nos permite obtener los estadísticos descriptivos separados por grupos. Pero esta opción produce un output difícil de leer e incómodo de exportar. Por eso Stata dispone de diversas opciones para realizar tablas de estadísticos descriptivos:

Tabulate, summarize
Nos muestra una tabla de frecuencias de los grupos con la media y la desviación estándar de la variable especificada. Es útil cuando queremos estos dos estadísticos de una variable entre grupos, pero no tiene mucha más flexibilidad. tabulate variablegrupo, summarize(variable1)



Tabstat
Este comando es más potente, puesto que nos permite incluir más de una variable y un amplio abanico de estadísticos descriptivos. El formato de resultados es especialmente útil, sobre todo cuando trabajamos con una sola variable. tabstat variable1 variable2, stats(mean med sd min max) 


No hay comentarios:

Publicar un comentario