Mostrando entradas con la etiqueta variable. Mostrar todas las entradas
Mostrando entradas con la etiqueta variable. Mostrar todas las entradas

martes, 27 de octubre de 2015

Eliminar y generar nuevas variables

Generate

Para crear una nueva variable, usaremos el comando generate. En Stata al crear una nueva variable debemos especificar el nombre y el contenido de la misma. Para definir el contenido usaremos expresiones lógicas y funciones aritméticas, lo que da mucho poder al comando generate. Por ejemplo:
  • generate nuevavariable=.  (Genera una nueva variable con todos los valores ‘missing’)
  • generate nuevavariable=variableexistente (Genera una copia de una variable)
  • generate nuevavariable=1 if variableexistente<=2 (Genera una variable que toma valor 1 si la antigua es menor o igual que 2, y missing para el resto)
  • generate nuevavariable= variableexistente^2 (Genera una variable igual al cuadrado de la antigua)
Dialogo Box (Cuadro de Menu) de Generate


Drop /keep

Para eliminar una variable, o un conjunto de variables, sólo tenemos que usar el comando drop nombrevariable Por el contrario, si lo que queremos es conservar una serie de variables, usaremos el comando keep, que es el inverso de drop (elimina todas las variables no especificadas).

Drop if / drop in (keep if/ keep in)

Si lo que queremos es eliminar algunas observaciones en lugar de variables, usaremos las expresiones lógicas para especificar qué casos queremos borrar (o conservar). Así, usaremos drop if cuando queramos especificar una condición, y drop in cuando queramos delimitar un rango de observaciones.






















Recodificar variables

Replace

Si para crear una nueva variable usábamos el comando generate, para cambiar su contenido, normalmente usaremos el comando replace. El comando replace, combinado con las expresiones lógicas y funciones aritméticas, es de gran utilidad y nos permite hacer muchas cosas que en otros programas resultan más complicadas de hacer. La sintaxis general es replace variable = valor o expresión (if /in)





















Recode

recode es una alternativa, más limitada pero útil para recodificar variables categóricas. Con recode cambiamos los valores de la variable uno a uno, debiendo especificar siempre los valores de partida y los de destino. La sintáxis básica es como sigue: recode variable (#=#) (# # = #) (# / # =#) En esta sintaxis, podemos especificar dos valores de partida separándolos con un espacio, o un rango de valores, usando el símbolo / o  # normalmente será un valor numérico, pero también puede ser:
  • missing - Todos los casos perdidos
  • nonmissing - Todos los casos válidos
  • else - El resto de valores no especificados
  • min - El valor mínimo
  • max - El valor máximo (ojo con los missing que se consideran infinito)




Estadística descriptiva en Stata


Summarize

El comando summarize variable1 variable2 (etc.) nos aporta información del número de observaciones válidas, la media, la desviación estándar y el mínimo y máximo de las variables que nosotros especifiquemos. Se trata de la información más relevante y, a menudo, tendremos suficiente con ella. Sin embargo, si queremos un resumen más completo podemos usar la opción detail, summarize variable1 variable2, detail. Es la sintaxis para el resumen estadistico.


Stata nos aporta más información sobre el contenido y propiedades de las variables. Con este comando, obtenemos los estadísticos descriptivos como la media, la desviación estándar, mínimo y máximo, Percentiles, Varianza, Asimetría (Skewness) y Kurtosis.


Tablas de estadísticos descriptivos

El comando summarize, a efectos generales, resulta de gran utilidad para hacer resúmenes de la muestra entera. Si lo combinamos con la opción if, podemos pedir estadísticos descriptivos para las submuestras que nos interesen, y combinado con by nos permite obtener los estadísticos descriptivos separados por grupos. Pero esta opción produce un output difícil de leer e incómodo de exportar. Por eso Stata dispone de diversas opciones para realizar tablas de estadísticos descriptivos:

Tabulate, summarize
Nos muestra una tabla de frecuencias de los grupos con la media y la desviación estándar de la variable especificada. Es útil cuando queremos estos dos estadísticos de una variable entre grupos, pero no tiene mucha más flexibilidad. tabulate variablegrupo, summarize(variable1)



Tabstat
Este comando es más potente, puesto que nos permite incluir más de una variable y un amplio abanico de estadísticos descriptivos. El formato de resultados es especialmente útil, sobre todo cuando trabajamos con una sola variable. tabstat variable1 variable2, stats(mean med sd min max) 


jueves, 15 de octubre de 2015

Nombres, Etiquetas y Notas

Las variables en Stata tienen nombres y etiquetas que nos ayudarán a identificarlas. Un buen
uso de los nombres y etiquetas nos puede ahorrar mucho tiempo y hacer nuestro tabajo en
Stata más fácil, eficiente y fiable.

Rename

Si queremos cambiar el nombre de cualquier variable, sólo tenemos que usar la orden rename nombreviejo nombrenuevo

Etiquetas de variable

Las etiquetas de variable resultan útiles especialmente cuando tenemos muchas
variables similares o cuyos nombres no resulten informativos. Para asignar etiquetas o
cambiarlas, sólo tenemos que escribir label variable nombrevariable
“etiqueta” (las comillas son importantes).

Etiquetas de valores

No sólo las variables tienen etiquetas, sino que las categorías en las variables
categóricas también las pueden tener. Esto resulta especialmente útil porque nos
permite identificar las categorias sin tener que recurrir constantemente a los
cuestionarios o libros de códigos. Para asignar etiquetas de valor a una variable
debemos proceder en dos pasos:

  • Primero creamos la etiqueta mediante el siguiente comando: label define nombreetiqueta 1”etiqueta1” 2”etiqueta” (etc.)
  • Después vinculamos la etiqueta a la variable o variables: label values variable nombreetiqueta

Desde el menu es posible, gracias al cuadro que encontramos en la pantalla principal, abajo a la derecha, Propiedades. Aqui es posible cambiar las etiquetas de las variables, y las etiquetas de los valores.


Destacar que para modificar los elementos mencionados, se deberá clickear el "candado" (para desbloquear esta ventana)


O desde el Variable Manager, donde se encuentra este tipo de pantalla, pero para cada variable (detallando sus caracterisiticas y opciones). 

  

Name, nombre de la variable
Label, etiqueta de la variable
Type, tipo de la variable (string, float...etc)
Format (formato), este alude a la presentación, la forma de visualización.

Notas

Y en Notes, aparecen las diferentes notas que puede tener la o las variables. Las notas en Stata son meta datos, son comentarios de la base o de las variables (en este caso de las variables).

Las sintaxis de las mismas son:
  • note: agregar notas a la base
  • note [variable]: agrega notas en la variable de la base




Existe un menu donde es posible, asi como agregar notas y etiquetar variables, etiquetar valores de una variable. En la siguiente captura de pantalla lo podemos visualizar.

En la misma es posible crear las etiquetas de los valores, editarlas o borrarlas. En el caso a continuacion, se etiqueto a 1 como Extranjero y 0 como Domestico (a este etiquetado se le llamo Origen, origin).