Para temas de asignación uso un igual. Para uso de expresiones condicionales uso doble igual. Si pongo el comando sort variable1 variable2 me ordena los ítems variable2 dentro de cada variable1 y, a la vez, a las variable1. Para unir bases de datos, primero me aseguro de que en am bas se encuentren las variables características comunes y luego uso el comando merge 1:1 variablecomún1 variablecomún2 using “F:\nombre de archivo” Puedo usar h antes de un comando para que me ayude con su sintaxis. El comando tab variable para variables cualitativas. Permite ver una tabla de frecuencia. Si hago tab variable, nol le quita las etiquetas a cada categoría de la variable. El comando sum variable para variables cuantitativas. Permite ver un resumen. Hist variable me muestra su distribución. El comando findit programa sirve para descargar programas creados por usuarios. Por ejemplo, el outreg2 permite exportar mis resultados a otros programas. Con el comando adodir puedo ver los paquetes instalados en mi PC. Con adouninstall paquete desinstalo alguno de ellos.
clear al iniciar para variables y etiquetas pero no borra resultados almacenados en la memoria. clear all si cumple con lo anterior. ssc install bcuse permite instalar las bases de datos de Wooldridge. En general, el comando ssc install permite instalar cualquier programa/paquete alojado en el archivo de Componentes Estadísticos de Software del Boston College. bcuse openness permite abrir la base de datos llama openness una vez que se instaló bcuse. También puedo emplear el comando use http://fmwww.bc.edu/ecp/data/wooldridge/openness, clear all para obviar los pasos anteriores. Si la base de datos pertenece al conjunto incorporado en Stata puedo usar sysuse, si está en la web puedo usar webuse census, por ejemplo, en su lugar. /* aquí se escribe texto */ Sombrear línea y Ctrl + D para ejecutarla. Opcionalmente puedo usar Ctrl + R para ejecutar todas las líneas. Con el comando des puedo ver la descripción de la base de datos. Con el comando br puedo ver las variables de la base de datos. Puedo usar el comando drop variable1 variable2 para eliminar variables o drop in fila inicial/fila final para eliminar las filas entre lo especificado. Otras variantes incluyen drop var* para eliminar todas las variables que comiencen con var y drop if variable variable > condición. Si quiero solo quedarme con algunas obsevaciones puedo usar el comando keep y sus variantes análogas a drop. keep if _n < número hace que me quede con las número primeras observaciones
Variable en rojo: texto Variable en negro: número Variable en azul: categórico Para cambiar una variable de texto a número destring variable, replace y graba la variable nueva encima. Para cambiar una variable de número a texto tostring variable, replace y graba la variable nueva encima. Alternativamente puede usarse , replace(otravariable) para reemplazar otra variable. También podría usar el comando ,gen (nuevavariable) para no grabar la variable nueva encima. Para tabla de frecuencias de una variable tab variable Para cambiar el nombre de una variable uso ren variable nuevavar Con el comando gen lnvar = ln(variable) puedo crear variables en función de otas. Para hacer operaciones uso di número*e(r2), donde e(r2) es el R2 de la regresión previamente corrida. Otros datos almacenados en la memoria son SCE: e(mss) SCR: e(rss) Para utilizar el coeficiente de algún regresor puedo usar di _b[variable] Para hacer una regresión pongo reg inf open Para obtener el vector de residuos uso el comando predict nombreresiduos, resid Para obtener el y estimado uso el comando predict nombreyestimado , xb Puedo ver los anteriores con br nombreresiduos nombreyestimado Para graficar las variables en una regresión bivariada twoway (scatter inf open) Prueba de hipótesis: Para realizar una prueba de hipótesis uso test (coeficiente1+coeficiente2 = 1) (coeficiente3 = 0), si es una sola hipótesis se pueden obviar los paréntesis. Para hacer la prueba de significancia aislada o conjunta pongo test coeficiente1 coeficiente2. El estadístico F que sale es el t2. Puedo obtener el t de tabla con di invt(df ,0.95) Puedo obtener el chi2 de tabla con di invchi2( df ,0.95) Puedo obtener el F de tabla con di invF(df1,df2,0.95) Multicolinealidad: Comando vif Variables dummy: Primero debo revisar si la variable no está aún como dummy yendo al apartado Propiedades – Etiqueta de Valor - … - Valor de etiquetas.
Por ejemplo, en esta misma base mroz puedo generar una dummy que me diga si la persona está desempleada en función a la tasa de desempleo de la ciudad donde vive. Entonces si la categoría base es no haber sido desempleado (0) mientras que (1) es haber sido desempleado, puedo aplicar:
gen isunem = 1 replace isunem = 0 if unem < 8 . Si se hace con texto sería… if == Texto “
”
Es importante escribirlos en lineas separadas. A lternativamente:
gen isunem = 1 if unem >= 8 replace isunem = 0 if unem < 8 Con ello se pueden ver los efectos sobre el salario si se estuvo desempleado haciendo la regresión. El intercepto en este caso indicaría cuánto salario percibe alguien que no ha estado desempleado. Si creo que los salarios no se afectan mediante una única brecha ante haber estado desempleado sino que también hay influencia incremental por medio de la pendiente, entonces puedo generar la dummy multiplicativa Tengo mi modelo 1: wage educ exper Anoto la SCR Modelo 2: wage educ exper isunem Anoto la SCR Modelo 3: gen isunem_exper = isunem*exper wage educ exper isunem_exper Anoto la SCR Para ver si efectivamente existe la influencia incremental puedo contrastar la hipótesis con mi Fest = (SCR2-SCR3)/SCR3 con Ftabla(1). Heterocedasticidad: Ho: no hay heterocedasticidad.
Test de White: Se corre la regresión y se usa el comando whitetst Manualmente: Se corre la regresión. Se obtienen los residuos al cuadrado. Se regresionan los residuos al cuadrado con las variables, las variables al cuadrado y la multiplicación entre variables. Se obtiene nxR2 aux, se obtiene el chi2 tabla donde q es el número de coeficientes sin contar el intercepto. Test de Breusch-Pagan: Se corre la regresión y se usa el comando estat hettest variable1 variable 2. Manualmente:
Se corre la regresión. Se obtienen los residuos al cuadrado y SRC/n. Se regresiona e2/(SCR/n) con las variables. Se obtiene SCE/2, se obtiene el chi2 tabla donde q es el número de coeficientes sin contar el intercepto. Datos de series de tiempo: Trabajemos, por ejemplo, con use http://www.stata-press.com/data/r13/klein Autocorrelación: Debo partir indicándole a Stata cuál es mi variable de tiempo. Uso el comando tsset variabletiempo. Puedo hacer un análisis gráfico puedo usar el comando scatter nombreresiduos variabletiempo. Si veo alguna tendencia en el tiempo hay autocorrelación. Para introducir un rezago en las variables puedo usar L.variable L2.variable, etcétera. Ho: no hay autocorrelación.
Test de Durbin-Watson: Se corre la regresión y se usa el comando estat dwatson. Alternativamente puede usarse la versión que no asume normalidad para el estadístico DW estat durbina. Manualmente: Se corre la regresión. Se obtienen los residuos. Se regresiona el residuo con su rezago. Se obtiene DW = 2(1-fi), donde el fi proviene de la regresión anterior y se compara con los valores críticos de tabla. Test de Breusch-Godfrey. : Se corre la regresión y se usa el comando estat bgodfrey, lag(número de periodos de rezago ) nomiss0 que reemplaza los valores faltantes con 0s. Manualmente: Se corre la regresión. Se obtienen los residuos. Se regresiona el residuo con un número q a escoger de sus rezagos y las variables. Se obtiene (n-q)x R2 aux, se obtiene el chi2 tabla. NOTA IMPORTANTE: el n es de la regresión original no olvidar.