ESTIMACIÓN DEL SALARIO Y SUS FACTORES DETERMINANTES EN EL DEPARTAMENTO DE LIMA En el presente trabajo tratamos de estimar por medio del método de Mínimos Cuadrados Ordinarios (MCO), una modelo que permita conocer en qué medida él género impacta sobre el salario/ingreso de los trabajadores, es decir, para estimar los retornos de características como la educación, su calidad y el impacto de la experiencia, sexo y edad de los trabajadores sobre los salarios. Dicha forma de estimación ha sido utilizada por varios autores que la han adoptado como base en las características del mercado laboral y para nuestro caso tomaremos la base de datos de la región de Lima; exactamente la provincia de Lima Metropolitana. Ing_lab = β1 + β2sexo + β3htrab + β4edad + β5edu + Ui
DONDE: Ing_lab: Sexo: htrab: Edad: Edu: Ui:
Ingresos laborales (Salarios) de los trabajadores de Lima Metropolitana en un año. Género del trabajador. Esta variable toma valor 1 si el individuo es hombre y 0 si es mujer. Horas de trabajo semanales de los trabajadores de Lima Metropolitana. Edad de los trabajadores de Lima Metropolitana. Años de educación de los trabajadores. Variable aleatoria con media cero y varianza constante que refleja características no observables y que afectan a los salarios.
βj (j = 1,2,3 ,4,5) : es el vector de parámetros par ámetros a estimar.
ESTIMACIÓN ECONOMÉTRICA es es la ciudad capital capital de la República la República del Perú. Se Perú. Se encuentra situada en la costa central Lima
del país, a orillas del océano océano Pacífico, Pacífico, conformando una extensa y populosa área urbana conocida como Lima como Lima Metropolitana, Metropolitana, flanqueada por el desierto desierto costero y costero y extendida sobre los valles de los ríos Chillón, ríos Chillón, Rímac Rímac y y Lurín. Lurín. Según Según el INEI, en el 2007 Lima contaba con más de 8,4 millones de habitantes, de los cuales, el índice de relación entre hombres y mujeres indica que por cada 100 mujeres, hay 98.8 hombres; hombres ; el 30% de la población po blación peruana, cifras que la convierten en la la ciudad más poblada del país. país. Para el presente trabajo se tomo una muestra de 99 habitantes.
Características que determinan el salario:
Educación formal Experiencia laboral Género Edad
Otros factores como: Oferta de trabajo. Coste de vida. Uso de internet. Tipo de empleo: rama de actividad. Base de contrato: part-time o full-time.
ANÁLISIS ECONOMÉTRICO - DATOS Y ESTIMACIÓN Se tiene a la región de Lima como objeto de estudio con el preámbulo realizado anteriormente y la data proporcionada por la encuesta ENAHO 2010; se analiza los datos que se pretende demostrar con el método econométrico del MCO, y las comparaciones respectivas. DATOS: Ing_lab: Ingresos laborales (Salarios) de los trabajadores de Lima Metropolitana en un año. Edu: Años de educación de los trabajadores. trabajado res. Hortrab: Horas de trabajo semanales de los trabajadores trab ajadores de Lima Metropolitana. Edad: Edad de los trabajadores de Lima Metropolitana. Sexo: Género del trabajador. Esta variable toma valor 1 si el individuo es hombre y 0 si es mujer. Una primera especificación de la ecuación de salarios que pretendemos estimar es la siguiente: Ing_lab= β 1 + β 2sexo 2sexo + β 3htrab 3htrab + β 4edad 4edad + β 5edu 5edu + Ui En otras palabras se puede determinar los salarios s alarios basados en regresiones del tipo: ING_LAB = F (sexo, horas de trabajo, edad, años año s de educación)
Veamos nuestra data con las variables, para poder estimar el modelo teniendo como base a Lima (n=99): ingreso laboral
horas trabajo semanal
edad
años educación
sexo
1579
49
45
6
0
307
28
18
8
1
0
36
16
6
0
0
24
14
5
0
6770
72
81
16
1
0
54
37
14
0
705
44
19
11
0
524
71
65
11
1
2472
44
50
16
1
640
6
51
16
0
980
12
61
16
1
30
14
56
11
0
1797
58
64
16
0
855
52
35
9
1
1161
76
28
14
1
307
70
24
14
0
6231
40
49
16
1
1600
40
47
11
0
2986
44
52
11
0
0
40
27
14
1
1076
44
32
11
1
1500
48
47
14
1
866
28
66
11
1
1191
44
57
14
0
1411
62
35
11
1
863
48
27
11
0
0
44
32
11
0
571
59
49
16
1
921
90
37
9
1
423
60
56
6
0
1074
72
29
11
1
1074
66
26
14
0
655
49
18
11
1
971
25
23
13
1
584
36
26
13
0
506
53
46
11
1
4357
40
32
15
0
378
49
59
14
0
1806
63
26
11
1
705
42
38
11
1
503
70
19
8
1
1122
47
62
6
1
608
15
53
7
0
350
55
33
11
1
1531
48
51
16
1
603
40
26
16
0
804
40
23
16
0
1216
34
45
16
0
993
50
78
6
0
901
32
45
15
1
250
11
53
16
0
710
41
19
12
1
1243
35
24
14
0
178
48
26
11
1
809
54
46
11
0
1203
70
36
11
1
317
10
57
6
0
903
84
38
13
1
80
24
33
11
0
40
6
53
16
0
602
48
36
11
1
438
48
37
13
0
281
14
60
14
0
2276
49
34
14
1
630
18
26
10
0
1080
48
31
11
1
941
42
33
11
1
1125
48
28
11
1
647
54
31
11
0
687
6
34
14
0
333
24
54
11
1
80
42
35
6
1
617
50
26
10
1
456
20
18
11
0
923
52
43
11
1
1178
60
30
7
1
1260
48
65
7
1
646
42
44
6
0
400
30
21
13
0
1521
48
23
16
1
3003
70
38
11
1
1057
45
40
14
1
735
54
57
7
0
2091
72
49
11
1
651
30
53
9
0
345
16
15
8
0
1988
44
43
12
1
557
8
46
14
1
1049
45
35
11
0
809
70
57
14
1
1525
70
46
11
1
2422
84
36
11
1
159
30
25
11
0
269
36
23
8
0
2012
48
59
12
1
672
35
52
9
0
747
45
21
11
0
1951
52
50
16
1
2529
30
25
11
1
3326
46
39
14
0
ESTIMACIÓN DEL MODELO: Comenzando con el procedimiento de estimación se utilizan los datos muéstrales de corte transversal. Es decir, se toma como muestra 99 observaciones. Considerando el siguiente modelo: Ing_lab = β1 + β2sexo + β3htrab + β4edad + β5edu + Ui
A continuación se regresión ara la variable “Ingreso laboral” contra una constante β0 (el intercepto, el cual explica todos los efectos determinantes que nuestras variables explicativas no logran captar), el sexo, horas de trabajo, edad y años de educación en el programa Eviews. Sobre la base de la información de los datos, se obtuvieron los siguientes cálculos:
EL ABORAD O: L os Autores (E-views )
MODELO ESTIMADO: = - 2414.696 113.5084*AÑOSEDUCACION INGRESO
+
472,8066*SEXO
+
16.9055*HORAS
+
28.10133*EDAD
+
Calculando las respectivas esperanzas para los Salarios de los hombres y mujeres: E (Y/ sexo=1, horas, edad, educación) = -1758,722 + 25.821*HORAS + 26.604*EDAD + 99.010*EDUCACION E (Y/ sexo=0, horas, edad, educación) = -2340.648 + 25.8215*HORAS + 26.604*EDAD + 99.010*EDUCACION
EL INTERCEPTO NEGATIVO (PARA HOMBRES) NO TIENE MUCHO SIGNIFICADO PORQUE EN LA MUESTRA NINGUNA DE LAS OTRAS VARIABLES (EDUCACION, HORAS DE TRABAJO, EDAD) TIENEN VALOR CERO. EL COEFICIENTE DE LA VARIABLE SEXO MIDE LA DIFERENCIA PROMEDIO ENTRE EL SALARIO PROMEDIO MENSUAL DE UNA MUJER Y DE UN HOMBRE, DADO LOS MISMOS NIVELES DE EDUCACION, HORAS DE TRABAJO Y EDAD.
Interpretación del Modelo Estimado Coeficiente de determinación: En nuestro modelo, el 33.69% de la variación total de los salarios están siendo explicado por la influencia lineal de la variables horas, edad, años de educación y sexo. Por lo que la variación residual es de 66,31 %. Es decir que “el comportamiento estimado de los ingresos de la provincia de Lima, se asemeja en 33.69% al comportamiento real” Análisis de Significancia Individual (Prueba “t” Student)
“Apreciando los resultados de la prueba de significancia estadística individual, podemos concluir que las variables horas, edad, educación y sexo, son estadísticamente
, puesto que sus respectivas probabilidad son menores al 5% por lo cual se significativos rechaza la hipótesis nula (H0: β=O)
Interpretación de los Parámetros L as variables y sus coeficientes C= Sexo = H oras de tr abajo = Edad = Añ os de estu di o =
-2414.696 472.8066 16.90555 28.10133 113.5084
SEGÚN EL MODELO PODEMOS CONCLUIR QUE:
Los salarios de los hombres son aproximadamente 472.8066 soles más con respecto a los salarios de las mujeres.
Una hora adicional de trabajo, incrementara el salario de ese trabajador 16.90555 soles.
Un trabajador ganara 28.10133 soles más en su salario, por cada año de vida cumplido.
Por cada año que un trabajador lo dedique a su educación e instrucción, su salario se verá incrementado en 113.5084 soles.
CAMBIO O QUIEBRE ESTRUCTURAL A continuación analizaremos la existencia o no del cambio estructural en nuestro modelo de exportación de cobre en la economía peruana. El modelo representa una relación de series de tiempo del modelo de Exportación de cobre entre los años 1999-2011 y se puede encontrar algunos indicadores de existencia de cambio estructural. Entre estos años podemos observar que existen cambios y crecimiento en nuestra economía que conlleva a que el comportamiento no sea constante. Y esto hace que necesitemos modelos que representen mejor a la realidad en los distintos escenarios que se presentan, en escenario en el que las exportaciones son muy diferentes a las otras.
ESPECIFICACION DEL MODELO EMPIRICO : F orma fun cional:
Inicialmente planteamos el siguiente modelo: X = f (P , Dmu) X = β0 + β1 * P + β2 * Dmu +
Var iabl e endógena: X = Exportaciones netas de cobre en millones de dólares americanos US$ por año. Var iables expli cativas:
=Precio del cobre en Ctvs de US$/lb. P Dmu =Demanda mundial del cobre en millones de toneladas por año. = la variable estocástica.
: Ex portaciones netas de cobre del Perú Esta será nuestra variable dependiente (Endogena), de acuerdo a la especificación de nuestro modelo econométrico. La variable se encuentra expresado en millones de dólares US$ Americanos. Precio (P):
Primera de nuestras variables independientes. La escogimos puesto que es evidente que la función de exportaciones es una derivación de la función de demanda, la cual depende
de los precios. Además su volatilidad afecta su demanda internacional. Esta expresada en Ctvs US$/Lb. Demanda mun dial del cobre refi nado (Dmu):
La incluimos en el modelo como variable independiente porque tiene una gran influencia la demanda externa de cobre. Tanto así que se estima que para el 2020 la demanda del cobre será mayor que a su oferta. Esta variable esta expresada en miles de tonelada por año de cobre refinado. Recolección de Datos:
En el presente análisis se ha considerado datos de series de tiempo, es decir, un conjunto de observaciones sobre los valores que toma una variable en diferentes momentos del tiempo. El periodo muestral abarca desde los años 1999 hasta el año 2011, es decir se analizan un total de 13 años, esto es debido a una escasez de datos principalmente en la variable demanda mundial del cobre. La información obtenida del Banco Central de Reserva del Perú se encuentra anualmente. Por el lado de las exportaciones, se utilizaron cifras anuales que se encontraban en millones de dólares. En el caso de la demanda mundial del cobre, los datos fueron obtenidos principalmente de Source: -World Metal Statistics March 2010 and Yearbook 2009, y para ellos se escogió la demanda de cobre refinado en miles de toneladas. OBS
X
P
DMU
1999
776.3000
71.3200
14465.000
2000
932.6000
82.2400
14816.000
2001
985.6000
71.6000
15675.000
2002
1187.100
70.7400
15350.000
2003
1260.500
80.7000
15221.000
2004
2480.600
129.990
15850.000
2005
3471.800
166.870
16610.000
2006
5995.500
304.910
17343.000
2007
7219.100
322.930
17980.000
2008
7277.000
315.510
18484.000
2009
5933.700
233.520
18400.000
2010
8870.400
342.280
19100.000
2011
10711.40
400.200
19510.000
ESTIMACIÓN DEL MODELO: Comenzando con el procedimiento de estimación se utilizan los datos muestrales en series de tiempo. Es decir, se toma como muestra 13 años comprendidos durante el periodo 19992011. Considerando el siguiente modelo: Exportaciones = β0 + β1 * Precios + β2 * Demanda mundial del cobre refinado + µt A continuación se regresionó la variable “Exportaciones de cobre en el Perú” contra una constante β0 (el intercepto, el cual explica todos los efectos determinísticos que nuestras
variables explicativas no logran captar), los precios del cobre y la demanda mundial del cobre refinado en el programa Eviews. Sobre la base de la información de los datos, se obtuvieron los siguientes cálculos:
De la regresión obtenemos los valores del intercepto y coeficientes de la pendiente:
X = – 11622.02 + 17.56991 * P + 0.743279* DMU + µt
.
I nterpr etación y análisis del modelo estimado
1. Coeficiente de determinación : El 98.58% de la variación total de las exportaciones netas de cobre en el Perú, esta siendo explicado por la influencia lineal de los precios del cobre y por la demanda del
cobre refinado a nivel mundial. Por lo que la variación residual es 1.42% que no esta siendo explicada.
Pruebas Residuos recur sivos:
En este grafico vamos analizar el quiebre estructural a través de las bandas de confianza para el modelo exportaciones del cobre con variables definidas del precio y demanda mundial.
En el gráfico observamos que el estadístico recursivo tiende a salir de las bandas de confianza, y se percibe un posible quiebre en el año 2007 en donde sus bandas de confianza se comienzan a ensanchar en este mismo punto por lo tanto concluimos que si existe un quiebre estructural en ese año.
Prueba Cusum:
Presenta la suma acumulada de los residuos normalizados y bandas de confianza de 95%. Ya que la grafica se mantiene dentro de las bandas de confianza, entonces los coeficientes serian estables en el tiempo, sin embargo un cambio en la dinamica del grafico en el 2006 es señal de un posible quiebre estructural en este periodo.
Prueba Cusum-cuadrado: Analizaremos la presencia de escenarios con diferentes características. Para ello realizamos la prueba de Cusum-Cuadrado. Con el gráfico de la prueba de Cusumcuadrado se observa que el modelo sufre un cambio estructural. Analizaremos el modelo de exportaciones del cobre en el Perú entre los años 1999-2011. X = F (precio, demanda mundial).
Podemos observar en la grafica sobrepasan las bandas de confianza por lo que nos dice que los coeficientes no son estables en el tiempo Podemos observar mediante el gráfico como el estadístico va a mostrar un crecimiento en el tiempo a partir del año 2005 y a su vez observamos cómo este estadístico sobrepasa las bandas de confianza a partir de este mismo año.
PRUEBA DE LOS COEFICIENTES RECURSIVOS : Estima los coeficientes del modelo de manera recursiva, si el modelo es estable las estimaciones de los coeficientes deben tender a ser convergentes y la varianza del estimador tiende a reducirse, conforme crece la muestra. 1. Residu o de la pr edicción de Y t obteni da con los coeficientes esti mados hasta el periodo t-1 Si t es normal, entonces Xt es normal N(0, ²) residuo normalizad o X t
et '
'
; t k 1, ...,T
1 xt ( X t 1 X t 1 ) xt
10,000 5,000 0
Gráfico n° 1
-5,000 -10,000 -15,000 -20,000 02
03
04
05
06
07
08
09
10
11
Recurs ive C(1) Estim ates ± 2 S.E.
60 40 20
Gráfico n°2
0 -20 -40 -60 02
03
04
05
06
07
08
09
10
11
Recurs ive C(2) Estim ates ± 2 S.E.
1.2
0.8
Grafico n°3 0.4
0.0
-0.4 02
03
04
05
06
07
08
09
10
11
Recurs ive C(3) Estim ates ± 2 S.E.
PRUEBA CHOW Un supuesto señala que la varianza de Ui debe permanecer constante en cada uno de los escenarios o muestras, igualmente los términos de error para cada regresión deben estar independientemente distribuidos, no correlacionados.
Ahora para la detección del problema de Heteroscedasticidad en el modelo de exportación de cobre en el Perú, se procede a la aplicación de las siguientes pruebas:
Prueba de Glejser : Glejser sugiere hacer la regresión sobre los valores absolutos de µt estimados sobre la variable Xi que se cree que esta muy asociada a las perturbaciones al cuadrado, para nuestro modelo dicha variable es el precio del cobre y la demanda mundial del cobre refinado. Dado que existe una forma funcional aproximada a una recta sobre dicha variable. Aplicando la regresión:
EL ABORAD O: L os Autores (E-views)
P (e) = 0.1190 Tcal = 1.704975 Gl = 10 Tcrit = 2.228 Ho: Homocedasticidad
H1: Heterocedasticidad Tcal< tcrit Se acepta la Ho por lo tanto no existe heterocedasticidad.
Prueba General de Heteroscedasticidad de White:
EL ABORAD O: L os Autores (E-views)
PLANTEAMINETO DE HIPÓTESIS
H o
: hom oscedasticidad
H a
: heterosced asticidad
u t
2
2
2
1 2 x 2t 3 x3t 4 x 2t 5 x3t 6 x 2t x 3t v t
2
µ = 30899545+59730.53*P – 4346.841*DMU+46.06155*P 2+0.154487*DMU 24.56898*p*DMU. R2auxiliar = 0.727949 En nuestro modelo hay 5 regresoras gl = 5 n* R2auxiliar ≈ X 2;gl. X 2 = 13 * 0.727949 X 2 = 9.463337
DECISIÓN
El valor ji-cuadrado calculado no es menor al valor ji-cuadrado crítico por lo que a un nivel de confianza del 95%, se llega a la conclusión de que no hay presencia de Heteroscedasticidad en la regresión mediante la prueba general de White.
Test de Chow
Fcrit.=F(k-1;n-k;α=5%) = F(2;10;5%)=4.1 Fcri= 4.10
Chow Breakpoint Test: 2007 F-statistic Log likelihood ratio
11.73601 23.35711
Probability Probability
0.004036 0.000034
Fcal > Fcritç Por lo tanto se rechaza H0, se concluye que no es homocedastica. Por lo que concluimos que sus varianzas no son constantes.
TÉCNICA DE VARIABLES DICÓTOMAS
Por este método nos permite conocer en donde es que se producen los cambios: en el intercepto y/o coeficiente de regresión. Tiene la ventaja de utilizar una sola regresión. Para ello debemos conocer y asumir previamente el punto del quiebre. Suponiendo que el punto de quiebre se encontraría en el 2006:
X = β1 + β4D2 + β2P + β3DMU + β5(D2.P) + β6(D2.DMU) + Ui Donde: X = Exportaciones netas de cobre en millones de dólares americanos US$ por año.
=Precio del cobre en Ctvs de US$/lb. P Dmu =Demanda mundial del cobre en millones de toneladas por año. = la variable estocástica D2:
variable dicótoma, toma valor 0 para el periodo 1999-2005; y el valor 1 para el periodo 2006-2011
Añadiendo al modelo inicial variables dicótomas que representen el punto de quiebre y procediendo con la regresión del nuevo modelo, obtenemos:
X = -5436.671 – 16357.23*D2 + 21.454*P + 0.321*DMU – 1.085*(D2.P) + 0.921*(D2.DMU) + Ui
Procedemos a hacer un análisis de cambio cualitativo y cuantitativo: Suponiendo que E(Ui)=0 E(X/D2=0, P, DMU)= - 5436.671 + 21.454*P + 0.321*DMU E(X/D2=1, P, DMU)= (-5436.671 – 16357.23) + (21.454 – 1.085)*P + (0.321 + 0.921)*DMU
= - 21793.901 + 20.369*P + 1.242*DMU
Existe cambio cualitativo (los interceptos cambian antes y después del 2006)
Existe cambio cuantitativo (los coeficientes de regresión cambian antes y después del 2006)