CAPÍTULO
1 Estadística descriptiva
1)
¿Cuál es la diferencia entre parámetro y un estadístico? La diferencia es que el Parámetro describe alguna característica c aracterística de una población y Estadística lo hace de una muestra.
2)
¿Por qué una muestra tiene que ser representativa de la población de la cual ha sido tomada? Una muestra debe ser representativa, es decir, debe asemejarse lo más posible a la población de la cual se toma, para: a) poder ser empleada empleada para hacer inferencias acerca de las características de la población; población; b) reducir el error muestral.
3)
¿El error muestral puede siempre disminuirse aumentando el tamaño de la muestra? Se puede disminuir el error muestral incrementando el tamaño de la muestra si y solo si no se ha cometido un error sistemático. Si se ha cometido un error sistémico, sin importar el tamaño t amaño de la muestra, el error muestral no podrá ser disminuido.
4)
¿El muestreo probabilístico es usado comúnmente para reali zar estudios e studios exploratorios? exploratorios? Comente. No. El muestreo no-probabilístico es el que comúnmente se utiliza para realizar estudios exploratorios, exploratorios, donde donde el objetivo objetivo principal es familiarizarse familia rizarse con la población población a estudiar. Es importante recordar que en estos e stos estudios exploratorios, exploratorios, el objetivo no es generalizar los resultados para lo cual se usa el método probabilístico. probabilístico.
1
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
5)
El muestreo aleatorio a leatorio simple, simple, el muestreo sistemático y el muestreo basado en el juicio del analista, ana lista, son todos muestreos probabilísticos. El muestreo aleatorio a leatorio simple simple y el muestreo sistemático son métodos probabilísticos. probabilísticos. El muestreo basado en el juicio del analista ana lista no es un método probabilístico. probabilístico. Los resultados de este último método dependen en gran medida del criterio y conocimiento de la persona bajo cuyo juicio juicio se realizó rea lizó el muestreo. muestreo.
6)
Explique cuál es e s el principal problema problema del muestreo sistemático. El principal problema de este método es el conocido como periodicidad o estacionariedad. Este problema se da cuando el factor de selección (k) coincide con estos periodos, lo que puede llevar al analista a obtener conclusiones erróneas. Por ejemplo, se desea hacer inferencias acerca de las ventas anuales de helados. Se supone que se cuenta con datos trimestrales. Si se decide emplear emplear el método sistemático y se determina como factor de selección, se puede acabar seleccionando solo aquellas ventas producidas en alguna estación del año, con lo cual los resultados obtenidos no podrán ser utilizados para hacer inferencias i nferencias acerca de las ventas anuales.
7)
Explique las características de una tabla de frecuencias adecuadamente estructurada (mutuamente excluyente y exhaustivas). Las clases deben ser excluyentes excluyentes y exhaustivas, ex haustivas, es decir que cada elemento elemento del conjunto conjunto debe pertenecer a una sola clase y, a su vez, todo elemento debe pertenecer a alguna clase. O sea que todo elemento elemento debe quedar dentro de una clase pero no puede estar en dos clases a la vez.
8)
2
Si se tienen los siguientes datos que corresponden corresponden al número de horas por día, pasadas pasad as frente al a l televisor televi sor,, por un grupo gr upo de 20 niños: 2.0, 2.5, 3.0, 1.2, 1.2, 2.9 2 .9,, 3.2, 2.5, 2.5, 1.7, 1.7, 2.3, 1.5, 4.1, 2.9, 3.1, 3.2, 4.4, 3.2, 4.1, 3.5, 2.8, 3.6. Con estos datos construya la tabla de distribución distribución de frecuencias que incluya las frecuencias, frecuencias acumuladas, las frecuencias relativas y las frecuencias relativas acumuladas. Para la construcción de las clases empiece en 1 y que el rango de las clases sea también 1, 1, es decir, la primera clase será [1,2).
Estadística descriptiva
CAPÍTULO 1
Frecuencia Dat o s
Bin
Clase
Frecuencia
1,2 1,5 1,7 2,0 2,3 2,5 2,5 2,8 2,9 2,9 3,0 3,1 3,2 3,2 3,2 3,5 3,6 4,1 4,1 4,4
1 2 3 4 5
1 2 3 4 5 y mayor...
0 3 7 7 3 0 20
Frecuencia
Frecuencia
acumulada
relativa
acumulada
relativa
0,15 0,35 0,35 0,15
3 10 17 20
% acumulado
0,15 0,50 0,85 1,00
1
0,00% 15,00% 50,00% 85,00% 100,00% 100,00% 100,00%
Histograma
a i c n e u c e r F
8 7 6 5 4 3 2 1 0
120,00% 100,00% 80,00% 60,00% 40,00% 20,00% 0,00%
Frecuencia % acumulado
Clase
9)
Basados en la pregunta 8, grafique el histograma, el polígono de frecuencias, y el gráfico de las frecuencias relativas acumuladas.
10)
Basados en la pregunta 8 responda las siguientes preguntas: a. b.
¿Cuál es el porcentaje de niños que ven televisión menos de 3 horas? 50% (Ver cuadro de Distribución de Frecuencias Pregunta 8.) ¿Cuántos niños ven televisión entre 2 y 3 horas? 7 (Ver cuadro de Distribución de Frecuencias Pregunta 8.)
3
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
c. d.
11)
¿Cuántos niños ven televisión entre 2 y 4 horas? 14 (Ver cuadro de Distribución de Frecuencias Pregunta 8.) ¿Cuál es el porcentaje de niños que ven televisión tres horas o más? 50% (Ver cuadro de Distribución de Frecuencias Pregunta 8.)
Desarrolle el ejercicio 8 usando Excel. Frecuencia Datos
Bin
Clase
Frecuencia
1,2 1,5 1,7 2,0 2,3 2,5 2,5 2,8 2,9 2,9 3,0 3,1 3,2 3,2 3,2 3,5 3,6 4,1 4,1 4,4
1 2 3 4 5
1 2 3 4 5 y mayor...
0 3 7 7 3 0 20
Frecuencia
Frecuencia
acumulada
relativa
acumulada
relativa
0,15 0,35 0,35 0,15
3 10 17 20
% acumulado
0,15 0,50 0,85 1,00
1
0,00% 15,00% 50,00% 85,00% 100,00% 100,00% 100,00%
Histograma
a i c n e u c e r F
8 7 6 5 4 3 2 1 0
120,00% 100,00% 80,00% 60,00% 40,00% 20,00% 0,00%
Frecuencia % acumulado
Clase
12)
Basados en los datos del ejercicio 8 calcule las siguientes medidas de tendencia central: a.
La media Media
b.
2,950
Moda()
3,200
Basados en los datos del ejercicio 8 calcule las siguientes medidas de dispersión: a.
El rango Rango
4
Mediana()
La moda Moda
13)
2,885
La mediana Mediana
c.
Promedio()
Max()-Min()
3,200
CAPÍTULO 1
b.
Estadística descriptiva
Los cuartiles 1er Cuartil, Q posición = ( N + 1) / 4 → (20 + 1) / 4 = 5, 25 Luego:
Q1 = [ 2,3 + 0,25 × (2,5 − 2,3)] ⇒ Q1 = 2,35
2do Cuartil, Q posición = 2 × ( N + 1) / 4 → 2 × (20 + 1) / 4 = 10, 5 En consecuencia:
Q2 = [ 2,9 + 0,5 × (3,0 − 2,9)] ⇒ Q2 = 2,95
(Nótese que este valor corresponde a la mediana)
3er Cuartil, Q posición = 3 × ( N + 1) / 4 → 3 × (20 + 1) / 4 = 15, 75 De esta forma:
Q3 = [3,2 + 0,75 × (3,5 − 3,2) ] ⇒ Q3 = 3,425
c.
d.
e.
f.
g.
14)
El rango inter-cuartil El rango inter-cuartil es:
1,075 Q3 − Q1 =
La desviación del cuartil La desviación del cuartil es:
(Q3 − Q1 ) / 2 = 0, 5375
La desviación media absoluta La desviación media absoluta es:
Desvprom() = 0,658
La varianza muestral La varianza muestral es:
Var () = 0,7413
La desviación estándar muestral La desviación estándar muestral es:
Desvest () = 0,8610
Basados en los datos del ejercicio 8 calcule la variable estandarizada (z) y demuestre que su media es 0 y su varianza 1.
5
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Teniendo la base de datos se calcula el valor estandarizado para cada dato: Datos Horas frente televisor
Media Desviación estándar 15)
− =
1,2
-1,96
1,5
-1,61
1,7
-1,38
2,0
-1,03
2,3
-0,68
2,5
-0,45
2,5
-0,45
2,8
-0,10
2,9
0,02
2,9
0,02
3,0
0,13
3,1
0,25
3,2
0,37
3,2
0,37
3,2
0,37
3,5
0,71
3,6
0,83
4,1
1,41
4,1
1,41
4,4
1,76
2,885
0,000
m
0,861
1,000
S
Basados en los datos del ejercicio 8 calcule el coeficiente de variación. CV = S / Media ⇒ (0,861 / 2, 885) = 0, 2984
16)
Se tiene dos muestras. La media y desviación estándar de la primera es igual a 0,25 y 0,1, respectivamente. La media y desviación estándar de la segunda es igual a 210 y 5, respectivamente. Comparando la desviación estándar de ambas se puede concluir que la primera muestra es menos dispersa que la segunda. ¿Es esta conclusión válida? ¿Por qué? ¿Cuál sería la manera correcta de determinar cuál de las muestras presenta más dispersión?
Descripción
6
Media
Desviación estándar
Coeficiente de variación
Muestra 1
0,25
0,10
0,400
Muestra 2
210,00
5,00
0,024
CAPÍTULO 1
Estadística descriptiva
Basados únicamente en la desviación estándar no se puede concluir qué variable es más dispersa. La manera correcta de determinar cuál muestra presenta más dispersión es en base al coeficiente de variación que da la relación de la desviación estándar respecto de la media. La muestra que presenta más dispersión es la muestra 1. 17)
¿A qué se refiere el problema de la media referido a los valores extremos (outliers)? Presente un ejemplo simple en el que se demuestre este problema. Pesos en Kg. Varones de 30-35 años
Mediana Media
Pesos en Kg. Varones de 30-35 años
73,0
73,0
75,9
75,9
77,8
77,8
78,0
78,0
79,0
79,0
79,3
79,3
80,0
80,0
80,5
80,5
81,5
81,5
82,0
250,00
79,15
79,15
78,70
95,50
El problema de la media referido a los valores extremos, se pone de manifiesto cuando un dato es considerablemente mayor o menor que el resto de observaciones. En el ejemplo se tiene un valor extremo positivo, lo que hace que la media se mueva hacia la derecha. 18)
¿La mediana se ve afectada por los valores extremos? La mediana no se ve afectada por los valores extremos, debido a que su valor corresponde a la ubicación central de una muestra de datos ordenada. Eso se puede observar en el ejemplo anterior.
19)
(Ejercicio en Excel) En la Tabla 10 se muestran los datos del producto interno bruto, de los gastos en consumo personales y de la inversión bruta en construcción residencial en los Estados Unidos durante los años 2000 al 2009.Los datos se obtuvieron del Bureau of Economic Analysis. Utilice estos datos para realizar lo siguiente:
7
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
a)
Hacer el diagrama de series de tiempo del PBI y de los gastos en consumo personales:
Año
Producto bruto interno
Gastos en consumo personales
Inversión bruta en construcción residencial
2000
9.951,50
6.830,40
449,00
2001
10.286,20
7.148,80
472,40
2002
10.642,30
7.439,20
509,50
2003
11.142,10
7.804,00
577,60
2004
11.867,80
8.285,10
680,60
2005
12.638,40
8.819,00
775,00
2006
13.398,90
9.322,70
761,90
2007
14.077,60
9.826,40
629,00
2008
14.441,40
10.129,90
477,20
2009
14.256,30
10.089,10
361,00
Diagrama de series de tiempo del PBI y de los gastos en consumo personales. Series de tiempo del PBI y Gastos en consumos personales 16000 14000 12000 $ S U e d s e n o l l i B
10000 8000 6000 4000 2000 0
Años Producto bruto interno
b)
8
Gastos en consumo personales
Hacer el diagrama de dispersión entre el PBI y los gastos en consumo personales. Asumir que la variable endógena es gastos en consumo personales. Añadir la línea de tendencia y mostrar la ecuación de la misma, así como el coeficiente de determinación (R 2).
CAPÍTULO 1
Estadística descriptiva
Diagrama de dispersión entre PBI y Gastos en consumos personales 11.000,00
y=0,721 x - 284,2 R2=0,998
s 10.000,00 o m $ u s S 9.000,00 s e U n l s o a e c n n 8.000,00 o n o l e s r l i s e B o p n 7.000,00 t s e a 6.000,00 G
9.000,00
11.000,00
Gastos en consumo personales
13.000,00
15.000,00
Lineal (Gastos en consumo personales)
PBI en Billones US$
Hacer el diagrama de dispersión entre el PBI y la inversión bruta en construcción residencial. Asumir que la variable endógena es la inversión bruta en construcción residencial. Añadir la línea de tendencia, y mostrar la ecuación de la misma así como el coeficiente de determinación (R 2). Se observa que con una ecuación lineal el coeficiente de determinación es bajo, la variable endógena es explicada con un valor muy bajo por la ecuación lineal. c)
Calcular el coeficiente de correlación entre el PBI y los gastos en consumo personales. Explique su resultado en términos del signo y la magnitud del coeficiente de correlación. Se observa que el coeficiente de correlación (r = 0,992), es positivo y refleja que el PBI se relaciona directamente con los gastos en consumo personal de manera bast ante fuerte (el valor del coeficiente de correlación es bastante cercano a 1).
d)
Calcular el coeficiente de correlación entre el PBI y la inversión bruta en construcción residencial. Explique su resultado en términos del signo y la magnitud del coeficiente de correlación. Se observa que el coeficiente de correlación (r = 0,1396), es positivo pero no tan fuerte como en el caso anterior (el valor del coeficiente es cercano a 0).
e)
Explique la relación entre la ecuación de la línea calculada en la pregunta b) y el coeficiente de correlación estimado en la pregunta d). La ecuación calculada en “b” es
Y = 0,7216 X − 284,27 con R 2 = 0,9984.
El coeficiente de correlación estimado en “d” es R = 0,9992
9
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
La variable Y (gasto en consumo personales) es explicada por la variable X (PBI) en relación directa. Esto está de acuerdo con el coeficiente de correlación que también indica una relación directa y positiva. 20)
(Ejercicio en Excel) Basados en los datos presentados en el ejercicio anterior construya una tabla que contenga la media, la mediana, el rango, el valor máximo, el valor mínimo, la varianza y la desviación estándar de cada una de las variables incluidas en el archivo, es decir, del producto interno bruto, de los gastos en consumo personales y de la inversión bruta en construcción residencial. Año
Producto Bruto Interno
Gastos en consumo personales
Inversión bruta en construcción residencial
2000
9.951,50
6.830,40
449,00
2001
10.286,20
7.148,80
472,40
2002
10.642,30
7.439,20
509,50
2003
11.142,10
7.804,00
577,60
2004
11.867,80
8.285,10
680,60
2005
12.638,40
8.819,00
775,00
2006
13.398,90
9.322,70
761,90
2007
14.077,60
9.826,40
629,00
2008
14.441,40
10.129,90
477,20
2009
14.256,30
10.089,10
361,00
Media
Promedio()
12.270,25
8.569,46
569,32
Mediana
Mediana()
12.253,10
8.552,05
543,55
Max() - Min()
4.489,90
3.299,50
414,00
Valor máximo
Max()
14.441,40
10.129,90
775,00
Valor mínimo
Min()
9.951,50
6.830,40
361,00
Varianza
Var()
2.970.239,09
1.548.966,60
19.415,22
1.723,44
1.244,57
139,34
Rango
Desviación estándar 21)
Desvest()
¿Qué información nos proporciona el coeficiente de correlación? El coeficiente de correlación proporciona como varía la variable endógena (Y) cuando varía la variable exógena (X). Recuerde que el coeficiente de correlación solo muestra la dependencia lineal entre dos variables.
22)
¿Cuál es la diferencia entre el coeficiente de correlación y el coeficiente de determinación? El coeficiente de determinación explica en porcentaje la variación de la variable endógena explicada por la variación de las variables exógenas.
10
CAPÍTULO
2 Probabilidades
1.
¿Qué es una variable aleatoria? Una variable aleatoria es aquella variable cuyos posibles valores son conocidos antes de realizar un experimento pero cuyo valor final solo puede ser conocido una vez realizado el experimento.
2.
¿Cuál es la diferencia entre una variable aleatoria discreta y una continua? Variable aleatoria discreta: Es una variable aleatoria que puede tomar solo ciertos valores en un determinado intervalo, con separaciones entre esos valores. Variable aleatoria continua: Una variable aleatoria continua es aquella que puede tomar cualquier valor en un determinado intervalo.
3.
Se lanzan dos dados a la vez y se observan los resultados del lanzamiento. En base a esto definir: a) b)
El experimento: Lanzar los dados. La variable aleatoria relacionada con el experimento: Todos los resultados posibles de lanzar los 2 dados a la vez son: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}.
11
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
c) d) e)
4.
El espacio muestral del experimento: estará dado por los 36 posibles resultados presentados en la pregunta b). Un evento cualquiera: Sacar un resultado de “2” al lanzar ambos dados. La probabilidad de obtener 7: La probabilidad de obtener 7 es 6/36 = 0,1667. El número 7 puede ser obtenido de las siguientes maneras: { (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) }.
Se sabe que en un salón de clases hay 25 personas, de las cuales 15 son mujeres y 10 hombres. Si se elige aleatoriamente a una persona, empleando la forma clásica de calcular las probabilidades, ¿cuál es la probabilidad que la persona elegida sea un hombre? La probabilidad calculada fue la siguiente: Cantidad de hombres: Cantidad total de personas: P(A) = 10/25 = 0,4
5.
¿Cuál es el complemento de la probabilidad de la pregunta anterior?
6.
10 25
P(A’) = 1 – P(A) = 1 – 0,4 = 0,6
Explique la ley que permite que se suponga que las frecuencias relativas sea n consideradas como probabilidades. La ley de los grandes números dice que si se realiza un número grande de pruebas, la frecuencia relativa con la que ocurre un evento se acercará a la probabilidad de que ocurra para una sola prueba. Por ejemplo, si se lanza una moneda una vez, el resultado será cara o cruz. Con un solo lanzamiento, la frecuencia relativa para sacar cara será 0 o 1. Sin embargo, si se lanza la moneda muchas veces, la frecuencia relativa se aproximará a 0,5, que en teoría es “lo que debe ser”.
7.
Si se tiene una moneda adecuadamente balanceada y se la tira una vez, ¿cuál será la probabilidad de obtener cara? Respuesta: P(A) = ½ = 0,5
8.
Se quiere crear un carnet de miembros de un determinado club. Se desea que este carnet tenga una identificación de 5 posiciones compuestas de letras y números. Se quiere que la primera posición tenga una vocal y que las siguientes 4 posiciones tengan números. ¿Cuántas identificaciones distintas se pueden crear? (Suponga que los números disponibles van del 0 a 9). En A solo hay 5 posibilidades (a, e, i, o, u), y en las siguientes posiciones hay 10 posibilidades (0, 1, 2, 3, 4, 5, 6, 7, 8, 9), entonces:
12
CAPÍTULO 2
A 5
B 10
C 10
D 10
Probabilidades
E 10
Identificaciones posibles = 5 × 10 × 10 × 10 × 10 = 50.000 Respuesta: Se pueden crear 50.000 identificaciones distintas. 9.
Se quiere realizar una promoción para un producto determinado. Se puede hacer un descuento del 10%, 15% o del 20%. Se puede anunciar en una revista especializada mediante un aviso pequeño, mediano o grande y se puede o no poner paneles de propaganda en la tienda. ¿Cuántas opciones se tienen para la realización de la promoción? Respuesta: Las opciones que se tienen para la realización de la promoción serán 3 (descuentos) × 3 (tamaños) × 2 (paneles) = 18.
10.
Se tiene un guardarropa en el que solo se pueden colocar tres pantalones a la vez. Si se tienen 5 pantalones, ¿de cuántas formas diferentes se los podrá colocar? De acuerdo a lo descrito son 5 pantalones y se pueden colocar 3 a la vez. A 5
B 4
C 3
Por lo tanto, las formas en que las que se pueden colocar los tres pantalones serán iguales a 5 × 4 × 3 = 60. 11.
Se tiene un estante de un supermercado donde se pueden colocar 10 productos. Si se cuenta con 15 productos, ¿de cuántas maneras distintas se los podrá colocar? De acuerdo a ello se deben realizar permutaciones de 15 en 10. 15
10
= 10.897.286.400
Respuesta: La cantidad de formas en las que se pueden colocar los 15 productos es 10.897.286.400. 12.
Si en el ejemplo anterior el orden no es importante, ¿de cuántas maneras se podrán colocar estos 15 productos en el estante de capacidad para 10 productos? De acuerdo a ello se deben realizar combinaciones de 15 en 10: 15
10
= 3.003
Respuesta: La cantidad de formas en las que se pueden colocar los 15 productos, considerando el orden en que se las coloca es 3.003. 13.
Se tienen 8 prototipos de un determinado producto. Solo se pueden lanzar al mercado 3 a la vez. De cuántas formas posibles se pueden lanzar: a)
Considerando el orden: 8 3 = 336
13
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
14.
Sin considerar el orden: 8 3 = 56
Se tienen 3 tareas para la casa. ¿De cuántas maneras se las puede realizar? De acuerdo a lo descrito son 3 tareas, las cuales se deben realizar sin un orden específico. A 3
B 2
C 1
Respuesta: La cantidad total es de 3! = 3 × 2 × 1 = 6 15.
Se tiene una góndola con capacidad para 3 productos. Se quieren colocar 6 productos (A, B, C, D, E, F) pero estando seguros que en uno de los extremos se tiene B y en el otro C, ¿de cuántas maneras se puede ordenar la góndola? Existen 2 series de posibilidades como las que se muestran en la tabla siguiente: 1 B C
2 4 4
3 C B
Respuesta: La cantidad de formas en que se puede ordenar la góndola es 2 (B o C) × 4 (A, D, E, F) × 1 (una vez seleccionado B o C solo queda 1 opción para esta posición) = 8. 16.
17.
Se tiene un estante con 5 espacios y se tienen 10 libros: a)
¿De cuántas maneras diferentes se pueden colocar los libros? 10 5 = 30.240
b)
¿De cuántas maneras se pueden colocarlos sin considerar el orden? 10 5 = 252
Un asesor financiero tiene 12 clientes, pero solo puede atender a 4 en un día determinado. ¿De cuántas maneras pueden ser seleccionados esos 4 clientes? Como el orden no es determinante para esta labor: 12
4
= 495
Respuesta: La cantidad de maneras que pueden ser seleccionados esos clientes es 495. 18.
Se tienen 4 días de vacaciones y se puede ir a tres ciudades, se puede ir en avión, tren, bus o automóvil particular y se puede hospedar en la casa de un amigo, en la casa de un familiar o en un hotel. ¿Cuántas posibles formas de organizar nuestras vacaciones se pueden obtener? La cantidad de formas para organizar nuestras vacaciones es 4 (días) × 3 (ciudades) × 4 (medios de transporte) × 3 (alojamientos) = 144.
14
CAPÍTULO 2
19.
20.
Probabilidades
Se posee una góndola con capacidad para 4 productos y se tienen 8 productos (A, B, C, D, E, F, G, H). Se quiere que el primer espacio esté reservado para el producto A. a)
¿De cuántas maneras se puede ordenar la góndola, teniendo en cuenta el orden de los productos? 7 3 = 210
b)
¿De cuántas maneras se puede ordenar la góndola, sin tener en cuenta el orden de los productos? 7 3 = 35
Un consultor financiero tiene 4 clientes (A, B, C, D) que visitará en un día determinado. El consultor selecciona aleatoriamente el orden en que los visitará. ¿Cuál es la probabilidad que el orden de las visitas sea: {B, C, A, D} o {A, B, C, D}? 1º 4
2º 3
3º 2
4º 1
El resultado de calcular la cantidad total de posibles visitas es igual a 4! P({B, C, A, D}) = 1/4! + 1/4! = 1/24 Algo similar ocurre con la otra probabilidad: P({A, B, C, D}) = 1/4! + 1/4! = 1/24 Respuesta: La probabilidad es la suma de las dos anteriores, o sea de 1/12. 21.
Se tiene la siguiente tabla de contingencias:
Tabla 8
a)
b)
Futbolistas (C)
Basquetbolistas (D)
Varones (A)
20
8
Mujeres (B)
4
12
Total
24
20
Total 28 16 44
Construir la tabla de contingencias en términos de frecuencias relativas. Futbolistas (C)
Basquetbolistas (D)
Varones (A)
0,46
0,18
Mujeres (B)
0,09
0,27
Total
0,55
0,45
Total 0,64 0,36 1,00
Hallar ( ∩ ): ( ∩ ) = 0,18
15
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
22.
c)
Hallar ( ∪ ): ( ∪ ) = 0,36 + 0,55 − 0,09 = 0,82
d)
Hallar (′): (′) = 1 − 0,45 = 0,55
e)
Hallar ( ∪ ): ( ∪ ) = 0,55 + 0,45 = 1,00 (son complementarios y mutualmente excluyentes)
f)
Hallar ( ∩ ): ( ∩ ) = Φ (vacío, son mutuamente excluyentes)
g)
Hallar ( ): ( ) = 0,55
Se tiene la siguiente tabla de contingencias que presenta las ventas en miles de unidades de un producto vendido en tres presentaciones diferentes (paquete de 2, 4 y 6 unidades), realizadas por tres tiendas de una cadena dada:
Tabla 9 Presentación 1 (D)
Presentación 2 (E)
Presentación 3 (F)
Tienda 1 (A)
16
13
22
Tienda 2 (B)
12
11
18
Tienda 3 (C)
21
15
24
Total
49
39
64
a)
Construir la tabla de contingencias en términos de frecuencias relativas. Presentación 1 (D)
Presentación 2 (E)
Presentación 3 (F)
Tienda 1 (A)
0,11
0,09
0,14
Tienda 2 (B)
0,08
0,07
0,12
Tienda 3 (C)
0,14
0,10
0,16
Total
0,32
0,26
0,42
Total 0,34 0,27 0,39 1,00
b)
¿Cuál es la probabilidad de vender el producto en la presentación 2? P(E) = 0,26
c)
¿Cuál es la probabilidad de vender el producto en la presentación 1 o 3? P(D∪F) = 0,32 + 0,42 = 0,74
d)
¿Cuál es la probabilidad que la tienda 1 venda el producto en la presentación 1? P(A ∩D) = 0,11
e)
¿Cuál es la probabilidad que el producto en la presentación 3 sea vendida por las tiendas 2 y 3? (P(F∩B) ∩ P(F∩C)) = P(F∩B) × P(F∩C ) = 0,12 × 0,16 = 0,0192
16
Total 51 41 60 152
CAPÍTULO 2
f)
g)
Probabilidades
¿Cuál es la probabilidad que el producto en la presentación 2 sea vendida por las tiendas 1 o 3? (P(E∩ A) ∪ P(E∩C)) = 0,09 + 0,10 = 0,19
¿Cuál es la probabilidad que el producto en la presentación 1 no sea vendida por la tienda 2? 1 − P(D∩B) = 1 − 0,08 = 0,92
23.
Si se utilizan los datos de la pregunta 22, un cliente para realizar una compra del producto decide secuencialmente de la siguiente forma: primero, la tienda donde comprará y, luego, decide la presentación del producto que comprará. a)
Construir el diagrama del árbol correspondiente. Incluir las probabilidades marginales, las condicionales y las conjuntas. P ( D
P(A)=0,34
|
A)
0,11
0,34
| A) 0, 27
P( F
| A) 0, 41
0,30
P( E | B )
P( F | B)
P(C)=0,39
P( D | C )
P(F | C )
c)
0, 26
0, 44
0,36
P (E | C )
b)
0, 32
P(E
P(D | B )
P(B)=0,27
0, 33
0,31
P( A D)
0,11
P( A E )
0, 09
P( A F )
0,14
P( B D)
0, 08
P( B E )
0, 07
P( B F )
0,12
P(C D)
0,14
P(C
) 0,10
E
P(C F )
0,16
¿Cuál es la probabilidad que el cliente seleccione la tienda 2? P(B) = 0,27 ¿Cuál es la probabilidad que el cliente no seleccione la tienda 3? P(C›) = 1 − P(C) = 1 − 0,39 = 0,61
d)
¿Cuál es la probabilidad que el cliente seleccione la tienda 1 y compre el producto en la presentación 2? P(A ∩E) = 0,09
e)
¿Cuál es la probabilidad que el cliente compre el producto en la presentación 2 dado que seleccionó la tienda 3? P(E|C) = 0,33
17
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
f)
g)
24.
¿Cuál es la probabilidad que el cliente compre el producto en la presentación 1 dado que seleccionó la tienda 2? P(D|B) = 0,30 ¿Cuál es la probabilidad que el cliente compre el producto en la presentación 2 o 3 dado que seleccionó la tienda 1? P(E|A) ∪ P(F|A) = P(E|A) + P(F|A) = 0,27 + 0,41 = 0,68
Utilizando los datos de la pregunta 22, calcule mediante el teorema de Bayes la probabilidad que el cliente compre el producto en la presentación 3 dado que seleccionó la tienda 1. Verifique su respuesta utilizando la fórmula de las probabilidades condicionales. P( F | A) =
P( A | F ) × P ( F ) P( A | D) × P ( D ) + P ( A | E ) × P ( E ) + P ( A | F ) × P (F )
Reemplazando, 0,14 × 0,42 0,14 0,42 P( F | A) = = = 0, 412 0,11 0, 09 0,14 0,34 × 0,32 + × 0, 26 + × 0, 42 0,32 0, 26 0, 42
Se demuestra que es igual que el valor obtenido usando la fórmula de la probabilidad condicional: P ( F A) 0,14 P (F | A) = = = 0, 412 0, 34 P( A) 25.
18
Se lanza un dado dos veces: a)
¿Se trata de eventos estadísticamente independientes? ¿Por qué? Sí, porque la probabilidad de ocurrencia de un lanzamiento no influye en la probabilidad del siguiente lanzamiento.
b)
Construya el diagrama del árbol correspondiente. Incluya las probabilidades marginales, las condicionales y las conjuntas. El gráfico es similar al de la pregunta 23 a), con la diferencia que los eventos son estadísticamente independientes. Es decir, que en general la probabilidad condicional es igual a la probabilidad marginal. Por ejemplo, la P(salga 4|salió 6) = P(salga 4).
c)
¿Cuál es la probabilidad que salga la siguiente secuencia: {2,1}? P(2∩1) = P(2) × P(1) = (1/6) × (1/6) = 1/36
d)
¿Cuál es la probabilidad que salga la siguiente secuencia: {6,6}? P(6∩6) = P(6) × P(6) = (1/6) × (1/6) = 1/36
Probabilidades
CAPÍTULO 2
e)
f)
g)
26.
¿Cuál es la probabilidad que salga 4 dado que en el primer lanzamiento salió 1? P(4|1) = P(4) = 1/6 ¿Cuál es la probabilidad que salga 6 dado que en el primer lanzamiento salió 6? P(6|6) = P(6) = 1/6 ¿Cuál es la probabilidad que salga 1 o 6 dado que en el primer lanzamiento salió 3? (P(1|3) ∪ P(6|3)) = P(1|3) + P(6|3) = P(1) + P(6) = (1/6) + (1/6) = 2/6
Se tiene una caja con 10 bolas: 4 son rojas y 6 son negras. Se seleccionan al azar 3 bolas, 1 a la vez, y se anota el color de la misma. El experimento se realiza con reemplazo, es decir, que una vez que se saca una bola y se anota su color, se le devuelve a la caja antes de realizar la siguiente selección. a)
Construir el diagrama del árbol correspondiente. Incluir las probabilidades marginales, las condicionales y las conjuntas. Note que en este ejemplo con reemplazo, los eventos son independientes. P( R | R, R) P ( R | R)
P(R)=4/10 | R)
0, 064
6 / 10
P ( R R N )
P ( R | R, N )
4 /10
P ( R N
R)
| R, N ) 6 /10
P ( R N
N )
0, 096
0, 096
6 /10
4 / 10
P ( N
| N , R ) 4 / 10
P ( N
R
4 / 10
P ( N
N
| N , N ) 6 / 10
P ( N
R R)
0,144
0, 096
4 /10
P(N)=6/10
P( N
P( R | N , N ) P( N
P( R | N , R )
P ( R R R )
| R, R)
P ( N
P( R | N )
4 /10
4 / 10 P( N
P( N
N )
R
0,144
) 0,144
| N ) 6 /10 P ( N
N
N )
b)
¿Cuál es la probabilidad que se saquen 3 bolas rojas? P(R ∩R ∩R) = 0,064 = 6,4%
c)
¿Cuál es la probabilidad que se saquen 2 bolas rojas y 1 bola negra? P(R ∩R ∩N) + P(R ∩N∩R) + P(N∩R ∩R) = 0,096 × 3 = 0,288 = 28,8%
d)
¿Cuál es la probabilidad que se saquen 3 bolas negras? P(N∩N∩N) = 0,216 = 21,6%
0, 216
19
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
e)
¿Cuál es la probabilidad que se saquen las bolas en la siguiente secuencia: {roja, roja, negra}? P(R ∩R ∩N) = 0,096 = 9,6%
f)
¿Cuál es la probabilidad que la segunda bola sea negra dado que la primera fue negra? P(N|N) = 0,6 = 60%
g)
27.
¿Cuál es la probabilidad que la tercera bola sea roja dado que la primera fue negra y la segunda fue roja? P(R|N,R) = 0,4 = 40%
Siguiendo con los datos de la pregunta 26, pero esta vez asumiendo que el experimento se realiza sin reemplazo, es decir, que una vez que se saca una bola y se anota su color, no se le devuelve a la caja antes de realizar la siguiente selección. a)
Construya el diagrama del árbol correspondiente. Incluya las probabilidades marginales, las condicionales y las conjuntas. Note que en este ejemplo sin reemplazo, los eventos NO son independientes. P( R | R, R) P( R | R)
P( R R R )
0, 033
| R, R) 6 / 8
P( R R N )
0,100
3/ 9 P( N
P(R)=4/10 P( N
2/8
P( R | R, N )
3/ 8
P( R N
R
P( N | R, N )
5/8
P( R N
N
P( R | N , R)
3/8
P( N
| N, R) 5 / 8
P( N
R N
P( N
N R
P( N
N N
R R
) 0,170
) 0,100
4/9
P(N)=6/10
P( N
P( R | N , N )
4/8
) 0,167 ) 0,167
| N ) 5 / 9 P( N
20
) 0,100
| R) 6 / 9
P( R | N )
P( N
| N , N )
4/8
b)
¿Cuál es la probabilidad que se saquen 3 bolas rojas? P(R ∩R ∩R) = 0,033
c)
¿Cuál es la probabilidad que se saquen 2 bolas rojas y 1 bola negra? P(R ∩R ∩N) + P(R ∩N∩R) + P(N∩R ∩R) = 0,10 × 3 = 0,30 = 30%
d)
¿Cuál es la probabilidad que se saquen 3 bolas negras? P(N∩N∩N) = 0,167 = 16,7%
) 0,167
CAPÍTULO 2
e)
¿Cuál es la probabilidad que se saquen las bolas en la siguiente secuencia: {roja, {roja, roja, negra}? P(R ∩R ∩N) = 0,10 = 10%
f)
¿Cuál es la probabilidad probabilidad que la segunda bola sea negra dado que la primera fue negra? P(N|N) = 5/9 5/9 = 0,56 = 56%
g)
28.
Probabilidades
¿Cuál es la probabilidad que que la tercera bola sea roja dado que que la primera fue f ue negra y la segunda fue roja? P(R|N,R) = 3/8 3/8 = 0,375 = 37,5%
La siguiente sigu iente tabla presenta la distribución de probabilidades referida al número de litros de agua consumidos semanalmente semanalmente por 10.000 familias:
Tabla 10
a)
P(x)
14
0,1
16
0, 2
17
0,3
18
0,3
21
0,1
¿Cuál es la cantidad de litros de agua semanales semana les de consumo promedio? promedio? Promedio = (0,1) × (14) + (0,2) × (16) + (0,3) × (17) + (0,3) × (18) + (0,1) × (21) = 17,2
b)
¿Cuál es la varianza de la cantidad de litros de agua consumidos semanalmente? semanalmente? 2 2 Var = (0,1) × (14 − 17,2) + (0,2) × (16 − 17,2) + (0,3) × (17 − 17,2)2 + (0,3) × (18 −17,2)2 + (0,1) × (21 − 17,2)2 = 2,96
c)
¿Cuál es la desviación estándar de la cantidad de litros de agua consumidos semanalmente? desv_est = (2,96)0,5 = 1,72
d)
29.
Consumo de agua en litros por semana
¿Por ¿Por qué se prefiere utilizar utiliza r la desviación estándar frente a la varianza? varianza ? Porque Porque la desviación estándar tiene la misma unidad de medida que la variable original.
Se tiene la siguiente tabla:
Tabla 11 Escenario
Probabilidad
Acciones (X)
Renta Fija (Y)
Expansión
0,3
+ 600
+ 200
Estabilidad
0,5
+ 500
+ 80
Recesión
0,2
- 450
- 110
21
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
a)
Calcular la covarianza entre los instrumentos de renta fija y las acciones. µ x = E ( x ) = (0,30) ,30) × (600) + (0,5) ,5) × (500) + (0,20) ,20) × (−450 450) = $ 340 ,30) × (20 (200) + (0,5 (0,5)) × (80) + (0,20) ,20) × (−11 110) = $ 78 µ y = E ( y ) = (0,30)
Por Por lo lo tanto, la covarianza entre entre las acciones acciones e instrumentos de renta fija será: σ xy = (0,1 (0,10) 0) ×[(600 [(600 − 340) 340) × (200 (200 − 78)] 78)]+ (0,50) (0,50)× [(50 [(500 0 − 340) 340) × (80 − 78) 78)] + (0,20 (0,20)) × [( −450 450 − 340) 340)× (−110 110 − 78) 78)] = $39. $39.38 380 0 b)
Calcular la correlación correlación entre los instrument instru mentos os de renta fija y las acciones. Para calcular la correlación correlación se necesitan calcular las desviaciones estándar: σ x = (0,30 (0,30)) × (60 (600 − 340)2 + (0,5) ,5)× (500 − 340)2 + (0,20) ,20) × (−450 − 340)2 = $ 397,37 σ y = (0,30 ,30) × (20 (200 − 78)2 + (0,5) ,5) × (80 − 78)2 + (0,20) ,20) × (− 110 − 78)2 = $ 107,41
Por lo tanto la correlación será: ρ = =
22
39.380 (397,37) (397,37) × (107, 107, 41) 41)
= 0,923
CAPÍTULO
3 Funciones de distribución de probabilidad discretas 1)
Respecto a la distribución distribución binomial: cuando se tiene una poblac p oblación ión pequeña y la muestra se hace sin reemplazo, el supuesto supuesto que la probabilidad probabilidad de suceso es la misma en cada tentativa ¿es satisfecha? Explique. No, ya que la probabilidad probabilidad cambiará cada vez que se hace la selección entre los elementos que quedan en la muestra.
2)
Se tiene una caja con 15 bolas, 8 son rojas y 7 son amarillas. Se seleccionan al azar 5 bolas, 1 a la vez, y se anota el color de la misma. Se supone supone que éxito es cuando cua ndo la bola extraída es e s de color amarillo. El experimento se realiza con reemplazo, es decir, que una vez que se saca una bola y se anota su color, se le devuelve a la caja antes de realizar la siguiente selección. Nota: Se resuelven todos estos ejercicios usando el comando Excel DISTR.BINOM. De acuerdo a los datos, la probabilidad de éxito (π) será igual a 7/15 = 0,4667. La hoja Excel que acompaña a este ejercicio es capitulo3_ejercici capitulo3_ejercicio2_binomial.xls. o2_binomial.xls. a)
¿Cuál es la probabilidad de sacar exactamente 3 bolas amarillas? P(x = = 3) = 0,0245
b)
¿Cuál es la probabilidad de sacar no sacar ninguna bola amarilla? P(x = = 0) = 0,0001
c)
¿Cuál es la probabilidad de sacar más de 2 bolas amarillas? P(x > 2) = P(x = = 3) + P(x = = 4) + P(x = = 5) = 0,0245 + 0,0643 + 0,1238 = 0,2126
23
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
¿Cuál es la probabilidad de sacar al menos 3 bolas amarillas? P(x < 3) = P(x = = 0) + P(x = = 1) + P(x = = 2) = 0,0001 + 0,0011 + 0,0065 = 0,0076 Note que se pueden utilizar utiliza r directamente las probabilidades probabilidades acumuladas, en dicho caso solo se toma el valor que corresponde a: P(x < 3) = P(x ≤ 2) = 0,0076 Esto último es cierto debido a que la distribución distr ibución de probabilidad binomial trata con variables aleatorias discretas, por lo que el número que es menor menor a 3 es 2. 2.
e)
¿Cuál es la probabilidad de sacar entre 2 y 5 bolas amarillas? P(2 ≤ x ≤ 5) = P(x ≤ 5) − P(x < 2) = P(x ≤ 5) − P(x ≤ 1) = 0,2201 − 0,0011 = 0,2190
f)
En promedio, ¿cuántas bolas amarillas se esperan sacar? Usando la fórmula de la distribución dist ribución binomial para obtener obtener el promedio:
E(x) = n × π = 15 × (0,4667) = 7,00
g)
¿Cuál es la desviación estándar? Usando la fórmula de la binomial para obtener obtener la varianza:
var(x) = n × π × (1 (1 − π) = 15 × (0,4667) × (1 − 0,4667) = 3,7333 Por Por lo tanto, la desviación estándar será igual a la parte positiva positiva de la raíz cuadrada de este número:
3)
desv_std(x) = 1,9322
Si se utiliza utiliz a Excel y con los datos de la pregunta 2, construya la tabla de probabilidades de la distribució distr ibución n binomial. Incluya las probabilidades marginales y las probabilidades probabilidades acumuladas. La hoja hoja Excel E xcel que acompaña a este ejercicio ejercicio es capitulo3_ejercici capitulo3_ejercicio2_binomial.xls. o2_binomial.xls.
24
CAPÍTULO 3
4)
Funciones de distribución de probabilidad discretas
Por medio del uso de Excel, verifique que la distribución binomial es: 1 a)
Simétrica: si π = 0,5 o si el número de tentativas es bastante grande. Use π = 0,5 y n = 10, y π = 0,4 y n = 100. n=10 y π=0,5
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000 1
2
3
4
5
6
7
8
9
10
11
n=100 y π=0,4
0,0900 0,0800 0,0700 0,0600 0,0500 0,0400 0,0300 0,0200 0,0100 0,0000 1
3
5
7
9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8 8 8 8 8 9 9 9 9 9 0 1
1 Esto se presenta en la planilla Excel capitulo3_ejercicio2_binomial.x ls, en las hojas llamadas a, b y c. Aquí solamente se han mostrado los gráficos correspondientes.
25
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Asimétrica positiva: si π < 0,5 y el número de tentativas es pequeño. Use π = 0,2 y n = 10. n=10 y π=0,2
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000 1
c)
2
3
4
5
6
7
8
9
10
11
Asimétrica negativa: si π > 0,5 y el número de tentativas es pequeño. Use π = 0,8 y n = 10. n=10 y π=0,8
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
1
5)
2
3
4
5
6
7
8
9
10
11
Se conoce que históricamente la probabilidad que un cliente compre un determinado producto es igual al 40%. Si se observa a 20 clientes: Para todas las siguientes preguntas se define x = número de clientes que compran un producto determinado. La hoja Excel que acompaña a este ejercicio es capitulo3_ejercicio5_binomial.xls.
26
CAPÍTULO 3
Funciones de distribución de probabilidad discretas
a)
¿Cuál es la probabilidad que exactamente 10 compren el producto? P(x = 10) = 0,1171
b)
¿Cuál es la probabilidad que al menos 5 clientes compren el producto? P(x ≥ 5) = 1 − P(x < 5) = 1 − P(x ≤ 4) = 1 − 0,0350 = 0,9650
c)
¿Cuál es la probabilidad que no más de 7 clientes compren el producto? P(x ≤ 7) = 0,4159
d)
¿Cuál es la probabilidad que compren el producto entre 5 y 8 clientes? P(5 ≤ x ≤ 8) = P(x ≤ 8) − P(x < 5) = P(x ≤ 8) − P(x ≤ 4) = 0,5956 − 0,0510 = 0,5446
e)
¿Cuál es la probabilidad que ningún cliente compre el producto? P(x = 10) = 0,0000
f)
En promedio, ¿cuántos clientes comprarán el producto? E(x) = n × π = 20 × (0,4) = 8
g)
¿Cuál es la varianza? Usando la fórmula de la binomial para obtener la varianza:
var(x) = n × π × (1 − π) = 20 × (0,4) × (1 − 0,4) = 4,80 Por lo tanto, la desviación estándar será igual a la parte positiva de la raíz cuadrada de este número:
6)
desv_std(x) = 2,1909
Emplee Excel y tome los datos de la pregunta 5, construya la tabla de probabilidades de la distribución binomial. Incluya las probabilidades marginales y las probabilidades acumuladas. La hoja Excel que acompaña a este ejercicio es capitulo3_ejercicio5_binomial.xls.
27
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
7)
8)
Se desea saber si las personas que trabajan en una determinada empresa pondrán sus pensiones en una administradora privada de pensiones. Las únicas respuestas posibles de los empleados son sí (éxito) o no (fracaso). Si el número de trabajadores de la empresa es de 50, de los cuales se seleccionan aleatoriamente y sin reemplazo a 20 empleados. Se supone que históricamente la probabilidad que una persona decida enrolarse es igual al 20%. a)
¿Se puede utilizar la distribución binomial para calcular las probabilidades? Analice el supuesto del modelo binomial asociado con que la probabilidad de suceso en cada tentativa debe ser el mismo. Asimismo utilice el criterio basado en el tamaño de la muestra (en comparación de la población) que hace que el supuesto se asuma como satisfecho. No se puede utilizar la distribución binomial ya que el supuesto que las probabilidades de éxito se mantienen constantes no se cumple (la muestra es sin reemplazo y el tamaño de la muestra es pequeño comparado con el de la población).
b)
¿Su respuesta cambiaría si el número de empleados de la empresa fuese 500? La regla para poder asumir que las probabilidades de éxito se mantienen constantes es n ≤ 0,05 N (el tamaño de la muestra es menor o igual al 5% del tamaño de la población). Si N = 500 y n = 20, se puede observar que 20 ≤ 0,05 (500). Por lo tanto, se podrá utilizar la distribución binomial.
c)
Bajo el supuesto original (50 empleados que trabajan en la empresa), ¿cuál sería la distribución adecuada a utilizar? La distribución a usar sería la distribución hipergeométrica.
Responder las siguientes preguntas basadas en la pregunta 7. Considere que el número de empleados de la empresa es igual a 500 (para que se pueda emplear la distribución binomial). Se recuerda que de estos empleados, se toma una muestra (sin reemplazo) de 20, a los que se les pregunta si desean poner sus pensiones en una administradora privada de pensiones. Un éxito será obtener una respuesta afirmativa. Se sabe que históricamente la probabilidad que una persona decida enrolarse es igual al 20%. Para todas las siguientes preguntas, se define x = número de empleados que pondrán sus pensiones en una administradora privada de pensiones. La hoja Excel que acompaña a este ejercicio es capitulo3_ejercicio8_binomial.xls.
28
CAPÍTULO 3
Funciones de distribución de probabilidad discretas
a)
¿Cuál es la probabilidad que exactamente 5 pongan sus pensiones en la administradora privada de pensiones? P(x = 5) = 0,1746
b)
¿Cuál es la probabilidad que al menos 3 empleados se enrolen en la administradora? P(x ≥ 3) = 1 − P(x < 3) = 1 − P(x ≤ 2) = 1 − 0,2061 = 0,7939
c)
¿Cuál es la probabilidad que no más de 3 empleados se enrolen en la administradora? P(x ≤ 3) = 0,4114
d)
¿Cuál es la probabilidad que se enrolen entre 2 y 6 clientes? P(2 ≤ x ≤ 6) = P(x ≤ 6) − P(x < 2) = P(x ≤ 6) − P(x ≤ 1) = 0,9133 − 0,0692 = 0,8441
e)
¿Cuál es la probabilidad que ningún empleado se enrole en la administradora privada de pensiones? P(x = 0) = 0,0115
f)
En promedio, ¿cuántos empleados se enrolarán en la administradora? E(x) = n × π = 20 × (0,2) = 4
g)
¿Cuál es la varianza? Usando la fórmula de la binomial para obtener la varianza:
var(x) = n × π × (1 − π) = 20 × (0,2) × (1 − 0,2) = 3,20
29
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Por lo tanto, la desviación estándar será igual a la parte positiva de la raíz cuadrada de este número: 9)
desv_std(x) = 1,7889
¿En qué casos se utiliza la distribución hipergeométrica? Cuando los eventos no son estadísticamente independientes, por ejemplo, cuando el muestreo es sin reemplazo, las probabilidades de suceso no son constantes, violando una vez más uno de los supuestos de la función de probabilidades binomial. En estos casos la distribución a usar debe ser la distribución hipergeométrica.
10)
Se tiene una caja con 15 bolas, 8 son rojas y 7 son amarillas. Se seleccionan al azar 5 bolas, 1 a la vez, y se anota el color de la misma. Se supone que éxito es cuando la bola extraída es de color amarillo. El experimento se realiza sin reemplazo, es decir, que una vez que se saca una bola y se anota su color, no se le devuelve a la caja antes de realizar la siguiente selección. X = bola extraída es amarilla. a)
¿Cuál es la probabilidad de sacar exactamente 3 bolas amarillas? P(x = 3) = 0,3263 Para comprobar esta respuesta se emplea la fórmula para calcular las probabilidades usando la distribución hipergeométrica.
P ( x = 3) =
15 −7 5 −3 15 5
C × C 7 3
C
7! 8! (7 − 3)!× 3! (8 − 2)!× 2! = 0,3263 = 15! (15 − 5)!× 5!
b)
¿Cuál es la probabilidad de sacar ninguna bola amarilla? P(x = 0) = 0,0186
c)
¿Cuál es la probabilidad de sacar más de 2 bolas amarillas? P(x > 2) = 1 − P(x ≤ 2) = 1 − 0,5734 = 0,4266
d)
¿Cuál es la probabilidad de sacar al menos 3 bolas amarillas? P(x ≥ 3) = 1 − P(x < 3) = 1 − P(x ≤ 2) = 1 − 0,5734 = 0,4266
e)
¿Cuál es la probabilidad de sacar entre 2 y 5 bolas amarillas? P(2 ≤ x ≤ 5) = P(x ≤ 5) − P(x < 2) = P(x ≤ 5) − P(x ≤ 1) = 1 − 0,1818 = 0,8182
f)
En promedio, ¿cuántas bolas amarillas se esperan sacar? µ = E ( x) =
30
n × k N
=
5×7 15
= 2,333
CAPÍTULO 3
g)
Funciones de distribución de probabilidad discretas
¿Cuál es la desviación estándar? La varianza está dada por: N − k N − n 15 − 7 15 − 5 × = (5) × (7) × × = 0,8889 2 2 N N − 1 15 15 − 1
σ 2 = n × k ×
Por lo tanto, el desvío estándar será igual a 0,9428. 11)
Si se emplea Excel y con los datos de la pregunta 10, construya la tabla de probabilidades de la distribución hipergeométrica. Incluya las probabilidades marginales y las probabilidades acumuladas. La hoja de Excel usada es capitulo3_ejercicio10_hipergeometrica.xls.
12)
Resuelva la pregunta 7 con los datos originales, es decir, con el número de empleados de la empresa igual a 50. Se recuerda que de estos empleados, se toma una muestra (sin reemplazo) de 20, a los que se les pregunta si desean poner sus pensiones en una administradora privada de pensiones. Un éxito será obtener una respuesta afirmativa. Se conoce que históricamente la probabilidad que una persona decida enrolarse es igual al 20%. (Se recomienda comparar estos resultados con los obtenidos en la pregunta 8.) Para todas las siguientes preguntas se define x = número de empleados que pondrán sus pensiones en una administradora privada de pensiones. En base a los datos del problema se asumirá que k es el 20% del total de empleados de la empresa, es decir, k = 10. La hoja Excel que acompaña a este ejercicio es capitulo3_ejercicio12_hipergeometrica.xls. a)
¿Cuál es la probabilidad que exactamente 5 pongan sus pensiones en la administradora privada de pensiones? P(x = 5) = 0,2151
b)
¿Cuál es la probabilidad que al menos 3 empleados se enrolen en la administradora? P(x ≥ 3) = 1 − P(x < 3) = 1 − P(x ≤ 2) = 1 − 0,1390 = 0,8610
c)
¿Cuál es la probabilidad que no más de 3 empleados se enrolen en la administradora? P(x ≤ 3) = 0,3650
31
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
¿Cuál es la probabilidad que se enrolen entre 2 y 6 clientes? P(2 ≤ x ≤ 6) = P(x ≤ 6) − P(x < 2) = P(x ≤ 6) − P(x ≤ 1) = 0,9635 − 0,0308 = 0,9327
e)
¿Cuál es la probabilidad que ningún empleado se enrole en la administradora privada de pensiones? P(x = 0) = 0,0029
f)
En promedio, ¿Cuántos empleados se enrolarán en la administradora? n × k 20 ×10 = =4 µ = E ( x) = N
g)
50
¿Cuál es la varianza? La varianza está dada por: N − k N − n 50 − 10 50 − 20 × = × × (20) (10) 502 × 50 − 1 = 1,9592 2 N N − 1
σ 2 = n × k ×
Por lo tanto, el desvío estándar será igual a 1,3997. 13) Al
emplear Excel y tomando en cuenta la pregunta 12, construya la tabla de probabilidades de la distribución hipergeométrica. Incluya las probabilidades marginales y las probabilidades acumuladas. La hoja de Excel usada es capitulo3_ejercicio12_hipergeometrica.xls.
32
CAPÍTULO 3
14)
Funciones de distribución de probabilidad discretas
Si se observa el número de clientes que son atendidos cada hora por un determinado cajero en una agencia bancaria. Las observaciones que corresponden a las 8 horas de trabajo en un día en particular son: 5, 6, 10, 15, 13, 8, 5, 8. Para las siguientes preguntas se asumirá que x es el número de clientes atendidos por hora por el cajero. La hoja Excel que corresponde al siguiente ejercicio es capitulo3_ ejercicio14_Poisson.xls. a)
Calcular el promedio de clientes atendidos por hora ( λ ). El promedio de las observaciones por hora de trabajo es igual a: x =
15)
5 + 6 + 10 +15 + 13 + 8 + 5 + 8 70 = = 8,75 = λ 8 8
b)
¿Cuál es la probabilidad que el cajero no atienda a ningún cliente en una hora de trabajo? P(x = 0) = 0,0002
c)
¿Cuál es la probabilidad que el cajero atienda exactamente a 8 clientes en una hora de trabajo? P(x = 8) = 0,1350
d)
¿Cuál es la probabilidad que el cajero atienda exactamente al menos a 7 clientes en una hora de trabajo? P(x ≥ 7) = 1 − P(x < 7) = 1 − P(x ≤ 6) = 1 − 0,2305 = 0,7695
e)
¿Cuál es la probabilidad que el cajero atienda a menos de 8 clientes en una hora de trabajo? P(x < 8) = P(x ≤ 7) = 0,3540
f)
¿Cuál es la probabilidad que el cajero atienda entre 6 y 10 clientes en una hora de trabajo? P(6 ≤ x ≤ 10) = P(x ≤ 10) − P(x < 6) = P(x ≤ 10) − P(x ≤ 5) = 0,7352 − 0,1317 = 0,6035
g)
¿Cuál es la probabilidad que el cajero atienda exactamente a 12 clientes en una hora de trabajo? P(x = 12) = 0,0666
Repita la pregunta 14 pero esta vez utilice el promedio histórico de clientes atendidos por hora, que es igual a 7. Para las siguientes preguntas se toma en cuenta que x es el número de clientes atendidos por hora por el cajero. La hoja Excel que corresponde al siguiente ejercicio es capitulo3_ ejercicio15_Poisson.xls.
33
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
34
a)
¿Cuál es la probabilidad que el cajero no atienda a ningún cliente en una hora de trabajo? P(x = 0) = 0,0009
b)
¿Cuál es la probabilidad que el cajero atienda exactamente a 8 clientes en una hora de trabajo? P(x = 8) = 0,1304
c)
¿Cuál es la probabilidad que el cajero atienda exactamente al menos a 7 clientes en una hora de trabajo? P(x ≥ 7) = 1 − P(x < 7) = 1 − P(x ≤ 6) = 1 − 0,4497 = 0,5503
d)
¿Cuál es la probabilidad que el cajero atienda a menos de 8 clientes en una hora de trabajo? P(x < 8) = P(x ≤ 7) = 0,5987
e)
¿Cuál es la probabilidad que el cajero atienda entre 6 y 10 clientes en una hora de trabajo? P(6 ≤ x ≤ 10) = P(x ≤1 0) − P(x < 6) = P(x ≤ 10) − P(x ≤ 5) = 0,9015 − 0,3007 = 0,6008
f)
¿Cuál es la probabilidad que el cajero atienda exactamente a 12 clientes en una hora de trabajo? P(x = 12) = 0,0263
CAPÍTULO 3
g)
16)
Funciones de distribución de probabilidad discretas
¿Se puede afirmar que el cajero de la pregunta 14 es más eficiente que la media de cajeros del banco? La media histórica es igual a 7. Si se toma la media muestral obtenida en la pregunta anterior (8,75) como representativa de la productividad del cajero, la respuesta sería afirmativa.
Tome en cuenta los datos de la pregunta 14 y utilice Excel construya la tabla de probabilidades de la distribución de Poisson. Calcule λ . Incluya las probabilidades marginales y las probabilidades acumuladas. La hoja Excel de este ejercicio es capitulo3_ejercicio14_Poisson.xls.
35
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
17)
Con los datos de la pregunta 15 y usando Excel, construya la tabla de probabilidades de la distribución de Poisson. Incluya las probabilidades marginales y las probabilidades acumuladas. La hoja Excel de este ejercicio es capitulo3_ejercicio15_Poisson.xls.
18)
36
Se conoce que el promedio ( λ ) de pacientes por hora que llegan a la sala de emergencias de un hospital es igual 3,6. Si se define a la variable aleatoria x como el número de pacientes atendidos en la sala de emergencias por hora. Responder: a)
¿Cuál es la probabilidad que en una hora lleguen 7 pacientes? P(x = 7) = 0,0425
b)
¿Cuál es la probabilidad que ningún paciente llegue en la siguiente hora? P(x = 0) = 0,0273
c)
¿Cuál es la probabilidad que lleguen entre 2 y 5 pacientes en una hora? P(2 ≤ x ≤ 5) = P(x ≤ 5) − P(x < 2) = P(x ≤ 5) − P(x ≤ 1) = 0,8441 − 0,1257 = 0,7184
d)
¿Cuál es la probabilidad que al menos lleguen 3 pacientes en una hora? P(x ≥ 3) = 1 − P(x < 3) = 1 − P(x ≤ 2) = 1 − 0,3027 = 0,6972
e)
¿Cuál es la probabilidad que a lo máximo lleguen 5 pacientes en una hora? P(x ≤ 5) = 0,8441
CAPÍTULO 3
19)
Funciones de distribución de probabilidad discretas
Con los datos de la pregunta 18 y empleando Excel, construya la tabla de probabilidades de la distribución de Poisson. Incluya las probabilidades marginales y las probabilidades acumuladas. La hoja Excel de este ejercicio es capitulo3_ejercicio18_Poisson.xls.
37
CAPÍTULO
4 Distribuciones de probabilidad continuas 1)
Independientemente de la función de distribución continua, ¿a qué es igual P(x = a), donde a es una constante? P(x = a) = 0
2)
Se tiene un experimento en el que todos los eventos tienen la misma probabilidad de ocurrencia en el intervalo a = 1, b = 6. En base a esto responder lo siguiente: a)
¿Cuál es distribución adecuada para este caso? Es la distribución de probabilidad uniforme. Antes de proceder con el cálculo de las probabilidades se necesita calcular la altura del rectángulo. Este estará dado por: 1 (b − a )
b)
=
1 (6 − 1)
= 0,20
P(x ≤ 4): P(x ≤ 4) = (4 − 1) × (0,2) = 0,6 Es 4 − 1 porque x ocurre en el intervalo [1,6] y la probabilidad en todo ese intervalo tiene que ser 1.
c)
P(1 ≤ x ≤ 4): P(1 ≤ x ≤ 4) = (4 − 1) × (0,2) = 0,6
39
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
P(3 < x ≤ 6): P(3 < x ≤ 6) = (6 − 3) × (0,2) = 0,6
e)
P(x > 5): P(x > 5) = 1 − P(x ≤ 5) = 1 − (5 − 1) × (0,2) = 0,2
f)
P(x = 1): P(x = 1) = 0
g)
¿Cuál es la esperanza matemática de este experimento? µ = E ( x) =
h)
2
=
1+ 6 2
= 3, 5
¿Cuál es la varianza de este experimento? σ = 2
3)
a+b
(b − a) 2 12
=
(6 − 1)2 12
= 2,0833
Se supone que el consumo de cierto producto se distribuye como una distribución uniforme con media 5 y varianza 3. Responda: a)
¿Cuáles son los límites de la distribución? µ = E ( x ) =
a+b
2
= 5 → a + b = 10
(b − a )2 σ = = 3 → (b − a)2 = 36 12 2
Resolviendo el sistema se obtendrá: a = 2 y b = 8 O bien, a = 8 y b = 2 Como b representa el límite superior, se seleccionará con la primera opción (a = 2 y b = 8). Antes de proceder con el cálculo de las probabilidades se necesita calcular la altura del rectángulo. Este estará dado por: 1 (b − a ) b)
=
1 (8 − 2)
= 0,1667
P(x ≤ 3): P(x ≤ 3) = (3 − 2) × (0,1667) = 0,1667 Es (3 – 2) porque x ocurre en el intervalo [2,8] y la probabilidad en todo ese intervalo tiene que ser 1.
40
CAPÍTULO 4
4)
Distribuciones de probabilidad continuas
c)
P(3 ≤ x ≤ 7): P(3 ≤ x ≤ 7) = (7 − 3) × (0,1667) = 0,6668
d)
P(2 < x ≤ 4): P(2 < x ≤ 4) = (4 − 2) × (0,1667) = 0,3334
e)
P(x > 6): P(x > 6) = 1 − P(x ≤ 6) = 1 − (6 − 2) × (0,1667) = 1 − 0,6668 = 0,3332
f)
P(x ≥ 3): P(x ≥ 3) = 1 − P(x ≤ 3) = 1 − (3 − 2) × (0,1667) = 1 − 0,1667 = 0,8333
Se conoce que el promedio ( λ ) de pacientes por hora que llegan a la sala de emergencias de un hospital es igual 3,6. Se define a la variable aleatoria x como el tiempo entre la llegada de los pacientes. Responda: En primer lugar se transforma el número de pacientes en pacientes por hora. a)
¿Cuál es la probabilidad que un paciente llegue en los siguientes 10 minutos, dado que acaba de llegar un paciente? 10 minutos = 0,1667 horas (10/60) F ( x) = P (tiempo de ocurrencia ≤ 0,1667 horas) = 1 − e −3,6 × (0,1667) = 0, 45
b)
¿Cuál es la probabilidad que ningún paciente llegue en la siguiente hora, dado que acaba de llegar un paciente? P( x ≥ 1) = e
c)
− λ ×k
= e −3,6 × (1) = 0, 00
¿Cuál es la probabilidad que algún paciente llegue entre los próximos 10 y 20 minutos, dado que acaba de llegar un paciente? P(0,1667 ≤ x ≤ 0, 34) = P( x ≤ 0, 3334) − P( x ≤ 0,1667) P(0,1667 ≤ x ≤ 0,34) = (1 − e −3,6 × ( 0,3334) ) − (1 − e −3,6 × ( 0,1667 ) ) = 0, 2476
d)
¿Cuál es el tiempo promedio esperado en el que arribará otro paciente? µ = E ( x ) =
1 λ
=
1 3,6
= 0, 2778
Es decir, que en promedio se espera que llegue un paciente cada 0,28 horas. e)
¿Cuál es la varianza del tiempo esperado en el que arribará otro paciente? σ 2 =
1 1 = = 0,0772 λ 2 3,6 2
41
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
5)
Mediante el uso de Excel construya la tabla de probabilidades marginales de la distribución exponencial dada la información del ejemplo anterior. La hoja Excel de este ejercicio se llama “capitulo4_ejercicio4_Exponencial.xls”.
6)
El número de clientes promedio por hora que compran un determinado producto en una tienda es igua l a 35. Si se define a la variable aleatoria x como el tiempo entre la llegada de los clientes. Responda: En primer lugar, se transforma el número de clientes en clientes por hora. a)
¿Cuál es la probabilidad que un cliente compre el producto en los siguientes 5 minutos, dado que un cliente acaba de comprar el producto? P( x ≤ 0,0833 horas) = 1 − e −35 × (0,0833) = 0,9458
b)
¿Cuál es la probabilidad que ningún cliente compre el producto en los siguientes 10 minutos, dado que un cliente acaba de comprar el producto? (10 minutos es 0,1667 horas, 10/60) P ( x ≥ 0,1667) = e
c)
−35 × (0,1667)
= 0, 0029
¿Cuál es la probabilidad que un cliente compre el producto entre los próximos 5 y 10 minutos, dado que un cliente acaba de comprar el producto? P (0, 0833 ≤ x ≤ 0,1667) = P( x ≤ 0,1667) − P( x ≤ 0, 0833) P (0, 0833 ≤ x ≤ 0,1667) = (1 − e −35 × (0,1667) ) − (1 − e −35 × (0,0833) ) = 0, 0571
d)
¿Cuál es el tiempo promedio esperado en el que un cliente comprará el producto? µ = E ( x ) =
42
1 λ
=
1 35
= 0, 0286
CAPÍTULO 4
Distribuciones de probabilidad continuas
Es decir, que en promedio se espera que un cliente compre cada 0,0286 horas (o sea, cada 1,71 minutos, ya que 0,0286 × 60 = 1,71). e) ¿Cuál es la varianza del tiempo esperado de la distribución en este caso? σ 2 = 7)
1 1 = 2 = 0,0008 2 λ 35
Por medio de Excel construya la tabla de probabilidades marginales de la distribución exponencial dada la información del ejemplo anterior. La hoja Excel de este ejercicio se llama “capitulo4_ejercicio6_Exponencial.xls”.
43
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
8)
Se tiene una variable aleatoria x ~ N(10,2), es decir, que la variable aleatoria x se distribuye como una normal con media 10 y desviación estándar 2. Utilice la regla empírica para responder las siguientes preguntas: Se recuerda la regla empírica mediante el siguiente gráfico:
0,50
-4
-3
-2
-1
0,50
0
1
2
3
4
68,3% 95,5% 99,7%
a)
P(x ≥ 10):
P ( x ≥ 10 ) = P z ≥ b)
10 − 10 2
= P( z ≥ 0) = 0,5
P(8 ≤ x ≤ 12): 8 − 10 x − µ 12 − 10 ≤ ≤ = P (−1 ≤ z ≤ 1) = 0, 683 2 σ 2
P(8 ≤ x ≤ 12) = P c)
P(4 ≤ x ≤ 14): 4 − 10 x − µ 14 − 10 ≤ ≤ = P(−3 ≤ z ≤ 2) 2 σ 2
P(4 ≤ x ≤ 14) = P
0, 955 0, 997 − 2 2
P( −3 ≤ z ≤ 2) = P ( z ≤ 2) − P ( z ≤ − 3) =
P( −3 ≤ z ≤ 2) = 0, 4775 + 0, 4985 = 0, 976 d)
P(4 ≤ x ≤ 16): 4 − 10 x − µ 16 − 10 ≤ ≤ = P (−3 ≤ z ≤ 3) = 0,997 2 σ 2
P(4 ≤ x ≤ 16) = P
44
CAPÍTULO 4
e)
P(x ≤ 8):
8 − 10
6 − 10
0,955
2
2
P ( x ≤ 8) = P z ≤ f)
= P ( z ≤ −1) = 0,5 − 2
0, 683 2
= 0,1585
P(x ≥ 6): P ( x ≥ 6 ) = P z ≥
9)
Distribuciones de probabilidad continuas
= P( z ≥ −2) = 0,5 +
= 0,9775
Se tiene una variable aleatoria x ~ N(7;1,5). Responda las siguientes preguntas: Los valores se han obtenido usando Excel (DISTR.NORM). Recuerde que Excel presenta las probabilidades desde −∞ hasta el valor deseado. Para analizar esto observe la Aplicación de Excel 2 del capítulo 4. a)
P(x ≥ 8):
8−7
1,5
P ( x ≥ 8 ) = P z ≥ b)
= P( z ≥ 0, 6667) = 1 − 0, 747518 = 0, 252482
P(5 ≤ x ≤ 6): 5 − 7 x − µ 6 − 7 ≤ ≤ = P(−1, 3333 ≤ z ≤ − 0, 6667) σ 1, 5 1, 5
P(5 ≤ x ≤ 6) = P
P(−1, 3333 ≤ z ≤ −0, 6667) = P( z ≤ − 0, 6667) − P( z ≤ −1, 3333) = 0, 252482 − 0, 091266 = 0,161216
c)
P(7 ≤ x ≤ 9): 7 − 7 x − µ 9 − 7 ≤ ≤ = P (0 ≤ z ≤ 1,3333) σ 1, 5 1, 5
P (7 ≤ x ≤ 9) = P
P (0 ≤ z ≤ 1, 3333) = P ( z ≤ 1, 3333) − P ( z ≤ 0) = 0, 908783 − 0, 50 = 0, 408783 d)
P(6 ≤ x < 8): 6 − 7 x − µ 8 − 7 ≤ ≤ = P (− 0, 6667 ≤ z ≤ 0, 6667) 1, 5 σ 1, 5
P(6 ≤ x ≤ 8) = P
P( −0, 6667 ≤ z ≤ 0, 6667) = P ( z ≤ 0, 6667) − P ( z ≤ − 0, 6667) = 0 , 747518 − 0, 252482 = 0, 495036 e)
P(x < 7):
7−7
1, 5
P ( x<7 ) = P z<
= P (z < 0) = 0,5
45
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
f)
P(x ≥ 6):
6−7
1,5
P ( x ≥ 6 ) = P z ≥ 10)
= P( z ≥ −0, 6667) = 1 − P( z < −0, 6667) =1 −0, 252482 = 0, 747518
Se conoce que los salarios (expresados en miles de U.M.) de las personas que trabajan en una determinada empresa transnacional siguen una distribución normal con media 50 y varianza 20. En base a esta información determinar lo siguiente: a)
P(x > 60):
60 − 50
20
P ( x>60 ) = P z> b)
= P ( z > 2, 2361) = 1 − P ( z ≤ 2, 2361) = 1 − 0, 987327 = 0, 012673
P(x > 100):
100 − 50
20
P ( x>100 ) = P z> c)
= P( z > 11,18) = 1 − P( z ≤ 11,18) = 1 −1 = 0, 00
P(45 ≤ x ≤ 75): 45 − 50 x − µ 75 − 50 ≤ ≤ = P (−1,1180 ≤ z ≤ 5, 5902) σ 20 20
P (45 ≤ x ≤ 75) = P
P (−1,12 ≤ z ≤ 3, 35) = P ( z ≤ 5, 5902) − P ( z ≤ −1,1180) = 1, 000000 − 0,131783 = 0, 868217 d)
P(x < 30):
30 − 50
20
P ( x<30 ) = P z< 11)
= P ( z < −4, 4721) = 0, 000004
Use la aproximación de la distribución binomial empleando la distribución normal. Se conoce que históricamente la probabilidad que un cliente compre un determinado producto es igual al 52%. Si se observan a 10 clientes: a)
¿Se cumplen las condiciones para la aproximación? Las condiciones son: n × π ≥ 5 y n × (1 − π) ≥ 5. Entonces como: 10 × (0,52) = 5,2 ≥ 5 y 10 × (1 − 0,52) = 4,8 < 5 Técnicamente no se puede utilizar la aproximación, pero a manera de demostrar el uso de esta aproximación se continuará con la solución del ejercicio. Para los siguientes ejercicios la media y la varianza serán las siguientes:
E(x) = n × π = 10 × (0,52) = 5,2
var(x) = n × π × (1 − π) = 10 × (0,52) × (1 − 0,52) = 2,496 Por lo tanto, la desviación estándar será:
46
std(x) = 1,58
Distribuciones de probabilidad continuas
CAPÍTULO 4
b)
¿Cuál es la probabilidad que exactamente 5 compren el producto? 4, 5 − 5, 2 x − µ 5,5 − 5, 2 ≤ ≤ = P( −0, 4430 ≤ z ≤ 0,1899) 1,58 σ 1,58
P( x = 5) = P(4, 5 ≤ x ≤ 5, 5) = P
P( −0, 44 ≤ z ≤ 0,19) = P( z ≤ 0,1899) − P( z ≤ −0, 4430) = 0, 575306 − 0, 328883 = 0, 246423 c)
¿Cuál es la probabilidad que al menos 3 clientes compren el producto? x − µ
P ( x ≥ 3 ) = P ( x ≥ 2,5 ) = P
σ
≥
2,5 − 5,2 1,58
= P( z ≥ −1, 7089)
P ( z ≥ −1, 7089) = 1 − P ( z ≤ −1, 7089) = 1 − 0, 043735 = 0 ,956265 d)
¿Cuál es la probabilidad que no más de 6 clientes compren el producto? x − µ 6,5 − 5,2 ≤ = P ( z ≤ 0,8228) σ 1,58
P ( x ≤ 6 ) = P ( x ≤ 6, 5 ) = P
P ( z ≤ 0,8228) = 0,794689 e)
¿Cuál es la probabilidad que compren el producto entre 3 y 7 clientes? 2, 5 − 5, 2 x − µ 7, 5 − 5, 2 ≤ ≤ = P (− 1, 7089 ≤ z ≤ 1, 4557) 1, 58 σ 1, 58
P (3 ≤ x ≤ 7) = P (2, 5 ≤ x ≤ 7, 5) = P
P (−1, 71 ≤ z ≤ 1, 46) = P (z ≤ 1, 4557) − P (z ≤ − 1, 7089) = 0, 927262− 0, 043735= 0 ,883527 f)
¿Cuál es la probabilidad que ningún cliente compre el producto? 0 − 5, 2 x − µ 0, 5 − 5, 2 ≤ ≤ = P (− 3, 2911 ≤ z ≤ − 2, 9747) 1,58 σ 1, 58
P ( x = 0) = P (0 ≤ x ≤ 0, 5) = P
P (−3, 29 ≤ z ≤ − 2, 97) = P ( z ≤ − 2, 9747) − P (z ≤ − 3, 2911) = 0, 001466 − 0, 000499 = 0, 000967
Se advierte que en la aproximación se emplea 0 como punto de partida. Esto es cierto porque no se puede tener − 0,5 clientes. 12)
Resuelva la pregunta anterior usando la probabilidad binomial. a)
¿Es la aproximación presentada en la pregunta anterior adecuada? De acuerdo a la parte a) de la pregunta anterior (donde se demostró que las condiciones se cumplieron solo marginalmente), la aproximación será buena.
b)
¿Por qué cree que esta aproximación es adecuada? Las condiciones son: n × π ≥ 5 y n × (1 − π) ≥ 5. Entonces como: 10 × (0,52) = 5,2 ≥ 5 y 10 × (1 − 0,52) = 4,8 < 5
47
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Como se observa la segunda condición es casi 5. Obviamente las aproximaciones serán mejores cuanto mayor sea el número de observaciones (n) o cuando la probabilidad tienda a 0,50. En este caso 0,52 es también bastante aproximada a 0,50, por lo que las estimaciones deben de ser buenas. c)
¿Cambiaría su respuesta si la probabilidad que el cliente compre el producto baje de 52% a 25%? Se puede observar: 10 × (0,25) = 2,5 ≤ 5 y 10 × (1 − 0,25) = 7,5 ≥ 5 Nótese que en este caso el primer número está bastante lejos de 5, por lo que esta aproximación no será buena.
d)
¿Cambiaría su respuesta si la probabilidad que el cliente compre el producto baje de 52% a 25%, pero que el número de clientes observados suba de 10 a 200? De acuerdo a las condiciones planteadas:
200 × (0,25) = 40 ≥ 5 y 200 × (1 − 0,25) = 150 ≥ 5 La aproximación será buena, en este caso porque n aumentó.
13)
Se advierte que un 41% de empresas creadas permanecen en el mercado un año o más. Si se define un suceso como el que una empresa permanezca por un año o más. Se toma una muestra de 100 empresas creadas en los últimos 5 años. Utilizando la aproximación de la distribución binomial usando la normal, responda a las siguientes preguntas: a)
Verifique que las condiciones de la aproximación son satisfechas. Las condiciones son: n × π ≥ 5 y n × (1 − π) ≥ 5. Entonces como:
100 × (0,41) = 41 ≥ 5 y 100 × (1 − 0,41) = 59 ≥ 5 Técnicamente se puede utilizar la aproximación. Para los siguientes ejercicios la media y la varianza serán las siguientes:
E(x) = n × π = 100 × (0,41) = 41
var(x) = n × π × (1 − π) = 100 × (0,41) × (1 − 0,41) = 24,19 Por lo tanto, la desviación estándar será:
std(x) = 4,9183
b)
¿Cuál es la probabilidad que al menos 20 empresas hayan permanecido en el mercado por un año o más? x − µ 19,5 − 41 ≥ = P ( z ≥ − 4, 3714) 4,9183 σ
P ( x ≥ 20 ) = P ( x ≥ 19, 5 ) = P
P ( z ≥ −4, 3714) = 1 − P ( z ≤ −4, 3714) = 1 − 0, 000006 = 0, 999994
48
CAPÍTULO 4
c)
Distribuciones de probabilidad continuas
¿Cuál es la probabilidad que un máximo de 30 empresas hayan permanecido en el mercado por un año o más? x − µ 30,5 − 41 ≤ = P ( z ≤ − 2,1349) σ 4,9183
P ( x ≤ 30 ) = P ( x ≤ 30, 5 ) = P
P( z ≤ −2,1349) = 0,016385 d)
¿Cuál es la probabilidad que entre 10 y 35 empresas hayan permanecido en el mercado por un año o más? 9, 5 − 41 x − µ 35, 5 − 41 ≤ ≤ = P (− 6, 4047 ≤ z ≤ −1,1118) 4,9183 σ 4, 9183
P ( 10 ≤ -x ≤ 35 ) = P ( 9, 5 ≤ -x ≤ 35, 5 ) = P
P (−6, 4047 ≤ z ≤ −1,1118) = P ( z ≤ − 1,1118) − P (z ≤ − 6, 4047) = 0,133112 − 0, 00000 = 0,133112
e)
Conteste la pregunta a) usando la distribución binomial. Se empleará Excel para obtener estos resultados. P ( x ≥ 20 ) = 1 − P ( x < 20) = 1 − P (x ≤ 19) = 1 − 0, 000002 = 0, 999998
f)
Conteste la pregunta b) usando la distribución binomial. P ( x ≤ 30 ) = 0,015214
g)
Conteste la pregunta c) usando la distribución binomial. P (10 ≤ -x ≤ 35 ) = P ( x ≤ 35) − P ( x < 10) = P ( x ≤ 35) − P (x ≤ 9) P ( x ≤ 35) − P ( x ≤ 9) = 0,131334 − 0, 00000 = 0,131334
Como se puede observar en las preguntas e) − f), los valores obtenidos mediante la distribución binomial son bastante cercanos a los obtenidos con la distribución normal. 14)
Construya la tabla de probabilidades de la chi cuadrada con 3 grados de libertad. Construya la tabla desde cero hasta 20 con incrementos de 0,5. Conteste lo siguiente: La hoja Excel se llama “capitulo4_ejercicio14_chi_cuadrada.xls”. Recuerde que Excel presenta las probabilidades desde el número deseado hasta +∞. De acuerdo a esto último se ajusta la forma en determinar las probabilidades. Se adjunta una parte de la tabla a los efectos prácticos.
49
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
15)
a)
P(x > 1,5): P(x > 1,5) = 0,91307
b)
P(x ≤ 6): P(x ≤ 6) = 1 − P(x > 6) = 1 − 0,306219 = 0,693781
c)
P(0 < x ≤ 3): P(0 < x ≤ 3) = P(x ≥ 0) − P(x > 3) = 1 − 0,699986 = 0,300014
d)
P(12 ≤ x ≤ 15): P(12 ≤ x ≤ 15) = P(x > 12) − P(x > 15) = 0,034788 − 0,010362 = 0,024426
Si los retornos de una determinada acción se distribuyen como una distribución t Student con 5 grados de libertad. Se toman aleatoriamente 50 observaciones y se define la variable aleatoria x como los retornos de la acción, responda lo siguiente: a)
50
Construya la tabla de probabilidades de la t de Student con 5 grados de libertad. Construya la tabla desde -3 hasta 3 en incrementos de 0,1. La hoja Excel se llama “capitulo4_ejercicio15_t_student.xls”. Recuerde que Excel presenta las probabilidades desde x hasta −∞, si el x es negativo, y desde x hasta +∞ si el x es positivo. De acuerdo a esto último se ajusta la forma de determinar las probabilidades.
CAPÍTULO 4
Distribuciones de probabilidad continuas
b)
P(x > 0,1): P(x > 0,1) = 0,46212
c)
P(x ≤ 0): P(x ≤ 0) = 0,5
d)
P(-0,5 < x ≤ 1,0): P(-0,5 < x ≤ 1,0) = [0,5 − P(x ≤ -0,5)] + [0,5 − P(x > 1,0)] = [0,5 − 0,31915)] + [0,5 − 0,18161] P(-0,5 < x ≤ 1,0) = 0,49924
e)
16)
P(1,0 ≤ x ≤ 2,5): P(1,0 ≤ x ≤ 2,5) = P(x > 1,0) − P(x > 2,5) = 0,18161 − 0,02725 = 0,15436
Construya la tabla de probabilidades de la F de Fisher con 5 y 10 grados de libertad en el numerador y denominador, respectivamente. Construya la tabla desde cero hasta 5 en incrementos de 0,1. Conteste lo siguiente: La hoja Excel se llama “capitulo4_ejercicio16_F.xls”. Recuerde que Excel presenta las probabilidades desde 0 hasta +∞. De acuerdo a esto último se ajusta la forma de determinar las probabilidades. Se adjunta una parte de la misma a los efectos prácticos.
51
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
17)
a)
P(x > 1): P(x > 1) = 0,4651
b)
P(x ≤ 2): P(x ≤ 2) = 1 − P(x > 2) = 1 − 0,1642 = 0,8358
c)
P(0,5 < x ≤ 2,2): P(0,5 < x ≤ 2,2) = P(x ≥ 0,5) − P(x > 2,2) = 0,7700 − 0,1352 = 0,6348
d)
P(3 ≤ x ≤ 4,5): P(3 ≤ x ≤ 4,5) = P(x > 3) − P(x > 4,5) = 0,0656 − 0,0208 = 0,0448
Se entrevistó a 60 familias para determinar sus gastos en consumo mensuales. Se tiene la siguiente tabla que muestra el rango de gastos de consumo mensual, el número de familias en cada rango y el gasto promedio mensual por rango:
Tabla 1 Número de familias
[500;1.000)
12
734
[1.000;1.500)
26
1.350
[1.500;2.000)
17
1.703
5
2.560
[2.000; +)
52
Gasto promedio mensual (en U.M.)
Rango (en U.M.)
CAPÍTULO 4
Distribuciones de probabilidad continuas
Responda las siguientes preguntas: Asuma que x = gasto en consumo de una determinada familia a)
¿Cuál es la probabilidad de seleccionar aleatoriamente a una familia cuyo gasto en consumo está entre 500 y 1.000 U.M.? P(x ∈ [500;1.000)) = 12/60 = 0,2000
Calcule las otras probabilidades de seleccionar aleatoriamente a una familia en un determinado rango de consumo. P(x ∈ [1.000;1.500)) = 26/60 = 0,4334
P(x ∈ [1.500;2.000)) = 17/60 = 0,2833
P(x ∈ [2.000; +)) = 5/60 = 0,0833
c)
¿Cuál es el gasto promedio mensual de toda la muestra? Promedio = 0,2 × 734 + 0,4334 × 1.350 + 0,2833 × 1.703 + 0,0833 × 2.560 = 1.427,60
b)
d)
¿Cuál es la varianza de la misma? Varianza = 0,2 × (734 − 1.427,60)2 + 0,43 × (1.350 − 1.427,60) 2 + 0,28 × (1.703 − 1.427,60)2 + 0,08 × (2.560 − 1.427,60)2 = 227.131,03 La desviación estándar será = 476,58
18)
¿Si una variable aleatoria se distribuye como una normal, las medias muestrales tomadas de esta población se distribuirán como una normal, si y solo si el tamaño de la muestra es mayor o igual que 30? Esta es la regla empírica que asegura con cierta certeza que el teorema del límite central se cumple. Sin embargo, si la población se distribuye como una normal, las medias muestrales tomadas de esta población también se distribuirán como una normal sin importar el tamaño de la muestra.
19)
¿Las medias muestrales se distribuyen normalmente, sin importar la distribución de la población de la que fueron tomadas? Comente. Falso. Esto es cierto si y solo si en el caso en el que la población de donde se toman las muestras se distribuye como una normal. En todos los otros casos se tiene que verificar que el teorema del límite central se cumple, es decir, se tiene que verificar que el tamaño de la muestra sea de por lo menos 30.
20)
El teorema del límite central dice que si el tamaño de las muestras es grande (por lo general ≥ 30), indiferentemente de la distribución poblacional de donde se sacaron las muestras, la distribución muestral será una normal. Comente. Correcto.
53
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
21)
Si se tiene una población que se distribuye como una normal con media 20 y desviación estándar 3, de la cual se extrae una muestra de tamaño 10. Conteste las siguientes preguntas: a)
En este caso, ¿cuál es la distribución de las medias muestrales? X~N(20,3) Por lo tanto la muestra, independientemente del tamaño de la muestra, será también normal.
b)
¿Cuál es la media y el error estándar de las medias muestrales? media muestral = µ = 20 s =
c)
σ
=
n
3 10
= 0,9487
P ( x > 18) .
x − µ 18 − 20 P( x > 18) = P > = P ( z > −2,1081) 0,9487 σ n P( z > −2,1081) = 1 − P ( z ≤ − 2,1081) = 1 − 0, 017511 = 0, 982489 d) P ( x ≤ 16) .
16 − 20
0,9487
P( x ≤ 16) = P z ≤ e)
= P ( z ≤ −4, 2163) = 0, 000012
P ( 21 ≤ x ≤ 23) .
21 − 20
P ( 21 ≤ x ≤ 23) = P
0, 9487
≤z≤
23 − 20
= P (− 1, 0541 ≤ z ≤ 3,1622)
0, 9487
P ( −1, 0541 ≤ z ≤ 3,1622) = P (z ≤ 3,1622) − P (z ≤ − 1, 0541) = 0, 999217− 0,145919= 0, 853298 22)
54
Si se tiene una población que no se distribuye como una normal. La media del proceso es 5 y la desviación estándar es 0,75. De esta población se saca una muestra de tamaño 10. Conteste las siguientes preguntas: a)
¿Se puede afirmar que en este caso la distribución muestral será una normal? No, porque la población no se distribuye como una normal.
b)
¿Su respuesta cambiaría si el tamaño de las muestras fuera 50? Sí, porque en ese caso se puede afirmar que el teorema del límite central se cumple, por lo que la muestra se distribuirá como una normal.
CAPÍTULO 4
c)
23)
Distribuciones de probabilidad continuas
Si su respuesta en b) es afirmativa, ¿por qué sería este el caso? Por la aplicación del teorema del límite central.
Continuando con la pregunta anterior y asumiendo que el tamaño de la muestra es 50, responda las siguientes preguntas: a)
P ( x ≤ 4 ) :
4−5 P ( x ≤ 4 ) = P z ≤ = P ( z ≤ − 9, 4251) = 0, 00 0,75 50 b)
P ( x > 5.5 ) :
5, 5 − 5
0,1061
P ( x > 5,5 ) = P z > c)
P ( 5 ≤ x ≤ 7 ) :
5−5
P ( 5 ≤ x ≤ 7 ) = P
0,1061
d)
= P( z > 4, 7125) = 1 − P( z ≤ 4, 7125) =1 −0,999999 = 0, 000001
7 −5
≤z≤
= P(0 ≤ z ≤ 18,8501) = 0, 50
0,1061
P ( 4 ≤ x ≤ 6 ) :
4−5
P ( 4 ≤ x ≤ 6 ) = P
0,1061
≤z≤
6−5
= P( −9, 4251 ≤ z ≤ 9, 4251)
0,1061
P( −9, 4251 ≤ z ≤ 9, 4251) = P( z ≤ 9, 4251) − P( z ≤ −9, 4251) = 1 − 0 = 1 24)
Si se tiene un índice de sentimiento de los inversionistas, que señala lo que los inversionistas creen que pasará con la economía el próximo año en términos de expectativas de crecimiento o recesión. Se supone que 57% del total de inversionistas esperan que la economía crezca el próximo año. Se toma aleatoriamente una muestra de 40 inversionistas. Responda lo siguiente: a)
Verifique que las condiciones para la aproximación mediante la distribución normal se cumplen. Las condiciones son: n × π ≥ 5 y n × π (1 − π) ≥ 5 Si se reemplaza por los valores dados en el ejercicio: 40 × 0,57 = 22,8 ≥ 5 40 × 0,57 × (1 − 0,57) = 9,804 ≥ 5 Por lo tanto, la condición se cumple y se puede afirmar que la proporción muestral se distribuye como una normal.
55
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Calcule la media y el error estándar. Media = π = 0,57 0,57(1 − 0,57) 40
c)
= 0,0783
P(p > 0,5):
0,5 − 0,57
0,0783
P ( p > 0, 5) = P z >
= P ( z > −0,8940)
P ( z > −0, 8940) = 1 − P ( z ≤ −0, 8940) = 1 − 0,185661 = 0, 814339 d)
P(p ≤ 0,6):
0,6 − 0,57
0,0783
P ( p ≤ 0, 6 ) = P z ≤ e)
= P( z ≤ 0, 3831) = 0, 649177
P(0,3 ≤ p ≤ 0,7): 0, 3 − 0, 57
P ( 0,3 ≤ p ≤ 0, 6 ) = P
0, 0783
≤z≤
0, 6 − 0, 57
= P(−3, 4483 ≤ z ≤ 0, 3831)
0, 0783
P(−3, 4483 ≤ z ≤ 0, 3831) = P ( z ≤ 0, 3831) − P ( z ≤ −3, 4483) = 0, 649177 − 0, 000282 = 0, 648895
56
CAPÍTULO
5 Estadística inferencial: Intervalos de confianza 1)
¿Cuál es la diferencia entre un parámetro y un estadístico? La diferencia es que el primero se refiere a la población y el segundo a la muestra.
2)
¿Un estadístico insesgado es aquel cuyo valor es igual al parámetro correspondiente? Incorrecto. Un estadístico insesgado es aquel cuyo valor esperado es igual al parámetro correspondiente.
3)
¿Por qué el denominador de la varianza muestral es n – 1? Porque de esta manera el estadístico de la varianza poblacional será insesgado. Para una demostración formal de esto se sugiere leer la sección 2 del capítulo 5.
4)
¿Puede un estimador ser no eficiente pero consistente? Correcto.
5)
¿Por qué es muy riesgoso realizar inferencias basadas en una estimación puntual? Debido a que se asume que el valor exacto del estadístico es igual al valor del parámetro. Para una explicación detallada se sugiere leer la sección 3 del capítulo 5.
57
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
6)
¿Cuál sería el efecto en los límites de un intervalo de confianza, si el nivel deseado de confianza es igual al 100%? Los límites serian −∞ y +∞. Lógicamente este intervalo contendrá con certeza el parámetro, su uso práctico es nulo ya que no provee ninguna información sobre la cual se puedan tomar decisiones.
7)
Si el nivel de confianza deseado tiende a cero, ¿el intervalo de confianza tenderá a 100%? En este caso el intervalo de confianza tenderá a la estimación puntual del parámetro.
8)
Se supone que una población se distribuye como una normal. Se conoce por datos históricos que la desviación estándar poblacional ( σ ) es igual a 2. Se toma una muestra aleatoria de 15 elementos de dicha población y se calcula su media muestral, que es igual a 20. En base a estos datos estime el intervalo de confianza de la media poblacional dados los siguientes niveles de confianza: Para el desarrollo de este ejercicio se utilizará el comando Excel DIST.NORM.INV. a)
Nivel de confianza del 90%:
µ ∈ x ± z ×
b)
σ
2 µ → ∈ ± × 20 1, 96 → µ ∈ [18, 9879; 21, 0121] 15 n
Nivel de confianza del 99%:
µ ∈ x ± z ×
9)
2 → µ ∈ 20 ± 1, 645 × → µ ∈ [19,1505; 20, 8495] 15 n
Nivel de confianza del 95%: µ ∈ x ± z ×
c)
σ
σ
2 → ∈ ± × 20 2, 56 µ → µ ∈ [18, 6780; 21, 3220] 15 n
Basados en las respuestas obtenidas en la pregunta anterior, comente: ¿Puede verificarse que la amplitud de los intervalos de confianza se incrementa conforme se incrementan los niveles de confianza deseados? Sí, es correcto, se puede verificar.
10)
Las ganancias/pérdidas mensuales de las empresas que componen un índice, se distribuyen como una normal. Se supone que la varianza poblacional ( σ 2) es conocida e igual a 245. Se toma una muestra aleatoria de 10 empresas componentes del índice. La media muestral de las ganancias/pérdidas de estas 10 empresas es igual a 1.350. Basados en esta información: Note que la desviación estándar será igual a 15,6525 (245^ 0,5).
58
CAPÍTULO 5
a)
¿Cuál es el estimador puntual de la media poblacional? El estimador puntual es 1.350.
b)
Construya el intervalo de confianza para la media poblacional. Asuma un nivel de significancia igual al 5%.
µ ∈ x ± z ×
c)
σ
15,6525 → µ ∈ 1.350 ± 1, 96 × → µ ∈ [1.340, 30;1.359, 70] n 10
Construya el intervalo de confianza para la media poblacional. Asuma un nivel de significancia igual al 10%.
µ ∈ x ± z ×
11)
Estadística inferencial: Intervalos de confianza
σ
15,6525 → µ ∈ 1.350 ± 1, 645 × → µ ∈ [1.341, 86;1.358,14] 10 n
Confeccione una hoja Excel que replique los resultados obtenidos en la pregu nta anterior. La hoja de Excel con el desarrollo del ejercicio anterior se llama “capitulo5_ ejercicio10_Z.xlsx”.
59
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
12)
¿Es cierto que conforme los grados de libertad de la distribución t de Student se incrementan, la distribución tenderá hacia una distribución normal? Correcto.
13)
Trabaje con los datos de la pregunta 10. Suponga que no se conoce la varianza poblacional. En este caso, lo que se hace es calcular la media y la varianza muestral. Los valores estimados son 245 y 49 para la media y la varianza muestral, respectivamente. Basados en esta información: La solución de este ejercicio usando Excel se llama “capitulo5_ejercicio13_t.xlsx” a)
Construya el intervalo de confianza para la media poblacional. Asuma un nivel de significancia igual al 5%:
µ ∈ x ± t (10−1) ×
b)
7 → µ ∈ 245 ± 2, 2622 × → µ ∈[239, 9925; 250, 0075] n 10
Construya el intervalo de confianza para la media poblacional. Asuma un nivel de significancia igual al 10%:
µ ∈ x ± t (10−1) ×
60
s
s
7 → µ ∈ 245 ± 1, 8331× → µ ∈ [240, 9422; 249, 0578] 10 n
CAPÍTULO 5
14)
Estadística inferencial: Intervalos de confianza
¿En esta última pregunta, se puede verificar que la amplitud de los intervalos de confianza se incrementa conforme se incrementan los niveles de confianza deseados? Correcto. Se puede apreciar que la amplitud del primer intervalo (95%) es mayor que el segundo (90%).
15)
Se sabe que el número de horas semanales trabajadas por los empleados de una determinada empresa siguen una distribución normal. Se tomó una muestra de 50 empleados y se obtuvo la media y la desviación estándar muestral, que son iguales a 45 y 2,7, respectivamente. En base a esta información responda: a)
¿Cuál es el estimador puntual de la media poblacional? El estimador puntual es 45.
b)
Construya el intervalo de confianza para la media poblacional. Asuma un nivel de significancia igual al 5%.
µ ∈ x ± t (50−1) ×
c)
2,7 → µ ∈ 45 ± 2, 01× → µ ∈ [44, 2327; 45, 7673] n 50
Construya el intervalo de confianza para la media poblacional. Asuma un nivel de significancia igual al 10%.
µ ∈ x ± t (50−1) ×
16)
s
s
2, 7 → µ ∈ 45 ±1, 68 × → µ ∈ [44, 3598; 45, 6402] n 50
Resuelva la pregunta 15 usando Excel. Resuelto en “capitulo5_ejercicio15_t.xlsx”.
61
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
17)
Dada las siguientes observaciones de una muestra proveniente de una población distribuida aproximadamente como una normal, construya el intervalo de confianza para la media poblacional considerando un nivel de confianza del 99%: 22, 31, 28, 22, 29, 25, 30, 24, 26, 29. Esta pregunta se encuentra resuelta en la hoja Excel “capitulo5_ejercicio17_t.xlsx”. La media muestral es igual a 26,60 y la desviación estándar igual a 3,27. Por lo tanto, el intervalo de confianza será:
3,27
10
µ ∈ 26, 60 ± 3, 2498 ×
18)
62
→ µ ∈ [ 23, 2366; 29, 9634 ]
Para ver la dificultad de un examen para la certificación de analistas financieros, se testeó el banco de preguntas con 50 estudiantes de doctorado en finanzas. Estos estudiantes requirieron en promedio 45 minutos para resolver el examen, con una desviación estándar de 3,5 minutos. Se supone que el tiempo de demora en resolver el examen se distribuye como una normal. Construya el intervalo de confianza de 95% para la media poblacional del tiempo que tardan los estudiantes de doctorado en resolver este examen.
CAPÍTULO 5
3,5
50
µ ∈ 45 ± 2, 0096 × 19)
Estadística inferencial: Intervalos de confianza
→ µ ∈ [ 44, 0053; 45,9947]
¿Cuáles son las condiciones para que la aproximación de la binomial mediante la distribución normal sea adecuada? La distribución binomial es adecuadamente aproximada usando la distribución normal cuando la probabilidad de suceso (p) es cercana a 0,5 o cuando n es bastante grande. En general, esta aproximación será buena si se cumple que (n × p ≥ 5) y [n × (1 – p) ≥ 5].
20)
Se hizo una encuesta sobre la intención de voto hacia un determinado candidato. Las posibles respuestas eran a favor y en contra. El tamaño de la muestra fue de 500 personas, de las cuales 342 dijeron que estaban a favor del candidato. Primero, se tiene que verificar que las condiciones para usar la distribución normal para aproximar la distribución binomial son satisfechas: n × p ≥ 5
→ (500) × (0,684) = 342 > 5
[n × (1- p) ≥ 5
→ (500) × (1 − 0,684) = 158 > 5
Por lo tanto, se podrá resolver este ejercicio usando las técnicas presentadas en el capítulo 5. a)
¿Cuál es el valor de la proporción muestral? p = 342/500 = 0,684
b)
Construya el intervalo de confianza del 90% para la proporción poblacional (π) definida como la proporción de los encuestados que votarían por el candidato. La media de la distribución binomial está dada por: p = E ( p ) = p = 0, 684
El error estándar está dado por: σ p =
p × (1 − p ) n
=
0, 684 × (1 − 0, 684) 500
= 0,0208
Por lo tanto, el intervalo de confianza será:
π ∈ p ± z
c)
p × (1 − p ) n
→ π ∈ [ 0,684 ± 1,645 × 0,0208] → π ∈ [0,6498;0,7182 ]
Basado en el intervalo obtenido y si se sabe que el candidato requiere del 51% de los votos para ser elegido, ¿se puede estar casi seguros que el candidato será elegido en estas elecciones? Sí, el 51% cae dentro del intervalo de confianza mostrado en la pregunta anterior.
63
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
21)
Se quiere determinar la proporción de clientes que compran menos de 10 unidades de un determinado producto en un mes. Se tiene una relación de clientes (identificados por un código único) de la cual se toma una muestra de 100 clientes. En esta muestra se determina que 35 personas compraron menos de 10 productos en un determinado mes. Se puede demostrar que las condiciones para la aproximación de la binomial usando la normal se satisfacen. a)
¿Cuál es el valor de la proporción muestral? p = 35/100 = 0,35
b)
Construya el intervalo de confianza del 95% para la proporción poblacional (π) definida como la proporción de los clientes que compraron menos de 10 unidades del producto en un mes. La media de la distribución binomial está dada por: p = E ( p ) = p = 0, 35
El error estándar está dado por: σ p =
p × (1 − p )
=
n
0, 35 × (1 − 0, 35) 100
= 0,0477
Por lo tanto, el intervalo de confianza será:
p × (1 − p)
n
π ∈ p ± z
22)
→ π ∈ [ 0, 35 ± 1, 96 × 0, 0477] → π ∈ [ 0, 2 565; 0, 4435]
Siga con la pregunta anterior, si la lista de clientes contiene una relación de 500 clientes: a)
¿Cómo afecta esto los cálculos de la estimación de los intervalos de confianza? En este caso, se conoce N (el tamaño de la población). Por lo tanto, se debe verificar si se tiene el problema de tamaño de población finita: n ≥ 0,05 × N; en este caso efectivamente el tamaño de la muestra (100) es mayor que el 5% del tamaño de la población (0,05 × 500 = 25). Se observa que se tiene el problema de tamaño de población finita y se debe ajustar el error estándar.
b)
Construya el intervalo de confianza del 95% para la proporción poblacional (π) definida como la proporción de los clientes que compraron menos de 10 unidades del producto en un mes, ajustando la fórmula por tamaño poblacional pequeño.
p × (1 − p)
n
π ∈ p ± z ×
×
N −n
500 − 100 → ∈ ± × × 0,35 1,96 0,0477 π N − 1 500 − 1
π ∈ [ 0,35 ± 1,96 × 0,0477 ×0,8953 ] → π ∈ [0,2663;0,4337 ]
64
CAPÍTULO 5
c)
23)
Compare estos resultados con lo obtenidos en la pregunta anterior. En este último caso el intervalo de confianza es más pequeño, como consecuencia del factor de ajuste del error estándar.
Un analista financiero desea determinar los ingresos promedio de ventas de las líneas aéreas durante la temporada alta anterior y que operan en una determinada región. Se conoce que la desviación estándar de todos los ingresos es σ = 300 U.M. El analista desea que el margen de error sea como máximo de 50 U.M., es decir, que se desea que la media poblacional como máximo esté a 50 U.M. de la media poblacional. Si el nivel de confianza deseado es del 95%, ¿Cuál será el número de ingresos que necesitará recolectar? n=
24)
Estadística inferencial: Intervalos de confianza
z 2 × σ
2
→n=
e2
1,962 × 300
2
= 138,30 ≅ 139
502
Si en la pregunta anterior se desea un error máximo de 25 U.M., ¿cuál es el efecto de reducir el error máximo deseado? y ¿cuál será el número de ingresos que necesitará recolectar? El efecto de reducir el error máximo deseado hará que el tamaño de la muestra requerida se incremente. n=
25)
z 2 × σ e2
2
→n=
1,962 × 300 252
2
= 553,19 ≅ 554
Si en la pregunta 23 se sabe además que en la región operan 30 líneas aéreas, ¿cuál será el número de ingresos por línea aérea que necesitará recolectar? En este caso se tiene un tamaño de población finita, por lo que se debe ajustar la fórmula para considerar esto. 3002 σ 2 n= 2 = = 24,65 ≅ 25 e 502 3002 σ 2 + + z 2 N 1, 962 30
26)
Utilice Excel para resolver la pregunta 23. Desarrollado en hoja Excel “capitulo5_ejercicio23_tamano_muestra.xlsx”.
65
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
27)
Se desea realizar una encuesta para determinar la factibilidad de poner una cafetería en el campus de una determinada universidad. Si se determina que existe una proporción significativa de estudiantes interesados se pondrá en marcha el proyecto. Se desea que el error máximo de la proporción muestral sea de 0,03 y el nivel de confianza igual al 95%, ¿cuál será el número de estudiantes a entrevistar? Como no se conoce un valor aproximado de p, se utilizará 0,5 como valor de p. n=
28)
e
2
1, 96 2 × 0, 5 × (1 − 0, 5) = = 1.067,11 ≅ 1.068 0,032
Prosiga con la pregunta 27. Si antes de la realización de la encuesta se hace una prueba piloto y se determina que la muestra proporcional de este piloto es 0,6; dado un nivel de confianza del 95%, ¿cuál será el número de estudiantes a entrevistar? n=
29)
2 z × p × (1 − p )
2 z × p × (1 − p )
e2
1, 96 2 × 0, 6 × (1 − 0, 6) = = 1.024,43 ≅ 1.025 0,032
Continúe con la pregunta 27. Si el número total de estudiantes de la universidad es igual a 1.000, ¿cuál será el número de estudiantes a entrevistar? En este caso se debe ajustar la fórmula para considerar el tamaño de población finita. n=
66
0,5 × (1 − 0,5) = 516, 23 ≅ 517 0, 032 0, 5 × (1 − 0, 5) + 1,962 1.000
CAPÍTULO
6 Estadística inferencial: Pruebas de hipótesis para la media 1)
¿Cuáles son las características que deben de satisfacer: la hipótesis nula y la alternativa? Deben de ser mutuamente exclusivas y exhaustivas.
2)
Se tienen las siguientes hipótesis, señale las que están correctamente estructuradas en base a su respuesta de la pregunta anterior: a) b) c) d) e)
H0: µ = 20; H0: µ < 20; H0: µ > 20; H0: µ > 20; H0: µ > 20;
H1: µ ≠ 20. H1: µ > 20. H1: µ ≤ 20. H1: µ ≤ 19. H1: µ ≥ 20.
Las respuestas correctas son: a) y c). 3)
¿Cuál es la regla de decisión basada en los valores críticos para una hipótesis no direccional? Rechazar la hipótesis nula si el valor del test estadístico cae a la derecha o izquierda de los valores críticos.
4)
¿Qué es el p-valor y cuál es la regla para rechazar la hipótesis nula? Si el p-valor es menor que la significancia estadística, rechazar la hipótesis nula.
67
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
5)
¿Es posible que la decisión usando el criterio del valor crítico sea diferente a la decisión alcanzada con el p-valor? No.
6)
Un juez realiza sus decisiones pensando que es mejor dejar libre a una persona culpable que enviar a la cárcel a una persona inocente. ¿Qué tipo de error estadístico (tipo I o tipo II) es el que utiliza al momento de decidir? Suponga que la hipótesis nula es que la persona es culpable. El error tipo I: Probabilidad de rechazar la hipótesis nula cuando esta es correcta.
7)
Se tiene una población que se distribuye como una normal con desviación estándar poblacional (σ ) igual a 3. Se toma una muestra de 15 elementos de esta población y se calcula la media muestral, la cual es igual a 16. Siga los pasos señalados en el capítulo y realice la siguiente prueba de hipótesis, asumiendo que el nivel de confianza es del 95%: a)
H0: µ = 17; H1: µ ≠ 17. Paso 1: Determinar el valor de z: En este caso se emplea Excel y se obtiene z = 1,96 y z = −1,96. Se advierte que este valor es conocido como el valor crítico de la hipótesis. Paso 2: Calcular es z-test: z − test =
16 − 17 3
15
= −1,29
Paso 3: Ubicar z-test y concluir:
Como el z-test está entre los valores críticos, no se rechaza la hipótesis nula. b)
Grafique y muestre claramente las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
Rechazar
-1,29
-4
68
-3
-1.96
-2
-1
0
1
1.96
2
3
4
CAPÍTULO 6
Estadística inferencial: Pruebas de hipótesis para la media
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está entre los valores críticos, no se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? El p-valor (la probabilidad asociada al z-test) es igual a:
P-valor = 0,098525 × 2 = 0,197051 Por lo tanto, como este valor es mayor que 0,05 (el nivel de significancia), no se rechazará la hipótesis nula.
e)
Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir si rechaza o no la hipótesis nula.
3
15
µ ∈ 16 ± 1,96 ×
→ µ ∈ [14, 4818;17, 5182 ]
Efectivamente 17 puede ser el valor de la media poblacional. 8)
Los beneficios antes de impuestos (en miles de U.M.) de las empresas del sector minero de un determinado país, se distribuyen como una normal con desviación estándar poblacional conocida e igual a 150. Se tomó una muestra de 25 Estados de Ganancias y Pérdidas, de las que se extrajeron los beneficios antes de impuestos y se tomó el promedio. Dicho promedio muestral es igual a 1.240. Suponiendo un nivel de confianza del 90%, realice la siguiente prueba de hipótesis: a)
H0: µ = 1.300;
H1: µ ≠ 1.300.
Paso 1: Determinar el valor de z:
En este caso se utiliza Excel y se obtiene z = 1,645 y z = −1,645. Se advierte que este valor es conocido como el valor crítico de la hipótesis. Paso 2: Calcular es z-test: z − test =
1.240 − 1.300 150
25
= −2,00
Paso 3: Ubicar z-test y concluir:
Como el z-test está a la izquierda del valores crítico z = −1,645, se rechaza la hipótesis nula.
69
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Grafique y muestre claramente las zonas de rechazo de la hipótesis nula. Rechazar
-4
-3
No rechazar
-2
-1,645
-1
0
Rechazar
1
1,645
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la izquierda del valores crítico z = −1,645, se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Se calcula con Excel y se obtiene el siguiente valor crítico relacionado con el z-test:
P-valor = 0,02275 × 2 = 0,0455 Como el p-valor es menor que el nivel de significancia (0,10), se rechaza la hipótesis nula. Recuerde que se multiplica por dos porque se está trabajando con una prueba no direccional.
e)
Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir si rechaza o no la hipótesis nula.
150
25
µ ∈ 1.240 ± 1, 645 ×
→ µ ∈ [1.190, 65;1.289, 35 ]
Como se puede apreciar 1.300 no se encuentra en este intervalo, por lo que se rechaza la hipótesis nula. 9)
Basado en la pregunta 8, para un nivel de confianza del 95%, realice la siguiente prueba de hipótesis: a)
H0: µ > 1.500;
H1: µ ≤ 1.500.
Paso 1: Determinar el valor de z.
En este caso se emplea Excel y se obtiene z = −1,645. Recuerde que en este caso la región de rechazo se encuentra a la izquierda, por lo que solo se considera el valor crítico en esta cola.
70
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
Paso 2: Calcular es z-test. z − test =
1.240 − 1.500 150
25
= −8,6667
Paso 3: Ubicar z-test y concluir.
Como el z-test está a la izquierda del valor crítico z = −1,645, se rechaza la hipótesis nula. b)
Grafique y muestre claramente las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
-8,6667
-4
-3
-1.645
-2
-1
0
1
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la izquierda del valor crítico z = −1,645, se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Al utilizar Excel se obtiene el siguiente valor crítico relacionado con el z-test:
P-valor = 0,0000 Como el p-valor es menor que el nivel de significancia (0,05), se rechaza la hipótesis nula.
10)
Con los datos de la pregunta 8, para un nivel de confianza del 99%, realice la siguiente prueba de hipótesis: a)
H0: µ < 1.100;
H1: µ ≥ 1.100.
Paso 1: Determinar el valor de z:
En este caso se usa Excel y se obtiene z = 2,326. Recuerde que en este caso la región de rechazo se encuentra a la derecha, por lo que solo se considera el valor crítico en esta cola.
71
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Paso 2: Calcular es z-test: z − test =
1.240 − 1.100 150
25
= 4,6667
Paso 3: Ubicar z-test y concluir:
Como el z-test está a la derecha de valor crítico z = 2,326, se rechaza la hipótesis nula. b)
Grafique y muestre claramente las zonas de rechazo de la hipótesis nula. No rechazar
Rechazar
4,6667
-4
-3
-2
-1
0
1
2,326
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la derecha de valor crítico z = 2,326, se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Al utilizar Excel se obtiene el siguiente valor crítico relacionado con el z-test:
P-valor = 0,9999 Como el p-valor es mayor que el nivel de significancia (0,01), se rechaza la hipótesis nula.
11)
Se tiene el registro de la velocidad de los vehículos que pasan por un determinado cruce peatonal. Se supone que la máxima velocidad permitida es de 15km/hora. Se toma una muestra de 100 vehículos y se calcula la media y la varianza muestral, que son iguales a 18 km/hora y 4 km/hora, respectivamente. Para un nivel de confianza del 95% realice la siguiente prueba de hipótesis: a)
72
H0: µ = 15; H1: µ ≠ 15. En primer lugar, advierta que la desviación estándar poblacional no es conocida. Por lo tanto, se utilizará la prueba t.
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
Paso 1: Determinar el valor de t.
Con la ayuda de Excel, se obtienen los valores críticos de la prueba: t = 2,276 y t = −2,276. Paso 2: Calcular es t-test. t − test =
18 − 15 2
100
= 15
Paso 3: Ubicar z-test y concluir.
Como el t-test está a la derecha de valor crítico z = 2,276, se rechaza la hipótesis nula. b)
Grafique y marque claramente las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
Rechazar
15
-4
-3
-2,276
-2
-1
0
1
2
2,276
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el t-test está a la derecha de valor crítico t = 2,276, se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Cuando se utiliza Excel se obtiene el siguiente valor crítico relacionado con el t-test:
P-valor = 0,0000 × 2 = 0,0000 Como el p-valor es menor que el nivel de significancia (0,05), se rechaza la hipótesis nula. Recuerde que se multiplica por dos porque se está trabajando con una prueba no direccional.
e)
Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir si rechaza o no la hipótesis nula.
µ ∈ 18 ± 2,326 x
2
→ µ ∈ [17,5348;18, 4652 ] 100
73
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Como se puede apreciar 15 no se encuentra en este intervalo, por lo que se rechaza la hipótesis nula. f)
12)
Nótese que en este caso no se asume que esta población se distribuya como una normal. ¿Es este supuesto necesario a la luz del teorema del límite central? Este supuesto no es necesario a la luz del teorema del límite central ya que el número de observaciones en la muestra es mayor que 30.
Con los datos de la pregunta 11, para un nivel de confianza del 95%, realice la siguiente prueba de hipótesis: a)
H0: µ > 20; H1: µ ≤ 20: Paso 1: Determinar el valor de t. En este caso se emplea Excel y se obtiene t = −1,9842. Recuerde que en este caso la región de rechazo se encuentra a la izquierda, por lo que solo se considera el valor crítico en esta cola. Paso 2: Calcular es t-test: t − test =
18 − 20 2
100
= −10
Paso 3: Ubicar z-test y concluir:
Como el t-test está a la izquierda del valor crítico t = −1,9842, se rechaza la hipótesis nula. b)
Grafique y muestre claramente las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
-10
-4
c)
74
-3
-1,9842
-2
-1
0
1
2
3
4
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el t-test está a la izquierda del valor crítico t = −1,9842, se rechaza la hipótesis nula.
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Se emplea Excel y se obtiene el siguiente valor crítico relacionado con el t-test:
P-valor = 0, 0000 Como el p-valor es menor que el nivel de significancia (0,05), se rechaza la hipótesis nula.
13)
Si se tienen los datos de la pregunta 11, para un nivel de confianza del 99%, realice la siguiente prueba de hipótesis: a)
H0: µ < 10; H1: µ ≥ 10: Paso 1: Determinar el valor de t. En este caso se usa Excel y se calcula el valor t = 2,6264. Recuerde que en este caso la región de rechazo se encuentra a la derecha, por lo que solo se considera el valor crítico en esta cola. Paso 2: Calcular es t-test. t − test =
18 − 10 2
100
= 40
Paso 3: Ubicar z-test y concluir.
Como el t-test está a la derecha del valor crítico t = 2,6264, se rechaza la hipótesis nula. b)
Grafique y señale claramente las zonas de rechazo de la hipótesis nula. No rechazar
Rechazar
40
-4
c)
-3
-2
-1
0
1
2
2,6264
3
4
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el t-test está a la derecha del valor crítico t = 2,6264, se rechaza la hipótesis nula.
75
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Se usa Excel se obtiene el siguiente valor crítico relacionado con el t-test:
P-valor = 0, 0000
Como el p-valor es menor que el nivel de significancia (0,01), se rechaza la hipótesis nula. Si se cuenta con la información sobre los precios de tickets aéreos desde la ciudad A hasta la ciudad B, ofrecida por todas las líneas aéreas que prestan servicio entre dichas ciudades. Se supone que la población de precios se distribuye como una normal con desviación estándar conocida e igual a 20 U.M. Se toma arbitrariamente una muestra de 25 precios cuya media muestral es igual a 180 U.M. Si el nivel de confianza deseado es del 99%, pruebe la siguiente hipótesis: e)
14)
a)
H0: µ = 160; H1: µ ≠ 160: Paso 1: Determinar el valor de z. En este caso se usa Excel y se logra z = 2,326 y z = −2,326. Paso 2: Calcular es z-test: z − test =
180 − 160 20
25
= 5,00
Paso 3: Ubicar z-test y concluir:
Como el z-test está a la derecha del valores crítico z = 2,326, se rechaza la hipótesis nula. b)
Grafique y señale claramente las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
Rechazar
5
-4
c)
76
-3
-2,326
-2
-1
0
1
2
2,326
3
4
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la derecha del valores crítico z = 2,326, se rechaza la hipótesis nula.
CAPÍTULO 6
Estadística inferencial: Pruebas de hipótesis para la media
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? Se utiliza Excel para obtener el siguiente valor crítico relacionado con el z-test:
P-valor = 0,0000 × 2 = 0,0000 Como el p-valor es menor que el nivel de significancia (0,01), se rechaza la hipótesis nula. Recuerde que se multiplica por dos porque se está trabajando con una prueba no direccional.
e)
Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir si rechaza o no la hipótesis nula.
20 180 2, 326 170, 696;189, 304 25
Como se puede apreciar 160 no se encuentra en este intervalo, por lo que se rechaza la hipótesis nula. f)
15)
Nótese que en este caso se supuso que esta población se distribuía como una normal. ¿Es este supuesto necesario a la luz del teorema del límite central? Sí, porque el tamaño de la muestra es menor que 30. Por lo tanto si no se asume que la población es normal, no se podría haber resuelto el problema con las técnicas enseñadas en el capítulo 6.
Con base en la pregunta 14, para un nivel de confianza del 95%, realice la siguiente prueba de hipótesis: a)
H0: µ > 190; H1: µ ≤ 190: Paso 1: Determinar el valor de z. En este caso se tiene una prueba de hipótesis direccional con el área de rechazo a la izquierda. Se utiliza Excel y se calcula z = −1,645. Paso 2: Calcular es z-test. z − test =
180 − 190 20
25
= −2,50
Paso 3: Ubicar z-test y concluir:
Como el z-test está esta a la izquierda del valor crítico z = −1,645, se rechaza la hipótesis nula.
77
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Grafique e indique las zonas de rechazo de la hipótesis nula. Rechazar
-4
-3
-2,50
No rechazar
-1,645
-2
-1
0
1
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test (−2,50) está a la izquierda del valor crítico z = −1,645, se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,00621
Este valor es menor que el nivel de significancia estadístico (0,05), por lo que se rechaza la hipótesis nula. 16)
Basado en la pregunta 14, para un nivel de confianza del 99%, efectúe la siguiente prueba de hipótesis: a)
H0: µ < 150; H1: µ ≥ 150. Paso 1: Determinar el valor de z. En este caso se tiene una prueba de hipótesis direccional con el área de rechazo a la derecha. Se emplea Excel y se obtiene z = 2,326. Paso 2: Calcular es z-test. z − test =
180 − 150 20
25
= 7,50
Paso 3: Ubicar z-test y concluir.
Como el z-test está a la derecha del valor crítico z = 2,326, se rechaza la hipótesis nula.
78
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
b)
Grafique e indique las zonas de rechazo de la hipótesis nula. No rechazar
Rechazar
7,50
-4
c)
-3
-2
-1
0
1
2
2,326
3
4
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test (7,50) está a la derecha del valor crítico z = 2,326, se rechaza la hipótesis nula.
d) En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula?
P-valor = 0,000 Este valor es menor que el nivel de significancia estadístico (0,01), por lo que se rechaza la hipótesis nula.
17)
Se realizó una serie de “focus groups” para determinar el nivel de aprobación del sabor de un nuevo producto que se desea introducir al mercado. Las opciones presentadas fueron: aprueba el sabor o no la aprueba. El número total de personas participantes en los grupos de discusión fue de 170, de las cuales 103 aprobaron el sabor. Si se supone que éxito es la aprobación del sabor y un nivel de significancia estadístico del 5%, responda las siguientes preguntas y realice la siguiente hipótesis: a)
¿Cuál es el valor de la proporción muestral de los sucesos? p =
b)
103 170
= 0,61
¿Se puede emplear la aproximación de la binomial usando la normal? (compruebe la condiciones necesarias para que esto sea cierto). Las condiciones son: (n × p) ≥ 5 y [n × (1 − p)] ≥ 5. Por lo tanto, como 170 × (0,61) = 103,7 ≥ 5 y 170 × (1 − 0,61) = 66,3 ≥ 5, las condiciones son satisfechas para usar la aproximación normal.
c)
H0: π = 0,60; H1: π ≠ 0,60: Paso 1: Determinar el valor de z.
79
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
En este caso se tiene una prueba de hipótesis no direccional con áreas de rechazo a ambos lados de la distribución. Se emplea Excel y se obtiene z = 1,96 y z = −1,96. Paso 2: Calcular es z-test. z − test =
0, 61 − 0, 60 0,61× (1 − 0, 61) 170
=
0, 01 = 0,27 0,037
Paso 3: Ubicar z-test y concluir.
Como el z-test está entre los valores crítico z = 1,96 y z = −1,96, no se rechaza la hipótesis nula. d)
Grafique y muestre las zonas de rechazo de la hipótesis nula. Rechazar
-4
-3
No rechazar
-1,96
-2
-1
0
0,27
Rechazar
1
2
1,96
3
4
e)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está entre los valores crítico z = 1,96 y z = -1,96, no se rechaza la hipótesis nula.
f)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,39358 × 2 = 0,78716
Este valor es mayor que el nivel de significancia estadístico (0,05), por lo que no se rechaza la hipótesis nula. g)
Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir si rechaza o no la hipótesis nula. El valor de z para un nivel de confianza del 95% es igual a 1,96, por lo que el intervalo de confianza para la proporción poblacional será:
π ∈ 0, 61 ± 1, 96
80
0,61 × (1 − 0, 61) 170
→ π ∈ [0,5367; 0, 6833 ]
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
De nuevo, el valor de la hipótesis nula 0,60, cae en este intervalo por lo que la hipótesis nula no se puede rechazar. 18)
Tome los datos de la pregunta 17 y para un nivel de confianza del 95%, realice la siguiente prueba de hipótesis: a)
H0: π > 0,50; H1: π ≤ 0,50. Paso 1: Determinar el valor de z. En este caso se tiene una prueba de hipótesis direccional con el área de rechazo a la izquierda. Se utiliza Excel y se obtiene z = −1,645. Paso 2: Calcular es z-test. z − test =
0, 61 − 0,50 0, 61× (1 − 0, 61) 170
=
0,11 = 2,97 0,037
Paso 3: Ubicar z-test y concluir.
Como el z-test está a la derecha del valor crítico z = −1,645, no se rechaza la hipótesis nula. b)
Grafique y señale las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
2,97
-4
-3
-1,645
-2
-1
0
1
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la derecha del valor crítico z = −1,645, no se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,9985
Este valor es mayor que el nivel de significancia estadístico (0,05), por lo que no se rechaza la hipótesis nula.
81
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
19)
Parta de los datos de la pregunta 17, para un nivel de confianza del 99%, haga la siguiente prueba de hipótesis: a)
H0: π < 0,70; H1: π ≥ 0,70: Paso 1: Determinar el valor de z. En este caso se tiene una prueba de hipótesis direccional con el área de rechazo a la derecha. Se usa Excel y se obtiene z = 2,326. Paso 2: Calcular es z-test. z − test =
0, 61 − 0, 70 0, 61× (1 − 0, 61) 170
=
−0, 09 0,0374
= −2,4064
Paso 3: Ubicar z-test y concluir.
Como el z-test está a la izquierda del valor crítico z = 2,326, no se rechaza la hipótesis nula. b)
Represente gráficamente y muestre las zonas de rechazo de la hipótesis nula. No rechazar
-4
-2,4064
-3
-2
-1
Rechazar
0
1
2,326
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la izquierda del valor crítico z = 2,326, no se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,9925
Este valor es mayor que el nivel de significancia estadístico (0,01), por lo que no se rechaza la hipótesis nula.
82
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
20)
En los últimos 3 ciclos académicos, el 60% de estudiantes del doctorado en finanzas aprobaron al primer intento el examen del curso de métodos cuantitativos. Si la presente clase tiene 35 estudiantes, con un nivel de confianza del 95%, responda las siguientes preguntas y realice la siguiente hipótesis: a)
¿Se puede utilizar la aproximación de la binomial empleando la normal (compruebe la condiciones necesarias para que esto sea cierto)? Las condiciones son: (n × p) ≥ 5 y [n × (1 − p)] ≥ 5. Por lo tanto, como 35 × (0,60) = 21 ≥ 5 y 35 × (1 − 0,60) = 14 ≥ 5, las condiciones son satisfechas para usar la aproximación normal.
b)
La proporción de estudiantes de la presente clase que aprobará el examen de métodos cuantitativos en el primer intento será igual al 70%. H0: π = 0,70; H1: π ≠ 0,70. Paso 1: Determinar el valor de z.
En este caso se tiene una prueba de hipótesis no direccional con áreas de rechazo a ambos lados de la distribución. Se emplea Excel y se obtiene z = 1,96 y z = −1,96. Paso 2: Calcular es z-test. z − test =
0, 60 − 0, 70 0,60 × (1 − 0,60) 35
=
−0,10 0,0828
= −1, 2077
Paso 3: Ubicar z-test y concluir.
Como el z-test está entre los valores crítico z = 1,96 y z = −1,96, no se rechaza la hipótesis nula. c)
Interprete gráficamente y señale las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
Rechazar
-1,2077
-4
-3
-1,96
-2
-1
0
1
2
1,96
3
4
83
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está entre los valores crítico z = 1,96 y z = −1,96, no se rechaza la hipótesis nula.
e)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,1131 × 2 = 0,2263
Este valor es mayor que el nivel de significancia estadístico (0,05), por lo que no se rechaza la hipótesis nula. f)
Construya el intervalo de confianza respectivo y utilícelo como criterio para decidir si rechaza o no la hipótesis nula. El valor de z para un nivel de confianza del 95% es igual a 1,96, por lo que el intervalo de confianza para la proporción poblacional será:
π ∈ 0, 60 ± 1,96
0,60 × (1 − 0,60)
→ π ∈ [0, 4377; 0, 7623 ]
35
De nuevo 0,70 (el valor de la hipótesis nula) cae en este intervalo por lo que la hipótesis nula no se puede rechazar. 21)
Parta de los datos de la pregunta 20, para un nivel de confianza del 95%, realice la siguiente prueba de hipótesis: a) La proporción de estudiantes de la presente clase que aprobará el examen de métodos cuantitativos en el primer intento será mayor al 60%. H0: π > 0,60;
H1: π ≤ 0,60.
Paso 1: Determinar el valor de z.
En este caso se tiene una prueba de hipótesis direccional con área de rechazo a la izquierda. Se usa Excel y se obtiene z = −1,645. Paso 2: Calcular es z-test. z − test =
0, 60 − 0, 60 0,60 × (1 − 0,60) 35
=
0, 00 = 0,00 0,0828
Paso 3: Ubicar z-test y concluir.
Como el z-test está a la derecha del valor crítico z = −1,645, no se rechaza la hipótesis nula.
84
Estadística inferencial: Pruebas de hipótesis para la media
CAPÍTULO 6
b)
Realice el gráfico y muestre las zonas de rechazo de la hipótesis nula. Rechazar
No rechazar
0,00
-4
-3
-1,645
-2
-1
0
1
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la derecha del valor crítico z = −1,645, no se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,50
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipótesis nula. 22)
Basado en la pregunta 20, para un nivel de confianza del 99%, efectúe la siguiente prueba de hipótesis: a)
La proporción de estudiantes de la presente clase que aprobará el examen de métodos cuantitativos en el primer intento será de no más del 50%. H0: π ≤ 0,50; H1: π > 0,50. Paso 1: Determinar el valor de z.
En este caso se tiene una prueba de hipótesis direccional con área de rechazo a la derecha. Se emplea Excel y se calcula z = 2,326. Paso 2: Calcular es z-test. z − test =
0, 60 − 0,50 0,60 × (1 − 0,60) 35
=
0,10 = 1, 2077 0,0828
Paso 3: Ubicar z-test y concluir.
Como el z-test está a la izquierda del valor crítico z = 2,326, no se rechaza la hipótesis nula.
85
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Grafque y señale las zonas de rechazo de la hipótesis nula. No rechazar
-4
-3
-2
-1
Rechazar
0
-1,2077
1
2,326
2
3
4
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el z-test está a la izquierda del valor crítico z = 2,326, no se rechaza la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,11
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipótesis nula.
86
CAPÍTULO
7 Estadística inferencial: Aplicaciones de la chi cuadrada 1)
Se tiene una población distribuida normalmente y de la cual se toma una muestra de 20 elementos. Se calcula la desviación estándar muestral, obteniéndose s = 3,5. Si se supone un nivel de confianza del 95%, realice la siguiente prueba de hipótesis de la varianza poblacional: El documento de Excel que acompaña a este ejercicio se llama “ capitulo7_ejercicio1_ chi_valores_criticos.xlsx”. a)
H0: σ 2 = 11; H1: σ 2 ≠ 11: Paso 1: Determinar el valor de chi cuadrada. Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. Por 2 lo tanto, para hallar el χ inf se tendrá que usar CHIINV(0,025;19) y para determinar 2 χ sup CHIINV(0,975;19), donde 19 corresponde a los grados de libertad de este ejemplo (n − 1 = 20 − 1 = 19). Los valores críticos que se obtendrán con Excel son 8,9065 y 32,8523, para el valor inferior y superior, respectivamente. Estos valores se encuentran en la hoja “chi_cuadrada_tabla de valores”. Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener el estadístico.
87
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
χ − test = 2
(n − 1) × s 2 σ 02
=
(20 − 1) × 3,52 11
= 21,1591
Paso 3: Ubicar el chi-test y concluir.
Se recuerda que se está trabajando con una prueba no direccional y que, por lo tanto, se tendrán dos aéreas de rechazo. Como se puede observar el chi-test cae en medio de ambos valores críticos, por lo que no se rechazará la hipótesis nula. b)
Grafique y muestre claramente las zonas de rechazo de la hipótesis nula.
α /2 = 0,025
α/2 = 0,025
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se puede observar el chi-test cae en medio de ambos valores críticos, por lo que no se rechazará la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,6561
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipótesis nula. e)
Construya el intervalo de confianza para la varianza poblacional y utilícelo para rechazar o no la hipótesis nula. (20 − 1) × (3, 52 ) 32,8523
88
≤σ ≤ 2
(20 − 1) × (3, 52 ) 8, 9065
→ 7, 085 ≤ σ 2 ≤ 26,133
CAPÍTULO 7
Estadística inferencial: Aplicaciones de la chi cuadrada
Como se puede apreciar el valor de la hipótesis nula (11) cae dentro del intervalo de confianza, por lo que no se rechaza la hipótesis nula. 2)
Basado en la pregunta 1, para un nivel de confianza del 90%, realice la siguiente prueba de hipótesis: a)
H0: σ 2 > 14; H1: σ 2 ≤ 14: Paso 1: Determinar el valor de chi cuadrada. Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. En este caso se tiene una prueba direccional con el área de rechazo a la izquierda. Al utilizar Excel se obtiene usando CHIINV(0,90;19). El valor crítico que se obtiene es 11,6509. Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener el estadístico. χ − test = 2
(n − 1) × s 2 σ 02
=
(20 − 1) × 3,52 14
= 16,625
Paso 3: Ubicar el chi-test y concluir.
Como se puede observar el chi-test cae a la derecha del valor crítico, por lo que no se rechazará la hipótesis nula. b)
Grafique y demuestre las zonas de rechazo de la hipótesis nula.
89
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se puede observar el chi-test cae a la derecha del valor crítico, por lo que no se rechazará la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,3847
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipótesis nula. 3)
En base a los datos de la pregunta 1, para un nivel de confianza del 99%, realice la siguiente prueba de hipótesis: a)
H0: σ 2 ≤ 10; H1: σ 2 > 10: Paso 1: Determinar el valor de chi cuadrada. Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. En este caso se tiene una prueba direccional con el área de rechazo a la derecha. Con la utilización de Excel se obtiene usando CHIINV(0,01;19). El valor crítico que se obtiene es 36,1909. Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener el estadístico. (n − 1) × s 2 (20 − 1) × 3,52 χ − test = = = 23,275 σ 02 10 2
Paso 3: Ubicar el chi-test y concluir.
Como se puede observar el chi-test cae a la izquierda del valor crítico, por lo que no se rechazará la hipótesis nula. b)
90
Grafique y muestre las zonas de rechazo de la hipótesis nula.
CAPÍTULO 7
Estadística inferencial: Aplicaciones de la chi cuadrada
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se puede observar el chi-test cae a la izquierda del valor crítico, por lo que no se rechazará la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,2254
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipótesis nula. 4)
Se tienen los balances de todos los bancos que operan en un determinado país. Se ha observado que el valor de los activos sigue una distribución normal. Se toma una muestra de 30 bancos y se calcula la varianza de la muestra. Esta varianza muestral es igual a 459. Con un nivel de confianza del 90% realice la siguiente prueba de hipótesis de la varianza poblacional: El documento de Excel que acompaña a este ejercicio se llama “ capitulo7_ejercicio4_ chi_valores_criticos.xlsx”. a)
H0: σ 2 = 500; H1: σ 2 ≠ 500: Paso 1: Determinar el valor de chi cuadrada. Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. Por 2 lo tanto, para hallar el χ inf se tendrá que usar CHIINV(0,05;29) y para determinar 2 χ sup CHIINV(0,95;29), donde 29 corresponde a los grados de libertad de este ejemplo (n − 1 = 30 − 1 = 29). Los valores críticos que se obtendrán con Excel son 17,7084 y 42,5570, para el valor inferior y superior, respectivamente Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener el estadístico. χ − test = 2
(n − 1) × s 2 σ 02
=
(30 − 1) × 459 500
= 26,622
Paso 3: Ubicar el chi-test y concluir.
Se recuerda que se está trabajando con una prueba no direccional y que, por lo tanto, se tendrán dos aéreas de rechazo. Como se puede observar el chi-test cae en medio de ambos valores críticos, por lo que no se rechazará la hipótesis nula.
91
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Grafique y señale las zonas de rechazo de la hipótesis nula.
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se puede observar el chi-test cae en medio de ambos valores críticos, por lo que no se rechazará la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,8156
Como el p-valor es mayor que el nivel de significancia (0,10), no se rechaza la hipótesis nula. e)
Construya el intervalo de confianza para la varianza poblacional y utilícelo para rechazar o no la hipótesis nula. (30 − 1) × 459 42,5570
≤σ2 ≤
(30 − 1) × 459 17, 7084
→ 312, 7805 ≤ σ 2 ≤ 751, 6772
Como se puede apreciar el valor de la hipótesis nula (500) cae dentro del intervalo de confianza, por lo que no se rechaza la hipótesis nula. 5)
Con los datos de la pregunta 4, para un nivel de confianza del 95%, realice la siguiente prueba de hipótesis: a)
H0: σ 2 > 500; H1: σ 2 ≤ 500: Paso 1: Determinar el valor de chi cuadrada. En este caso se tiene una hipótesis direccional con el área de rechazo a la izquierda. Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. Por 2 lo tanto, para hallar el χ se tendrá que usar CHIINV(0,95;29), donde 29 corresponde a los grados de libertad de este ejemplo (n − 1 = 30 − 1 = 29). El valor crítico que se obtiene con Excel es 17,7084.
92
Estadística inferencial: Aplicaciones de la chi cuadrada
CAPÍTULO 7
Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener el estadístico. χ − test = 2
(n − 1) × s 2 σ 02
=
(30 − 1) × 459 500
= 26,62
Paso 3: Ubicar el chi-test y concluir.
Se recuerda que se está trabajando con una prueba direccional con área de rechazo a la izquierda. Como se puede observar el chi-test cae a la derecha del valor crítico (en la zona de no rechazo), por lo que no se rechazará la hipótesis nula. b) Grafique y muestre claramente las zonas de rechazo de la hipótesis nula.
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Se recuerda que se está trabajando con una prueba direccional con área de rechazo a la izquierda. Como se puede observar el chi-test cae a la derecha del valor crítico (en la zona de no rechazo), por lo que no se rechazará la hipótesis nula.
d)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,4078
Como el p-valor es mayor que el nivel de significancia (0,05), no se rechaza la hipótesis nula. 6)
Basado en la pregunta 4, para un nivel de confianza del 99%, realice la siguiente prueba de hipótesis: a)
H0: σ 2 ≤ 400;
H1: σ 2 > 400: 93
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Paso 1: Determinar el valor de chi cuadrada.
En este caso se tiene una hipótesis direccional con el área de rechazo a la derecha. Se recuerda que Excel provee la probabilidad desde el valor deseado hasta +∞. Por 2 lo tanto, para hallar el χ se tendrá que usar CHIINV(0,01;29), donde 29 corresponde a los grados de libertad de este ejemplo (n − 1 = 30 − 1 = 29). El valor crítico que se obtiene con Excel es 49,5879. Paso 2: Calcular el chi-test.
En este paso simplemente se reemplazan los valores en la ecuación (4) para obtener el estadístico. χ − test = 2
(n − 1) × s 2 σ 02
=
(30 − 1) × 459 400
= 33,2775
Paso 3: Ubicar el chi-test y concluir.
Se recuerda que se está trabajando con una prueba direccional con área de rechazo a la derecha. Como se puede observar el chi-test cae a la izquierda del valor crítico (en la zona de no rechazo), por lo que no se rechazará la hipótesis nula.
94
b)
Grafique y demuestre las zonas de rechazo de la hipótesis nula.
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Se recuerda que se está trabajando con una prueba direccional con área de rechazo a la derecha. Como se puede observar el chi-test cae a la izquierda del valor crítico (en la zona de no rechazo), por lo que no se rechazará la hipótesis nula.
CAPÍTULO 7
d)
Estadística inferencial: Aplicaciones de la chi cuadrada
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,2666 Como el p-valor es mayor que el nivel de significancia (0,01), no se rechaza la hipótesis nula.
7)
Se tiene la siguiente tabla de contingencias que relaciona el género con el aprobar o desaprobar un curso de métodos cuantitativos en una determinada universidad:
Tabla 15 Aprobó Femenino Masculino Totales
Totales
Sí
No
25
14
39
14
9
23
39
23
62
Asuma un nivel de confianza deseado del 95% y realice lo siguiente: a)
Pruebe la siguiente hipótesis: H0: El que un estudiante apruebe el curso es independiente de su género. H1: El que un estudiante apruebe el curso NO es independiente de su género.
Se advierte que en esta tabla el número de filas f = 2 y el número de columnas c = 2. Esta tabla presenta los valores observados ( O ij ). Para calcular el estadístico presentado en la ecuación (6) se tienen que calcular los valores esperados (E ij ). Para esto se necesita calcular p j , lo cual se hace de la siguiente manera: p1 =
39 = 0,6290 62
p2 =
23 62
= 0,3710
Si en realidad las notas obtenidas por género son independientes, 62,90% de alumnos deberían aprobar el examen independientemente de su género. Asimismo, 37,10% de alumnos deberían desaprobar el examen independientemente de su género. Basados en esto, la tabla de valores esperados (usando la ecuación (7)) será:
95
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Tabla 15, a) Marca
Totales
CC
PP
Promoción
0,629 × 39 = 24,53
0,371 × 39 = 14,47
39
No promoción Totales
0,629 × 23 = 14,47
0,371 × 23 = 8,53
23
39
23
62
Si se reemplazan estos valores en la Ecuación (6), se obtendrá: (25 − 24,53) 2 (14 − 14,47) 2 (14 − 14,47) 2 (9 − 8,53) 2 + + + = 0,0654 χ − test = 24, 53 14, 47 14, 47 8,53 2
Para seguir el procedimiento de las pruebas de hipótesis, se necesita conocer el valor crítico de la distribución chi cuadrada con (f − 1) × (c − 1) grados de libertad. En este caso este número será (2 − 1) × (2 − 1) = 1. El nivel de confianza es igual a 0,95, por lo que α será igual a 0,05. Al utilizar Excel, este valor crítico será igual a 3,8415. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Por lo tanto, como el valor del chi-test (0,0654) es menor que el valor crítico, no se rechazará la hipótesis nula de independencia. Lo que significa que, dada la información disponible, el que un alumno apruebe o no el examen es independiente de su género.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,7982
Por lo tanto, como el p-valor es mayor que el nivel de significancia estadístico (0,05), no se rechaza la hipótesis nula. 8)
Se tiene el volumen negociado, durante el último año, de dos acciones similares cotizadas en dos bolsas de valores. Los datos se muestran en la siguiente tabla (los valores están expresados en millones de acciones):
Tabla 16 Bolsa de Valores Acción 1 Acción 2 Totales
96
Totales
A
B
4,1
2,7
6,8
5,2
3,9
9,1
9,3
6,6
15,9
Estadística inferencial: Aplicaciones de la chi cuadrada
CAPÍTULO 7
Asuma un nivel de confianza deseado del 95% y resuelva: a)
Pruebe la siguiente hipótesis: H0: El volumen de negociación es independiente de la Bolsa de Valores donde
se negocia la acción.
H1: El volumen de negociación NO es independiente de la Bolsa de Valores
donde se negocia la acción.
Se advierte que en esta tabla el número de filas f = 2 y el número de columnas c = 2. Esta tabla presenta los valores observados ( O ij ). Para calcular el estadístico presentado en la ecuación (6) se tienen que calcular los valores esperados (E ij ). Para esto se necesita calcular p j , lo cual se hace de la siguiente manera: p1 = p2 =
9,3 = 0,5849 15,9 6,6 15,9
= 0,4151
Si en realidad los volúmenes negociados son independientes, 58,49% debería de ser negociados en la Bolsa de Valores A y el 41,51% en la Bolsa de Valores B. Basados en esto, la tabla de valores esperados (usando la ecuación (7)) será: Tabla 16, a) Bolsa de Valores
Totales
A
B
Acción 1
0,5849 × 4,1 = 2,398
0,4151 × 2,7 = 1,121
6,8
Acción 2
0, 5849 × 5,2 = 3,041
0,4151 × 3,9 = 1,619
9,1
Totales
9,3
6,6
15,9
Si se reemplazan estos valores en la Ecuación (6), se obtendrá: χ − test = 2
(4,1 − 2,398) 2, 398
2
+
(2,7 − 1,121) 1,121
2
(5,2 − 3,041)
2
+
3, 041
(3,9 − 1,619)
2
+
1, 619
= 8,1786
Para seguir el procedimiento de las pruebas de hipótesis, se necesita conocer el valor crítico de la distribución chi cuadrada con (f − 1) × (c − 1) grados de libertad. En este caso este número será (2 − 1) × (2 − 1) = 1. El nivel de confianza es igual a 0,95, por lo que α será igual a 0,05. Si se utiliza Excel, este valor crítico será igual a 3,8415. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como el valor del chi-test (8,1786) es mayor que el valor crítico, se rechazará la hipótesis nula de independencia. Lo que significa que, dada la información disponible, el volumen negociado dependerá de la Bolsa de Valores donde se negocien las acciones.
97
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,0042 Por lo tanto, como el p-valor es menor que el nivel de signif icancia estadístico (0,05), se rechaza la hipótesis nula.
9)
En base a los valores presentados en la tabla 2 y asumiendo un nivel de significancia estadística del 1%, realice lo siguiente: a)
Pruebe la siguiente hipótesis: H0: El volumen de negociación es independiente de la acción negociada. H1: El volumen de negociación NO es independiente de la acción negociada.
Se advierte que en esta tabla el número de filas f = 2 y el número de columnas c = 2. Esta tabla presenta los valores observados ( O ij ). Para calcular el estadístico presentado en la ecuación (6) se tienen que calcular los valores esperados ( E ij ). Para esto se necesita calcular p j , lo cual se hace de la siguiente manera: p1 = p2 =
9,3 15,9 6,6 15,9
= 0,5849 = 0,4151
Si en realidad los volúmenes negociados son independientes, 58,49% debería de ser negociados en la Bolsa de Valores A y el 41,51% en la Bolsa de Valores B. Basados en esto, la tabla de valores esperados (usando la ecuación (7)) será: Tabla 16, b) Bolsa de Valores
Totales
A
B
Acción 1
0,5849 × 4,1 = 2,398
0,4151 × 2,7 = 1,121
6,8
Acción 2 Totales
0,5849 × 5,2 = 3,041
0,4151 × 3,9 = 1,619
9,1
9,3
6,6
15,9
Al reemplazar estos valores en la Ecuación (6), se obtendrá: χ 2 − test =
(4,1 − 2,398)2 2, 398
+
(2,7 − 1,121)2 1,121
+
(5,2 − 3,041)2 3, 041
+
(3,9 − 1,619)2 1, 619
= 8,1786
Para seguir el procedimiento de las pruebas de hipótesis, se necesita conocer el valor crítico de la distribución chi cuadrada con (f − 1) × (c − 1) grados de libertad. En este caso este número será (2 − 1) × (2 − 1) = 1. El nivel de confianza es igual a 0,99, por lo que α será igual a 0,01. Si se emplea Excel, este valor crítico será igual a 6,6349.
98
CAPÍTULO 7
Estadística inferencial: Aplicaciones de la chi cuadrada
b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Al ser el valor del chi-test (8,1786) mayor que el valor crítico, se rechazará la hipótesis nula de independencia. Lo que significa que, dada la información que se dispone, el volumen negociado dependerá de la Bolsa de Valores donde se negocien las acciones.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,0042
Por lo tanto, como el p-valor es menor que el nivel de significancia estadístico (0,01), se rechaza la hipótesis nula. 10)
Se tiene la siguiente tabla de frecuencias en la que se presentan las ventas de todas las tiendas que son parte de una determinada cadena:
Tabla 17 Ventas (En cientos de miles de U.M.)
Número de tiendas
<25
2
[25,35)
8
[35,45)
12
[45,55)
14
[55,65)
11
[65,75)
7
>75
1
Se supone que la media y la desviación estándar calculadas a partir de la muestra son iguales a 52 y 10, respectivamente. Asuma que el nivel de confianza deseado es del 90%. Se siguen los pasos descritos en el capítulo, probar la siguiente hipótesis:
a)
H0: La muestra proviene de una distribución normal. H1: La muestra NO proviene de una distribución normal. Paso 1: Poner la información en una sola fila e identificar los límites de las clases.
De ser necesario juntar las clases con menos de 5 observaciones. Tabla 17, a) <25
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
>75
2
8
12
14
11
7
1
99
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Se puede observar que las clases de los extremos tienen valores menores a 5, por lo que se deben juntar con las observaciones adyacentes a las mismas: Tabla 17, b) <35
[35,45)
[45,55)
[55,65)
>65
8 + 2 = 10
12
14
11
7+1=8
Paso 2: Convertir los límites en términos de valores estandarizados (z).
En este ejemplo µ es 52 y 10. A continuación convertir los límites en términos de z: 35 | -1,70
45 | -0,70
55 | 0,30
65 | 1,30
35 − 52
45 − 52
55 − 52
65 − 52
10
10
10
10
Paso 3: Calcular las probabilidades relacionadas a estos valores z.
Se emplea Excel para obtener las probabilidades con la función DISTR.NORM. ESTAND y se tendrán: P ( z < − 1,70 ) = 0,0446 P ( −1, 70 ≤ z ≤ −0, 70 ) = 0, 2420 − 0, 0446 = 0,1974 P ( −0, 70 ≤ z ≤ 0, 30 ) = 0, 6179 − 0, 2420 = 0, 3759 P ( 0, 30 ≤ z ≤ 1, 30 ) = 0, 9032 − 0, 6179 = 0, 2853
P ( z > 1, 30 ) = 1 − 0, 9032 = 0, 0968
Paso 4: Calcular los valores esperados ( E i ).
Los valores esperados (para cada clase) se calculan simplemente multiplicando la probabilidad de cada clase por el número total de observaciones en la muestra. Los valores esperados se muestran en la siguiente tabla: Tabla 17, c)
100
<35
[35,45)
[45,55)
[55,65)
>65
2,453
10,857
20,675
15,692
5,324
Estadística inferencial: Aplicaciones de la chi cuadrada
CAPÍTULO 7
Como se puede observar en esta tabla existen valores menores que 5, por lo que se debe ajustar las tablas 17, b) y 17, c) de la siguiente manera: Tabla 17, d) <45
[45,55)
[55,65)
>65
22
14
11
7+1=8
<45
[45,55)
[55,65)
>65
13,31
20,675
15,692
5,324
Tabla 17, e)
La tabla 17, d) corresponde a los valores observados y la tabla 17, e) a los valores esperados. Paso 5: Proceder con la prueba de hipótesis.
Una vez que se tienen la tabla con los valores esperados, se procede a calcular el chitest de bondad de ajuste, presentado en la ecuación (8): χ − test = 2
(22 − 13,31) 2 13, 31
+
(14 − 20,675)2 20, 675
+
(11 − 15,692)2 15, 692
+
(8 − 5,324)2 5, 324
= 10,577
Ahora, se procederá a encontrar el valor crítico basado en una chi cuadrada con (c – m – 1) grados de libertad. En este caso, el número de parámetros de la distribución normal estimados a partir de la muestra es igual a 2 (m = 2). El número final de columnas en la tabla es 4 (c = 4). Por lo tanto, los grados de libertad serán iguales a 1 (4 − 2 − 1). Se usa Excel para obtener el valor crítico que será igual a 2,7055. En este caso, el chi-test = 10,577 es mayor que 2,7055. Por lo que se rechaza H 0, lo que significa que la muestra no proviene de una distribución normal. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? En este caso, el chi-test = 10,577 es mayor que 2,7055. Por lo tanto, se rechaza H 0, lo que significa que la muestra no proviene de una distribución normal.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,0012
Como el p-valor es menor que el nivel de significancia del 10%, se rechaza la hipótesis nula. 11)
Basado en la pregunta 10, solo la desviación estándar ha sido calculada a partir de los datos de la muestra y es igual a 10.
101
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
a)
Se desea probar la siguiente hipótesis (con un nivel de confianza del 95%). H0: La muestra proviene de una distribución normal con media 50. H1: La muestra NO proviene de una distribución normal con media 50. Paso 1: Poner la información en una sola fila e identificar los límites de las clases.
De ser necesario juntar las clases con menos de 5 observaciones. Tabla 17, f) <25
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
>75
2
8
12
14
11
7
1
Se puede observar que las clases de los extremos tienen valores menores a 5, por lo que se debe juntar con las observaciones adyacentes a las mismas: Tabla 17, g) <35
[35,45)
[45,55)
[55,65)
>65
8 + 2 = 10
12
14
11
7+1=8
Paso 2: Convertir los límites en términos de valores estandarizados (z).
En este ejemplo µ es 50 y la desviación estándar de 10. A continuación convertir los límites en términos de z: 35 | -1,50
45 | -0,50
55 | 0,50
65 | 1,50
35 − 50
45 − 50
55 − 50
65 − 50
10
10
10
10
Paso 3: Calcular las probabilidades relacionadas a estos valores z.
Se emplea Excel para obtener las probabilidades, se tendrán: P ( z < − 1,50) = 0,0668 P ( −1, 50 ≤ z ≤ −0, 50 ) = 0, 3085 − 0, 0668 = 0, 2417 P ( −0, 50 ≤ z ≤ 0, 50 ) = 0, 6915 − 0, 3085 = 0, 383 P ( 0, 50 ≤ z ≤ 1, 50 ) = 0, 9332 − 0, 6915 = 0, 2417
P ( z > 1, 50 ) = 1 − 0, 9332 = 0, 0668
102
CAPÍTULO 7
Estadística inferencial: Aplicaciones de la chi cuadrada
Paso 4: Calcular los valores esperados ( E i ).
Los valores esperados (para cada clase) se calculan simplemente multiplicando la probabilidad de cada clase por el número total de observaciones en la muestra. Los valores esperados se muestran en la siguiente tabla: Tabla 17, h) <35
[35,45)
[45,55)
[55,65)
>65
3,674
13,294
21,065
13,294
3,674
Como se puede observar en esta tabla existen valores menores que 5, por lo que se debe ajustar las tablas 17, g) y 17, h) de la siguiente manera: Tabla 17, i) <45
[45,55)
>55
22
14
19
[35,45)
[45,55)
[55,65)
16,968
21,065
16,968
Tabla 17, j)
La tabla 17, i) corresponde a los valores observados y la tabla 17, j) a los valores esperados. Paso 5: Proceder con la prueba de hipótesis.
Una vez que se tienen la tabla con los valores esperados, se procede a calcular el chitest de bondad de ajuste, presentado en la ecuación (8): (22 − 16,968) 2 (14 − 21,065) 2 (19 −16,968) 2 χ − test = + + = 4,105 16,968 21, 065 16,968 2
Ahora, se procederá a encontrar el valor crítico basados en una chi cuadrada con (c – m – 1) grados de libertad. En este caso, el número de parámetros de la distribución normal estimados a partir de la muestra es igual a 1 (m = 1), recordar que solo se ha estimado la desviación estándar. El número final de columnas en la tabla es 3 (c = 3). Por lo tanto los grados de libertad serán iguales a 1 (3 − 1 − 1). Al usar Excel el valor crítico será igual a 3,8415. En este caso chi-test = 4,105 es mayor que 3,8415. Por lo tanto, se rechaza H 0, lo que significa que la muestra no proviene de una distribución normal.
103
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
c)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? En este caso, el valor del chi-test = 4,105 es mayor que 3,8415. Por lo tanto, se rechaza H0, lo que significa que la muestra no proviene de una distribución normal. En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,043 Como el p-valor es menor que el nivel de significancia del 5%, se rechaza la hipótesis nula.
12)
Con los datos de la pregunta 10, asuma que trabaja con un nivel de confianza del 95%: a)
Se desea probar la siguiente hipótesis: H0: La muestra proviene de una distribución normal con media 50 y desviación
estándar de 4.
H1: La muestra NO proviene de una distribución normal con media 50 y
desviación estándar de 4.
Paso 1: Poner la información en una sola fila e identificar los límites de las clases.
De ser necesario juntar las clases con menos de 5 observaciones. Tabla 17, i) <25
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
>75
2
8
12
14
11
7
1
Se puede observar que las clases de los extremos tienen valores menores a 5, por lo que se debe juntar con las observaciones adyacentes a las mismas: Tabla 17, j) <35
[35,45)
[45,55)
[55,65)
>65
8 + 2 = 10
12
14
11
7+1=8
Paso 2: Convertir los límites en términos de valores estandarizados (z).
En este ejemplo, µ es 50 y la desviación estándar es 4. A continuación convertir los límites en términos de z:
104
35 | -3,75
45 | -1,25
55 | 1,25
65 | 3,75
35 − 50
45 − 50
55 − 50
65 − 50
4
4
4
4
CAPÍTULO 7
Estadística inferencial: Aplicaciones de la chi cuadrada
Paso 3: Calcular las probabilidades relacionadas a estos valores z.
Al utilizar Excel para obtener las probabilidades se tendrán: P ( z < − 3,75) = 0,0001 P ( −3, 75 ≤ z ≤ −1, 25 ) = 0,1056 − 0, 0001 = 0,1055 P ( −1,25 ≤ z ≤ 1,25) = 0,8944 − 0,1056 = 0,7888 P (1, 25 ≤ z ≤ 3, 75 ) = 1, 000 − 0, 8944 = 0,1056
P ( z > 3, 75 ) = 1 − 0, 9999 = 0, 0001
Paso 4: Calcular los valores esperados ( E i ).
Los valores esperados (para cada clase) se calculan simplemente multiplicando la probabilidad de cada clase por el número total de observaciones en la muestra. Los valores esperados se muestran en la siguiente tabla: Tabla 17, k) <35
[35,45)
[45,55)
[55,65)
>65
0,00
5,80
43,38
5,80
0,00
Como se puede observar en esta tabla existen valores menores que 5, por lo que se debe ajustar las tablas 17, b) y 17, c) de la siguiente manera: Tabla 17, l) <45
[45,55)
>55
22
14
19
<45
[45,55)
>55
5,80
43,38
5,80
Tabla 17, m)
La tabla 17, l) corresponde a los valores observados y la tabla 17, m) a los valores esperados.
105
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Paso 5: Proceder con la prueba de hipótesis.
Una vez que se tienen la tabla con los valores esperados, se procede a calcular el chitest de bondad de ajuste, presentado en la ecuación (8): χ − test = 2
(22 − 5,80) 2 5,80
+
(14 − 43,38) 2 43,38
+
(19 − 5,80) 2 5,80
= 45,2 + 19,9 + 30,0 = 95,1
Ahora se procederá a encontrar el valor crítico basado en una chi cuadrada con (c – m – 1) grados de libertad. En este caso, el número de parámetros de la distribución normal estimados a partir de la muestra es igual a 0 (m = 0). El número final de columnas en la tabla es 3 (c = 3). Por lo tanto los grados de libertad serán iguales a 2 (3 − 0 − 1). En base a esto el valor crítico será igual a 5,9915. En este caso chi-test = 95,1 es mayor que 5,9915. Por lo tanto, se rechaza H 0, lo que significa que la muestra no proviene de una distribución normal con media 50 y desviación estándar 4. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? En este caso, se observa que el chi-test = 95,1 es mayor que 5,9915. Por lo tanto, se rechaza H0, lo que significa que la muestra no proviene de una distribución normal con media 50 y desviación estándar 4.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,00
Por lo tanto, como el p-valor es menor que el nivel de signif icancia estadístico (0,05), se rechazará la hipótesis nula. 13)
Si se está interesado en saber si una variable sigue una distribución uniforme con parámetros a = 1, b = 6. Los valores observados se encuentran en la siguiente tabla:
Tabla 18
a)
106
Intervalo
Frecuencia
[1,2)
40
[2,3)
42
[3,4)
43
[4,5)
39
[5,6]
41
Basado en estos datos y asumiendo un nivel de confianza del 95%, ¿se podría afirmar que la variable aleatoria se distribuye como una distribución uniforme con parámetros a = 1, b = 6? Antes de proceder con el cálculo de las probabilidades se necesita calcular la altura del rectángulo (ver el capitulo 4). Este estará dado por:
Estadística inferencial: Aplicaciones de la chi cuadrada
CAPÍTULO 7
1 (b − a )
=
1 (6 − 1)
= 0,20
H0: La muestra proviene de una distribución uniforme con parámetros a = 1, b = 6. H1: La muestra NO proviene de una distribución uniforme con parámetros a = 1, b = 6.
Por lo tanto, si los datos siguen una distribución uniforme, la probabilidad será la misma independientemente del intervalo. Con esto en mente, la tabla de valores es perados será: Tabla 18, a) Intervalo Valor esperado
[1,2)
[2,3)
[3,4)
[4,5)
[5,6]
205 × 0,2 = 41
41
41
41
41
Una vez calculada la tabla con los valores esperados, se utiliza la ecuación (8) para determinar el chi-test: χ − test = 2
c
(Oi − E i ) 2
i =1
E i
∑
=
(40 − 41)2 41
+
(42 − 41) 2 41
+
(43 − 41) 2 41
+
(39 − 41) 2 41
+
(41 − 41) 2 41
χ 2 − test = 0,2439
Ahora falta calcular el valor crítico de la distribución chi cuadrada con ( k − m − 1) grados de libertad. En este caso, no se ha calculado ningún parámetro a par tir de la muestra, por lo que m será igual a 0. Por lo tanto, se buscará el valor de una chi cuadrada con 5 − 1 = 4 grados de libertad y un nivel de significancia de 0,05. Con el uso de Excel el valor crítico de la prueba será igual a 9,4877. Como se puede observar el chi-test cae en la zona de no rechazo, por lo que no se puede rechazar la hipótesis nula y se podrá afirmar que efectivamente la muestra puede provenir de una población que se distribuye uniformemente. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se puede observar, el chi-test cae en la zona de no rechazo, por lo que no se puede rechazar la hipótesis nula y se podrá afirmar que efectivamente la muestra puede provenir de una población que se distribuye uniformemente.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,8852
Como el p-valor es mayor que 0,05, no se rechaza la hipótesis nula.
107
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
14)
Se tiene datos diarios sobre las personas que compran un determinado producto al visitar una tienda de una cadena comercial. Los datos se presentan en la siguiente tabla:
Tabla 19
a)
Cantidad comprada
Promedio de compras diarias
0
24
1
58
2
44
3
31
4
18
5
6
6
1
Con estos datos y asumiendo un nivel de confianza del 95%, ¿se podría afirmar que la variable aleatoria se distribuye como una Poisson? Las hipótesis a testear serán: H0: La muestra proviene de una distribución de Poisson. H1: La muestra NO proviene de una distribución de Poisson.
Al igual que en los casos anteriores se determinan los valores esperados ( E i ). En este caso, lo primero que se debe recordar es que para poder determinar una distribución de Poisson se necesita conocer λ , que es simplemente igual al valor esperado de eventos en un determinado intervalo. En este caso se cuenta con una muestra, por lo que se aproximará este parámetro con la media muestral. λ = x =
0 × 24 + 1 × 58 + ... + 6 ×1 = 1,9066 ≅ 2 182
Dada esta información se procederá a emplear la tabla de la distribución de Poisson presentada en el apéndice del libro. Se busca la columna que corresponda a λ = 2 y se procede a calcular los valores esperados como se muestra en la Tabla Tabla 19, a)
108
Cantidad Comprada
Probabilidad
Total de observaciones × Probabilidad (E i )
0
0,13534
182 × 0,1353 = 24,632
1
0,27067
49,262
2
0,27067
49,262
3
0,18045
32,842
4
0,09022
16,420
5
0,03609
6,568
≥6
0,01203
3,014
CAPÍTULO 7
Estadística inferencial: Aplicaciones de la chi cuadrada
Si se emplea la información de la tabla 19 (valores observados) y la tabla 19, a) (valores esperados), se procede a calcular el chi-test: χ − test = 2
c
(Oi − E i ) 2
i =1
E i
∑
=
(24 − 24, 632) 2 24, 632
+
(58 − 49, 262) 2 49, 262
+ ... +
(1 − 3, 014)2 3, 014
χ 2 − test = 3,778
Para hallar el valor crítico se necesitan los grados de libertad. En este caso será igual a (c − m − 1) = (7 − 1 − 1) = 5. Así, m = 1, ya que se calcula la media de la distribución ( λ ) a partir de los datos de la muestra. Con el uso de Excel se obtiene 11,0705. Como se observa, el chi-test (3,778) está a la izquierda del valor crítico, por lo que no se rechaza la hipótesis nula y se concluye que, dada la información disponible, la muestra puede provenir de una distribución de Poisson. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se observa, el chi-test (3,778) está a la izquierda del valor crítico, por lo que no se rechaza la hipótesis nula y se concluye que, dada la información disponible, la muestra puede provenir de una distribución de Poisson.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,5818
Por lo tanto, no se rechaza la hipótesis nula. 15)
Con los datos presentados en la tabla 14, responda: a)
Si asume un nivel de confianza del 99%, ¿se podría afirmar que la variable aleatoria se distribuye como una Poisson con media λ = 2? Las hipótesis a testear serán: H0: La muestra proviene de una distribución de Poisson con media λ = 2. H1: La muestra NO proviene de una distribución de Poisson con media λ = 2
Se busca la columna que corresponda a λ = 2 y se procede a calcular los valores esperados como se muestra en la Tabla.
109
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Tabla 19, a) Cantidad Comprada
Probabilidad
Total de observaciones × Probabilidad (E i )
0
0,13534
182 × 0,1353 = 24,632
1
0,27067
49,262
2
0,27067
49,262
3
0,18045
32,842
4
0,09022
16,420
5
0,03609
6,568
≥6
0,01203
3,014
Si se emplea la información de la tabla 19 (valores observados) y la tabla 19, a) (valores esperados), se procede a calcular el chi-test: χ − test = 2
c
(Oi − E i )2
i =1
E i
∑
(24 − 24, 632) 2 (58 − 49, 262) 2 (1 − 3, 014) 2 = + + ... + 24, 632 49, 262 3, 014
χ 2 − test = 3,778
Para hallar el valor crítico se necesitan los grados de libertad. En este caso será igual a (c − m − 1) = (7 − 0 − 1) = 6. En este caso m = 0 ya que NO se calcula la media de la distribución ( λ ) a partir de los datos de la muestra. Al emplear Excel se obtiene 12,5916. Como se observa, el chi-test (3,778) está a la izquierda del valor crítico, por lo que no se rechaza la hipótesis nula y se concluye que, dada la información disponible, la muestra puede provenir de una distribución de Poisson. b)
En base al criterio del valor crítico, ¿cuál es su decisión respecto a la hipótesis nula? Como se observa, el chi-test (3,778) está a la izquierda del valor crítico, por lo que no se rechaza la hipótesis nula y se concluye que, dada la información disponible, la muestra puede provenir de una distribución de Poisson.
c)
En base al criterio del p-valor, ¿cuál es su decisión respecto a la hipótesis nula? P-valor = 0,5818
Por lo tanto, no se rechaza la hipótesis nula.
110
CAPÍTULO
8 Fundamentos de álgebra lineal
Se tienen las siguientes matrices: A =
1)
4 −1 1 2
3
5
2 1
3
7
5
, B = 3 0 , C = 8 −5 3 , D = 1
5
2
0
7
9
3 0
6
4
2
2 9
4
, E = 9 0 8 4 8 7
Demuestre, usando las matrices presentadas anteriormente: a)
( A + D ) ' = ( A '+ D ') A + D =
4 −1 1 2
3
5
+
9
3 0
6 4
2
=
13 2 1 8
7
7
13 8 ( A + D) ' = 2
7
1
7
Y, 4
2
9 6
13 8
A '+ D ' = −1 3 + 3 4 = 2
1
5
0 2
1
7 7
111
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
( A × B ) ' = ( B '× A ') A × B =
4
−1 1
2
3
( A × B ) ' =
5
2 1
6
×3 0= 1
9
18 27
5
6 18 9
27
Y
( B '× A ') = c)
2 3 1 1
0 5
2
× −1 3 = 1
5
6 18 9
27
C × I 3 = I 3 × C = C , donde I 3 es la matriz identidad de orden 3. 3 C × I3 = 8
2
7
I3 × C = 0
5
1 0 0
3
7
0
7
0 0 1 3
7
5
2
0
7
3
7
5
1 0 × 8 −5 3 = 8 −5 3 = C
0 0 1
2
0
7
2
0
tr ( C ) = tr ( C ' )
3 7 5 Tr ( C) = Tr 8 −5 3 = 3 − 5 + 7 = 5 2 0 7 Y 3 8 2 Tr (C ') = Tr 7 −5 0 = 3 − 5 + 7 = 5 5 3 7
112
5
−5 3 × 0 1 0 = 8 −5 3 = C
1 0 0
d)
4
7
CAPÍTULO 8
e)
Fundamentos de álgebra lineal
tr ( C × E ) = tr ( E × C )
3 C × E = 8
2
7
5
2
9 4
89
67 103
−5 3 × 9 0 8 = −17 96
13
0
57
7
4 8 7
32
74
89 67 103 Tr (C × E ) = Tr −17 96 13 = 89 + 96 + 57 = 242 32 74 57
Y 2
9
4 3
7
5
86
× C = 9 0 8 8 −5 3 = 43 E ExC 4
8
7 2
0
7
90
−31
65
63
101
−12
93
86 −31 65 × C ) = Tr 43 63 101 = 86 + 63 + 93 = 242 Tr(E( ExC Tr 90 −12 93 f)
tr ( C + E ) = tr ( C ) + tr ( E )
3 C + E = 8
2
7
5
2 9
4
5
16
9
−5 3 + 9 0 8 = 17 −5 11 0
7
4 8 7
6
8
14
5 16 9 Tr (C + E ) = Tr 17 −5 11 = 5 − 5 + 14 = 14 6 8 14
Y 3 7 5 2 9 4 Tr (C ) + Tr ( E ) = Tr 8 −5 3 + Tr 9 0 8 = (3 − 5 + 7) × (2 + 0 + 7) = 14 2 0 7 4 8 7 g)
¿Es la matriz E una matriz simétrica? Sí.
113
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
2)
Multiplique: a)
A × D '
A × D ' =
b)
4 −1 1 2
3
×3 4= 0 2
33 22 27 34
3 × C 3 3 × C = 3 × 8 2
c)
5
9 6
7
5
21
15
−5 3 = 24 −15
9
0
21
7
9 6
0
B × C 2 1 B × C = 3
3
0×8
1 5
2
7
5
−5 3 0
7
Se puede apreciar que las matrices no son conformables, por lo que esta multiplicación no se puede realizar. 3)
Resuelva la pregunta 2 usando Excel. La hoja Excel con estos cálculos es “capitulo8_ejercicio3_multip_matrices.xlsx”. El primer caso se encuentra en la hoja a) y el segundo en la b).
114
CAPÍTULO 8
4)
Fundamentos de álgebra lineal
Calcule el determinante de C usando usa ndo el método método de Sarrus y usando Excel. 3
7
5
8 −5 3 det(C ) = 2
0
7 = −105 + 0 + 42 − (−50 + 0 + 392) = −405
3
7
5
8 −5 3
El ejercicio ejercicio usando usa ndo Excel se llama l lama “capitulo8_ejerci “capitulo8_ejercicio4_determinante.xlsx” cio4_determinante.xlsx”..
5)
Basado en su respuesta a la pregunta 4, ¿es C una matriz singular? No, porque el determinante de C es distinto de cero.
6)
Determine la matriz inversa de E usando la fórmula presentada en el capítulo y usando u sando Excel. Primero, se calcula la matriz de cofactores: t
−64 31 31 72 31 72 −64 31 cof ( E ) = 31 −2 −20 = 31 −2 −20 72 −20 −81 72 −20 −81
Advierta que la matriz matriz es simétrica por lo que que su transpuesta será la misma. Se calcula la matriz adjunta: −64 −31 adj( E ) = −31 −2 72
20
72 20
−81
115
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Se calcula el det(E) por medio de Excel y da -119. Por lo tanto, la inversa de E será:
( E ) −1 =
−64 −31 −31 −2
72
72
−81
20
20
−119
0, 54 54
0, 26 26
0, 61 61
= 0, 26 0, 02 −0,17 61 −0,17 0, 68 68 −0, 61
La hoja Excel que contiene la solución de este ejercicio se llama: “capitulo8_ejercicio6_ inversa.xlsx”.
7)
Demuestre usando las matrices presentadas: a)
E −1 × E = E × E −1 = I n
0, 54
0, 26
0, 61
( E ) −1 × E = 0, 26
0, 02
−0,17 × 9 0 8 = 0 1 0
−0, 61 −0,17
2 9 4
0, 68
4 8
7
1 0 0 0 0
1
Y 2 9 4 E × ( E ) −1 = 9
0, 54
0, 26
0, 61
0 8 × 0, 26
0, 02
−0,17 = 0 1 0
4 8 7 b)
( E − ) 1
−1
−0, 61 −0,17
0, 68
1 0 0 0 0 1
= E −1
0, 54 0, 26 0, 61 2 9 4 ( E −1 ) −1 = 0, 26 0, 02 −0,17 = 9 0 8 = E −0, 61 −0,17 0, 68 4 8 7
116
Fundamentos de álgebra lineal
CAPÍTULO 8
c)
−1 ( C × E ) = ( E −1 × C −1 )
3 C × E = 8
2
7
5
2
9 4
89
67 103
−5 3 × 9 0 8 = −17 96
13
0
57
7
4 8 7
32
0, 09 094
0, 07 079
(C × E )−1 = 0, 029
0, 037
−0,187 −0, 060
089 −0, 09 092 −0, 08
74
0, 20 201
Y −0,114 ( E −1 × C −1 ) = 0, 26 0, 02 −0,17 × 0,124 −0, 027 −0, 077 61 −0,17 0, 68 68 −0, 02 025 −0, 03 035 0,175 −0, 61 0, 54 54
0, 26 26
0, 09 094
0, 07 079
( E −1 × C −1 ) = 0, 0 , 029
0, 037
089 −0, 09 092 −0, 08 d)
0, 61 61
0, 08 086
0,121
−0,187 −0, 060 = ( C × E ) −1 0, 20 201
( E ') −1 = ( E −1 ) '
En este caso E es una matriz simétrica por lo que E’ = E y, por lo tanto, se cumple la pregunta d). 8)
Resuelva el siguiente sistema de ecuaciones: ecuaciones:
x1 − 2 x2 + 4 x3 = 20 2 x1 + x2 + 3 x3 = 15 3 x − x + 6 x = 23 3 1 2 1
−2 4
2
1
3
−1 6 x3
x1
20
3 × x2 = 15 23 −1
20 1 −2 4 x2 = 2 1 3 × 15 x3 3 −1 6 23 x1
117
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Al calcular calcula r la matriz inversa se obtienen obtienen los los siguientes siguientes resultados: x1
−1, 8 −1, 6
x2 = 0, 60 1, 20 20 x3 9)
1, 0
1, 0
2, 0
20
−14
−1, 0 × 15 = 7 23 12 −1, 0 23
Resuelva la pregunta 8 usando usa ndo Excel. La solución se ubica en “capitulo8_ejercicio9_sistema_ecuaciones.xlsx”.
10)
Suponga Suponga que se tiene la siguiente matriz: 1 1 0 1 1 0 F = 1 1 0
1 0 1 1 0 1
11)
a)
¿Es la matriz F no singular? No.
b)
¿Puede determinar las causas de la dependencia dependencia lineal? Existe dependencia dependencia lineal entre las columnas de la matriz. En este caso la primera columna de F es igual a la suma de las columnas 2 y 3.
Dado el siguiente sistema de ecuaciones en forma matricial: y1
x1
2 9
y2 = E × x2 = 9 y3
x3
4
0 8 × x2
4 8 7
Calcule ∂Y / ∂X . Como se tiene Y = E × X
118
x1 x3
CAPÍTULO 8
12)
∂ y1 ∂ x1
∂y1 ∂x2
∂y1 ∂x3
∂Y ∂ y2 = ∂ X ∂x1 ∂ y3 ∂ x1
∂y2 ∂x2 ∂y3 ∂x2
∂y2 = 9 0 8 = E ∂x3 4 8 7 ∂y3 ∂x3
Fundamentos de álgebra lineal
2 9 4
Dado el siguiente sistema de ecuaciones en forma matricial: 3 Y = x1
x3 × 8
x2
7
5
x1
−5 3 × x2
2
0
7
x3
Calcule ∂Y / ∂X . Como se tiene Y = X '× A × X La solución será igual a 3 Y = 2× 8
2
7
5
x1
∂Y = 2 × A × X ∂ X 6
14
−5 3 × x2 = 16 −10 0
7
x3
4
0
10
x1
6 × x2 14
x3
119
CAPÍTULO
9 El modelo de mínimos cuadrados ordinarios (MCO) univariado 1)
Describa los componentes de la ecuación de la recta (el intercepto y la pendiente). yi = α + β × xi + ε i
En este caso α representa el intercepto y β la pendiente. El intercepto puede entenderse como el valor que toma y en la ausencia de x . Un β positivo (negativo) indica que la relación entre y y x es positiva (negativa), es decir, que si x se incrementa y , también, se incrementará (disminuirá). El valor que tome β indicará la fuerza en la relación. Cuanto mayor sea el valor de β en valor absoluto, mayor será la fuerza de la relación entre las variables. 2)
¿Qué información se obtiene de la pendiente, en términos de su signo y magnitud? Un β positivo (negativo) indica que la relación entre y y x es positiva (negativa), es decir, que si x se incrementa y , también, se incrementará (disminuirá). El valor que tome β indicará la fuerza en la relación. Cuanto mayor sea el valor de β en valor absoluto, mayor será la fuerza de la relación entre las variables.
3)
¿Existe alguna relación entre la pendiente y el coeficiente de correlación? Básicamente proporcionan la misma información. Se recuerda que el coeficiente de correlación mide la dependencia lineal entre dos variables. El rango de posibles valores va entre −1 (perfecta correlación negativa) hasta 1 (perfecta correlación positiva). Cuando el coeficiente de correlación entre dos variables es positivo (negativo) indica que la rela-
121
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
ción entre y y x es positiva (negativa), es decir, que si x se incrementa y también se incrementará (disminuirá). Asimismo, cuando más cerca a 1 en valor absoluto, mayor será la fuerza de la relación entre las variables. Como se puede observar, la información de β y del coeficiente de correlación es la misma. 4)
Si β = 0, ¿se espera que el coeficiente de correlación sea igual a 0? Fundamente su respuesta. Si beta es cero, significa que no hay dependencia lineal.
5)
Si se tienen las siguientes dos ecuaciones: y = 1 + 1,5 x y = 1 + 4, 5 x a)
¿En cuál de ellas la variable x ejerce más influencia sobre la variable dependiente y ? En el segundo caso, ya que β = 4,5 y es mayor que 1,5.
b)
Grafique ambas ecuaciones para sustentar su respuesta en la par te a). 300 250 200 y
150 100 50 0 1
2
3
4
5
6
7
x
y=1+1,5 x
6)
y=1+4,5 x
¿Por qué se introduce un término de error en la ecuación lineal? Lo primero que se tiene que tener en cuenta es que la línea recta no es la descripción perfecta de los eventos observados, es decir, existirán errores.
7)
¿Es posible utilizar el modelo de MCO en la siguiente ecuación? yi = α + β1 × x1,i + β 2 × x2,i + β 3 × x1,i × x2,i + ε i
Sí, porque el modelo es lineal en los coeficientes.
122
CAPÍTULO 9
8)
El modelo de mínimos cuadrados ordinarios (MCO) univariado
¿Cuál es el criterio del modelo de MCO para estimar los coeficientes de la ecuación? El criterio que permitirá obtener una única línea recta será el minimizar la suma de los errores al cuadrado.
9)
De acuerdo al supuesto de la normalidad de los errores, los errores extremos son poco probables. Comente. La distribución normal decrece asintóticamente. Asimismo, se recuerda que la probabilidad que existan observaciones a tres desviaciones estándar de la media es prácticamente cero. Por eso, cuando se asume normalidad, se está suponiendo que la probabilidad de valores extremos es bastante pequeña.
10)
Se cuenta con datos mensuales del Producto Bruto Interno (PBI) y Exportaciones (en millones de US$) del Perú desde enero de 1994 a abril del 2010. Los datos son provistos por el Instituto Nacional de Estadística e Informática del Perú. Se desea investigar la relación que existe entre ambas variables. Se asume que la variable independiente son las exportaciones y que la variable dependiente es el PBI. Los datos se encuentran en el archivo pbi_exportaciones_peru.xlsx . En base a esto realizar lo siguiente: La hoja Excel que acompaña a este ejercicio se llama: “capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”. a)
Determine la correlación entre ambas variables. Según se ha determinado en la hoja de correlación del archivo citado, la correlación entre las variables es de 0,9448.
correlación
b)
Comente su resultado en base al signo y magnitud del coeficiente de correlación. La relación lineal entre ambas variables es positiva y bastante fuerte (el valor es bastante cercano a 1).
c)
Emplee Excel, prepare el gráfico de dispersión e incluya la ecuación lineal. Asegúrese de incluir en el gráfico, la ecuación y el coeficiente de determinación (R 2 ). En la hoja de “dispersión” del archivo citado se encuentra el siguiente gráfico obtenido en base a los datos.
123
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
PBI y Exportaciones
y = 2,9759x + 8163,5 R² = 0,8926
20.000,00 18.000,00 16.000,00 14.000,00 12.000,00 10.000,00 8.000,00 6.000,00 0
500
1000
PBI y Exportaciones
124
1500
2000
2500
3000
3500
Lineal (PBI y Exportaciones)
d)
Utilice las ecuaciones de los coeficientes del modelo, desarrolladas en el capítulo, estime los coeficientes relacionados al intercepto y a la pendiente. (Use las ecuaciones (35) y (50)). La repuesta se encuentra en la hoja “algebra” del documento Excel “capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”.
e)
Aplique Excel, desarrolle el modelo de MCO univariados y presente la ventana de los resultados. La repuesta se encuentra en la hoja “mco” del documento Excel “capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”.
CAPÍTULO 9
El modelo de mínimos cuadrados ordinarios (MCO) univariado
f)
Verifique que los valores obtenidos en la parte d son los mismos a los de la parte e. Se verificó que efectivamente los resultados son los mismos.
g)
¿Cuántos parámetros tiene este modelo (k) y con cuántas observaciones (n) se cuenta? K = 2, n = 196
h)
Emplee las ecuaciones (66) y (67) para calcular el coeficiente de determinación y el coeficiente de determinación ajustado. ¿Los valores coinciden con los obtenidos por Excel? Interprete el resultado obtenido. La repuesta se encuentra en la hoja “R2” del documento Excel “capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”.
Al usar la ecua ción (66) y la información obtenida en la hoja "mco", se calcula el R^2
Al usar la ecua ción (67) y la información obtenida en la hoja "mco", se calcula el R^2 ajustado
i)
Use la ecuación (71), calcule el error estándar y compárelo con el obtenido usando Excel. La repuesta se encuentra en la hoja “error estándar” del documento Excel “capitulo9_pregunta10_pbi_exportaciones_peru.xlsx”. El resultado es exactamente el mismo, como se puede observar a continuación.
125
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Error Estándar
j)
De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del 95%, ¿se puede afirmar que existe una relación lineal entre las exportaciones y el PBI? (use el p-valor de la prueba). El p-valor de la prueba es 0,00. Por lo tanto, como el p-valor es menor que el nivel de significancia (0,05) se rechazará la hipótesis nula de no relación lineal. O sea, que se puede afirmar que existe una relación lineal entre las exportaciones y el PBI.
k)
Con base en las pruebas de hipótesis individuales y usando el t-test y el valor crítico, ¿se puede afirmar que el coeficiente del intercepto es estadísticamente significativo? T-test = 80,75, el valor crítico corresponde a una T con n – 2 grados de libertad (194) y que es igual a 1,9723. Como el valor del t-test está en la zona de rechazo, se puede afirmar que el coeficiente del intercepto es estadísticamente significativo.
l)
Emplee el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente del intercepto? P-valor = 0,00 Por lo tanto, y como el p-valor es menor que 0,05, se rechaza la hipótesis nula de no significancia estadística. Es decir, que el coeficiente del intercepto es estadísticamente significativo.
m)
Finalmente, mediante los intervalos de confianza, ¿confirma lo encontrado en los puntos k y l? El intervalo de confianza para el intercepto es [7.964,10; 8.362,87]. Como se puede apreciar el valor cero no está en este intervalo por lo que se rechaza la hipótesis nula de no significancia estadística del intercepto.
n) Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico, ¿se puede afirmar que el coeficiente de la pendiente es estadísticamente significativo?
T-test = 40,15, el valor crítico corresponde a una T con n – 1 (195) grados de libertad y que es igual a 1,9723. Por lo tanto, como el valor del t-test está en la zona de rechazo, se puede afirmar que el coeficiente de la pendiente es estadísticamente significativo.
o)
Utilice el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente de la pendiente? P-valor = 0,00
126
CAPÍTULO 9
El modelo de mínimos cuadrados ordinarios (MCO) univariado
Por lo tanto, al ser el p-valor menor que 0,05, se rechaza la hipótesis nula de no significancia estadística. Es decir, que el coeficiente de la pendiente es estadísticamente significativo. p)
11)
Finalmente, con los intervalos de confianza, ¿confirma lo encontrado en los puntos n y o? El intervalo de confianza para el intercepto es [2,83; 3,12]. Como se puede apreciar el valor cero no está en este intervalo por lo que se rechaza la hipótesis nula de no significancia estadística de la pendiente.
Repita el ejercicio 10 usando EViews, realice y verifique lo siguiente: El documento de EViews que acompaña a este ejercicio se llama: “capitulo9_pregunta10_pbi_exportaciones_peru.wf1”. a)
Presente un análisis preliminar de los datos. Incluya el gráfico de series de tiempo para cada variable, estadísticas descriptivas y el coeficiente de correlación. Los resultados se encuentran en el documento de EViews bajo los nombres: “grafico_export”, “grafico_pbi”, “estad_descrip” y “correlacion” y las pantallas se muestran a continuación.
127
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Presente el gráfico de dispersión. El resultado se encuentran en el documento EViews bajo el nombre: “dispersión”.
c) Desarrolle el modelo de MCO que considere como variable endógena al PBI y variable predeterminada a las exportaciones. ¿Son los coeficientes estimados los mismos? El resultado se encuentran en el documento EViews bajo el nombre: “mco” que se reproduce a continuación:
128
CAPÍTULO 9
El modelo de mínimos cuadrados ordinarios (MCO) univariado
Los resultados son los mismos.
12)
d)
¿Son los coeficientes de determinación y el coeficiente de determinación ajustado iguales a los obtenidos con Excel? Sí.
e)
Use el análisis de varianza, ¿llega a la misma conclusión? Como se puede apreciar Prob(F-statistic) = 0. Por lo que se llega a la misma conclusión que el caso anterior.
Se cuenta con información respecto a la cartera administrada por las Administradoras Privadas de Pensiones del Perú (fondo 2) y el encaje de la cartera correspondiente. Los datos semanales fueron obtenidos del portal de internet de la Superintendencia de Banca y Seguros del Perú (http://www.sbs.gob.pe/0/modulos/JER/JER_Interna. aspx?ARE=0&PFL=0&JER=150) y corresponden al periodo que comienza el 02 de Octubre del 2009 hasta el 23 de Abril del 2010. Se sabe que el encaje está directamente relacionado con la cartera administrada, es decir, que el encaje será nuestra variable dependiente y la cartera administrada nuestra variable independiente o explicativa. En base a esto realizar lo siguiente: La hoja Excel que acompaña a este ejercicio se llama: “capitulo9_pregunta12_encaje_ cartera_AFP.xlsx”. a)
Determine la correlación entre ambas variables. En la hoja de “correlacion” del archivo mencionado se ha efectuado el cálculo correspondiente. Se obtuvo un valor de 0,9812.
129
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
c)
Comente su resultado en base al signo y magnitud del coeficiente de correlación. La relación lineal entre ambas variables es positiva y bastante fuerte (el valor es bastante cercano a 1). Use Excel, prepare el gráfico de dispersión e incluya la ecuación lineal. Asegúrese de incluir en el gráfico, la ecuación y el coeficiente de determinación (R 2 ). En la hoja de Excel denominada “dispersión” se encuentra el gráfico, que se muestra.
Encaje y Cartera Administrada 510
y = 0,0103x - 33,173 R² = 0,9628
500 490 480 470 460 450 47500
48000
48500
49000
49500
Encaje y Cartera Administrada
d)
130
50000
50500
51000
51500
52000
52500
Lineal (Encaje y Cartera Administrada)
Utilice las ecuaciones de los coeficientes del modelo, desarrolladas en el capítulo, estimar los coeficientes relacionados al intercepto y a la pendiente. Use las ecuaciones (35) y (50). La repuesta se encuentra en la hoja “algebra” del documento Excel “capitulo9_pregunta12_encaje_cartera_AFP.xlsx”
CAPÍTULO 9
El modelo de mínimos cuadrados ordinarios (MCO) univariado
e)
Emplee Excel, desarrolle el modelo de MCO univariado y presente la ventana de los resultados. La repuesta se encuentra en la hoja “mco” del documento Excel “capitulo9_pregunta12_encaje_cartera_AFP.xlsx”.
f)
Verifique que los valores obtenidos en la parte d) son los mismos a los de la parte e). Se verificó que efectivamente los resultados son los mismos.
g)
¿Cuántos parámetros tiene este modelo (k) y con cuántas observaciones (n) se cuenta? K = 2, n = 30.
h)
Utilice las ecuaciones (66) y (67) para calcular el coeficiente de determinación y el coeficiente de determinación ajustado. ¿Los valores coinciden con los obtenidos por Excel? Interprete el resultado obtenido. La repuesta se encuentra en la hoja “R2” del documento Excel “capitulo9_pregunta12_encaje_cartera_ AFP.xlsx”, que se expone a continuación.
Al emplear la ecuació n (66) y la información o btenida en la hoja "mco", se calcula el R^2
Al emplear la ecuació n (67) y la información o btenida en la hoja "mco", se calcula el R^2 ajustado
131
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
i)
Emplee la ecuación (71), calcule el error estándar y compárelo con el obtenido usando Excel. La repuesta se encuentra en la hoja “error estándar” del documento Excel “capitulo9_pregunta12_encaje_cartera_AFP.xlsx”.
Error Estándar
j)
De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del 95%, ¿se puede decir que existe una relación lineal entre el encaje y la cartera administrada? (use el p-valor de la prueba). El p-valor de la prueba es 0,00. Por lo tanto, como el p-valor es menor que el nivel de significancia (0,05) se rechazará la hipótesis nula de no relación lineal, es decir, que se puede afirmar que existe una relación lineal entre el encaje y la cartera administrada.
k)
Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico, ¿se puede afirmar que el coeficiente del intercepto es estadísticamente significativo? T-test = -1,74, el valor crítico corresponde a una T con n − 2 (28) grados de libertad y que es igual a 2,0484. Por ello, el valor del t-test está en la zona de no rechazo, se puede mencionar que el coeficiente del intercepto no es estadísticamente significativo.
l)
Utilice el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente del intercepto? P-valor = 0,09 Como el p-valor es mayor que 0,05, no se rechaza la hipótesis nula de no significancia estadística. Es decir, que el coeficiente del intercepto no es estadísticamente significativo.
m)
Finalmente, usando los intervalos de confianza, ¿confirma lo encontrado en los puntos k y l? El intervalo de confianza para el intercepto es [72,32; 5,98]. Como se puede apreciar el valor cero está en este intervalo por lo que no se rechaza la hipótesis nula de no significancia estadística del intercepto.
n)
Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico, ¿se puede afirmar que el coeficiente de la pendiente es estadísticamente significativo? T-test = 26,91, el valor crítico corresponde a una T con n − 2 (28) grados de libertad y que es igual a 2,0484. Como el valor del t-test está en la zona de rechazo, se puede afirmar que el coeficiente de la pendiente es estadísticamente significativo.
132
CAPÍTULO 9
o)
El modelo de mínimos cuadrados ordinarios (MCO) univariado
Utilice el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente de la pendiente? P-valor = 0,00. Como el p-valor es menor que 0,05, se rechaza la hipótesis nula de no significancia estadística. Es decir, que el coeficiente de la pendiente es estadísticamente significativo.
p)
13)
Finalmente, use los intervalos de confianza, ¿confirma lo encontrado en los puntos n y o? El intervalo de confianza para el intercepto es [0,010; 0,011]. Como se puede apreciar el valor cero no está en este intervalo, por lo que se rechaza la hipótesis nula de no significancia estadística de la pendiente.
Repita el ejercicio 12 usando EViews, realice y verifique lo siguiente: El documento de EViews que acompaña a este ejercicio se llama: “capitulo9_pregunta12_encaje_cartera_AFP.wf1”. a)
Presente un análisis preliminar de los datos. Incluya el gráfico de series de tiempo para cada variable, estadísticas descriptivas y el coeficiente de correlación. Los resultados se encuentran en el documento EViews bajo los nombres: “grafico_ encaje”, “grafico_cartera”, “estad_descrip” y “correlacion”. A continuación se muestran los gráficos correspondientes.
133
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
134
b)
Presente el gráfico de dispersión. Los resultados se encuentran en el documento EViews bajo el nombre: “dispersión”.
c)
Desarrolle el modelo de MCO que considere como variable endógena al encaje y variable predeterminada a la cartera administrada ¿Son los coeficientes estimados los mismos? El resultado se encuentran en el documento EViews bajo el nombre: “mco” que se reproduce a continuación:
CAPÍTULO 9
El modelo de mínimos cuadrados ordinarios (MCO) univariado
Los resultados son los mismos. d)
¿Son los coeficientes de determinación y el coeficiente de determinación ajustado iguales a los obtenidos con Excel? Sí.
e)
Si utiliza el análisis de varianza, ¿llega a la misma conclusión? Como se puede apreciar Prob(F-statistic) = 0. Por lo que se llega a la misma conclusión que el caso anterior.
135
CAPÍTULO
10 El modelo de mínimos cuadrados ordinarios (MCO) multivariado 1)
De acuerdo al supuesto de no autocorrelación de los errores ¿Cómo es la matriz de varianza-covarianza? y ¿cómo la representaría de manera matricial?
E (ε × ε ') =
2)
σ 2
0
...
0
0
σ 2
...
0
...
...
...
...
0
0
... σ 2
Si se tiene la siguiente regresión: yi = α + β1 × x1,i + β 2 × x2,i + ε i
3)
=Σ
a)
Interprete los parámetros: el intercepto, β1 y β2: Como siempre el intercepto es el valor que la variable y toma en el caso que las otras variables sean cero. Cada uno de los coeficientes β representa la influencia lineal de cada variable exógena hacia la variable endógena.
b)
¿Cuál es el número de coeficientes de la regresión (k)? K = 3
Se ha estimado una regresión multivariada y se han obtenido los siguientes resultados: yˆ = 0,1 + 1, 2× x1 − 0,3 × x2
137
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
a)
4)
Explique el tipo de relación que existe entre la variable dependiente ( y ) y cada una de las variables independientes. Y depende positivamente de x 1 y negativamente de x 2 . Asimismo, la influencia de x 1 es mayor que la influencia de x 2.
b)
Si x 1 = 100, ¿cuál es el valor estimado de y ? yˆ = 0,1 + 1, 2 × 100 = 120,1
c)
Si x 2 = 40, ¿cuál es el valor estimado de y ? yˆ = 0,1 − 0, 3 × 40 = −11, 9
d)
Si x 1 = 70 y x 2 = -10, ¿cuál es el valor estimado de y ? yˆ = 0,1 + 1,2 × 70 − 0,3 × (− 10) = 87,1
Se tienen los resultados de dos regresiones donde la variable endógena representa el número de minutos hablados por teléfono en un determinado mes. Las variables exógenas son el número de personas mayores de 12 años que viven en un determinado hogar ( x 1 ) y el nivel de ingresos familiares ( x 1 ). Cada regresión presenta datos de una ciudad distinta. Los resultados de las regresiones son los siguientes: yˆ = −21,517 + 11,996 × x1 + 0,019 × x2
Para la ciudad 1
yˆ = 55, 536 + 5, 644 × x1 + 0, 012 × x2
Para la ciudad 2
Los coeficientes de ambas variables exógenas son estadísticamente significativos al 5%. En la primera ecuación, el coeficiente del intercepto no es significativo al mismo nivel de significancia. En la segunda ecuación, el intercepto es altamente significativo. a)
¿En cuál de las ciudades el número de miembros de una familia mayores de 12 años ejerce una mayor influencia en los minutos hablados por teléfono? En la ciudad 1.
b)
De acuerdo a las estimaciones para la ciudad 2, ¿cuál será el número de minutos hablados por teléfono estimados, si el ingreso familiar es igual a 5.000? yˆ = 55,536 + 0,012 × 5.000 = 115,536
c)
De acuerdo a las estimaciones para la ciudad 2, ¿cuál será el número de minutos hablados por teléfono estimados si el ingreso familiar es igual a 3.500 y el número de miembros de la familia (mayores de 12 años) es igual 3? yˆ = 55,536 + 5,644 ×3 + 0,012 ×3.500 =114, 468
5)
Si se continúa con el caso anterior. Como el coeficiente del intercepto no es estadísticamente significativo en la regresión de la ciudad 1, se lo elimina y se obtiene lo siguiente: yˆ = 12, 601× x1 + 0, 014 × x2
138
CAPÍTULO 10
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
a)
De acuerdo a las estimaciones para la ciudad 1, ¿cuál será el número de minutos hablados por teléfono estimados si el ingreso familiar es igual a 3.000? yˆ = 0,014 × 3.000 = 42
b)
De acuerdo a las estimaciones para la ciudad 1, ¿cuál será el número de minutos hablados por teléfono estimados si el ingreso familiar es igual a 2.500 y el número de miembros de la familia (mayores de 12 años) es igual 2? yˆ = 12,601× 2 + 0,014 × 2.500 = 60,202
6)
Los datos con los que se estimaron las regresiones presentadas en las preguntas 4) y 5) se presentan a continuación:
Tabla 14
Minutos
Ciudad 1 Número de integrantes familia (>12 años)
Ingreso familiar (U.M.)
Minutos
Ciudad 2 Número de integrantes familia (>12 años)
Ingreso familiar (U.M.)
150
6
5.500
90
2
2.000
64
2
3.700
108
3
2.900
126
4
5.750
122
4
4.000
141
5
5.750
94
2
2.500
89
2
4.000
99
3
2.300
89
3
4.500
106
3
3.000
110
4
4.000
133
5
4.500
166
5
6.000
143
6
5.000
95
2
5.000
104
2
3.000
110
2
5.500
154
6
5.000
Estos datos se encuentran en el archivo de Excel llamadas_telefonicas.xls. La solución en Excel de este problema se encuentra en el archivo “capitulo10_pregunta6_llamadas_telefonicas.xlsx”. a) Para cada ciudad estime la regresión donde la variable endógena es el número de minutos hablados por teléfono ( y ) y las variables exógenas son el número de personas mayores de 12 años que viven en un determinado hogar ( x 1 ) y el nivel de ingresos familiares ( x 2 ). Utilice Excel y verifique que sus resultados coincidan con los resultados presentados en la pregunta 4. Los resultados se presentan en la hoja “algebra” del documento Excel “capitulo10_ pregunta6_llamadas_telefonicas.xlsx”.
139
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
140
b)
Para cada ciudad, ¿la variabilidad de la variable endógena es adecuadamente explicada por la variabilidad de las variables explicativas? Sí. Los R 2 son bastante cercanos a la unidad.
c)
Para cada ciudad, de acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del 95% y por medio del p-valor de la prueba, ¿puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas? Sí. El p-valor asociado a cada regresión es 0,00 (menor que 0,05). Por lo que existe una relación lineal en ambas ciudades entre la variable endógena y las variables ex-
CAPÍTULO 10
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
plicativas. Recuerde que la hipótesis nula de la prueba del ANOVA es que no existe relación lineal entre las variables. d)
Para cada ciudad, basados en las pruebas de hipótesis individuales y empleando el t-test y el valor crítico, ¿puede afirmar que el coeficiente del intercepto es estadísticamente significativo? En el caso de la ciudad 1 el t-test del intercepto es igual a -1,05 y para el caso de la ciudad 2 este es igual a 12,45. En este caso para ubicar el valor crítico se utilizan 7 grados de libertad (10 − 3). Recuerde que en este caso el número de coeficientes (k) es igual a 3. Este valor crítico es igual a 2,3646. En el caso de la primera ciudad el intercepto es no significativo y en el caso de la segunda ciudad este es altamente significativo.
e)
Si utiliza el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente del intercepto? En el caso de la ciudad 1 el t-test del intercepto es igual a 0,33 y para el caso de la ciudad 2 este es igual a 0,00. Por lo tanto, se llega a las mismas conclusiones.
f)
Finalmente, usando los intervalos de confianza, ¿confirma lo encontrado en los puntos d) y e)? Ciudad 1: [-69,75; 26,72] Ciudad 2: [44,99; 66,08] Por lo tanto, se llega a las mismas conclusiones.
g)
Para cada ciudad, basados en las pruebas de hipótesis individuales y usando el pvalor, ¿puede afirmar que el coeficiente de x 1 es estadísticamente significativo? Ciudad 1: p-valor = 0,00 el coeficiente de x 1 es significativo al 5%. Ciudad 2: p-valor = 0,045 el coeficiente de x 1 es significativo al 5%.
h)
Si emplea los intervalos de confianza, ¿confirma lo encontrado en el punto g)? Ciudad 1: [0,16; 11,13] Ciudad 2: [5,51; 18,48] Por lo tanto, se obtienen las mismas conclusiones.
i)
Para cada ciudad, basados en las pruebas de hipótesis individuales y usando el pvalor, ¿puede afirmar que el coeficiente de x 2 es estadísticamente significativo? Ciudad 1: p-valor = 0,01 el coeficiente de x 2 es significativo al 5%. Ciudad 2: p-valor = 0,01 el coeficiente de x 2 es significativo al 5%.
j)
Si usa los intervalos de confianza, ¿confirma lo encontrado en el punto i)? Ciudad 1: [0,01; 0,03] Ciudad 2: [0,00; 0,02] Se llega a las mismas conclusiones.
141
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
7)
142
De acuerdo a los resultados de la pregunta 6), en la regresión que corresponde a la primera ciudad, el coeficiente del intercepto no es significativo al 5%. Sin embargo, el intercepto de la regresión que corresponde a la segunda ciudad es altamente significativo. De acuerdo a esto, realice lo siguiente: a)
Para la primera ciudad corra la regresión sin incluir el intercepto. Los resultados se presentan en la hoja “mco” del documento Excel “capitulo10_pregunta6_llamadas_telefonicas.xlsx”.
b)
Analice los resultados, ¿coinciden con la regresión estimada presentada en la pregunta 5)? Sí.
c)
¿Qué pasa si hace lo mismo con la segunda regresión?, es decir, si conociendo que el coeficiente del intercepto es estadísticamente significativo, ¿se fuerza el intercepto a ser cero? Al forzar el intercepto a ser cero cuando este es significativamente distinto de cero genera que el coeficiente de x 1 pase a ser no significativo y que ambos coeficientes cambien radicalmente sus valores, como se puede observar en los siguientes resultados.
CAPÍTULO 10
8)
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
Realice la regresión con los datos de la tabla 1, esta vez utilizando EViews. Compare los resultados con los obtenidos en la pregunta 6). La hoja de EViews con esto resultados se llama “capitulo10_pregunta6_llamadas_telefonicas_1.wf1” y “capitulo10_pregunta6_llamadas_telefonicas_2.wf1” Los resultados son exactamente los mismos. Para la ciudad 1:
143
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Y para la ciudad 2:
9)
Responda la pregunta 7) utilizando EViews. La hoja de EViews con esto resultados se llama “capitulo10_pregunta6_llamadas_telefonicas_1.wf1” y “capitulo10_pregunta6_llamadas_telefonicas_2.wf1”. Las ecuaciones modificadas se llaman “mco_modif”. Para la ciudad 1:
144
CAPÍTULO 10
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
Y para la ciudad 2:
10)
Se cuenta con información financiera de 12 empresas de los Estados Unidos dedicadas a la publicidad. Las 12 empresas son negociadas en la Bolsa de Valores de Nueva York (New York Stock Exchange) o en NASDAQ. Se quiere determinar la influencia de la deuda total ( x 1 ) y del total del capital invertido en las empresas ( x 2 ) en la capitalización de mercado de las empresas ( y ). Los datos corresponden al año del 2006, están expresados en miles de US dólares y fueron obtenidos de Bloomberg. El archivo Excel que contiene esta información es MarketCap_DeudaTotal_CapitalInvertido.xls. Los resultados se presentan en el documento EViews “capitulo10_pregunta10_MarketCap_DeudaTotal_CapitalInvertido_sol.wf1”. a)
Usando EViews, estime la regresión donde la variable endógena es la capitalización de mercado de las empresas ( y ) y las variables exógenas son la deuda total ( x 1 ) y el total del capital invertido en las empresas ( x 2 ).
145
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
¿Es la variabilidad de la variable endógena adecuadamente explicada por la variabilidad de las variables explicativas? El R 2 y el R 2 ajustado son bastante altos. Por lo tanto, la variable endógena es adecuadamente explicada por la variabilidad de las variables explicativas.
c)
De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del 95% y mediante el uso del p-valor de la prueba, ¿puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas? De acuerdo a la Prob(F-statistic) que es igual a 0,00 se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas.
d)
Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico, ¿puede declarar que el coeficiente del intercepto es estadísticamente significativo? El t-test es igual a 0,372657 y el valor crítico que corresponde a una t con 12-3 (9) grados de libertad es igual a 2,2622. Por lo tanto no se rechaza la hipótesis nula de no significancia estadística.
e)
Si emplea el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente del intercepto? P-valor = 0,7180 que es mayor que 0,05. Se llega a la misma conclusión que la pregunta anterior.
f)
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede avalar que el coeficiente de x 1 es estadísticamente significativo? P-valor = 0,0098 que es menor que 0,05. Por lo tanto, x 1 es estadísticamente significativa.
146
CAPÍTULO 10
g)
h)
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede afirmar que el coeficiente de x 2 es estadísticamente significativo? P-valor = 0,0011 que es menor que 0,05. Por lo tanto, x 2 es estadísticamente significativa. Interprete sus resultados de la ecuación estimada. La capitalización de mercado de las empresas ( y ) depende negativamente de la deuda total ( x 1 ) y positivamente del total del capital invertido en las empresas ( x 2 ). El efecto del total del capital invertido en las empresas es mayor que el efecto de la deuda total. Para contestar las preguntas i) a k) se re-estima la ecuación sin considerar el intercepto. El resultado se presenta a continuación:
Por lo tanto la ecuación sería igual a yi = −4,962228x1 + 5,005425 x2 i)
De acuerdo a la ecuación estimada, ¿cuál sería el nivel de capitalización bursátil si el capital invertido es igual a US$ 10.000? yi = 5, 005425× 10.000 = 50.054, 25
j)
De acuerdo a la ecuación estimada, ¿cuál sería el nivel de capitalización bursátil si el total de deuda es de US$ 5.000? yi = −4,962228× 5.000 = −24.811,14
k)
De acuerdo a la ecuación estimada, ¿cuál sería el nivel de capitalización bursátil si el capital invertido es igual a US$ 10.000 y el total de deuda es igual a US$5.000? yi = −4,962228× 5.000 + 5.005425× 10.000 = 25.243,11
147
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
11)
Se cuenta con datos anuales correspondientes al ingreso neto, ingreso financiero (por intereses) y las provisiones por pérdidas, desde el año 1934 al año 2009, las mismas que fueron obtenidas de la página de internet de la Federal Deposit Insurance Corporation (FDIC) de los Estados Unidos (http://www2.fdic.gov/hsob/hsobRpt.asp). Los datos presentan valores agregados de todos los bancos comerciales en ese país expresados en miles de US dólares. El archivo Excel que contiene esta información es IngresoNeto_ IngresoInteres_Provisiones.xls. Los resultados se presentan en el documento EViews “capitulo10_pregunta11_ IngresoNeto_IngresoInteres_Provisiones.wf1”. a)
Por medio de EViews, estime la regresión donde la variable endógena es el ingreso neto ( y ) y las variables exógenas son los ingresos financieros ( x 1 ) y las provisiones por pérdidas ( x 2 ).
Por lo tanto, la ecuación sería igual a: yi = −3.545.135 + 0, 473934 × x1 − 0,746837 × x2 b)
148
¿Es la variabilidad de la variable endógena adecuadamente explicada por la variabilidad de las variables explicativas? El R 2 y el R 2 ajustado son bastante altos. De esta forma, la variable endógena es adecuadamente explicada por la variabilidad de las variables explicativas.
CAPÍTULO 10
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
c)
De acuerdo a la prueba F-test (análisis de varianza), con un nivel de confianza del 95% y con el uso del p-valor de la prueba, ¿puede confirmar que existe una relación lineal entre la variable endógena y las variables exógenas? De acuerdo a la Prob(F-statistic) que es igual a 0,00 se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas.
d)
Basados en las pruebas de hipótesis individuales y usando el t-test y el valor crítico, ¿puede asegurar que el coeficiente del intercepto es estadísticamente significativo? El t-test es igual a −3,385518 y el valor crítico que corresponde a una t con 76 −3 (73) grados de libertad es igual a −1,9930. Por lo tanto, se rechaza la hipótesis nula de no significancia estadística. Es decir, que el coeficiente del intercepto es estadísticamente significativo.
e)
Si usa el p-valor, ¿obtiene la misma conclusión respecto a la significancia del coeficiente del intercepto? Sí, este es igual a 0,0011 que es menor que 0,05.
f)
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede afirmar que el coeficiente de x 1 es estadísticamente significativo? P-valor = 0,0000 que es menor que 0,05, por lo tanto x 1 es estadísticamente significativa.
g)
Basados en las pruebas de hipótesis individuales y usando el p-valor, ¿puede asentir que el coeficiente de x 2 es estadísticamente significativo? P-valor = 0,0000 que es menor que 0,05, por lo tanto x 2 es estadísticamente significativa.
h)
Interprete sus resultados de la ecuación estimada. El ingreso neto ( y ) depende positivamente de los ingresos financieros ( x 1) y negativamente con respecto a las provisiones ( x 2 ). El efecto sobre el ingreso neto de las provisiones es mayor que el del ingreso financiero.
i)
De acuerdo a la ecuación estimada, ¿cuál sería el ingreso neto si el i ngreso financiero es igual a US$ 10.000.000.000? yi = −3.545.135 + 0,473934× 10.000.000.000, 00 = 4.735.794.865
j)
De acuerdo a la ecuación estimada, ¿cuál sería el ingreso neto si el i ngreso financiero es igual a US$ 50.000.000? yi = −3.545.135 + 0,473934 × 50.000.000 = 20.151.565
k)
De acuerdo a la ecuación estimada, ¿cuál sería el ingreso neto si el i ngreso financiero es igual a US$ 200.000.000 y las provisiones por pérdidas son iguales a US$ 50.000.000? yi = −3.545.135 + 0,473934 × 200.000.000 − 0,746837 ×50.000.000 = 53.899.815
149
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
12)
Se tienen los siguientes datos mensuales que corresponden a los ingresos en miles de US dólares por concepto de cobro de peaje, de una empresa dedicada a la administración de carreteras. Los datos corresponden a los años 2006 a 2008. Se está interesado en generar una ecuación que represente la tendencia de los ingresos. Se conoce que en diciembre del 2006 el estado (dueño de las carreteras) redujo el número de puestos de cobro de peaje de 12 a 5. La tabla tiene las siguientes columnas: fecha, ingresos en US dólares, los meses expresados de manera numérica (números consecutivos desde 1 hasta 36) y la variable dummy (D) que toma el valor de 1 en el 2006 y cero después. Los datos se encuentran en el documento Excel “peaje.xls”. La solución a este problema usando Excel se encuentra en el archivo “capitulo10_pregunta12_peaje_sol.xlsx”, en la hoja “1 dummy”. a)
Emplee Excel y realice el gráfico de series de tiempo de los ingresos de la empresa.
US$ 600.000 500.000 400.000 300.000 200.000 100.000 0 E R Y L T V E R Y L T V E R Y L T V E O N A A U E O N A A U E O N A A U E M M J S N E M M J S N E M M J S N
150
b)
¿Qué observa en el gráfico? Se observa que alrededor de diciembre del primer año (2006) algo pasó con los ingresos (cayeron dramáticamente). Esto se conoce como quiebre estructural.
c)
Incluya una línea de tendencia. Incluya en el gráfico la ecuación de la regresión y el coeficiente de determinación.
CAPÍTULO 10
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
US$
y = -1750,5x + 429980 R² = 0,0386
600.000 500.000 400.000 300.000 200.000 100.000 0 E R Y L T V E R Y L T V E R Y L T V E O N A A U E O N A A U E O N A A U E M M J S N E M M J S N E M M J S N
¿Se puede afirmar que la variabilidad de los ingresos es adecuadamente descrita por la variabilidad del tiempo (R 2 )? El R 2 es bastante bajo. Por lo tanto, de acuerdo a este estadístico, se puede concluir que la variabilidad de los ingresos no es adecuadamente descrita por la variabilidad del tiempo. ¿Por qué cree que el R 2 es bastante bajo? d)
e)
Por el problema observado en la parte b) de esta pregunta. f)
Corra la siguiente regresión: yi = α + β1 × x1,i + β 2 × Di + ε i
Donde y corresponde a los ingresos mensuales, x 1 a los meses expresados de manera numérica y D la variable dummy. La solución a este problema se encuentra en la hoja “1 dummy” del archivo “capitulo10_pregunta12_peaje_sol.xlsx”.
151
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
g)
Verifique el cambio en el valor del coeficiente de determinación, ¿a qué cree se debe este cambio? El R 2 ahora es igual a 89%. El cambio se debe al uso de la variable dummy que ha permitido capturar el cambio estructural.
h)
Grafique la línea estimada con la ecuación en el punto f). En este caso ¿se tendrán dos líneas, una para el 2006 y otra para los siguientes años? Como se puede apreciar, se tienen dos líneas: una que corresponde al primer año (2006) y la otra que corresponde a los dos siguientes años. 600.000 500.000 400.000 300.000 200.000 100.000 0 0
5
10
15
20
Ventas en US$
152
25 MCO
30
35
40
CAPÍTULO 10
13)
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
Repita el ejercicio anterior usando EViews. La solución a este problema usando EViews se encuentra en el archivo “capitulo10_pregunta13_peaje_sol.wf1”.
Como se puede apreciar, estos resultados son exactamente iguales a los obtenidos en la pregunta 12. 14)
Se continúa con el ejercicio 12). Se conoce, además, que en el mes de octubre del 2008 (mes 34) el precio del peaje subió. La solución a este problema usando Excel también se encuentra en el archivo “capitulo10_pregunta12_peaje_sol.xlsx”, en la hoja “2 dummy”. a)
Corra la siguiente regresión: yi = α + β1 × x1,i + β 2 × D1,i + β 3 × D2,i + ε i
Donde y corresponde a los ingresos mensuales, x 1 a los meses expresados de manera numérica y D 1 la variable dummy para el cambio en puestos de peaje que toma el valor de 1 para el 2006 y cero después de eso y, D 2 la variable dummy para capturar el efecto del cambio de precios, que toma el valor de cero hasta septiembre del 2008 y 1 a partir de octubre del mismo año. La solución a este problema usando Excel se encuentra en el archivo “capitulo10_ pregunta12_peaje_sol.xlsx”, en la hoja “2 dummy”. La ecuación obtenida es: ventasi = 150.199 + 7.800 × Tiempo + 287.556 × D1 + 86.967 × D2
153
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
154
b)
Interprete sus resultados. En este caso se puede observar que todas las variables son significativas al 5%. En todos los casos el p-valor es igual a 0,00. En lo que respecta a los coeficientes de las dummies, se muestra que estos son significativos y positivos.
c)
Explique el cambio en R 2. De nuevo, el R 2 mejora significativamente debido a que se está modelando de me jor manera los cambios estructurales presentes en los datos.
El modelo de mínimos cuadrados ordinarios (MCO) multivariado
CAPÍTULO 10
d)
Grafique la línea estimada con la ecuación en el punto c). (En este caso ¿se tendrán tres líneas, una para el 2006, otra para el 2007 hasta septiembre del 2008 y otra para los meses restantes meses?) Como se puede observar en la siguiente figura, efectivamente se tendrán tres líneas dependiendo del periodo a considerar. 600.000 500.000 400.000 300.000 200.000 100.000 0 1
3
5
7
9
11 13 15 17 19 21 23 25 27 29 31 33 35 Ventas en US$
MCO
155
CAPÍTULO
11 Prueba de los supuestos del modelo de MCO 1)
¿Cuál es la consecuencia de tener errores heterocedásticos? La presencia de heterocedasticidad no tiene ningún efecto en los coeficientes estimados, los que continuarán siendo insesgados. Sin embargo, ya no serán eficientes, es decir, que no tendrán la mínima varianza entre todos los estimadores insesgados.
2)
¿Cuáles son las causas que pueden causar autocorrelación en los errores? Entre las causas más probables se pueden mencionar las siguientes: •
•
•
3)
La existencia de un patrón estacional. El uso de una forma funcional incorrecta para modelar la relación entre la variable endógena y las variables explicativas. Omisión de variables explicativas que, a su vez, están autocorrelacionadas.
¿Qué mide el test de Durbin-Watson?, ¿se puede emplear este test para ver la autocovarianza de orden 3? No. El test de Durbin-Watson solo se puede emplear para determinar la existencia de autocovarianza de orden 1.
4)
¿Cuál es la consecuencia de tener errores autocorrelacionados? Al igual que en el caso de heterocedasticidad, la presencia de autocorrelación no afecta la propiedad de insesgamiento de los coeficientes. Sin embargo, ante la presencia de
157
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
autocorrelación los parámetros estimados no serán eficientes. Esto significa que las inferencias serán incorrectas. 5)
¿Cuál son las causas de no normalidad de los errores? y, ¿cuáles son las consecuencias de no tener errores que se distribuyan normalmente? Entre las posibles causas de no normalidad se pueden mencionar la presencia de estacionalidad en los datos y la presencia de valores extremos (outliers). Existe un teorema bastante importante conocido como el “ teorema del límite central ”. De acuerdo con este teorema, la distribución de las medias muestrales se distribuye normalmente si el tamaño de la muestra es lo suficientemente grande (por lo general, se asume que esta condición es satisfecha si el número de observaciones en la muestra es mayor que 30). Por lo tanto, si se cuenta con una muestra grande, se puede invocar a este teorema y se puede estar seguro que la distribución de los test estadísticos son correctos aun cuando el supuesto de normalidad no es satisfecho.
6)
En la siguiente tabla se presentan los datos correspondientes al número de minutos hablados por teléfono en un determinado mes, el número de personas mayores de 12 años que viven en un determinado hogar ( x 1 ) y el nivel de ingresos familiares ( x 2 ).
Tabla 2 Minutos
Número integrantes familia (> 12 años)
Ingreso familiar (U.M.)
90
2
2.000
108
3
2.900
122
4
4.000
94
2
2.500
99
3
2.300
106
3
3.000
133
5
4.500
143
6
5.000
104
2
3.000
154
6
5.000
Estos datos se encuentran en el archivo de Excel llamadas_telefonicas_19.xlsx. Para todas las pruebas de hipótesis se supone que el nivel de significancia estadístico es igual al 5%. El documento de EViews que contiene esta información se llama “capitulo11_pregunta6_llamadas_telefonicas.wf1”. a)
158
Usando EViews, realice la siguiente regresión:
= + 1 × 1, + 2 × 2, + .
CAPÍTULO 11
b)
Prueba de los supuestos del modelo de MCO
Realice la prueba de Wald para probar si el coeficiente del intercepto es igual a 55.
Como se puede apreciar, no se puede rechazar la hipótesis nula que el coeficiente del intercepto es igual a 55. c)
De acuerdo a la prueba F-test (análisis de varianza), ¿se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas? Utilice el pvalor de la prueba. El p-valor de la prueba es igual a 0,000001. Por lo tanto, se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas.
159
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
¿Se puede estar seguro que E(ε) = 0? Mientras el intercepto sea considerado, este supuesto siempre será satisfecho.
e)
Presente el gráfico de los errores (residual plot). ¿Puede observar algún indicio de heterocedasticidad?
Si se observa este gráfico parece no haber problemas de heterocedastidad. f)
160
Realice la prueba de heterocedastidad de White. Interprete sus resultados.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
Se asume que el nivel de significancia deseado es del 5% y se utilizan los p-valores para decidir si se rechaza o no la hipótesis nula de homocedasticidad: Prob F(5;4) = 0,2639 > 0,05, en consecuencia, no se rechaza H 0. Prob Chi-square(5) = 0,2117 > 0,05, no se rechaza H 0. En conclusión, basados en el test de White, se puede concluir que los errores de la regresión cumplen el supuesto de homocedasticidad. g)
En caso que la heterocedasticidad esté presente, corrija los errores estándar usando el ajuste por heterocedasticidad de White. Los errores son homocedásticos, por lo que no se necesitan corregir los errores estándar.
h)
Compare sus resultados con la regresión original. ¿Pasa algo con los valores de los coeficientes estimados? No se realiza ningún ajuste por heterocedasticidad.
i)
De acuerdo al test de Durbin-Watson, ¿existe autocorrelación de primer orden en los errores? DW = 1,032391 En el problema que se está analizando, el número de regresores (sin incluir el intercepto) es 2 y el número de observaciones es igual a 10: DW L es igual a 0,697 y DW S es igual a 1,641. Construyendo las zonas críticas se tendrán: 0
0,697
1,641
2
2,359
3,303
4
En este caso el estadístico cae en la zona en la que el DW no pude detectar la presencia de autocorrelación de primer orden. j)
Realice el test de Breusch-Godfrey de orden 5 (5 rezagos). Interprete sus resultados.
161
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
De acuerdo a este test, no se puede rechazar la hipótesis nula de no autocorrelación de orden 5.
162
k)
Si los errores son autocorrelacionados, estime la matriz de varianza-covarianza que es consistente con heterocedasticidad y autocorrelación (Newey-West). Compare sus resultados con la regresión original. No existe autocorrelación, por lo tanto, no se realiza ningún ajuste al modelo.
l)
Verifique la normalidad de los errores usando el test de Jarque-Bera. Interprete sus resultados.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
Como se puede apreciar, no se puede rechazar la hipótesis nula de normalidad. m)
Construya la matriz de correlaciones entre todas las variables, ¿cree que existe la posibilidad de tener problemas de multicolinealidad?
Dada la alta correlación entre las variables es posible tener problemas de multicolinealidad. Una forma de analizar el impacto de esto es correr dos regresiones, una solo con edad y otra con edad e ingresos, y ver si los coeficientes varían dramáticamente. Si no lo hacen, el problema no sería serio. En la situación contraria, se recomendaría solo usar una de las variables y buscar otras que puedan explicar a la variable endógena. n)
Utilice el RESET, test propuesto por Ramsey, para verificar si la forma funcional del modelo es la adecuada.
Como se puede apreciar, no se puede rechazar la hipótesis nula que la forma funcional lineal es la adecuada.
163
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
7)
Se cuenta con información financiera de 12 empresas de los Estados Unidos dedicadas a la publicidad. Las 12 empresas son negociadas en la bolsa de valores de Nueva York (New York Stock Exchange) o en NASDAQ. Se quiere determinar la influencia de la deuda total ( x 1 ) y del total del capital invertido en las empresas ( x 2 ) en la capitalización de mercado de las empresas ( y ). Los datos corresponden al año del 2006, están expresadas en miles de US dólares y fueron obtenidas de Bloomberg. El archivo Excel que contiene esta información es MarketCap_DeudaTotal_CapitalInvertido.xlsx. Para todas las pruebas de hipótesis se asume que el nivel de significancia estadístico es igual al 5%. El documento de EViews que contiene esta información se llama “capitulo11_pregunta7_ MarketCap_DeudaTotal_CapitalInvertido.wf1”.
164
a)
Por medio de EViews, realice la siguiente regresión: = + 1 × 1, + 2 × 2, + .
b)
Realice la prueba de Wald para probar si el coeficiente relacionado con el total de deuda es igual a -5.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
De acuerdo a la prueba F o chi-cuadrada, no se rechaza la hipótesis nula que el coeficiente relacionado con el total de deuda es igual a -5. c)
De acuerdo a la prueba F-test (análisis de varianza), ¿se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas? Utilice el pvalor de la prueba. El p-valor de la prueba es igual a 0,000001. Por lo tanto, se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas.
d)
¿Se puede estar seguro que E(ε) = 0? Mientras el intercepto sea considerado, este supuesto siempre será satisfecho.
e)
Presente el gráfico de los errores (residual plot). ¿Puede observar algún indicio de heterocedasticidad?
165
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
De acuerdo a este gráfico se pueden observar indicios de heteroscedasticidad. f)
Realice la prueba de heterocedastidad de White. Interprete sus resultados.
Se a sume que el nivel de significancia deseado es del 5% y se utilizan los p-valores para decidir si se rechaza o no la hipótesis nula de homocedasticidad: Prob F(5;4) = 0,0122 < 0,05, en consecuencia, se rechaza H 0. Prob Chi-square(5) = 0,0635 > 0,05, no se rechaza H 0. En este caso, en que existe una contradicción entre ambas pruebas, se preferirá el F-test ya que toma en consideración el tamaño de la muestra. Es decir, que cuando la muestra es pequeña se deberá de usar la prueba F. Por lo tanto, se tienen problemas de heterocedasticidad. g)
166
En caso que la heterocedasticidad esté presente, corrija los errores estándar usando el ajuste por heterocedasticidad de White.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
h)
Compare sus resultados con la regresión original, ¿pasa algo con los valores de los coeficientes estimados? Se puede observar que los coeficientes no cambian y que los que sí cambian son los valores de los errores estándar, que decrecen.
i)
De acuerdo al test de Durbin-Watson, ¿existe autocorrelación de primer orden en los errores? En este caso el DW es bastante cercano al valor de 2, por lo que se puede afirmar que no existe autocorrelación de primer orden.
j)
Realice el test de Breusch-Godfrey de orden 5 (5 rezagos). Interprete sus resultados.
167
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
De acuerdo a este test no se puede rechazar la hipótesis nula de no autocorrelación de orden 5.
168
k)
Si los errores son autocorrelacionados, estime la matriz de varianza-covarianza que es consistente con heterocedasticidad y autocorrelación (Newey-West). Compare sus resultados con la regresión original. No existe autocorrelación, por lo tanto, no se realiza el ajuste de Newey-West al modelo.
l)
Verifique la normalidad de los errores usando el test de Jarque-Bera. Interprete sus resultados.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
Como se puede apreciar, no se puede rechazar la hipótesis nula de normalidad. m)
Construya la matriz de correlaciones entre todas las variables, ¿cree que existe la posibilidad de tener problemas de multicolinealidad?
Dada la alta correlación entre las variables es posible tener problemas de multicolinealidad. Una forma de analizar el impacto de esto es correr dos regresiones, una solo con deuda y otra con deuda e inversión, y ver si los coeficientes varían dramáticamente. Si no lo hacen, el problema no sería serio. En el caso contrario, se recomendaría solo usar una de las variables y buscar otras que puedan explicar a la variable endógena.
169
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
n)
Utilice el RESET, test propuesto por Ramsey, para verificar si la forma funcional del modelo es la adecuada.
Como se puede apreciar, no se puede rechazar la hipótesis nula que la forma funcional lineal es la adecuada. 8)
Se cuenta con datos anuales correspondientes al ingreso neto, ingreso financiero (por intereses) y las provisiones por pérdidas, desde el año 1934 al año 2009, las mismas que fueron obtenidas de la página de internet de la Federal Deposit Insurance Corporation (FDIC) de los Estados Unidos (http://www2.fdic.gov/hsob/hsobRpt.asp). Los datos presentan valores agregados de todos los bancos comerciales en ese país expresados en miles de US dólares. El archivo Excel que contiene esta información es IngresoNeto_ IngresoInteres_Provisiones.xlsx. Para todas las pruebas de hipótesis se asume que el nivel de significancia estadístico es igual al 5%. El documento de EViews que contiene esta información se llama “capitulo11_pregunta8_ ingresoneto_ingresointeres_provisiones.wf1”.
170
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
a)
Use EViews, realice la siguiente regresión: = + 1 × 1, + 2 × 2, + .
b)
Realice la prueba de Wald para probar si el coeficiente relacionado con las provisiones es igual a -1.
De acuerdo a la prueba F o chi-cuadrada, se rechaza la hipótesis nula que el coeficiente relacionado con provisiones es igual a -1.
171
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
c)
De acuerdo a la prueba F-test (análisis de varianza), ¿se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas? Utilice el pvalor de la prueba. El p-valor de la prueba es igual a 0,000001. Por lo tanto, se puede afirmar que existe una relación lineal entre la variable endógena y las variables exógenas.
d)
¿Se puede estar seguro que E(ε) = 0? Mientras el intercepto sea considerado, este supuesto siempre será satisfecho.
e)
Presente el gráfico de los errores (residual plot). ¿Puede observar algún indicio de heterocedasticidad?
En este caso se presenta el gráfico de los errores, ya que la tabla es bastante grande. Como se puede apreciar existe bastante evidencia de problemas de heterocedasticidad.
172
CAPÍTULO 11
f)
Prueba de los supuestos del modelo de MCO
Realice la prueba de heterocedasticidad de White. Interprete sus resultados.
Se asume que el nivel de significancia deseado es del 5% y se utilizan los p-valores para decidir si se rechaza o no la hipótesis nula de homocedasticidad: Prob F(5;4) = 0,000 < 0,05, en consecuencia, se rechaza H 0. Prob Chi-square(5) = 0,000 < 0,05, se rechaza H0. En este caso, es claro que se tienen problemas de heterocedasticidad. g)
En caso que la heterocedasticidad esté presente, corrija los errores estándar usando el ajuste por heterocedasticidad de White.
173
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
h)
Compare sus resultados con la regresión original, ¿pasa algo con los valores de los coeficientes estimados? Se puede observar que los coeficientes no cambian y que lo que si cambia son los valores de los errores estándar, los que decrecen.
i)
De acuerdo al test de Durbin-Watson, ¿existe autocorrelación de primer orden en los errores? El estadístico de DW = 0,593802 En el problema que se está analizando, el número de regresores (sin incluir el intercepto) es 2 y el número de observaciones es igual a 76. En la tabla de los valores de esta prueba no se tienen exactamente los valores que corresponden a 76. Solo se cuenta con valores que corresponden a 75. Se utilizará este número, que será una buena aproximación de los valores deseados. En este caso: DW L es igual a 1,571 y DW S es igual a 1,680. Construyendo las zonas críticas se tendrán: 0
1,571
1,680
2
2,320
2,429
4
En este caso el estadístico cae en la zona en la que el DW indica la presencia de autocorrelación positiva. j)
174
Realice el test de Breusch-Godfrey de orden 5 (5 rezagos). Interprete sus resultados. Como se puede observar a continuación, de acuerdo a este test se puede rechazar la hipótesis nula de no autocorrelación de orden 5. Por lo tanto, se tienen claramente problemas de autocorrelación de los errores.
CAPÍTULO 11
k)
Prueba de los supuestos del modelo de MCO
Si los errores son autocorrelacionados, estime la matriz de varianza-covarianza que es consistente con heterocedasticidad y autocorrelación (Newey-West). Compare sus resultados con la regresión original.
Se puede observar que los coeficientes no cambian y que los que sí cambian son los valores de los errores estándar, que decrecen aún más. l)
Verifique la normalidad de los errores usando el test de Jarque-Bera. Interprete sus resultados.
175
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Como se puede apreciar, no se puede rechazar la hipótesis nula de normalidad. m)
Construya la matriz de correlaciones entre todas las variables, ¿cree que existe la posibilidad de tener problemas de multicolinealidad?
En este caso, la correlación entre las variables no es tan alta como en las preguntas anteriores. Sin embargo es aún posible tener problemas de multicolinealidad. n)
176
Utilice el test RESET propuesto por Ramsey para verificar si la forma funcional del modelo es la adecuada.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
Como se puede apreciar, se rechaza la hipótesis nula que la forma funcional lineal es la adecuada. Por lo tanto, se deben probar modelos adicionales. Una sugerencia seria correr el modelo aumentando la regresión inicial con los regresores al cuadrado. En la siguiente figura se presenta el caso en que se ha incluido el cuadrado de los ingresos financieros.
177
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
o)
Utilice el test de errores de predicción, verifique la estabilidad de los parámetros estimados. El punto donde se iniciará el pronóstico será en el 2007.
Se recuerda que las hipótesis son: H 0 : H1 :
Los errores de la predicción son ceros para todas las predicciones
( los parámetros estimados son estables) Los errores de la predicción no son ceros para todas las predicciones
( los parámetros estimados
no
son estables)
En base a los resultados del test se rechaza la hipótesis nula. p)
178
Verifique lo encontrado en la pregunta o), pero esta vez empleando el método de las variables dummies. Se crean las variables “dum1”, “dum2” y “dum3” que tendrán puros ceros hasta la observación 74, 75 y 76, respectivamente. Y, en las mencionadas posiciones tendrán el numero 1. Y se corre la regresión tal como se mostró en el capítulo 11. Los resultados se presentan a continuación.
CAPÍTULO 11
Prueba de los supuestos del modelo de MCO
Como Como se puede apreciar los coeficientes asociados a las dummies son significativas, lo que sustenta nuestra conclusión de la pregunta anterior. Para asegurarse de esto se verá si todos los coeficientes relacionados con las variables dummies son cero. Para eso se emplea el test de Wald. Los resultados de esta prueba son los siguientes:
Como se puede apreciar se rechaza la hipótesis nula de no significancia signif icancia estadística estadíst ica de los coeficientes de las dummies. Por lo que que se estará e stará seguro de afirmar afirma r que los parámetros no son estables. 179
CAPÍTULO
12 Modelos de series de tiempo 1)
¿Es una serie de tiempo t iempo un proceso estocástico? Un proceso estocástico es una secuencia de números aleatorios. El proceso estocástico se escribirá como { y i } para i = 1, 2,… Si este índice representa tiempo, el proceso estocástico se llamará serie de tiempo.
2)
¿Por qué el tener una sola realización de algún proceso estocástico representa un problema para el cálculo c álculo de los parámetros pará metros poblacionales? poblacionales? El principal problema en los modelos de series de tiempo es que en la realidad solo se observa el proceso estocástico en una de sus varias posibles realizaciones. Por lo tanto, solo se puede obtener obtener un set de estadísticos e stadísticos (media, varianza, varianza , etc.) dadas las observaciones disponibles. disponibles. En teoría, si se pudieran observar todas las posibles realizaciones del proceso estocástico, se podrían calcular los parámetros poblacionales (tal como la media poblacional) simplemente como el promedio de todas las realizaciones.
3)
En palabras, ¿cómo define un proceso estacionario? estacionario? El concepto de estacionariedad en en síntesis significa que todas las la s observaciones observaciones de las series de tiempo provienen de la misma distribución de probabilidad y que, si a su vez el proceso no es muy persistente, cada observación contendrá información valorable que no está presente en ninguna de las otras observaciones, por lo que los estadísticos obteobtenidos de las observaciones serán consistentes con sus respectivos parámetros poblacionales. Por ejemplo, la media de estas observaciones en el tiempo será consistente con la media poblacional. poblacional. 181
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
4)
¿Qué es una serie estacionaria con tendencia? Es una serie no estacionaria simplemente porque tienen una tendencia determinística. Es decir, que si se remueve la tendencia, tendencia, la serie de tiempo se convertirá convertirá en una serie estacionaria.
5)
¿Qué es una serie estacionaria en diferencias? Una serie de tiempo que no es estacionaria pero que su diferencia sí lo es, se conoce como serie estacionaria en diferencias.
6)
¿Es un proceso de ruido blanco un proceso estacionario e stacionario débil? débil? El proceso de ruido ru ido blanco (White Noise Process) es un proceso débilmente estacionario con media constante y no autocorrelación.
7)
¿Cuál es la diferencia entre las pruebas de Box-Pierce and Ljung-Box? Y, ¿cuál es recomendable mendable usar cuando la muestra es pequeña? Ambas pruebas se distribuyen distribuyen como como una chi cuadrada debido debido a que n × ρ ˆ es asintó a sintótiticamente independiente independiente y distribuido d istribuido como una normal estándar. Por lo tanto, la suma al cuadrado de estos números es asintóticamente chi-cuadrada. Los grados de libertad de esta distribución son iguales a m, que representa el número de rezagos deseados. El método de Ljung-Box es preferido cuando el tamaño de la muestra es pequeño. Como se puede observar, la diferencia entre estos e stos dos métodos desaparece conforme n (número de observaciones) se incrementa.
8)
0,8 89; 2 = 0,49; 3 = 0,0 Se tienen las siguientes autocorrelaciones autocorrelaciones estimadas: 1 = 0, ,07 7. Determinar si esta serie de tiempo es estacionaria usando el criterio de los intervalos de confianza y las pruebas de Box-Pier Box-Pierce ce y Ljung-Box. Ljung-Box. Asuma que el nivel de confianza confi anza estadístico deseado es del 95% y que el número de observaciones es 100.
De acuerdo al criterio de los intervalos de confianza se tendría (asumiendo un nivel de confianza del 5%):
ρ ∈ ±1, 96 ×
→ ρ ∈ [−0,196; 0,196] 100 1
Por Por lo tanto, las dos primeras autocorrelacion autocorrelaciones es serían significativas, mientras que la ultima no lo sería. Se utiliza la prueba de Box-Pierce: Box − Pierce(Q ) =
m
∑(
ˆ j ) = ( 100 × 0, n × ρ 0, 89) + ( 100 × 0, 0, 49) + ( 100 × 0, 0, 07) 2
j =1
,71 Box − Pierce(Q) = 103,71 Ljung − Box(Q) =
m
j =1
182
n+2
∑ n − j ×(
ˆ j ) 2 n ρ
2
2
2
Modelos de series de tiempo
CAPÍTULO 12
100 + 2 100 + 2 100 + 2 × ( 100 × 0,89)2 + × ( 100 × 0, 49) 2 + × ( 100 × 0, 07) 2 100 − 1 100 − 2 100 − 3
Ljung − Box(Q) =
Ljung − Box(Q) = 107,12
La hipótesis nula en este caso es: H 0 : ρ1 = ρ 2 = ρ 3 = 0
Lo que se prueba es la no existencia de autocorrelación de hasta tercer orden. Se conoce que ambas pruebas se distribuyen como una chi cuadrada con 3 grados de libertad (m = 3). Si se desea un nivel de significancia del 5% (es una prueba no direccional, por lo que cada cola será igual al 2,5%), el valor crítico superior de la chi cuadrada para estos grados de libertad será igual a 9,3484. Por lo tanto, como los valores de las pruebas son 103,71 y 107,12, para el Box-Pierce and Ljung-Box, respectivamente, se rechazará la hipótesis nula. Lo que significa que existe autocorrelación significativa hasta el tercer rezago. 9)
¿En los modelos de series de tiempo univariados, ¿se asume que los errores son ruidos blancos? Este supuesto es usual y es más débil que asumir que los errores son i.i.d. (independientes e idénticamente distribuidos).
10)
Escriba la ecuación de un modelo MA(4). yt = µ + ut + θ1 × ut −1 + θ 2 × ut −2 + θ3 × ut −3 + θ 4 × u t − 4
11)
Escriba la ecuación de un modelo AR(3). yt = µ + φ1 × yt −1 + φ2 × yt −2 + φ3 × yt −3 + ut
12)
¿Por qué es importante la condición de invertibilidad del proceso MA(q)? Porque con esta condición se asegura que el proceso MA es estacionario, es decir, que el proceso tiende a volver a su media de largo plazo.
13)
¿Por qué es importante la condición de estacionariedad del proceso AR(p)? Porque con esta condición se asegura que el proceso AR es estacionario, es decir, que el proceso tiende a volver a su media de largo plazo.
14)
¿Si un proceso AR(p) es estacionario, podrá expresarse como un proceso MA(∞)? Correcto. Esto se llama teorema de descomposición de Wold . Observe las ecuaciones (76) a (82) del capítulo 12.
15)
En un proceso MA(5), ¿cuántas autocorrelaciones distintas de cero se tendrán? Se tendrán 5, después de eso las autocorrelaciones serán cero.
183
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
16)
En un proceso AR(5), ¿cuántas autocorrelaciones distintas de cero se tendrán? Infinitas. En un proceso AR las autocorrelaciones decaen asintóticamente.
17)
¿Es un proceso con raíz unitaria un proceso estacionario? No. Un proceso con raíz unitaria en un proceso no estacionario.
18)
Escriba la ecuación de un modelo ARMA(3,4). yt = µ + φ1 × yt −1 + φ2 × yt −2 + φ3 × yt −3 + ut + θ1 × ut −1 + θ2 × ut −2 +θ3 × ut −3 +θ4 ×u t −4
19)
Si tiene un proceso en el que las autocorrelaciones son iguales a cero después de 2 rezagos y donde las autocorrelaciones parciales decaen asintóticamente, ¿qué modelo univariado de series de tiempo podría ser el adecuado? El modelo más adecuado es MA(2).
20)
Si tiene un proceso en el que las autocorrelaciones y las autocorrelaciones parciales decaen asintóticamente, ¿qué modelo univariado de series de tiempo podría ser el adecuado? ARMA(p,q), donde p y q se tienen que determinar usando algún criterio de información.
21)
¿Qué se entiende por parsimonia? En modelos de series de tiempo la idea de parsimonia se refiere a que siempre se preferirá un modelo con un menor número de rezagos si la influencia marginal de incluir rezagos adicionales en el modelo es baja.
22)
Si se tiene un pronóstico cuyo MAPE es menor que 1, ¿puede afirmar que estos pronósticos son mejores que los pronósticos de un modelo de camino aleatorio? Correcto.
23)
En términos de la descomposición de los errores de predicción, ¿se desea que el componente de correlación sea el que es mayor?, ¿por qué? Porque se desea que los pronósticos sean insesgados y eficientes. Por lo que se espera que los componentes del insesgamiento y de la varianza sean bastante bajos.
24)
Se tiene información presentada en la hoja de Excel peaje_2007_2008.xlsx. Este archivo contiene los ingresos mensuales en miles de US dólares por concepto de cobro de peaje de una empresa dedicada a la administración de carreteras. Los datos corresponden a los años 2007 al 2008 (24 observaciones). Con base en estos datos y asumiendo un nivel de significancia estadístico del 5%, responder usando EViews (sugerencia: diferencie dos veces la serie para hacerla estacionaria y poder estimar el modelo). El archivo de EViews que contiene la solución de este problema se llama: “capitulo12_ problema24_ peaje_2007_2008.wf1”
184
CAPÍTULO 12
Modelos de series de tiempo
a) Grafique la serie:
b)
Visualmente, ¿es la serie es estacionaria? No es estacionaria.
c)
Convierta la serie a retornos (para las siguientes preguntas trabaje con esta serie). La serie se llama “drpeaje”. Se generó de la siguiente manera: genr rpeaje=(peaje-peaje(-1))/peaje(-1) Y para convertir esta serie que aún no es estacionaria se toma la diferencia de la misma: genr drpeaje=d(rpeaje) Es con esta serie que se trabajará.
185
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
d)
Determine el modelo de series de tiempo que mejor se ajuste a la serie de los retornos. Use el método gráfico y los criterios de información. Por el método gráfico parece que la serie es una serie de ruido blanco. Se utilizan los criterios de información y el modelo que mejor se acomoda a los datos de acuerdo al AIC es ARMA(5,1). La siguiente tabla presenta los resultados.
AR ↓ / MA → 1 2 3 4 5
1
2
3
4
5
AIC
-2,399937
-2,144301
-3,036256
-3,097501
-2,262856
BIC
-2,367553
-1,945345
-2,787560
-2,799066
-1,914681
AIC
-2,351186
-2,286551
-2,105357
-1,838040
-2,730849
BIC
-2,152040
-2,037618
-1,806637
-1,489534
-2,332556
AIC
-2,238808
-2,739238
-2,713945
-2,643450
-2,662308
BIC
-1,990272
-2,440994
-2,365994
-2,245792
-2,214942
AIC
-2,444835
-2,696527
-2,035197
-3,002999
-2,874146
BIC
-2,148045
-2,350271
-1,639476
-2,557813
-2,379495
AIC
-3,382618
-3,165640
-1,831467
-2,977382
-1,335567
BIC
-3,039530
-2,773540
-1,390355
-2,487256
-0,796429
Sin embargo, cuando se corre la regresión se puede apreciar que el proceso MA es uno no invertible, por lo que el modelo final será un modelo AR(5).
Como se puede observar este modelo es estacionario.
186
CAPÍTULO 12
Modelos de series de tiempo
e)
Realice el pronóstico estático de los últimos tres meses (2008:10 al 2008:12).
f)
Determine la calidad de los pronósticos con base en los criterios de evaluación presentados. En lo que se refiere al MAPE, si este es menor que 1 (o 100%), significa que el modelo que se está utilizando es mejor que el modelo de caminos aleatorios. En este ejemplo, ese es el caso, el MAPE es igual al 40,44138%. Asimismo, el coeficiente de desigualdad de Theil es significativamente menor que 1, lo que significa que el modelo utilizado es mejor que el modelo de caminos aleatorios.
g)
Grafique los datos pronosticados con los datos reales.
187
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
25)
Se cuenta con datos anuales correspondientes al ingreso neto de los bancos de los Estados Unidos, desde el año 1980 al año 2009. Estos datos han sido obtenidos de la página de internet de la Federal Deposit Insurance Corporation (FDIC) de los Estados Unidos (http://www2.fdic.gov/hsob/hsobRpt.asp). Los datos presentan valores agregados de todos los bancos comerciales en ese país expresados en miles de US dólares. El archivo Excel que contiene esta información es Bancos_IngresoNeto_1980_2009.xlsx. Con base en estos datos y asumiendo un nivel de significancia estadístico del 5%, responda usando EViews: El archivo de EViews que contiene la solución de este problema se llama: “capitulo12_ problema25_ Bancos_IngresoNeto_1980_2009.wf1” a)
Grafique la serie.
b)
Visualmente, ¿es la serie es estacionaria? No.
c)
Convierta la serie a retornos (para las siguientes preguntas trabaje con esta serie). La serie se llama “ring”. Se generó de la siguiente manera: genr ring=(ingreso- ingreso (-1))/ ingreso (-1)
d)
188
Determine el modelo de series de tiempo que mejor se ajuste a la serie de los retornos. Use el método gráfico y los criterios de información. Por el método gráfico parece que la serie en una serie de ruido blanco. Al utilizar los criterios de información, el modelo que mejor se acomoda a los datos de acuerdo al AIC es ARMA(2,3). En este caso se emplean 4 rezagos asumiendo que la influencia máxima son 3 años. La siguiente tabla presenta los resultados.
CAPÍTULO 12
AR ↓ / MA → 1 2 3
Modelos de series de tiempo
1
2
3
AIC
3,793366
3,746353
3,816016
BIC
3,888523
3,889089
4,006331
AIC
3,908946
3,668110
3,453164
BIC
4,052928
3,860085
3,693134
AIC
3,862707
3,784971
3,616057
BIC
4,056260
4,026912
3,906387
e)
Realice el pronóstico estático de los últimos tres años (2007 al 2009).
f)
Determine la calidad de los pronósticos con los criterios de evaluación presentados. En lo que se refiere al MAPE, si este es menor que 1 (o 100%), significa que el modelo que se está utilizando es mejor que el modelo de camino aleatorio. En este ejemplo, ese no es el caso, el MAPE es igual al 115,1498%. Sin embargo, el coeficiente de desigualdad de Theil es significativamente menor que 1, lo que significa que el modelo utilizado es mejor que el modelo de camino aleatorio. En este caso, lo que puede haber pasado es que un solo error de pronóstico puede haber causado que el MAPE sea mayor que 100%. Por esto se prefiere al coeficiente de desigualdad de Theil.
189
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
g)
Grafique los datos pronosticados con los datos reales.
Donde “ringf” es el pronóstico de la serie. 26)
Utilice internet busque los datos diarios que correspondan a los años 2009 y 2010 del índice financiero de NASDAQ (sugerencia: buscar en Yahoo Finance). Con estos datos y asumiendo un nivel de significancia estadístico del 5%, responda usando EViews. La serie usada corresponde al 2 de enero del 2009 al 31 de diciembre del 2010. Los datos y las respuestas a las preguntas se encuentran en el archivo de EViews “capitulo12_ problema26_nasdaq_2009_2010.wf1”. a)
190
Grafique la serie.
CAPÍTULO 12
b)
Visualmente, ¿es la serie estacionaria? No.
c)
Convierta la serie a retornos (para las siguientes preguntas trabaje con esta serie). Se utiliza el comando EViews “dlog” para calcular los retornos en logaritmos de la serie NASDAQ. La nueva serie se llama “ret” y cuyo gráfico se presenta a continuación:
d)
Determine el modelo de series de tiempo que mejor se ajuste a la serie de los retornos. Use el método gráfico y los criterios de información.
AR ↓ / MA → 1 2 3 4 5
Modelos de series de tiempo
1
2
3
4
5
AIC
-5.520749
-5.527939
-5.524351
-5.521641
-5.519519
BIC
-5.495538
-5.494325
-5.482333
-5.471220
-5.460694
AIC
-5.526833
-5.522938
-5.531490
-5.531424
-5.585655
BIC
-5.493168
-5.480856
-5.480992
-5.472509
-5.518324
AIC
-5.522276
-5.542327
-5.599040
-5.574010
-5.592924
BIC
-5.480130
-5.491752
-5.540036
-5.506576
-5.517061
AIC
-5.531202
-5.541879
-5.594016
-5.589944
-5.615341
BIC
-5.480549
-5.482785
-5.526480
-5.513965
-5.530920
AIC
-5.524775
-5.520783
-5.590047
-5.586177
-5.615525
BIC
-5.465589
-5.453143
-5.513952
-5.501627
-5.522520
De acuerdo al criterio de AIC el mejor modelo es al ARMA(4,5) y de acuerdo al BIC es el ARMA(3,3). Por parsimonia, se escogerá el modelo seleccionado con el BIC.
191
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
e)
Realice el pronóstico estático de los últimos tres meses (2010:10 al 2010:12). Primero, se estima el modelo cuyos resultados se presentan a continuación:
Se pronosticarán los retornos de los últimos dos meses del 2010 (desde la observación 455 a la observación 504). El resultado del pronóstico se muestra a continuación:
192
CAPÍTULO 12
f)
g)
Modelos de series de tiempo
Determine la calidad de los pronósticos en base a los criterios de evaluación presentados. En lo que se refiere al MAPE, si este es menor que 1 (o 100%), significa que el modelo que se está utilizando es mejor que el modelo de caminos aleatorios. En este ejemplo, ese no es el caso, el MAPE es igual al 374,0100%. Sin embargo, el coeficiente de desigualdad de Theil es significativamente menor que 1, lo que significa que el modelo utilizado es mejor que el modelo de camino aleatorio. En este caso, lo que puede haber pasado es que un solo error de pronóstico puede haber causado que el MAPE sea mayor que 100%. Por esto se prefiere al coeficiente de desigualdad de Theil. Asimismo, se puede observar que el “bias proportion” es bastante cercano a cero (lo que indica que los pronósticos son insesgados) y el “variance proportion” es pequeño comparado con el “covariance proportion” (es algo deseado). En base a esto se puede afirmar que los pronósticos creados con el modelo ARMA(3,3) son mejores que los que se pudieran haber obtenido con el modelo de camino aleatorio. Grafique los datos pronosticados con los datos reales.
193
CAPÍTULO
13 Modelos para la volatilidad volatilidad condicional: Los modelos de heteroscedasticidad condicional autorregresiva
1)
¿Qué entiende por movimientos de agrupados de volatilidad (Volatility Clustering)? Los movimientos de volatilidad agrupados se observan frecuentemente en las series de los retornos retornos de las acciones cotizadas en las bolsas de valores. Estos movimientos movimientos se deben a que grandes cambios en los precios de las acciones acciones tienden a ser seguidas de grandes cambios, de cualquier signo, y pequeños cambios son seguidos de pequeños cambios. Este movimiento en los retornos, a su vez, genera similar comportamiento comportamiento en la volatilidad del instrumento financiero. Es decir que, grandes cambios de volatilidad tienden a seguir grandes cambios mientras que pequeños cambios de volatilidad tienden a seguir segui r pequeños cambios.
2)
Explique cómo el modelo ARCH captura los movimientos agrupados de volatilidad. El modelo ARCH es capaz de capturar este e ste tipo de movimiento de la volatilidad. Para observar esto se debe examinar la última parte de la Ecuación (9). En esta ecuación se puede advertir que la volatilidad condicional es una función de los errores al cu cuadrado. adrado. Por lo tanto, si u t-1 fue grande en términos absolutos, se espera que las siguientes va-
195
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
rianzas rianza s condicionales condicionales sean también grandes. Asimismo, si u t-1 fue pequeña, por el modelo la varianza condicional, en el período t, t+1, etc., también será pequeña. 3)
Explique la condición de estacionariedad del modelo ARCH. La varianza varia nza incondicional incondicional del modelo ARCH está dada por: ω
σ 2 = E ( µ t 2 ) =
1−
q
∑ α
(14)
j
j =1
Se advierte que para asegurar la no negatividad de la varianza, se requiere que ω y α j , q
para j = 1, 2,…, q, sean no negativos y que ∑ α j sea menor que la unidad. A esta e sta condi j =1 ción se le conoce como la condición de estacionariedad . 4)
¿Cuáles son los principales problemas del modelo ARCH? El principal problema con el modelo ARCH es que muchas veces el número de rezagos (q) requeridos es bastante grande. Esto presenta una serie de problemas generados por la no parsimonia del modelo, entre los cuales el más grave gr ave es el que la condición de no negatividad puede ser violada, lo que significa que se pueden obtener varianzas condicionales negativas. Otro problema del modelo ARCH es el hecho mismo de la determinación del número óptimo de rezagos a utiliza utilizarr (q). (q). Hasta ahora a hora no existe un método universalmente universalmente aceptado.
5)
¿Cuál es la intuición detrás del uso del modelo ARCH-M? ARCH-M? En finanzas existe una relación que es de bastante uso: la relación entre riesgo y rentabilidad. La idea básica es que a más riesgo se exigirá más rentabilidad, es decir, que el riesgo tiene un precio que debe ser considerado. En términos de lo que se está analizando, esto significa que la ecuación de la media condicional debe considerar el efecto de la varianza varian za condicional. condicional.
6)
Exprese el modelo GARCH (1,1) en un modelo ARCH (∞). σ = 2 t
ω (1 − β )
∞
+ α ∑ β j −1ut2− j j =1
Para ver la forma en que se arriba a esta ecuación se recomienda ver las ecuaciones (94) (94) a (98) del capítulo 13. 7)
¿Puede el modelo GARCH modelar la asimetría de los movimientos movimientos de la volatilidad? No, pero existen varias modificaciones del modelo GARCH que permiten capturar esta asimetría: los modelos TARCH, EGARCH y el modelo de componentes ARCH, son ejemplos de modelos que pueden capturar asimetrías.
196
CAPÍTULO 13
8)
Modelos para la volatilidad condicional
Explique el concepto concepto del efecto de apalancamiento apa lancamiento y las posibles causas del mismo. El efecto de apalancamiento apa lancamiento se refiere al a l hecho que cuando el precio de las acciones cae, el ratio de apalancamiento apala ncamiento,, definido como los pasivos divididos por el capital social de la empresa, crece. Desde el punto de vista de los accionistas, este incremento implica que los flujos de caja futuros son más inciertos, por lo que su reacción frente a caídas en los precios de las acciones, movimientos adversos, será mucho más acentuada que en el caso de observarse movimientos al alza de los precios. precios.
9)
Utilice internet y busque los datos diarios que correspondan a los años 2000 al 2010 del índice financiero de NASDAQ (sugerencia: buscar en Yahoo Finance). Con base en estos datos y asumiendo un nivel de significancia estadístico del 5%, responda usando EViews: Los datos de este ejercicio se encuentran en “Nasdaq_2000_2010.xlsx” y la solución del problema en “capitulo “capitu lo13_problema9_ 13_problema9_ Nasdaq_2000 Nasdaq_ 2000_201 _2010. 0.wf1” wf1”.. a)
Grafique la serie de los retornos.
b)
De acuerdo al gráf ico de la pregunta anterior, anterior, se puede decir que existen movimientos agrupados agr upados de volatilidad (Volatility (Volatility Clustering), explique. explique. Como se puede observar, observar, los retornos tienden tienden a agruparse agr uparse y ocurrir ocurri r en grupos gr upos claramente definidos por periodos de gran volatilidad y otros de baja volatilidad. Obsérvese, por ejemplo, el movimiento de los retornos durante las observaciones 2.200-2.500 2.200-2.500 que corresponden a los años 2008 y 2009 (gran (gra n volatilidad), en comparación con el correspondiente a los 2004-2006 (baja volatilidad).
197
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
c)
Determine la existencia de efectos ARCH en esta serie de tiempo. Al seguir el procedimiento señalado en el capítulo, se obtiene:
Como el p-valor (0,0000) es menor que el nivel de significancia estadístico (5%), se rechaza la hipótesis nula, lo que quiere decir que la serie de retornos del índice de NASDAQ presenta efectos ARCH, los cuales se necesitan modelar adecuadamente. d)
198
Modele la media condicional como un modelo AR(2) y la varianza condicional como un modelo GARCH(1,1).
CAPÍTULO 13
e)
Modelos para la volatilidad condicional
Analice los resultados obtenidos en el punto d): verifique la significancia estadística de cada uno de los coeficientes del modelo. Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la muestra. Use el método dinámico. Si se observan los resultados de la media condicional se puede advertir que el p-valor de la media incondicional (c) es estadísticamente significativo (el p-valor es igual a 0,000, que es menor que 0,05, por lo que se rechaza la hipótesis nula que el intercepto es igual a cero). Asimismo, se puede apreciar que el coeficiente del AR(2) es significativo, lo que puede sugerir que este modelo es adecuado para modelar la media condicional del índice. Ahora se pasan a analizar los resultados de la varianza condicional, la cual se ha modelado como un modelo GARCH(1,1). Para seguir con la terminología del modelo presentado en la Ecuación (19), el coeficiente “C” corresponde a ω, “RESID(-1)^2” corresponde a α y “GARCH(-1)” a β. Se procede a verificar si los supuestos del modelo se satisfacen: primero, todos los coeficientes son positivos; segundo, la condición de estacionariedad ( α + β < 1) es satisfecha. Al tomar estos dos supuestos a la vez, se puede estar seguro que la varianza incondicional, Ecuación (24), será positiva. Finalmente todos los coeficientes de la parte GARCH son significativos. El pronóstico de los últimos 20 días:
199
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
10)
f)
Determine la calidad de los pronósticos con base en los criterios de evaluación presentados en el capítulo 12. La primera parte del gráfico presenta los pronósticos de la media condicional y la segunda parte a la volatilidad condicional. En el caso de la varianza condicional se puede advertir que esta estuvo debajo del promedio de la varianza incondicional, por lo que se observa que en el tiempo estos pronósticos tienden a ese promedio de largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se puede apreciar que el MAPE y el índice de Theil son menores que 100% y 1, respectivamente. Esto significa que los pronósticos del modelo son mejores que los pronósticos del modelo de camino aleatorio.
g)
Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la muestra. Use el método estático.
Use los datos recolectados en la pregunta 9 y realice lo siguiente: La solución del problema en “capitulo13_problema10_ Nasdaq_2000_2010.wf1”. a)
200
Utilice EViews, modele la media condicional como un modelo AR(1) y la varianza condicional como un modelo TARCH con “threshold” igual a 1.
CAPÍTULO 13
b)
Modelos para la volatilidad condicional
Analice los resultados obtenidos en el punto a): verifique la significancia estadística de cada uno de los coeficientes del modelo. Recuerde que el nivel de significancia deseado es igual al 5%. En los resultados presentados en la pregunta a), el término γ × ut2−1 × d t −1 de la Ecuación (27) corresponde a “RESID (-1)^2*(RESID (-1)<0)”. Por lo tanto, este término representa el efecto de las malas noticias en la varianza condicional. Se puede observar que este coeficiente es significativo e igual a 0,110607. Como es estadísticamente significativo y mayor que 0, se puede afirmar que el efecto apalancamiento está presente y que, además, como este coeficiente es distinto de cero, se puede formular que la curva del impacto de las noticias es asimétrico.
c)
En base a su respuesta de la pregunta b), ¿se puede afirmar que el efecto de apalancamiento está presente en la serie de tiempo? Como el coeficiente de asimetría es estadísticamente significativo y mayor que 0, se puede afirmar que el efecto apalancamiento está presente.
d)
En base a su respuesta de la pregunta b), ¿se puede verificar la asimetría de la respuesta de la volatilidad? Como este coeficiente es distinto de cero, se puede formular que la curva del impacto de las noticias es asimétrica.
201
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
11)
e)
Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la muestra. Use el método dinámico.
f)
Determine la calidad de los pronósticos con base en los criterios de evaluación presentados en el capítulo 12. La primera parte del gráfico presenta los pronósticos de la media condicional y la segunda parte al de la volatilidad condicional. En el caso, de la varianza condicional, se puede advertir que esta estuvo debajo del promedio de la varianza incondicional, por lo que se observa que en el tiempo estos pronósticos tienden a ese promedio de largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se puede apreciar que el MAPE y el índice de Theil son menores que 100% y 1, respectivamente. Esto significa que los pronósticos del modelo son mejores que los pronósticos del modelo de camino aleatorio.
Utilice los datos recolectados en la pregunta 9 y realice lo siguiente: La solución del problema en “capitulo13_problema11_ Nasdaq_2000_2010.wf1”. a)
202
Use EViews, modele la media condicional como un modelo AR(1) y la varianza condicional como un modelo EGARCH(1,1).
CAPÍTULO 13
Modelos para la volatilidad condicional
b)
Analice los resultados obtenidos en el punto a): verifique la significancia estadística de cada uno de los coeficientes del modelo. Recuerde que el nivel de significancia deseado es igual al 5%. En el gráfico de la pregunta a) se puede observar que el coeficiente γ es estadísticamente significativo (p-valor = 0.000) y negativo ( γ = − 0,087477).1 Esto último implica que el efecto de apalancamiento está presente y, finalmente, como γ es distinto de cero, el impacto de las noticias (buenas o malas) en la varianza condicional es asimétrico.
c)
En base a su respuesta de la pregunta b), ¿se puede afirmar que el efecto de apalancamiento está presente en la serie de tiempo? Como el coeficiente γ es estadísticamente significativo y negativo. Esto último implica que el efecto de apalancamiento está presente
d)
En base a su respuesta de la pregunta b), ¿se puede verificar la asimetría de la respuesta de la volatilidad? Como γ es distinto de cero, el impacto de las noticias (buenas o malas) en la varianza condicional es asimétrico.
1 Nótese, que este coeficiente corresponde a C(4), tal como se puede apreciar en la siguiente ecuación presentada en la misma ventana de resultados de EViews: LOG(GARCH) = C(3) + C(4)*ABS(RESID(-1)/@SQRT(GARCH(-1))) + C(5)*RESID(-1)/@SQRT(GARCH(-1)) + C(6)*LOG(GARCH(-1)).
203
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
204
e)
Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la muestra. Use el método dinámico.
f)
Determine la calidad de los pronósticos con base en los criterios de evaluación presentados en el capítulo 20. La primera parte del gráfico presenta los pronósticos de la media condicional y la segunda parte a la de la volatilidad condicional. En el caso de la varianza condicional, se puede advertir que esta estuvo debajo del promedio de la varianza incondicional, por lo que se observa que en el tiempo estos pronósticos tienden a ese promedio de largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se puede apreciar que el MAPE y el índice de Theil son menores que 100% y 1, respectivamente. Esto significa que los pronósticos del modelo son mejores que los pronósticos del modelo de camino aleatorio.
g)
Grafique la curva de impacto de las noticias usando los resultados de este modelo.
CAPÍTULO 13
12)
Modelos para la volatilidad condicional
Emplee los datos recolectados en la pregunta 9 y realice lo siguiente: La solución del problema en “capitulo13_problema12_ Nasdaq_2000_2010.wf1”. a)
Use EViews, modele la media condicional como un modelo AR(1) y la varianza condicional como un modelo de componentes ARCH(1,1) que además capture los efectos de apalancamiento y asimetría en los movimientos de la volatilidad (utilice threshold = 1).
205
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
206
b)
Analice los resultados obtenidos en el punto a): verifique la significancia estadística de cada uno de los coeficientes del modelo. Recuerde que el nivel de significancia deseado es igual al 5%. En este caso, el coeficiente que muestra la convergencia de la volatilidad de largo plazo (q t ) a ω está dado por C(4), que es igual a 0,994481. Como se mencionó anteriormente, esto significa que el componente de largo plazo converge lentamente al nivel de equilibrio. La velocidad de convergencia de la parte transitoria está dada por la suma de (α + β), que en este caso es igual a [C(6)+C(7)]. Esta suma es igual a − 0,159244 (= − 0,103038 − 0,056206).
c)
En base a su respuesta de la pregunta b), ¿se puede afirmar que el efecto de apalancamiento está presente en la serie de tiempo? Sí.
d)
En base a su respuesta de la pregunta b), ¿se puede verificar la asimetría de la respuesta de la volatilidad? Finalmente, se presenta el mismo modelo pero esta vez se introduce el factor de asimetría tal como se muestra a continuación:
CAPÍTULO 13
Modelos para la volatilidad condicional
En este caso la variable de interés para analizar si existe el efecto de apalancamiento es el coeficiente γ de la Ecuación (41) que en este caso se presenta como C(7). Como se puede ver en el gráfico anterior, este coeficiente es estadísticamente significativo, positivo e igual a 0,037565. Este resultado implica que efectivamente existen efectos transitorios de apalancamiento. e) Realice el pronóstico de la volatilidad condicional de los últimos 20 días de la muestra. Use el método dinámico.
f)
Determine la calidad de los pronósticos con base en los criterios de evaluación presentados en el capítulo 12. La primera parte del gráfico presenta los pronósticos de la media condicional y la segunda parte de la volatilidad condicional. En el caso de la varianza condicional, se puede advertir que esta estuvo debajo del promedio de la varianza incondicional, por lo que se observa que en el tiempo estos pronósticos tienden a ese promedio de largo plazo (de ahí la pendiente positiva de esa recta). Asimismo se puede apreciar que el MAPE y el índice de Theil son menores que 100% y 1, respectivamente. Esto significa que los pronósticos del modelo son mejores que los pronósticos del modelo de camino aleatorio.
207
CAPÍTULO
14 Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
1.
¿Qué entiende por no estacionariedad? El concepto de estacionariedad , en síntesis significa que todas las observaciones de la serie de tiempo provienen de la misma distribución de probabilidad y que, si a su vez, el proceso no es muy persistente, cada observación contendrá información valorable que no está presente en ninguna de las otras observaciones, por lo que los estadísticos obtenidos de las observaciones serán consistentes con sus respectivos parámetros poblacionales. Por ejemplo, la media de estas observaciones en el tiempo será consistente con la media poblacional.
2.
¿Cuál es la diferencia entre no estacionariedad en tendencia y estocástica? En una serie no estacionaria en tendencia, los momentos de su distribución de probabilidad no serán constantes (condición para estacionariedad). Sin embargo, si se tiene esta serie no estacionaria en tendencias y se desea convertirla en una estacionaria, lo que se tendrá que hacer será simplemente correr la siguiente regresión: yt = α + β × T + ut
Y luego se trabaja con los residuos estimados.
209
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
En el caso de una serie no estacionaria estocástica, la serie no presenta una tendencia clara como en el caso anterior pero es aún no estacionaria. Si uno tiene series no estacionarias estocásticas, el procedimiento para convertirlas en series estacionarias será el diferenciarlas, es decir: ∆ y = yt − yt −1 3.
¿Es correcto diferenciar una serie no estacionaria en tendencia para convertirla en estacionaria? Justifique su respuesta. No, porque al hacer esto se introducirá un proceso MA no invertible. Para observar esto, en detalle, se recomienda examinar las ecuaciones (4) y (5) de este capítulo.
4.
¿Qué es una serie I(1)? Una serie I(1) es una serie no estacionaria que para ser convertida en una serie estacionaria necesita ser diferenciada 1 vez.
5.
¿Cuál es la idea de la prueba aumentada de Dickey-Fuller? La idea fundamental de la prueba aumentada de Dickey-Fuller es que para detectar la presencia de raíces unitarias, la ecuación de las hipótesis debe considerar rezagos de la variable endógena que permita que los errores sea no autocorrelacionados.
6.
¿Cuál es la diferencia entre la prueba de Dickey-Fuller y la prueba aumentada de Dickey-Fuller? El estadístico de DF presentado en la ecuación (6) o su equivalente en la ecuación (16) asume que los errores son no autocorrelacionados. Sin embargo, en la práctica este supuesto puede no cumplirse. Es por esto que DF modificaron el test original de tal manera de hacer que los errores sean efectivamente no correlacionados. La idea es bastante simple: para evitar que los errores sean autocorrelacionados se aumenta en la ecuación (6) (o (16)) p-rezagos de la serie de la siguiente manera: p
∆ yt = λ × yt −1 + ∑ δ i × ∆yt −i + ut
i =1
7.
Escriba cual sería la ecuación de un modelo VAR(2) tri-variado. ¿Cuál sería el número de variables a estimar? β1,1
β1,2
β1,3
y2,t = α 2 + β 2,1
β 2,2
α3
β 3,2
y1,t y3,t
α1
β 3,1
y1,t −1
γ 1,1
γ 1,2
γ 1,3
u1,t
β 2,3 × y2,t −1 + γ 2,1 γ 2,2
γ 2,3 × y2,t − 2 + u2,t
β 3,3
γ 3,3
y3,t −1
γ 3,1
γ 3,2
y1,t − 2 y3,t − 2
u3,t
El número de coeficientes a estimar en este modelo VAR(p) irrestricto es igual a (r + p × r2). En nuestro caso r = 3 y p = 2, por lo tanto, se tendrán (3 + 2 × 32) = 21.
210
CAPÍTULO 14
8.
Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
¿Por qué un modelo que trabaja con series en diferencias solo puede capturar las relaciones de corto plazo entre las variables? Se escribe nuevamente la ecuación (49) del capítulo en la que cada variable ha sido diferenciada: ∆ yt = α + β1 × ∆yt −1 + β 2 × ∆yt −2 + ... + β k × ∆ yt − k + ut
Si existe una relación de largo plazo, también conocida como equilibrio o situación estacionaria, todas las variables no variarán con el tiempo, es decir que: y = yt = yt −1
Por lo tanto, si se aplica esta condición de equilibrio en la ecuación (49) se observará que todas las variables en diferencias desaparecerán, ya que estas variables se han calculado como y t − y t-1, por lo que es igual a cero. Por lo tanto, queda claro que cuando las variables incluidas en el sistema están en diferencias solo se están modelando las relaciones de corto plazo entre las variables. 9.
Escriba el modelo de corrección de errores y explique cada uno de los coeficientes del modelo. Si las series son cointegradas se puede utilizar el modelo de corrección de errores, que toma la siguiente forma: 2, t −1 ) ∆ yt = α + β1 × ∆X 1,t + β 2 × ∆X 2, t + β3 ( yt −1 − γ − δ1 × X1, t −1 − δ2 × X
En este caso, sí existe un vector de cointegración ( 1, −γ , −δ1, −δ 2 ) implicará que el término entre paréntesis es estacionario y, por lo tanto, esta ecuación puede ser adecuadamente estimada y será posible realizar inferencia sobre los coeficientes estimados. También nótese que ( δ1 , δ 2 ) representan las relaciones de largo plazo entre la variable y y las variables X 1 y X 2 , respectivamente. 10.
Escriba un modelo en corrección de errores donde se tienen las siguientes variables: y 1,t , x 1,t , x 2,t y x 3,t . 3,t −1 ) ∆ y1,t = α + β1∆X 1,t + β 2 × ∆X 2,t + β3 × ∆X 3,t + β 4 ( y1,t −1 − γ − δ1 × X 1,t −1 − δ 2 × X 2,t −1 − δ 3 × X
11.
¿Qué entiende por cointegración? La idea fundamental de la cointegración es que existe una relación de largo plazo entre las variables. Es decir, que existe alguna fuerza que hace que las variables tiendan a un equilibrio o a un estado estacionario en el largo plazo.
12.
¿Qué es un vector de cointegración y por qué es importante para el uso de modelos de corrección de errores? Se asume que se tienen k, cada una de las cuales es I(1). Se afirma que existe una relación de largo plazo o una relación de cointegración, si existe una combinación lineal
211
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
que hace que estas sean integradas de orden cero (I(0)), es decir, que si existe un vector de cointegración de tal manera que la serie resultante sea estacionaria o I(0). Matemáticamente, k
∑ δ × y i
i
∼ I (0)
i
13.
Explique la lógica de la prueba de Johansen. El test de Johansen se basa en la siguiente ecuación: ∆ yt = Η1 × ∆yt −1 + Η 2 × ∆yt −2 + ... + Η k −1 × ∆yt −(k −1) + Γ × yt −k + ut
El último término es el que captura la relación de largo plazo de las variables en caso que se encuentre uno o más vectores de cointegración. Es justamente en este último término en el que el test de Johansen se basa. La prueba analiza los valores propios de la matriz Γ y su rango. Se conoce que el rango de una matriz es igual al número de valores propios diferentes de cero. En el caso de tener variables estacionarias se puede demostrar que la matriz Γ tendría rango completo, es decir, que el número de valores propios diferentes de cero sería exactamente igual al número de variables en el sistema, que en este caso se ha llamado “ r ”. En el caso que se tenga variables I(1), el rango necesariamente será menor r , lo que a su vez significa que el número de valores propios también será menor que r . Se debe de recordar que a cada valor propio le corresponde un vector propio. En el caso de la prueba de Johansen, estos vectores propios corresponden a los vectores de cointegración que se están buscando. Como se mencionó anteriormente, el número máximo de vectores de cointegración es igual a r – 1. Existen dos test para detectar la presencia de vectores de cointegración: el test de la traza y el test de la máxima verosimilitud. Para una detallada explicación de ambos se recomienda leer la sección 4.2.2 de este capítulo. 14.
Busque en Yahoo Finance tres series financieras. Busque datos diarios que correspondan a los dos últimos años. Con base en estos datos, replicar paso por paso el ejemplo presentado en la sección 5 de este capítulo. Esté seguro de hacer lo siguiente: Los datos corresponden a tres índices bursátiles: SP500, BOVESPA (Brasil) y MERVAL (Argentina). Los datos se encuentran en “sp500_Ibovespa_MerVal_2009_2010. xlsx”. La solución de este problema se encuentra en el archivo EViews “capitulo14_problema14_ sp500_Ibovespa_MerVal_2009_2010.wf1”.
212
CAPÍTULO 14
a)
Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
Grafique las series en niveles y en logaritmos. Las series en niveles:
Series en logaritmos (lsp, lmerv y lbvsp):
213
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
b)
Mediante el uso de las funciones de autocorrelación ¿podría decir que las series son no estacionarias? No. Si se observan las funciones de autocorrelación se puede afirmar que las funciones no son estacionarias. Esto se puede apreciar al ver que las funciones de autocorrelación decrecen bastante lentamente, tal como se presenta en el siguiente gráfico que corresponde al índice brasileño. Lo mimo se puede apreciar para los otros índices.
c)
Utilice la prueba aumentada de Dickey-Fuller para probar que las series tienen raíz unitaria.
d)
214
test
Bvsp
Merv
SP
ADF-test
-2,428521
-0,725734
-1,287791
Valor crítico (5%)
-2,867645
-2,867645
-2,867645
Conclusión
Raíz unitaria
Raíz unitaria
Raíz unitaria
Verifique que las series son I(1), es decir, verifique si las series en diferencias son estacionarias. test
Bvsp
Merv
SP
ADF-test
-22,48426
-23,71090
-9,849522
Valor crítico (5%)
-2,867645
-2,867645
-2,867645
Conclusión
Estacionario
Estacionario
Estacionario
CAPÍTULO 14
e)
Trabaje con las series estacionarias, construya los modelos del tipo ARMA(p,q) que mejor se ajusten a cada serie. Recuerde utilizar los criterios de información para decidir el número óptimo de rezagos del modelo. Pronostique los últimos 5 días de las series y compare sus resultados con los datos reales. Para “dlsp”: De acuerdo al AIC ARMA(5,4) y de acuerdo al BIC ARAMA(4,4). Se trabajará con el modelo más parsimonioso (ARMA(4,4)).
AR ↓ / MA → 1 2 3 4 5
Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
1
2
3
4
5
AIC
-5,640196
-5,636160
-5,641248
-5,649873
-5,655802
BIC
-5,613074
-5,599997
-5,596045
-5,595630
-5,592518
AIC
-5,635459
-5,686999
-5,690338
-5,684624
-5,677278
BIC
-5,599236
-5,641721
-5,636005
-5,621235
-5,604833
AIC
-5,651064
-5,689304
-5,692775
-5,681323
-5,690067
BIC
-5,605710
-5,634880
-5,629280
-5,608757
-5,608431
AIC
-5,662446
-5,703839
-5,699836
-5,747463
-5,748205
BIC
-5,607931
-5,640239
-5,627149
-5,665691
-5,657346
AIC
-5,661646
-5,694845
-5,696271
-5,696542
-5,692208
BIC
-5,597939
-5,622037
-5,614361
-5,605531
-5,592096
Para “dlbvsp”: De acuerdo al AIC ARMA(5,4) y de acuerdo al BIC AR AMA(3,2). Se trabajará con el modelo más parsimonioso (ARMA(3,2)). AR ↓ / MA → 1 2 3 4 5
1
2
3
4
5
AIC
-5,407608
-5,403325
-5,405012
-5,398710
-5,397972
BIC
-5,380486
-5,367162
-5,359809
-5,344466
-5,334688
AIC
-5,401775
-5,402939
-5,402178
-5,446759
-5,410423
BIC
-5,365552
-5,357661
-5,347844
-5,383370
-5,337979
AIC
-5,410465
-5,465383
-5,453382
-5,449086
-5,447370
BIC
-5,365112
-5,410959
-5,389887
-5,376520
-5,365734
AIC
-5,405294
-5,423263
-5,461819
-5,476032
-5,433330
BIC
-5,350779
-5,359662
-5,389132
-5,394259
-5,342471
AIC
-5,400365
-5,437204
-5,436806
-5,494032
-5,492650
BIC
-5,336657
-5,364395
-5,354896
-5,403021
-5,392538
215
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Para “dlmerv”: De acuerdo al AIC ARMA(5,4) y de acuerdo al BIC AR AMA(2,2). Se trabajará con el modelo más parsimonioso (ARMA(2,2)). AR ↓ / MA → 1 2 3 4 5
1
2
3
4
5
AIC
-5,558336
-5,555816
-5,551614
-5,549396
-5,548579
BIC
-5,531215
-5,519654
-5,506411
-5,495153
-5,485295
AIC
-5,554846
-5,621943
-5,584130
-5,562258
-5,588822
BIC
-5,518624
-5,576665
-5,529796
-5,498868
-5,516377
AIC
-5,553002
-5,566523
-5,632194
-5,629649
-5,627098
BIC
-5,507648
-5,512099
-5,568699
-5,557083
-5,545461
AIC
-5,565073
-5,572615
-5,628868
-5,629399
-5,656460
BIC
-5,510558
-5,509014
-5,556182
-5,547626
-5,565602
AIC
-5,558015
-5,607993
-5,623276
-5,653828
-5,653644
BIC
-5,494307
-5,535184
-5,541366
-5,562817
-5,553532
Pronóstico (método estático) para dlsp:
216
CAPÍTULO 14
Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
Pronóstico (método estático) para dlbvsp:
Pronóstico (método estático) para dlmerv:
217
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
f)
Determine si existe Granger-causalidad entre las variables.
Como se puede ver DLBVSP y DLMERV no causan DLSP y no se causan entre ellas. En el caso de DLSP esta causa DLBVSP (p-valor = 0,05189, muy cerca de 0,05). g)
Construya un modelo VAR(p) usando las series estacionarias. De nuevo seleccione apropiadamente el número de rezagos del modelo. Pronostique los últimos 5 días de las series y compare sus resultados con los datos reales. De acuerdo al AIC el mejor modelo es un VAR(4) y de acuerdo al BIC es un VAR(1). Por parsimonia se escogerá el modelo VAR(1). VAR 1 2 3 4 5
218
Valor AIC
-17,63280
BIC
-17,52431
AIC
-17,62639
BIC
-17,43622
AIC
-17,65014
BIC
-17,37802
AIC
-17,67019
BIC
-17,31584
AIC
-17,66640
BIC
-17,22955
CAPÍTULO 14
Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
Pronóstico (método estático) para dlsp:
Pronóstico (método estático) para dlbvsp:
219
ESTADÍSTICAS Y ECONOMETRÍA FINANCIERA
Pronóstico (método estático) para dlmerv:
h)
220
Verifique si existe alguna relación de cointegración entre las series mediante el uso del test de Johansen. Si se emplean 4 rezagos se obtiene lo siguiente:
CAPÍTULO 14
Modelos de Series de Tiempo Multivariados y el Concepto de Cointegración
Como se puede observar se tienen hasta 2 vectores de cointegración. Recuerde que el máximo número de vectores de cointegración es igual al número de variables menos 1. En nuestro caso 3 − 1 = 2. i)
De existir esta relación de largo plazo, estime el modelo VEC y pronostique los últimos 5 días de las series y compare sus resultados con los datos reales. De acuerdo al AIC el mejor modelo es un VEC(5) y de acuerdo al BIC es un VEC(1). Por parsimonia se escogerá el modelo VEC(1). VAR 1 2 3 4 5
Valor AIC
-17,72995
BIC
-17,56722
AIC
-17,75290
BIC
-17,50840
AIC
-17,45913
BIC
-17,43258
AIC
-17,77279
BIC
-17,36393
AIC
-17,78386
BIC
-17,29240
Pronóstico (método estático) para dlsp:
221