a a c tic ti A Í A Í s í s í R R d d EI EI a t a t N N s s E E E E G G a í a í NI NI er re i i E E n n D D e e L L g n n g A A I I N N e e IO I O dl dl C C a a A A n n N N o i o i s s D D e e A A o fo f DI DI r r S S P P R R a l a l E E e e VI VI u u c c N N s s U U E E
PRUEBA DE HIPÓTESIS
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Prueba del Ratio de Verosimilitud Ho: θ∈
o
H1: θ∈
1
Teorema Si
Rq es un espacio q-dimensional y si o 1 es un subespacio r-dimensional, entonces, bajo condiciones de regularidad: 1
∀θ∈Ωo: -2log
2 (q-r)
cuando n
Región de rechazo R: R = {X: -2log
(X)>
2 1- ;(q-r)
} Lic. Luis Huamanchumo Huamanchumo de la Cuba
1
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (A) Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población N p( , ) Ho:
=
o
;
conocido
-2log = n( x 2
o
)’
-1
(x-
o
)~
2
(p)
(p)
Rα Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (B) Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población N p( , ) Ho:
=
o
;
desconocido
Prueba de T2 de Hotelling para una muestra -2log = nlog( 1 +d’S -1d)
Se sabe que:
d=x-
o
((n-p)/p)d’S-1d ~ F(p, n-p)
Lic. Luis Huamanchumo de la Cuba
2
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (C) Sea x1, x2, …, xn una muestra aleatoria independiente e idénticamente distribuida de una población N p( , ) Ho:
=
o
;
desconocido
Estimadores Máximo Verosímiles Ho verdadero H1 verdadero
=x =x
y y
-2log = np ( a – log g - 1) ~ m=
p(p+1) 2
g = ( Π i )1/p
= o =S 2
(m)
a=Σ
i
/p
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
HIPÓTESIS LINEALES
Lic. Luis Huamanchumo de la Cuba
3
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis Lineales I (D) Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población N p( , ) Ho: A = a
;
conocido
donde A(qxp) y a(qx1) q ≤p son conocidos Si Ho es verdadera: n( Ax – a )’( AΣA’)-1( Ax – a ) ~ χ2(q) Se rechaza Ho si el estadístico calculado es mayor a χ2(q) Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis Lineales II (E) Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población N p( , ) Ho: A = a
;
desconocido
donde A(qxp) y a(qx1) q ≤p son conocidos Si Ho es verdadera: (n-1) ( Ax – a )’( ASA’)-1( Ax – a ) ~ T2(q, n-1) Se rechaza Ho si el estadístico calculado es mayor a χ2(q) Lic. Luis Huamanchumo de la Cuba
4
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
HIPÓTESIS PARA MEDIDAS REPETIDAS
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Observación
Variable i = 1,...,p
Xk i j Tratamiento k = 1,2
Unidad Experimental j = 1,...,n
Lic. Luis Huamanchumo de la Cuba
5
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Tratamiento k=1
Tratamiento k=2
X11j X12j . . . X1pj
“p” observaciones en la j-ésima unidad para el tratamiento 1
X21j X22j . . . X2pj
“p” observaciones en la j-ésima unidad para el tratamiento 2
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Diferencias Pareadas D1j = X11j - X21j D2j = X12j - X22j . . .
donde
Dt j = D1j , D2j , ... , Dpj
Dpj = X1pj - X2pj Supuestos 1
E( Dj ) =
=
. .
2
y
Cov ( Dj ) =
d
p Lic. Luis Huamanchumo de la Cuba
6
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Comparación de Tratamientos para un Diseño de Medidas Repetidas X ij es la respuesta al i-ésimo tratamiento sobre la j-ésima unidad
X1j X2j . . . Xqj
Xj =
j = 1, 2, ..., n
Los “q” tratamientos se aplican repetidamente a la j-ésima unidad
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Contrastes para (i)
(ii)
1. . 11
3. . q2
1
2 3
=
q
1 2
=
q-1
-1
0
...
0 0 . . .
. .
-1
q
1 . . .
0 . . .
-1 . . .
...
1
0
0
...
1 2
= C1
-1
1
0
...
0
0
0 . . .
-1 . . .
1 . . .
...
0 . . .
0 . . .
. .
0
0
0
...
-1
1
q
1 2
= C2
Lic. Luis Huamanchumo de la Cuba
7
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (F)
Hipótesis (G)
No hay efecto de tratamientos Ho :
C2
=0
H1 :
C2
0
Existen diferencias respecto al control Ho :
C1
=0
H1 :
C1
0
(n- p+1) x’C’( CSC’)-1 Cx ~ F(1-α ; p-1, n-p+1) p-1 Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (H)
Comparación de dos vectores de medias
Sea xi1, xi2, …, xin1 una muestra aleatoria iid N p( 1, ) y x j1, x j2, …, x jn2 una muestra aleatoria iid de una población N p( 2, ) donde las variables son independientes. Ho : μ1 = μ2 H1 : μ1 ≠ μ2 Si Ho es cierta, la región de rechazo está dada por: n1n2( n1+ n2 – p - 1) ( x – x )’S-1 ( x – x ) ≥ F (1-α ; p, n +n -p-1) 1 2 1 2 1 2 2 p (n1+ n2) Lic. Luis Huamanchumo de la Cuba
8
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (I)
Comparación de matrices de covarianzas
Sea xih ~ Np( h,
h)
i=1, …, nh; h=1, …, k son variables aleatorias independientes Ho:
1=
2=
H1:
i≠
j
…=
k
k
-2logλ = n log lSl - Σ nh log lShl ~ χm2
(Ho cierta)
h=1
m=
1 (k-1) p (p+1) 2 Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (J)
Comparación de dos medias, diferentes matrices de covarianzas en muestras grandes
Sea xi1 ~ Np( 1,
con i=1, …, n1; y xi2 ~ Np( 2, …, n2 son variables aleatorias independientes 1)
2)
con j=1,
Ho : μ1 = μ2 H1 : μ1 ≠ μ2 -1
( x1 – x2 )’ ( S1 + S2 ) ( x1 – x2 ) n1 n2
χp2
Lic. Luis Huamanchumo de la Cuba
9
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
ANALISIS DE PERFILES
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (K)
Perfiles Paralelos (Similares)
De Hipótesis (F):
Perfiles Poblacionales
- 2) = 0
Ho :
C2 (
1
H1 :
C2 (
1-
2)
0
Grupo 1 a i d e M
Grupo 2
La hipótesis se rechaza si: Tratamiento
n1n2(n1+n2-p) (n1 +
n2)2(p-1)
(C x)T (CSC’)-1 C x > F(1-α, p-1, n1+n2-p)
Lic. Luis Huamanchumo de la Cuba
10
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (L)
Igualdad de dos niveles Ho :
1tp(
1
- 2) = 0
H1 :
1tp (
1
-
2)
0
La región de rechazo bajo Ho es: n1 n2 (n1 + n2 - 2) (n1 +
n2)2
1tp( x1 - x2 )
2
>
F (1-α; 1, n1+n2 - 2)
1tp S 1p
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Hipótesis (M)
Efecto Tratamiento
(n1+n2-p) p-1
Ho :
C2(
1
+ 2) = 0
H1 :
C2(
1
+
2)
0
(C x)T (CSC’)-1 C x > F(1-α, p-1, n1+n2-p)
x=
n1x1 + n2x2 n1 + n2 Lic. Luis Huamanchumo de la Cuba
11
A IC T S Í D A T S E A Í R EI N E G NI E D L A N IO S E F O R P A L E U C S E
APLICACIONES
S C EI - F I N U
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
CASO: Cheques Antiguos del Banco Suizo. (en pulgadas) x1 x5
x3
x2 x6 x4
Lic. Luis Huamanchumo de la Cuba
12
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Se dispone de 200 datos sobre seis medidas, respecto a 100 cheques bancarios genuinos y 100 cheques falsificados
Queremos probar si la media muestral de las observaciones obtenidas de las notas bancarias falsas es igual a:
μo =
Media muestral de los cheques genuinos (asumiremos que corresponde a la media poblacional)
214.9 129.9 129.7 8.3 10.1 141.5
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
xf =
Media muestral de los cheques falsificados
214.8 130.3 130.2 10.5 11.1 139.4
Asumimos que “ Σ” es conocida e igual Sf -2log = n( x -
o
)’
-1
(x-
o
) = 7,552.0074
2 (0.95; 6)=12.592
Se rechaza Ho Lic. Luis Huamanchumo de la Cuba
13
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Asumimos que “ Σ” es desconocida Se sabe que: De los datos:
((n-p)/p)d’S-1d ~ F(p, n-p)
d=x-
o
((n-p)/p)d’S-1d = 183.147
F(0.95; 6, 94) = 2.1966 Se rechaza Ho
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Se dispone de información estadística de 15 compañías del sector energía y estamos interesados en analizar sus activos (X 1) y ventas(x2). Con la información disponible se obtiene la matriz de covarianzas:
S = 107 x
1.6635 1.2410 1.2410 1.3747
Lic. Luis Huamanchumo de la Cuba
14
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Probar que la varianza del vector (x 1,x2) del sector Energía es igual a X1: Activos ; X 2: Ventas Ho:
O
=
=
o
;
O
desconocido
13608514,178 12694886,400 12694886,400 16790650,178
-2log = n tr(
-1 o S) – 2
n log
-1 o S
- np = 4.541
(0.95;3) =
Lic. Luis Huamanchumo de la Cuba
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Se desea comparar el valor medio de los activos del sector y de las ventas del sector energetico y manufacturero. Se dispone de 15 empresas del sector energía y 10 del sector manufacturero. A partir de la información muestral se obtuvo los siguientes resultados: x1 =
S1 = 107 x
4,080 2,580.5
1.6635 1.2410 1.2410 1.3747
x2 = 4,307.2 4,925.2
S2 = 107 x
1.2248 1.1425 1.1425 1.5112
Lic. Luis Huamanchumo de la Cuba
15
UNI-EPIES
ANÁLISIS MULTIVARIANTE I
Probar si existe diferencias significativos de posición entre el sector Energía y Manufacturero Ho : μ1 = μ2 H1 : μ1 ≠ μ2 Si Ho es cierta, la región de rechazo está dada por: n1n2( n1+ n2 – p - 1) ( x – x )’S-1 ( x – x ) ≥ F (1-α ; p, n +n -p-1) 1 2 1 2 1 2 p (n1+ n2)2 n1n2( n1+ n2 – p - 1) ( x – x )’S-1 ( x – x ) = 2.287 1 2 1 2 2 p (n1+ n2) F(0.95; 2,22)=3.4434
Se acepta Ho Lic. Luis Huamanchumo de la Cuba
16