Universidad Tecnológica Nacional Facultad Regional Buenos Aires Departamento de ciencias básicas
Probabilidad & Estadística Resumen de la materia V.1 F.E.P
(Actualizada al 11-08-12)
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
El documento fue realizado en base al libro: Probabilidad y estadística para la ciencia y la tecnología – tecnología – Walpole. Walpole. El mismo fue recomendado en la cursada. El apunte no contiene la totalidad de las demostraciones a conocer por parte del alumno a la hora de dar el examen, examen, solo sirve como ayuda una vez conocidos los temas de forma adecuada. El resumen no busca reemplazar a los libros ni a la teoría dada en clase. El resumen puede contener nomenclatura que la cual no coincida con los apuntes tomados en clase. Realizado por: Fernando (F.E.P) para:
UTNnianos www.utnianos.com.ar
Página 2 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Unidad I - Probabilidad.
Experimento: Proceso que genera un conjunto de datos. Espacio muestral: Conjunto de todos los resultados posibles de un experimento estadístico. Se representa con el símbolo S. Suceso o evento: Sub conjunto del espacio muestral. - Evento imposible: - Evento cierto: S - Suceso binario: {o,1} (dos resultados posibles)
∅
Operaciones entre eventos (sucesos)
Suceso unión:
∩ ∩ ≠
-
Mutuamente excluyentes: =0 No son mutuamente excluyentes: 0 Suceso intersección : - Independientes. Ej: Un dado. - No independientes -> condicionados. Ej: Mazo de cartas.
Complemento: A -> A ῾; Ac Propiedad: Au A
C
P(a) + P(Ac) = 1
Leyes de De Morgam: o o
∪∩ ∩∪ = =
Probabilidad: Se calcula a los eventos para medir su incertidumbre.
≤ ≤ ∪ ∩ 1 0 2 3
=
,
/
1
=1
=
+
=0 Página 3 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
∪∩ − ∩ ∩ ≠ 4 5
= =
+
.
Probabilidad compuesta:
∩ =
Probabilidad condicional:
( | )
∩ =
0
( )
Consecuencias de la definición axiomatica (Probabilidad)
∅ − ∁ − ≤ − ∩ 1 2 3 4
=1 =0 =>
=
Cantidad de combinaciones posibles:
∁ (
)
Donde:
Permutaciones posibles:
(
N: cantidad de objetos
K: grupos de “x” cantidad.
)
Donde:
N: cantidad de objetos K: grupos tomados.
Página 4 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Teorema de Bayes.
… … ≠ ∀ ≠ ∩ ∩ …
Si los eventos: 1 , 2 , , constituyen una partición del espacio muestral S, donde 0 / 1 ,2,3 ,2,3.. . entonces para cualquier evento A en S tal que ( ) 0 se cumple:
=
=1
(
)
=
= 1,2,
,
=1
Demostración: Por la definición de probabilidad condicional.
∩ =
( )
… … ≠ ∩
Si los eventos 1 , 2 , , constituye una partición del espacio muestral S tal que ( ) 0 para i=1,2,3,….,k entonces entonces cualquier cualquier evento de A de de S:
=
(
)=
=1
( |
)
=1
Y con el teorema en el denominador:
∩ ∩ =
=1
(
Si A y B son dos sucesos independientes también lo son.
)
=
=1
Fin tema: Probabilidad.
Página 5 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Unidad II – Variables Variables aleatorias.
Variable aleatoria: Función que asocia un numero real con cada elemento del espacio muestral. -
}
:
Tipos de variables:
-
Discretas: Una variable aleatoria se llama: Varaible aleatoria discreta (V.A.D) si se puede contar su conjunto de resultados posibles.
-
Continuas: Una variable aleatoria cuyo conjunto de valores posibles es un intervalo completo de números no es discreta.
Funciones: -
… → Representación: , , , Recorrido: = {0,1, {0,1,2, 2,
Función de probabilidad variable discreta. Función de densidad de probabilidad variable continua Función de distribución o probabilidad acumulada (V.D) Función de distribución o probabilidad acumulada ( V.C)
Función de probabilidad variable discreta
= (
El conjunto de pares ordenados or denados ( , variable aleatoria discreta X.
= )
) se llama función de probabilidad de la
Definición:
El conjunto de pares ordenados ( , ) es una función de probabilidades o distribución de probabilidad de la variable aleatoria X si para cada resultado posible de X: -
≥ 0 =1 = =
Página 6 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Función de densidad de probabilidad Variable continua.
Definición: La función f(x) es una función de densidad de probabilidad para la variable aleatoria continua X, definida en el conjunto de números reales R si:
-
∫∞ ≥ −∞ ∫ 0
+
=1
<
<
=
Nota: La probabilidad puntual es cero (0)
Función de distribución o probabilidad acumulada (V.D) Definición:
La función de la distribución acumulada F(x) de una variable aleatoria discreta X con distribución de probabilidad f(x) es:
≤ ≤ −∞ ∞ =
=
( ) para
<
<
Función de distribución o probabilidad acumulada (V.C) Definición:
La función de distribución acumulada F(x) de una variable aleatoria continua X con función de densidad f(x) es:
≤ ∫−∞ −∞ ∞ =
=
para
<
<
Esperanza o valor esperado de una variable aleatoria. Sea X una variable aleatoria con distribución de probabilidad f(x) la media o valor esperado de X es:
Página 7 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
-
Si X es discreta:
=
-
. ( )
Si S es continua:
=
=
∞ −∞ +
=
.
Teorema: Sea X una variable aleatoria con distribución de probabilidad f(x). El valor esperado de la variable aleatoria g(x) es:
-
Si X es discreta:
=
( )
-
=
( ). ( )
Si X es continua:
−∞∞ +
( )
=
=
( ).
Propiedades de la esperanza.
∓ ∓ ∓ 1 2 3 4 5
=
=
.
=
+
.
=
= . .
.
( )
Función distribución “Características”
-
Es una función continua Es creciente lim lim
→−∞ → ∞ +
=0 =1
Página 8 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Varianza. Si X una variable aleatoria con distribución de probabilidad f(x) y media E(µ); la variaza de x es:
− 2
=
Demostración:
= = = = =
2
( )
−− − − − 2
2
2 2
2
+
+
2
2
2
2
2
+
2
+
2
Calculo de E(X2) -
Variable aleatoria discreta:
2
-
. ( )
Variable aleatoria continua:
2
2
=
∞ −∞ +
=
2
.
Propiedades de varianza.
∗ ∗ − 1 2 3 4 5
=0 = 2 + = + = =
2
.
+ + ( )
.
Teorema Sea X una variable aleatoria con distribución de probabilidad f(x). La varianza de la variable aleatoria g(x) es:
Página 9 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
-
Si es discreta:
− − 2 ( )
-
2
=
.
Si es continua:
− 2 ( )
2
=
2
=
∞ −∞ − +
=
2
.
Desvió estándar (dispersión)
≥ =
( )
0
Fin tema: Variables Aleatorias.
Página 10 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Unidad III – Distribuciones Distribuciones especiales. Tipos de distribuciones:
Distribuciones discretas: - Binomial - Hipergeométrica - Geometrica - Poisson Distribuciones continuas: - Exponencial - Uniforme - Normal - Gamma Distribución Binomial (pág 144 – Walpole) Características:
(1) Sucesos dicotómicos: - Éxito (P) - Fracaso (Q) (me interesa que salga lo que quiero si no, no me importa) = = =1 ; + =1
−
(2) Ocurre en “n” pruebas o repeticiones independientes. (3) Se mantiene probabilidad constante de prueba en prueba. (4) Se denota como: ~B(n, ~B(n, p)
Donde:
N: Cantidad de ensayos; P: Probabilidad de éxito en 1 ensayo. X: Numero de éxito en n eventos.
(5)
− − ~B n, p = b x,n,p
=
=
.
. 1
Donde:
K: éxitos X: numero de … que …
Página 11 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
−
(6) Esperanza: (7) Varianza:
=
=
1
Distribución hipergeométrica. La distribución hipergeométrica encuentra aplicaciones en el muestreo de aceptación, donde lotes de material o las partes se muestran con la finalidad de determinar si se acepta o no el lote completo. Ej: Mazo de 40 cartas -> extraigo 8 -> 3 de oro; 5 cualesquiera.
= 3;
=5 =
=
10 3
30 5
40 8
Características:
(1) Esperanza:
(2) Varianza:
=
=
− −
Donde: N: Lote. N: Elementos que tomo al azar. K: Número de éxitos.
1
Distribución de Poisson. Características:
(1) Sucesos raros que suceden en un continuo. Continuo:
(2) (3) (4) (5)
Temporal Espacial: longitud, superficie, volumen.
La variable aleatoria X es el número de sucesos raros que ocurren en un continuo. Recorrido: = 0,1,2,3,4, . . , .. Parámetro: λ (lambda) –> Valor esperado. Se expresa como: ~Poi con > 0
… … λ λ
Página 12 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
=
=
=
−λ λ t t
t t k !
Donde:
K: Prob. Que llegue ese valor.
λ λ λ
(6) Esperanza: (7) Varianza:
=
= con con
>0
Distribución uniforme. Características:
(1) Se expresa como: ~Unif a, b (2) La función de densidad de la variable aleatoria uniforme continua X en el intervalo [a,b] es:
≤ ≤ − 1
, ,
=
0
Nota: La función de densidad forma un rectángulo con base B-A la altura:
− −
(3) Esperanza: (4) Varianza:
−
=
=
+ 2
2
12
Distribución exponencial. Aplicación:
-
Tiempo medio entre fallas. Cantidad de continuo entre eventos de Poisson.
Página 13 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires Características:
α
(1) Se expresa como: ~exp ( ) (2) Función de distribución exponencial:
−
>0
=
(Función densidad)
(3) Esperanza: (4) Varianza:
0
1
=
=
1
2
(5) Función de probabilidad acumulada o distribución.
− − =
0 1
>0
(6) Propiedad Pérdida de memoria.
α
Sea: ~exp ( )
Entonces:
≤ − − =
>
+
>0 0
0
>
=
= (
> )
Relación Poisson con exponencial.
λ λ
Sea: ~Poi
y
~exp
Relación: =
Covarianza:
− − ,
=
[(
( )(
]
Página 14 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Distribución normal. Características: (1) Se expresa como: (2) Características: -
μ σ
~N ( , )
Grafica: Campana de Gauss Área total bajo la curva = 1 Área a cada lado de = = 0,5 Curva simétrica respecto de = La curva es asintótica al eje X.
∫−∞∞ +
=1
(3) Función que la describe:
=
1
2 .
− − 1 2
2
Distribución Normal estándar.
(1) Se expresa como: ~ (0,1) (2) = 0 (3) = 1 (4) Función que describe:
∈ =
1
2
−
1 2 2
(5) Propiedad: Pasaje de normal a normal estándar.
Si ~
,
=>
=
−
~
∴ 0,1
=
+
Página 15 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Distribución Gamma.
Función que la describe:
− − ≥ 1
1
,
=
0
0
Características:
(1) Se expresa como:
~ ( , ) Donde:
α: Parámetro de la forma. Β: Parámetro de la escala.
(2) Función gamma:
∞ − − +
=
1
0
(3) Esperanza: (4) Varianza:
=
=
2
Fin tema: Distribuciones Especiales.
Página 16 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Unidad IV – Estimación. Estimación.
Estadística inferencial: - Estimadores puntuales. - Intervalos de confianza. - Test de hipótesis. (Unidad V) Estadística descriptiva: - Media muestral. - Varianza muestral. - Desvió estándar. - Mediana - Moda o modo - Coeficiente de variabilidad. -
Nota: La estadística descriptiva se ocupa del análisis de datos. Representación del resultado de un experimento.
Población: Totalidad de observaciones que nos interesan, de número finito o infinito.
Muestra: Sub-conjunto de la población. Nota: Si se eligen muestras seleccionando a los miembros más convenientes de la población puede producir una estimación errónea con respecto a la población. Cualquier procedimiento que sobreestime o subestime alguna característica de la e población se dice que esta “SESGADO” para eliminar el sesgo se toman muestras d forma aleatoria.
Definición: Sean X1, X2, …, Xn variables aleatorias independientes, cada una con la misma distribución de probabilidad (I.I.D) f(x). Definimos X1, X2, …, Xn
como una muestra aleatoria de tamaño n de la población f(x) y escribimos su distribución de probabilidad conjunta como:
… … 1,
2,
.
=
1
2
..
Página 17 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Media de la muestra: Si X1,X2,…,Xn representa una muestra aleatoria de tamaño n, entonces
la media de la muestra se define mediante el estadístico:
=1
=
Donde:
.
Definición: Cualquier función de las variables aleatorias X1, X2, …, Xn que forman
una muestra aleatoria se llama ESTADISTICO ESTADISTICO..
Mediana de la muestra: El que está en el medio de la muestra. Se busca el valor:
=
2
Moda o Modo: Valor de la serie de mayor frecuencia, nomenclatura:
Varianza de la muestra: La variabilidad en la muestra es como se dispersan las observaciones a partir del promedio.
∗ 1
=
Definición:
Si X1, X2, …, Xn representa una muestra aleatoria de tamaño n, entonces la
varianza de la muestra se define con el estadístico:
−
− 2
=
=1
2
1
Página 18 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Desviación estándar de la muestra: La desviación estándar de la muestra que se denota con S, es la raíz cuadrada positiva de la varianza de la muestra.
=
2
Coeficiente de variabilidad.
.
í
=
Serie de frecuencia de datos: -
=
(del dato ) Frecuencia relativa: donde n: total de datos. Frecuencia absoluta:
Definición:
Como un estadístico es una variable aleatoria que depende solo de la muestra observada, debe tener una distribución de probabilidad. La distribución de probabilidad de un estadístico se llama distribución muestral.. La distribución de probabilidad de se llama distribución muestral muestral de la media, está depende del tamaño de la población y del método de elección de datos.
Distribuciones muestrales: - Normal - Chi-Cuadrado - T-Student - F-Snedecor
Estimadores puntuales: Dado (X1, X2, …, Xn) llamamos estamiador
aleatoria.
a cualquier función de la muestra
Página 19 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Parámetro (Fijo y desconocido)
Estimador (Variable aleatoria)
µ
2
2
λ
p
Propiedad. {X1,X2,…,Xn} Muestra aleatoria de tamaño n (V.A.I.I.D)
∀ :
= =
2
=1
=
=
Propiedades (deseables (deseables)) de Estimadores Puntuales: (1) Insesgamiento:
− =
es insesgado si
=0
(2) Eficiencia relativa:
Si 1 y 2 son dos estimadores insesgados de eficiente que 2 si ( 1) < ( 2)
, decimos que
1
es más
Página 20 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Propiedad: {X1,X2,…,Xn} V.A.I.I.D muestra aleatoria de tamaño “n”
2
=
Desvió estándar:
=
Error cuadrático medio:
− . .
=
2
Distribución Media muestral (NORMAL) (1) Distribución exacta. -
=
=
2
(X1,X2,…,Xn)
~
,
Si ~ entonces la variable media media muestral muestral se distribuye distribuye en en , forma exactamente normal.
~ ( ,
(2) Distribucion asintótica.
)
Teorema central del límite (VER HOJA DE FORMULAS) Sean (X1,X2,…,Xn) una sucesión de variables aleatorias independientes
→ ≥
e idénticamente distribuidas (I.I.E.D) tales que ,
=
y
=
(
2
30)
Página 21 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Distribución Chi-Cuadrado. Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene la varianza 2 , entonces el estadístico:
≄ − − ≄− ~
2
2
1
=
2
1
2
~
2
1
Distribución T-Student. Aplicación: Se utiliza para inferencia sobre la media poblacional cuando desconocido. Si + 30 entonces
→ ∞ ≥
→ − ~
=
Distribución de
2
,
~
(0,1)
=
=1
-
Esperanza de :
-
Varianza de :
=
=
Página 22 de 29
es
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Intervalos de confianza.
≤ ≤
La estimación por intervalo de un parámetro poblacional es un intervalo de la forma donde . A medida que se aumenta el tamaño de la muestra, nuestra estimación está más cerca del parámetro lo cual tiene como resultado un intervalo más pequeño. De esta manera, el intervalo estimado, indica por su longitud, la precisión de la estimación puntual. Tipos:
(1) (2) (3) (4)
Intervalo de confianza para la media poblacional. Intervalo de confianza par la media poblacional con Intervalo de confianza para la proporción P. Intervalo de confianza para la varianza poblacional.
2
desconocido.
Intervalo de confianza para estimar la media poblacional. -
Muestra aleatoria {X1,X2,….,Xn} {X1,X2,….,Xn} V.A.I.I.D
−− − − − ~ ( , ) con desconocida y conocida.
Estimador:
=
~ (0,1)
:(
1
;
+
2
1
)
2
Observaciones:
(1) El intervalo de confianza está centrado c entrado en (2) Longitud del intervalo: 2 .
− 1
2
(3) Si aumento la muestra -> disminuye la longitud del intervalo.
−
(4) Error: =
1
2
Intervalo de confianza para la media poblacional con -
Estimador:
=
− − − ~
;
2
desconocido.
1
− :(
2
+
)
2
Página 23 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Intervalo de confianza para la proporción p. -
Estimador:
=
−
~ (0,1)
− − − :(
1
; +
2
1
Intervalo de confianza para la varianza poblacional. -
Estimador:
− ∗ ≄− 1
2
2
2
~
1
−≄ ∗ −≄ −∗ :(
2
1
;
2
1 2 1
2
)
2
2
)
2
Relación entre error y confiabilidad: -
Para n: fijo mayor precisión -> menor confiabilidad y viceversa. Si se quiere mejorar la precisión sin perder confiabilidad debe aumentarse el tamaño de la muestra. Intervalo más amplio -> mayor longitud.
Fin tema: Estimaciones e intervalos de confianza.
Página 24 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Unidad V – Prueba Prueba de hipótesis.
Hipótesis: Una hipótesis estadística es una conjetura (información) (i nformación) acerca de un parámetro poblacional con respecto a una o más poblaciones. Nota: La verdad o falsedad de una hipótesis nunca se sabe con absoluta certidumbre, a menos que se examine toda la población algo poco práctico.
Papel de probabilidad en la prueba de hipótesis: El rechazo de una hipótesis implica que la evidencia de la muestra la refuta. Por otro lado significa que hay una pequeña probabilidad de obtener la información muestral observada cuando, de hecho, la hipótesis es verdadera. El planteamiento de una hipótesis está influido por la estructura de la probabilidad de una conclusión errónea. Ej: Para probar que un medidor es más preciso que otro el ingeniero prueba la hipótesis de que no hay diferencia en la precisión de los dos tipos de medidores.
Hipótesis nula e hipótesis alternativa. -
Hipótesis nula:
Se refiere a cualquier hipótesis que deseamos probar y se denota con H0. Nota: El rechazo de H0 conduce a la aceptación de una hipótesis alternativa que se denota con H1.
-
Hipótesis alternativa: Representa la pregunta que debe responderse, la teoría que debe probarse y, por ello, su especificación es muy importante. Nota: La hipótesis nula H0 anula o se opone a H1
Página 25 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Conclusión del análisis. (1) Rechazo H0: A favor de H1 debido a evidencia suficiente en los datos. (2) No rechazo H0: Debido a evidencia insuficiente en los datos.
Decisiones en hipótesis.
Dos decisiones:
Rechazo H0: -
Acepto H0: -
Siendo H0 falsa -> CORRECTO Siendo H0 verdadera -> ERROR TIPO I
Siendo H0 falsa -> ERROR TIPO II Siendo H0 verdadera -> CORRECTO
Error tipo I:
El rechazo de la hipótesis nula cuando es verdadera.
Error tipo II: No rechazar hipótesis nula cuando es falsa.
Probabilidades. -
P P P P
β − α
−β α
rechazar H0 falsa falsa = pote potenc ncia ia del del tes testt = 1 rechazar H0 verdadera verdadera = nive nivell de de sign signifi ifica cació ción n= aceptar H0 falsa falsa = aceptar H0 verdadera verdadera = 1
Nota: Si para un tamaño de muestra fijo: Si reducimos la probabilidad de cometer un error de tipo II, aumenta la probabilidad de cometer un error de de tipo I. La probabilidad de cometer ambos errores se puede disminuir al aumentar el tamaño de la muestra.
Página 26 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Propiedades importantes. -
-
-
Los errores de tipo I y II están relacionados. Por lo general una disminución en la probabilidad de uno tiene como resultado un incremento en la probabilidad del otro. El tamaño de la región critica y, por lo tanto, la probabilidad de cometer un error de tipo I, siempre se puede reducir al ajustar el (los) valor (es) critico (s). Un aumento en el tamaño muestral n reducirá a α y β de forma simultánea. Si la hipótesis nula es falsa, β es máximo cuando el valor real de un
parámetro se aproxima al valor hipotético. Cuanto más grande sea la distancia entre el valor real y el valor hipotético, β será menor.
Potencia del test. La potencia de una prueba (α) es la probabilidad de rechazar H0 dado que una
alternativa específica es verdadera, se puede calcular como: 1-β
Test o prueba de hipótesis para la media (de una población) con varianza conocida. -
Estadístico de prueba:
-
Casos:
Caso 1
= >
=
−
0
~
(0,1)
Caso 2
0: 1:
0
0
Caso 3
0: 1:
= <
0
0
≠ 0: 1:
=
0
0
Para los test restantes solo variará el estadístico de prueba, según los estimadores vistos en cada uno de los intervalos de confianza.
Página 27 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Valor y cálculo del P-Valor.
− >
0;
=
=
2
Nota:
-
Si P-valor P-valor > α: no rechazo H0. Si P-valor
≤
α: rechazamos H0
Fin tema: Prueba de hipótesis.
Página 28 de 29
Universidad Tecnológica Nacional
Facultad Regional Buenos Aires
Unidad VI – Regresión Regresión Lineal. Nota: Este es un tema el cual se puede resolver en su totalidad con la tabla de fórmulas y la calculadora, en el apunte figura una introducción mínima para poder resolver ejercicios y entender la tabla.
Recta de regresión poblacional:
=
+
1
Obtención de los coeficientes de la recta: -
0
− 1= 0=
1
Cantidades básicas que se calculan.
− − − − =
1
=
2
=
=
1
2
=
Coeficiente de determinación:
2
=
Coeficiente de correlación lineal:
=
Fin tema: Regresión Lineal.
Página 29 de 29