Análi An áli si s de Dat os par a la l a Geren ci a
CURSO: A CURSO: An n áli ál i s i s d e Dato Dat o s p ara ar a la l a Geren Ger enc cia
José Antoni o Robles Flores Sistemas de Información y Métodos Cuantitativos ESAN Graduate School of Business Lima Lima - Pe Peru ru
Basado Basado en: Levine; Levine; Krehbiel Krehbiel & Berenson Berenson 2014. Estadística para Administración 6ta Edición. Pearson.
Análi An áli si s de Dat os par a la l a Geren ci a
CURSO: A CURSO: An n áli ál i s i s d e Dato Dat o s p ara ar a la l a Geren Ger enc cia
SESION 02 02: Intro nt rodu ducc cció ión n a la Pro Probabil babilid ida ad: Conceptos básicos (Capítu (Capítulo lo 04) 04)
Basado en: Levine; Levine; Krehbiel & Berenson 2014. Estadística Estadística para Administración 6ta Edición. Pearson.
Análi An áli si s de Dat os par a la l a Geren ci a
Objetivos de esta sesión Los conceptos y definiciones básicos de probabilidad • Probabilidad condicional • Uso del Teorema de Bayes • Reglas de conteo •
Análi An áli si s de Dat os par a la l a Geren ci a
Conceptos Básicos de Probabilidad Probabilidad •
Probabilidad – la posibilidad de que un evento incierto ocurrirá (siempre entre 0 y 1)
•
Evento Imposible – un evento que no tiene ninguna posibilidad de ocurrir (probabilidad = 0)
•
Evento Cierto – un evento que ocurrirá con toda seguridad (probabilidad = 1)
Análi An áli si s de Dat os par a la l a Geren ci a
Evaluando la Probabilidad •
Hay tres aproximaciones para evaluar la probabilidad de un evento incierto: 1. probabilidad clásica a priori Probabilidad probabili probabi lid d ad de deocurrencia ocurrencia
Asumiendo que todos los resultados son igualmente posibles
X
T
número de formas en las que el evento ocurre
número total de resultados posibles posibles
2. pr prob obab abililid idad ad cl clás ásic icaa em empí píri rica ca probabilid ad deocurrencia ocurrencia Probabilidad de
número de formas observadas del evento
número total de resultados observados
3. pro probab babili ilidad dad sub subjet jetiva iva sobre la base de una combinación de la experiencia de una persona, la opinión personal y el análisis particular de la situación si tuación
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de una probabilidad a priori •
Cuando se selecciona aleatoriamente un día del año 2012, ¿cuál es la probabilidad de que el día sea uno de Enero? Probabilid ad de Día en Enero
T
número total de dias en 2012
31 días en Enero
X
T
número de días en Enero
X
366 días en 2012
31
366
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de una probabilidad empírica •
Encuentre la probabilidad de seleccionar un hombre que esté tomando el curso de análisis de datos de una población descrita en la siguiente tabla: Hombre Mujer Total
Tomando An. Datos 84 76 160
Probabilidad hombre An. Datos
No Tomando An. Datos 145 134 279
Total 229 210 439
número hombre tomando An. Datos
número total de personas
84
439
0.191
Análi An áli si s de Dat os par a la l a Geren ci a
Eventos Cada posible resultado de una variable es un evento. • Evento simple Un evento que se describe por una sola característica – e.g., Un naipe rojo de una baraja de cartas –
•
Evento conjunto
Un evento que se describe por dos o más características – e.g., Un as rojo de una baraja de cartas • Complemento de un evento A (representado por A’) – Todos los resultados que no son parte del evento A – e.g., Todas los naipes que no son diamantes –
Análi An áli si s de Dat os par a la l a Geren ci a
Espacio Muestral El Espacio Muestral es el conjunto de todos los eventos posibles Ej.: Las 6 caras de un dado: Ej.: Los 52 naipes de un juego de cartas:
Análi An áli si s de Dat os par a la l a Geren ci a
Visualizando Eventos •
Tablas de Contingencias – Para todos los días en 2012 Ene
Mi ér c No Mi er c To t al
•
No Ene
4
48
27
287
31
335
52 314 366
Árbol de Decisión 4
Espacio Muestral
Todos los días en 2012 2012
Tot al
27 48 287
Número total de resultados en el Espacio Muestral
Análi An áli si s de Dat os par a la l a Geren ci a
Definición: Probabilidad Simple •
La Probabilidad Simple se refiere a la probabilidad de un evento simple. Ej: P(Ene) – Ej: P(Mierc) –
Ene Mi ér c No Mi er c To t al
No Ene
Tot al
4
48
52
27
287
314
31
335
366
P(Ene.) = 31 / 366
P(Mierc.) = 52 / 366
Análi An áli si s de Dat os par a la l a Geren ci a
Definición: Probabilidad Conjunta •
La Probabilidad Conjunta se refiere a la probabilidad de ocurrencia de dos o más eventos (evento conjunto). – Ej: P(Ene. Y Mierc.) – Ej: P(No Ene. Y No Mierc.) Ene Mi ér c
No Mi er c To t al
No Ene
Tot al
4
48
52
27
287
314
31
335
366
P(Jan. and Wed.) = 4 / 366
P(Not Jan. and Not Wed.) = 287 / 366
Análi An áli si s de Dat os par a la l a Geren ci a
Eventos Mutuamente Excluyentes •
Eventos que no pueden ocurrir en simultáneo
Ejemplo: Elegir aleatoriamente un día de 2012 A = día en Enero; B = día en Febrero –
Eventos A y B son mutuamente excluyentes
Análi An áli si s de Dat os par a la l a Geren ci a
Eventos Colectivamente Exhaustivos •
Eventos colectivamente exhaustivos Uno de los eventos debe ocurrir – El conjunto de eventos cubre todo el espacio muestral –
Ejemplo: Elegir aleatoriamente un día de 2012 A = Día de semana; B = Fin de semana C = Enero; D = Primavera Los eventos A, B, C y D son colectivamente exhaustivos (pero no mutuamente excluyentes – un día de semana puede ser en Enero o en Primavera) P rimavera) – Los eventos A y B son colectivamente exhaustivos y también mutuamente excluyentes –
Análi An áli si s de Dat os par a la l a Geren ci a
Computando Probabilidades Conjunta y Marginal •
La probabilidad de un evento conjunto, A y B: P(A y B)
•
número de resultados que satisfacen A y B
número total de resultados básicos básicos
Computando una probabilidad marginal (o simple) : P(A) P(A y B1 ) P(A y B2 ) P(A y Bk ) •
Donde B1, B2, …, Bk son k eventos mutuamente excluyentes y colectivamente exhaustivos
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de Probabilidad Conjunta P (Enero (Enero y Miércoles Miércoles))
número de días en Ene. y Mierc.
número total de días en 2012
4
366
Enero No Ene Total
4
48
52
No-Mierc
27
287
314
Total
31
335
366
Mierc
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de Probabilidad Marginal P(Mierc P(Mierc))
P(Mierc y Ene) P(Mierc y No Ene)
Ene En e
4 366
No Ene Total
4
48
52
No-Mierc
27
287
314
Total
31
335
366
Mierc
48 366
52 366
Análi An áli si s de Dat os par a la l a Geren ci a
Probabilidades Marginal y Conjunta utilizando Tablas de Contingencia Evento Evento
B1
B2
Total
A 1
P(A 1 y B 1)
P(A 1 y B 2)
P(A 1)
A 2
P(A 2 y B 1)
P(A 2 y B 2)
P(A 2)
Total
P(B 1)
Probabili dad Conju Conjunta nta
P(B 2)
1
Probabilid Probabil idad ad Margin Marginal al (Simpl (Simple) e)
Análi An áli si s de Dat os par a la l a Geren ci a
Probabilidad Probabilidad es la medida numérica de la posibilidad de que un evento ocurra • La probabilidad de un evento debe estar entre 0 y 1, inclusive •
1
Certeza
0 ≤ P(A) ≤ 1 Para cualquier evento A •
La suma de las probabilidades de todos los eventos mutuamente excluyentes y colectivamente exhaustivos es 1
0.5
P(A) P(B) P(C) 1 Si A, B, y C son mutuamente excluyentes y colectivamente exhaustivos
0
Imposible
Análi An áli si s de Dat os par a la l a Geren ci a
Regla General de la Adición Regla General de la Adición: P(A P(A o B) B ) = P(A) P(A) + P(B) P(B) - P(A P(A y B) B)
Si A y B son mutuamente excluyentes, excluyentes , entonces P(A y B) = 0, por lo que la regla se puede simplificar: P(A P(A o B ) = P(A) P(A) + P(B)
Para eventos mutuamente excluyentes A y B
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de la Regla General de la Adición P(Rojo P(Rojo o A As s ) = P(Rojo P(Rojo)) +P( As A s ) - P(Rojo y A As s) = 26 26/52 /52 + 4/52 - 2/52 = 28/52
Tipo
Color Rojo
Negro
Total
2
2
4
No-As
24
24
48
Total
26
26
52
As A s
No contar los dos ases rojos repetidamente!
Análi An áli si s de Dat os par a la l a Geren ci a
Computando la Probabilidad Condicional •
Una probabilidad condicional es la probabilidad de un evento, dado que otro evento ha ocurrido: P(A | B)
P(B | A)
P(A y B) P(B)
La probabilidad condicional de A dado que B ha ocurrido
P(A y B) P(A)
La probabilidad condicional de B dado que A ha ocurrido
Donde P(A y B) = probabilidad probabilida d conjunta de A y B P(A) = probabilidad marginal o simple de A P(B) = probabilidad marginal o simple de B
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de Probabilidad Condicional •
•
En un lote de autos usados, 90% tienen aire acondicionado (AC) y 40% tienen un GPS. 35% de los autos tienen ambos. ¿Cuál es la probabilidad de que un auto tenga un GPS dado que tiene AC? i.e., queremos hallar P(GPS | AC)
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de Probabilidad Condicional •
(continuación)
En un lote de autos usados, 90% tienen aire acondicionado (AC) y 40% tienen un GPS. 35% de los autos tienen ambos . GPS
No GPS To t al
AC A C
0.35
0.55
0.90
No AC AC
0.05
0.05
0.10
Total
0.40
0.60
1.00
P(GPS | AC)
P(GPS y AC) P(AC)
0.35 0.90
0.3889
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo de Probabilidad Condicional
(continuación)
AC, sólo consideramos la fila superior (90% de los autos). • Dado AC, De éstos, 35% tienen GPS. 35% de 90% es aprox. 38.89%. 38.89%. GPS
No GPS To t al
AC A C
0.35
0.55
0.90
No AC AC
0.05
0.05
0.10
Total
0.40
0.60
1.00
P(GPS | AC)
P(GPS y AC) P(AC)
0.35 0.90
0.3889
Análi An áli si s de Dat os par a la l a Geren ci a
Utilizando Árboles de Decisión .35 .90
Dado AC o no AC:
.55 Todos lo s Auto Au to s
P(AC y GPS) = 0.35
P(AC y GPS’) = 0.55
.90
Probabilidades Condicionales .05 .10
P(AC’ y GPS) = 0.05
.05
P(AC’ y GPS’) = 0.05
10
Análi An áli si s de Dat os par a la l a Geren ci a
Utilizando Árboles de Decisión .35 .90
Dado AC o no AC:
.55 Todos lo s Auto Au to s
P(AC y GPS) = 0.35
P(AC y GPS’) = 0.55
.90
Probabilidades Condicionales .05 .10
P(AC’ y GPS) = 0.05
.05
P(AC’ y GPS’) = 0.05
10
Análi An áli si s de Dat os par a la l a Geren ci a
Utilizando Árboles de Decisión (continuación) .35
Dado GPS o no GPS:
.40
.05 Todos lo s Auto Au to s
P(CD y AC) = 0.35
P(CD y AC’) =
0.05
.40
.55 .60
P(CD’ y AC) = 0.55
.05
P(CD’ y AC’) = 0.05
60
Análi An áli si s de Dat os par a la l a Geren ci a
Independencia Independencia Estadística •
Dos eventos son independientes si y sólo si:
P(A P(A | B) P(A)
•
Los eventos A y B son independientes cuando la probabilidad de un evento no está afectada por el otro evento
Análi An áli si s de Dat os par a la l a Geren ci a
Reglas de Multiplicación •
Regla de Multiplicación para dos eventos A y B:
P(A y B) P(A P(A | B) P(B)
Nota:
Si A y B son independientes, independientes , entonces P(A | B) P(A) y la regla de multiplicación se simplifica a
P(A y B)
P(A) P(B)
Análi An áli si s de Dat os par a la l a Geren ci a
Probabilidad Marginal •
La probabilidad marginal para el evento A: P(A) P(A | B1) P(B1 ) P(A | B2 )P(B2 ) P(A | Bk )P(Bk ) –
Donde B1, B2, …, Bk son k eventos mutuamente excluyentes y colectivamente exhaustivos
Análi An áli si s de Dat os par a la l a Geren ci a
Teorema de Bayes El Teorema Teorema de de Bayes Bayes se utiliza utiliza para para revisar revisar probabilidades calculadas previamente cuando hay información adicional • Fue desarr desarrollad olladoo por Thoma Thomass Bayes en el Siglo Siglo 18 18 • Es una extensión de la probabilidad condicional •
Análi An áli si s de Dat os par a la l a Geren ci a
Teorema de Bayes El teorema de Bayes se utiliza para revisar revi sar probabilidades previamente calculadas después de obtener nueva información P(A | B i )P(B i ) P(B i | A) P(A | B 1 )P(B 1 ) P(A | B 2 )P(B 2 ) P(A | B k )P(B k ) •
donde: Bi = iésimo evento de k eventos mutuamente excluyentes y colectivamente exhaustivos A = nuevo evento que puede tener impacto en P(B i)
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo del Teorema de Bayes •
Una compañía de perforación ha estimado un 40% de posibilidad de obtener petróleo para su nuevo pozo.
•
Una prueba detallada se ha programado para obtener mayor información. Históricamente, 60% de los pozos exitosos han tenido pruebas detalladas, y 20% de los pozos no exitosos han tenido pruebas detalladas.
•
Dado que este pozo ha sido programado para la prueba detallada, ¿cuál es la probabilidad de que el pozo será exitoso?
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo del Teorema de Bayes (continuación) •
• • •
•
Sea S = pozo exitoso U = pozo no exitoso P(S) = 0.4 , P(U) = 0.6 (probabilidades previas) Definir el evento de prueba detallada como D Probabilidades Condicionales: P(D|S) = 0.6 P(D|U) = 0.2 La meta es encontrar P(S|D)
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo del Teorema de Bayes (continuación) Aplicar el Teorema de Bayes: P(S | D)
P(D | S)P(S) P(D | S)P(S) P(D | U)P(U)
(0.6)(0.4) (0.6)(0.4) (0.2)(0.6)
0.24 0.24 0.12
0.667
Entonces, la probabilidad revisada de éxito, dado que este pozo ha sido programado para una prueba detallada es 0.667
Análi An áli si s de Dat os par a la l a Geren ci a
Ejemplo del Teorema de Bayes (continuación) •
Dada la prueba detallada, la probabilidad revisada de que el pozo sea exitoso ha aumentado a 0.667 del estimado original de 0.4 Prob Condicional
Probabilidad Conjunta
Probablidad Revisada
S (exitoso)
Prob Previa 0 .4
0. 6
(0.4)(0.6) = 0.24
0.24/0.36 = 0.667
U (no-exitoso)
0 .6
0. 2
(0.6)(0.2) = 0.12
0.12/0.36 = 0.333
Evento
Suma = 0.36
Análi An áli si s de Dat os par a la l a Geren ci a
Reglas de Conteo Reglas para contar el número de posibles resultados • Regla de Conteo 1: 1:
•
–
Si uno de k eventos diferentes mutuamente excluyentes y colectivamente exhaustivos puede ocurrir en cada uno de n intentos, el número de posibles posibles resultados es igual a
kn –
Ejemplo: •
Si se lanza un dado 3 veces entonces hay 6 3 = 216 posibles resultados
Análi An áli si s de Dat os par a la l a Geren ci a
Reglas de Conteo (continuación) •
Regla de Conteo 2: 2: –
Si hay k1 eventos en el primer intento, k 2 eventos en el segundo intento, … y kn eventos en el n ésimo intento, el número de posibles resultados es
(k1)(k2)…(kn) –
Ejemplo: Se quiere ir a un parque, almorzar en un restaurante e ir al cine. Hay 3 parques, 4 restaurantes y 6 cines. ¿Cuántas posibles combinaciones hay? • Respuesta: (3)(4)(6) = 72 posibilidades diferentes •
Análi An áli si s de Dat os par a la l a Geren ci a
Reglas de Conteo (continuación) •
Regla de conteo 3: 3: –
El número de formas que n objetos pueden arreglarse en orden es
n! = (n)(n – 1)…(1) –
Ejemplo: Usted tiene cinco libros para poner en una repisa. ¿De cuántas maneras puede usted ponerlos en la repisa? • Respuesta: 5! = (5)(4)(3)(2)(1) = 120 diferentes diferentes posibilidades •
Análi An áli si s de Dat os par a la l a Geren ci a
Reglas de Conteo (continuación) •
Regla de Conteo 4: 4: –
Permutaciones: El número de formas de arreglar X Permutaciones: objetos seleccionados de n objetos en orden es n
Px
n!
(n X)!
–
Ejemplo: •
Su restaurante tiene cinco selecciones de menú, y tres son selecciones para los especiales del día. ¿De cuántas formas distintas se puede ordenar los especiales del día?
•
Respuesta:
nPx
n!
(n X)!
5!
(5 3)!
120 120
2
60
diferentes posibilidades
Análi An áli si s de Dat os par a la l a Geren ci a
Reglas de Conteo (continuación) •
Regla de Conteo 5: 5: Combinaciones:: El número de formas en que se puede – Combinaciones seleccionar X objetos de n objetos, sin importar el orden, es
n
Cx
n!
X! (n X)!
– Ejemplo: • Usted tiene cinco libros y va a seleccionar tres aleatoriamente para leer. ¿Cuántas combinaciones diferentes de libros puede seleccionar? • Respuesta:
n Cx
n!
X!(n
5! X)!
3!(5 3)!
120
(6)(2)
10
posibilidades diferentes
Análi An áli si s de Dat os par a la l a Geren ci a
Resumen del Capítulo: • • • •
• • • •
Se presentaron los conceptos básicos de probabilidad Espacios Espacios muestrales muestrales y eventos, eventos, tablas tablas de contingencia contingencia,, probabilidad simple y probabilidad conjunta Se presentaron las reglas básicas de probabilidad La regla general de la suma, la regla de la suma para eventos mutuamente excluyentes, la regla para eventos colectivamente exhaustivos Se presentó la definición de probabilidad condicional Independencia estadística, probabilidad marginal, árboles de decisión y la regla de la multiplicación Se presentó el Teorema de Bayes Se examinaron las reglas de conteo
Análi An áli si s de Dat os par a la l a Geren ci a
Referencias •
Levine; Levine; Krehbiel Krehbiel & Berenson Berenson 2014. 2014. Estadística Estadística para para Administración 6ta Edición. Pearson.