LUIS GABRIEL NIÑO DUARTE ANYI YISLENI ORJUELA ARENAS
DOCENTE: ANGELA PATRICI PATRICIA A GUERRERO
-2013-
PROYECTO ESTADISTICA II
LUIS GABRIEL NIÑO DUARTE ANYI YISLENI ORJUELA ARENAS ARENAS
INSTITUCION UNIVERSITARIA UNIVERSITARIA POLITECNICO GRANCOLO GR ANCOLOMBIANO MBIANO ADMINISTRACION DE EMPRESAS (CURRICULO INTEGRADO) VIRTUAL -2013-
II ENTREGA
OBJETIVOS
•
• •
•
Calcular y analizar la información proporcionada por las medidas de tendencia central, las medidas de localización y las medidas de dispersión. Comprender los conceptos teóricos estadísticos haciendo uso de un programa. Utilizar el programa Microsoft Excel para poder realizar cálculos de probabilidad, utilizando las funciones de probabilidad para ariables aleatorias discretas y para !.". continuas. "plicar y comprender correctamente los conceptos de #istribución $inomial, #istribución %ormal, &eorema del 'ímite Central, Estimación (untual e )nteralo de Confianza.
MARCO TEÓRICO Te!"# $e P!%#%&'&$#$ 'a probabilidad constituye un importante parámetro en la determinación de las diersas casualidades obtenidas tras una serie de eentos esperados dentro de un rango estadístico. Existen diersas formas como m*todo abstracto, como la teoría #empster+hafer y la teoría de la relatiidad num*rica, esta -ltima con un alto grado de aceptación si se toma en cuenta ue disminuye considerablemente las posibilidades hasta un niel mínimo ya ue somete a todas las antiguas reglas a una simple ley de relatiidad. 'a probabilidad de un eento se denota con la letra p y se expresa en t*rminos de una fracción y no en porcenta/es, por lo ue el alor de p cae entre 0 y 1. (or otra parte, la probabilidad de ue un eento 2no ocurra2 euiale a 1 menos el alor de p y se denota con la letra . (345 6 1 + (3E5 'os tres m*todos para calcular las probabilidades son la regla de la adición, la regla de la multiplicación y la distribución binomial.
Re'# $e '# #$&&*+ 'a regla de la adición o regla de la suma establece ue la probabilidad de ocurrencia de cualuier eento en particular es igual a la suma de las probabilidades indiiduales, si es ue los eentos son mutuamente excluyentes, es decir, ue dos no pueden ocurrir al mismo tiempo. (3" o $5 6 (3"5 U (3$5 6 (3"5 7 (3$5 si " y $ son mutuamente excluyente. (3" o $5 6 (3"5 7 (3$5 8 (3" y $5 si " y $ son no excluyentes. iendo9 (3"5 6 probabilidad de ocurrencia del eento ". (3$5 6 probabilidad de ocurrencia del eento $. (3" y $5 6 probabilidad de ocurrencia simultánea de los eentos " y $.
Re'# $e '# ,'.&/'&#&*+ 'a regla de la multiplicación establece ue la probabilidad de ocurrencia de dos o más eentos estadísticamente independientes es igual al producto de sus probabilidades indiiduales. (3" y $5 6 (3" $5 6 (3"5(3$5 si " y $ son independientes. (3" y $5 6 (3" $5 6 (3"5(3$:"5 si " y $ son dependientes
Re'# $e L#/'#e 'a regla de 'aplace establece ue9 'a probabilidad de ocurrencia de un suceso imposible es 0. 'a probabilidad de ocurrencia de un suceso seguro es 1, es decir, (3"5 6 1. (ara aplicar la regla de 'aplace es necesario ue los experimentos den lugar a sucesos euiprobables, es decir, ue todos tengan o posean la misma probabilidad. 'a probabilidad de ue ocurra un suceso se calcula así9 (3"5 6 %; de casos faorables < %; de resultados posibles Esto significa ue9 la probabilidad del eento " es igual al cociente del n-mero de casos faorables 3los casos dónde sucede "5 sobre el total de casos posibles.
D&.!&%&+e $e /!%#%&'&$#$ 'a distribución de probabilidades es un modelo ue describe la forma en ue arían los resultados de un experimento aleatorio.
E/e!&,e+. #'e#.!& Es definido como un proceso o actiidad ue al e/ecutarse puede dar uno o arios posibles resultados. i es al =">"?@ lo ue define el resultado, se dice ue el experimento es aleatorio.
V#!%'e #'e#.! 'a ariable aleatoria está asociada con los resultados de los experimentos aleatorios. 'a ariable aleatoria toma diferente alores dependiendo del resultado del experimento aleatorio. eg-n el tipo de alor ue toman las ariables pueden ser discretas, reales o continuas. 'as ariables discretas son auellas cuyos alores son n-meros enteros, las ariables reales son las ue toman alores con decimales y las ariables continuas son las ue toman los alores en un interalo.
D&.!&%&*+ B&+,'
Es una distribución de probabilidad discreta, mide el n-mero de *xitos en una secuencia de n ensayos independientes, con una probabilidad fi/a de ocurrencia del *xito entre los ensayos. 'a ariable binomial es una ariable aleatoria discreta ue solo puede tomar los alores,An suponiendo ue se han realizado n pruebas. Como hay ue considerar todas las maneras posibles de tener B+*xitos y 3n+B5+fracasos, debemos calcular estas por combinaciones 3n-mero combinatorio n sobre B5. Cada experimento tiene dos resultados posibles9 B)&D D ?"C"D, donde la probabilidad de B)&D es p y la probabilidad de fracaso es 61+p. El resultado obtenido en cada prueba es independienteF la probabilidad de *xito se mantiene constante entre un experimento y otro. &odo experimento ue tenga esas características se le puede aplicar el modelo binomial. Microsoft Excel nos permite calcular la probabilidad de obtener un n-mero concreto de *xitos 3(3B6xi55 de una ariable aleatoria discreta ue sigue una distribución binomial $3n,p5, en problemas con un n-mero fi/o de pruebas o ensayos 3n5, cuando los resultados de un ensayo son sólo *xito o fracaso, cuando los ensayos son independientes y cuando la probabilidad de *xito es constante durante todo el experimento 3p5. (ara ello, en insertar función, selecciona dentro del tipo de funciones estadísticas, el comando =#)&?.$)%DM@. 'os argumentos de la función9 G %-mH*xito, es el n-mero de *xitos en los ensayos, ue se desean estimar 3xi5. G Ensayos, es el n-mero de ensayos independientes o repeticiones ue se realizan 3ni5. G (robH*xito, es la probabilidad de *xito en cada ensayo 3p5. G "cumulado, es un alor lógico ue determina la forma de la función. i el argumento acumulado es !E?#"#E?D, #)&?.$)%DM deuele la función de distribución acumulada, ue es la probabilidad de ue exista el máximo n-mero de *xitosF si es "'D, deuele la probabilidad para una condición en particular.
D&.!&%&*+ N!,#' 'as distribuciones de probabilidad normal tambi*n son conocidas como la distribución de gauss o distribución gaussiana. Esta distribución de caracteriza porue los alores se distribuyen formando una campana de Iauss, en torno a un alor central ue coincide con el alor medio de la distribución9 Un J0K de los alores están a la derecha de este alor central y otro J0K a la izuierda. Cuando la media de la distribución es 0 y la arianza es 1, se denomina 2normal tipificada2, y su enta/a reside en ue hay tablas donde se recoge la probabilidad acumulada para cada punto de la cura de esta distribución. "demás, toda distribución normal se puede transformar en una normal tipificada. 'a importancia de la distribución normal se debe principalmente a ue hay muchas ariables asociadas a fenómenos naturales ue siguen el modelo de la normal.
Microsoft Excel nos permite calcular la probabilidad de una ariable aleatoria continua ue sigue una distribución normal tanto con una media y desiación típica de cualuier alor, %3 L, 5, como los alores de una normal tipificada o estandarizada, %30,15. " su ez, tambi*n nos permite conocer cómo se estandarizan o tipifican las ariables. 'a función #)&?.%D?M, permite buscar la probabilidad ue en una distribución normal de parámetros % 3L,5 de/a por deba/o el alor =a@, 3(3B N a5 5. (ara ello, en insertar función, selecciona dentro del tipo de funciones estadísticas, el comando =#)&?.%D?M@. Esta función, deuele la distribución normal para la media y desiación estándar especificadas. &iene un gran n-mero de aplicaciones en estadística, incluidas las pruebas de hipótesis. 'os parámetros a definir son9 G B es el alor cuya distribución desea obtener 3xi 6 a5. G Media es la media aritm*tica de la distribución 3parámetro L5. G #esHestándar es la desiación estándar de la distribución 3parámetro 5. G "cum. es un alor lógico ue determina la forma de la función. i el argumento "cum. es !E?#"#E?D, la función #)&?.%D?M deuele la función de distribución acumulada, es decir, la fórmula es el entero desde el infinito negatio a x de la fórmula dada.F si es "'D, deuele la función de masa de probabilidad. 'a función #)&?.%D?M"'.E&"%#"? nos permite calcular la probabilidad ue, en una distribución normal de media cero y desiación típica uno, se encuentra por deba/o del alor =a@, 3(3> N a5 6O5. (ara ello, en insertar función, selecciona dentro del tipo de funciones estadísticas, el comando =#)&?.%D?M.E&"%#3z5@. Esta opción deuele la función de distribución normal estándar acumulatia. 'a distribución tiene una media de 0 3cero5 y una desiación estándar de uno. Esta función nos proporciona las mismas probabilidades ue la tabla estándar de áreas de curas normales.
Te!e,# $e' L",&.e Ce+.!#' El teorema del límite central o teorema central del límite indica ue, en condiciones muy generales, la distribución de la suma de ariables aleatorias tiende a una distribución normal cuando la cantidad de ariables es muy grande. ste teorema, perteneciente a la teoría de la probabilidad, encuentra aplicación en muchos campos relacionados, tales como la inferencia estadística o la teoría de renoación. El enunciado del teorema es el siguiente9 ea B1, BP,A,Bn una muestra aleatoria de una población cuya distribución tiene por media Q y por desiación estándar . Entonces, si n es suficientemente grande, la ariable aleatoria
&iene una distribución aproximadamente normal con media Q x6Q y x6
e distribuye aproximadamente normal estándar, conforme n se hace grande.
E.&,#&*+ P+.#' 'a estadística proee t*cnicas ue permiten obtener conclusiones generales a partir de un con/unto limitado S pero representatio S de datos. Cuando inferimos no tenemos garantía de ue la conclusión ue obtenemos sea exactamente correcta. in embargo, la estadística permite cuantificar el error asociado a la estimación. 'a mayoría de las distribuciones de probabilidad dependen de cierto n-mero de parámetros. alo ue estos parámetros se conozcan, deben estimarse a partir de los datos. El ob/etio de la estimación puntual es usar una muestra para obtener n-meros ue, en alg-n sentido, sean los ue me/or representan a los erdaderos alores de los parámetros de inter*s. upongamos ue se selecciona una muestra de tamaTo n de una población. "ntes de obtener la muestra no sabemos cuál será el alor de cada obseración. "sí, la primera obseración puede ser considerada una .a. B1, la segunda una .a. BP, etc. (or lo tanto, antes de obtener la muestra denotaremos B1, BP,...., Bn a las obseraciones y, una ez obtenida la muestra los alores obserados los denotaremos x1, xP,...., xn. Un estimador puntual de un parámetro es un alor ue puede ser considerado representatio de y se indicará V. e obtiene a partir de alguna función de la muestra. 'a estimación por interalo9 es auella ue calcula un interalo ue contenga entre sus límites, con cierta probabilidad, el erdadero alor del parámetro poblacional. Este interalo se llama )%&E?!"'D #E CD%)"%>".
PROCEDIMIENTO
D&.!&%&+e $e /!%#%&'&$#$ E.&,#&*+ $e P#!,e.! 1 'a resolución del primer punto es presentada en la ho/a de cálculo =1W #istribución $inomialXX. Como necesitamos simular una distribución binomial, el primer paso a seguir es determinar los parámetros reueridos para ser insertados en la función de Excel Y#)&?.$)%DM.%Zx3n-mero de *xito5Fn3ensayos5Fp3probabilidad de *xito5Falor lógico erdadero 315 si es acumulado[Y El n-mero de *xito x depende de la condición dada en la actiidad, sin embargo es necesario hallar las probabilidades particulares desde x60 hasta x610 con el fin de dar respuesta a todas las preguntas planteadas en *sta parte.
El n-mero de ensayos n es una condición dada, por lo tanto su alor es n610. 'a probabilidad de *xito para los clientes con hobby ia/ar 3\ en la base de datos5, la determinamos a partir de las tablas dinámicas desarrolladas en la entrega anterior, de modo ue p corresponde a la 3cantidad de clientes con hobby ia/ar5<3total de clientes5, entonces p6\\J<1]^J. Una ez hallados los parámetros anteriores, procedemos a calcular las respectias probabilidades de *xito para cada caso en particular, plasmadas en la tabla ue se muestra a continuación9 x
(ZB6x[
0
(ZB60[
1
(ZB61[
P \
(ZB6P[ (ZB6\[
_ J
(ZB6_[ (ZB6J[
`
(ZB6`[
(ZB6[
]
(ZB6][
^ 10
(ZB6^[ (ZB610[
0,1_P^_00 P 0,\0`^J_J \ 0,P^``P_\ \ 0,1`^]`1] 0,0`\]\_P ] 0,01`__^` 0,00P^_\ 1 0,000\`1P P P,^0]^E+ 0J 1,\]]1E+ 0` P,^]1E+0]
'a respuesta al inciso a5, corresponde entonces a la suma de las probabilidades para los n-meros de *xito de \ a 10, ya ue satisfacen la condición impuesta, obteniendo un alor de 0.PJ\. #e manera similar la parte b5, se expresa como la suma de las probabilidades de *xito para el interalo de B6P y B6JF llegando al alor de 0.J_ como respuesta. Conociendo la probabilidad de *xito para *ste caso en particular, el tamaTo de toda la población y el tamaTo de la muestraF concluimos ue se espera ue P clientes en una muestra de 10 tengan como hobby ia/ar y de la misma forma \\J clientes se a/ustan a *ste criterio de la población total de 1]^J clientes.
2 &anto el segundo como tercer problema son resueltos en la ho/a de cálculo =PW y \W #istribución %ormal =. Utilizando la función de Excel (?DME#)D para la columna ue contiene los )%I?ED conseguimos la media Q 6 J\_P. imilarmente la función #E!E&.( nos arro/a la desiación estándar para el grupo de datos a analizar 6_]\P,_J\. 'o anterior con el fin de obtener los parámetros reueridos por la función #)&?.%D?M.%. " continuación desarrollamos las preguntas planteadas en *ste puntoF un cliente seleccionado al azar tiene como probabilidad de tener un ingreso
inferior a JV000.000, (3BJV000.0005 6 0,_P, mientras ue la probabilidad de tener un ingreso entre \V000.0000 y `VJ00.000 corresponde a (3\000.000B`J00.0005 6 (3B`VJ00.0005 + (3B\V000.0005 6 0,P]1. (or -ltimo tenemos ue (3B`000.0005 6 1 + (3B`V000.0005 6 0,__`.
3 (ara la resolución del tercer apartado comenzamos por hallar la media y la desiación estándar de los I"&D siguiendo las instrucciones descritas anteriormente, obteniendo Q 6 P^\ y 6 P_]J, P\, respectiamente. El siguiente paso inolucra la utilización del &eorema del 'ímite Central, para el cual normalizamos los datos nominales con la fórmula
y #onde n corresponde al tamaTo de la población y es el alor promedio de referencia a utilizar seg-n la pregunta ue estemos respondiendo. (ara todas las preguntas tenemos el mismo x6 \^P,^J. Entonces para obtener la probabilidad de ue la muestra aleatoria de _0 tenga una media superior a PV_00.000, tenemos un alor de > 6 +0,^^^. (3
P_00.0005 6 (3> +0.^^^5 6 1 + (3> +0.^^^5 6 0.]_1
Cabe resaltar ue (3> +0,^^^5 es calculado utilizando la #)&?.%D?M.E&"%#.%, para la cual sólo necesitamos el alor estándar >.
función
Con la misma lógica anterior para hallar el alor de la probabilidad de ue la media de la muestra se encuentre entre PV000.000 y PV]00.000, necesitamos normalizar *stos dos alores anteriores, resultando en > s6 0,01^ y >i6 + P,01. (3P000.000
P]00.0005 6 (3> 0,01]]5 + (3> +P,015 6 0,_]J
(ara la -ltima pregunta de *ste punto, tenemos > 6 +P,01, por lo cual (3
P000.0005 6 (3> +P,015 6 0,0PP
4 (ara resoler el -ltimo punto necesitamos primero tomar P0 alores aleatorios de clientes, los cuales son mostrados en la ho/a de cálculo =_WEstimadores e )nteralo de C.@. (osteriormente tenemos ue seleccionar un criterio para realizar la estimación puntual para la media y la arianza del )%I?ED. En nuestro caso para simplificar los cálculos seleccionamos el M*todo de Máxima !erosimilitud, donde los estimadores máximo erosímiles son la media y la arianza muestrales, los cuales obtenemos como 6 J_J^ y 6 P\`PJ1,J^, con la funciones de Excel (?DME#)D y !"?. respectiamente. 'a desiación estándar sería entonces la raíz cuadrada del -ltimo alor es decir 6P`^0,0P] y la cantidad de datos n 6 P0.
(osteriormente ueremos inferir de los datos reci*n hallados un interalo de confianza del ^JK para estimar el )%I?ED promedio de todos los clientes. ste interalo de confianza es mostrado gráficamente en la siguiente cura normal tipificada
Entonces la partición de > para obtener un interalo de confianza de Q del ^JK (Z+1.^` N > N 1.^`[ 6 0.^J 'a expresión para determinar el interalo de confianza es entonces
#onde >
CONCLUSIONES
•
•
•
•
•
•
'a distribución de frecuencia es una tabla de resumen en la ue los datos se disponen en agrupamientos o categorías conenientemente establecidas de clases ordenadas num*ricamente. 'a principal enta/a de usar una de estas tablas de resumen es ue las principales características de los datos se hacen eidentes inmediatamente para el lector. 'a principal desenta/a de tal tabla de resumen es ue no podemos saber cómo se distribuyen los alores indiiduales dentro de un interalo de clase particular sin tener acceso a los datos originales. 'a probabilidad es la posibilidad u oportunidad de ue suceda un eento particular. 'a probabilidad inolucrada es una porción o fracción cuyo alor aría entre cero y uno exclusiamente. Dbseramos un eento ue no tiene posibilidad de ocurrir 3es decir, el eento nulo5, tiene una probabilidad de cero, mientras ue un eento ue seguramente ocurrirá 3es decir, el eento cierto5, tiene una probabilidad de uno. 'a regla más eidente para las probabilidades es ue deben ariar en alor de 0 a 1. Un eento imposible tiene una probabilidad cero de ocurrir, y un eento cierto tiene una probabilidad uno de ocurrir. 'a probabilidad simple se refiere a la probabilidad de ocurrencia de un eento simple. En esta práctica hemos utilizado el Microsoft Excel para los cálculos de probabilidades, siendo *ste como muchos otros programas más accesibles, y con funciones completas. e pudo realizar con e/emplos el cálculo de la función de probabilidad y distribución para ariables aleatorias discretas ue siguen una distribución $inomial y, para ariables aleatorias continuas ue siguen una distribución normal, llegando a er las diferencias entre ambos casos con respecto a la distribución de los datos. e aprendieron a utilizar m*todos de estimación puntual y estimación por interalo, como herramienta para inferir datos estadísticos a partir de una peueTa muestra aleatoria de una población.
Nota: En el documento de Excel puede encontrar todas las pestañas de la primera y segunda entrega, en este caso está en orden de la primera entrega a la segunda.
BIBLIOGRA56A
•
http9<
http9<<.estadistica.ucr.ac.cr
I ENTREGA
OBJETIVOS
• • • •
"prender a analizar datos en las tablas de doble entrada o tablas dinámicas. "prender a utilizar las leyes de probabilidad. "plicar y explorar las herramientas estadísticas de Excel. "nalizar estadísticamente los resultados
MARCO TEÓRICO 1 C+.&'e: on medidas de posición ue se determinan mediante un m*todo ue determina la ubicación de los alores ue diiden un con/unto de obseraciones en partes iguales. 'os cantiles son los alores de la distribución ue la diiden en partes iguales, es decir, en interalos ue comprenden el mismo n-mero de alores. Cuando la distribución contiene un n-mero alto de interalos o de marcas y se reuiere obtener un promedio de una parte de ella, se puede diidir la distribución en cuatro, en diez o en cien partes. 'os más usados son los cuartiles, cuando diiden la distribución en cuatro partesF los deciles, cuando diiden la distribución en diez partes y los centiles o percentiles, cuando diiden la distribución en cien partes. 'os cuartiles, como los deciles y los percentiles, son en cierta forma una extensión de la mediana. (ara algunos alores u , se dan nombres particulares a los cuantiles, 4 3u59 Q(u)
Mediana Cuartiles #eciles Centiles 'os cuartiles son los tres alores ue diiden al con/unto de datos ordenados en cuatro partes porcentualmente iguales. jay tres cuartiles denotados usualmente 41, 4P, 4\. El segundo cuartil es precisamente la mediana. El primer cuartil, es el alor en el cual o por deba/o del cual ueda un cuarto 3PJK5 de todos los alores de la sucesión 3ordenada5F el tercer cuartil, es el alor en el cual o por deba/o del cual uedan las tres cuartas partes 3JK5 de los datos. 2 T#%'# D&+,&# 'as tablas dinámicas, tambi*n llamadas piot tables, son una herramienta para análisis de bases de datos 3$#5. e encargan de resumir y ordenar la información contenida en la $#.
Esta clase de tablas permiten analizar sólo una porción de la $#, es decir, con una $# con gran cantidad de campos o columnas, ayudan a isualizar -nicamente la información releante, con lo ue el análisis se torna más sencillo. 'as piot tables están basadas en dos conceptos9 sumarización y rotación.
3 Te!"# $e P!%#%&'&$#$ 'a probabilidad constituye un importante parámetro en la determinación de las diersas casualidades obtenidas tras una serie de eentos esperados dentro de un rango estadístico. Existen diersas formas como m*todo abstracto, como la teoría #empster+hafer y la teoría de la relatiidad num*rica, esta -ltima con un alto grado de aceptación si se toma en cuenta ue disminuye considerablemente las posibilidades hasta un niel mínimo ya ue somete a todas las antiguas reglas a una simple ley de relatiidad. 'a probabilidad de un eento se denota con la letra p y se expresa en t*rminos de una fracción y no en porcenta/es, por lo ue el alor de p cae entre 0 y 1. (or otra parte, la probabilidad de ue un eento 2no ocurra2 euiale a 1 menos el alor de p y se denota con la letra . (345 6 1 + (3E5 'os tres m*todos para calcular las probabilidades son la regla de la adición, la regla de la multiplicación y la distribución binomial. ?egla de la adición9 'a regla de la adición o regla de la suma establece ue la probabilidad de ocurrencia de cualuier eento en particular es igual a la suma de las probabilidades indiiduales, si es ue los eentos son mutuamente excluyentes, es decir, ue dos no pueden ocurrir al mismo tiempo. (3" o $5 6 (3"5 U (3$5 6 (3"5 7 (3$5 si " y $ son mutuamente excluyente. (3" o $5 6 (3"5 7 (3$5 8 (3" y $5 si " y $ son no excluyentes. iendo9 (3"5 6 probabilidad de ocurrencia del eento ". (3$5 6 probabilidad de ocurrencia del eento $. (3" y $5 6 probabilidad de ocurrencia simultánea de los eentos " y $. ?egla de la multiplicación9 'a regla de la multiplicación establece ue la probabilidad de ocurrencia de dos o más eentos estadísticamente independientes es igual al producto de sus probabilidades indiiduales. (3" y $5 6 (3" $5 6 (3"5(3$5 si " y $ son independientes. (3" y $5 6 (3" $5 6 (3"5(3$:"5 si " y $ son dependientes ?egla de 'aplace9
'a regla de 'aplace establece ue9 'a probabilidad de ocurrencia de un suceso imposible es 0. 'a probabilidad de ocurrencia de un suceso seguro es 1, es decir, (3"5 6 1. (ara aplicar la regla de 'aplace es necesario ue los experimentos den lugar a sucesos euiprobables, es decir, ue todos tengan o posean la misma probabilidad. 'a probabilidad de ue ocurra un suceso se calcula así9 (3"5 6 %; de casos faorables < %; de resultados posibles Esto significa ue9 la probabilidad del eento " es igual al cociente del n-mero de casos faorables 3los casos dónde sucede "5 sobre el total de casos posibles.
PROCEDIMIENTO 1 A,/'&*+ $e '# B#e $e D#. sta se lleó a cabo mediante la redefinición de categorías mediante la conersión de ariables de tipo cuantitatio a cualitatio, explicado en detalle a continuación. Utilizando el criterio de los percentiles de PJ y J 3cuartiles5, se procedió a determinar los interalos alto, medio y ba/o, para clasificar de *sta manera a las ariables ingresos, cr*dito y gasto cualitatiamente. 'a función utilizado en Excel fue la siguiente9 6(E?CE%&)'3matrizF5F donde =matriz@ corresponde al rango de alores y =@ al respectio cuartil a utilizar. Estos cómputos se pueden encontrar en la ho/a de cálculo =(ercentiles@F de *sta manera se llegaron a definir los siguientes criterios9
)ngresos Cr*dito Iastos
"lto ) & `00 C & 10J00 I & \J00
Medio `00 ) PP]J 10J00 C P000 \J00 I 1P00
$a/o ) PP]J C P000 I 1P00
" continuación se crearon las nueas columnas )ngresos, Cr*ditos y Iastos. Utilizando condiciones lógicas en Excel se realizó la clasificación de *stas ariables seg-n el criterio descrito en el paso anterior de la manera presentada aba/o. #onde las columnas C, M y #, corresponden a )ngresos, Cr*dito y Iastos respectiamente de la ho/a de cálculo =#atos@. )ngresos9 6)3CP`00F2"lto2F)3CPPP]JF2$a/o2F2Medio255 Cr*dito9
6)3MP10J00F2"lto2F)3MPP000F2$a/o2F2Medio255
Iastos9 6)3#P\J00F2"lto2F)3#P1P00F2$a/o2F2Medio255
'a ariable =exo@ tuo ue ser redefinida como =I*nero@, primero conirtiendo todos los alores dados en la primera de formato de texto a n-mero y posteriormente creando la columna I*nero donde se modificó el n-mero =0@, correspondiente a mu/eres a =P@, para de *sta manera hacer coincidir los datos con la descripción del problema, usando la función de Excel 6)3)P61F212F2P25, donde ) corresponde a la columna =exo@ de la ho/a de cálculo =#atos@. Una ez ampliada la base de datos, se procedió a aTadir la ho/a de cálculo =?eorganización )nfo@, con el fin de facilitar el siguiente paso de la actiidad, la creación de las tablas dinámicas.
2 T#%'# B&$&,e+&+#'e (T#%'# D&+,&#) (ara la creación de las J tablas dinámicas reueridas, se procedió a utilizar los respectios rangos de datos organizados en J grupos de la ho/a de cálculo =?eorganización )nfo@. Más específicamente, para crear una tabla dinámica bidimensional en Excel, se selecciona el rango de datos, luego se le da clic a la opción insertar tabla dinámica y por -ltimo se determina cual ariable corresponde a las columnas y cual a las filasF todo lo anterior teniendo en cuenta ue debido a ue las ariables son de tipo cualitatio la configuración de campo de alor de la tabla dinámica debe estar en =Cuenta@. #e *sta manera se obtuieron las siguientes tablas dinámicas, a partir de las cuales se pueden determinar las probabilidades marginales, condicionales y con/untas para las ariables seleccionadas. &abla #inámica $idimensional )ngreso y Cr*dito Cuenta "gencia
de Cr*dito
)ngresos "lto $a/o Medio &otal general
"lto P\ ] 1 _J]
$a/o `0 P1 1_` _P\
Medio 1\` P_^ `P^ 101_
&otal general _`^ __ ^JP 1]^J
Medio `` J\ ]_^ ^`]
&otal general _`^ __ ^JP 1]^J
&abla #inámica $idimensional )ngreso y Iastos Cuenta "gencia )ngresos "lto $a/o Medio &otal general
de Iastos "lto _0\ J _`0
$a/o _P1 _` _`
&abla #inámica jobby y I*nero Cuenta "gencia jobby
de I*nero 1
P
&otal
1 P \ _ J &otal general
1^_ P1P 1_\ 1 1`0 ]]`
P1J P\P 1^P 1^_ 1` 100^
general _0^ ___ \\J \1 \\` 1]^J
&abla #inámica )ngresos y %-mero de (ersonas Cuenta de "gencia )ngresos "lto $a/o Medio &otal general
(ersonas 0 1\ P1^ \11 ``
1 `` ^` P00 \`P
P 1J\ 10^ P]] JJ0
\ ^1 _P 1P^ P`P
_ 1J ` P1 _P
J ` P P 10
` 1
1 1
1
&otal general _`^ __ ^JP 1]^J
&abla #inámica I*nero y %iel de Educación Cuenta "gencia I*nero 1 P &otal general
de Educación 1 P_ \J` `\0
P _\1 _`P ]^\
\ 10P 10J P0
_ ^ ]` 1`J
&otal general ]]` 100^ 1]^J
3 C'' $e P!%#%&'&$#$e Utilizando las tablas dinámicas creadas en el paso anterior y la teoría de la probabilidad, se respondieron las ] preguntas planteadas y se formularon \ más. 'as respuestas se encuentran en la ho/a de cálculo =Cálculo de (robabilidades@, pero son mostradas de nueo a continuación. 'os alores utilizados para responder a cada pregunta pueden ser erificados obserando la fórmula utilizada en Excel para cada casilla. + 'a probabilidad de ue tenga ingreso medio y cr*dito ba/o. 07088 + 'a probabilidad de ue tenga ingreso alto o un gasto medio. 078239 + 'a probabilidad de ue no tenga un ingreso alto.
078929 + 'a probabilidad de ue no tenga ingreso ba/o ni tenga cr*dito ba/o. 07412 + ki tiene como hobby el cine, cuál es la probabilidad de ue sean un hombreO 074843 +ki tiene ingreso ba/o, cuál es la probabilidad de ue tenga tres personas a cargoO 070;;
+kCuál es la probabilidad de ue sea una mu/er ue tenga un niel de estudios de maestríaO 070994 +kon independientes los eentos la persona tiene )ngreso alto y el cr*dito ba/oO. ustifiue su respuesta. N + e
e ?#= 0 '&e+.e >e &+&$e+ + &+!e #'. = !@$&. %# + kCuál es la probabilidad de ue tenga un niel de estudios de doctoradoO 070;81 + kCuál es la probabilidad de ue sea hombre y tenga como hobby leerO 07034 + kCuál es la probabilidad de ue tenga un niel de ingresos alto y este a cargo de P personasO 070;08
CONCLUSIONES
•
•
•
•
•
'a distribución de frecuencia es una tabla de resumen en la ue los datos se disponen en agrupamientos o categorías conenientemente establecidas de clases ordenadas num*ricamente. 'a principal enta/a de usar una de estas tablas de resumen es ue las principales características de los datos se hacen eidentes inmediatamente para el lector. 'a principal desenta/a de tal tabla de resumen es ue no podemos saber cómo se distribuyen los alores indiiduales dentro de un interalo de clase particular sin tener acceso a los datos originales. 'a probabilidad es la posibilidad u oportunidad de ue suceda un eento particular. 'a probabilidad inolucrada es una porción o fracción cuyo alor aría entre cero y uno exclusiamente. Dbseramos un eento ue no tiene posibilidad de ocurrir 3es decir, el eento nulo5, tiene una probabilidad de cero, mientras ue un eento ue seguramente ocurrirá 3es decir, el eento cierto5, tiene una probabilidad de uno. 'a regla más eidente para las probabilidades es ue deben ariar en alor de 0 a 1. Un eento imposible tiene una probabilidad cero de ocurrir, y un eento cierto tiene una probabilidad uno de ocurrir. 'a probabilidad simple se refiere a la probabilidad de ocurrencia de un eento simple. 'a utilización de pecentiles 3cuartiles en nuestro caso5, permiten establecer alores representatios para conertir ariables cuantitatias a cualitatias. 'as tablas dinámicas permiten expresar de manera gráfica probabilidades marginales, condicionales y con/untas para de *ste modo facilitar el cálculo de la probabilidad de ocurrencia de eentos determinados.
BIBLIOGRA56A
•
http9<