Avance Proyeco Profesional Universidad Latnoamericana
Esadístca I
Repore Final Hernández Díaz n!el Prof"# $ello %ampos Ale&andro RE'"()* +,-.+*/
08/2017
Introducción La estadística es la rama de las matemáticas que se encarga de recopilar y organizar datos. Una de las palabras más usadas en la estadística es; Población, que es el conjunto de individuos sobre el que se va a estudiar una característica. ambi!n la estadística se encarga de estudiar "enómeno que recopilan dat os para estudiar algunos. algunos. (Ocampo, A. 2017). Ejemplos: #i nosotros queremos $acer un estudios sobre el peso de todos los estudiantes del curso, %&uál sería la población' #on todos los estudiantes del curso porque a ellos serán a los que les vamos a $acer el estudio. Pero si quisi!ramos $acer otro estudio acerca del color pre"erido pre"erido del color de los estudiantes estudiantes de la universidad universidad,, entonces entonces estamos $ablando de otra población población que sería todos esos estudiantes de esa universidad. (tro seria por ejemplo la intención de voto para la Presidencia de un país, entonces la población seria todas las personas que pueden votar de ese país, pero en este caso no serian todas las personas del País por que no todas las personas del país van a realizar la actividad que yo voy a investigar, entonces solo se tomara a unos cuantos. ) esto en la estadíst ica le agregamos otra palabra que sería; *ndividuo, o unidad estadís tica, que es cada uno de los elementos que compon componen en la poblac población ión.. +sto es cada uno de los element elementos os o de las personas personas a las que se les va a $acer el estudio. estudio. +sto representa solo una unidad. ambi!n se utiliza la palabra uestra; -ue es un conjunto representativo de la población, entonces la población es todos, el individuo o unidad es solo uno y muestra, es una parte que se toma cuando la población es muy grande. La otra palabra palabra que ocupamos es ato; estas son cada una de las respuestas respuestas que las encuestas encuestas me dan, para estas se pueden ocupar, n/meros, Letras del abecedario, *ncisos y a"irmaciones, 0#*, 1(, 1( #)2+, )L 3+4, 3+4, 1*15U1(6. Para poder realizar las estadísticas se debe de elaborar una tabla de "recuencias, esta consta de datos complejos que nos ayudaran a la solución de un problema. La tabla está compuesta por una cantidad de datos que nos ayudaran a realizar su solución. iene tambi!n un rango que es la di"erencia entre el numero mayor y menor de nuestros datos, para esto e7iste una peque8a "ormula que es la siguiente.
9: má7imo < mínimo : =9ango ambi!n requerimos de un n/mero de intervalos esta igual se adquiere c on una "órmula que es la siguiente> ?: 1umero de intervalos ?:@A B.B Long 0n6 : *ntervalos n : 1umero de datos Los intervalos son el n/mero de casillas que se tienen que realizar en la tabla para acomodar los datos #e utiliza una amplitud que es lo grande de cada uno de los intervalos. ): 9C?: )mplitud Medidas de tendencia central, (a Media, Mediana ! Moda) &uando $ay una serie de datos, se pueden realizar u organizar, en tablas de "recuencia, tambi!n los podemos representar en gra"icas, a su vez se requiere obtener un valor representativo de estos datos. La media> +s el promedio aritm!tico de los datos, esta se puede realizar sumando el valor de cada uno de los datos y dividirlo entre los datos que tenemos La "órmula que la representa es la siguiente>
x N
X
x n
La ediana> &uando los datos se encuentran agrupados, la mediana es la que queda al centro, cuando están ordenados. #e representa con el símbolo e. &uando el n/mero de datos es impar solo $ay que ordenar y seleccionar el del centro. La moda> +sta es el valor que aparece con mayor "recuencia, pueden e7istir más de un valor con mayor "recuencia 02iomodal o ultimodal. #e representa con el símbolo o.
"ro#a#ilidad +s una medida de la posible medida de un evento cuando se realiza un e7perimento, sirve para resaltar alg/na e"ectividad o alg/n resultado de que tan probable se podría decir la e"icacia de un medicamento o en este caso que tanta probabilidad $ay de sacarse la lotería o inclusive desarrollar un antídoto de alg/n virus mortal. La probabilidad se representa con una P y el tipo de eventos con letras ya sea ) o 2. Una probabilidad puede tomar un valor comience desde el cero $asta el uno, pero nunca puede superar el uno o ser negativo. &uando la probabilidad da igual a D, signi"ica que el evento no ocurrirá, de lo contrario si da igual a @ es que el evento ocurrirá, pero sin embargo el evento tiene un valor intermedio ejemplo> D.@, D.E, D.B, D.F, D.G signi"ica que tiene un porcentaje de que el evento ocurre por ejemplo; si cae en el D.E signi"ica que tiene un EDH de probabilidad en una cantidad de veces. $ipos de "ro#a#ilidad Probabilidad clásica> +s aquella que dado un seceso 0)6, el numero de probabilidad de que 0a6 ocurra se de"ine como el n/mero de casos "avorables al evento, dividido al n/mero de casos totales P ( A)
ncasosfavor ablesaA ncasostotal es
Probabilidad conjunta o regla de la comunicación> +s aquella que e7presa la e7periencia de un suceso 0)6 y el suceso 026, pueden ocurrir de dos "ormas que el segundo suceso dependa del primero es decir sucesos dependientes o cuando ning/n suceso depenta del otro es decir sucesos independientes, Para esto se ocupan dos "ormulas y son las siguientes; #ucesos dependientes. P ( AnB ) P ( A) P ( B / A)
#ucesos independientes P ( AnB ) P ( A) * P ( B )
Probabilidad condicional> +s aquella que nos ayuda a determinar como a"ecta la probabilidad de 0)6, el $ec$o de saber que $a ocurrido otro evento 026 P ( A / B )
P ( AnB ) P ( B )
Probabilidad e7perimental> +s aquella que nos permite calcular la probabilidad de sucesos irregulares, es decir es la probabilidad que asignamos a un suceso mediante el cálculo de su "recuencia relativa, al repetir el e7perimento muc$as veces, en resumen es el resultado basada de pruebas repetidas. +sta probabilidad se calcula con la relación que un n/mero de veces que un evento a ocurrido con el n/mero de veces que se $a ensayado. P
n Eventosocurridos nTotaldeeve ntos
%istri#uciones contin&as de pro#a#ilidad La distribución normal nos sirve para detectar la cantidad de "enómenos que e7plica la mas importante de las distribuciones estadísticas. ambi!n se le denomina con el nombre de campana de 5)U##, pues al representar su in"orme de probabilidad tiende a tener "orma de campana. Una variable aleatoria continua, es aquella que puede asumir un n/mero in"inito de valores dentro de un determinado rango. %istri#ución de pro#a#ilidad normal La normal es la distribución de probabilidad mas importante, multitud de variables aleatorias continuas siguen una distribución normal o apro7imadamente una normal,. Una de sus características mas importantes es que casi cualquier distribución de probabilidad tanto discreta como continua, se puede apro7imar bajo una normal bajo ciertas condiciones. La distribución de probabilidad normal y la curva normal que la representa, tiene las siguientes características> I
La curva normal tiene "orma de campana y un solo pico en el centro de la distribución. e esta manera, la media aritm!tica, la mediana y la moda de la distribución son iguales y se localizan en el pico. )sí, la mitad de mitad del área bajo la curva se encuentran a la derec$a de este punto central la otra mitad esta a la izquierda de dic$o punto.
I
La distribución de probabilidad normal es sim!trica alrededor de de su media.
I
La curva normal desciende suavemente en ambas direcciones a partir del valor central. La curva llega a acercarse cada vez mas al eje , pero nunca llega a tocarlo, es decir, las colas de la curva se e7tienden de manera inde"inida en ambas direcciones, ('edano, M. 2001).
.G
.G
Para trabajar con la distribución normal se debe de calcular la variable 4 con la siguiente "ormula> Z
X
+l valor de 4, indica a cuantas desviaciones estándar de la media se localiza el valor de . #i el valor de es mayor que la media, el valor de 4, será positivo, si es menor, 4 será negativo. Para calcular estas probabilidades de acuerdo al valor de la 4, se utiliza una tabla estandarizada de valores de distribución normal. La tabla corresponde a la probabilidad de que el valor de 4, este entre D y el valor obtenido de 4.
$AA %E "OAII%A%
Ejemplo a reali*ar +n un programa de capacitación laboral para estimular las $abilidades creativas y emprendedoras del personal, se aplico un diagnostico inicial adecuado donde la puntuación media "ue de EBJ puntos. )l "inalizar el programa, los trabajadores presentaron una evaluación similar con los siguientes resultados. )demás se les pregunto si consideraban /til o no este tipo de actividades para su desarrollo pro"esional. #: #*, 1: 1(
PU0$A1E .)) .(( .(2 .(* .(, .(/ .)( .). .(. .(4 .)* .(* .() .)+ .(, ..3 .(/ .)* .(3 .(4
RE'PUE'$A PU0$A1E 0 .(/ 0 .). ' .)3 0 .(, ' .(2 ' .(* ' .(/ ' .() ' .(, ' .(* ' .(4 ' .(2 0 .., ' .)+ ' .(( ' .)/ ' .(. ' .(2 ' .(* ' .)(
RE'PUE'$A PU0$UA1E ' .)* ' .(* ' .(2 ' .(, ' .)4 ' .(3 ' .() ' .(. ' .). ' .(2 ' .). 0 .)+ ' .)) ' .() ' .)( ' .)* ' .(, ' .(, 0 .(/ ' .(*
RE'PUE'$A PU0$UA1E 0 .() ' .(/ 0 .)2 ' .)+ ' .(* ' .(2 ' .(4 0 .(, ' .(/ ' .() ' ..3 ' .(* ' .)+ ' .(/ ' .() ' ..3 ' .)* ' .(( 0 .(3 ' .(2
RE'PUE'$A PU0$UA1E ' .() ' .(2 ' .(, ' .(. ' .). ' .)* ' .() 0 .(, ' .(* ' .)+ ' .). 0 ..) ' .(( ' .(. ' .)) ' .). ' .)3 ' .(* ' .). ' .)4
RE'PUE'$A ' ' ' ' ' ' ' ' 0 0 ' ' ' ' ' ' ' ' ' 0
:;!< > I:;R?!L>
'
r
R = 249 – 224 = 25
224 228
22
1
0.01 @ 100 = 1A
1
Intervalos
228 232
230
15
0.15 @ 100 =15A
1
232 23
234
22
0.22 @ 100 =22A
38
23 240
238
30
0.3 @ 100 = 30A
8
240 244
242
23
0.23 @ 100 = 23A
91
244 248
24
7
0.07 @ 100 = 7A
98
248 252
250
2
0.02 @ 100 = 2A
100
'ol5ci6n# Rango
K= 1+ 3.3 Log (100) = 7. K= 7 !"#l$t%& ! = 25 / 7 = 3.57 !=4
(') es la "ara &e lase esta es el #ro"e&$o entre los l*"$tes &e a&a $ ntervalo es &e$r ' = 224 + 228 / 2 = 22 = Intervalo 1 ' = 228 + 232 / 2 = 230= Intervalo 2 ' = 232 + 23 / 2 = 234 = Intervalo 3 ' = 23 + 240 / 2 = 238 =Intervalo 4 ' = 240 + 244 / 2 = 242 Intervalo 5 ' = 244 + 248 / 2 = 24 Intervalo ' = 248 + 252 / 2 = 250 Intervalo 7. La &$v$s$,n &e entre &os sale &el n-"ero &e &atos %e a en a&a $ntervalo. La re%en$a es el n-"ero &e vees %e el &ato a#aree &entro &e n%estra tala &e &atos se re#resenta on %na (). La re%en$a relava es La re%en$a entre el n%"ero &e &atos r= / n = re%en$a Relava. 6e"#lo &e n%estro #r$"er Intervalo r = 1 / 100 = 0.01 as* s%es$va"ente on a&a %no &e los $ntervalos &e la re%en$a. l res%lta&o se #%e&e "%l#l$ar #or $en #ara %e nos & el #orenta6e &e la r. or -l"o La re%en$a asol%ta a%"%la&a es la a%"%la$,n &el $ntervalo &e a&a el&a &e re%en$a es &e$r se van s%"an&o los n-"eros.
Hiso!ramas on los &$agra"as o graBas %e re#resentan los &atos a&%$r$&os #or a&a re%en$a o lase. stas se #%e&en re#resentar en %na o6a &e Cl%lo. l D$stogra"a &e n%estras aBr"a$ones &e arr$a &e = $ := :o se re#resenta &e la s$g%$ente "anera. n n%estra tala tene"os 85 s$ %e s$ lo &$v$&$"os entre el n-"ero &e &atos %e son 100 lo "%l#l$a"os #or $en %e ser*a n%estro #orenta6e nos &a 85 = 85/ 100 @ 100 = 85 A E>L>R !FL G : tene"os %e son 15 : = 15 / 100 @ 100 = 15 A E>L>R R><> stos valores lo "Cs reo"en&ale es %l$Har la graBa &e #astel
HIiso!rama de 7arca de %lase
Hiso!rama de frec5encia
Hiso!rama de frec5encia relatva
Hiso!rama de Frec5encia Ac5m5lada
7edidas de $endencia %enral8 7edia8 7ediana y 7oda en daos a!r5pados en Inervalos
X 238
edia
:;!< > I:;R?!L>
'$
B
224 228
22
1
1
228 232
230
15
1
232 23
234
22
38
23 240
238
30
8
240 244
242
23
91
244 248
24
7
98
248 252
250
2
100
e:EBK
o:EBK, "r:BD
xi
X Para poder encontrar la media requeriremos de la siguiente "ormula; La cual se tuvo que crear una nueva casilla con N ese nombre, que se logra $aciendo la multiplicación de la casilla 7 por ", de cada uno d los intervalos y se suma al "inal el total y a$ora si podemos $acer la s iguiente operación aplicando la "órmula para obtener la media. 1666 X 20 : EBK
ediana Para la mediana requerimos ordenar los datos del menor al mayor y el dato que quede en medio será la mediana en este caso nuestros datos ya se encuentran ordenador y el numero que queda en medio es el EBK nuevamente, queda mensionar que no siempre este dato se repite. +sto se reconoce por que el numero de datos que tenemos es in par, cuando nuestro numero de datos es par se agarran los dos de en medio y le sacamos la media en este caso se suman esos dos datos y se divide entre esos dos datos y esa será la mediana.
oda La moda recordemos que es el dato que más se repite y para sacarla en nuestra tabla de "recuencias solo $ay que ver cuántas veces se repite un dato ese sería el numero de moda, $ay ocasiones en que el dato se repite dos veces a esto se le llama 2imodal. +n nuestra tabla de "recuencias la "recuencia relativa que más se repite es EBK nuevamente con BD repeticiones.
Ejercicio de "ro#a#ilidad (rganizar los datos en una tabla de contingencia e7plorando las posibles relaciones entre las variables consideradas en el estudio. (rganizar los datos cruzados en una tabla de contingencia e7plorando las posibles relaciones entre las variables consideradas en el estudio. Para ello contempla los siguientes grupos de personal> aquellos que consideran /til el programa y los que no; quienes tuvieron puntuaciones por arriba de la media y qui!nes no.
.))
0
.(/
'
.)*
0
.()
'
.()
'
.(( .(2 .(* .(, .(/ .)( .). .(. .(4 .)* .(* .() .)+ .(, ..3 .(/ .)* .(3 .(4 'I por arri9a de la media 'i por de9a&o de la media 0o por arri9a de la media 0o por de9a&o de la media
0 ' 0 ' ' ' ' ' ' ' ' 0 ' ' ' ' ' ' '
.). .)3 .(, .(2 .(* .(/ .() .(, .(* .(4 .(2 .., .)+ .(( .)/ .(. .(2 .(* .)( ., (, + 3
' ' ' ' ' ' ' ' ' ' 0 ' ' ' ' ' ' 0 '
.(* .(2 .(, .)4 .(3 .() .(. .). .(2 .). .)+ .)) .() .)( .)* .(, .(, .(/ .(*
' 0 ' ' ' ' 0 ' ' ' ' ' ' ' ' ' ' 0 '
.(/ .)2 .)+ .(* .(2 .(4 .(, .(/ .() ..3 .(* .)+ .(/ .() ..3 .)* .(( .(3 .(2
' ' ' ' ' ' 0 ' ' ' 0 ' ' ' ' ' ' ' '
.(2 .(, .(. .). .)* .() .(, .(* .)+ .). ..) .(( .(. .)) .). .)3 .(* .). .)4
' ' ' ' ' ' ' 0 0 ' ' ' ' ' ' ' ' ' 0
l i t & s e a m a r , o r p l E +
Arri#a de la media
%e#ajo de la media
total
'I
2
/
O
0
2
37
74
$O$A
"reunta: +5ual es la pro#a#ilidad de 6ue un tra#ajador considere &til tomar un curso de capacitación dado 6ue se encuentra en el rupo de las puntuaciones por arri#a de la media-
P ( A / B )
P ( A B ) P ( B )
28 28
1
El 100
In8erencia de la puntuación t9pica
l D$stogra"a &e re%en$as relavas ontr%$&o en el e6er$$o &e arr$a esta onor"a&o #or %na "e&$a %e es "% re#resentava se as$"$la "%o a la or"a &e la a"#ana %e #%e&e llegar a tener %n &$str$%$on onn%a &e #roa$l$&a& ene or"as &een&entes &e a"os la&os tanto &el la&o &ereo o"o &e la la&o $H%$er&o. sta nos re#resenta el #orenta6e %e ene a&a $ntervalo en s% valor &e re#e$ones la s%"a en total &e este #orenta6e e%$vale al 100A #ero la "e&$a nos re#resenta %n 80A en este e6e"#lo %e #%e&e o%rr$r en s% #roeso. La $nter#reta$on &e este D$stogra"a es "e&$r el valor &e #orenta6e &e a%er&o a la "e&$ana &e los valores #ro#or$ona&os &e a%er&o a la ' n%"ero &e &atos. n este e6er$$o %e real$Ha"os "$ re%en$a relava &e a%er&o a la "e&$ana s$ to"o %na or"a &e a"#ana se ve
re#resentavo o"o "en$one arr$a a la &$str$%$on nor"al &e la "e&$a a %e este ta"$en to"o %na or"a &e a"#ana nor re#resenta el $strogra"a on %na or"a #%nag%&a #or en "e&$o ene or"a &esen&ente &e a"os la&os.
A6u9 8alto incluir lo siuiente:
3. Res5lados del proyeco" resenta e#l$a los &atos %e ot%v$ste. Je "anera a&$$onal otn e $ntegra los $ntervalos &e onBanHa orres#on&$entes a los #arC"etros &e a&a %na &e las var$ales est%&$a&as. I ara la var$ale %antava &e #%nt%a$,n en %na a$l$&a& &eter"$na el $ntervalo &e onBanHa &on&e es "Cs #roale %e se en%entre la "e&$a #ola$onal &e esta al$Ba$,n. ara la var$ale %al$tava &e %l$&a& o venta6a #er$$&a #or el traa6a&or &eter"$na el $ntervalo &e onBanHa orres#on&$ente a la #ro#or$,n #ola$onal.
5onclusión Podemos observar que la importancia de la estadística no solo sirve para la solución de alg/n problema sino tambi!n, nos ayuda a tener in"ormación que representa la apro7imación de un estudio y el cálculo e7acto representado en tablas y en gra"icas. +sta nos puede ayudar a organizar in"ormación de varios estudios que realizan las empresas por medio de encuestas a la población en base a algo que sea de su importancia Por ejemplo; muc$as empresas buscan o quieren saber que tan bueno es su producto, y como la población es muy grande solo escogen un lugar, supongamos una tienda comercial para poder adquirir las respuestas del publico que consume ese producto, en base a eso se adquieren resultados para que puedan comprobar por ejemplo que de cada @DD personas MD se sienten satis"ec$as con el producto.
La estadística tambi!n se puede representar por medio de gra"icas que sirve para poder tener ordenada la in"ormación adquirida y se pueda representar de una mejor manera. 1os va a ayudar a detectar los datos más rápidamente y a poder distinguir valores más altos y los más bajos. ) estas gra"icas se les conoce como Nistogramas. La utilización de las "ormulas en este ejemplo son las más acertadas para poder adquirir in"ormación congruente y e7acta, de acuerdo a las normas de estadística son "ormulas sencillas y "áciles de aprender. Para la adquisición de las di"erentes medidas de tendencia central como lo es la edia, ediana y oda, podemos observar que solo basta con seguir unas sencillas "ormulas que se aplican en este caso a una tabla de "recuencias con datos agrupados por intervalos, estas medidas las adquirimos para poder tener un n/mero promedio que sería nuestra media, tambi!n para obtener el numero central que sería nuestra mediana y para obtener el numero que más se repite que sería nuestra moda. +n el caso de la moda no siempre e7iste en los datos solamente un numero que se repite varias veces sino que a veces $ay di"erentes datos que se repiten varias veces y las mismas veces de otro dato a esto se le llama 2imodal cuando aparece dos datos repetidos dos veces o multimodal cuando se repiten B datos con la misma cantidad de veces. La probabilidad por ende nos sirve para poder detectar la e"ectividad de un resultado en general a trav!s de un estudio realizado utilizando datos con"iables. +s decir si un laboratorio de medicina acaba de desarrollar un nuevo medicamento contra la gripa y quiere saber qu! tan e"icaz es su "órmula utilizada en personas, deberá tener datos e7actos de el tiempo y la edad de las personas que lo tomaron y a trav!s de eso saber que probabilidad $ay que "uncione en las personas de acuerdo a la edad que tienen y que probabilidad $ay de que no "uncione en personas más jóvenes o adultas. La probabilidad nos puede ayudar a tener resultados que la mayoría de las empresas desean saber por la cuestión de lograr resultados en sus productos que venden o en su propio personal. +n la distribución normal de la media nos ayuda muc$o a representar datos que a trav!s de una media se puede encontrar su porcentaje de probabilidad que tenga una reacción a cumplir con su con"irmación de que este e7perimento suceda o no suceda a esto se re"iere la probabilidad y la "orma de calcular una media desde el punto más alto $asta el punto más bajo y esta se representa con un $istograma en "orma de campana que baja de manera descendente sin tocar el punto de la que es la media y a trav!s de ella darnos n/meros proporcionales a l porcentaje de reacción de acuerdo a los datos que se quieran obtener. Para esto tambi!n ocupamos una tabla de in"erencias para lograr estos resultados, necesitamos el valor de la 4, ya e7plicado arriba y de acuerdo a este valor sacaremos el valor representativo de la probabilidad de acuerdo a esta tabla que nos ayudara a ser mas precisos en este dato y se pueda gra"icar esta gra"ica de la campana y obtener un resultado cabe mencionar que la probabilidad de porcentaje de un
e7perimento es de cero a @, que se representan en porcentaje de DH a @DDH y los puntos medios .@D, .ED, .BD, etc., son porcentajes de @D, ED y BDH de que este e7perimento el acto se repita cierto n/mero de cantidad de veces. La estadística no solo nos sirve para calcular la media, mediana y la moda que nos ayudan a detectar y ordenar ciertos datos que se aportan y quienes están en la media, cuales se repiten mas y cuál es el dato del medio sin ordenarlos. Posteriormente de acuerdo a estos datos podemos tener probabilidades para poder saber con qu! "recuencia puede suceder un acto en el e7perimento y cuál podría ser la probabilidad de que tenga !7ito o error, tambi!n a trav!s de $istogramas nos podemos dar una ayuda para representar toda la in"ormación de una m anera más sencilla y "ácil de entender para poderla representar.
9e"erencias>
Bologna, E. (2013) Estadística para psicología y educacin (3!. ed). "rgentina# Bru$as. %apítulo 6. Bases pro&a&ilísticas para la in'erencia. e&ano. (2001). L! JI;RIMEIN: :>R!L. 2011 &e eretar$a &el sta&o &e la &%a$,n $o Oe J$s#on$le en L$nea (campo, ). 0arzo, ED@J6. &onceptos 2ásicos de +stadística. DB.@J, de U) #itio Oeb> isponible en Línea (campo, ). 0ebrero, ED@J6. abla de "recuencia agrupada en intervalos. DE.@J, de U) #itio Oeb> isponible en Línea (campo, ). 0arzo, ED@J6. edia, ediana y oda, datos agrupados en intervalos. DB.@J, de U) #itio Oeb> isponible en Línea
riola, . 0ED@B6. Estadística. 0@Da. ed.6. !7ico> Pearson. riola, . 0ED@B6 Estadística. 0@@a. ed.6. !7ico> Pearson.