Estadística General
Tema: Estadística
ESTADÍSTICA GENERAL INTRODUCCIÓN La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes grandes arreglos arreglos y tablas, tablas, de volúmenes volúmenes de cifras cifras relativas relativas a nacimiento nacimientos, s, muertes, muertes, viajes, visitantes, ingresos, ventas y así sucesivamente. sucesivamente. Algunas personas podrían pensar que la enseñanza de la estadística slo interesa a los profesores, o bien a los investigadores que trabajan en los diferentes departamentos de una universida universidad. d. !sta es una creencia creencia errnea, errnea, puesto que la estadísti estadística ca "a surgido desde desde la misma estadística y podemos encontrar !stadísticos en psicología, economía, medicina, ingeniería y otras áreas.
¿Que es la estadística? #egún$ %iccionario &A!
'iencia o recuento de la poblacin, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestacin de un !stado, provincia, pueblo, clase, etc.
'iencia que utiliza conjuntos de datos num(ricos para obtener inferencias basadas en el cálculo de probabilidades.
La !stadística se ocupa de los m(todos y procedimientos para recoger, clasificar, resumir, "allar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos) así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. La !stadística , rama de las matemáticas que se ocupa de reunir, organizar y analizar datos num(ricos y que ayuda a resolver problemas como el diseño de e*perimentos y la toma de decisiones. Estadística es un conjunto de métodos científicos para la recopilación, representación
condensación y análisis de los datos extraídos de un sistema en estudio. Con el objeto de poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.
Ing. Est. Jorsi Ericson Balcázar Gallo
+
Estadística General
Tema: Estadística
Paa !u" si#e la estadística +. ara la descripcin de datos. -. ara conocer datos de poblacin a partir de datos de muestra. . ara ver las relaciones entre los datos.
I$%&ta'cia de la Estadística La estadística "a jugado un papel primordial en el desarrollo de la sociedad moderna, al proporcionar "erramientas metodolgicas generales generales para analizar la variabilidad, determinar relacione relacioness entre variables, variables, diseñar en forma ptima estudios y e*perimen e*perimentos tos y mejorar mejorar las predicciones y toma toma de decisiones en situaciones de incertidumbre. Las t(cnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades) estudios de consumidores) análisis de resultados en deportes) administradores de instituciones) en la educacin) organismos políticos) m(dicos) y por otras personas que intervienen en la toma de decisiones.
LA ESTADÍSTICA ( LA IN)ESTIGACIÓN CIENTÍ*ICA La I'#esti+aci' Cie'tí-ica La investigacin es un proceso de produccin de conocimientos científicos) es un proceso sistemático a trav(s del cual se recogen datos e informacin de la realidad objetiva para dar respuesta a las interrogantes que se plantean. /o "ay investigacin grande o pequeña, simplemente investigar es buscar respuesta a determinadas interrogantes, a trav(s de la aplicacin de procedimientos científicos.
.PAPEL DE LA ESTADÍSTICA EN LA IN)ESTIGACIÓN CIENTÍ*ICA./ La !stadística es considerada tambi(n como un suministro de un conjunto de "erramientas sumamente útiles en la investigacin. /o e*iste investigacin, investigacin, proceso o trabajo encaminado encaminado a obtener informacin cuantitativa cuantitativa en general, en la que la estadística no tenga una aplicacin. La estadística no puede ser ignorada por ningún investigador, aún cuando no tenga ocasin de emplear la !stadística Aplicada en todos sus detalles y ramificaciones. !l papel de la estadística en la investigacin es, entonces, funcionar como una "erramienta en el diseño de investigaciones, en el análisis de datos, y en la e*traccin de conclusiones a partir de ellos. !scasamente !scasamente podrá preveerse un papel papel mayor y más más importante
Ing. Est. Jorsi Ericson Balcázar Gallo
-
Estadística General
Tema: Estadística
Paa !u" si#e la estadística +. ara la descripcin de datos. -. ara conocer datos de poblacin a partir de datos de muestra. . ara ver las relaciones entre los datos.
I$%&ta'cia de la Estadística La estadística "a jugado un papel primordial en el desarrollo de la sociedad moderna, al proporcionar "erramientas metodolgicas generales generales para analizar la variabilidad, determinar relacione relacioness entre variables, variables, diseñar en forma ptima estudios y e*perimen e*perimentos tos y mejorar mejorar las predicciones y toma toma de decisiones en situaciones de incertidumbre. Las t(cnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades) estudios de consumidores) análisis de resultados en deportes) administradores de instituciones) en la educacin) organismos políticos) m(dicos) y por otras personas que intervienen en la toma de decisiones.
LA ESTADÍSTICA ( LA IN)ESTIGACIÓN CIENTÍ*ICA La I'#esti+aci' Cie'tí-ica La investigacin es un proceso de produccin de conocimientos científicos) es un proceso sistemático a trav(s del cual se recogen datos e informacin de la realidad objetiva para dar respuesta a las interrogantes que se plantean. /o "ay investigacin grande o pequeña, simplemente investigar es buscar respuesta a determinadas interrogantes, a trav(s de la aplicacin de procedimientos científicos.
.PAPEL DE LA ESTADÍSTICA EN LA IN)ESTIGACIÓN CIENTÍ*ICA./ La !stadística es considerada tambi(n como un suministro de un conjunto de "erramientas sumamente útiles en la investigacin. /o e*iste investigacin, investigacin, proceso o trabajo encaminado encaminado a obtener informacin cuantitativa cuantitativa en general, en la que la estadística no tenga una aplicacin. La estadística no puede ser ignorada por ningún investigador, aún cuando no tenga ocasin de emplear la !stadística Aplicada en todos sus detalles y ramificaciones. !l papel de la estadística en la investigacin es, entonces, funcionar como una "erramienta en el diseño de investigaciones, en el análisis de datos, y en la e*traccin de conclusiones a partir de ellos. !scasamente !scasamente podrá preveerse un papel papel mayor y más más importante
Ing. Est. Jorsi Ericson Balcázar Gallo
-
Estadística General
Tema: Estadística
El desarrollo científico científico y la investigación investigación no son posibles posibles sin la estadística estadística
TRA0A1O O2se#a 3 desci2i di-ee'tes %&2le$as elaci&'ad&s c&' su caea/ CLASI*ICACION CLASI*ICACION O TIPOS DE ESTUDIOS Se+4' el tie$%& de &cue'cia de l&s 5ec5&s 3 e+ist&s e+ist&s de la i'-&$aci' #e clasifican en$ ♦
Ret&s%ecti#&6 #on aquellos estudios que el investigador indaga sobre "ec"os ocurridos en el pasado.
♦
P&s%ecti#&6 #on aquellos estudios que el investigador registra la informacin según van ocurriendo los fenmenos.
Ing. Est. Jorsi Ericson Balcázar Gallo
Estadística General
Tema: Estadística
ESTADÍSTICA GENERAL DI)ISIÓN DE LA ESTADÍSTICA La !stadística para su mejor estudio se "a dividido en dos grandes ramas$ la !stadística %escriptiva y la 0nferencial. Estadística Descriptiva:
#e denomina denomina estadís estadística tica descript descriptiva, iva, al conjunto conjunto de m(todos m(todos
estadísticos que se relacionan con el resumen y descripcin de los datos, como tablas, gráficas, y el análisis mediante algunos cálculos. Estadística Inferencial
#e denomina denomina inferencia inferencia estadística estadística al conjunto de m(todos m(todos con los
que se "acen la generalizacin o la inferencia sobre una poblacin utilizando una muestra. La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que (stas sean dadas con una medida de confiabilidad que es la probabilidad. !stas dos partes de la estadística no son mutuamente e*cluyentes, ya que para utilizar los m(todos m(todos de la inferencia inferencia estadística, estadística, se requiere requiere conocer conocer los m(todos m(todos de la estadístic estadísticaa descriptiva. La Estadística Inferencial inesti!a o anali"a una población partiendo de una muestra tomada.
T7R8INOS DE ESTADÍSTICA Los t(rminos estadísticos que se usan en estadística es necesario conocerlos para poder entender el lenguaje estadístico que se utiliza en el desarrollo de la asignatura$
P&2laci'6 !n forma general, en estadística) estadística) se denomina poblacin, poblacin, a un conjunto de elementos elementos 1que consiste de personas, objetos, etc.2, que contienen una característica observable común.
Ing. Est. Jorsi Ericson Balcázar Gallo
3
Estadística General
Tema: Estadística
La pobl poblac aci inn debe debe esta estarr perf perfec ecta tame ment ntee defi defini nida da en el tiem tiempo po y en el espa espaci cio. o. or or lo tant tanto, o, al defi defini nirr una una poblacin, se debe cuidar que el conjunto de elementos que
la
integran quede perfectamente delimitado. #i, por ejemplo, estamos analizando la edad de los alumnos de la 4/, debemos especificar cuáles y cuándo, entonces seria$ +356 alumnos de la 4niversidad /acional de iura, en Abril del -7++ -7++.. 8La poblacin puede ser finita o infinita9$ Población Finita, !s el conjunto finito de unidades de análisis donde se puede identificar a
un elemento inicial y:o a un elemento final. or ejemplo, la poblacin de fabricas de Lima ;etropolitana, todos los los estudiantes estudiantes e*istentes e*istentes en la 4niversidad /acional de iura. Población Infinita,
'onjunto infinito de elementos donde no se podría identificar a
una unidad inicial ni a la unidad final. !jemplo, la poblacin de personas con "ábitos de fumar, poblacin de personas que consumen bebidas gaseosas, poblacin e personas que consumen cervezas, cervezas, los árboles de la selva peruana, etc.
8uesta$ !s una parte o subconjunto de una poblacin en estudio. La muestra está cons consti titu tuid idaa de elem elemen ento toss sele selecc ccio iona nado doss de una una manera deliberada, con el objeto de investigar las propiedades de su poblacin. 'uando no se puede acceder a los datos de toda la poblacin, que es lo más frecuente, y se debe trabajar con slo los de la muestra, a la simple descripcin de los datos se añade el inter(s por valorar "asta qu( punto los resultados de la muestra son generalizables a la poblacin. #e denomina muestra a una una parte de la poblacin seleccionada seleccionada de acuerdo con un plan o regla, con el fin de obtener informacin acerca de la poblacin de la cual proviene. 8
P&2laci' 9N:
P&2laci' 9N:
8uesta 9':
µ
;uestreo
σ σ
-
# $ -
$
0nferencia
Ing. Est. Jorsi Ericson Balcázar Gallo
p 5
Estadística General
Tema: Estadística
)aia2le6 !s una característica de inter(s, toma diferentes valores. Las variables son características observables, susceptibles de adoptar distintos valores o ser e*presados en varias categorías. Las variables se representan con letras mayúsculas del abecedario. !jemplo$ •
=$
•
>$ ". %el yogurt.
•
?$ 'olor de la bebida gaseosa.
•
@$ /úmero de gaseosas defectuosas por lote.
•
$ ;(todo de enseñanza.
•
;$
•
/$
•
=$ Dastos realizados por la empresa por aniversario de esta, en el mes de Bulio.
•
>$ !dad de los alumnos del colegio 8;ariano ;elgar9.
•
@$
U'idad de a';lisis & u'idad ele$e'tal6 !s el objeto o elemento indivisible que será estudiado en una poblacin o en una muestra, sobre los cuales se va a obtener datos, de los ejemplos anteriores seria$ •
'ada perno producido.
•
'ada frasco que contiene al yogurt.
•
'ada gaseosa producida.
•
'ada lote producido.
•
'ada alumno.
•
'ada lote de ladrillos.
Ing. Est. Jorsi Ericson Balcázar Gallo
F
Estadística General
Tema: Estadística
•
'ada equipo ftalmolgico de las zonas rurales en el 'LA# #ullana.
•
'ada departamento de dic"a empresa.
•
'ada alumno del colegio 8;ariano ;elgar9.
•
'ada trabajador que labora en la empresa ED.
Dat&s6 'omúnmente se le conoce como observaciones. #on los valores que toma la variable en cada unidad estadística. %e los ejemplos anteriores seria$ •
*+G- cm., *-G-.+ cm.
•
y+G+-.-H, y-G+.5H
•
q+Gamarillo, q-Grojo, qGnegra, q3Gamarilla.
•
!tc.
U'idad de $edida . #on las unidades físicas en las que son e*presados los datos. Las variables cualitativas no tienen unidad de medida. %e los ejemplos anteriores. •
cm.
•
Drados.
LAS )ARIA0LES odemos iniciar el tema indicando que definir las variables 8me permitirá dar respuesta a lo que quiero estudiar9. !l se*o, la edad, el nivel socioeconmico, el seguimiento de un determinado plan de cuidados, el tipo de droga que se consume, la percepcin de riesgo frente a una determinada conducta, etc. son aspectos que con seguridad se abordarán si estamos realizando un estudio sobre el consumo de drogas, pues bien, estos aspectos a estudiar, son lo que denominamos las variables de estudio.
CLASI*ICACIÓN DE LAS )ARIA0LES
Ing. Est. Jorsi Ericson Balcázar Gallo
6
Estadística General
Tema: Estadística
8edi es asignar valores a las variables del estudio. #u principal funcin es evitar la subjetividad del investigador. La forma de medir las variables va a determinar el análisis matemático, estadístico, de las mismas.
Clasi-icaci' se+4' su 'atuale
Escala '&$i'al6 %etermina la igualdad o desigualdad de los individuos. #e*o$ masculino o femenino. Iumador$ #í. /o. !stado 'ivil$ soltero, casado, viudo, separado o divorciado.
Escala &di'al $ %etermina el orden de los individuos de 8mayor9, 8menor9 o 8igual que9. Jabito de fumar$ no fumador, fumador moderado, fumador importante. 'onsumo de tabaco$
)ARIA0LES CUANTITATI)AS6 ;iden una característica de forma num(rica, miden una cantidad. ueden ser$
)aia2les Discetas $ !ntre dos valores consecutivos no e*iste otro valor, es decir toman solo valores enteros. #e obtienen siempre por conteo. !jemplo. • • • • •
/úmero de "ijos. /úmero de maquinas registradoras. /úmero de máquinas empacadoras de cemento. /úmero de estaciones de servicio. /úmero de cajeros automáticos.
Ing. Est. Jorsi Ericson Balcázar Gallo
C
Estadística General
Tema: Estadística
)aia2les C&'ti'uas $ !ntre dos valores consecutivos se pueden encontrar infinitos valores, es decir toman valores decimales. #e obtienen siempre por alguna medicin o un cálculo matemático. !jemplo$ • • •
eso de pernos
CUALITATIVAS
Nominal
Ordinal
CUANTITATIVAS
Continua
Discreta
ELE8ENTOS DE UNA )ARIA0LE La identificacin y definicin de variables es la tarea más delicada de toda investigacin y del trabajo estadístico. <(ngase presente que las variables se deducen a partir de los objetivos de un estudio o investigacin. !n consecuencia, para tener (*ito en la seleccin de variables, es recomendable distinguir los siguientes cinco elementos$ a2 /ombre o denominacin de la variable. b2 %efinicin o conceptualizacion de la variable. c2 4n conjunto de categorías o niveles, que es definida por el investigador. Las categorías no son únicas, lo mínimo es dos categorías y dependen de los objetivos de la investigacin. d2 rocedimiento para categorizar o agrupar las unidades de análisis. e2 Algunas medidas de resumen o indicadores. !jemplo$ Meamos la variable Estad& Ci#il6 a2 /ombre$ !stado 'ivil o conyugal
Ing. Est. Jorsi Ericson Balcázar Gallo
N
Estadística General
Tema: Estadística
b2 %efinicin$ !s la situacin de la persona empadronada en relacin con las leyes y costumbres del país. c2 'ategorías$ 1+2 #oltero 1-2 'asado 12 'onviviente 132 %ivorciado 152 Miudo d2 'ategorizacin$ O'uál es su estado civilP e2 ;edidas de &esumen 0ndicadores$ K
%istribucin orcentual
K
K
!tc.
Meamos la variable cuantitativa, 0ngreso$ a2 /ombre$ 0ngresos b2 %efinicin$ #on los recursos monetarios netos, incluyendo todas las bonificaciones que percibe una persona por su ocupacin principal y secundaria durante el periodo de referencia de la encuesta. c2 'ategorías$ uede proponerse en forma de niveles o simplemente intervalos. rimera forma$ 1+2 Alto
#egunda forma$ 1+2 ;enos de 77
1-2 ;edio
1-2 %e 7+ a 577
12 Qajo
12 %e 57+ a 677 132 %e 67+ a mas
d2 'ategorizacin$ O'uál fue su ingreso total en el último mesP e2 ;edidas de resumen, 0ndicadores$ 0ngreso promedio, 0ngreso mediano, etc.
E1ERCICIOS => De l&s e'u'ciad&s si+uie'tes Ide'ti-ica la %&2laci', $uesta, u'idad de a';lisis, dat& 3 la #aia2le 9ti%& de #aia2le 3 sus ele$e't&s:
Ing. Est. Jorsi Ericson Balcázar Gallo
+7
Estadística General
Tema: Estadística
+2 #e desea saber el tiempo de vida de los motores en las motocar >A;AJA cierto estudio se "izo ciudad de
Ta2a& =@ I'#esti+a, %ese'ta 3 e%&'e aceca de6 &ecoleccin de datos$ K
'oncepto
K
Iuentes de datos
K
<(cnicas de recoleccin de datos.
K
'enso y !ncuesta
RECOPILACIÓN DE DATOS La recopilacin de datos es el momento en la cual el investigador se pone en contacto directo con los sujetos, objetos o elementos sometidos al estudio con el propsito de obtener los datos o respuestas de las variables consideradas) a partir de estos datos se prepara la informacin estadística y se calcula las medidas de resumen e indicadores para el análisis estadístico. ara recoger la informacin se toma en cuenta las siguientes modalidades$ Las fuentes de informacin, los sistemas de recoleccin y las t(cnicas de recoleccin. *UENTES DE IN*OR8ACION !s el lugar, la institucin o persona donde están los datos para cada una de las variables o aspectos de la investigacin. Las fuentes de informacin pueden ser$ a2 *ue'tes i'te'as6 !s la informacin recopilada por la empresa 1o la institucin2 de los resultados de su propia gestin. #on pues las observaciones que constantemente realizan los departamentos$ Administrativos, contables, comerciales, t(cnicos, etc.
Ing. Est. Jorsi Ericson Balcázar Gallo
++
Estadística General
Tema: Estadística
!jemplo. &eportes financieros, &eportes de operaciones, que están dados por la informacin de la produccin, ventas, compras, estados de p(rdidas y ganancias, &eportes especiales, es informacin adicional para un análisis específico. b2 *ue'tes ete'as6 #on informaciones estadísticas elaboradas por instituciones de investigacin, ya sean públicas o privadas, o dependencias especializadas, generalmente requeridas a nivel nacional o sectorial. c2 *ue'tes Pi$aias6 'uando los datos se obtienen directamente de la misma persona o entidad 1unidad de observacin2 utilizando ciertas t(cnicas. !jemplo. Llevar a cabo una encuesta para conocer el grado de satisfaccin laboral de los trabajadores de la fábrica '!0'AI!. Rndices de precios al consumidor. d2 *ue'tes Secu'daias6 'uando los datos ya "an sido elaborados y procesados por otras personas o instituciones. !jemplo. La informacin estadística que publica el 0/!0 de los diferentes ministerios del erú.
SISTE8A DE RECOLECCIÓN #on procedimientos que se utilizan para recoger informacin, puede ser$ a2 L&s Re+ist&s6 #on libros, padrones en donde se anotan en forma regular permanente y obligatoria los "ec"os ocurridos. !jemplo. &egistros civiles, &!/0!', &egistros úblicos, etc. b2 Las E'cuestas6 #on procedimientos de obtencin de informacin estructurada según criterios previos de sistematizacin que se efectúa con propsito específico en la poblacin o en un sector de ella. ueden ser$
2/>: E'cuesta Ce'sal6 'uando abarca toda la poblacin en estudio. !jemplo. 'enso de poblacin y vivienda de +NN. 2/@: E'cuesta 8uestal6 'uando abarca una parte de la poblacin en estudio. !jemplo. Llevar una encuesta a +57 alumnos de la 4'MKiura. TECNICAS DE RECOLECCION #on procedimientos que se utilizan para recolectar informacin según la naturaleza del trabajo de investigacin. ueden ser$ !l cuestionario, la entrevista, el análisis de contenido, etc. a2 La &2se#aci'6 !s la accin de mirar con rigor, en forma sistemática y profunda, con el inter(s de descubrir la importancia de aquello que se observa. b2 El cuesti&'ai&6 !s un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas que se formulan al encuestado o entrevistado con el propsito de obtener datos de las variables consideradas en estudio. c2 La e'te#ista6 !s un dialogo entre personas, es una t(cnica donde una persona llamada entrevistador, encuestador o empadronador solicita al entrevistado le proporcione algunos datos e informacin. d2 A';lisis de c&'te'id&s6 !s la t(cnica más elaborada y que goza de mayor prestigio en el campo de la observacin documental. !l fin o propsito del análisis del
Ing. Est. Jorsi Ericson Balcázar Gallo
+-
Estadística General
Tema: Estadística
contenido consiste en determinar los puntos más importantes de un documento para observar y reconocer el significado de los mismos en sus elementos, como palabras, frases, etc., y en clasificarlos adecuadamente para su análisis y e*plicacin.
ORGANIBACIÓN ( CLASI*ICACIÓN DE DATOS 4na vez que se "a llevado a cabo la recoleccin de datos es necesario organizarlos y presentarlos adecuadamente de tal manera que facilite su comprensin, descripcin y análisis del fenmeno en estudio y obtener conclusiones válidas para la toma de decisiones. #e consideran las siguientes actividades$ &evisin y correccin de los datos, construccin de tablas de distribucin de frecuencias y representacin tabular y gráfica. Re#isi' 3 C&ecci' de l&s Dat&s
CUADROS O TA0LAS ESTADÍSTICAS 4n cuadro estadístico es el arreglo ordenado, columnas y filas, de datos estadísticos o características relacionadas, con el objeto de ofrecer informacin estadística de fácil lectura, comparacin e interpretacin. 4n cuadro estadísticos es le resultado de trabajos previos 1planeamiento, recopilacin, tabulacin, cálculos, etc.2 Partes principales: 1) Número del !adro" #)
3) ') ()
es le cdigo o elemento de identificacin que permite ubicar el cuadro en el interior de un documento. $it!lo, es la descripcin resumida del contenido del cuadro. &esponder a las clásicas preguntas $ ?ue, %onde, 'omo y 'uando %!e: O?u( informacin contiene el cuadroP • ?ue "ay en el cuadro, se refiere al "ec"o observado o la característica principal. omo: O'mo está arreglada o clasificada la informacinP • 'omo están ordenados o clasificados los datos en el cuadro. • Donde: OA dnde corresponde la informacin tabuladaP #e refiere al lugar geográfico o institucin a la que corresponde la informacin. !ando: OA qu( período de tiempo se refiere la informacinP • A que momento o periodo de tiempo esta referida la informacin puede ser un momento especifico o puntual, como tambi(n un periodo de varios años, mese o semanas, etc. Encabe&amiento o conceptos" !s la descripcin resumida sobre contenido de las filas y columnas que contiene el cuadro de informacin . !erpo" 'omprende al contenido num(rico de la informacin del cuadro. F!ente" #e anotará el nombre de la unidad responsable de la formulacin y presentacin del tabulado de informacin estadística. /H de cuadro Ing. Est. Jorsi Ericson Balcázar Gallo
+
Estadística General
Tema: Estadística
CUADRO N => DISTRI0UCIÓN DE @= E8PRESAS SEGN EL N8ERO DE TRA0A1ADORES EN PIURA, A0RIL DEL @=>/ /S !ncabezamiento f i "i Ii
TALLO ( FO1AS Una manera muy simple de representar información en muestras de tamaño moderado, es el tallo y hojas. Básicamente, consiste en un ordenamiento en que el último dígito se escribe separadamente de los de mayor significación. Mostraremos su uso mediante los datos que aparecen en la Tabla ! que presentamos a continuación.
Tabla 01 DATOS DE ALUMNOS DEL TERCER DE INGENIERIA INDUSTRIAL CICLO DE LA UNIVERSIDAD PRIVADA CESAR VALLEJO DE PIURA, 2011 " T # $ " T # $ " T # $ M !%& ' !( ) !%& %* !( ) !%* + ! M !%( '' ! ) !%( '! !- ) !' '( ! M !% '' !( M !(& %& ! ) !% '! !) !' +- ! ) !'% +! * ) !%* '% * ) !'( '' * ) !%+ '' ! ) !%- '& *! ) !%! '& !( ) !%' % ! ) !( ' * ) !% % ! ) !'+ '* !- ) !%' '% ! ) !% % !( ) !'+ '* * ) !%' '% !M !(( %( *! M !( % !- ) !'' '* ! ) !' ' !( ) !% '' ! ) !'' +' !)uente $ncuesta a alumnos.
" T # $ ) !%& + !) !% '' ! ) !' '! !) !%% % ! ) !(+ '- * ) !(+ % !) !(& ( * M !(& ( ! ) !'( '+ !( ) !' '* !
" T # $ ) !%& '' !( ) !%( '% ! ) !' + !) !( '+ ! ) !% +- * M !(+ '% * M !(* % ** M !(* % !M !%% %* * M !(! (' !-
" T # $ M !( ( ! M !' (* ! M !%' ( !M ! (' * M !(% %% *! M !(' % ! M !%- ( !M !(& ( !-
/onde " genero 0M1 Masculino, )1)emenino2 T $statura 0cm2 # #eso 03g2 $ $dad 0años2 $n esta tabla, aparecen datos de ' alumnos del tercer ciclo de ingeniería industrial de la Uni4ersidad #ri4ada 56sar 7alle8o, correspondientes a las 4ariables "6nero, $statura 0cm2 y #eso 09g2, recolectados de una encuesta. #ara construir el tallo y :o8as correspondiente a la 4ariable $statura, se escribe una columna con las decenas de los números que serán representados. ;as estaturas
Ing. Est. Jorsi Ericson Balcázar Gallo
+3
Estadística General
Tema: Estadística
disponibles en la muestra, tienen como decenas a los 4alores !', !%, !( y !. /e este modo, el número !%' tiene !% decenas y ' unidades. $sto significa que en la columna de la derec:a, a la altura del !%, se anota el dígito '.
TALLO ! "OJAS DE LA TA#LA 01 ESTATURA DE ALUMNOS ! +''%(( ' ! !**&&&&+'''%%( % ((-! !*&&&+++'%( ( ! ' $l resultado obtenido puede considerarse como un reordenamiento de la información original. =in embargo, al poner ordenadamente las cifras, se tiene un beneficio adicional al mirar la figura globalmente, entrega una representación gráfica de la información. 0$sta 4isión se facilita si el gráfico se obser4a lateralmente2. ;a simplicidad de este procedimiento lo :ace muy adecuado para representar pequeños con8untos de datos en forma manual.
T$%&'(os )t'l'*a+os f i >
Frecuencia absoluta simple ( ) indica el número de 4eces que se repite un atributo, característica, 4alor o el número de 4alores de un con8unto de datos que se encuentran en un inter4alo. ;a suma total de estas frecuencias es igual al total de datos 0n o ?2. hi T
>
Frecuencia porcentual simple ( hi T =
f i
n
): se define en cada fila como
×+77
. ;a suma total de estas frecuencias es el !.@. 5uando no esta eApresada en porcenta8e se denomina frecuencia relativa simple 0 hi
). 1 % i 2 >
Frecuencia absoluta acumulada
: indica la cantidad de datos que se
encuentran :asta cierto 4alor o clase. & i T >
Frecuencia porcentual acumulada (
): indica el porcenta8e de datos
que se encuentran :asta cierto 4alor o clase.
Ing. Est. Jorsi Ericson Balcázar Gallo
+5
Estadística General
Tema: Estadística
' iU >
Marca de clase ( ): es el punto medio de cada inter4alo, es decir L + Ls ' iU = i -
.
Nota ;as frecuencias acumuladas se obser4an cuando estamos estudiando 4ariables cuantitati4as, la marca de clase se utiliará cuando traba8emos con inter4alos.
ELA0ORACIÓN DE CUADROS DE DISTRI0UCIÓN DE *RECUENCIAS A: )ARIA0LES CUALITATI)AS E1E8PLO >/>/ !n una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus colores$ /egro1/2, Qlanco1Q2, &ojo1&2, -7 consumidores dieron las siguientes respuestas$ Q, /, /, Q, &, /, /, Q, Q, /, Q, /, /, &, Q, /, Q, &, Q, /. 'onstruir la distribucin de frecuencias. Draficar la distribucin
SOLUCION/ La tabulacin de estos datos, donde la variable cualitativa es # $ 'olor de bebida gaseosa, es la distribucin de frecuencias del cuadro +.-. Cuad& >6 %istribucin de personas por su color preferido de una marca de bebida gaseosa. Malores de
Irecuencias
#
Absolutas$ /egro 1/2 Qlanco 1Q2 &ojo 1&2
f i
Irecuencias &elativas$
N C -7
7.35 7.37 7.+5 +.77
hi
Irecuencias orcentajes$
pi
35 37 +5 +77
Iuente$ !laboracin propia.
ELA0ORACIÓN DE GRA*ICOS GRA*ICO DE 0ARRAS
Ing. Est. Jorsi Ericson Balcázar Gallo
+F
Estadística General
Tema: Estadística
G;-ic& >6 %istribucin de personas por su color preferido de una marca de bebida gaseosa. ersonas N
7.35
C
7.37
6 F 5 3
7.+5
+ 7
/egro Qlanco &ojo
Iuente$ 'uadro 7+
Ga-ic& Cicula !l gráfico - es la representacin mediante gráfica de sectores circulares del cuadro + La frecuencia 35T es equivalente a 7. 37 × F7 ° = +33 °
7. 35 × F7 ° = +F- °
, la frecuencia 37T es equivalente a
, y la frecuencia +5T es equivalente a
7.+5 × F7° = 53 °
G;-ic& @6 %istribucin de personas por su color preferido de una marca de bebida gaseosa.
Ing. Est. Jorsi Ericson Balcázar Gallo
+6
Estadística General
Tema: Estadística
+5T 37T
& Q N 35T
Iuente$ 'uadro 7+
Eecici&/ !n una muestra se recolecto datos sobre la marca de baterías que usaban 7 radios portátiles del ej(rcito peruano de la ciudad de iura, enero del -7+7 . co ca se co ca %onde$ ca$ anasonic ca co ca ca se co$ %uracell se co se co co se$ AVita so$ /ational co se co ca co so
co
ca
ca
co
co
co
co
co
ca
oblacin o muestra$ 7 baterias Mariable$ marca de bateria
0: )ARIA0LE CUANTITATI)A 0/>: CUADRO SIN INTER)ALOS #uponga que se "an recolectado n valores de alguna variable discreta #. !l procedimiento más simple de organizar estos n datos, consiste en ordenar estos valores num(ricos en forma ascendente.
Ing. Est. Jorsi Ericson Balcázar Gallo
+C
Estadística General
Tema: Estadística
#i todos los n datos son distintos entre si, se obtendrá una distribucin de frecuencias de n valores de la variable # , donde cada uno de estos valores tienen frecuencia absoluta igual a uno. #i algunos valores se repiten, y si al terminar el ordenamiento se obtienen ( 1 valores distintos de # , digamos,
- ,..., x ( x+ , x
( ≤ n
2
, con frecuencias absolutas respectivas
f + , f - ,..., f (
, la distribucin de frecuencias de estos n datos se resume en el cuadro +. 1observar que es similar al cuadro +.+2. Cuad& @6 )istribución de frecuencias de ariable discreta Malores de Irecuencias Irecuencias Irecuencias f i hi pi La variable # Absolutas &elativas orcentajes x+
f +
h+
p+
x-
f -
h-
p-
...
...
...
...
x (
f (
h(
p(
n
+.77
+77.77
Iuente$WWWWW.. Las frecuencias absolutas relativas y porcentajes poseen , en el caso de variable discreta y continua, el mismo significado y propiedades, que en el caso de la variable cualitativa. 'uando es grande el número de datos observados de una variable discreta, su organizacin es muy engorrosa. !n este caso, para resumir los datos y poder calcular las medidas descriptivas, es conveniente seguir el m(todo de organizacin de variable continua por intervalos que se describe en la seccin +.3. siguiente.
G;-ica La representacin gráfica más común de una distribucin de frecuencias de variable discreta es del tipo 2ast' que consiste en trazar en cada valor distinto de la variable, segmentos de recta proporcionales a su frecuencia. /@/ Ante la pregunta del número de "ijos por familia 1variable # 2 una muestra de -7 "ogares de la ciudad de iura, marc las siguientes respuestas$ -, +, -, 3, +, , -, , -, 7, , -, +, , -, , , +, -, 3. 'onstruir la distribucin de frecuencias de la variable # . Draficar.
Ing. Est. Jorsi Ericson Balcázar Gallo
+N
Estadística General
Tema: Estadística
SOLUCION/ Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 7, +, -, , 3 que se repiten respectivamente +, 3, 6, F, - veces. La distribucin de frecuencias de # se da en el cuadro +.3. Cuad& @6 Iamilias de la ciudad de iura, según su número de "ijos. /úmero de Irecuencias Irecuencias Irecuencias Jijos Absolutas relativas orcentajes f i
# i
7 + + 3 6 F 3
hi
pi
7.75 7.-7 7.5 7.7 7.+7 +.77
5 -7 5 7 +7 +77
GRA*ICO DE 0ASTONES Ga-ic& =6 Iamilias de la ciudad de iura, según su número de "ijos. f i 6
hi
F
7.5 7.7
5 3
7.-7
-
7.+7
+
7.75 7
+
-
3 #
Iuente$ 'uadro 7!n la gráfica de bastones, se indican las frecuencias absolutas y relativas en cada valor distinto de la variable.
Ing. Est. Jorsi Ericson Balcázar Gallo
-7
Estadística General
Tema: Estadística
!jercicio. #e tomo a -7 empresas de transportes de la 'iudad del norte del país la cual se tiene datos de la cantidad de años dando servicio de transporte puntos turísticos del norte del país$ F 5 3 3 3 3 5 5 3 5 F 3 3 F 5 !labora un cuadro de distribucin de frecuencias
0/>: CUADRO SIN INTER)ALOS La distribucin de frecuencias por intervalos o clases se usa cuando la variable estadística es continua o cuando el número de valores distintos de una variable discreta es muy grande 1más de -7 líneas en el monitor de una computadora2. !sta distribucin se obtiene dividiendo el a'+& de variacin de los datos en ( intervalos y determinando el número de datos que contiene cada intervalo 1'uadro +.52. Cuad& >// )istribución de frecuencias por interalos Irecuencia s f i &elativas pi I i 'onteo hi 0ntervalos Absolutas orcentajes I +
***...
f +
h+
p+
I -
***...
f -
h-
p-
...
...
...
...
...
I (
:::...
f (
h(
p(
n
+.77
+77.77
ara construir la distribucin de frecuencias de intervalos "ay varios procedimientos. !n este te*to se conviene y recomienda$
R>. !legir no más de -7 intervalos ni menos de 5, ya que muc"os intervalos pueden complicar innecesariamente los cálculos de las medidas descriptivas, y pocos intervalos podrían omitir características importantes de los datos. !n este te*to ele!imos todos los interalos de i!ual amplitud +. R@/ !l número de intervalos elegido, debe dar una distribucin de frecuencias mono modal , es decir, una distribucin cuyas frecuencias van aumentando progresivamente "asta una frecuencia má*ima y luego van disminuyendo tambi(n progresivamente.
Ing. Est. Jorsi Ericson Balcázar Gallo
-+
Estadística General
Tema: Estadística
C&'stucci' de la disti2uci' de -ecue'cias %ados n valores de alguna variable cuantitativa # continua 1o discreta con más de -7 valores distintos2 uno de los m(todos para construir la distribucin de frecuencias es$ >/ %eterminar el rango 1 2 de variacin de los datos que se define por # ma* , = # ma* − # min # min donde es el dato má*imo y es el dato mínimo. @/ %eterminar el número de intervalos, ( , teniendo en cuenta la recomendacin R>. 4n valor apro*imado del número de intervalos, ( , nos proporciona la re!la de $tur!es , donde, ( G + X .log1 n2,
or
n ≥ +7
ejemplo,
)
redondeado el número al entero inmediato mayor.
si
se
( = + + . log1 352 = F. 355F
tienen
n = 35
datos sin decimales, entonces,
. Luego, ( podrá elegirse como F, 6, C, o cualquier otro número entero, teniendo en cuenta las recomendaciones R> y R@. ( = n , -5 ≤ n ≤ 377 Alternativamente se puede utilizar donde . / %eterminar la amplitud + del intervalo, dividiendo el rango entre el número de intervalos. !sto es, + = , ( . + = , (
#i la divisin no es e*acta en el número de decimales de los datos, entonces, el número + se apro*ima por exceso de manera que se cubra todo el rango, esto es, de (+ ≥ ,
manera que . #i los datos son enteros, + es entero, si los datos tienen un decimal, + tiene un decimal, etc. or ejemplo, si los datos tienen dos decimales y si + =
, : ( =
5.3+F, se elige
5.5. 1no 5.32. H/ %eterminar el !*ceso$ !G &YK&G AZEK& / %eterminar los e*tremos de los intervalos de la siguiente manera$ I + = [ # min , # min + +[ I -
= [ # min + +, # min + - +[
I
= [ # min + - +, # min + +[ …
I ( = [ # min
…
+ 1( − +2 +, # min + ( +\
Ing. Est. Jorsi Ericson Balcázar Gallo
--
Estadística General
Tema: Estadística
O2se#e !ue se ciea %& la deec5a el 4lti$& i'te#al& . !sto se debe a que si la divisin :( es e*acta en el número de decimales de los datos, entonces, # ma* = # min + ( + . E1E8PLO >// Los ingresos quincenales en dlares 1variable # 2 de 35 personas son$ F CN F 3N 5F F3 5N 5 6C 3 5
67
56
F-
3
FC
F-
-F
F3
6-
5-
5+
F-
F7
6+
F+
55
5N
F7
F6
56
F6
F+
F6
5+
C+
5
F3
6F
33
6
5F
F-
F
F7
'onstruir una distribucin de frecuencias de C intervalos.
SOLUCION6 # ma*
+2 %e los datos, se encuentra , = CN − -F = F
=
CN y
# min
=
-F. !l rango de variacin de los datos es$
-2 La amplitud del intervalo se elige a partir del valor + =
, (
=
F = 6C65 . . C
'omo los datos son enteros, elegimos
+ = C
.
-2 Los intervalos, el conteo y las frecuencias absolutas de los 35 ingresos quincenales se dan en el cuadro +.F$ 2
Cuad& 6 )istribución de los in!resos de / personas Irecuencias 0ntervalos 'onteo Absoluta &elativa orcentaje I i
[-F,3[ [3,3-[ [3-,57[ [57,5C[ [5C,FF[
: :: :::: ::::: ::::: ::::: ::::: ::::: :
Ing. Est. Jorsi Ericson Balcázar Gallo
f i
hi
pi T
+ 3 +7 +F
7.7-7.733 7.7CN 7.--7.5F
-.3.3 C.N --.5.F
-
Estadística General
Tema: Estadística
[FF,63[ ::::: ::: C [63,C-[ ::: [C-,N7\ : +
7.+6C 7.7F6 7.7-+.777
+6.C F.6 -.+77.7
!jercicio. !stos datos corresponden a las puntuaciones de F7 ingresantes a la !scuela de 0ngeniería 0ndustrial en el último e*amen de admisin para el ingreso a la 4'M ] iura. F5 3 CC 5N 5 6F -+ 35 F3+ F 6C 57 3C FF7 5 5 F5 63 3N 6 F7 6F 53C F+ 3 55 CC3 37 5F 63 F 55 35 F6 F+ 5C 6N FC 56 67 5+ 36 -F 5F 63F 5+ C7 53 F+ FN 57 5
GRA*ICOS PARA CUADROS CON INTER)ALOS 9&t& ee$%l&: FISTOGRA8A $ !s una grafica que se utiliza para representar la distribucin de frecuencias absolutas o relativas simples. 'onsiste en un grupo de rectángulos adyacentes que tienen sus bases en el eje de las abscisas 1donde se representa los intervalos de clase de la variable2 y altura igual a las frecuencias de cada clase.
G G= D A D I
@ @=
T N
>
A C
>= =
H > = >
J > E >
H @
J @
= @
E @
H G = G
EDAD 9aK&s:
Ing. Est. Jorsi Ericson Balcázar Gallo
-3
Estadística General
Tema: Estadística
POLÍGONO DE *RECUENCIA6
G G= @ D A D I T N A
@= >
C >=
= L
>@
L
>@
>L @@ @L EDAD 9aK&s:
G@
GL
G G= D @ A D @= I T N > A C >=
= >L
@@
@L
G@
GL
EDAD 9aK&s:
O1I)AS$ #on gráficos que se utilizan para representar las frecuencias acumuladas absolutas o relativas, y que consiste en un grafico lineal que nos permite observar la cantidad de elementos que quedan por encima o por debajo de determinados valores. Las ojivas son de dos tipos$ 8ojivas menor que9, 8ojivas o más9. ara su elaboracin se trabaja con los límites inferiores de cada intervalote clase y las frecuencias acumuladas correspondientes. GRA*ICO N >@ CO8ISARIA M
Ing. Est. Jorsi Ericson Balcázar Gallo
GRA*ICO N > CO8ISARIA M
-5
Estadística General
Tema: Estadística
DISTRU0UCION ACU8ULADA M8ENOR QUE DE PERSONAS DETENIDAS POR DELITO DE RO0O, SEGN EDAD 1UNIO @==
>@= S A N >== O S R E Q= P E D P= O R E H= 8 U N @=
DISTRU0UCION ACU8ULADA MO 8AS DE PERSONAS DETENIDAS POR DELITO DE RO0O, SEGN EDAD 1UNIO @==
>@=
S A N >== O S R E Q= P E D P= O R E H= 8 U N @=
= >=
>
@=
@
G=
G
=
EDAD 9aK&s:
>=
>
@=
@
G=
G
EDAD 9aK&s:
PRACTICA DIRIGIDA >/ !n el tema de estadística nos referíamos a un atleta de decatln cuya media de puntuacin en las +7 pruebas era de C7+.F puntos. !specifica en este estudio estadístico qui(n es la poblacin y qu( tipo de variable se considera. @/ 0ndica que #aia2les son cualitati#as y cuales cua'titati#as $ a . ' om id a I av or i ta . b. rofesin que te gusta. c . / úm er o d e g o l es m ar ca do s p or t u e qu ip o f a v or i to e n l a ú lt i ma temporada. d . / ú me r o d e a l u mn o s d e l a 4 ' MK 0 4& A . ! l c o l or d e l o s o j o s d e tus compañeros de clase. e. 'oeficiente intelectual de tus compañeros de clase. f . / ú me r o de a rt í cu l os d ef e ct u os o s. g. orcentaje de artículos defectuosos.
Ing. Est. Jorsi Ericson Balcázar Gallo
-F
Estadística General
Tema: Estadística
" . es o en g r. de p er n os . i . ' ap a ci d ad d e ca rg a de l m on t ac ar g a.
/ 'lasifique las variables e indique el tipo de escala en que están medidas las siguientes características K rofesin K Año de nacimiento K /acionalidad K !dad K Drado de instruccin K !stado civil K /úmero de "ijos K 0ngreso mensual familiar promedio K /úmero de tel(fono K /úmero de %/0 K %ireccin H/ % e l a s s ig ui en te s #aia2les i ndi ca c uál es s on discetas y c ua le s c&'ti'4as . a. /úmero de acciones vendidas cada día en la Qolsa. b.
/ ' l as i fi c ar l a s s i g ui e nt e s #aia2les en cualitati#as y cua'titati#as discetas o c&'ti'uas . a . L a n ac i on a li d ad d e u n a pe r so n a. b. /úmero de litros de agua contenidos en un depsito. c. /úmero de libro en un estante de librería. d. #uma de puntos tenidos en el lanzamiento de un par de dados. e . L a p ro f es i n d e un a p er s on a. f. !l área de las distintas baldosas de un edificio. g. /úmero de maquinas remalladoras. ". /úmero de pernos producidos diariamente.
/ Al investigar el nivel socioeconmico en una encuesta a rofesores de la 0.!. #an ;iguel de iura en el mes de %iciembre del -7+7 con los valores$ Qajo1Q2, medio 1;2, alto1A2, -7 profesores dieron las siguientes respuestas$ ;, Q, Q, ;, A, Q, Q, ;, ;, Q, ;, Q, Q, A, ;, Q, ;, A, ;, Q. 'onstruir la distribucin de frecuencias y trazar su gráfica.
Ing. Est. Jorsi Ericson Balcázar Gallo
-6
Estadística General
Tema: Estadística
/ !n la Librería 8<% QA&A<9 en el mes de !nero del -7+7 se realizo un inventario de -7 lotes de 3C libros cada uno y se encontr el siguiente número de libros con errores por lote$ , -, 5, 7, +, , -, +, 7, +, , 3, -, 3, 3, , 3, , -, . a. 'onstruir la distribucin de frecuencias relativas y frecuencias relativas acumuladas. Draficar. b. O?u( porcentaje de lotes tienen dos o más pero menos de 3 artículos defectuososP.
/ L as p un tu ac io ne s o bt en id as p or u n g ru po d e e n u na p ru eb a d e estadística a los alumnos de La 4'MKiura en el mes de ;arzo del -7++ "an sido$
a. 'onstruir la t a 2l a d e d i st i2 u ci ' d e - ec u e' c ia s y d i b u j a e l %&lí+&'& de -ecue'cias .
J/ rganiza los datos y realiza un diagrama de tronco y "ojas para luego realizar su cuadro con 5 intervalos de igual amplitud 1VG52 y tambi(n utilizando la regla de #turges con los sueldos anuales de las siguientes personas que trabajan en la fábrica de 'ementos acasmayo en Lima en !nero del -7+7 de la planilla de la empresa.
>=/
#e "a medido a 7 enfermos del Jospital &egional de iura en el mes de enero del -77N el contenido de calcio en la sangre, datos recolectados de su registro medico, dándose los valores siguientes$
a. Agrupa en intervalos y repres(ntalo gráficamente de una manera adecuada. b. 0nterpreta los resultados más importantes en esta tabla.
>>/ Los puntajes de una prueba de aptitud de Alumnos de la 0.!. 8#an Buan Qautista9 del -7+7 en Qarranca se tabularon en una distribucin de frecuencias de F intervalos de igual amplitud. #i se tienen$ marcas de clase, h+ = hF
h
= h5 h3 = 7.-5 h- = h3 − h+ h = h+ + 7.+7
, , , , de frecuencias absolutas y graficar el polígono
Ing. Est. Jorsi Ericson Balcázar Gallo
Y 2= 40
,y
% F
y
Y 4 =80
, frecuencias$
= F7
, completar la distribucin
-C
Estadística General
>@/
Tema: Estadística
%urante este año se "an contabilizado de los registros los siguientes nacimientos en la zona norte del erú en el año -77N, del acata medico se obtuvo lo siguiente$
%i bu jar pa ra es to s da to s un pictograma de cunas que represente el número de nacimientos en cada "ospital 1el área de la cuna debe ser proporcional a la frecuencia2. >/ !l número de estrellas de los "oteles de erú en el año -77N según un informe del ;inisterio de !c onom ía e n fe brero del -7+7 emitido por 0/!0 viene dado por la siguiente serie$
a/ ' on st ru ir l a t a 2l a d e d i st i2 u ci ' d e - ec u e' c ia s y d i b u j a e l dia+a$a de 2aas/ >H/
#e registra el tiempo en minutos que utilizan 7 alumnos para ejecutar una tarea, resultando los siguientes$ -+. +5.C +C.3 --.6 +N.F +5.C -F.3 +6. ++.- -.N -F.C --.6 +C.7 -7.5 ++.7 +C.5 -.7 -3.F -7.+ +F.- 7C. -+.N +-. --. +.3 +6.N +-.- +.3 +5.+ +N.+
a2 'onstruir una distribucin de frecuencias de F intervalos de igual amplitud y a partir de (sta >/ Las calificaciones determinadas según el registro acad(mico de un profesor de 57 alumnos en ;atemáticas del la 0.!. #an ;iguel de iura en el año -77C "an sido las siguientes$
a. 'onstruir la t a 2l a d e d i st i2 u ci ' d e - ec u e' c ia s y d i b u j a e l dia+a$a de 2aas .
>/ Las notas del e*amen parcial de estadística de !ducacin de la 4niversidad /acional de iura en el 00 ciclo del -7+7 dieron la siguiente distribucin de frecuencias a2 'ompletar la distribucin de frecuencias. b2 Draficar el Jistograma de frecuencias respectivo. c2 O?u( porcentaje de las notas se encuentran apro*imadamente en el intervalo$[C, +3\. Y i
/ota [ , [F ,
[ [
Ing. Est. Jorsi Ericson Balcázar Gallo
hi
H i
7.+5 7.35
-N
Estadística General
Tema: Estadística
[ , [ 7.67 [ , [ +.5 [ , \ 7.+7 >/ L o s p e s o s r e c o l e c t a d o s d e u n a e n c u e s t a a l o s F 5 e m p l e a d o s d e l a fábrica QA'E4# de la 'iudad de Lima en el año -77N vienen dados por la siguiente tabla$
a . ' on st ru ir la ta2la de -ecue'cias . b. &epresentar el 5ist&+a$a y el %&lí+&'& de -ecue'cias .
>/
La distribucin de los tiempos, en minutos, que utilizaron F5 personas para realizar una prueba de aptitud aparece representada en el siguiente "istograma. O?u( porcentaje de las personas emplearon entre N y ++.5 minutos P.
>J/ !n #ADAIALAQ!LLA, el sueldo mínimo y má*imo de -77 empleados de su planilla en el mes de !nero de -7+7 es de ^+57 y ^77 respectivamente.
La demanda diaria de azúcar 1en decenas de Vilos2 en el -7+7 recopilada de su registro de ventas durante ciento noventa días en '#<# #A' , se tabul en una distribucin de frecuencias sim(trica de cinco intervalos de amplitud iguales a 3. #i la marca de clase del intervalo central es igual a +- y si la curva de frecuencias absolutas f 1 x 2 = −1 x − +- 2 -
satisface la relacin$ "istograma.
Ing. Est. Jorsi Ericson Balcázar Gallo
+ 67
reconstruir la distribucin y graficar su
7
Estadística General
Tema: Estadística
@>/
La organizacin del tiempo 1minutos2 registrados en un informe, que tardaron +77 obreros de '/#<&4'<0'# #A' para ejecutar la reparacin de un colegio en el mes de !nero del -7+7, "a dado una tabla de frecuencias de cuatro intervalos de igual I + = [F, P\ amplitud cuyo "istograma correspondiente es sim(trico. #i el intervalo , la f - = - f + + 5 frecuencia absoluta$ , y si se sabe que el C5T de los obreros demoran menos de +- minutos. 'ompletar la distribucin de frecuencias.
@@/
Los 37 alumnos de la 4niversidad /acional de iura en el mes de !nero de -77N de una clase "an obtenido las siguientes puntuaciones, sobre 57, en un e*amen de !stadística.
a . ' on st ru ir la ta2la de - ecue'cias . b. %ibujar el 5ist&+a$a y el %&lí+&'& de -ecue'cias .
REDUCCION DE DATOS $n las tres semanas anteriores están referidos, con cierto detalle, a la clasificación de 4ariables, recolección de datos, construcción de tablas de frecuencia y a la representación grafica, como fase preliminar en la descripción y análisis estadístico. $l ob8eti4o principal de estas primeros temas, :a sido determinar la naturalea y formas de la distribución de frecuencias, como base para la
.%/+)'( +/ +atos a tra46s de ciertas características descripti4as y medidas de resumen.
$n el problema de comparar dos o mas distribuciones de frecuencias, puede resultar fácil :acer una comparación grafica de las frecuencias, sin embargo, eAisten dificultades para :acer comparaciones cuantitati4as. $stadísticamente para facilitar este análisis comparati4o es necesario disponer de algunos indicadores o medidas de resumen.
Ing. Est. Jorsi Ericson Balcázar Gallo
+
Estadística General $stas
características
Tema: Estadística
descripti4as
0cantidad2,
constituyen
los
llamados
$=TC/D"
$n general, para llegar a determinar los $=TC/D"C<)E= se sigue el siguiente esquema
&ecopilacin de datos
%A<# &0D0/AL!#
rganizacin y procesamientos de datos
%0#<&0Q4'0/ %! I&!'4!/'0A#
'A&A'
&educcin de datos
!#
MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS =on 4alores que refle8an el centramiento o punto central de la 4ariable estudiada. =on tres la media, la mediana y la moda.
MEDIA ARITM3TICA $s el 4alor promedio de todos los 4alores de la 4ariable, o el Fcentro de gra4edad Fde la distribución de datos. =e representa como FGH si se trata de la media de la población de referencia y como FAH si se trata de una media muestral. ;a media puede calcularse en las 4ariables cuantitati4as continuas y discretas. ;a fórmula es
#
x ∑ = n
i
=
x+ + x -
+ x + .......... . + x n n
IAi1 =umatorio de todos los 4alores de la 4ariable
Ing. Est. Jorsi Ericson Balcázar Gallo
-
Estadística General
Tema: Estadística
n 1 número total de todos los indi4iduos $8emplo 5alcular la media de edad de un grupo de % personas, cuyas edades son ', %,(, , - y ! años.
#
5 + F + 6 + C + N + +7 = 6.5 F
=
LA MEDIANA si
n
es
si
n
es
impar Me
=
x n
+
1
2
par x Me
n
+
x n
2
=
2
+1
2
5uando se tiene un numero impar
•
de datos, la
mediana es igual al termino central
$8emplo 5onsideremos el peso en 3ilogramos de una muestra de !! alumnos de las $scuela #rofesional de $stomatología del turno Tarde %'
(%
+
+
%
(
-
(
%(
(*
(
$ntonces n 1 !! Erdenamos los datos +
+
%'
%(
%
(*
(%
( (
(
-
C:ora buscamos el t6rmino medio
Me
= x + ++ + = x F -
si
n
es
, es decir el seAto 4alor de la serie es la mediana, M/ 4 52 im par
Me
=
x n
+
1
2
si
n
e s
pa r x Me
=
n
+
x n
2
2
1 +
2
5uando se tiene un numero par de datos, la
•
mediana es igual
$8emplo =upongamos que tenemos datos sobre los sueldos en soles que reciben mensualmente el personal que labora en el :ospital de l a ciudad de #iura. ++'
'! &*&
+*'
Ing. Est. Jorsi Ericson Balcázar Gallo
+* ++ +&* '!
Estadística General
Tema: Estadística
$ntonces n 1 y ya están ordenados
M e
=
xC
+ x C
-
-
-
++
=
x 3 + x 5
=
-
3- + 337 -
= 3F
LA MDA EL !AL" MDAL (M): $s el 4alor de la 4ariable que más 4eces se repite, es decir, aquella cuya frecuencia absoluta es mayor. ?o tiene porque ser única. $8emplo •
$l con8unto * * ' ( - - - ! ! !! !& tiene la moda Mo 1 -
•
$l con8unto & ' ! !* !% ! no tiene moda.
•
$l con8unto * & + + + ' ' ( ( ( - tiene dos modas + y (J es una distribución FbimodalH.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS LA MEDIA A"I#M$#I%A &A"A DA#' A"&AD' EN #A*LA' DE F"E%EN%IA' ;os datos se pueden presentar en tablas sin inter4alos y en tablas con inter4alos, en ambos casos se usa la M/+'a a%'t&$t'a Po(+/%a+a y
∑Y f
i i
i =+
n M0K2 1
LA MEDIANA &A"A DA#' A"&AD' +.
La mediana en tablas sin intervalos
a6 Lue
n -
N j −+ <
n -
< N j
no coincide con algún ?8 se tiene que $ntonces Me 1 Ki
Ing. Est. Jorsi Ericson Balcázar Gallo
3
Estadística General
b6 Lue
Tema: Estadística
n -
N j −+ =
n < N j -
N j −+ <
n
coincide con algún ?8, se tiene que +
Me :
-
(Y j −i +Y j )
$ntonces
,.
La mediana en tablas con intervalos n -
a
-
< N j
allamos
n − N j −+ M e = Li + c N j − N j −+
LA MDA &A"A DA#' A"&AD' +. La moda en tablas sin intervalos Una 4e agrupados los datos en una tabla de frecuencia, el 4alor modal será el 4alor de la 4ariable que mas se repite o que tiene la mayor frecuencia. ;a mayor
n j frecuencia se denotara con
.
n j ;a moda Mo 1
,. La moda en tablas con intervalos
n j + + M o = Li + c n n + j − + j + +
MEDIDAS DE POSICI7N MEDIDA' DE &'I%I-N &A"A DA#' A"&AD'
Ing. Est. Jorsi Ericson Balcázar Gallo
5
Estadística General
Tema: Estadística
LOS CUARTILAS 89:6 PARA DATOS AGRUPADOS =on los tres 4alores que di4iden al con8unto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles > $l primer cuartil L ! es el menor 4alor que es mayor que una cuarta parte de los datos > $l segundo cuartil L * 0la mediana2, es el menor 4alor que es mayor que la mitad de los datos > $l tercer cuartil L & es el menor 4alor que es mayor que tres cuartas partes de los dato Usamos la siguiente formula
(n − 1 j −+ 3 2 0 = L I + C 0 =+, − 1 1 j −+ j DECILES son los nue4e 4alores que di4iden al con8unto de datos ordenados en die partes iguales, tal que entre dos decilas consecuti4as se encuentre no mas del !@ del total de las obser4aciones. $n total :ay nue4e decilas /!, /*, /&, /+, /',NN.., /-.
(n − 1 j −+ +7 ) 0 = L I + C 0 = +, N − 1 1 j −+ j
PERCENTILES son -- 4alores que di4iden en cien partes iguales el con8unto de datos ordenados. $8emplo, el percentil de orden !' de8a por deba8o al !'@ de las obser4aciones, y por encima queda el '@
(n − 1 j −+ +77 3 0 = L I + C 0 = +, NN − 1 1 j −+ j
PROPIEDADES DE LA 8EDIA ARIT8ETICA
Ing. Est. Jorsi Ericson Balcázar Gallo
F
Estadística General
Tema: Estadística
8EDIDAS DE DISPERSIÓN I't&ducci' Las medidas de tendencia central no son suficientes para describir un conjunto de valores de alguna variable estadística. Los promedios determinan el centro, pero nada indican acerca de cmo están situados los datos respecto al centro. !n primer lugar se necesita una medida del grado de dispersión o ariabilidad con respecto al centro con la finalidad de ampliar la descripcin de los datos o de comparar dos o más series de datos. !n segundo lugar se necesita una medida del grado de asimetría o deformacin en ambos lados del centro de una serie de datos, con el fin de describir la forma de la distribucin de los datos. !sta medida se denomina índice de asimetría. !n tercer lugar se necesita una medida que nos permita comparar el apuntamiento o curtosis de distribuciones sim(tricas con respecto a la distribucin sim(trica normal. !sta medida se denomina índice de apuntamiento o curtosis. Las estadísticas de asimetría y apuntamiento se incluyen en este capítulo dada su poca importancia. !l lector debería correr paquetes de computo entre otros el E*$ para las aplicaciones de este capitulo.
Ing. Est. Jorsi Ericson Balcázar Gallo
6
Estadística General
Tema: Estadística
/@ 8edidas de dis%esi' Las medidas de dispersión o ariabilidad son números que $ide' el +ad& de se%aaci' de l&s dat&s c&' es%ect& a u' #al& ce'tal , que generalmente es la media aritm(tica. Las principales medidas de dispersin son$ el ran!o, el ran!o intercuartil, la arian"a, la desiación estándar , y el coeficiente de ariación.
/@/> Ra'+& & ec&id& de u'a #aia2le De-i'ici'. !l ran!o de variacin o recorrido, , de una serie de datos, es la diferencia entre sus valores má*imo y mínimo. !sto es, , = x ma* − x min xma x
xm in
siendo el valor má*imo y el valor mínimo. !l rango es una medida de dispersin muy fácilmente calculable, pero es muy inestable, ya que depende únicamente de los dos valores e*tremos. #u valor puede cambiar grandemente si se añade o elimina un slo dato. or tanto su uso es muy limitado. or ee$%l&, dadas las dos series de datos a2 +, 3, 3, 5, 5, 5, 5, F, F, N b2 +, -, , 3, 5, F, 6, C, N Ambas series tienen la misma media, 5, y el mismo rango, C, pero las dos series no tienen la misma dispersin, ya que la segunda tiene mayor variabilidad. !l empleo del rango como medida de comparacin de variacin puede estar justificado cuando se precise rápidamente de una medida de dispersin y no "aya tiempo de calcular algunas de las otras.
/@/@ Ra'+& i'tecuatil 3 a'+& se$ii'tecuatil De-i'ici'/ !l ran!o intercuartil, I, es la diferencia entre sus cuartiles tercero y primero. !sto es, ,I = 2 − 2+ . !l rango intercuartil es u'a $edida !ue eclu3e el @ $;s alt& 3 el @ $;s 2a& , dando un rango dentro del cual se encuentra el 57T central de los datos observados y a diferencia del rango total no se encuentra afectada por los valores e*tremos.
Ing. Est. Jorsi Ericson Balcázar Gallo
C
Estadística General
Tema: Estadística
#i el rango intercuartil es muy pequeño entonces describe alta uniformidad o pequeña variabilidad de los valores centrales. or ee$%l&, si en una distribucin de frecuencias de +77 ingresos quincenales se 2+ = F-^
encuentran los cuartiles ,I = 2
2 = 67^
, y
, entonces, el rango intercuartil
es
− 2+ = ^67 − F-^ = C.
!sto, indica que el 57T de los ingresos quincenales de los +77 empleados varía dentro del valor ^C. !l rango intercuartil se aplica a variables medidas en escala por lo menos ordinal. De-i'ici'/ !l ran!o semiintercuartil, $I, es igual al rango intercuartil dividido por -. !l rango semiintercuartil se puede asociar con la mediana y se puede e*presar en funcin 2+ y 2
de ella. #i una distribucin es normal los cuartiles
son equidistantes de la mediana. ±
#e deduce entonces, que el rango intercuartil y la mediana $I , son la misma distancia. Además, como e*actamente el 57T de los datos se encuentran en el rango intercuartil, ±
entonces, el intervalo$ mediana $I contiene tambi(n e*actamente el 57T de los datos. ±
#i la distribucin es asim(trica, el intervalo$ mediana $I contendría aproximadamente el 57T de los datos. or ee$%l&, si en la distribucin de los +77 ingresos quincenales donde
2+ = F- ^
,y
2 = 67 ^
, el rango semiintercuartil es ^3. #i la mediana fuera igual a ^FF, entonces, apro*imadamente el 57T de los datos se "allan comprendidos en el intervalo ^FF
3.
NOTA/ #i la distribucin es muy asim(trica, el rango intercuartil 1o el semiintercuartil2 es preferible a la desviacin estándar como medida de la dispersin.
)aia'
La varianza calculada a partir de una muestra será denotada por σ
y referida a una
-
poblacin se denotará por . De-i'ici'/ La varian&a se define como la $edia ait$"tica de l&s cuadad&s de las di-ee'cias de l&s dat&s con respecto a su media aritm(tica. La varianza es una medida de dispersin con unidades de medicin al cuadrado, por ejemplo, ^-, Em-, etc. De-i'ici'/ La desviación est+ndar es la raíz cuadrada positiva de la varianza.
Ing. Est. Jorsi Ericson Balcázar Gallo
N
Estadística General
Tema: Estadística
La desviacin estándar calculada a partir de una muestra se denotará por s y referida a la s = s - σ = σ σ poblacin por . !sto es, , .
C;lcul& de la #aia': )aia'
La varianza de n valores es el número$
x
, de alguna variable cuantitativa # cuya media es , n
s n
∑ 1 x
∑ 1 x
=
− x 2 -
i G+
n n
∑ x
− x 2 = -
i
i
i =+
i
− nx -
i =+
!s fácil verificar que$ or lo tanto, n
s -
=
∑ x
i
i =+
n
− x -
E1E8PLO /> 'alcular la varianza y la desviacin estándar de los 35 ingresos quincenales sin tabular del ejemplo +. SOLUCION n
n = 35
∑ x = i
i =+
, -FC-^, Luego, la varianza es el número
-FC= x = 35
n
∑ x i G+
5N.F,
i
= +FF,-33^-
n
∑ x s
-
=
i
i =+
n
− x - =
+FF,-33 35
− 15N.F2 - =
+3-.+5+^-. s = s - = +3- .+5+ = ;ientras, que la desviacin estándar es$ ++.N-^ O2se#a que la varianza está en ^ , mientras que la desviacin estándar está en ^.
@: )aia'
Ing. Est. Jorsi Ericson Balcázar Gallo
37
Estadística General
Tema: Estadística
La varianza de n valores de una variable estadística discreta # que se clasifican en ( valores distintos
- ,..., x ( x+ , x
con frecuencias absolutas respectivas
f+ , f - , ..., f (
, y cuya media
x
aritm(tica es se calcula utilizando la frmula$ (
∑ f 1 x i
s
(
∑ f 1 x i
#e verifica que or lo tanto,
=
-
− x 2 -
i G+
n
− x 2 = -
i
i
i =+
(
∑ f x i
i
− nx -
i =+
(
∑ f x i
=
s -
i =+
n
i
− x -
E1E8PLO /@ 'alcular la varianza y la desviacin estándar del número de "ijos de la muestra de -7 familias del ejemplo +.-. SOLUCION/ La distribucin del ejemplo +.- se repite en el cuadro .+ donde se "a insertado una f i 1 xi 2 -
columna de productos
. (
!ntonces,
n=
∑
f i xi
=
i =+
-7, ( =5,
33,
33 x = = -7
(
∑ f x
-
i i
=
i G+
-.-,
++C
Luego, la varianza es el número (
s -
=
∑ f x i
i
i =+
n s = s
-
− x - =
++C − 1 - . -2 - = -7
+.7F "ijos-.
= +.7F =
La desviacin estándar es$
+.7 "ijos.
Cuad& /> 'omputo de la varianza$ 'aso de variable discreta x i
f i
f i xi
f i xi-
7 + -
+ 3 6
7 3 +3
7 3 -C
Ing. Est. Jorsi Ericson Balcázar Gallo
3+
Estadística General
Tema: Estadística
3
F -7
+C C 33
53 ++C
@2: )aia'
clases número$
, frecuencias absolutas respectivas (
∑ f 1 y i
s -
=
i
f + , f - ,..., f (
y con media
x
es el
− x 2 -
i G+
n
#e puede verificar que$ (
∑ f 1 y i
i =+
(
− x 2 = ∑ f i y i- − nx -
i
i =+
or lo tanto, -
( n f i yi − f i yi f i 1yi − x 2 i =+ G s = i G+ = i =+ (
(
∑
∑
∑
n
n
(
∑ f y i
i
i =+
n
− x - .
E1E8PLO / 'alcular la varianza y la desviacin estándar de los 35 ingresos quincenales tabulados del ejemplo +.. SOLUCION/ La distribucin del ejemplo +. se repite en el cuadro .- donde se "a insertado una -
f i mi
columna de productos . Cuad& /@/ 'álculo de la varianza para datos agrupados por intervalos 0ngresos ;arcas /_.ersona roductos roductos s I i
[-F,3[ [3,3-[ [3-,57[ [57,5C[ [5C,FF[ [FF,63[ [63,C-[ [C-,N7\
yi
f i
f i yi
f i y i-
7 C 3F 53 F67 6C CF
+ 3 +7 +F C + 35
7 6F +C3 537 NN5F7 -3 CF -67-
N77 -CCC C3F3 -N+F7 F+573 N-77 +C-56NF +F66F3
Ing. Est. Jorsi Ericson Balcázar Gallo
3-
Estadística General
Tema: Estadística
(
∑ f i y i
n=
35, ( = C,
=
i =+
x
=
(
-67-
∑ f y
=
35
i
i
=
i G+
-67-,
F7.733,
+F6,6F3
Luego, la varianza es el número (
s
-
=
∑ f y i
i =+
i
n
− x - =
s = s
-
+F6,6F3 35
− 1F7.7332 - =
+--.653 ^-.
= +-- .653 =
La desviacin estándar es$ ++.76N dlares. O2se#a que la varianza de los mismos datos no tabulados es +3-.+5+^ - .
NOTA 9C;lcul& de la #aia'
= f i n
"ace
en la varianza de datos tabulados, se tiene s -
=
(
∑
hi mi-
− x -
i =+
x =
(
∑h m i
i
i =+
, donde
NOTA 9)aia'
µ
La varianza
x+ , x - ,..., x 1
de una poblacin finita de 1 datos
sin tabular y cuya media es
, se define por$ 1
∑ 1 x σ- =
− µ2
i
1
∑ x
-
=
i G+
1
i G+
1
i
− µ-
#i formamos todas las muestras posibles de tamaño n y calculamos sus varianzas s
utilizando la frmula
-
=
∑ 1 x
i
− x 2 - n
, resulta que la media de todas estas varianzas vale$ n −+ n
σ-
. σ-
s -
ara que la media de todas las varianzas sea igual a , basta multiplicar a por n 1 n − +2 . or esta razn, algunos autores definen la varianza 1en estadística descriptiva 2 con denominador
n −+
. !stas - varianzas se tratan en el capítulo N de estimacin de parámetros.
/@/H C&e-icie'te de #aiaci'
Ing. Est. Jorsi Ericson Balcázar Gallo
3
Estadística General
Tema: Estadística
De-i'ici'/ !l coeficiente de ariación, C.4 . es una medida de dispersión relatia 1libre de unidades de medidas2, que se define como la desviacin estándar dividido por la media aritm(tica. !sto es, C .4 . =
s x
,
o en T !l coeficiente de variacin se utiliza para comparar la variabilidad de dos o más series de datos que tengan medias iguales o diferentes o que tengan unidades de medida iguales o diferentes 1por decir, una serie en Vilogramos y otra serie en metros2. or dar un ee$%l&, si dos secciones J+ y J- de matemática 0, tienen la misma desviacin estándar igual a +3, no podemos concluir que los dos "orarios tienen la misma variabilidad. Así mismo, si las desviaciones estándares de J+ y J- son iguales a - y 3 respectivamente no podemos concluir que las notas de J- son más dispersas que las de J+. La variabilidad depende de las medias de los dos grupos. #i la media del "orario J+ es +F y la media del "orario J- es ++, los coeficientes de variacin respectivos son$ C .4 + . =
s+ x+
=
s +3 +3 = 7.C65, o C6.5T, C .4 - . = - = = +.-6 o +-6T +F x - ++
!s decir, las calificaciones obtenidas en J+ son más "omog(neas o tienen menor variabilidad que las calificaciones del "orario J-.
/@/ Us& de las $edidas de dis%esi' La varianza viene e*presada en unidades cuadráticas en las que vienen e*presados los datos. La desviacin estándar viene e*presada en las mismas unidades en las que vienen e*presados los datos. !l coeficiente de variacin viene e*presada en números abstractos 1suprimiendo las unidades en las que vienen e*presados los datos2. >: #i dos o más series de datos 1observados en el mismo tipo de medicin2 tienen medias aritm(ticas iguales 1o casi iguales2 es más dispersa la serie que tiene mayor s -
medida de variabilidad$ &ango, o I , o , o s, o C4 . #i "ay marcada asimetría, es preferible comparar con el rango intercuartil.
@: #i dos o más series de datos, no tienen medias iguales 1o casi iguales2, o no tienen las mismas unidades de medicin, entonces, es más dispersa la serie que tenga mayor coeficiente de variacin. NOTA 9)al&es esta'dai
# − x s
!l lector puede verificar que la variable 5 estandariza cualquier media en 7 y cualquier " = 7
varianza en +. 1robar que$
,y
- =+ s 5
Ing. Est. Jorsi Ericson Balcázar Gallo
2
33
Estadística General
Tema: Estadística
E1E8PLO /H !n una evaluacin de ;atemáticas e Jistoria resultan las medias + y +6 y las desviaciones estándar y 3, respectivamente. #i un alumno obtiene +3 en ;atemáticas y +F en Jistoria, Oen cuál de los dos cursos tiene mejor rendimiento relativoP. SOLUCION !l "ec"o de que tenga +F en Jistoria y +3 en ;atemáticas no significa que tiene mejor rendimiento en Jistoria. #e deben calcular los rendimientos relativos con la puntuacin estandarizada 5 " =
!n ;atemáticas " =
+3 − + = 7. +F − +6 3
= −7.-5
!n Jistoria !n consecuencia, tiene mejor rendimiento relativo en ;atemáticas.
/@/ P&%iedades de la #aia': La varianza es un número real no negativo y viene e*presada en unidades cuadráticas. ;ientras, que la desviacin estándar viene e*presada en las mismas unidades en las que vienen e*presados los datos. @: %adas, la media
x
y la varianza
s # -
de n datos de una variable # , la suma total de los n1 s # - + x 2 cuadrados de los valores es igual a . ara datos no tabulados se tiene por ejemplo, n
∑ x
i
-
= n1s # + x - 2
i G+
xi
: #i cada uno de n los valores es transformado en s'- = a - s-# yi n valores es, 1verificar`2. s' = a s # 'onsiguientemente, 'omo casos particulares se tiene$ #i
y i
=b
yi
= axi + b
, entonces, la varianza de los
- =7 s'
, entonces, . !s decir, si los n datos son iguales a una constante, entonces, su varianza es igual a cero.
Ing. Est. Jorsi Ericson Balcázar Gallo
35
Estadística General
#i
#i
y i
= xi + b
y i
= axi
s'-
Tema: Estadística = s-#
, entonces, . !s decir, si sumamos a cada dato una constante, la varianza 1y la desviacin estándar2 no cambian. s'-
= a - s-#
, entonces, . !s decir, si multiplicamos a cada dato por una constante, a, la varianza de los nuevos valores es igual que la varianza de los antiguos valores multiplicada por
a
-
.
H: La varianza y la desviacin estándar pueden ser calculadas tambi(n en distribucin de frecuencias de intervalos de amplitud diferentes, siempre que puedan determinarse las marcas de las clases / or otra parte, dependen de todos los datos y son sensibles a la variacin de cada uno de estos. Qasta que uno de los datos varíe, para que varíen aquellas. : %ados ( series de datos con tamaños, medias y varianzas respectivas -
-
-
n- , x - , s -
n+ , x+ , s+
,
n ( , x ( , s (
, ...,
, entonces, la varianza,
s 6
n+
, de los
+ n- + ... + n( = n
datos
es$ (
- = s 6
∑
(
-
ni si
∑ n 1 x − x2 i
i =+
+
n
-
i
i =+
n
.
: Desi+ualdad de C5e23s5e#. 'ualquiera sea la forma de la distribucin de frecuencias 1sim(trica o asim(trica2, el intervalo
[ x − (s # , x + (s # \ ( > +
,
contiene por lo menos el +−
+ -
(
en T de los datos. !l porcentaje de datos que se "allan fuera del intervalo es menor que el + -
(
[ x − - s # , x + -s # \
en T . +−
+ -
-
=
3
or ee$%l&, el intervalo contiene por lo menos el o 65T, de los datos. [ x − s # , x + s # \ !l intervalo contiene por lo menos el CC.CNT, 1C:N2, de los datos. [ x − 3 s # , x + 3 s # \ !l intervalo contiene por lo menos el N.65T, 1+5:+F2, de los datos.
E1E8PLO / !n el mes de !nero el sueldo promedio de los trabajadores del sector industrial era de ^-77. ara el mes de Bulio se considera un aumento del 7T al sueldo del mes de !nero más un adicional de ^57. #i el coeficiente de variacin en !nero era de 7.-5, Ose puede decir que la distribucin de sueldos en Bulio es más "omog(neaP
Ing. Est. Jorsi Ericson Balcázar Gallo
3F
Estadística General
Tema: Estadística
SOLUCION #ea # $ #ueldos de !nero, ' $ #ueldos de Bulio x
=
La media de !nero es$ ^-77. 'oeficiente de variacin en !nero, C4 = 7.-5 s # = C4 × x = La desviacin estándar de !nero es 7.-5×-77 = ^57 La relacin entre las dos variables es$ ' = +.7 # + 57,
!ntonces, la media de los sueldos de Bulio es y = +. x
+ 57 = +.1 -77 2 + 57 = +7
La varianza de los sueldos de Bulio es -
s'
= 1+.2 - s # - =
1+.2-1572- = 3--5 s'
= 3--5 =
La desviacin estándar$
F5 C4 =
s' y
=
F5 +7
=
'oeficiente de variacin en Bulio$ 7.-7N6. 'omparando los coeficientes de variacin de !nero y Bulio se puede decir que la distribucin de los sueldos de Bulio es más "omog(nea.
E1E8PLO / #i el ingreso de +-7 obreros tiene una media de ^77 y una desviacin estándar de ^7 a2 O'uántos obreros por lo menos tienen sueldos comprendidos en el intervalo [^-37, ^F7\P. b2 %eterminar el intervalo que contiene al menos el CC.CCNT de los ingresos c2 #i el mínimo sueldo es ^-+7, en qu( porcentaje se puede afirmar que los ingresos son superiores a ^N7P
SOLUCION/ x
a2
=
s
^77,
=
^7, de la relacin [77 − ( 172, 77 + ( 172\ = [ -37 , F7 \
( = -
+−
+ --
=
3
resulta . !ntonces el, o 65T1+-72GN7 obreros por los menos tienen ingresos en el intervalo [-37, F7\. b2 #i al menos el CC.CCNT de los obreros tienen ingresos en el intervalo
Ing. Est. Jorsi Ericson Balcázar Gallo
36
Estadística General
Tema: Estadística [77 − ( 172, 77 + ( 172\
+−
+ -
= 7.CCCN
( =
(
entonces, . %e donde resulta Luego, el intervalo es [^-+7, ^N7\.
.
c2 Iuera del intervalo [^-+7, ^N7\ está menos del ++.++T de los ingresos. #i el mínimo es ^-+7, entonces, el porcentaje de ingresos mayor que ^N7 es $e'&s de ++.++T.
E1E8PLO / !l costo inicial de produccin, # ) de una muestra de C7 objetos de cierto tipo, tiene una desviacin estándar de ^7. La media del costo de produccin es de ^-57 para el F7T de la muestra y de ^-77 para el resto. !l costo final de produccin ' es dado por la relacin$ ' = +.- # + 5.
#i el precio de venta de cada objeto de la muestra es proporcional al cuadrado del costo final de produccin, Ocuánto se recaudaría por la venta totalP. SOLUCION/ s #
=
x
^7,
=
-57×7.F7 + -77×7.37 = ^-7 y
= +.- x + 5 = +.-1 -7 2 + 5 =
%e ' = +.- # + 5, se tiene, -
s'
= 1+.-2
- -
s #
-C+.
=
1+.-2-172- = +-NF C7
∑ y
i
= C71 s' - + y - 2 =
i =+
&ecaudacin total
C71+-NF+1-C+2-2 = F,3-7,5F7.
/ I'dices de asi$etía De-i'ici'/ #e dice que una distribucin de frecuencias es simétrica, si los intervalos equidistantes del intervalo central tienen iguales frecuencias.
x
'omo en distribuciones asim(tricas se verifica $ de e*presar el índice de asimetría es$
Ing. Est. Jorsi Ericson Balcázar Gallo
− 7o ≅ 1 x − 7e 2
, entonces, otra forma
3C
Estadística General
Tema: Estadística 1 x − 7e2 . s
+ $ =
I'te%etaci'/
+s = 7
#i la distribucin de los datos es sim(trica, x
. Mer la figura .+.a, donde se
= 7e = 7o
observa, además, que coinciden los tres promedios$
.
+s ≠ 7
, la distribucin es asim(trica. Además, es a si$"tica %&siti#a o sesgada a
#i
+s > 7
la derec"a, si a la izquierda si
7o < 7e < x
, 1Iig. .+ b donde
+s < 7
x
< 7e < 7o
1Iig. .+.c donde
a: #im(trica
2. >, es asim(trica negativa o sesgada 2
2: Asimetría positiva *i+ua/ />
c: Asimetría negativa
or ee$%l&, la distribucin de los 35 ingresos quincenales del ejemplo +. tabulados en oc"o intervalos tiene asimetría negativa$ +s =
1 x − 7e2 s
=
1F7.33 − F7.652 ++.76N
= −7.+N+
NOTA/ 9Ot&s í'dices de asi$etía: !l índice de asi$etía de Peas&' utilizando momentos es definido por$ +s =
n7
1 n − +21 n − -2 s
n
7
=
∑ 1 # − x 2
i
s =
n=
i =+
donde , número de casos, la desviacin estándar. !ste índice es utilizado por los paquetes de computo estadístico para determinar la asimetría de distribuciones de la forma datoKfrecuencia. ara n dat&s ta2ulad&s e' , i'te#al&s, un m(todo alternativo es utilizar el índice de asi$etía de *is5e definido por$ +s =
7 : n s
(
7 =
∑ f 1m − x2 i
i
i=+
donde$
,
s =
#i la distribucin es sim(trica asim(trica negativa.
la desviacin estándar
+s = 7
. #i
Ing. Est. Jorsi Ericson Balcázar Gallo
+s > 7
, es asim(trica positiva y si
+s < 7
3N
, es
Estadística General
Tema: Estadística
or ee$%l&, continuando con el ejemplo +., el índice de asimetría de los 35 ingresos quincenales tabulados en la forma datoKfrecuencia es
+s =
7.65. > de los mismos datos
−
+s =
tabulados en C intervalos es$ −7.. NOTA 9Oi#as asi$"ticas 3 si$"ticas:/ Las ojivas o curvas de frecuencias acumuladas, presentan formas particulares según el tipo de asimetría. or ejemplo, en la figura .-a la curva de frecuencia acumulada A es de una distribucin con asimetría e*trema negativa. La jiva ' es de asimetría e*trema positiva. La ojiva Q es de una distribucin sim(trica. !n la figura .-b la diagonal % es la ojiva de una distribucin normal. La curva I es la ojiva de una distribucin sim(trica leptocúrtica, y la ! de una platicúrtica. 1ver .3 curtosis2
*i+/ /@a jivas asim(tricas relativas
*i+/ /@2 jivas sim(tricas relativas
/H Cut&sis La curtosis es la propiedad de una distribucin de frecuencias por la cual se compara la dispersin de los datos observados cercanos al valor central con la dispersin de los datos cercanos a ambos e*tremos de la distribucin. La curtosis se mide en comparacin a la curva sim(trica normal o mesoc8rtica 1fig. .a2
*i+/ / 'urtosis de curvas sim(tricas 4na curva sim(trica con curtosis mayor que de la normal es denominada curva leptoc8rtica 1fig. .c2. 4na curva sim(trica con curtosis menor que de la normal es denominada curva platic8rtica 1fig. .b2. !*isten varias maneras de medir la curtosis de la distribucin de los datos.
Ing. Est. Jorsi Ericson Balcázar Gallo
57
Estadística General
Tema: Estadística
Cut&sis 2asad& e' %ece'tiles !sta medida de curtosis es muy poco usada por ser muy inestable. #in embargo, describe muy bien el concepto. !n una curva normal, el cociente del rango intercuartil 1percentil 65 menos el percentil -52 entre la diferencia del percentil N7 menos el percentil +7 es apro*imadamente igual 7.5. 3 65 − 3 -5 3 N7 − 3 +7 A medida que y sean iguales 1valor del cociente casi uno2, la distribucin 3 65 − 3 -5 será leptocúrtica, y a medida que sea cada vez más pequeño con respecto a 3 N7 − 3 +7 1valor del cociente casi cero2 la distribucin será platicúrtica. La curtosis utilizando percentiles se define por el cociente$ 0 =
3 65 − 3 -5 3 N7 − 3 +7
− 7. 5
I'te%etaci'/ #i la distribucin es '&$al, 0 tiende a 7. #i 0 tiende a 7.5, es le%t&c4tica, y si 0 tiende a −7.5, es %latic4tica. or ee$%l&, la distribucin de los 35 ingresos quincenales del ejemplo +. tabulados en 0 = 1FF.65 − 5 .32 16.5 − 352 − 7.5 =
C intervalos tiene curtosis −7.7. #in embargo, no se puede relacionarla con una distribucin normal, por que (sta distribucin de frecuencias no es sim(trica.
NOTA/ 9Otas $edidas de cut&sis: La curtosis utilizando momentos es definida por la e*presin$ 0 =
n1 n + +2 7 3
− 7 - 7 - 1n − +2 1 n − +21 n − -21 n − 2 s 3
n
7 j
=
∑ 1 # − x2
j
i
s =
n=
i =+
donde , número de casos, la desviacin estándar. !sta curtosis es utilizado por los paquetes de computo estadístico para determinar la curtosis de disti2uci&'es de la -&$a dat&-ecue'cia . ara n dat&s ta2ulad&s e' , i'te#al&s, la curtosis se calcula por$ 0 =
7 3 : n s
3
−
(
7 3
=
∑ f 1m − x2 i
i =+
i
3
s =
donde$ , la desviacin estándar. #i la distribucin es '&$al, 0 =7. #i 0 >7, es le%t&c4tica, y si 0 <7 es %latic4tica. or ee$%l&, continuando con el ejemplo +., la curtosis de los 35 ingresos quincenales tabulados en la forma datoKfrecuencia es 0 =
0 =
+.7-+. > de los mismos datos tabulados en C
intervalos es 7.-33. Si' e$2a+&, '& se %uede deci !ue es le%t&c4tica, %& !ue la disti2uci' de l&s dat&s '& es si$"tica/
Ing. Est. Jorsi Ericson Balcázar Gallo
5+