ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE ADMINISTRACION DE EMPRESAS
“FADE”
MÓDULO DE ESTADÍSTICA BÁSICA TUTOR: ING. GENOVEVA TAPIA
CONTABILIDAD Y AUDITORIA
2012
INDICE
Introducción Indicaciones para el Estudio del Módulo Objetivos Generales del Módulo Estrategias para el estudio de Estadísticas Prueba de Diagnóstico PRIMERA UNIDAD: DESCRIPCION DE LOS CONJUNTOS DE DATOS Objetivos Contenidos 1. Intr Introd oduc ucci ción ón Hist Histór óric ica a 2. Concepto Concepto de Estadística Estadística Descriptiva 3. Clasificación Clasificación de la Estadística Estadística 3.1. 3.1. Esta Estadí dísti stica ca De Desc scrip ripti tiva va (Ded (Deduc uctiv tiva) a) 3.2. 3.2. Esta Estadí dísti stica ca Infe Infere renc ncial ial (Ind (Induc uctiv tiva) a) 3.3. 3.3. Esqu Esquem ema a de de Esta Estadí díst stica ica Indu Induct ctiva iva 3.4. .4. Med Medida idas de de Ca Calidad idad 3.5. Sumatorias 4. Orga Organi niza zaci ción ón de Dato Datoss 5. Vari Variab able less Estad Estadís ísti tica cass 5.1. 5.1. Varia ariabl ble es Disc iscreta retass 5.2. 5.2. Varia ariabl ble es Contin ntinua uass 6. De Desc scrip ripci ción ón de Dato Datoss 7. Proced Procedimi imient ento o para para agrupa agruparr los los datos datos.. 8. Distribu Distribució ción n de Frecuenc Frecuencias, ias, interv intervalo aloss y marcas marcas de clase. clase. 9. Represe Representa ntació ción n gráfi gráficas cas de los datos datos
AUTOEVALUACIÓN AUTOEVALUACIÓN N.1 SEGUND SEGUNDA A UNIDAD: UNIDAD: MEDIDAS MEDIDAS DE TENDEN TENDENCIA CIA CENTRA CENTRAL L Y DE LA DISPERSION Objetivos Contenidos 1. Introd Introducc ucción ión Históric Histórica a 2. Medida Medida Aritmética Aritmética o prome promedio dio para datos datos no agrupados agrupados 3. Median Mediana a para dato datoss no agrupad agrupados os 4. Moda Moda para para dato datoss agrupa agrupados dos 5. Media aritmética aritmética para para datos datos agrupado agrupadoss 6. Median Mediana a para para datos datos agrup agrupado adoss 7. Moda Moda para para dato datoss agrupa agrupados dos 8. Cuartiles, Cuartiles, Deciles, Deciles, y Percentile Percentiless para datos datos no agrupa agrupados. dos. 9. Cuartiles, Cuartiles, Deciles, Deciles, y Percentile Percentiless para datos datos agrupado agrupados. s. 10. Med Medidas idas de disp ispersió sión para datos no agrup rupados y agrupados. 10.1 10.1.. De Desv svia iacción ión Medi Media a para para dato atos no agru agrupa pado doss y agrupados.
2
10.2. Varianza Varianza y desviació desviación n típica para para datos datos agrupado agrupadoss y no agrupados 11. 11. Form Forma a de Di Dist stri ribu buci ción ón de frec frecue uenc ncia iass 11.1 11.1.. Curt Curto osis sis AUTOEVALUACIÓN AUTOEVALUACIÓN N.2. BIBLIOGRAFIA INTRODUCCION
El módulo de Estadística y Probabilidades esta diseñado de acuerdo al Programa General que se estudia en los Centros de Enseñanza Técnica Superior. Los métodos y conceptos son aplicables a la investigación empírica en todas las disciplinas que van desde las Ciencias Sociales a las Ciencias Físicas. El enfoque de este módulo es conceptual y no Matemático, es decir no se realiza la demostración y obtención de las fórmulas. Sin embargo se sustenta en la Aplicación de las fórmulas. El peso fuerte de su estudio está acentuado en la: Comprensión, Aplicación e Interpretación de los conc concep epto toss más más que que la prueb prueba a o cálc cálculo ulo manu manual al o elect electró rónic nico o cuyo cuyoss resultados resultados son números, números, estos números números hay que saberlo interpretar. interpretar. Los ejemplos con requerimiento de cálculo son cortos para no desviar la atención de los conceptos. Para Para los los estu estudi dian ante tess cuyo cuyo cono conoci cim mient iento o del del Alge Algebr bra a elem elemen enta tall no recuerdan, se proporciona un anexo de ello, con el objeto de permitir un repaso de las habilidades algebraicas necesarias. Siempre que en el módulo se introducen temas estadísticos que involucren esas habilidades matemáticas. Sin embargo creo que la compresión de la Estadística se facilita trabajando con algunos ejemplos que tenemos a mano y más que todo tomando ejemplos de nuestro entorno y de la vida real. Para el avance del estudio de cada unidad se sugiere la utilización de calcu calcula lado doras ras micro microco comp mput utad ador oras as y comp comput utad ador oras as o cualq cualqui uier er otro otro software estadístico u hoja electrónica que tenga a mano. En los últimos años el estudio del Análisis Estadístico ha conducido dos método todoss est estadís adísttico icos: las las dos dos prim rimeras eras unid unidad ade es se refi refier ere e a la Estadística Descriptiva, que se refiere a la tabulación, representación y descripción de un conjunto de datos. Estos datos pueden ser variables cuantitativos o variables categóricos. Al seguir paso a paso cada unidad nos guiará nuestra preparación y estud studio io,, tant anto indi indivi vid dual ual y cole colecctivo tivo.. Sin Sin deja dejarr de lado lado nue nuestra strass 3
experiencias personales y aporte pedagógico que estará por ser dinámico real y experimental. El módulo consta de dos unidades: 1. Descrip Descripció ción n de dos conjun conjuntos tos de datos datos 2. Medida Medidass de la tenden tendencia cia cent central ral y de de la dispe dispersió rsión n
INDICACIONES PARA EL ESTUDIO DEL MODULO
Para el aprendizaje del módulo se recomienda: 1. Revisa Revisarr las técnicas, técnicas, aplica aplicació ción n y resoluc resolución ión de Problem Problemas as del álgebra álgebra elemental. 2. Ponga Ponga en práctica práctica una lectura inicial, intermedia intermedia y final de de cada cada tema. tema. 3. Anali Analice ce los los objet objetivo ivoss de cada cada uni unida dad d 4. Utilice Utilice y apliqu aplique e algun algunas as técn técnica icass de estu estudio dio 5. Ampl Amplíe íe los los cont conten enid idos os de cada cada unid unidad ad conv conver ersa sand ndo o con con pers person onas as entendidas en la materia. 6. Revise Revise y exami examine ne sus tarea tareass haciend haciendo o uso de la la Bibliog Bibliografí rafía a 7. Ponga Ponga en acción acción su Inteligen Inteligencia cia Mental, Mental, su su Inteligen Inteligencia cia Emocion Emocional al y su cent centro ro motri otriz: z: Plan Plante tean ando do preg pregun unta tas, s, real realiz izan ando do encu encues esta tass o resolviendo ejercicios. 8. Pro Proponga nga que que su auto autoev eval alua uacción ión gene genere re perm perman anen ente te alie alient nto o y confianza. 9. Examine Examine las falencias falencias existente existentess en usted usted y en su equipo equipo de trabajo trabajo.. OBJETIVOS GENERALES DEL MODULO
Avance de los temas que se desarrollarán: 1. 2. 3. 4. 5. 6. 7. 8. 9.
Iden Identi tific ficar ar entr entre e varia variabl ble e disc discre reta ta y varia variabl ble e cont continu inua a Comp Compren rende derr lo lo que que es una una mues muestra tra y pobl poblac ació ión n Dife Difere renc ncia iarr entre entre un Parám Parámet etro ro y un esta estadí dísti stico co Plan Plante tear ar paso pasoss par para a orga organiz nizar ar un conju conjunt nto o de de dat datos os.. Plan lantear fórmu rmulas de medida idas de centrali ralizzación ión y medida idas de dispersión Repre Represen senta tarr medi mediant ante e gráfi gráfico coss los los resu resulta ltado doss obt obten enid idos os Defin De finir ir conce concept ptos os funda fundame ment ntale aless de Prob Probab abili ilida dad d distrib distribuc ucio ione ness de probabilidad Form Formul ular ar las las cuat cuatro ro regl reglas as de pro proba babil bilid idad ad:: La regl regla a de la sum suma a y la regla de multiplicación. Plan lantear la na naturale ralezza y form forma a de la dist distrribu ibución ión norma rmal y su relaciona con la desviación típica. 4
1. 2. 3. 4. 5. 6. 7.
ESTRATEGIAS PARA EL ESTUDIO DE ESTADISTICA Come Comenta ntario rio de lectu lecturas ras y texto textoss especia especializa lizados dos Desarro Desarrollar llar mapa mapass menta mentales les y/o y/o conce conceptu ptuale aless Conve nversar rsar con con varia ariass pers perso onas nas ente enten ndid didas para ara lue luego plant lante ear preguntas y desarrollar cuestionarios. Reali Realiza zarr encu encues esta tass del del ento entorno rno y fuer fuera a de ello. ello. Aplic Aplican ando do la Triad Triada a estratégica de la: Visión, Misión y Valores. Comp Comparti artirr experie experienci ncias as luego luego de de las encu encuest estas. as. Exposic Exposición ión indiv individu idual al y grupal grupal del traba trabajo jo en equip equipo. o. Entre Entrete tenim nimien iento to motiva motivacio ciona nal. l.
PRUEBA DE DIAGNOSTICO
1. Escriba Escriba los los diez diez prim primero eross múltip múltiplos los del del número número 7 2. ¿Cuál ¿Cuál es el número número del del cual estos estos número númeross son múltip múltiplos: los: 12, 12, 15, 30, 30, 39?. 3. Si hay 15 mujeres mujeres en en un grupo grupo de de 65 estudia estudiantes. ntes. ¿Qué ¿Qué proporc proporción ión del del grup grupo o rep represe resent ntan an las las muje ujeres? res? y ¿Qué ¿Qué propo roporc rció ión n de grup grupo o representan los varones?. 4. Suponga que: X 1 = 4, X2 = 8, X3 = 8, X4 = -6, Halle el resultado de: 4
∑ Xi = i =1
5. Redond Redondee ee los los siguie siguiente ntess número númeross decima decimales: les: a) 1,05 1,0519 19 a tre tress díg dígit itos os b) 125, 125,84 84 a tre tress cifra cifrass ent entera erass c) 425, 425,45 45 a una una cifra cifra deci decima mall d) 1250 1250,1 ,126 26 a cinc cinco o díg dígito itoss 6. Si n1 = 7; n2 = 9; y n3 = -6. ¿Cuánto vale n = ¿
7. [ (3 + 5) + (9 / 2 − 2] /[ ( 12 − 3) /(5 / 2)] = ? 8. Dé los los valo valores res absolut absolutos os de de 1.96 1.96 y –1.96 –1.96 9. Si X1 = 25 y X = 29, y si K = X1 – X, ¿Cuál es el valor absoluto de (K)? 10. Si ∑ x 2 = ∑ y 2 − ny 2 , si ∑ y 2 = 45000, n = 10; y = 20, ¿ cuántovale ∑ x 2 ?
5
n ∑ xy − ( ∑ x )( ∑ y )
11. Si B1 = n ∑ x −( ∑ x ) , donde n = 10, ∑ xy = 3995; ∑ x 460; ∑ y = 82; ∑ x 2 = 22420. Halle B1 2
2
12. Dado los siete siete valores de X y de Y aquí indicados: indicados: X = 8,12,10,11,8,7,6 Halle ∑X = Y = 9,10,8, 9,10,8,9,8,7 9,8,7,7 ,7 Halle ∑X = 13. Dado el siguiente conjunto conjunto de datos: 2,1,8,5,-1,3, 2,1,8,5,-1,3,9. 9. Ordene en forma ascendente y en forma descendente. des cendente. 14. Si tengo los siguientes siguientes números: números: 48.5 y 20.2. ¿Cuál ¿Cuál es el mayor mayor valor y cuál es el menor valor? Y cuál es su diferencia?. 15. Usted como como estudiante estudiante considere una variable variable y, quién financia sus estudios sea una variable X ¿Cuál es la variable dependiente y cuál la variable independiente?. 16. Si r =
∑ xy ( ∑ x ) 2 ( ∑ y 2 )
, despeje ( (∑ x) 2 =
PRIMERA UNIDAD DESCRIPCION DE LOS CONJUNTOS DE DATOS OBJETIVOS: 1. Dar un un co concepto de de es estadística. 2. Dist isting inguir uir ent entre re va variab riable le contin ntinu ua y dis disccret reta 3. Dife Diferen renci ciar ar conju conjunt ntos os de dato datoss no agru agrupa pado doss y dato datoss agru agrupa pado dos. s. 4. Esta Estable blece cerr Inte Interva rvalo loss de de clas clase e y marc marca a de de clas clases es “Dist “Distrib ribuc ucio ione ness de de frecuencia” 5. Repr Repres esen enta tarr los los dat datos os de un conj conjun unto to por por med medio io de gráf gráfic icas as.. 1.
- IN INTRODUCCION HI HISTORICA.
La Estadística se estructuró como disciplina científica, en el siglo pasado pero ya se conocía y se utilizaba en la antigüedad. La misma puede catalogarse en orden cronológico en los siguientes antecedentes: a.- Las antiguas civilizaciones, como por ejemplo la de Egipto realizaban rele releva vant ntam amie ient ntos os esta estadí díst stic ico os (cap (capta taci ción ón de dato datos) s),, debi debido do a las las inundaciones del río Nilo, efectuaban censos anuales, los mismos que permitan conocer como distribuir los bienes y reparto de propiedades para para que que fuer fueran an rest restit itui uido dos. s. Tam También bién., ., se sabe sabe que los los grie griego goss levantaban levantaban censos censos demográfico demográficoss (nacimiento (nacimientos, s, muertes, muertes, casamiento casamientos, s, etc.) y de propiedad.
6
b.- En la época época del Imperio Romano se aplicaba aplicaba censos censos poblacionales poblacionales y de bienes a los pueblos sometidos al imperio con objeto de aplicar el régimen de impuestos. En la époc época a mode modern rna, a, la técn técnica ica censa censall adqu adquiri irió ó un gran gran desar desarro rollo llo llegando a constituirse un eficaz auxiliar de las tareas gubernamentales. 2.
CON CONCEPT CEPTO O DE ESTA ESTADI DIST STIC ICAS AS DESC DESCR RIPT IPTIVA IVA
Estadística se refiere a la colección, representación y utilización de datos numéricos para realizar inferencias y alcanzar decisiones ante la ince incerti rtidu dumb mbre re que que plan plante tean an much muchas as disci discipl plin inas as que que van van desde desde las las cien iencias, ias, la ingenier iería, ía, las las ley leyes, la medicin icina, a, la econom nomía, ía, la adm adminis inistr trac ació ión n y otra otrass cien cienci cias as,, soci social ales es y físi física cas. s. El aspe aspect cto o mas importante de la estadística es la obtención de conclusiones basadas en los datos experimentales. La
3.- CLASIFICACION DE LA ESTADISTICA
La Estadística se subdivide en: Descriptiva e Inductiva. refier ere e a la reco recop pilac ilació ión n y 3.1.- Estad 3.1.Estadíst ística ica Descr Descript iptiva iva :- Se refi desc descri ripc pció ión n de un grup grupo o de dato datos. s. Es aque aquell lla a que que estu estudi dia a toda toda la población. 3.2 3. 2.- Estad stadís ísti tica ca In Indu duct ctiv iva a :- Es el proceso para lograr generalizaciones acerca del todo (llamado la población) examinando una parte de ella (llamada la muestra). Para que esto sea valido, la muestra debe ser representativa de la población.
3.3ESQUEMA DE ESTADISTICA INDUCTIVA
7
Muestra
INDUCCIO N
Poblaci
Encuesta
AAa
Veamos que significa población y muestra. lecció ión n de toda toda la posi posibl ble e info inform rmac ació ión n que que Población:- Es la colecc carac caracte teriz riza a a un fenó fenóme meno no.. La pobl poblac ació iónn- o Univ Univers erso o pued puede e ser ser tan tan gran grande de o pequ pequeñ eña. a. Mues Muestr tra a :- Es mi subc subcon onju junt nto o repr repres esen enta tati tivo vo seleccionado de una población. 3.4MEDIDAS DE CALIDAD
El Británico William TOMHSON mas conocido como LORD KELVIN solía decir. “Cuando no puede medir y expresar numéricamente lo que dice o conoce algo sobre ellos; pero mientras no pueda medir ni expresar en número su conocimiento es escaso o poco satisfactorio”. Para que un número o varios números representen la información que se supone que representan, depende de la medida de la calidad de los datos. Estas medi medida dass son: son: La vali valide dezz o rele releva vanc ncia ia,, la Exac Exacti titu tud d y la Prec Precis isió ión n o confiabilidad.
Un número o varios números son válidos cuando miden lo que están destinados a medir o representar. Ejemplo: El número de personas que visitan cierto lugar turístico del
Ecuador en cada mes del año es el mismo desde hace mucho tiempo atrás. Exactitud
8
Es la diferencia entre los valores dados y el valor verdadero o real de lo que representan los datos. Esto se consigue empleando instrumentos más sofisticados o mejores métodos de obtención de datos. Ejemplo: El peso de una persona se lee en una báscula normal: 78.6kg.,
en otra un poco más precisa 78.5 kg. Y en una sofisticada 78.658kg. Precisión
Se refiere al grado de respetabilidad de los datos. Esto es cuando se real realiz iza a la mism isma medid edida a u obse observ rvac ació ión n del del mism mismo o obje objeto to en dos dos ocasiones diferentes se obtiene los mismos resultados o muy cercanos entre entre sí. Se Se puede puede mejo mejorar rar la prec precisió isión n obtención de los datos.
tenien teniendo do mas mas cuida cuidado do en la la
Ejemplo: Al medir el peso de una persona en la misma báscula que indica 2kg. De más, se tendrá el peso preciso pero no exacto. 3.5SUMATORIAS Concepto de sumatoria:
A menudo resulta difícil trabajar con todos los elementos de una determinada sucesión, considerándolos como sumandos. Para facilitar este trabajo se ha convenido representar la adición de los términos en forma abreviada, mediante el signo Σ, acompañado de la fórmula o término general que define a la sucesión y del rango de valores que tomará la variable considerada en esa fórmula. Se denomina sumatoria de una sucesión
an , a la forma abreviada de
escribir sus términos expresados como sumandos: El signo Σ corresponde a la Se denota: letra mayúscula sigma, del alfabeto
n
a1
+ a 2 + a 3 + ... ... + a = ∑a n
k
k
=1
9
Ejemplos: n
1+2+3+...+ n=
∑ k k =1
n
12 +22+32+...+n2 =
∑
k 2
k =1
1 2
+
2
+
3
3 4
+
4 5
+ ... +
20 21
20
=∑ k =1
k k + 1
2. Propiedades de las sumatorias:
Sumatoria de una constante: n
Si c1=c2=c3=...=cn=c, constante, entonces:
c ∑
k
=n ⋅c
k = 1
Ejemplo: 50
200 ∑ 4 = 4 + 4 + 4 + ... + 4 = 50 ⋅ 4 = 200 k =1
50 veces Sumatoria del producto de una constante por los términos de una sucesión: n
Si c es una constante, entonces:
∑c ⋅ a k =1
n
k
= c ⋅ ∑ a k k =1
n
La notación
∑a k =1
k
se
lee: “sumatoria de los términos de la forma, a sub k, donde k varía de 1 a n.”
Ejemplo: 5
∑ 3(k
2
k =1
5
+ 1) = 3 ⋅ ∑ (k 2 + 1) = 3 ⋅ (2 + 5 + 10 + 17 + 26) = 3 ⋅ 60 = 180 k =1
10
Sumatoria de una suma o resta de términos de dos o más sucesiones:
Si
a k
y
bk
son sucesiones, entonces se cumple que: n
∑
n
( a k
k
6
Ejemplo:
∑ k =1
(k 2
=1
n
± b ) = ∑a ± ∑b k
k
k
=1
k
6
6
6
k =1
k =1
k =1
k
=1
− 3k + 2) =∑ k 2 − 3 ⋅ ∑ k + ∑ 2
Propiedad Telescópica de las sucesiones:
El desarrollo de algunas sumatorias tiene la particularidad de que casi todos sus términos se anulan quedando estas reducidas a sólo dos términos. Esta propiedad se denomina Propiedad telescópica de las sumatorias. Observemos el siguiente caso: n
∑ (a k =1
k +1
− a x ) = ( a2 − a1 ) + (a3 − a 2 ) + (a 4 − a3 ) + ... + (an − an−1 ) + (a n+1 − an )
Luego: n
∑(a
k +1
− a k ) = a n +1 − a1
k =1
Con el mismo razonamiento se tiene: n
∑( ak − ak 1 ) = a1 − an 1 +
k =1
11
+
La Propiedad Telescópica también es válida para la suma de los recíprocos:
n
∑ 1 =1
k
−
a k +1
∑ 1 n
=1
k
a k
−
1 a k
1 1 = a 1 − a1 + n
1 1 = a − a 1 +1 +1
1 a k
n
La propiedad Telescópica es de gran utilidad para hallar una expresión que permita calcular directamente el valor de alguna sumatoria o para demostrar si una sumatoria es igual a una expresión o fórmula dada, como por ejemplo: Calculemos una fórmula para:
∑ k (k 1+ 1) n
k =1
Si expresamos el numerador de la fracción como: (1+k-k), tenemos: n
1 + k − k
n
1 + k
n
k
1
1
∑ k (k + 1) = ∑ k (k + 1) − k (k + 1) = ∑ k − k + 1 k =1
k =1
k =1
Aplicando la propiedad telescópica: n
1
1
1
∑ k − k + 1 = 1 − n + 1 = k =1
n +1 −1 n +1
=
Por lo tanto: n
1
n
∑ k (k + 1) = n + 1 k =1
12
n n +1
Guía de Ejercicios: Calcula las siguientes sumatorias: 13
1)
∑ (7 + k )
3
=
k =1
8
2)
∑ (3k − 2) = k =1
6
3)
k
∑ (k + 1) k =1
2
=
Expresa como sumatoria, las siguientes sumas: i)
12 + 23 + 34 + … + 5051
ii)
1 ∙ 1 +2 ∙ 3 +3 ∙ 5 + … + 10 ∙ 19
iii)
2 + 5 + 8 + 11 + … + 44
iv)
1 + 4 + 7 + … + 43
v)
2 + 5 + 10 + 17 + … + 401
vi)
5 + 8 + 13 + 20 + … + 904
4.- ORGANIZACION DE DATOS
Los datos sin organizar organizar carecen de sentido, es decir los datos brutos 110 permiten interpretar nada acerca de la información obtenida. Por esta razón es necesario organizar los datos, lo cual se realiza dependiendo del tipo de variable con la que se esta trabajando. Veamos que significa variable. Variable.- Es la que asume distintos valores en un evento o proceso, y pueden ser números o cantidades/ Ejemplo: salarios, precios, edades, peso, estatura, etc. 4.1 VARIABLES ESTADISTICAS
13
Las Las vari variab able less esta estadí díst stic icas as pued puede en ser ser de dos dos clas clases es:: disc discre reta tass y continuas. 5.1.- Variables Discretas
Son aquellas que asumen valores específicos o determinados, en general son números enteros y sirve para contar o enumerar. Eje: El número de trabajadores de una empresa, el número de habitantes de un país, el numero de alumnos del ISTRA, etc. La variable discreta no tiene un límite determinado. 5.2.- Variables Continuas Son aquellas que asumen valores determinados en un rango, pueden ser enteros o fraccionarios y sirven para medir .
Eje: La temperatura, el peso, estatura, edad, etc. La variable continua tiene un 6. DESCRIPCION DE DATOS U OBSERVACIONES Al número de datos u observaciones se lo representan con N. Para describir los dates puede presentar dos casos : 1er Caso.:- Cuando el conjunto de observación tiene pocos datos o valores . Ej: Un estu estudi dian ante te dura durant nte e un sem semestr estre e dio dio diez diez exám exámen enes es parc parcia iale less calificados sobre diez (10 puntos), obteniendo los siguientes resultados: 6-7-6-8-5-7-6-9-10 y 6. En este ejemplo, N= 1O (numero de datos). Para este tipo de conjunto (o estadística) primero se hace un cuadro o una tabla, luego en la primera columna del cuadro se ordenan los datos o valo valore ress ya sea sea en form forma a asce ascend nden ente te o desc descen ende dent nte e (cre (creci cien ente te o decreciente) en la segunda columna se ponen el numero de los valores que se repiten, al numero que se repite se llama frecuencia (f).
Esto lo visualizamos mediante el siguiente cuadro. Notas
Frecuencia (f)
Absoluta 5
1
6
4
7
2 14
8
1
9
1
10
1
TOTAL N = 10 10 2do. Caso - Cuando el conjunto de observación tiene muchos valores diferentes Para este caso se emplea un procedimiento llamado 'Agrupamiento de datos". Esto es posible cuando el numero do datos es mayor que 30 (N > 30). Observación.- El número de clases que se emplea para agrupar los datos en un conjunto depende del ..mero de datos.
* Si el numero de datos es pequeño, el numero de clases a emplear será cercano a cinco (5), pero generalmente nunca nunca menos que que cinco (5). * Si existe una cantidad elevada de datos, el número de clases debe encontrarse entre ocho (8) y doce (12) clases. * En general general el número número de clases puede encontrarse encontrarse entre 5 a 15 clases, el número de clases se puede elegir uno mismo (entre 5 a 15). * Para saber en cuantos grupos o clases agrupamos 16s datos, se utiliza la formula de Sturges K= 1+3,322 log (N), donde K. es el numero de clases y N es el numero de dates u observaciones. Esto se clasifica mediante el siguiente ejemplo: La demanda diaria, en unidades de un producto, durante 30 días de trabajo es: 105 106 105 107 109 111 110 110 107 107 104 99 103 99 103 101 100 101 100 103 98 92 97 94 95 95 93 95 95 95 91 82 91 85 90 86 87 89 87 89 El numero de datos u observaciones es N= 40. Como el numero de datos es mayor que 30, agrupamos los datos utilizando la formula de Sturges: K = 1+3,322 log (N) K= 1+3.322 log (40) K= 1+3,322 (1.60205) K- 1+5,322 K = 6,32 = 6 Por tanto los 40 datos datos podernos podernos agrupar en 6 grupos o clases 15
7. PROCEDIMIENTO PARA AGRUPAR LOS DATOS
1.- Ordenamos los datos en forma creciente o decreciente (ascendente o descendente). 2.2.- Enco Encont ntra ram mos el dato dato mayor ayor y el dato dato menor enor,, llam llamad ado o tam también bién observ observació ación n mayo mayorr (OM) (OM) y observ observació ación n meno menorr (om). (om). Con Con estos estos datos datos encontramos el rango o recorrido, en formula es : Rango = R = OM –om 3.- Determinamos el numero de clases o grupos (K), utilizando la formula de Sturges, (en nuestro ejemplo anterior K = 6). 4.- Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa con la letra C, en formula es :
C= Rango _, C= es la amplitud de la clase Numero de clases R C = K
5.- Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia, esto es : CLASE
LIMITE DE CLASE
FI
6.- En la columna de límites de clase anotamos como limite inferior (Li) de la clase a la observación menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos tantos datos hasta el limite superior (Ls), así sucesivamente iremos anotando en clase, hasta llegar a la ultima clase en la que debe escribir incluido el dato mayor. 7.- Finalmente contamos cuantos datos están incluidos en cada clase y lo ponemos en la columna de las frecuencias (f). Ejemplo
1.- Ordenamos los dates del ejemplo que estamos tratando en forma ascendente
16
82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98 99 99 100 100 101 101 103 103 103 104 105 105 106 107 107 107 109 110 110 112
2-- Hallamos el Rango R = OM - om R =lll - 82 = 29 3.- Determinamos Determinamos el número de clases. K= 1+3,322 log(40) = 6, (K =6) =6) 4.- Determinamos la amplitud del intervalo de la clase. C=R/K C= 29 / 6 = 4.83 C=5 5.- Preparamos columnas.
el
cuadro
con
3
Clases
Límites de Clases
Frecuencia fi
1
82 - 86
3
2
87 - 91
7
3
92 - 96
8
4
97 - 101
8
5
102 - 106
7
6
107 - 111
7 TOTAL TOTAL N = 40
- EJERCICIOS 17
En un centro distribuidor de electrodomésticos, la demanda diaria de televisores de 14 pulgadas durante 31 días de trabajo es :
38 – 35 – 76 – 5 8 – 48 – 59 – 67 – 63 - 33 - 69 – 53 – 51 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49 – 78 – 48 – 42 – 72 – 52 – 47 47 - 66 –58 – 44 – 44 – 56 45. Agrupe estos datos, aplicando el procedimiento. 1.- Ordenamos los datos en forma ascendente. 25-28- 32- 33 – 35 – 36 – 37 –42 – 44 – 44 – 45 – 47 – 48 48 – 49 – 51 – 52 – 53 – 56 – 57 - 58 – 58 – 59 – 61 – 63 –66 –67- 69 – 72 – 76 - 78 2.- R = 78 - 25 = 53 3.- K = l+3,3221og(30) 4.- C = R / K = 53 / 6 = 8. 833 = 9 5.- Presentamos los datos en columnas Clases
Limites
de Clases
1
25
-
33
Frecuencia fi 4
2
34
-
42
4
3
43
-
51
8
4
52
-
60
7
5
61
-
69
5
6
70
-
78
3
18
TOTAL TOTAL n = 31 NOTA :- Para ordenar los datos es conveniente saber si los datos se trata de atributos o variables.
Son los los que que expr expres esan an cual cualid idad ades es.. Eje: Eje: buen bueno, o, malo, alo, Atrib Atribut uto o :- Son masculino femenino. sume dist istint intos valore loress en un evento, Varia Variabl ble e :- Es la que asum generalmente son números. Para ordenar datos de atributos es conveniente clasificar de acuerdo con las categorías en que el atributo puede dividirse. Por Eje: si queremos ordena ordenarr datos datos corresp correspond ondien ientes tes a calific calificacio aciones nes de exáme exámenes nes serán, serán, sobresaliente, muy buena, buena, regular, insuficiente. Pero, si queremos ordenar datos correspondientes a variables, hay que orde ordena narr los los valo valores res en form forma a crec crecien iente te o decre decrecie cient nte e (asc (ascen ende dent nte e o descender, (e) 8. DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE.
Para hacer la descripción gráfica de los datos es necesario conocer algunos elementos de la estadística. 8.1.- LIMITES DE INTERVALOS DE CLASE Todo grupo, grupo, intervalo o clases tiene dos limites: Limite inferior (Li) y Limite superior (Ls).
8.2.- PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc) 19
Cuando estamos trabajando con datos agrupados es conveniente buscar para cada intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que se representa con Xc, en formula es :
Xc = Li +2 Ls por ejemplo en el intervalo 25 – 33, Li = 25, Ls = 33 Xc =(25+33)/ 2 = 58/ 2 = 29 Xc = 29 medio)
(29 (29 es el punt punto o
8.3.- FRECUENCIA ABSOLUTA
Es el número de veces que se repite un dato, o el número de datos que sc encuentre dentro de un intervalo o clase, se lo representa con la letra "F minú minúsc scul ula, a, es deci decirr a este este tipo tipo de frec frecue uenc ncia ia se llam llama a Frec Frecue uenc ncia ia Absoluta. 8.4 .-FRECUENCIA RELATIVA :- Se obtiene dividiendo el número de datos u observaciones de la clase o grupo para el numero total de datos o observaciones:
se representa con la letra (f r), en fórmula es : fr =
Número de datos en la clase
Número total de datos
fr = f/ N ; f es la frec frecuen uencia cia de la clase clase y N cl numero de datos. 8.5. FRECUENCIA ACUMULADA :- Se obtiene de la siguiente forma, en la primera clase se pone la frecuencia absoluta del mismo, en la segunda clase se pone la suma 'de la frecuencia de la primera clase con la segunda clase, y así sucesivamente hasta la suma con la frecuencia de la ultima clase.
btiene ne de la 8.6. 8.6. FREC FRECUE UENC NCIA IA RELA RELATIV TIVA A ACUMU ACUMULA LADA DA :- Se obtie siguiente siguiente manera manera que la frecuencia frecuencia acumulada, acumulada, pero sumando sumando las
20
frecuencias relativas correspondientes. la suma de todas las frecuencias relativas es igual a 1. en formula es : K
∑ F
R
I =1
8.7 .- PORCENTAJE
El porcentaje se obtiene multiplicando la frecuencia relativa por 100, sn formula es : (%) (%) = f r = N x100 f
Aplicando esta formula se obtiene mi porcentaje, cuyo resultado debe expresarse en % (tanto por ciento). La suma de los porcentajes es igual a 100. (100%). Ejemplo Dada la siguiente tabla hallar : Cla Clase Limit imite e de de Frecuen clase cia Li f Ls 1 25 - 33 4
Punto Medio Xc
fA
.fr fra
29
4
0.13 0. 0.13
Porcentaje %
.0.13X100 = 13 0.13 0.26 0.13X100 = 13
2
34 - 42
4
38
8
3
43 - 51
8
47
16 0. 0.26 '0.52 0.26X100 = 26
4
52 - 60
7
56
23 0.23 0.75 0.23X100 = 23
5
61 – 69
5
65
28 0.16 0.91 0.16X100 = 16
6
70 - 78
3
74
31 0.09 1.00 0.09X100 = 9
TOTAL 1.00
N-31 100% 21
a) El punt punto o medi medio, o, b) Frec Frecue uenc ncia ia acum acumul ulad ada, a, frec frecue uenc ncia ia rela relati tiva va,, frecuencia relativa acumulada y el porcentaje. 9 .- REPRESENTACION GRAFICA DE LOS DATOS La representación gráfica de los datos es un medio eficaz para el análisis de las estadísticas, que nos permiten ver el comportamiento de los datos en mi conju conjunt nto o del del cual cual se este este inve investi stiga gand ndo. o. Para Para lueg luego o sacar sacar sus conclusiones. La representación gráfica de los datos constituye mi medio auxiliar de la investigación estadística pues esta se fluidamente en la descripción. 9. 1.- SISTEMAS DE REPRESENTACION
El sistema de representación mas usual es el PLANO CARTESIANO, en el eje eje X se pone ponen n los los valo valore ress disti istint nto os de la varia ariabl ble e para ara date datess no agrupados y los limites de clases para los datos agrupados, en el eje Y se ponen las frecuencias absolutas (o frecuencias relativas), Veamos las representaciones gráficas mas usuales en la estadística. histog ogra ram ma es un gráf gráfic ico o que que tien tiene e un 9.1.19.1.1- Histogram Histogramas as :- El hist conjunto de rectángulos de igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas. Para construir un histograma se traza primero en el primer cuadrando positivo del plano cartesiano, luego en el ej. X se anotan los limites infe inferi rio ores; res; y sup superio eriore ress de las las clas clase es, pro procuran urando do que haya haya una continuidad o coincidencia, Esto es que, el limite superior de una clase se constituye en limite inferior do In siguiente clase. NOTA :- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que corresponden a sus alturas se ponen sus respectivas (frecuencias. Ejemplo Clase
limites de Clase
F
L-R
1
25 - 33
4
24.5 -33.5
2
34 - 42
4
33.5 - 42.5
3
43 - 51
8
42.5 -51.5
4
52 -60
7
51.5 - 60.5
22
5
61- 69
5
60.5 - 69.5
6
70 - 78
3
69.5 - 78.5
Histogra Histograma ma:: de la demand demanda a diaria de televisores
8
7
6 5
4
3
2
1
0
2 4 .5
3 3 .5
4 2 .5
5 1 .5
6 0 .5
6 9 .5
7 8 .5
9.1.2.- Polígono de Frecuencia :- Es un gráfico lineal, su construcción es similar al histograma; para su construcción se unen los puntos medios de cada clase, con sus respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman un polígono.
Ejemplo:
Clase Limites Clase
de f
L.R
Xc
1
25 - 33
4 24.5 33.5
- 29
2
34 - 42
4 33.5 42.5
– 38
3
43- 51
8 42.5 51.5
- 47
4
52 - 60
7 51.5 60.5
- 56
5
61- 69
5 60.5 69.5
- 65
6
70 – 78
23 3
69.5 78.5
- 74
29 38
47
56
65
74
9.1.3.- Curvas de Frecuencias Acumuladas (OJIVA)
El gráfico gráfico de una distrib distribuci ución ón de frecuenci frecuencias as acumulad acumuladas as OJIVA, o curva de distribución de frecuencias acumuladas.
llamada llamada
Para su construcción se procede de la siguiente manera •. Se considera el plano cartesiano, en el eje X se anotan los limites reales (l-R) de la clase, en el eje Y se anotan las frecuencias acumuladas (desde la menor hasta la mayor)
Ejemplo
Clas e
Limites de Clase
F
TA
L.R
1
25 - 33
4
4
24.5 – 33.5
2
34 - 42
4
8
33.5 – 42.5
3
43 - 51
8
16
42.5 – 51.5
4
52 - 60
7
23
51.5 – 60.5
5
61 - 69
5
28
60.5 – 69.5
24
6
70 - 78
3
31
69.5 – 78.5
OJIVA (o curva de distribución) 35 30 25 20
Serie
15
1
10 5 0 24.5
33.5
42.5
51.5
60.5
78.5
Ejemplos :
Dada la siguiente tabla ; Limite de clase Li Ls 19.2 - 19.4
Xc
f
fr,
fA
19.3
1
0.05
1
19.5 -
19.7
19.6
2
0.10
3
19.8 -
20.0
19,9
8
0.40
11
20.1 -
20.3
20.2
4
0.20
15
20.4 -
20.6
20.5
3
0.15
18
20.7 -
20.9
20.8
2
0.10
20
TOTAL TOTAL N= 20 Construya el Histograma, el polígono de frecuencia y la ojiva.
25
9.1.4.- Diagrama de Barras o Gráfico de Barras.
El diagrama de barras es un gráfico que se representa por medio de rect rectán ángu gulo loss que que se leva levant ntan an desd desde e el eje eje X, hast hasta a una una altu altura ra que que correspondo a I eje Y y que es igual a las frecuencias de las diferentes categorías de los datos. La diferencia entre el diagrama de barras y el histograma esta en que e1 histograma se refiere a una distribución. de frecuencias y los diagramas de barras se utilizan para cualquier tipo de atributos o categorías.
I
CAMPOS
PETROLEROS
NUMERO DE POSOS
1
Lago Agrio
20
2
Shushufindi – Aguarico
57
3
Sacha
101
4
Yuca Yuca Sur
7
5
Cononaco
12
6
Duremo guanta
9
7
Auca
28
8
libertador
50
Ejemplo DIAGRAMA DE BARRAS DE LOS CAMPOS PETROLEROS
26
120 120 100 100 80 60
Serie1
40 20 0 1
2
3
4
5
C amp os
6
7
8
P et ro le ro s
27
EJERCICIOS LIMITE DE CLASE 1.5 2.4 1.5 3.4 3.5 4.4 4.5 5.4 5.5 6.4 6.5 7.4 7.5 8.4 8.5 9.4 9.5 10.4 . TOTAL TOTAL
F
I) Dada Ia siguiente siguiente tabla.
3 3 5 5 6 8 4 4 2 N=40
Hallar el Histograma, el polígono de frecuencia y la curva do distribución.
2) Dada la siguiente tabla que representa el número de carros vendidos en 6 días de feria internacional. MARCA DE CARROS
F
Datsun
40
Ford 45
Toyota Toyota Vitara Montero
32
San Remo
38
44
46
Grafique el diagrama de barras
28
9.15.- GRAFICOS EN SECTORES 0 DIAGRAMAS DE PASTEL
Los Los gráfi ráfico coss en sec sectore toress o diag iagram ramas de paste astell se utili tilizzan para ara representar los datos cuyo conjunto forman un todo. Pertenecen a este grupo los CIRCUNGRAMAS 0 CICLOGRAMAS, que son círculos que representan al numero total de datos (N) divididos en tantos sectores circulares como categorías tiene el grupo. Cada Cada sect sector or circ circul ular ar es prop propor orci cio onal nal a la frec frecue uenc ncia ia de su clas clase e o categoría. Para encontrar el numero de grados de cada clase o categoría se utiliza la siguiente formula. GRADO = (f /n)*360 Donde f es la frecuencia de la clase y n el numero total de datos del conjunto. EJEMPLO CLASE
LIMITE CLASE
1 2 3 4 5 6
25 34 43 52 61 70
TOTAL
-
DE FRECUENCI GRADO PORCENTAJ A S E F Fr x 100 33 4 46.5° 0.13x100= 42 4 46.5° 13 51 8 93° 0.13x100= 60 7 81° 13 69 5 58° 0.26x100= 78 3 35° 26 0.23x100= 23 0.16 x100=16 0.09X100= 9 N=31 360° 100%
29
Grado =
Grado =
4 x 360 31 4 x 360 31
Grado =
8 x 360 31
1.
= 46.5
= 46.5
= 92.9 = 93 Grado = 7 x31360 = 81 Grado = 5 x31360 = 58 Grado = 3 x31360 = 35 9 16 133 23
13 2 6
AUTOEVALUACION No. 1 Instrucción:
Seña Señale le con una una (x) (x)la alte altern rnat ativ iva a o alte altern rnat ativ ivas as verda erdade dera rass que que corresponda a cada pregunta. 1.
En el el sigui siguien ente te red redon onde deo o de dat datos os seña señale le las las apro aproxi xim macio acione ness que que son correctas de acuerdo al Sistema Internacional. a. b. c. d.
2.
Señale ñale con con un una (x) (x) las las var varia iabl ble es co contin ntinua uas. s. a. b. c. d.
3.
125,85 aproximado a tres cifras enteras enteras es es 126 235,135 aproximado a dos cifras decimales decimales es 235,14. 425,45 aproximado a una cifra decimal decimal es 425,5. 1.250,1245 aproximado a una cifra decimal decimal es 1.250,2.
Provincias de del Ec Ecuador Habitantes de del Ec Ecuador La est estat atur ura a de los los alu alum mnos de de un cole colegi gio o. La edad edad de los los alu alumn mno os de de la la Moda Modali lida dad d Abie Abiert rta. a.
La va variab iable fa famili ilias de del Ec Ecuado ador es es: a. b. c. d.
Continua Discreta Cualitativa Ninguna de de la las an anteriores.
30
4.
Seña Señale le co con una una (x) (x) las las pro propo posi sici cion ones es que que son son cor corre rect ctas as.. a.
c.
La dife difere renc ncia ia que que se se est estab able lece ce entr entre e el el val valo or may mayor or y el el valor menor de la variable es la amplitud total. b. c=Ls-Li+1 La marca arca de clas clase e es es el el val valor or medio edio de cada cada inte interv rval alo. o. d. Xc = (Ls+Li)/2
5. determi rmine los los lím límite ites rea reales les que le corre rresponden al sigu iguien iente intervalo: 46-50. a.
46,5 - 50,5 b. 45,5 - 49,5 45,5 - 50,5 Ningu inguna na de las las solu soluccione ioness ante anteri rio ores. res.
c. d. 6.
7.
Un cole colegio gio tiene tiene 3.20 3.200 0 estu estudia diant ntes es.. Si los los alumn alumnos os matr matricu icula lado doss en el primer curso son 400, entonces el porcentaje que le corresponde a este curso es de: a. 8,5% b. 12,5% c. 80% d. Ningu inguna na de la solu soluccione ioness ante anteri rio ores. res. el ancho del intervalo 51 - 57 es: a. b. c. d.
C=5 C=6 C=7 Ningun Ninguna a de las las anter anteriore iores. s.
8.
La marc arca de cla clase del del inte interv rval alo o 30 - 35 es: a. 4 b. 5 c. 32 d. Ningu inguna na de las las solu soluccione ioness ante anteri rio ores. res.
9.
Para el cálculo de la frecuencia relativa debemos fórmula. a.r =
utilizar la
f .100 N
b. fr = f . N c. fr = N f
e. Ningun Ninguna a de las solucio soluciones nes anterio anteriores. res. 10.
La fórmu fórmula la para para calcular calcular el porcen porcentaje taje de la frec frecuen uencia cia es: 31
a. p = f .N 100 ., N b. p = f 100 c. p = N f d. Ningun Ninguna a de de las las anter anteriore ioress 11. 11.
¿Cuá ¿Cuáll de las las sig sigui uien ente tess es una una grá gráfic fica a de sup super erfic ficie. ie. a. b. c. d.
Curva de magnitud Polígono de fr frecuencia Barras compuestas Pictograma.
12. 12. en un un políg polígon ono o de frecu frecuen enci cias, as, los los valor valores es repre represe sent ntad ados os en el el eje vertical corresponden a: a. b. c. d. 13.
En un un histo histogram grama, a, las las frecue frecuencia ncia se ubic ubican an en en el eje eje vert vertical ical Y, y en el eje horizontal. a. b. c. d.
14. 14.
15. 15.
Los intervalos de clase. Las frecuencias acumuladas. Los puntos medios. las fr frecuencias.
Los lilimites re reales de clase Las variables Los po porce rcentajes jes de las fre frecuencias ias las fr frecuencias re relativas
Cuan Cuando do en el el polígo polígono no de frec frecue uenc ncia ia los los punta puntaje jess se distrib distribuy uyen en en forma uniforme, la prueba aplicada ha sido: a. Con un alto grado de di dificultad b. Con ci cierto gr grado de de dif difiicultad. c. Normal. d. Ningu inguna na de las las solu soluccione ioness ante anteri rio ores. res. El gráfi gráfico co que que se obtie obtiene ne al repre represen senta tarr la variab variable le y la frecu frecuen enci cia a acumulada. a. b. C. d.
16. 16.
Pictograma Ojiva o curva de magnitud. Polígono de Frecuencia. Diagrama de fr frecuencias.
El políg polígon ono o de de frecu frecuen enci cia a es es un un gráf gráfic ico. o. a. De superficie b. Lineal
32
c. d. 17. 17.
18. 18.
Libre Ninguno de de lo los an anteriores.
Para Para traz trazar ar un dia diagram grama a de barr barra as horizo rizont ntal ale es en el eje eje de las las abscisas se localizan las frecuencias y en el eje de las ordenadas. a. la amplitud de la variable b. Los limites reales de clase. c. Los da datos de la variable. d. Las frecuencias acumuladas. Las Las frec frecue uenc ncia iass rela relati tiva vass las las pode podem mos repr repres esen enta tarr gráf gráfic icam amen ente te utilizando un diagrama a. b. c. d.
Lineal Superficie Libre Ninguna de de la las an anteriores.
19 En un diagrama de sectores, los 360 grados del ángulo central de un círculo se distribuyen utilizando la fórmula. a.
A° =
f .100 N
b. A° =
f .360°
A° = d. A° =
N .100 f
c.
f
f .360° N
20. El diagrama es espiral se utiliza para representar: a. Solo series con datos datos geográficos geográficos b. Dos series series de datos datos c. Una variación variación expansiva expansiva de un fenómeno fenómeno.. d. Los porcentaje porcentajess de la variable. PARTE B. En la siguiente serie estadística de intervalos:
120 114 108 102 96 90
X - 125 - 119 - 113 - 107 - 101 - 95
F 5 6 10 9 15 2 N=47
Determine:
33
a. La marca marca de clase. b. La frecuencia frecuencia relativa relativa c. La frecuenci frecuencia a acumulada acumulada d. El porcentaje porcentaje de la frecuencia frecuencia relativa e. El histogram histograma a f. La curva de distribuc distribución ión (OJIVA) (OJIVA) g. El diagrama diagrama de pastel. pastel.
SEGUNDA UNIDAD MEDIDA DE LA TENDENCIA CENTRAL Y DE LA DISPERSION OBJETIVOS
Al terminar el estudio de esta unidad el estudiantes estará en capacidad de : Determinar la media, mediana y el modo, la interpretación y conclusión de la misma ya sea de datos no agrupados y agrupados. Determinar la varianza y la desviación típica de datos no agrupados y agrupados. Determinar la asimetría, sesgo de la curva de distribución “curtosis”. CONTENIDOS. 1. INTR INTROD ODU UCCIO CCION N En la sección anterior se plantearon las técnicas gráficas para describir las distribuciones ocultas en un conjunto de datos en esta unidad se
34
definen algunas “medidas numéricas” que se emplean para describir un conjunto de datos. Estas medidas son de dos tipos: a. Medida Medidass de tende tendenci ncia a central central o de centr centraliz alizació ación n b. Medida Medidass de dispers dispersión ión o de de varia variabili bilidad dad.. Estudiaremos tanto para datos agrupados como no agrupados. Las medidas de tendencia central se refiere a la localización de una distribución. La más importantes medidas de tendencia central son: la media (X), la mediana (Mdn), la moda (mo), media geométrica (g.M) y la mediana armónica(G.A) Las medidas de dispersión o variabilidad se refiere a la dispersión o distanciamiento de un dato con los demás y con respecto a su media. Las más más import important antes es son: son: la desvia desviació ción n media media (DM). (DM). Desviac Desviación ión media mediana na 2 (DMd), la varianza (S ) y la desviación típica o estándar (S). 2. MEDIA DIA ARITM ITMETICA ICA O PRO PROMEDIO DIO PAR PARA DATOS NO AGRUPADOS DEFINICION.- La media se define como la suma de los valores de un conjunto de datos dividida para el número total de datos.
Existen dos tipos de medias : La media poblacional que se representa por u (miu) y la media para muestras que se representa po (X) (equis barra). La media para datos no agrupados está dada por la siguiente fórmula: n
x =
∑ xi i =1
n
= x1+ x 2 + x 3+n.............+ xn
n
Donde
∑ xi =
a la suma de cada uno de los valores del conjunto de datos
i 01
y (n) es el número total de elementos del conjunto. Dado el siguiente conjunto de datos hallas su media. 38-35-76-58-48-59-67-63-33-69-53-51-28-25-36-32-61-57-49-78-48-4272-52-47-66-58-44-44-56-45 Aquí es este conjunto N = 30 n
X =
∑= Xi i 1
N
=
38+ 35 + 76 + 58+ .....44 + 44 + 56 + 31
= 1590 = 51.29 31
3. MEDIANA PARA DATOS NO AGRUPADOS
median ana a es una una cole colecc cció ión n de dato datoss debi debida dame ment nte e DEFINICIÓN.- La medi ordenados en forma ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmética de los dos valores medios. La median está justamente en el 50% de los datos (en la mitad). Para hallar la mediana, puede presentar dos casos.
35
1er. Caso.- Cuando el número de datos es impar.- En este caso la mediana se encuentra en la mitad de la “serie ordenada” de los datos, se puede encontrar utilizando la siguiente fórmula. Mdn =
N +1
2
El resultado de esta operación nos indica la posición o el lugar donde está la mediana (este valor no es la respuesta).
DATOS SIN ORDENAR DATOS ORDENADOS 38 35 76 58 45 25 28 32 32 33 35 35 36 67 63 33 69 53 59 38 42 44 44 44 45 47 48 48 28 25 36 32 61 51 48 49 78 48 42 72 57 49 51 52 52 53 56 57 58 58 47 66 58 44 44 52 56 58 59 61 63 66 67 69 72 76 78 N = 31 (NÚMERO DE DATOS IMPAR). Mdn = N + 1 = 31 + 1 = 32 = 2 2 2
16
El 16 no es la mediana, el 16 nos indica la posición o lugar que ocupa la mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 16 ocupa el número 51 Por lo tanto la Mdn = 51. 2do. Caso.- Cuando el número de datos es par.- En este caso se utiliza el mismo procedimiento que el 1er. Caso, y se obtiene un número entero con decimales, en este caso la median se encuentra hallando la media aritmética de los dos valores medios.
DATOS SIN ORDENAR DATOS ORDENADOS 38 35 76 58 45 26 28 32 33 35 36 67 63 33 69 53 59 39 42 44 44 44 45 45 47 28 25 36 32 61 51 48 48 49 78 48 42 72 57 50 51 52 52 53 56 56 57 47 66 58 44 44 52 58 58 56 59 61 63 66 67 69 72 76 78 Mdn = N + 1 = 30 + 1 = 31 = 15.5 2 2 2
36
El número 15.5 no es la mediana, este valor nos dice que la mediana está entre el elemento 15 y el elemento 16 de los datos ordenados, esto es: El puesto u15 está ocupado por el número 51 y el puesto 16 por el número 52. Por lo tanto la mediana es: Mdn = 51 + 52 = 2 2
103 = 51,5
4. MODA PARA DATOS NO AGRUPADOS.
Definición.- La moda en un conjunto de datos u observaciones es el valor que se repite con mayor frecuencia. A la moda o modo se lo representa con Mo. NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda es UNIMODAL. EJEMPLO.
Hallar la moda del siguiente conjunto de datos. 19 7 20
1 6 17
3 6 8
4 6 18
2 6 9
5 6 10
Si existen dos dos valores que que se repiten, el el conjunto conjunto tiene dos modas, modas, es BINODAL. 1 4 12
2 5 11
3 6 11
3 7 10
3 8 11
3 9 11
Mo = 3 es bimodal. bimodal. Mo. = 11. Si existen más de dos valores que se repiten, el conjunto tiene varias modas, se llama MULTIMODAL. EJERCICIOS. 1. Los Los siguie siguient ntes es dato datoss repre represe sent ntan an las latas latas de fritas fritas de una mues muestr tra a de 20 unid unidad ades es que que cont contien ienen en peso pesoss neto netoss que que oscilan entre 19.3 onzas y 20.9 onzas.
37
19.7-19.9-20.2-19.9-20.0-20.6-19.3-20.4-19.9-20.3-20.1-19.5-20.9-20.320.8-19.9-20.0-20.6-19.9-19.8 Hallar la media, mediana y la moda para este conjunto de datos no agrupados. 5. MEDIA PARA DATOS AGRUPADOS
La media para datos agrupados se calcula por la siguiente fórmula: n
X =
∑= f Xc 1
i 1
N
N
Donde
∑ f Xc = A la suma del producto de las frecuencias por el punto 1
i =1
medio o marca de clase. N= Número total de datos u observaciones K= Número de clases. Para hallar la media de datos agrupados, primero encontramos los puntos medios, luego multiplicamos cada frecuencia por el punto medio de la clase. Sumamos la columna de los productos y su resultado dividimos para el número total de datos. EJEMPLO I 1 2 3 4 5 6 TOTAL TOTAL
LIMITE CLASE 25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78
DE F 4 4 8 7 5 3 N=31
Xc
f. Xc
29 38 47 56 65 74
4x29=116 4x38=152 8x47=376 7x56=392 5x65=325 3x74=222 6
∑ f . Xc = 1583 i 01
6
F . xC ∑
X
=
I = 1
n
=153813
=51
.06
6. MEDIANA PARA DATOS AGRUPADOS
La medi median ana a para para dato datoss agru agrupa pado doss se obtie obtiene ne medi median ante te la siguie siguient nte e fórmula: Mdn = Li +
[ N / 2 − ( ∑ f ) i ]
38
f m
C
PROCEDIMIENTO 1. Formamos una tabla para los límites de clases, frecuencias y frecuencias acumuladas. 2. Hallar las frecuencias acumuladas. Li= significa límite real inferior de la calase mediana. N/2= es el número de datos dividido para dos. ( ∑ f )i = 20 C= 1.15 – 1.10 = 0.05 Fm=15 Mdn = Li +
[ N / 2 − ( ∑ f ) i ] f m
.C
Mdn = 1.15 + [ 2415−20 ] (0.05) = 1.15 + [ 4 / 15] (0.05) = 1.15 + 0.0133 Mdn = 1.163 163 ≈ 1.2
8. MO MODA DA PAR PARA A DATO DATOS S AGRU AGRUPAD PADOS OS.. Para hallar la moda para datos agrupados, primeramente primeramente se observa en colu column mna a da las las frec frecue uenc ncia ias, s, el valo valorr más alto alto (cla (clase se con con la mayor ayor frecuencia.) Luego se halla la moda utilizando la siguiente fórmula Mo = Li +
d 1 d 1+ d 2
C
Li = Límite inferior de la calase modal (clase con la mayor frecuencia). d1= d1= Frec Frecue uenc ncia ia de la clas clase e moda modall menos enos la frec frecue uenc ncia ia de la clas clase e anterior d2 = Frecuencia de la clase modal menos la frecuencia de la siguiente clase. C = Amplitud o longitud del intervalo de clase. EJEMPLO LIMITE DE CLASE fi 1.00 – 1.04 4 1.05 – 1.09 6 1.10 – 1.14 10 1.15 – 1.19 15 1.20 – 1.24 8 1.25 – 1.29 5 N = 48 48
I 1 2 3 4 5 6 Total
En este ejemplo la frecuencia la frecuencia más alta es 15 y está en la cuarta clase. Li = 1.15 d1 = 15 – 10 = 5 d2 = 15 - 8 = 7 C = 1.20 – 1.15 = 0.05 Mo = Li +
d 1 d 1+ d 2
C
39
Mo = 1.15 1.15 + 5 (0.05) (0.05) = 1,15 1,15 + 0,0208 0,0208 ( 5+7) Mo= 1.170 ≈ 1,2 8. CUAR CUARTI TILE LES, S, DECI DECILE LES S Y PER PERCENT CENTIL ILES ES,,
PAR PARA DAT DATOS NO
AGRUPADOS.
Los cuartiles, deciles y percentiles se asemejan mucho a la mediana porque también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas. Mientras la mediana divide un conjunto de datos en dos mitades, los cuartiles la dividen en 4 partes, los deciles la dividen en 10 partes y los percentiles la dividen en 100 partes. Para Para los los dato datoss no agru agrupa pado dos, s, las las fórm fórmul ulas as que que se empl emplea ean n son son las las siguientes: CUARTILES:
Primero: Q1 = (N/4) + (1/2) Segundo: Q2 = (2N/4) +(172) Tercero: Tercero: Q3 = (3N/4) + (1/2). DECILES
Primero: (N/10) + (1/2) = D1 Segundo: (2N/10) + (1/2) = D 2 Tercero: Tercero: (3N/10) (3N/10) + (1/2) = D3 Cuarto: (4N/10) + (1/2) = D 4 Quinto: (5N/10) + (1/2) = D 5 Sexto: (6N/10) + (1/2) = D 6 Séptima: (7N/10) + (1/2) = D 7 Octavo: (8N/10) + (1/2) = D 8 Noveno: (9N/10) + (1/2) = D 9 PERCENTILES Primero: P1 = (N/100) + (1/2) Segundo: P2 = ( 2N/100) +(1/2) ................................................... Diez P10 = ( 10N/100) +(1/2) Setenta = P70 = ( 10N/100) +(1/2) Ochenta = P80 = ( 80N/100) +(1/2)
40
EJEMPLO
Del siguiente conjunto de datos hallar, los cuartiles, el decil segundo y decil decil noveno noveno,, ademá ademáss hallar hallar los percen percentile tiless décimo décimo,, veinti veinticin cinco co avo, avo, setenta y cinco avo (75) y noventa avo. 82 92 99 105
85 93 99 105
86 94 100 106
87 95 100 107
87 95 101 107
89 95 101 107
89 95 103 109
90 95 103 110
Q1 = (N/4) +(1/2) = (40/4) + (1/2) = 10 +0.5 , = 91.5 Q2= (2N/4) +(1/2) = 20+ 0.5 = 20.5 , = 98.5 Q1 = (3N/4) (3N/4) +(1/2) +(1/2) = 30+0.5 = 30.5, 209 = 91.5 2 D1 = (2N/10) (2N/10) +(1/2) +(1/2) = 8+0.5 = 8.5, 181 = 90.5 2 2 D9= (9N/4) (9N/4) +(1/2) = 36+0.5 36+0.5 = 36.5, 216 = 10,85 2 P10= (10N/4) (10N/4) +(1/2) +(1/2) = 4+0.5 = 4.5 , 174 = 87 2 P25 = (25N/4) +(1/2) = 10+0.5 = 10.5, 92 = 183 = 91.5 P75 = (75N/4) +(1/2) = 30 + 0.5 = 30.5 , 105 = 209 = 91.5 P90 = (90N/4) +(1/2) = 36+0.5 = 36.5 , 109 = 216 = 108
91 97 103 110
91 98 104 111
Q 1 = 91 + 92
= 183
2 Q2 = 98 + 99 =
2
2 Q1 = 2
D2 =
2 197
104 + 105 = 90 + 91 =
D9 = 107 + 109 = 2
P10 =
2
P 25 =
2
2
2
2
2
87 + 87 = 91 +
Q1 = 104 + Q1 =
107 +
2
De todos estos dados usados son los Percentiles: llama reco recorri rrido do inte intercu rcuan anti till a la dife diferen renci cia a entre entre los los Definición.- Se llama percentiles 75 avo. Y 25 avo. En formula es: Recorrido intercuantil = P75 – P25 = 104.5 – 91.5 = 13
41
llama a reco recorri rrido do inte interd rdec ecil il a la dife difere renc ncia ia entr entre e los los Definción.- Se llam percentiles 90avo. Y 10 avo. En fórmula es: Recorrido interdecil = P90 - P10 = 108 – 87 = 21,. 9.
CUAR CUARTI TILE LES, S, DECI DECIL LES Y PERC PERCE ENTIL NTILES ES PAR PARA
DATO DATOS S
AGRUPADOS.
Para hallar los cuartiles, deciles y percentiles de datos agrupados, basta recordar la fórmula de la medinan para datos agrupados. Esto Es: Mdn = Li +
[ N / 2 −( ∑ f ) i ] f m
C
Por lo tanto las formulas par par los Cuartiles, deciles deciles y percentiles son: CUARTILES : Q1 = Li +
[ N / 4−( ∑ f ) i ]
Q2 = Li +
[ 2 N / 4 − ( ∑ f ) i ]
Q3 = Li +
[ 3 N / 4 − ( ∑ f ) i ]
f cuartil
.C
.C
f cuartil
.C
f cuartil
DECILES D1 = Li +
[ N / 10 −( ∑ f )i ]
D5 = Li +
[ 5 N / 10− ( ∑ f ) i ]
D8 = Li +
[ 8 N / 10− ( ∑ f ) i ]
D9 = Li +
[ 9 N / 10− ( ∑ f ) i ]
f decil
.C
.C
f decil
.C
f decil f decil
.C
PERCENTILES
Dentro de los percentiles los más usados son.: [ N / 10−( ∑ f )i ]
P 10 = Li +
f percentil
.C
P 25 = Li +
[ 25 N / 10−( ∑ f )i ]
P 75 = Li +
[ 75 N / 10−( ∑ f )i ]
f percentil f percentil
[ P 90 = Li +
90 N / 10−( ∑ f ) i ] f percentil
.C
.C
.C
Así tenemos lo siguiente: Recorrido intercuantil = P75 – P25 42
Recorrido interdecil = P90 – P10.
EJEMPLO De la siguientes siguientes tablas determinar, determinar, el recorrido recorrido intercuantil intercuantil y el recorrido recorrido interdecil I
LIMITE DE CLASE 82 - 86 87 - 91 92 - 96 97 - 101 102 - 106 107 - 111
1 2 3 4 5 6
FRECDUENCIA f i 3 7 8 8 7 7
FRECUENCIA ACUMULADA 3 11 18 26 33 40
N=40 P 10 = Li +
[10 N / 100− ( ∑ f ) i ] F percentil
P 25 = Li +
.C
400 = 4 (2da clase). 100 Li= 87; ( ∑ f)i = 3; f= 7; C=5 P 10 = 87 + (4-3/7) 5 P10 = 87 + (1/7) 5= 87+0.71 P10 = 87.71 P 90 = Li +
[ 90 N / 100− ( ∑ f )i ] F percentil
[ 25 N / 100−( ∑ f )i ] F percentil
.C
1000 = 10 (2da clase). 100 Li= 87; ( ∑ f)i = 3; f= 7; C=5 P 25 = 87 + (10-3/7) 5 P25 = 87 + (7/7) 5 = 87+5 P25 = 92 P 10 = Li +
.C
90N = 3600=36 (6ta clase). 100 Li= 107; ( ∑ f)i = 33; f= 7. 107+ (36 (36-33 -33/7) /7) 5 P 90 = 10 P90 = 107 + (3/7) 5= 107+2.14 P90 = 109.14
[10 N / 100− ( ∑ f ) i ] F percentil
.C
75N = 3000=30 (5ta clase). 100 Li= 102; ( ∑ f)i = 26; f= 7. P 75 = 102+ (30-26/7) 5 P75 = 102+ (4/7) 5= 102+2.85 P75 = 104.86
Recorrido intercuantil = P75 – P25 = 104.86 – 92 = 12.86 ≈ 13 Recorrido interdecil = P90 – P10 = 109.14 – 87.71 = 21.43. EJERCICIOS
Dado el siguiente conjunto de datos no agrupados (20 datos ). 40.2 29.3 35.6 88.2 42.9 26.9 28.7 99.8 35.6 37.8
25.1 29.3 35.6 40.2 50.6 25.4 31.7 36.8 42.9 55.2 43
44.2 32.3 55.2 50.6 25.4 31.7 36.8 45.2 25.1 39.7
26.9 32.3 37.8 44.2 88.2 28.7 35.6 39.7 45.2 99.8
Calcular : el recorrido intercuantil y recorrido interdecil. P10= ¨[10(20)/100 + 0.5 = 2 + 0.5 = 2.5; está entre el elemento 2 y 5 de los datos ordenados. P10= 25.4 + 26.9/2 = 52.3/2 = 26.15 P25 = 29.3 + 31.7 / 2 = 61/ 2 = 30.5 P75 = [75(20)/100[ + 0-5 = 15 + 0.5 = 15.5; está entre el elemento 15 y 16 P75 0 44.2 + 45.2 / 2 = 89.4 /2 = 44.7 P90 = [90(20)/100 + 0.5 = 18+0.5 = 18.5; está entre el elemento 18 y 19. P90 = 88.2 + 55.2 / 2 = 134.4/2 = 71.7. Recorrido intecuantil = P75 – P25 = 44.7 – 30.5 = 14.2 Recorrido interdecil = P90 – P10 = 71.7 – 26.15 0 45.55. Del sigui Del siguien ente te conj conjun unto to de dato datoss agru agrupa pado dos, s, calc calcul ulas as los los reco recorri rrido doss intercunatil e interdecil. Además, la media, mediana, moda. Limite de clase
1.10 1.87 2.64 3.41 4.18 4.95 5.72 6.49
-
1.86 2.63 3.40 4.17 4.94 5.71 6.48 7.25
Frecuencia Punto Frec. (f) medio (Xc) Acumulada (Fa) 4 1.48 4 14 2.25 18 11 3.02 29 9 3.79 38 7 4.56 45 1 5.33 46 2 6.10 48 2 6.87 50 N = 50
f.xc
5.92 31.50 33.22 34.11 31.92 5.33 12.2 13.74 167.94
10.- MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Y AGRUPADOS.
La dispersión se refiere a la variabilidad o amplitud en los datos. Las medidas más importantes de dispersión son: La desuvicación media. La varianza La desviación estándar. 10.1 DESVIACIÓN MEDIA PARA DATOS NO AGRUPADOS.
La desviación media para datos no agrupados está dada por:
44
_ ∑Xi - X n
D.M =
DM= Desviación media. Xi – X = valor absoluto de la diferencia entre cada dato de la muestra y la media. N= Número de datos. EJEMPLO:
Del siguiente conjunto da datos: Hallar la desviación media (D.M) 82 92 99 105
85 93 99 105
86 94 100 106
87 95 100 107
87 95 101 107
89 95 101 107
89 95 103 109
90 95 103 110
91 97 103 110
91 98 104 111
X = 82 + 85 + .............................+111 = 97.9 40 Mdn = 40 + 1 = 20.5 2 Mdn = 98 + 99 = 98.5 2 N
DMdn = N
∑
∑= ( xi − Mdn) i 1
N
Xi − X =
82 – 97.9 + 85 – 97.9 + 86 – 97.9 + ..... + 111-97.9
i =1
= -15.9 + -12.9 + -11.9 + ........+13.1 = 15.9 + 12.9 + 11.9 + ......+ 13.1 _ ∑ Xi – X = 264.2 Por lo tanto: _ ∑Xi - X n DM = 264.2 40 DM = 6.605 ≅ 6.61
45
D.M =
10.1.2 DESVIACION MEDIA PARA DATOS AGRUPADOS
La desviación media para datos agrupados está dado por: _
∑ f Xc – X D.M =
n
Donde f = es la frecuencia de cada clase Xc – X = es la diferencia entre la marca de clase (punto medio) y la media. EJEMPLO De la siguiente tabla de datos agrupados calculas la Desviación Media. Limite de clase 82 – 86 87 - 91 92 - 96 97 - 101 102 106 107 – 111
Punto Medio Xc 84 89 94 99 104 109
TOTAL TOTAL
Fre c. Fi 3 7 8 8 7 7
FiX d= Xc – X Fi Xc – X c (Xc – X )2
25 2 62 3 75 2 79 2 72 8 76 3 N= 39 40 10
84 - 97.75 =13.75 89 - 97.75 = 8.75 94 - 97.75 = 3.75 99 – 97.75 .75 = 1.25 104 – 97.75 = 6.25 109 - 97.75 = 11.25
3(13.75) = 41.25 7(8 7(8.75) .75) = 61.25 8 ( 3.75) = 30.00 8 (1.25) = 10.00 7 ( 6.25) = 43.75 7 811. 811.25 25)) = 78.75 FiXc – X= 265
(13.75)2 189.0625 (8.75)2 76.5625 (3.75)2 14.0625 (1.25)2 1.5625 (6.25)2 39.0625 (11.25)2 126.5625
= = = = = =
K
x =
∑ f i Xc
i =1
N
=
3910 40
= 97.75
_
∑ f Xc – X D.M =
n
= 265/ 40 = 6,625
10.2 VARIANZA PARA DATOS AGRUPADOS Y NO AGRUPADOS.
46
Fi (Xc – X)2 567.18 75 535.93 75 112.50 00 12.500 0 273.43 75 885.93 75 2387,5
La raíz cuadrada de la varianza recibe el nombre de Desviación estándar. k
S = 2
∑ fxc 2 − nx 2 n −1
= S
2
∑= f ( Xc− X )
2
i
i 1
=
N −1
2387.5 39
= 61.2179
10.2.1 DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS.- La raíz cuadra cuadrada da de la varianz varianza a recibe recibe el nombre nombre de . Desvia Desviació ción n estándar. k
S= ∑ f ( Xc− X )
2
i
i =1
S =
N −1
61.2179
S = 7, 824 10.2.3 VARIANZA PARA DATOS NO AGRUPADOS.
La varianza para datos no agrupados está dada por: N
S 2 =
∑= i 1
( Xi − X ) 2
=
N −1
N
∑ ( Xi − X )
Método abreviado.
∑ x 2 − nx 2 n −1
= Sumatoria o suma de la diferencia de cada valor del conjunto
2
i =1
de datos menos la media elevado al cuadrado. N-1= Al número de datos de la observación menos uno. 82 92 99 105
85 93 99 105
86 94 100 106
87 95 100 107
87 95 101 107
89 95 101 107
89 95 103 109
90 95 103 110
91 97 103 110
_ X = 97,9 40
S = 2
40
∑ ( Xi − X )
2
∑= ( xi − X )
2
i 1
N −1
2 111 − 97.9) = (82 − 97.9) 2 + (86 − 97.9) 2 + ......... + (111
i =1
Por lo tanto
= 2379.61 40
S = 2
∑= ( Xi − X ) i 1
40 −1
2
=
2379 .61 39
47
= 61.015
91 98 104 111
10.2.4. DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS
raíz cuad cuadrad rada a más más la varia varianz nza a recib recibe e el nomb nombre re de Definición.- La raíz Desviación estándar. Del ejemplo anterior tenemos : S 2 = 61.015 Desviación Estándar: S = 61.015 = 7.81 EJEMPLO
Los siguientes datos agrupados representan los pagos por almace almacenam namient iento o para los 50 más más grande grandess detalli detallista stass durante durante el año 1979 Limite Frec s uenc Li Ls 1.10 4 1.86 14 1.87 - 11 2.63 9 2.64 7 3.40 1 3.41 2 4.17 2 4.18 4.94 4.95 5.71 5.72 6.48 6.49 7.25
Xc
f A
FiXc
Xc-X
F1XcX
(XcX)2
F1(XcX)2
1.48 2.25 3.02 3.79 4.56 5.33 6.10 6.87
4 18 29 38 45 46 48 50
5.92 31.5 33.22 34.11 31.92 5.33 12.20 13.74
1.88 1.11 0.34 0.43 1.20 1.79 2.76 3.51
7.52 15.54 3.74 3.87 8.40 1.97 5.48 7.02
3.176 1.024 0.059 0.276 1.684 4.277 8.139 13.01 7
12.70 4 14.33 6 .649 2.511 11.78 8 4.277 16.27 8 26.03 4
N=5 0
167.9 4 8
X =
∑= F Xc I
I 1
N
= 16750.99 3.36
N/2 = 50/2=25 está en la 3era clase. Li = 2.635 8
(
∑ f )i = 18; i =1
48
53.54
88.57 7
f m = 11 C= 5.72 – 4.95 = 0.77 Mdn = Li +
8 f ) y N / 2− i∑ =1
f m
Mdn= = 2.635 2.635 + [25-18/11 (.77) Mdn= Mdn= 2.63 2.635 5 + [0.6 [0.636 36 (0.77 (0.77)) = 2.635 2.635 + 0.49 = 3.13 Mo = Li +
d 1 d 1+ d 2
C
d1 = 14-4 =10 d2 = 14-11 =3 Li = 1.865 Mo= 1.865 + 1 O (0.77) =1.865 + (0.769) (0.77) = 1.865 + 0.923 = 2.46 10+3 Mo= 2.46 8
∑= f ( Xc − X ) 1
DM =
1
i
N
= 5354 50 = 1.0708
8
∑= f ( Xc− X ) 1
DM =
i 1
N
=
53.4 50
= 1.068
8
S = 2
∑= f ( Xc − X ) 1
i 1
N
=
88.577 49
= 1.808 ≈ 1.79
8
S =
∑= f 1( Xc − X ) i 1
2
= 1.808 = 1.344 ≈ 1.34
N −1
Recorrido intercuantil = P75 –P25 P 75 = Li +
8 f ) i .C 75 N / 100− ( i∑ =1
f percentil
75(50) = 37.5 está en la 4ta clase 100 8
Li
∑ f )i = 29 ;
= 3.41; .41;
i =1
C= 0.77 P75= = 3.41.41 3.41.41 + (37.5 - 29/9) 29/9) (0-77) (0-77) = 3.41 + (8.5/9)(0.7 (8.5/9)(0.77) 7) = 3.41 + 0.7272 P75 = 4,137
49
P 25 = Li +
8 25( 50) / 100− f ) i .C i =1
∑
f percentil
25 (50) = 12.5 está en la 2da CLASE 100 Li= 1.87 ; ( ∑ f )i = 4;
C = 0.77
f percentil percentil = 14 P25= 1.87 + 12.5 –4/14 (0.77) P25 = 1.87 + (8.5/14)(0.77) P25= 1.87 +0.4675 P25= 2.388 Recorrido intercuantil = P75 –P25 P 75 = Li +
8 75 N / 100−( I ∑ F )i =1
f percentil
.C
75(50) = 37.5 está en la 4ta clase. 100 Li = 3.41; (
8
∑ f )i = 29; c = 0.77 i =1
f percentil percentil = 9 P75= 3.41 +¨[37.5 – 29/9 (0.77) = 3.41 3.41 + (8.5/9)(0.77)=3.41 +0.7272 P75= 4.137 P 25 = Li +
25( 50) / 100− ( 8 f ) i .C ∑ i =1 f percentil
25(50) = 12.5 está en la 2da clase P 25 P 25 P 25 P 25
= 1.87 + [12.5 − 4 / 14](0.77) = 1.87 + (8.5 / 14)(0.77) = 1.87 + 0.4675 = 2.338
= 1.8; (∑ f )i = 4; C = 0.77 f percentil = 14
Li
Recorrido intercuatil
= P75 – P25
=4.137 – 2.338 = 1.799 11. FORMA DE DISTRIBUCION DE FRECUENCIA
50
La forma de la distribución sobre unimodales unimodales se refiere a: ( 1) Su simetría o falta de ella (asimetría) y ( 2) la curtosis (la agudeza de su punta). ASIMETRIA. Una distribución tiene asimetría cero si es simétrica a su
media. En una distribución simétrica, la media, media, la mediana mediana y la moda son iguales. X = Md = Mo Una distribución esta segunda positivamente si la cola derecha es más larga que la cola izquierda. Entonces, la media > mediana> moda (veáse la siguiente figura ). SIMÉTRICA
Media = Mediana=Moda
SESGADA POSITIVAMENTE
Moda < Mediana < Media
SESGADA NEGATIVAMENTE NEGATIVAMENTE
Media < Mediana < Moda
La asim asimet etrí ría a (Sk) (Sk) pued puede e medir edirse se por por el coef coefic icie ient nte e de sim simetrí etría a de Pearson
Sk = 3(µ – med) para para poblaci pobl aciones ones
σ Sk = 3(X 3(X – med med)) para para mues muestr tras as.. s La asimetría puede medirse también por el tercer momento respecto a la media y se puede hallar también mediante la siguientes fórmulas:
51
k
Sk =
∑=1 n ( x −
υ
i
)
3
para poblaciones
i
3
σ
k
Sk =
∑= fi ( x− x )
3
para muestras.
i
i 1
s 3
Donde, u3 es el tercer momento central; Si u3< 0, se dice que la negativativamente
distribución
es
asimétrica
Si u3> 0, se dice que la distribución es asimétrica positivamente Si u3= 0, se dice que la distribución es simétrica.
11.1
CURTOSIUS.CURTOSIUS.- la curtosis curtosis estudia la puntiagudez puntiagudez de la
curva
Una curva de punta aguda se llama leptocúrtica. Una curva de punta atacha se llama platircúrtica. Una curva que se encuentra entre la leoptocúrtica y platicúrtica se llama mesocúrtica (ver fig. 3.2). LEPTOCURTICA MESOCURTICA PLATICURTICA
MEDIA
52
La curtosis puede medirse por el cuarto momento respecto a la medi media a divid dividid ido o por por la desvi desviac ació ión n está estánd ndar ar eleva elevada da a la cuart cuarta a potencia. Es fórmulña es: k
Sk =
∑= n ( x−
υ
i
)4
para poblaciones
i 1
4
σ
k
Sk =
∑ fi ( x− x )
4
para muestras.
i
i =1
s 4
Donde, u2 es el cuarto momento central La curtosis curtosis para para una una curva curva leptocú leptocúrtica rtica >3. >3. La curtosis curtosis para para una una curva curva mesocúrtica = 3. La curtosis para para una curva platicúrtica < 3 Coeficiente de Pearson: P = 3( x −5Mdn )
Si P < 0, los datos están sesgados sesgados a la izquierda. Si P > 0, los datos están sesgados a la derecha. Si P = 0, los datos están distribuidos normalmente. TEO TEOREMA REMA
DE
CHEB CHEBYS YSHE HEY: Y:
Afirma
que
al
(observaciones) de un conjunto se encuentra en 1 −
1 k 2
menos
un
dato
, k > 1yK = desviación
típica de la media. Coeficiente de variación: Mide el grado de dispersión de un conjunto
de datos en relación con su media. S CV =
(100) X
Combinación .- Es un conjunto de elementos, en la que la composición
es importante, y no el orden. nCr = n!/ n!/ r! ( n – r) ! Permutación Permutación .- Es un conjunto de elementos, en la que, la composición
y el orden es importante. nPr = n! / (n – r) !
53
riacion iones con rep repetició ición n dan el número de Variación.- Las varia subconjuntos en el cual importa el orden y se admite la repetición. nVr = n r
,
AUTOEVALUACION # 2 Instrucción
Señale Señale con con una (x) la alterna alternativ tiva a verdad verdadera era que correspo corresponde nden n a cada cada pregunta. PARTE A
1. Las medidas de tendencia central son valores: a. Que ocupan el centro de una serie ordenada b. Con Con los los cual cuales es se sepa separa ran n los los dato datoss con con respecto a su media. c. Haci acia los los cuales les tien ienden a acerca rcase o alejarse los demás valores de la serie. d. Que
resultan
de
multiplicar
las
desviaciones para el número de casos. 2. La media media aritmética aritmética es es el valor prome promedio dio que resulta resulta de: a. Mult Multipl iplica icarr la sumat sumator oria ia de valo valore ress por por el número total de casos. b. Dividir Dividir la suma suma de las desviac desviacion iones es para el el número de casos. 54
c. Divid ividiir un conjun junto de valore loress para ara el número total de los mismos. d. Ninguna Ninguna de las proposicione proposicioness anterio anteriors. rs. 3.
La fórm fórmul ula a
X =
∑ fX c N
se la utiliz iliza a para hallar lar la media
aritmética de: a. Una Una serie serie esta estadí dísti stica ca b. Una Una serie serie estadí estadístic stica a de interv intervalo alo c. Una Una serie serie estad estadístic ística a de frecu frecuenc encia ia d. Dato Datoss agr agrup upad ados os.. 4. La media mediana na de la siguien siguiente te serie serie de datos: datos: 19, 15, 18, 18, 16, 17 es: a. 18 b. 17 c. 16 d. Ningun Ninguno o de los valor valores es anterio anteriores. res. 5.
La fórmula Mdn = N 2 se la utiliza para: a. Determ Determinar inar el el valor valor de la medi mediana ana b. Enco Encont ntra rarr el valor valor que que más se repite repite en la serie c. Determ Determinar inar la la posició posición n de la median mediana a d. Enco Encont ntra rarr el valor valor de la media mediana na de una una serie estadística.
6. Señale cual de las las sig siguien iente medidas ind individu iduales les es equivalente a la mediana. a. El perc percen enti till 25 25 b. El segu segund ndo o cua cuarti rtill c. El cuar cuarto to deci decil. l. d. Ningun Ninguna a de las anterio anteriores. res. 7. El modo modo de la siguiente siguiente serie serie estadístic estadística a es: 55
X 145 144 143 142 141
F 12 10 15 14 9
a. 14.5 b. 15 c. 143 d. Ningun Ninguna a de las anterio anteriores res 8. Señale Señale cuàl de de las siguiente siguientess proposicione proposicioness es verdadera. verdadera. 40 A La medi media a geom geomèt ètric rica a es la raíz raíz cuad cuadrad rada a del del prod produc ucto to de los los valores de la variable 41 La media es el valor recìproco de la media aritmètica. 42 El modo es es el valor que se presenta con más más frecuencia. 43 Ninguna Ninguna de las anteriore anteriores. s. 1. La media media geomé geométricaz tricaz se la puede puede aplicar aplicar para: para: a. Hallar Hallar en econo economìa mìa el costo costo prom promedi edio o b. Obtener un promedio exacto de una progresión geométrica c. Para Para calcu calcular lar la la desvia desviació ción n típica típica d. Hallar Hallar prome promedio dioss de velocida velocidades des.. 2. Indentifiq ifiqu ue cuáles les de las las sig siguien ientes medida idas son son de dispersión: a. b. c. d.
INSTRUCCIONES:
Modo Varinz inza Mediana Desvi De sviac ació ión n típi típica ca
PRUEBA DE ENSAYO
Esta prueba consta de cuatro problemas en las cuales es preciso que escribir todo el procedimiento. Serán valores con cuatro puntos, un punto cada problema. 1.- Determine la media aritmética de la siguiente serie estadística. 56
X 66-70 61-65 56-60 51-55 46-50
F 15 20 12 22 10
2.- Si la edad de los profesores de un colegio es: X 26-30 31-35 36-40 41-45 46-50 51-55
F 25 32 24 15 10 8
Calcular la mediana: 3.- Determin rmine e la desviac iación ión media de la sigu iguiente serie estadística: Peso en KG. 60 61 62 63 64 65
F 5 8 12 24 16 4
4.- Determine la desviación típica de la serie que se encuentra registrada en el siguiente cuadro estadística.
16-22 23-29 30-36 37-43 44-50 51-57
EDADES 51-57 44-50 37-43 30-36 23-29 16-252
F 10 14 26 35 21 12 118
57
F 12 21 35 26 14 10 N =118
BIBLIOGRAFIA
ALLE ALLEN N L. WEBS WEBSTE TER. R. Esta Estadí díst stic ica a Apli Aplica cada da para para la Adm Adminis inistr trac ació ión n y Economía, IRWIN, 1999. ALLISON, D. E. 1970 “Test anxiety, stress y intelligence perfomance” Sxiencia, 2, 26 – 27. CONOVER, W. J y otros 1974. “Some reasons for not using the ytes”. DIXON, W. J. Y F. J. Masser, 1980. Introduction to statical Analysis (4ta. Ed.) Nueva York: McGrawHill.
58
FREN FRENCH CH,, J. W. 1946 1946 “Efe “Efect ctss of anxi anxiet ety y on verb verbll and and mathe athem matic atical al examination scores”, Educational and Bychological Mea surement, 22, 553 – 564. BURSTEIN, H. 1971. Ttribute Sampling: Tables and Ex Planations o Tubles for for De Dete term rmin inig ig conf confid iden ence ce limi limits ts and and smpl smple e size sizess base based d on clos close e aproximations of the binomial distribution. KENNETH D. HOPKINS y B.R. HOPKINS. Estadística Básica. México 1997 Ingramex. GEORGE CANAYOS . Probabilidades y Estadística. México 1992. McGrawHill.
59