REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DE EDUCACIÓN SUPERIOR
UNIDADES CURRICULARES ESPECIALIZADAS
ESTADÍSTICA I
Primer Trayecto –
Tercer Trimestre horas
Trabajo Acompañado Trabajo Independiente Horas por semana Total horas en el período
Material elaborado por: Márquez Zambrano, Luisa
“1805 -2005 Bicentenario del Juramento del Libertador Simón Bolívar en el Monte Sacro”
ii
Índice pp.
Índice
ii
ObjetivoyContenidosdelaUnidadCurricular InstruccioneG senerales
iv vi
Introducción
vii
Unidad1.AspectosGeneralesdelaEstadística 1 ▪ Concepto, objeto y rama de la estadística. Síntesis histórica. 1 ▪ Tipos de estadística 4 ▪ Universo,poblaciónyvariable 5 ▪ Concepto de medición. Niveles y Escalas de medida. ▪ Clasificacióndelasescalasdemedida. 8 ▪ Tiposdeinvestigaciónestadística. 11 ▪ Importancia de la estadística en las ciencias administrativas y económicas 12 Unidad 2. Obtención, Ordenamiento y Representación de Datos Estadísticos ▪ Fuentes y métodos de recolección de datos. Ventajas limitaciones. y ▪ Preparacióndedatosestadísticos. ▪ Razones,proporcionesyporcentajes. ▪ Distribucióndefrecuencias. ▪ Presentación de los datos estadísticos mediante gráficos. Tipos,normasyelementos. Unidad 3 . Medidas E stadísticas d e P osición C entral y No C entral ▪ Medidas de tendencia central para datos simples Media aritmética. Media ponderada. Media geométrica. Mediana y moda. ▪ Medidas de tendencia central para datos simples Media aritmética. Mediana. Moda. Media geométrica. ▪ Medidas de tendencia no central Percentiles, cuartiles y deciles.
ESTADÍSTICA I
15 15 18 18 20 21
25 25 26 27 28 30 31 32 33 33
iii
Unidad4.MedidasdeDispersiónoVariablidad ▪ La dispersión. ▪ Medidas de dispersión absolutas Rango recorrido o Desviación media Varianza y desviación típica ▪ Medidas de dispersión relativas. Coeficientedevariación
ESTADÍSTICA I
40 40 42 42 44
iv
Objetivos y Contenidos de la Unidad Curricular Estadística I El presente curso se estructura en cuatro unidades, las cuales permitirán analizar de forma estadísticas los datos de tus actividades empresariales con el propósito de lograr una toma de decisiones eficientes, es decir, que te permitan realizar evalúo económico y social de las actividades que realices dentro de la organización en la cual te desempeñas. Cada una de las unidades programáticas de este material contempla la presentación teórica de los contenidos. A continuación se presentan el objetivo general de la unidad curricular y los contenidos de la misma.
Objetivo General: 1. Analizar los datos estadísticos para la toma de decisiones apropiadas en el diagnóstico, planificación e interpretación de los procesos inherentes a la administración.
Contenidos: UNIDAD 1. ASPECTOS GENERALES DELA ESTADÍSTICA
▪ Concepto, objeto y rama de la estadística. Síntesis histórica. ▪ El dato estadístico: cuantitativo y cualitativo. Universo, población y variable
▪ Concepto de medición. Niveles y Escalas de medida. Clasificación de las escalas de medida
▪ Importancia de la estadística en las ciencias administrativas y económicas.
▪ Tipos de investigación estadística. UNIDAD 2. OBTENCIÓN, ORDENAMIENTO YREPRESENTACIÓN DE DATOS ESTADÍSTICOS
▪ Fuentes y métodos de recolección de datos. Ventajas y limitaciones. ▪ Preparación de datos estadísticos.
ESTADÍSTICA I
v ▪ Presentación de los datos estadísticos mediante tablas y gráficos. Tipos, normas y elementos. ▪ Análisis de los datos estadísticos. Razones, proporciones y porcentajes. ▪ Distribución de frecuencias. ▪ Lectura e interpretación de tablas y gráficos. UNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRAL.
▪ Media aritmética. Concepto, propiedades y cálculo para datos simples y distribuciones de frecuencia. ▪ Media ponderada. Concepto, propiedades y cálculo para datos simples y distribuciones de frecuencia. Concepto, propiedades y cálculo para datos simples y distribuciones de frecuencia. ▪ Media geométrica. Concepto y propiedades para datos simples y distribuciones de frecuencia. ▪ Mediana y moda. Concepto y propiedades para datos simples y distribuciones de frecuencia. ▪ Percentiles, cuartiles y deciles. Concepto y propiedades para datos simples y distribuciones de frecuencia. UNIDAD 4. MEDIDAS DE DISPERSIÓN O VARIABILIDAD.
▪ La dispersión. Estadísticos de dispersión. Medidas absolutas y medidas relativas. Fuentes y métodos de recolección de datos. Ventajas y limitaciones. ▪ Recorrido: concepto características y formas de cálculo. ▪ Desviación media. Concepto, características y formas de cálculo. ▪ Varianza y desviación típica. Concepto, características y formas de cálculo. ▪ Coeficiente de variación. Concepto, características y formas de cálculo.
ESTADÍSTICA I
vi
INSTRUCCIONES GENERALES
Este material estará conformado por aspectos teóricos y prácticos, esto significa que aquí encontrarás los planteamientos fundamentales de cada contenido, con ejemplos y algunas propuestas de ejercitación. También contarás con elementos de ayuda que te brindarán información resaltante del contenido estudiado, estos mensajes están resaltados de diferentes formas, a continuación se te presentan sus significados:
Los recuadros rellenos y sombreados indican la exposición de una definición.
La presentación de notas, datos curiosos o resúmenes se realizarán por medio de cuadros de texto con borde irregular Los cambios de letra indican la introducción de un ejemplo Los recuadros de doble línea presentan interrogantes con las que haremos reflexiones sobre el contenido que se está trabajando.
Adelante la estadística de espera… y recuerda:
“Sólo en el diccionario el éxito está antes que el trabajo.” Profesor Luis Huguet
ESTADÍSTICA I
vii
ESTADÍSTICA I
viii
Introducción Lind, Mason y Marchal (2001) en su libro “Estadística para administración y contaduría” hacen referencia a una cita de H.C.Well, un escritor e historiador inglés, quien dijo hace más de 100 años que
“para ser un buen ciudadano, el
pensamiento estadístico sería un día tan importante como saber leer” . Estos
mismos autores afirman que Well no mencionó los negocios porque apenas comenzaba la revolución francesa, sin embargo, aseguran que si ese escritor tuviera hoy la posibilidad de hacer un comentario sobre las estadísticas seguramente diría que “el pensamiento estadístico es necesario no sólo para ser un buen ciudadano, sino también para la toma de decisiones acertadas en los negocios”. La estadística la aprendemos desde la educación básica, no obstante, pareciera que no encontráramos el valor y la utilidad que ella tiene en la vida diaria. Aun en las circunstancias más comunes de nuestro día a día empleamos estadística para la toma de decisiones, por ejemplo, cada vez que vamos a bañarnos si disponemos de un calentador de agua abrimos el chorro durante un rato hasta que comienza a salir el agua caliente, metemos la mano, probamos la temperatura, decidimos si se agrega más agua fría o no y cuando consideramos que la temperatura es adecuada decidimos entrar a la regadera. En este caso tomamos una decisión basándonos en una muestra, esta cotidianidad es una de las técnicas empleadas por la estadística. Estadística es el conjunto de técnicas que se emplean para la recolección, organización, análisis e interpretación de datos, los resultados del análisis y la interpretación nos permiten predecir determinados acontecimientos que nos pueden favorecer en la administración de una empresa. Por ello la importancia de esta unidad curricular dentro del plan de formación “Administración y Gestión” la cual te brindará herramientas para toma de decisiones acertadas en los diferentes procesos administrativos.
ESTADÍSTICA I
UNIDAD I ASPECTOS GENERALES DE LA ESTADÍSTICA
¡Comencemos nuestro recorrido! En este apartado encontrarás… Contenidos de la primera unidad
Ejemplos
Ejercicios propuestos
ESTADÍSTICA I
2
UNIDAD I. ASPECTOS GENERALE S DE LA ESTADÍSTICA. ESTADÍSTICA. GENERALES
Síntesis Histórica Las inquietudes estadísticas se remontan a la antigüedad, pero el contenido de las mismas ha variado notablemente a través del tiempo. Desde el cuarto milenio a.C. los chinos realizaban censos de población y utilizaban tablas de estadística aplicadas a los problemas agrícolas. Los egipcios, los griegos y los romanos también realizaron múltiples investigaciones recurriendo a la estadística como herramienta. Indudablemente, en esa época no se conocía la palabra estadística y nadie pensaba en promover leyes de comportamiento de los datos recogidos con mayor o menor exactitud, pero se conocían los procesos censales y catastrales que ayudaban a describir situaciones reales. Las primeras tentativas para sistematizar los conocimientos surgen en Alemania en el Siglo XVII, mientras que en Inglaterra se logra un nuevo progreso al superar la fase meramente descriptiva y comenzar a utilizar los datos con fines predictivos. Más tarde, a partir del análisis de los juegos de azar, el cálculo de las probabilidades se incorpora como un instrumento extremadamente poderoso para el estudio de fenómenos cuyas causas son demasiado complejas para conocerlas totalmente y poder analizarlas sin su uso. A partir de comienzos del Siglo XX, la estadística logra su expansión definitiva desarrollando su aplicación en todas las ramas del saber. La biología, la meteorología, investigación agronómica, la demografía, sociología y muchas otrasla ciencias han sido transformadas mediantelaelpsicología, empleo dela métodos estadísticos. Esta invasión de la estadística en todos los dominios de la investigación pura o aplicada permite que los métodos estadísticos se desarrollen permanentemente para dar respuesta a los distintos problemas a resolver.
Definición y Objeto de la Estadística La Estadística tiene por objeto la recolección, presentación, análisis e interpretación de observaciones o mediciones hechas sobre un conjunto de objetos, personas, procesos, fenómenos, etc. Comúnmente es considerada como una colección de hechos numéricos expresados en términos de una relación, y que han sido recopilados a partir de otros datos numéricos. A continuación se te presenta un cuadro con definiciones de estadística planteadas por diferentes autores en diferentes años:
ESTADÍSTICA I
3
Autor
Gini, 1953
Yale y Kendal, 1954
Kendall y Buckland ,1980
Murria R. Spiegel, 1991
Lind, Mason y Marchal, 2001
Definición
La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos Un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra. La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis La ciencia de reunir, organizar, presentar, analizar e interpretar datos para ayudar a tomar las mejores decisiones
¿Consideras que ha habido una diferencia u avance notorio a través de los años en las definiciones de estadística presentadas en el cuadro anterior?
Quizás el hecho más curioso que resalta de las definiciones anteriores es: ¿La estadística es una ciencia o una técnica? En la actualidad se considera como un poderoso auxiliar en la investigación. Por ello estudiaremos la estadística como un conjunto de métodos que nos permiten evaluar datos cualitativos y cuantitativos. Entendiendo por dato cuantitativo a aquel que está expresado de forma numérica, por ejemplo: la edad, el peso, las calificaciones, etc. Mientras los datos cualitativos reflejan, como su nombre lo indica, cualidades, características del objeto que se analiza por ejemplo: Categori zar las los niveles de inasistencias de un trabajador en muchas o pocas, la estatura bajo,regular mediano o alto, opinar sobre un producto calificándolo de muy bueno, en bueno, o deficiente, etc.
ESTADÍSTICA I
4
Tipos de Estadística Dos corrientes de influencia han conducido al desarrollo de los métodos estadísticos. Una de ellas, tenía por objeto mantener en orden registros del gobierno (de hecho, estado y estadística vienen de la misma raíz latina,status). De ella evolucionaron las actividades de conteo, medición, descripción, tabulación, ordenamiento y levantamiento censal, que conforman lo que hoy conocemos como estadística descriptiva. La segunda corriente de influencia se srcinó en las matemáticas de los juegos de azar y condujo al desarrollo de la estadística inferencial o inductiva, basada fundamentalmente en el concepto de probabilidad matemática.
Estadística Descriptiva: La estadística descriptiva esta dedicada a descubrir las regularidades o características existentes en un conjunto de datos mediante la utilización de gráficos y de medidas numéricas de resumen. En otras palabras, resume y transforma datos para poder interpretar la información. A través de la cuantificación y ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial).
Estadística Descriptiva: Métodos para organizar, resumir y presentar datos de manera informativa
Estadística Inductiva o Inferencial: Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística. En resumen, son procedimientos estadísticos que se utilizan para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos. La Estadística
ESTADÍSTICA I
5
inferencial permite, mediante la utilización de métodos estadísticos basados en la teoría de las probabilidades, generalizar las conclusiones obtenidas a partir de una muestra a la población de la que ha sido extraída. Es importante destacar que para que las conclusiones sean válidas, se debe tratar que la muestra sea representativa de la población.
Estadística Inferencial: Métodos usados para determinar algo acerca de la población basándose en una muestra. Leamos el siguiente ejemplo Imaginemos que nuestro profesor de estadística I calcula la calificación promedio de nuestro grupo en primera unidad. Como está empleando la estadística para describir el desempeño sin generalizar estos resultados hacia otros grupos de Estadística I el profesor está utilizando estadística descriptiva, con graficas, tablas y diagramas muestra los datos de manera que sea más fácil su entendimiento. Supongamos ahora que el mismo profesor decide utilizar el promedio de calificaciones obtenidas por nosotros en la primera unidad para estimar la calificación promedio que obtendremos en el resto de las unidades de esta asignatura. El proceso de estimación de tal promedio sería un problema concerniente a la estadística inferencial.
Universo, Población y Variable La estadística está compuesta por métodos científicos mediante los cuales podemos recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en dichos análisis. En cualquier trabajo en el que se aplique, la estadística debe hacer referencia a un conjunto de sujetos u objetos de análisis, conocido como población.
Población o Universo: Es el conjunto de entidades u objetos que satisfacen una definición común y en los que interesamucho analizar una o varias Aquí el término población tiene un significado más amplio quecaracterísticas. el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo.
ESTADÍSTICA I
6
Una población se precisa como un conjunto finito o infinito de personas que presentan características comunes, por lo que debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias, debemos especificar cuáles y cuándo, por ejemplo: Escuelas primarias de Caracas, año 1995. El tamaño de una población viene dado por la cantidad de elementos que la componen. se simboliza con la letray N, en el caso que sea unaGeneralmente población finita, es decir, esta que información podemos contabilizar establecer unen límite de existencia. Población: Es la recolección completa de todas las observaciones de interés ara el investi ador.
Muestra: Es un subconjunto de unidades de análisis de una población dada, destinado a suministrar información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los elementos. Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que se defina tenga tamaño infinito (incontable), y en consecuencia, no fuera posibleexhaustiva observar apuede todosser susmuy elementos. otras ocasiones, costo de lade observación elevado,En el extenso tiempo deelrecolección la información, o más aún, la observación de los elementos puede ser destructiva. En todos estos casos, la única manera de estudiar la población es obteniendo muestras de ella. El tamaño de la muestra queda determinado por el número de elementos que la forman y se simboliza con la letra n.
Muestra: Es una parte representati va de la población que se estudia y se toma cuando la población es demasiado grande como
Ejemplo: Si necesitamos conocer la cantidad de personas entre 20 y 30 años que pertenecen a cooperativas en Venezuela, todas las personas que posean estas características ( tener entre 20 y 30 años y trabajar en una cooperativa) serán nuestra población, seguramente va a ser difícil buscar todas las cooperativas de todo el país para conocer este dato, una forma de hacer la investigación es seleccionando un grupo de estados del país, podría ser uno de cada región y visitando sus ESTADÍSTICA I
7 cooperativas, para obtener la información, en este caso obtendremos una muestra, en la cual encontraremos personas de todas las edades, pero estos datos nos permitirán predecir de acuerdo a la cantidad de jóvenes en estos estados la proporción de jóvenes que habrán en todas las cooperativas del país. Observemos que este es una cose de estadística inferencial.
Variables: Una variable es la característica de un objeto, persona o situación que es capaz modificarse en extensión y naturaleza, es decir, es unaconsecuenc característica que para varía de un objeto a otro que no permanece constante y como ia sirve singularizar un objeto o grupo de ellos. Debemos tener claro que a variable no es el objeto de estudio en sí, sino sus características, por ejemplo si estuviéramos analizando un local para alquilar el local no es variable, variables son sus atributos: ubicación, tamaño, iluminación, ventilación, etc. Podemos encontrar dos tipos de datos: Cualitativos y cuantitativos. Variables Cualitativas:
Llamamos variable cualitativa a aquella no o puede ser expresada de forma numérica, por ejemplo la religión, podemos decir que somos católicos, judíos, protestantes, evangélicos, etc. Observemos que este es un dato que varía de un individuo a otro pero no puede ser expresado de forma numérica. Variables Cuantitativas: Es aquella variable que puede ser expresada de forma
numérica, por ejemplo el número de hijos por familia. Estas variables se dividen en dos grupos: variables continuas y discretas. Variable Discreta:
Es aquella que solo puede asumir ciertos valores, y ente éstos suele haber huecos, generalmente se expresan en números enteros, por ejemplo, cantidad de miembros de una cooperativa, podemos decir que está conformada por doce, trece personas, pero nunca podremos decir que nuestra cooperativa está conformada por 20,5 personas. Apreciemos el siguiente ejemplo: Una variable discreta puede ser la cantidad de lapiceros que tenemos disponibles en nuestro inventario, si contamos podemos decir que tenemos 96 bolígrafos, el dato en este caso se expresa evitando los rangos entre los valores, es decir, no podíamos decir que tenemos 95,2 lapiceros o 96,1. En este tipo de casos se expresa el dato en un número entero. Variables Continuas:
Es aquella que puede adoptar cualquier valor dentro de un rango específico , por ejemplo, la duración de un viaje en carro de Caracas a Maracay, algunas veces
ESTADÍSTICA I
8
puede durar una hora y cuarenta y cinco minutos o dos horas, etc. Otro ejemplo de variable continua el promedio de las calificaciones de un estudiante en cada lapso. Veamos este otro ejemplo: Una variable continua es nuestra temperatura corporal, cuando tenemos fiebre nos tomamos la temperatura, la medida puede ir desde los 36 grados hasta los 41, pero incluyendo los números decimales, por ejemplo 36;36,1;36,2; …37;37,1…38;38,1…39,9;40…;40,5 etc.
El peso de las verduras que ascendente compramos operiódicamente es una variable continua, pues puede variar de forma descendente incluyendo los decimales, no hay vacíos entre los rangos, todos son continuos, de allí el nombre de la variable. Como resumen…
Datos Cuantitativos o numéricos
Cualitativos o atributos
Discretos
Continuos
Concepto de Medición. Niveles de Medición de las Variables Medición Medición es la cuantificación del atributo de una variable, ¿Qué quiere decir esto? Cuando medimos hacemos una estimación numérica de un objeto, pero no del objeto en sí, medimos los indicadores de sus atributos, para ello contamos con cuatro niveles de medición
Niveles de Medición Los datos se pueden clasificar de acuerdo a cuatro niveles de medición. Los niveles de medición indican que tipo de operación se puede hacer con los datos para resumirlos, presentarlos y determinar que pruebas estadísticas pueden llevarse a cabo con ellos. Existen cuatro niveles de medición: Nominal, ordinal, de intervalo y de razón, estos niveles tienen un orden ascendente el más bajo de la escala es el nominal y el más alto el de razón.
ESTADÍSTICA I
9
Medición Nominal
En el este tipo de medición los objetos sólo pueden ser nombrados o contados. No hay un orden, consiste simplemente en clasificar observaciones dentro de ciertas categorías, las cuales deben ser mutuamente excluyentes y colectivamente exhaustivas. Mutuamente excluyentes significa que un individuo, objeto o medición pertenece únicamente a una categoría, y exhaustiva significa que ningún individuo, objeto o medición puede quedar sin categorías por ejemplo: En un nivel de medición ordinal, una categoría que podríamos establecer es el sexo, clasificado en hombre y mujer, por lo que los individuos que observamos sólo pueden pertenecen a un grupo. Si estuviéramos realizando una observación de la imagen de la izquierda diríamos: Hay un hombre y una mujer.
En la medición nominal un mismo objeto de análisis no pueden estar en dos categorías, pero todos tienen que estar en una, no puede haber observación fuera de una categoría. Para que no se nos olvide esta propiedad de la medición nominal atendamos el siguiente ejemplo: En un aula de clases vamos a clasificar las personas por lugar de nacimiento, una misma persona no puede haber nacido en dos lugares, pero tampoco se puede decir que no nació en ningún lado, por lo tanto, todos tenemos que estar en una sola categoría .
Medición Ordinal
El siguiente nivel es el ordinal, en este caso las observaciones además de poder ser clasificadas en categorías, también pueden ser ordenadas por rango, de manera creciente o decreciente. Esto significa que una primera observación puede ser mayor que la segunda, y esta a su vez mayor que la tercera, y así sucesivamente. Sin embargo esto no implica una secuencia de intervalos iguales, atendamos al siguiente ejemplo: Vamos a comprar un vehículo para transportar nuestra mercancía, tenemos tres opciones y los agrupamos de acuerdo a su kilometraje, el primero tiene 25.000Km, el segundo 34.000Km y el último 35.500km, observemos que ordenamos las opciones de menor a mayor según la cantidad de kilómetros, por ello lo “ordinal”, pero hay que resaltar que los intervalos que los separa, o sea la cantidad de kilómetros entre cada carro son diferentes, de 25.000 a 34.000 hay 9 kilómetros de diferencia, mientras que de 34.000 a 35.500 tan sólo hay kilómetro y medio. En la escala ordinal esto no importa. Medición de Intervalo
ESTADÍSTICA I
10
La medición de intervalo posee las características de la ordinal con la salvedad que aquí la distancia entre los rangos son equivalent es, esto quiere decir que los intervalos pueden ser sumados y restados. Por ejemplo, supongamos que hemos medido cuatro calificaciones con una escala de intervalo las cuales son 10,8,7 y 5. Con estos datos podemos afirmar que la diferencia entre el primero y el tercero es equivalente a la diferencia entre el segundo y el cuarto, observemos: 10-7=3, 85=3, sin embargo no podemos decir que el que sacó 8 tuvo el doble del que sacó cinco, a pesar que la diferencia entre los que sacaron 10 y 7, es igual a la diferencia de los que sacaron 8 y 5 Otra característica resaltante de la medición intervalos es que que medimos este tipo de variables no tiene cero absoluto, esto significaporque el atributo no tiene ausencia. Retomemos el ejemplo de la medición de la temperatura corporal, si empleamos un termómetro y nos tomamos la temperatura podemos decir que tenemos fiebre o no pero, pero el hecho de no tener fiebre no significa que tengamos cero temperatura, por lo tanto aquí el cero (0) es relativo. Otro caso en el que el cero es relativo es el número de calzado, no hay calzado número 0. Si medimos el calzado en medición de intervalo diríamos, en una casa hay cinco miembros familiares que calzan 15, 24, 25, 36 y 48. 25 28 31 37 43 a
b
c
d
e
La diferencia entre a y c= 6, entre b y d= 3 entre c y d=6 entre d y e=6, observemos que podemos la distancia entre equivalente a la de dmás y e, c, c y d sone es pero no por ello decir quea lay persona tiene el pie tres veces grande que la persona b. Medición de Razón
Es el nivel más alto de medición, ella posee todas las características de las escalas anteriores, con la diferencia de que aquí el cero si es absoluto, es decir, la presencia del cero indica la ausencia del atributo observado. Un buen ejemplo de un cero absoluto es la velocidad, si detenemos un vehículo la velocidad es cero, porque hay ausencia de velocidad. Pero a medida que comenzamos a acelerar el vehículo podemos decir que si vamos a 30 kilómetros recorreremos la mitad del camino que un carro que va a 60. En la medición de razón la distancia entre los rangos son exactamente iguales. Veamos otro ejemplo: Las medidas de la regla, el cero indica la ausencia de medida, pero la distancia del 0 al 1, ó del 1 al 2 es la misma que la del 2 al 3 ó la del 3 al 4, y así sucesivamente, entre cada rango hay la misma diferencia.
Tipo de Investigación Estadística
ESTADÍSTICA I
11
Cuando aplicamos los métodos estadísticos para el estudio de un fenómeno se denomina investigación estadística, estos tipos son: La investigación Directa y la investigación indirecta
Investigación Directa Es aquella en la que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos srcinales, por esto se llama también investigación primaria. La mayoría de las investigaciones de carácter oficial, demográficas, económicas o sociales son directas. La investigación deirecta se divide en: exhaustiva o completa, y parcial o incompleta. Son exhaustivas, aquell as en la que se estudian todos los elementos que integran el universo, todas sus características o las necesarias para describir totalmente la población estudiada. Son investigaciones parciales o incompletas, cuando tan solo se estudia un número limitado de los casos individuales que forman el universo o cuando se estudian algunas manifestaciones del fenómeno que no lo describen totalmente; se utiliza este tipo de investigación cuando es imposible el estudio del fenómeno representativa y no de forma completa. Este tipo de investigación puede ser representativa, estamos en el primer caso cuando las manifestaciones del fenómeno estudiado son suficientes y necesarias para describir el fenómeno; en caso contrario, caemos dentro de la no representativas.
Investigaciones Indirectas Son aquellas en las que el investigador se vale de informaciones indirectas, de resultados o cálculos de investigaciones anteriores o en base de los conocimientos que tenga el investigador del fenómeno por experiencias anteriores. Se dividen estas investigaciones en conjeturales (estimaciones) y secundarias. La investigación conjetural es aquella en base a conocimientos parciales, opiniones o cálculos, proporciona resultados primarios de valor práctico. Este tipo de investigación puede tener el inconveniente de que, dado el carácter subjetivo de estos conocimientos y opiniones, se pueden obtener resultados diferentes utilizando varios investigadores para el estudio de un mismo fenómeno. La investigación secundaria es aquella que se efectúa por reagrupaciones o reelaboraciones de resultados de otras investigaciones; tiene a su favor este tipo de investigación, que el costo y trabajo queda notablemente reducido. La investigación indirecta conjetural puede ser: por aproximación, por analogía y por proporción. Por proporción, es la que basada en el convencimiento que sobre el fenómeno tiene el investigador, ya sea por experiencia o por resultado anteriormente obtenido. Los datos que se obtienen en esta investigación serán siempre aproximados al aplicarlos al fenómeno que estudia, pero sirven para tener una idea general del mismo. ESTADÍSTICA I
12
Por analogía, son aquellas basadas en el estudio de uno o varios fenómenos que guardan cierta semejanza con el fenómeno a investigar, determinándose ciertas modalidades y características de dicho fenómeno, por procedimientos inductivos. El método inductivo se basa en la acumulación de datos cuya tendencia nos permite generalizar el comportamiento de los sistemas en estudio. La veracidad de sus conclusiones se ven reafirmadas con la generación de más y más datos que apunten en la misma dirección. La investigación conjetural por proporción, puede hacerse de parte a todo un hecho a otro; en el primer caso, se observa una parte de fenómeno y sin mayor rigor aplica a todo el fenómeno; en el caso de un hecho a otro, relacionan dos o más hechos y a través del conocimiento de uno de ellos se determinan las modalidades de otros.
Importancia de la Estadística en Administración Si te has preguntado por qué un administrador debe saber sobre técnicas estadísticas, te presentamos dos razones: Tomar decisiones La estadística te permite Solucionar problemas Los hombres y mujeres que se dedican a las actividades comerciales están en una constante búsqueda de ganancias o excedentes que le permitan crecer o ampliarse en su área, la mayoría de ellos consideran que la estadística es fundamental para el proceso de toma de decisiones, ¿Por qué?, porque permite inferir cómo afectarán las posibles opciones de inversión. De igual forma, la estadística ayuda a tomar decisiones para solucionar problemas que se suscitan en el camino del desarrollo productivo. Recordemos que el desempeño laboral como administrador exigirá el análisis de múltiples datos, los que debemos manejar de forma útil para la organización, es decir, analizando los riesgos y las oportunidades que representan.
ESTADÍSTICA I
13
Ejercicios Unidad 1 1) Escribe cinco ejemplos de datos cuantitativos y cinco de datos cualitativos. 2) Realiza un ejemplo de una mu estra de una población cualquiera. 3) Determina cual de los siguientes puntos es una población o una muestra: a) Los estudiantes de sexto grado de Venezuela b) Los estudiantes de Misión Sucre región Caracas. c) Todas las familias con mascotas de un municipio. d) Los reportes de un día sobre la actividades realizadas en un liceo. 4) Clasifica en cual itativa y cuanti tativas las sigui entes variables: a) b) c) d)
Los literales de calificación en la escuela básica (A,B,C,D y E) Cantidad de pacientes atendidos por Barrio Adentro. El color de cabello de las personas de una comunidad. Cantidad de hijos de nuestros vecinos.
5) Clasifica las siguientes variables como continuas o discretas a) Número de camisas producidas por una cooperativa b) Las horas de un día c) Cantidad de estudiantes de nuestra comunidad d) Kilos de pollo vendidos en Mercal 6) Cuál es el nivel de medición de las siguientes variables: a) Una clasificación de los estudiantes de la zona en la que viven. b) Calificaciones de los estudiantes en la primera prueba de estadística c) Temas de los discursos del presidente Chávez d) El número de horas por semana que estudia un alumnos de Misión Sucre e) El año de fabri cación del trans porte público que cubr e la ruta de nuestro vecindario f) Los periódicos vendidos cada domingo. g) Grupos de estudiantes según su edad.
ESTADÍSTICA I
14
UNIDAD II OBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOS ESTADÍSTICOS
¡Excelente! ya hemos llegado a la segunda unidad, sigamos avanzando. En este apartado encontrarás:
Contenidos de la segunda unidad Ejemplos Ejercicios propuestos
ESTADÍSTICA I
15
partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los demás.
UNIDAD 2. OBTENCIÓN, ORDENAMIENTO Y REPRESENTACIÓN DE DATOS ESTADÍSTICOS.
Fuentes y Métodos Recolección de Datos
de
Fuentes de Datos El lugar del cual obtenemos los datos para realizar nuestros análisis estadísticos se denomina fuente. Los datos que requerimos para realizar una evaluación estadística de los procesos administrativos los podemos encontrar por medio de diversas fuentes las cuales pueden ser; primarias o secundarias, u oficiales o privadas. Llamamos fuentes primarias la persona o institución que ha recolectado los datos, y secundaria si la persona o institución que ha publicado los datos no fue la que efectuó la investigación.
Datos Primarios: son aquellos que el investigador obtiene directamente de la realidad, recolectándolos con sus propios instrumentos. Datos Secundarios: son registros escritos que proceden de un contacto con la práctica, pero que ya han sido elegidos y procesados por otros
Los datos primarios y secundarios no son dos clases esencialmente diferentes de información, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orígenes, y todo dato primario, a
Los datos oficiales son todos aquellos que hayamos en dependencias gubernamentales, y por el contrario los datos emitidos por entes no gubernamentales los denominamos privados. Técnicas de Recolección de Datos Existen diversas técnicas de recolección de datos, aquí mencionaremos las más comunes o las más empleadas. La Observación
Consiste en el uso sistemático de nuestros sentidos para captar la realidad que queremos estudiar. Es una técnica antigua, a través de sus sentidos, hombreque capta la realidad que loel rodea, luego organiza intelectualmente. El uso de nuestros sentidos es una fuente inagotable de datos que, tanto para la actividad científica como para la vida práctica resulta de inestimable valor.
Observación: Es el registro visual de lo ocurre es una situacional real, clasificando los acontecimientos de acuerdo con algún esquema pre estructurado y La observación es un proceso cotidiano para nosotros, es parte de nuestra experiencia de vida, pero nuestras observaciones diarias al no estar orientadas a un propósito determinado carecen de controles ESTADÍSTICA I
16
que nos alejen de los errores. Para realizar un proceso de observación con el propósito de recabar datos debemos seguir algunos principios básicos: Debe tener un propósito específico. Debe ser planeada cuidadosa y sistemáticamente. Debe llevarse, por escrito o de
espontaneidad y por tanto alterando la confiabilidad de los datos. La Entrevista.
La entrevista es una técnica en la cual es investigador, de acuerdo a la información que necesita recolectar elabora una serie de preguntas que
forma audiovisual, cuidadoso de la misma.un control Debe especificarse su duración y frecuencia. Debe seguir los principios básicos de validez y confiabilidad.
más tarde realiza se convertirá en asula persona fuente. que Las entrevistas la mayoría de las veces se realizan en persona, es decir, visitando al entrevistado y registrando la información ofrecida, ya sea con un grabador o por escrito.
La principal ventaja de esta técnica es que los hechos son percibidos directamente, sin ninguna clase de intermediación, colocándonos ante una situación tal como ésta se da naturalmente. De este modo, nunca obtendremos distorsiones de la realidad, las cuales solemos tener al emplear una entrevista, ya que en
Como técnica de recolección de datos la entrevista tiene muchas ventajas; es aplicable a toda persona, siendo muy útil con los analfabetos, los niños o con aquellos que tienen limitación física u orgánica que les dificulte proporcionar una respuesta escrita. Se le puede explicar al
ellas entrevistados colocan su toque lospersonal al brindar la información. Otra ventaja es que la conducta se describe en el momento exacto en que está ocurriendo. Además, las observaciones se pueden realizar independientemente de que las personas estén dispuestas a cooperar o no, a diferencia de otros métodos en los que sí necesitamos de la cooperación de las personas para obtener la información deseada. Su principal desventaja reside en que la presencia del observador puede generar alteración modificación en la una conducta de o los objetos observados, destruyendo la
entrevistado con los quédatos propósito estamos recogiendo y esta ayuda a que éste dirija mejor sus respuestas. A pesar de todas sus bondades la entrevista también posee algunas desventajas o limitaciones: Requiere una mayor inversión de tiempo para recoger la información, como las respuestas pueden ser totalmente abiertas se puede dificultar el análisis de los datos y requiere de mucha astucia para obtener los datos que se desean canalizando las respuestas del entrevistado aun cuando éste se desoriente. El Cuestionario
Es el método que utiliza un instrumento ESTADÍSTICA I
17
impreso. Como en el caso de la entrevista, hay preguntas pero todas están formuladas en un papel, ellas están destinadas a obtener repuestas sobre el problema en estudio y son dadas por consultado a través de un proceso de escritura, sin embargo, el cuestionario puede ser llenado por el encuestado o con ayuda de un empadronador.
recomienda cuando se use está técnica se escoja una muestra más grande de sujetos de estudio.
El cuestionario puede aplicarse a grupos o individuos estando presente el responsable de recoger la información o no; puede enviarse por diversos medios a los seleccionados en la muestra. También puede contratarse a una persona que cumpla que aplique el cuestionario, en estos casos se suele llamar cédula de entrevista. Un ejemplo de esta aplicación son los empadronadores de los censos de población, recordemos que ellos traen el cuestionario con sus preguntas y sus respuestas, la función que cumplen
mucha información, pero requierey más tiempo por parte del informante es más difícil de analizar por parte responsable de recoger los datos.
es leer cada pregunta la respuesta dada por ely marcar encuestado. Las ventajas de esta administración es que no quedarán preguntas en blanco y también que puede ser aplicada a analfabetos, niños o personas con alguna discapacidad.
Mixtos : poseen ambosCuestionarios tipos de preguntas abiertas y cerradas, por ello el nombre de “mixtos”.
Cuando la aplicación cuestionario queda en manos de los encuestados se pueden presentar problemas relacionados con la cantidad y calidad de datos que pretende obtener para el estudio. Estos problemas que a su vez se convierten en desventaja son: que el cuestionario no fuese devuelto; que los consultados evadan la respuesta a alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Debido a esa posible pérdida de información se
Existen tres tipos de cuestionarios: Cuestionarios Abiertos. Son en los que se pregunta al sujeto algo y se le deja en libertad de responder como quiera. Este tipo de cuestionario es muy útil y proporciona
Cuestionarios Cerrados . Están estructurados de tal manera que al informante se le ofrecen sólo determinadas opciones de respuesta, y debe seleccionar una de ellas. Este cuestionario es más fácil de codificar y contestar. Como desventaja, es que al ofrecerle categorías al informante se le están "sugiriendo" las respuestas.
La mayoría de los cuestionarios poseen la siguiente estructura: Titulo Instrucciones Identificación del encuestado (la identificación no hace referencia al nombre, en muchos estudios las respuestas anónimas suelen ser más objetivas, pero si vamos a aplicar el cuestionario a una población diversa podemos
identificarlos por edad, profesión, etc.) Preguntas Observaciones
ESTADÍSTICA I
18
En general, en el proceso de recolección de datos los métodos e instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus características propias y la información que se requiera, sin embargo dan flexibilidad para que el investigador determine su uso apropiado según el estudio a realizar.
Preparación de los Datos Estadísticos. Una vez recogidos los datos pasamos a su preparación para iniciar el estudio, para poder lograr el análisis estadístico es necesario ordenar los datos y clasificarlos, lo primero que hacemos es revisar los instrumentos de recolección de información aplicados, sobre todos si son cuestionarios llenados por el informante ya que en una entrevista el entrevistador es el que registra las respuestas. Algunos autores proponen que cuando quedan cuestionarios con preguntas sin contestar las llenemos con la respuesta que la mayoría colocó, sin embargo esto se podría considerar poco ético, pues no es la respuesta del encuestado, en ese caso la sugerencia es eliminar ese cuestionario de la muestra. Terminado este proceso pasamos al agrupamiento. En el caso de las entrevistas y cuestionarios con preguntas abiertas debemos crear categorías de acuerdo con los puntos expresados por los entrevistados de tal forma que ninguna opinión o planteamiento se
queden sin categoría, pero también de forma que ninguna opinión pueda incluirse en dos categorías, es decir, deben ser mutuamente excluyentes. Una vez bien estructuradas las categorías contamos la frecuencia de aparición de cada categoría en las respuestas dadas. En el caso cerradas de ser unsecuestionario preguntas contabiliza de la frecuencia de aparición de cada respuesta para luego elaborar una tabla con la distribución de frecuencias, tema que ampliaremos más adelante.
Razones Proporciones Porcentajes
y
Una de las funciones de la estadística es resumir todos los datos de un conjunto para resaltar sus características más importantes. Una de las formas de realizar esta actividad es relacionando los datos, ya sea entre ellos mismos o con datos similares, es decir, convertir los valores absolutos en valores relativos, ya veremos por qué.
Razones La razón (R) es el valor que indica la relación cuantitativa existente entre dos cantidades, por ejemplo: En una ciudad existen 54.000 empleados y 36.000 desempleados, la razón de empleado a desempleado se expresa así: R = ( A) = 54.000 = 9 (a ) 9.000
Siendo ESTADÍSTICA I
19
A= Nro. de individuos con cierta característica a= Nro. de individuos que no poseen cierta característica La interpretación del ejemplo anterior es que por cada 4 empleados hay 1 desempleado. Al ser la razón un valor relativo no depende de losque valores absolutos de los individuos la forman, ya que por ejemplo en una zona donde hay 90.000 empleados y 10.000 desempleados la razón sigue siendo de 9.
Proporción La proporción es una razón, pero su diferencia con las razones anteriores, es que el denominador del cociente es el número total de unidades enunciadas. La proporción se representa con la siguiente fórmula: p=
A
siendo N= (A)+(a)
N
La proporción contraria sería q=
(a)
N
Ambas p y q son complementarias y si se suman debe dar igual a 1 p+q=1 Remplacemos las formulas con los datos del ejercicio anterior A 54.000 = = 0,857 N 63.000 (a ) 9.000 q= = = 0,142 N 63.000 p=
Porcentajes Como vimos en el apartado anterior las proporciones vienen expresadas en valores decimales, esto no es ningún inconveniente, pero cuando se quiere presentar al público los datos utilizar decimales es confuso, por ello se acostumbra a multiplicar las proporciones por 100, para convertir los valores decimales en enteros, es decir, para porcentajes.
convertirlos
P% =
Q% =
A
∗ 100
N (a )
N
en
∗ 100
Convirtamos pues nuestras proporciones en porcentajes: P=
q=
A 54.000 = = 0,857 ∗100 = 85,7% N 63.000 (a)
N
¿Cómo
=
9.000 63.000
= 0,142 ∗ 100 = 14,2%
interpretamos
estos
porcentajes? De con la misma manera que lo hicimos la proporción, decimos que 85,7% de las personas están empleadas y el 14,2 % están desempleados. Observemos que si tan sólo damos uno de los dos porcentajes con su respectiva interpretación, el segundo porcentaje no es necesario darlo, pues si decimos que en la cuidad “X” el 85,7% de las personas están empleadas, ya podemos inferir la minoría está desempleada, sin necesidad de manejar el porcentaje exacto.
La proporción de empleados sería de 0,85, y la de desempleados Ambas proporciones de 0,142. son complementarias y si las sumamos da igual a 1
Porcentajes de Cambio
Son los que muestran la diferencia entre dos porcentajes; estos pueden
ESTADÍSTICA I
20
ser en aumento o en descenso, veamos sus fórmulas: Pa =
M −m ∗100 m
Pd =
M −m ∗100 M
que logremos determinar de forma correcta las distancias de los intervalos que usaremos para agrupar nuestros datos.
Distribución de Frecuencias: Es un agrupamiento de datos en categorías mutuamente excluyentes en el cual se registran la cantidad de veces que se ha
Siendo Pa= Porcentaje de aumento Pd= Porcentaje disminución
de descenso o M= Cantidad mayor m= Cantidad menor Ejemplo: Si sabemos que el excedente de nuestra cooperativa en el año 2004 fue de 100.000.000 de bolívares, y para el año 2005 Bs. 135.000.000, ¿cuál fue el porcentaje de aumento? Pa = Pa =
M −m ∗100 = m 135 .000 .000 −100 .000 .000
∗100 =
100 .000 .000 35 .000 .000 Pa = ∗100 = 35 % 100 .000 .000
El porcentaje de aumento de nuestro excedente fue de un 35% en un año.
Distribución de Frecuencias. En muchas ocasiones habrás observados tablas como esta: Edades ( en a ños) Frecuencia 5a1 26 6-10 44 11-15 32 Esta tabla se denomina Distribución de Frecuencias. La estadística descriptiva utiliza la distribución de frecuencias para organizar y presentar los datos. Lo deseable es
Ahora te preguntarás ¿Cómo elaboro una distribución de frecuencias?, la forma más fácil de aprenderlo es a través de un ejemplo: Observemos el siguiente grupo de números y supongamos que son la cantidad de viajes que realiza cada día durante un mes la aerolínea Conviasa 1 1 1 2 8 5 2 0 0 1 1 1 1 9 4 3 2 3 1 0 1 2
2 0
1 7
1 8
1 5
8
9
1 9 1 0
En esa tabla de datos buscamos el valor mayor y el menor, para
determinar la cantidad de clases, para ello utilizamos la fórmula 2k, empleándola de la siguiente manera, en los vuelos de Conviasa n = 20, asignemos a k un valor arbitrario, por ejemplo 4,24=16 si n = 20, 4 clases no cubrirían todos los datos, probemos con k=5, 2 5=32, es mayor que 20, completamente a n, cubriríamos por lo que deberíamos conformar 5 clases.
ESTADÍSTICA I
21 Ahora vamos a amplitud del
calcular la intervalo ,
rec orrd dan e ser reco ando que que deb debe ser el mismo para todas las clases , y que deben abarcar desde el dato menor hasta el mayor, lo calculamos a través de la siguiente fórmula: i〉
H
−L
10 a 8
Días al Mes Frecuen cia (f)
7/20
7
11a13
5
14a16
3
17a19
3
Frecuenc ia relativa
5/20 3/20
k
En la que i es el intervalo de la clase, H el mayor número observado, L el menor valor observado y k el número de clases: H − L 20 − 8 i〉 = = 2,4 k 5 Redondeamos a 2 que será el tamaño de nuestros intervalos, recordemos que debemos tener 5 clases. Ahora organicemos nuestros datos:
Cantidad de 11aV8uelos 13 11 a 16 14 a 19 17 a 22 20 a
Cantida d de Vuelos
F 7recuencia (f) 5 3 3 2
Ya construimos nuestra distribución de frecuencias, es bueno acotar que el punto medio de la clase se haya en el punto medio entre el límite superior y el límite inferior, en el primer intervalo el punto medio entre 8 y 10 es 9. 9 es el punto medio de la primera clase. También podemos tener distribuciones de frecuencia relativa, que es la frecuencia absoluta entre la cantidad total de observaciones ( n):
20a22
3/20 2/20
2
Total
20
20/2 0
0,3 5 0,2 5 0,1 5 0,1 5 0,1 0 1
Con la frecuencia relativa obtenemos la fracción del número total de observaciones, y si lo multiplicamos por 100 los porcentajes. Si interpretamos el cuadro anterior según su frecuencia relativa podíamos decir que el 35 % de los días del mes Conviasa realiza entre 8 y 10 vuelos.
Presentación Estadísticos
de
los
Datos
A parte de la distribución de frecuencias los datos pueden también pueden ser presentados en gráficos contentivos de los mismos datos que expresamos en la distribución de frecuencias. Seguro te preguntarás ¿Y si tienen los mismos datos para que hacerlos? La respuesta es que el gráfico permite apreciar de forma más rápida los datos obtenidos, ya lo comprobaremos más adelante. Existen una gran variedad de gráficos, primero conoceremos los dos más empleados en ESTADÍSTICA I
22
administración, también mencionaremos otros tipos de gráficos de mucha utilidad, sin embargo te invito a ampliar sobre este tema a través de un arqueo bibliográfico.
Histograma: Es uno de los gráficos utilizados mayormente unaempleado representar distribución para de frecuencias
Histograma: Gráfica en la que las clases se indican en el eje y (horizontal) y las frecuencias de la clase por eje x (vertical). Las frecuencias quedan representadas en el gráfico por la altura de las barras, la que se trazan una al lado de la otra.
las frecuentas de clase. Recordemos que el punto medio representa los valores de cada clase. El histograma y el polígono de frecuencia nos permiten tener una visión de las principales características de un conjunto de datos, a pesar de tener ambos el mismo propósito, el histograma tiene la ventaja como de un representar frecuencia rectángulocada que además incluye ambos valores del intervalo. Por su parte el polígono de frecuencia tiene una ventaja sobre el histograma, permite comparar dos distribuciones de frecuencia a la vez, y si por ejemplo queremos hacer un gráfico con los gastos de tres años con una misma distribución de frecuencias, fácilmente lo podemos hacer.
100 80
Polígono de frecuencia
Este
60
Oeste 40
Un polígono de frecuencia es perecido al histograma. Consiste en segmentos de línea que se conectan por los puntos formados por la intersección del punto medio de la clase y de la frecuencia de clase. La elaboración de un polígono de frecuencias se hace colocando los puntos medios de cada clase en el eje x y la escala en el eje y, es decir,
Norte 20 0 1er
2do
3er
4to
trim.
trim.
trim.
trim.
Otras presentaciones gráficas de datos Gráfica por medio de línea.
ESTADÍSTICA I
23
Las gráficas por medio de línea son muy útiles en la administración porque podemos mostrar el cambio de una variable en el tiempo, es decir, si queremos ver la cantidad de unidades vendidas de un producto que fabricamos en nuestra organización, este gráfico es la mejor opción. Para su elaboración colocamos la variable, que
Seguramente te preguntarás ¿En qué se diferencian los histogramas del gráfico de barras? Se diferencian en algo que podría parecer tonto, pero no, y es en la separación que existe entre las barras. Los histogramas poseen sus barras continuas porque sus datos son de intervalo o de razón, mientras que en los gráficos de barra
continuandosería con nuestro de Conviasa, cantidadejemplo de vuelos diarios sobre el eje y y el tiempo sobre el eje x.
al poder cada admitir cualquier niveluna de medición barra representa variable que puede ser cualitativa o cuantitativa. Diagrama Circular:
El diagrama circular, muy reconocido por gráfico de torta es especial para representar porcentajes. El diagrama circular convierte los 360 grados del círculo en el 100% de la variable que estamos representando. Este es un gráfico muy de muy fácil lectura, pues las líneas que cortan la circunferencia permiten, rápidamente, ver que clase de la variable tiene el mayor
7,00
6,00
5,00
F4,00 ia n u c e r
porcentaje.
3,00
2,00
1 9,00
12,00
15,00
18,00
21,00
Vuelos
2
10% 15%
Gráfico de Barras.
Es un gráfico muy versátil, en el se puede graficar cualquier tipo de variable y en cualquier nivel de medición. Las barras pueden ser verticales u horizontales, y tampoco hay mayor inconveniente en la distribución de los datos a través de los ejes del plano cartesiano.
35%
3 4
15% 25%
5
100 80 60 Este
40 20 0 1er
2do
3er
4to
trim.
trim.
trim.
trim.
ESTADÍSTICA I
24
UNIDAD III MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRAL
¡Felicitaciones! Ya te encuentras en la tercera unidad, continua con tus progresos. Aquí encontrarás… Contenidos de segunda unidad Ejemplos
la
Ejercicios propuestos
ESTADÍSTICA I
UNIDAD 3. MEDIDAS ESTADÍSTICAS DE POSICIÓN CENTRAL Y NO CENTRAL Las medidas de tendencia central tienen como propósito hallar con toda precisión el centro de un conjunto de observaciones
Medidas de Posición
Central
Promedios Matemáticos
No Central
Promedios No Matemáticos
Media Aritmética
Mediana (Med)
Cuartiles (Qx) Deciles (Dx)
Moda (Mo) Media Ponderada
Percentiles (Px)
Media Geométrica MG
Medidas de Tendencia Central para datos Simples La Media Aritmética La media aritmética o media es la medida de tendencia central que frecuentemente llamamos promedio, consiste en la suma de los valores del grupo de datos dividida entre la cantidad de valores. La media aritmética de una población se representa con el símbolo µ (mu), y la media aritmética de una muestra se representa con el símbolo X (equis barra) y sus fórmulas son las siguientes: µ
Siendo:
=
∑X
N
X =
∑X
n
∑ X La sumatoria d todos los datos N Población n Muestra
Ambas fórmulas son idénticas, con la única diferencia que en el primer caso trabajamos con la población entera y en el segundo con una muestra. Ejemplo: Durante cada hora de trabajo de un día una cooperativa produce las siguientes cantidades de artículos de limpieza: 14, 19, 20, 15, 12, 18, 16, 10.¿Cuál es el número medio de unidades producidas? µ =
∑X
=
14 + 19 + 20 + 15 + 12 + 18 + 16 + 10
N
8
=
124
= 15,50
8
El numero medio de producción es de 15,5 artículos de limpieza, pero si retomamos los contenidos estudiados en la primera unidad, la cantidad de artículos producidos en un variable discreta, ya que si estuviésemos hablando de jabones de baño no podemos decir que fabricamos 15 jabones y dejamos hecho la mitad del siguiente, por lo tanto aquí aplicamos una regla que se denomina redondeo. El redondeo de un número consiste en que una o varias de sus cifras finales (de izquierda a derecha) se substituyen por ceros o se ascienden o descienden si ese último número es mayor o menor que 5 De tal forma que de 15,5 redondeamos el número decimal, como 5 es redondeamos por exceso convertimos el 15, 5 en 16.
≥ a 5
Propiedades de la Media Aritmética: Para calcular la media se toman todas los valores Un conjunto de datos sólo tiene una media. La media es única La media es una medida útil para compara dos o mas poblaciones La media aritmética es la única medida de posición en la que las suma de las desviaciones de los valores de la media es siempre cero: ∑( X − X ) = 0
Ejemplo: La media de 3, 8 y 4 es 5 ∑( X − X ) = (3 − 5) + (8 − 5) + ( 4 − 5) = −2 + 3 + −1 = 0
Media Ponderada La media ponderada o promedio ponderado es una media aritmética en al que cada uno de los valor es se le pondera de acuerdo a su importancia con el grupo general. Las fórmulas de media ponderada poblacional y muestral son idénticas:
µw
ó Xw =
∑( wX ) ∑w
Donde: X w Media Ponderada X Observación individual W Peso o ponderación asignada a cada observación Cuando calculamos la media aritmética no sale a discusión si cada uno de los datos tiene igual importancia, sin embargo en ciertos casos puede ocurrir que determinados datos tengan más valor que otro de su mismo conjunto, observemos el siguiente ejemplo:
Un estudiante obtuvo las siguientes calificaciones en su curso de estadística I: 19, 20, 18 y 16. Sin embargo dentro de los porcentajes la tercera calificación es la que tiene mayor ponderación o mayor valor, debido a que representaba el 30 % de la calificación final, a continuación se reflejan los datos en la siguiente tabla: Calificacion es 19 20 18 16
Xw =
Ponderació XW n 1 19 1 20 3 54 1 16 6 10 9
∑( wX ) ∑w
=
109 6
= 18,16
El promedio ponderado de calificaciones de este estudiante es de 18,16 puntos.
Media Geométrica La media geométrica es útil para encontrar el promedio de porcentajes, proporciones, índices o tasas de crecimiento. Tiene mucha aplicación en el comercio y en la economía debido a que nos inter esa encontrar el porcentaje de cambio en ventas, salarios o cualquier otro dato económico. La media de un conjunto n de números positivos se define como la n-ésima raíz del producto de los n valores. La formula de la media geométrica se escribe así: MG = n ( x1 )...( x n )
La mayoría de las calculadoras pueden calcular la raíz enésima de cualquier número
La media geométrica será siempre menor o igual a la media aritmética, pero nunca mayor. Ejemplo: Un empleado gana 700.000 bolívares al mes, este año va a recibir un 5% de aumento y el próximo año un 15%, si sacamos la media aritmética de estos de ambos porcentajes nos daría un promedio de 10%, pero el verdadero promedio es 9, 886. Empleemos la fórmula de media geométrica: MG
=
(1,05)(1,15)
1,09886
=
Verifiquemos: si elsu trabajador del que hablábamos gana Bs. 650.000 con los dos aumentos sueldo quedará: 650.000 * 0,05= 32.500 682.000 * 0,15= 102.370 Total con el aumento 784.870 bolívares Ahora realicemos el cálculo con nuestra media geométrica 700.000*0,09886=64.259 714.259*0,09886=70.611,6 Total = Bs.784.870
Mediana y Moda Mediana
La mediana o media posicional queda en la mitad un grupo de elementos ordenados de forma ascendente o descendente. En este caso la mitad de los números estará por debajo de la mediana y la otra mitad por encima de ella. La mediana se obtiene con la siguiente ecuación: Med =
n +1 2
Si el grupo de datos es impar la mediana se calcula así de la siguiente forma. Ejemplo: Calculemos la mediana de los kilos(ordenados de forma ascendente) de materia prima utilizadas durante esta semana: 33, 36, 40, 45, 57,60 y 68. Med =
n +1 2
=
7 +1 2
=
8 2
=4
La mediana es el valor que está en la posición 4: 33, 36, 40, 45, 57,60 y 68. Si el grupo de datos es par, aplicamos la misma ecuación promediando los dos valores centrales, observemos el ejemplo: Datos: 10, 15, 18, 25, 31, 36, 45, 60, 77, 80 Med =
n +1 2
=
10 + 1 2
=
11 2
= 5,5
El punto 5,5 estaría entre los valores de las posiciones 5 y 6, por lo buscamos ambos valores y los promediamos 10, 15, 18, 25, 32, 36, 45, 60, 77, 80 X =
32 + 36 2
=
86 2
= 43
La mediana es 43. Moda
Es la medida de tendencia central más fácil de recordar ya verás por qué: ¿Por qué sabemos que algún producto está de moda? Seguramente responderás… Por que lo usan muchas personas, o por que lo vemos frecuentemente en la calle, y efectivamente eso es la moda, el dato que más se repite dentro de nuestro conjunto de elementos. Veamos este ejemplo: Edades de los niños de nuestra familia: 12, 1, 10, 1, 10, 2, 5, 7, 8, 9, 10, 11. El número que más se repite es el 10, a pesar del que el 1 también se repite, el 10 se repite mayor número de veces.
Medidas de Tendencia Central para Datos Agrupados Antes de avanzar, es correcto aclarar que las definiciones de nuestras medidas de tendencia central se mantienen, a continuación se te presentan un resumen repaso con las definiciones de todas. Media Aritmética:
Es una medida de tendencia central que se obtiene dividiendo la suma de los valore s del con unto de datos entr e el número total de
Media Ponderada:
Es un caso especial de media aritmética pero cuando todos los datos tienen diferentes valores o ponderaciones que los discrimina según su importancia Media Geométrica:
Es una medida que calcula los promedios de los porcentajes
Mediana:
Observación de la mitad de los datos después de que se han colocado de forma ordenada
Moda:
Es el valor que más se repite dentro de su conjunto, es decir, posee mayor frecuencia
Media Aritmética para Valores Agrupados Para aproximar la media aritmética de datos organizados en una distribución de frecuencias, comenzamos por asumir que las observaciones de cada clase están representadas por el punto medio de la clase. La media de una distribución de frecuencias se calcula así: X =
∑ fX
n
En la que X = media aritmética X= valor o punto medio de cada clase f= frecuencia de cada clase fX= frecuencia en cada clase por el punto medio de la clase ∑ fX = suma de estos productos n= número total de frecuencias Ejemplo: Calculemos la media del precio de venta de los vehículos del plan Venezuela Móvil
Precio de Venta de vehículos (millones de bolívares) 18 23 a 23 28 a 28 33 a 33 38 a 38 42 a Total
Frecuen cia 25 28 26 17 13 109
Al precio de venta medio de los vehículos puede estimarse a partir de datos agrupados en una distribución de frecuencias, lo primero que debemos calcular es el punto medio de cada clase, para eso le calculamos el promedio: 18+23/2=20,5 luego ese valor medio se multiplica por la frecuencia, como se muestra en la siguiente tabla:
Precios de venta 18 23 a 23 28 a 28 33 a 33 38 a 38 43 a Total
Frecuencia (f) 25 28 26 17 13
Punto Medio (X) 20,5 25,5 30,5 35,5 40,5
512,5 714 793 603,5 526,5 3.149,5
109
X =
∑ fX
n
=
3.149,5 109
fX
= 28,9
Decimos entonces que la media del precio de venta del plan Venezuela Móvil es de Bs. 28.800.000.
La Mediana Para Valores Agrupados La mediana es el valor por debajo del cual se encuentran una mitad de los valores y por encima del cual se encuentra la otra mitad. Como los datos están organizados en una distribución de frecuencias, se ha perdido algo de información. Así no podemos calcular la mediana exacta, sin embargo, se puede estimar de la siguiente manera: n Med = L + 2
− CF
f
(i)
Donde: L= Límite inferior de la clase que contiene la mediana. n= Número de frecuencias. f= frecuencia en la clase mediana. CF= número de las frecuencias acumuladas en las clases que preceden a la clase que contiene la mediana. i= amplitud de la clase en la que se encuentra la mediana. Utilicemos los datos del ejemplo anterior, pero en esta oportunidad debemos calcular la frecuencia acumulada, que no es más que la suma acumulada de las frecuencias de cada clase o categoría, veámoslo en la siguiente tabla:
Precios de Venta 23 a 18 28 a 23 33 a 28 38 a 33 43 a 38 Total
Frecuencia (f) 25 28 26 17 13
Frecuencia Acumulada 25 53 79 96 109
109
Debemos localizar en cual clase se encuentra la mediana, para eso dividimos el total de la frecuencia entre 2, n =190/2=54,5. Ahora buscamos en la frecuencia 2
acumulada el grupo de intervalos que tenga a este número: Frecuencia Precios de Venta Frecuencia (f) Acumulada 23 a 18 28 a 23 33 a 28 38 a 33 43 a 38 Total
25 28 26 17 13
25 53 79 96 109 109
Podemos apreciar fácilm ente que el tercer grupo de intervalos es el que posee al número en la posición 54,5 debido a que el anterior sólo llega hasta el número 53, observemos este diagrama. 53
79
Bs. 28.000.000
? Mediana
Bs.33.000.000
Sustituyamos ahora los valores: n 109 − CF − 53 Med = L + 2 (i ) = 28.000.000 + 2 (5.000.000) = 28.000.000 + 288.000 = 28.288.000 f 26
La mediana del precio de venta es 28.288.000. Si comparamos la mediana con la media aritmética se nos presenta una diferencia, pero recordemos que… No podremos determinar una mediana exacta porque hemos perdidos datos en el proceso de agrupación
Moda Para Datos Agrupados
Siendo la moda el valor con más frecuencia, sólo debemos buscar dentro de nuestra distribución de frecuencias los intervalos con mayor cantidad de frecuencia, revisemos la tabla de precios de venta del Plan Venezuela Móvil. Precios de Venta
Frecuencia (f)
23a18 28a23 33a28 38a33 43a38 Total
25 28 26 17 13 109
El intervalo de 23 a 28 millones es que tiene mayor cantidad de observaciones, por lo tanto para la moda el punto medio de la clase: 23+28/2=25,5; pordeterminar lo tanto la moda del calculamos precio de venta es Bs. 25.500.000.
Media Geométrica para Datos Agrupados La media geométrica para datos agrupados ecuación:
se determina con la siguiente
MG = n X 1f1 X 2f 2 ... X nf n
Donde X= punto medio de los intervalos f = frecuencia Recuerda La media geométrica se calcula para promedios de porcentajes
Relación entre Media, Mediana y Moda En las distribuciones simétricas la media, la mediana y la moda coinciden en el valor, mientras que en una distribución asimétrica positiva la media es mayor que la mediana, pero por el contrario, si la distribución es asimétrica negativa, la media es menor que la mediana. Media
Simétrica
Media
Asimétrica negativa
Media
Asimétrica positiva
Medidas de Posición No Central Los cuartiles, deciles y percentiles se asemejan a la mediana por que dividen la distribución en partes iguales, la mediana lo hace en dos los que están por encima y or debajo de ella, mientras que los cuartiles dividen los valores en cuatro partes iguales, los deciles en diez y los percentiles en cien. A continuación se te muestran las ecuaciones necesarias para su cálculo:
Medidas de Posición No
Datos simples
Datos Agrupados
Central Cuartiles
Qx =
x ∗n 4
Deciles
Dx =
x ∗n 10
Percentiles
Px =
x ∗n 100
Cuartiles Los cuartiles dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales, Los cuartiles son denotados como Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Para Datos Simples
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Cuando n es par: Qx =
1∗ n 4
Recordemos que x representa el valor del cuartel que puede ser 1,2 y 3
Cuando n es impar:
Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cuartiles cuando se trata de datos agrupados es la siguiente:
cálculo de los
k= 1,2,3
Donde: Lk = Límite real inferior de la clase del cuartil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k
Deciles Los deciles dividen la continuidad de los datos ordenados en diez partes porcentualmente iguales. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Para Datos Simples
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Dx =
Dx =
x ∗n 10
Cuando n es par:
x( n + 1) 10
Cuando n es impar:
Siendo x el número del decil. Para Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1,2,3,... 9
Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra fórmula para calcular los deciles: El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones.
El quinto decil corresponde a la mediana.
El noveno decil supera al 90% y es superado por el 10% restante.
Donde (para todos): L1 = limite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase.
Centiles o Percentiles Los percentiles son una de las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los percentiles dividen los datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99. Para Datos Simples
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Para los percentiles, cuando n es par: Px =
x ∗n 100
Px =
x ∗ (n + 1) 100
Cuando n es impar: Siendo x, el número del percentil. Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75. Para Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula:
k= 1,2,3,... 99
Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra forma para calcular los percentiles es: Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.
El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante. Ejemplo Determinación del primer cuartil, el séptimo decil y el treintavo percentil, de la siguiente tabla:
Salarios (en miles de bolívares)
Número de Empleados (f1)
Frecuencia Acumulada
200-299 300-399 400-499 500-599 600-699 700-800
85 90 120 70 62 36
85 175 295 365 427 463
Como son datos agrupados, se utiliza la fórmula Siendo,
La posición del primer cuartil.
La posición del septimo decil.
La posición del treintavo percentil. Entonces,
El primer cuartil: 115.5 – 85 = 30.75 Li = 300, Ic = 100 , fi = 90
El 7 decil:
Posición: 324.1 – 295 = 29.1 Li = 500, fi = 70
El percentil 30 Posición:
138.9 – 85 = 53.9 fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de Bs.334.000; que bajo Bs. 541.570 gana el 57% de los empleados y sobre Bs. 359.880, gana el 70% de los empleados.
UNIDAD IV MEDIDAS DE DISPERSIÓN O VARIABILIDAD
¡MAGNÍFICO! Llegamos a la última unidad de esta divertida unidad curricular Aquí encontrarás… Contenidos de la segunda unidad Ejemplos Ejercicios propuestos
UNIDAD 4. MEDIDAS DE DISPERSIÓN Las medidas de tendencia central por sí solas carecen de significado, pues de nada sirve saber el promedio sin conocer la dispersión, qué significa esto, saber cuanto se alejan las observaciones de su propio promedio, observemos el siguiente ejemplo: A continuación se te presenta el monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ”
Meses
Empresa “XXX”
Empresa “ZZZ”
Julio Agosto Septiemb re Octubre Noviembr e Diciembr e
1.500.000 1.800.000
4.800.000 3.900.000
2.000.000
2.000.000
2.300.000
1.400.000
2.500.000
700.000
2.800.000
100.000
Total
12.900.000
12.900.000
Empresa “XXX”
X
=
2 .150 .000
Empresa “ZZZ”
X
=
2.150 .000
Ambas tienen la misma media en ventas, pero si realizamos el análisis considerando cada una de las ventas del mes podemos apreciar que la situación de la empresa “ZZZ” es muy delicada, debido a que el último mes de facturación se aleja mucho de la media. Por esto la importancia de las medidas de dispersión.
Medidas de Dispersión: Miden que tanto se dispersan los datos recabados de su media
Existen dos grupos de medidas de dispersión. El primer grupo es el de las medidas de dispersión absolutas que vienen expresado por las mismas medidas que identifican a la serie de datos; el segundo grupo es el de las medias de dispersión relativas que son relaciones entre las medidas de dispersión y las medidas de tendencia central, expresado en valores abstractos (porcentajes).
Medidas de Dispersión Absolutas El Rango
El rango o recorrido es la medida de dispersión más sencilla, consiste en calcular la diferencia entre el valor mayor o el valor menor de la observación: R = VM − Vm
Revisemos el siguiente ejemplo: Horas diarias dedicadas al estudio por un grupo de estudiantes del plan de formación Administración y Gestión: 1, 2 3 2, 5 5 2 3 3, 4 5 2
Calculemos la media aritmética
2, 5 X =
28 12
1
1
= 2,3 ≈ 2 .
Podemos decir que todos los
alumnos dedican aproximadamente dos horas diarias al estudio. Calculemos el Rango, R=Vm-Vm=4-1=3. El rango de 3 es la distancia entre los límites. El rango es una medida de dispersión débil pues sólo incluye dos valores del conjunto. El rango es una buena opción cuando comparamos dos situaciones similares, retomemos el ejemplo al principio de la unidad Monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ”
Meses Julio Agosto Septiemb re Octubre Noviembr e Diciembr e Total
Empresa “XXX”
Empresa “ZZZ”
1.500.000 1.800.000
4.800.000 3.900.000
2.000.000
2.000.000
2.300.000
1.400.000
2.500.000
700.000
2.800.000
100.000
12.900.000
12.900.000
Empresa “XXX” X 2.150 .000 Empresa “ZZZ” X 2.150 .000 Calculemos el rango de cada una XXX= 2.800.000 - 1.500.000=1.300.000 ZZZ= 4.800.000 – 100.000= 4.700.000 Podemos concluir que la media de la empresa XXX es más representativa que la de la empresa ZZZ. =
=
Para calcular el rango de datos agrupados tomamos el límite inferior de la primera clase y el límite superior de la última clase. Ejemplo. Utilicemos la distribución e frecuencias del Plan Venezuela Móvil trabajado en la unidad anterior Precios de Venta del
Frecuencia (f)
Vehículo 23 18 a 28a23 33a28 38a33 38 a 43 Total
X =
109 5
25 28 26 17 13 109
= 21,8 R = VM − Vm = 43 − 18 = 25
El rango es 25 millones. Desviación Media
La desviación media mide la cantidad media en que los valores de la población, o de la muestra, varían de la media. Se define así: DM =
∑X − X
n
Donde Xes el valor de cada observación X = es la media aritmética de los valores n= es el número de observaciones en la muestra = indica el valor absoluto. En otras palabras se hace caso omiso de los signos de las desviaciones medias, ¿Por qué? Porque si no lo hiciéramos así las desviaciones positivas y negativas se anularían, y al desviación siempre sería cero, y una medida de dispersión cero sería completamente inútil. Ejemplo
Número de horas 1,5 2 3 3,5 4
1, 5 2
2
3
3
2
2, 5
3, 5 1
(X-X) 1,5-2,3=0,8 2-2,3=-0,3 3-2,3=0,7 3,5-2,3=1,2 4-2,3
2, 5 4 1
Desviación A bsoluta 0,8 0,3 0,7 1,2 1,7 4,7
DM =
∑X − X
=
n
4,7 = 0,94 ≈1 El 5
número de horas estudiada se desvía de la
media en una hora Varianza y Desviación Estándar
La varianza y la desviación estándar son medidas de dispersión basadas en la desviación media, pero en lugar de usar valores absolutos, elevamos al cuadrado las desviaciones. Elevar al cuadrado significa eliminar los números negativos. La variancia y la desviación son las medidas de dispersión más útiles, pues proporcionan una medida más significativa sobre el punto de dispersión
Varianza: La media aritmética de las desviaciones de la
Desviación Estándar: La raíz cuadrada positiva de la varianza
Varianza poblacional y Desviación Estándar para datos simples
Recordemos que la población son todas las observaciones que hemos recabado, es decir, los datos. Su fórmula es: S 2 = ∑( X i − X ) n −1
2
Donde S 2 =varianza poblacional X= valor de una observación de la población X = media aritmética de la población n= Número de observaciones de la población Ejemplo: Un corredor de seguros vende tres pólizas por los siguientes precios en millones : 32, 23 y 26 X =
S2 =
32 + 23 + 26 3
= 27
(32 − 27) 2 + (23 − 27) 2 + ( 26 − 27) 2 3
=
25 + 16 + 1 3
= 14
S = S 2 = 3,74
El precio de las pólizas de seguro está estrechamente agrupado alrededor de los 27 millones de bolívares y pueden fluctuar entre los 3.740.000 bolívares. Varianza Poblacional y Desviación Estándar para Datos Agrupados S2 =
∑ fM
2
−nX
n −1
2
s=
s2
Ejemplo: El director de Conviasa requiere conocer el número de pasajeros atendidos por día para determinar si la variación de pasajeros es grande, ya que de ello depende la ampliación en la flota de aviones, la distribución de frecuencias es la siguiente:
Pasajeros (Clases)
Días (Frecuenci a)
Punto Medio (M)
fM
M2
fM2
50-59 60-69
3 7
54,5 64,5
163,5 451,5
2.970,25 4.160,25
70-79
18
74,5
1341
5.550,25
80-89 90-99 100-09
12 8 2
84,5 94,5 104,5
1014 756 209
7.140,25 8.930,25 10.920,2 5
8.910,75 29.121,7 5 99.904,5 0 85.683 71.442 21.840,5
TOTAL
50
∑ fM
Xg = S2 = s
=
n
=
3.935 50
2 −nX n −1
∑ fM s
2
=
= 78,7
2
147 ,31
=
3.935
316.902, 50
Por lo tanto
316 .902,5 − 50(78,7 ) 2 49
= 147,31
12 ,14
=
El director de Conviasa ya puede decidir si los aviones que utilizan actualmente pueden acomodar fluctuaciones hasta de 12 pasajeros en los días de tránsito pesado.
Medidas Relativas de Dispersión Las medidas de dispersión estudiadas hasta ahora no nos permiten hacer comparaciones entre la dispersión de los valores de varias distribuciones, ya que todas ellas están afectadas por la unidad de medida en que se expresan los datos; de allí que la comparación sería imposible porque cada medida vendría expresada
en unidades diferentes. Además varias distribuciones pueden tener un mismo tener un mismo valor para determinada medida de dispersión y ser la variabilidad de sus datos en relación con la media, diferente. Por ello la existencia de medidas de dispersión relativa que se expresan en porcentaje (valores abstractos) y se determinan por la relación existente entre una medida de dispersión absoluta y una medida de la tendencia central, relación que nos permite compara la variabilidad de los datos entre varias series. La medida de dispersión relativa de mayor importancia es el coeficiente de variación, que se expresa eny porcentajes y se calcula por la relación que existe entre la desviación estándar la media aritmética. Su fórmula es la siguiente: CV =
σ
X
100
Ejercicios Unidades 2, 3 y 4 1) Qué tipo de instrumento de recolección de datos aplicarías en as siguiente situaciones y por qué. a.Para registrar el comportamiento de niños en un parque público. b.para supervisar la correcta ejecución de una obra en tu comunidad. c. Para registrar los hábitos alimenticios de tus familiares y amigos en una reunión d.Para contratar nuevos personal para tu empresa e.Pa ra solucionar un problema entre el personal que labora en una organización. f. Para conocer la opinión del pú blico sobre los productos que produces.
2) Realiza un censo en tu co munidad sobre dos var iables de tu inter és, por ejemplo: cantidad de papeleras por acera, cantidad de vecinos que participan en las misiones, etc. Luego: a.Clasifica las variables según su nivel de medición b.Realiza el proceso de recolección de datos (con al menos 20 observaciones, muestras) c. Elabora la distribución de frecuencias para ambos casos d.Selecciona el gráfico que más se adecue a tu variable y presenta en los resultados obtenidos. e.Calcula la media aritmética, la mediana y la moda de las variables estudiadas, con su respectiva medida de dispersión (Varianza y desviación estándar) 3) Calcula la media, mediana y la moda de la s edades de t u grupo familiar 4) Calcula la razón de poste s de alumbrado púb lico en buen y mal est ado que están en el trayecto que va desde tu casa hasta tu sitio de estudio o de trabajo.
Concluimos exitosamente este proceso de aprendizaje, esperamos que lo hayas disfrutado.
Respuestas Unidad I 1) Escribe cinco ejemplos de datos cuantitativos y cinco de datos cualitativos.
Respuesta abierta 2) Realiza un ejemplo de una población y su muestra.
Respuesta abierta 3) Determina cual de los puntos es una población o una muestra: Los estudiantes desiguientes sexto grado de Venezuela. Población Los estudiantes de Caracas pertenecientes a Misión Sucre. Muestra Todas las familias con mascotas de un municipio. Población Los reportes de un día sobre las actividades realizadas en un liceo. Muestra 4) Clasifica en cualitativa y cuantitativas las siguientes variables: Los literales de calificación en la escuela básica (A,B,C,D y E) Cualitativa El color de cabello de las personas de una comunidad. Cualitativa Cantidad de pacientes atendidos por Barrio Adentro. Cuantitativa Cantidad de hijos de nuestros vecinos. Cuantitativa 5) Clasifica las siguientes variables como continuas o discretas Número de camisas producidas por una cooperativa. Discreta Las horas de un día. Continua Cantidad de estudiantes de nuestra comunidad. Discreta Kilos de pollo vendidos en Mercal. Continua 6) Cuál es el nivel de medición de las siguientes variables: Calificaciones de los estudiantes en la primera prueba de estadística. Razón Una clasificación de los estudiantes de la zona en la que viven Nominal Temas de los discursos del presidente Chávez. Nominal El número de horas por semana que estudia alumno de Misión Sucre. Razón El año de fabricación del transporte público que cubre la ruta de nuestro vecindario. Intervalo Los periódicos vendidos cada domingo. Razón Grupos de estudiantes según su edad. Ordinal
Unidades 2, 3 y 4 1) Qué tipo de instrumento de recolección de datos aplicarías en as siguiente situaciones y por qué. a.Pa ra registrar el comportamiento de niños en un parque público. Observación b.Para supervisar la correcta ejecución de una obra en tu comunidad. Observación, Entrevistas c. Para conocer los hábitos alime nticios de tus familiares y amigos en una reunión. Cuestionario d.Para nuevos personal para empresa. e.Pa ra contratar solucionar un problema entretu el personalEntrevista que labora en una organización. Entrevista f. Para conocer la opinión del público sobre los produ ctos que produces. Cuestionario
2) Realiza un censo en tu comunidad sobre dos variables de tu interés, por ejemplo: cantidad de papeleras por acera, cantidad de vecinos que participan en las misiones, etc. Luego: g.Clasifica las variables según su nivel de medición h.Realiza el proceso de recolección de datos (con al menos 20 observaciones, muestras) i. Elabora la distribución de frecuencias para ambos casos j. Selecciona el gráfico que más se adecue a tu variable y presenta en los resultados obtenidos. k.Calcula la media aritmética, la mediana y la moda de las variables estudiadas, con su respectiva medida de dispersión (Varianza y desviación estándar) Respuesta Abierta según los datos obtenidos
3) Calcula la media, mediana y la moda de las edades de tu grupo familiar Respuesta Abierta según los datos obtenidos 4) Calcula la razón de postes de alumbrado público en buen y mal estado que están en el trayecto que va desde tu casa hasta tu sitio de estudio o de trabajo. Respuesta Abierta según los datos obtenidos
Bibliografía
KAZMIER, L. (1998) Estadística Aplicada a la Administración y a la Economía. Mac Graw Hill. México LIND, D, Mason, R y Marchal, W (2001) Estadística para Administración y
Economía. Mac Graw Hill. México. RIVAS, E. (2000) Estadística General. Ediciones de la Biblioteca. UCV. Caracas WEBSTER, A. (2000) Estadística aplicada a los Negocios y a la Economía . Mac Graw Hill, Santa Fé de Bogotá.