Trabajo Trabajo de metrología y control de calidad
Presentado por: Cristian Vanegas Martínez Jesús Antonio Doria Camilo Piñeres Petro
A: ng! Val"ry #anc$eros
%&V'()DAD D' C*(D*+A ,AC%#TAD D' &-'&'(A) &-'&'(* M'C.&CA
M*&T'(A/C*(D*+A
&T(*D%CC*& Mediante el presente trabajo presentaremos información sobre las medidas de dispersión de tendencia central, de dispersión así como las herramientas de control estadístico, entre ellas la tabla t student. En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersión, por cuanto que estn referidos a la variabilidad que exhiben los valores de las observaciones, !a que si no hubiere variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran ma!oría de las medidas de la estadística descriptiva. "as medidas de tendencia central tienen como objetivo el sinteti#ar los datos en un valor representativo, las medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia central son representativas como síntesis de la información. "as medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. $istinguimos entre medi medida dass de dispe dispers rsió ión n absol absolut utas as,, que que no son son comp compara arabl bles es entr entre e dife difere rent ntes es muestras ! las relativas que nos permitirn comparar varias muestras.
*bjeti0os -eneral: %onocer %onocer las herramientas herramientas estadísticas estadísticas disponibles disponibles para reconocer reconocer si la los resultados de un proceso estn dentro son los idóneos para ser o no aceptados.
'speci1icos: &den &dentitifificar car las las dife difere rent ntes es tende tendenc ncia iass de medi medida dass !a sean sean centr central al o de dispersión. 'aber el uso adecuado de la tabla t student para el control estadístico de un proceso.
Medidas de tendencia central "as medida sirven como como medidass de tenden tendencia cia centra centrall 2media 2media33 median medianaa y moda4 moda4 sirven puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.
Media aritm"tica: Ms conoci conocida da como como medi repres esen enta ta por por medi medio o de una una mediaa o prom promedi edio o. 'e repr letra M o por una 5 con una línea en la parte superior. $ado un conjunto numérico de datos, x (, x ), ..., x n, se define su media aritmética como
Propiedades • • • •
"as principales propiedades de la media aritmética son* 'u clculo es mu! sencillo ! en él intervienen todos los datos. 'u valor es +nico para una serie de datos dada. 'e usa usa con con frec frecue uenc ncia ia para para comp compar arar ar pobl poblac acio ione nes, s, aunq aunque ue es ms ms apropiado acompaarla de una medida de dispersión.
ncon0enientes de s6 6so En el clculo de la media no todos los valores contribu!en de la misma manera. "os valores altos tienen ms peso que los valores cercanos a cero. -o es confiable para datos mu! dispersos. 'u valor no siempre hace parte de la realidad, porque es un promedio por ejemplo* a veces el valor que uno espera no debe contar con puntos decimales. Media m6estral Esencialmente, la media muestral es el mismo parmetro que el anterior, aunque el adje adjetitivo vo mues muestr tral al se aplic aplica a a aquel aquella lass situ situac acio ione ness en las las que que la medi media a aritmética se calcula para un subconjunto subconjunto de de la población objeto de estudio. "a media muestral es un parmetro de extrema importancia en la inferencia estadística,, siendo de gran utilidad para la estimación estadística estimación de de la media poblacional, entre otros usos.
Moda 2Mo4 Es la medida que indica cual dato tiene la mayor 1rec6encia en un conjunto de datos/ o sea, cual se repite ms.
Propiedades •
%lculo sencillo.
•
&nterpretación mu! clara.
•
Al depender sólo de las frecuencias, puede calcularse para variables cualitativas.
Des0entajas •
•
•
•
'u valor es independiente de la ma!or parte de los datos, lo que la hace mu! sensible a variaciones muestrales. 0or otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del n+mero de intervalos ! de su amplitud. 1sa mu! pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor. -o siempre se sit+a hacia el centro de la distribución. 0uede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia 2distribuciones bimodales o multimodales3.
Mediana "a mediana representa el valor de la variable de posición central en un conjunto de datos ordenados. Existen dos métodos para el clculo de la mediana* (. %onsiderando los datos en forma individual, sin agruparlos. ). 1tili#ando los datos agrupados en intervalos de clase.
A continuación veamos cada una de ellas.
Datos sin agr6par 'ean los datos de una muestra ordenada en orden creciente ! designando la mediana como 2 3, distinguimos dos casos* una ve# a4 'i n es impar , la mediana es el valor que ocupa la posición que los datos han sido ordenados 2en orden creciente o decreciente3, porque éste es el valor central. Es decir* . 0or ejemplo, si tenemos 4 datos, que ordenados son* ,
,
, , 56 El valor central es el tercero* . Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo 2 , 3 ! otros dos por encima de él 2 , 3. b3 'i n es par , la mediana es la media aritmética de los dos valores centrales. %uando es par, los dos datos que estn en el centro de la muestra ocupan las posiciones ! . Es decir* . 0or ejemplo, si tenemos 7 datos, que ordenados son* , , , , , 56 8a! dos valores que estn por debajo del ! otros dos que quedan por encima del siguiente dato . 0or tanto, la mediana de este grupo de datos es la media aritmética de estos dos datos*
.
Datos agr6pados Al tratar con datos agrupados, si n / 2 coincide con el valor de una frecuencia acumulada, el valor de la mediana coincidir con la abscisa correspondiente. 'i no coincide con el valor de ninguna abscisa, se calcula a través de semejan#a de
tringulos en el histograma o polígono de frecuencias acumuladas, utili#ando la siguiente equivalencia*
$onde
!
son las frecuencias absolutas acumuladas tales que
, ! son los extremos, interior ! exterior, del intervalo donde se alcan#a la mediana ! es la abscisa a calcular, la mediana. 'e observa que es la amplitud de los intervalos seleccionados para el diagrama.
,orm6la general
'jemplos para datos agr6pados Entre (.49 ! (.79 Entre (.79 ! (.:9 Entre (.:9 ! (.;9 ha! < estudiantes.
ha! ha!
) 4
estudiantes. estudiantes.
). 8allar la mediana de la distribución estadística que viene dada por la siguiente tabla* =(9, (43 f i <
=(9, (43 =(4, )93 =)9, )43 =)4, <93 =<9, <43
=(4, )93 4
=)9, )43 :
=)4, <93 >
=<9, <43 )
f i
?i
< 4 : > )
< ; (4 (@ )(
)( 21 2
=10.5 M =20 + e
(
10.5
)
−8 ( ) 5
7
Medidas de dispersi7n "as medidas de dispersi7n, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un n+mero, si las diferentes puntuaciones de una variable estn mu! alejadas de la media. %uanto ma!or sea ese valor, ma!or ser la variabilidad, cuanto menor sea, ms homogénea ser a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. 0ara calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. 0ero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. 1na es tomando las desviaciones en valor absoluto 2desviación media3 ! otra es tomando las desviaciones al cuadrado 2varian#a3.
(ango estadístico El rango o recorrido interartic6lar es la di1erencia entre el 0alor m89imo y el 0alor mínimo en 6n gr6po de números aleatorios! )e le s6ele simbolizar con B. (e6isitos del rango •
Crdenamos los n+meros seg+n su tamao.
•
estamos el valor mínimo del valor mximo
'jemplo 0ara la muestra 2;, :, 7, @, >, 43, el dato menor es > ! el dato ma!or es @. 'us valores se encuentran en un rango de*
Medio rango o (ango medio El medio rango o rango medio de un conjunto de valores numéricos es la media del ma!or ! menor valor, o la tercera parte del camino entre el dato de menor valor ! el dato de ma!or valor. En consecuencia, el medio rango es*
'jemplo 0ara una muestra de valores 2<, <, 4, 7, ;3, el dato de menor valor Min5 ; ! el dato de ma!or valor Max5 <. El medio rango resolviéndolo mediante la correspondiente fórmula sería*
epresentación del medio rango*
Varianza "a varian#a es una medida estadística que mide la dispersión de los valores respecto a un valor central 2media3, es decir, es el cuadrado de las desviaciones*
0ropiedades •
•
"a varian#a es siempre positiva o 9* 'i a los datos de la distribución les sumamos una cantidad constante la varian#a no se modifica.
Des0iaci7n est8ndar "a varian#a a veces no se interpreta claramente, !a que se mide en unidades cuadrticas. 0ara evitar ese problema se define otra medida de dispersión, que es la desviación típica, o desviación estndar , que se halla como la raí# cuadrada positiva de la varian#a. "a desviación estndar informa sobre la dispersión de los datos respecto al valor de la media/ cuanto ma!or sea su valor, ms dispersos estarn los datos. Esta medida viene representada en la ma!oría de los casos por ), dado que es su inicial de su nominación en inglés. $esviación estndar muestral
$esviación estndar poblacional
Coe1iciente de 0ariaci7n En estadística, cuando se desea hacer referencia a la relación entre el tamao de la media ! la variabilidad de la variable, se utili#a el coe1iciente de 0ariaci7n.
'u fórmula expresa la desviación estndar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estndar. 0or otro lado presenta problemas !a que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. 0or ello es importante que todos los valores sean positivos ! su media dé, por tanto, un valor positivo. A ma!or valor del coeficiente de variación ma!or heterogeneidad de los valores de la variable/ ! a menor %.D., ma!or homogeneidad en los valores de la variable. 'uele representarse por medio de las siglas C!V! Exigimos que* 'e calcula*
$onde es la desviación típica. 'e puede dar en tanto por ciento calculando*
Propiedades y aplicaciones •
•
•
•
El coeficiente de variación no posee unidades. El coeficiente de variación es típicamente menor que uno. 'in embargo, en ciertas distribuciones de probabilidad puede ser ( o ma!or que (. 0ara su mejor interpretación se expresa como porcentaje. $epende de la desviación típica, también llamada desviación estndar, ! en ma!or medida de la media aritmética, dado que cuando ésta es 9 o mu! próxima a este valor el %.D. pierde significado, !a que puede dar valores mu! grandes, que no necesariamente implican dispersión de datos.
Distrib6ci7n normal En estadística ! probabilidad se llama distrib6ci7n normal, distrib6ci7n de -a6ss o distrib6ci7n ga6ssiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada en fenómenos reales. "a grfica de su función de densidad tiene una forma acampanada ! es simétrica respecto de un determinado parmetro estadístico. Esta curva se conoce como campana de auss ! es el grfico de una función gaussiana. "a importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales ! psicológicos. Mientras que los mecanismos que sub!acen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
mportancia de la distrib6ci7n normal "a distribución normal es de suma importancia en estadística por tres ra#ones principales* (. -umerosas variables continuas de fenómenos aleatorios tienden a comportarse probabilísticamente mediante ésta.
). Es el límite al que convergen tanto variables aleatorias continuas como discretas. <. 0roporciona la base de la inferencia estadística clásica debido a su relación con el teorema del límite central .
Propiedades de la distrib6ci7n normal (. 'u grafica tiene forma acampanada. ). El valor esperado, la mediana ! la moda tienen el mismo valor cuando la variable aleatoria se distribu!e normalmente. <. 'u dispersión media es igual a (.<< desviación estndar. Es decir, el alcance intercuartil est contenido dentro de un intervalo de dos tercios de una desviación estndar por debajo de la media a dos tercios de una desviación estndar por encima de la media.
En la prctica, algunas de las variables que observamos sólo pueden aproximar éstas propiedades. Así que si el fenómeno puede mediarse aproximadamente mediante la distribución normal se tendr* (. Fue el polígono puede verse en forma de campana ! simétrico. ). 'us mediciones de tendencia central tienen bastante parecido. <. El valor intercuartil puede diferir ligeramente de (.<< desviaciones estndar. >. El dominio de la variable aleatoria normalmente distribuida generalmente caer dentro de < desviaciones estndar por encima ! por debajo de la media. 4. "a probabilidad equivale al rea encerrada bajo la curva.
'l modelo matem8tico
El modelo o expresión matemtica que representa una función de densidad de probabilidad se denota mediante el símbolo f ( x ) . 0ara la distribución normal, se tiene la siguiente función de probabilidad.
$onde e
es la constante matemtica aproximada por ).:(;);
π es la constante matemtica aproximada por <.(>(4@
0armetros X es cualquier valor de la variable aleatoria continua, donde
Así,
A continuación se presentan las grficas de las funciones de densidad -ormal con el objetivo de observar cambios en la distribución de probabilidad* %aso (* %uando se mantiene la misma media, pero cambia la varian#a. Ejemplo*
%aso )* %uando se mantiene la misma varian#a, pero cambia la media. Ejemplo* 2
!
3
Ahora, al examinar la primera ! segunda derivada de otras propiedades de la curva normal*
f ( x ) , se pueden listar
(. "a moda, que es el punto sobre el eje hori#ontal donde la curva es un mximo ocurre cuando . ). "a curva es simétrica alrededor de un eje vertical a través del valor esperado .
<. "a curva tiene sus puntos de inflexión en , es cóncava hacia abajo si , ! es cóncava hacia arriba en cualquier otro punto. >. "a curva normal se aproxima al eje hori#ontal de manera asintótica conforme nos alejamos de la media en cualquier dirección.
Distrib6ci7n normal est8ndar - 29, (3 "a distrib6ci7n normal est8ndar3 o tipi1icada o red6cida3 es aquella que tiene por media el valor cero, = >?, ! por des0iaci7n típica la 6nidad3 @ > .
#a probabilidad de la 0ariable 5 depender8 del 8rea del recinto sombreado en la 1ig6ra. G para calcularla utili#aremos una tabla. Tipi1icaci7n de la 0ariable 0ara poder utili#ar la tabla tenemos que transformar la variable 5 que sigue una distribución & 2=3 @4 en otra variable B que siga una distribución & 2?3 4.
%lculo de probabilidades en distribuciones normales "a tabla nos da las probabilidades de P2z 4 , siendo z la variable tipificada. Estas probabilidades nos dan la 16nci7n de distrib6ci7n E24.
E24 > P2z 4 H+squeda en la tabla de valor de I %nidades y d"cimas en la columna de la i#quierda.
Cent"simas en la fila de arriba.
02J K a3
02J 6 a3 5 ( L 02J K a3
02J K a3 5 ( 02J K a3
02J 6 a3 5 02J K a3
02a N J K b 3 5 02J K b3 02J K a3
02b N J K a 3 5 02a N J K b 3 -os encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad ! se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el 0alor 6e m8s se apro9ime a F.
02a N J K b 3 5 02J K b3 = ( 02J K a3O
p5P
,6nci7n ga6ssiana
%urvas gaussianas con distintos parmetros.
?orma tridimensional. En estadística, la 16nci7n ga6ssiana 2en honor a %arl ?riedrich auss3 es una función definida por la expresión*
$onde a, b ! c son constantes reales 2a 6 93. "as
funciones
gaussianas
se
utili#an
frecuentemente
en
estadística
correspondiendo, en el caso de que a sea igual a , a la función de densidad de una variable aleatoria con distribución normal de media Q5b ! varian#a R)5c).
Propiedades •
"as gaussianas se encuentran entre las funciones elementales, aunque no poseen primitivas elementales. 'in embargo, el valor exacto de la integral impropia sobre todo el rango real puede derivarse a partir del valor de la integral de auss obteniéndose que*
El valor de la integral es ( si ! solo si , en cu!o caso la función gaussiana es la función de densidad de una variable aleatoria con distribución normal de media Q5b ! varian#a R)5c). 'e muestran varias grficas de funciones gaussianas en la imagen adjunta. •
"as funciones gaussianas con c) 5 ) son las autofunciones de la transformada de ?ourier . Esto significa que la transformada de ?ourier de
una función gaussiana no es sólo otra gaussiana, sino adems un m+ltiplo escalar de la función original. •
"a grfica de la función es simétrica con forma de campana, conocida como campana de -a6ss. El parmetro a es la altura de la campana centrada en el punto b, determinando c el ancho de la misma.
Aplicaciones "a primitiva de una función gaussiana es la función error . Estas funciones aparecen en numerosos contextos de las ciencias naturales, ciencias sociales, matemticas e ingeniería. Algunos ejemplos* •
•
•
•
•
•
•
En estadística ! teoría de probabilidades, las funciones gaussianas aparecen como la función de densidad de la distrib6ci7n normal, la cual es una distribución de probabilidad límite de sumas complicadas, seg+n el teorema del límite central. 1na función gaussiana es la función de onda del estado fundamental del oscilador armónico cuntico. "os orbitales moleculares usados en química computacional son combinaciones lineales de funciones gaussianas llamados orbitales gaussianos. Matemticamente, la función gaussiana juega un papel importante en la definición de los polinomios de 8ermite. %onsecuentemente, estn también asociadas con el estado de vacío en la teoría cuntica de campos. "os ra!os gaussianos se usan en sistemas ópticos ! de microondas. "as funciones gaussianas se utili#an como filtro de suavi#ado en el procesamiento digital de imgenes.
Gerramientas estadísticas 'on herramientas que a!udan a resolver problemas estadísticos de manera fcil ! adecuada existen varias herramientas estadísticas las cuales son +tiles para algunas situaciones especificas Entre las cuales tenemos* • •
8istogramas tablas de frecuencia tabla t student
Gistograma 1na grfica de la distribución de un conjunto de medidas. 1n 8istograma es un tipo especial de grfica de barras que despliega la variabilidad dentro de un proceso. 1n 8istograma toma datos variables 2tales como alturas, pesos, densidades, tiempo, temperaturas, etc.3 ! despliega su distribución. "os patrones inusuales o sospechosos pueden indicar que un proceso necesita investigación para determinar su grado de estabilidad.
%sos • • •
•
Mostrar el resultado de un cambio en el sistema &dentificar anormalidades examinando la forma %omparar la variabilidad con los límites de especificación %uando se quiere comprender mejor el sistema, específicamente al* 8acer seguimiento del desempeo actual del proceso, 0robar ! evaluar las revisiones de procesos para mejorar
$esde un sistema estable, se pueden hacer predicciones sobre el desempeo futuro del sistema. 1n equipo para efectuar mejoras utili#a un 8istograma para evaluar la situación actual del sistema ! para estudiar resultados. "a forma del 8istograma ! la información de estadísticas le a!udan al equipo a saber cómo mejorar el sistema. $espués de que una acción por mejorar es tomada, el equipo continua recogiendo datos ! haciendo 8istogramas para ver si la teoría ha funcionado.
"os pasos en su construcción son los siguientes* (.
&dentificar el objetivo del uso del histograma ! reunir los datos necesarios.
). &dentificar los valores mximos ! mínimos ! calcular el rango, es decir, la dimensión del intervalo existente entre esos dos valores. <.
$eterminar el n+mero de barras a representar.
>.
Establecer la anchura de las barras.
4.
%alcular los límites inferior ! superior de cada barra.
7.
$ibujar el histograma.
:.
Anali#ar el histograma ! actuar con los resultados.
Ventajas •
•
"os rectngulos muestran cada clase de la distribución por separado. El rea de cada rectngulo, en relación con el resto, muestra la proporción del n+mero total de observaciones que se encuentran en esa clase. 'u construcción a!udar a comprender la tendencia central, dispersión ! frecuencias relativas de los distintos valores. Muestra grandes cantidades de datos dando una visión clara ! sencilla de su distribución.
Des0entajas de s6 6so • •
•
"as observaciones individuales se pierden. "a selección del n+mero de clases ! su amplitud que adecuadamente representen la distribución puede ser complicado. 1n histograma con mu! pocas clases agrupa demasiadas observaciones ! uno con muchas deja mu! pocas en cada clase.
Tabla de 1rec6encias 1na tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada característica en que se han dividido los datos, nos permite organi#ar los datos de tal manera que nos sirvan para la toma de decisiones.
%sos: •
•
"as tablas de frecuencia se usan ms que todo en los censos de población, sondeos de opinión p+blica, estudios del comportamiento humano, etc. 'irve ms que todo para medir frecuencias
Ventajas: • •
• •
'imple de interpretar "as tablas de frecuencias son fciles de leer ! de entender, !a que en su ma!oría tienen tres columnas que muestran el valor total ! la frecuencia epresentan un gran tamao de datos El agrupamiento de una gran cantidad de datos en intervalos o grupos de clase a!uda a resumir ! condensar gran cantidad de datos en un formato funcional
Des0entajas: •
•
Tablas grandes: los grandes vol+menes de datos requieren que formules muchos intervalos de clase para la precisión que requiere la construcción de muchas células de precisión, por lo tanto, dificultando el anlisis de estos datos. "as tablas grandes pueden ser difíciles de presentar, interpretar ! comprender. n1ormaci7n inadec6ada: Aunque las estadísticas como cuadrados se utili#an para determinar la relación entre las columnas ! las tablas en una tabla de frecuencias, solo comprueban una hipótesis nula de si existe alguna asociación. 0or consiguiente, ofrecen información inadecuada sobre la actual asimetría, cutrosa, relación ! distribución de los valores de datos.
nter0alos de clase 0ueden utili#arse dos métodos para formular intervalos de clase* intervalos cerrados, como de 4 a (9, o intervalos abiertos como ms de 44 o menos de <9. "os grandes vol+menes de datos dificultan llegar a los intervalos de clase adecuados representativos de todos los valores. Adems, los intervalos de clase abiertos no hacen hincapié en los valores extremos ni en los rangos.
Procedimiento para constr6ir 6na tabla de 1rec6encia 0ara construir una distribución de frecuencias en clases seguimos el siguiente procedimiento aplicado al ejemplo* "os puntajes de un examen de ingreso a la universidad reali#ado por >9 alumnos son los siguientes* ((9,(9),(9;,((4,()9,(<9,@<,()>,((),(9),((9,(9;,(9;,(9@,((9@9,@4,@;,(9>,()>, (<9,@:,()4,(<7,(>9,(9>,(9;,@7,(97,(9:,(9<,@),()),@<,@@,(9:,(94,(9<,((4,((9 0aso (.
$eterminamos el rango de variación de los datos que se define como* 5 Smx L Smin, donde el primero es el dato mximo ! el segundo es el dato mínimo. 0ara el ejemplo Smx 5 (>9 ! Smin 5 @9 entonces
5 (>9 L @9 5 49.
0aso ). $eterminamos el n+mero de intervalos o clases I. I 5 raí# 2n3 es decir raí# 2>93 5 7,<) que también se redondea al entero siguiente quedando P 5 : 0aso <. %alculamos la amplitud de clase 2A3, que corresponde a la cantidad de datos que van en esa clase, dividiendo el rango entre el n+mero de clases I* A 5 sustitu!endo A 5 49 se redondea a ;. P5: 0aso >. %onstruimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma 2"i, "s3. 0ara formar las clases comen#aremos con los límites inferiores* • •
En la primer clase tomamos "i ( 5 Smin 2 el dato ms pequeo3 0ara las dems clases el límite inferior se obtiene sumando la Smin con la amplitud, es decir*
"i n 5 "i n ( T A. 0ara nuestro ejemplo 5 @9 ! A 5 ; Entonces las : clases quedan* %lases
%lculos
"ímites inferiores
"i ( 5 Smin
@9
@9
"i ) 5 "i ( T A
@9 T ; 5 @;
@;
"i < 5 "i ) T A
@; T ; 5 (97
(97
"i > 5 "i < T A
(97 T ; 5 ((>
((>
"i 4 5 "i > T A
((> T ; 5 ())
())
"i 7 5 "i 4 T A
()) T ; 5 (<9
(<9
"i : 5 "i 7 T A
(<9 T ; 5 (<;
(<;
0ara obtener los límites superiores se toma el valor anterior al límite inferior de la clase siguiente ! se va sumando la amplitud A 5 ; %lases "i "ímites superiores "s "s ( 5 SminL(TA @9
@:
"s ) 5 "s ( T A
@;
Uomar el
(94
"s < 5 "s ) T A
(97
valor
((<
"s > 5 "s < T A
((>
anterior a @;
()(
"s 4 5 "s > T A
())
! sumamos
()@
"s 7 5 "s 4 T A
(<9
la amplitud ;
(<:
(<;
(>4
?inalmente !a podemos elaborar las clases con sus respectivas frecuencias, recordando que cada clase abarca todos los valores que van desde el límite inferior hasta el superior. %lases f @9
:
@; V (94 (97 V ((<
@ (<
((> L ()(
<
()) V ()@
>
(<9 V (<:
<
(<; V (>4
(
Uotal
>9
Datos ordenados:
@9 @) @< @< @4 @7 @: @; @@ (9) (9) (9< (9< (9> (9> (94 (97 (9: (9: (9; (9; (9; (9; (9@ ((9 ((9 ((9 ((9 (() ((4 ((4 ()9 ()) ()> ()> ()4 (<9 (<9 (<7 (>9
P6nto Medio 0.M 5 2"i T "s3 )3 se suman los límites de clase ! el resultado se divide entre dos.0ara nuestro ejemplo obtendríamos los siguientes puntos medios* %lases
Mi
f
@9
@<,4
:
@; L (94
(9(,4
@
(97 L ((<
(9@,4
(<
((>W()(
((:,4
<
()) L ()@
()4,4
>
(<9 L (<:
(<<,4
<
(<; L (>4
(>(,4
(
Uotal
>9
Tabla t st6dent En probabilidad ! estadística, &a distribuciónLt o distribución t de 'tudent es una distribución de probabilidad que surge del problema de estimar &a media de una población normalmente distribuida cuando el tamao de &a muestra es pequeo. A &a teoría de pequeas muestras también se le llama teoría exacta del muestreo, !a que también &a podemos utili#ar con muestras aleatorias de tamao grande. Deremos un nuevo concepto necesario para poder entender la distribución t 'tudent. Este concepto es Xgrados de libertadY.
0ara definir grados de libertad se har referencia a &a varian#a maestral* $istribución de probabilidad t student* 1na variable aleatoria se distribu!e seg+n el modelo de probabilidad t o U de 'tudent con I grados de libertad, donde I es un entero positivo, si su función de densidad es &a siguiente*
"a grfica de esta función de densidad es simétrica, respecto del eje de ordenadas, con independencia del valor de I, ! de forma algo semejante a &a de una distribución normal*
'u valor medio ! varian#a son*
"a siguiente figura presenta &a grfica de varias distribuciones t. "a apariencia general de &a distribución t es similar a &a de &a distribución normal estndar* ambas son simétricas ! unimodales, ! el valor mximo de &a ordenada se alcan#a en &a media Q 5 C. 'in embargo, &a distribución t tiene colas ms amplias que &a normal/ esto es, &a probabilidad de las colas es ma!or que en &a distribución normal. A medida que el n+mero de grados de libertad tiende a infinito, &a forma límite de &a distribución t es &a distribución normal estndar.
Propiedades de la distrib6ci7n t: •
%ada curva t tiene forma de campana con centro en 9.
•
%ada curva t, est ms dispersa que &a curva normal estndar.
•
A medida que I aumenta, &a dispersión de &a curva t correspondiente disminu!e.
A medida que IL6 Z, la secuencia de curvas t se aproxima a &a curva normal estndar "a 0rueba de 8ipótesis para medias usando $istribución t de 'tudent se usa cuando se cumplen las siguientes dos condiciones* •
Es posible calcular las media ! la desviación estndar a partir de la muestra. El tamao de la muestra es menor a <9. El procedimiento obedece a los 4 pasos esenciales*
Paso 0lantear 8ipótesis -ula 28o3 e 8ipótesis Alternativa 28i3. •
•
"a 8ipótesis alternativa plantea matemticamente lo que queremos demostrar. "a 8ipótesis nula plantea exactamente lo contrario.
Paso H $eterminar -ivel de 'ignificancia. 2ango de aceptación de hipótesis alternativa3. α 'e considera* 9.94 para pro!ectos de investigación. 9.9( para aseguramiento de calidad. 9.(9 para encuestas de mercadotecnia ! políticas
Paso ;: Evidencia Muestral. 'e calcula la media ! la desviación estndar a partir de la muestra.
Paso I: 'e aplica la $istribución t de 'tudent para calcular la probabilidad de error 203 por medio de la fórmula*
Paso : En base a la evidencia disponible se acepta o se recha#a la hipótesis alternativa. 'i la probabilidad de error 203 es ma!or que el nivel de significancia* 'E E%8AJA 8&0[UE'&' A"UE-AU&DA. 'i la probabilidad de error 203 es menor que el nivel de significancia* 'E A%E0UA 8&0[UE'&' A"UE-AU&DA. 'jemplo: •
•
'e aplica una prueba de autoestima a )4 personas quienes obtienen una calificación promedio de 7).( con una desviación estndar de 4.;< 'e sabe que el valor correcto de la prueba debe ser ma!or a 79. \Existe suficiente evidencia para comprobar que no ha! problemas de autoestima en el grupo seleccionado]
%onsidera un nivel de significancia de 9.94
Paso : Gip7tesis Alternati0a 2Gi4: "o que se quiere comprobar El grupo no tiene problemas de autoestima. Dalor de autoestima ma!or a 7 9. Gip7tesis &6la 2Go4: "o contrario a la 8ipótesis Alternativa El grupo tiene problemas de autoestima. Dalor de autoestima menor a 79. Paso H: $eterminar nivel de significancia* α 0,05 Paso ;: Evidencia Muestral =
Paso I: Aplicando la $istribución de 0robabilidad %alculando t^*
Huscando en la tabla de $istribución de t de 'tudent, encuentras el valor del rea*
Paso : esultados* 0or lo tanto el grupo no tiene problemas de auto estima.
%sos para los c6ales es adec6ada esta distrib6ci7n: 0ara determinar el intervalo de confian#a dentro del cual se puede estimar &a media de una población a partir de muestras pequea 2n N <93. •
•
•
0ara probar hipótesis cuando una investigación se basa en muestreo pequeo. 0ara probar si dos muestras provienen de una misma población.
Características: En muchas ocasiones no se conoce R ! el n+mero de observaciones en la muestra n N <9. En estos casos, se puede utili#ar la desviación estndar de la muestra s como una estimación de R, pero no es posible usar la distribución J como estadístico de prueba. El estadístico de prueba adecuado es la distribución t. 'us aplicaciones en la inferencia estadística son para estimar ! probar una media ! una diferencia de medias 2independiente ! pareada3. -rados de libertad: -umero de valores que podemos elegir libremente, existe una distribución t distinta para cada uno de los posibles grados de libertad.
Tabla t st6dent "a tabla que utili#amos recoge los valores de distintos cuantiles para distintos grados de libertad.
'jemplo %on 4 grados de libertad, el cuantil 9.@4 es ).9(4
Di1erencia con otras tablas: •
•
•
"a tabla de distribución t es ms compacta que # ! muestra las reas ! valores de t para unos cuantos porcentajes exclusivamente 2(9_,4_,)_ ! (_3 1na segunda diferencia de la tabla es que no se centra en la probabilidad de que el parmetro de la población que est siendo estimado caiga dentro del intervalo de confian#a. 0or el contrario, mide la probabilidad de que ese parmetro no caiga dentro del intervalo de confian#a 1na tercera diferencia en el empleo de la tabla consiste en que hemos de especificar los grados de libertad con que estamos trabajando.
%sos de la tabla: "os grados de libertad de una t de 'tudent se indicaran como v. $e manera anloga a la definición utili#ada para la -ormal, si S es una t v,` de 'tudent con v grados de libertad, entonces* El valor t v, ` se busca en las tablas de la t de 'tudent. • •
•
mportancia del est6dio de la distrib6ci7n T! 'i al aplicar muestreo no es posible extraer muestras ma!ores a <9 elementos, la utili#ación de la distribución normal presenta grandes riesgos estadísticos. 0ara ello, la teoría de pequeas muestras presenta como alternativa a la distribución tL student, en el entendido de que conforme el tamao de la muestra tienda a <9 elementos, la distribución tLstudent tiende a la distribución normal. 0or ello es importante el estudiar la distribución U de student !a que toda inferencia estadística que se desee reali#ar con muestras pequeas tiene ms valide# si se hace con la distribución tLstudent.
Concl6si7n %ualquier empresa que necesite una mejora entender la necesidad de la estadística. Ga que la estadística proporciona los medios para medir ! controlar los procesos de producción para minimi#ar las variaciones que conducen a error o residuos ! para garanti#ar la coherencia en el proceso. Esto ahorra dinero al reducir las cantidades de material utili#ado para fabricar o rehacer productos, así como los materiales perdidos por exceso ! desechos, ms el costo por valide# de las garantías debido al envío de productos defectuosos. 0or esto es tan importante todas las herramientas antes mencionadas !a que gracias a ellas se optimi#an los procesos ! se les hace su debida verificación de calidad.