Estadística para la investigación en seguridad pública públi ca Unidad 2. Estadística inferencial para una población
Licenciatura en Seguridad Pública 5°Cuatrimestre Programa de la asignatura: Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Clave: 010920518/020920518 Universidad Abierta y a Distancia de México
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
1
Estadística para la investigación en seguridad pública públi ca Unidad 2. Estadística inferencial para una población Índice Unidad 2. Estadística Estadística inferencial para una población población ........................................................... 3 Presentación Presentación de la unidad ................................................................................................... 3 Propósitos............................................................................................................................ 3 Competencia Competencia específica específica....................................................................................................... 3 Presentación Presentación de la unidad ................................................................................................... 4 2.1. Estimación puntual y por intervalo de la media ............................................................. 5 2.1.1. Estimador puntual y sus propiedades ........................................................................ 6 2.1.2. Distribución muestral de la media, normal y “t de Student” ........................................ 7
2.1.3. Teorema del límite central........................................................................................ 14 2.1.4. Intervalo de confianza confianza para la media........................................................................ 14 2.2. Estimación puntual y por intervalo de la proporción .................................................... 17 2.2.1. Estimador puntual y sus propiedades ...................................................................... 18 18 2.2.2. Distribución muestral de la proporción proporción ..................................................................... 18 2.2.3. Cálculo de un intervalo de confianza para la proporción .......................................... 19 Actividad 1. Estimadores Estimadores puntuales puntuales ................................................................................... 21 Actividad 2. Estimaciones Estimaciones puntuales puntuales e intervalos intervalos de confianza confianza .......................................... 22 2.3. Prueba de hipótesis .................................................................................................... 22 2.3.1. Conceptos generales de la metodología .................................................................. 23 2.3.2. Prueba de hipótesis de la media .............................................................................. 25 2.3.3 Relación entre una prueba de hipótesis de la media y un intervalo de confianza ...... 31 2.3.4. Prueba de hipótesis de la proporción proporción ....................................................................... 32 2.3.5. Relación entre una prueba de hipótesis de la proporción y un intervalo de confianza34 Actividad 3. Pruebas de hipótesis hipótesis ...................................................................................... 35 Actividad 4. Problemario Problemario .................................................................................................... 36 Autoevaluación Autoevaluación .................................................................................................................. 36 Evidencia de aprendizaje. Resolución de ejercicios sobre pruebas de hipótesis e intervalos de confianza confianza ...................................................................................................................... 37 Actividades Actividades de Autorreflexió Autorreflexión n............................................................................................. 37 Cierre de la unidad ............................................................................................................ 38 Fuentes de consulta .......................................................................................................... 39 Fuentes cibergráficas cibergráficas......................................................................................................... 39
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
2
Estadística para la investigación en seguridad pública públi ca Unidad 2. Estadística inferencial para una población Índice Unidad 2. Estadística Estadística inferencial para una población población ........................................................... 3 Presentación Presentación de la unidad ................................................................................................... 3 Propósitos............................................................................................................................ 3 Competencia Competencia específica específica....................................................................................................... 3 Presentación Presentación de la unidad ................................................................................................... 4 2.1. Estimación puntual y por intervalo de la media ............................................................. 5 2.1.1. Estimador puntual y sus propiedades ........................................................................ 6 2.1.2. Distribución muestral de la media, normal y “t de Student” ........................................ 7
2.1.3. Teorema del límite central........................................................................................ 14 2.1.4. Intervalo de confianza confianza para la media........................................................................ 14 2.2. Estimación puntual y por intervalo de la proporción .................................................... 17 2.2.1. Estimador puntual y sus propiedades ...................................................................... 18 18 2.2.2. Distribución muestral de la proporción proporción ..................................................................... 18 2.2.3. Cálculo de un intervalo de confianza para la proporción .......................................... 19 Actividad 1. Estimadores Estimadores puntuales puntuales ................................................................................... 21 Actividad 2. Estimaciones Estimaciones puntuales puntuales e intervalos intervalos de confianza confianza .......................................... 22 2.3. Prueba de hipótesis .................................................................................................... 22 2.3.1. Conceptos generales de la metodología .................................................................. 23 2.3.2. Prueba de hipótesis de la media .............................................................................. 25 2.3.3 Relación entre una prueba de hipótesis de la media y un intervalo de confianza ...... 31 2.3.4. Prueba de hipótesis de la proporción proporción ....................................................................... 32 2.3.5. Relación entre una prueba de hipótesis de la proporción y un intervalo de confianza34 Actividad 3. Pruebas de hipótesis hipótesis ...................................................................................... 35 Actividad 4. Problemario Problemario .................................................................................................... 36 Autoevaluación Autoevaluación .................................................................................................................. 36 Evidencia de aprendizaje. Resolución de ejercicios sobre pruebas de hipótesis e intervalos de confianza confianza ...................................................................................................................... 37 Actividades Actividades de Autorreflexió Autorreflexión n............................................................................................. 37 Cierre de la unidad ............................................................................................................ 38 Fuentes de consulta .......................................................................................................... 39 Fuentes cibergráficas cibergráficas......................................................................................................... 39
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
2
Estadística para la investigación en seguridad pública públi ca Unidad 2. Estadística inferencial para una población Unidad 2. Estadística inferencial para una población Presentación de la unidad En la presente unidad se describe el propósito de la estadística inferencial; se presenta el significado de estimador puntual y por intervalo, de distribución muestral, y se analiza cómo obtener conclusiones acerca de una población a partir de una muestra. Se estudian únicamente dos distribuciones muestrales: la de la media y la de la proporción. Se presentan las condiciones, características y metodología para determinar sus estimadores puntuales y por intervalo. De igual manera, se presenta y analiza el significado de realizar una prueba de hipótesis, de la metodología que se sigue para hacerla y se realizan pruebas de hipótesis para la media y la proporción. Finalmente, se muestra la relación entre una prueba de hipótesis y un intervalo de confianza.
Propósitos Los propósitos de esta unidad son:
Comprender los alcances de la estadística inferencial. Comprender el significado de estimador puntual y por intervalo. Determinar los estimadores puntuales y por intervalo de las distribuciones muestrales de la media y la proporción. Comprender y utilizar la metodología de las pruebas de hipótesis para la media y la proporción. Reconocer la relación entre una prueba de hipótesis y un intervalo de confianza.
Competencia específica
Analizar la información de una muestra para identificar las dinámicas de la población de estudio, mediante la resolución de problemas con técnicas de estadística inferencial.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
3
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Presentación de la unidad Como se sabe, la teoría del muestro permite obtener información acerca de una población finita a través de muestras extraídas al azar, sin embargo, es más práctico y frecuentemente más importante inferir información de una población mediante varias muestras extraídas de ella. Lo anterior lo hace la inferencia estadística o estadística inferencial , basándose en la teoría del muestro y el objetivo es estimar una medida descriptiva de la población (por ejemplo, la media o la varianza) a partir de la medida descriptiva de la muestra (media o varianza muestral); a los primeros se les llama parámetros y a los segundos estadísticos . Debido a lo anterior, es claro que para una población en particular, los parámetros son fijos y frecuentemente desconocidos, mientras que los estadísticos varían dependiendo de la muestra. A continuación se muestran algunos de los parámetros más comunes y sus correspondientes estadísticos:
Medida descriptiva
Parámetro
Media
Estadístico _
x
Varianza
Desviación estándar
s
Proporción
p
_ p
2
s
2
Los principales tipos de inferencia que se realizan son:
Estimación puntual o por intervalo Prueba de hipótesis
Dado que las inferencias estadísticas que se hacen acerca de la población se realizan por medio de muestras, lo natural es usar la media y la varianza (estadísticos) como estimadores de los parámetros correspondientes. Para poder llevar a cabo lo anterior, existen dos problemas:
Determinar si la estimación está sesgada Determinar la cercanía del valor del estadístico con el valor del parámetro que se está estimando.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
4
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Para analizar el sesgo, considérese que se toman una gran cantidad de muestras de una población con media y que se determina la media de cada una de las muestras, obteniendo los valores
_ xi
_ , con estos es posible construir una distribución cuya media x
tiene un valor que puede estar cercano o no al valor de la media poblacional
.
Si el valor
x _ de la de la media de la distribución de medias es cercano al de la población , se _
dice que
x es
un estimador
insesgado de .
En general, si la media de la distribución muestral de un estadístico es igual a su correspondiente parámetro, el estadístico se llama estimador insesgado del parámetro , si no es igual se denomina estimador sesgado. Los valores correspondientes de tales estadísticos se conocen como estimaciones insesgadas o sesgadas , respectivamente. Hay dos tipos de estimación de parámetros. 1) Estimación puntual: es la que está dada por un valor numérico. 2) Estimación por intervalo: son aquellas que están dadas por dos números, entre los que, muy probablemente, está el valor del parámetro poblacional. Es importante no confundir un estimador puntual con una estimación puntual; debe recordarse que la segunda es un valor particular obtenido de un estimador puntual.
2.1. Estimación puntual y por intervalo de la media Si se consideran todas las posibles muestras de tamaño n que pueden extraerse de una
__ población y que se calcula la media x de cada una de las muestras, con estos valores i
se puede construir una distribución de la cual también se puede encontrar la media
__ x
como usualmente se ha hecho. Por la forma en que se calcula
__ ,
puede verse que un estimador puntual es una función
x
de un conjunto de observaciones de la población y es un “punto” en el sentido de que se
refiere a un solo valor. __ xi
Del mismo modo, la información contenida en las calculadas, permite construir un intervalo dentro del cual puede estar contenido el valor del parámetro .
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
5
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población 2.1.1. Estimador puntual y sus propiedades Puede ser claro que por medio de las muestras es posible hacer una estimación de cualquiera de los parámetros de una población, de manera que no es fácil determinar cuál de los estadísticos es el más apropiado. Los siguientes cuatro criterios permiten hacer esta elección:
Inestabilidad: es preferible usar un estimador no sesgado, es decir, cuando ocurre que la esperanza del estadístico es igual al valor del parámetro, por ejemplo:
_ E x . Ahora bien, aun cuando lo anterior se cumpla, puede ocurrir algo como lo mostrado en la siguiente gráfica:
__ x
En este caso, la elección del estimador, usando solo este criterio, no resulta suficiente.
Consistencia: se dice que el estimador del parámetro es consistente si el valor del estimador se aproxima al valor del parámetro de la población cuando el tamaño de la muestra se hace más y más grande.
Por ejemplo, para la distribución muestral de medias tenemos que:
E x
x
x
n
de aquí puede apreciarse que conforme n se hace más grande, el cociente se hace cada vez más pequeño, por lo que la división se acerca más al cero; ahora bien, que la desviación estándar sea cercana a cero, significa que los valores de x se encuentran muy cerca y alrededor del valor de .
Eficiencia: se dice que el estimador del parámetro es eficiente cuando tiene la menor de las varianzas entre todos los posibles estimadores.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
6
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Suficiencia: se dice que el estimador es suficiente si genera tanta o más información acerca del parámetro de la que podría proporcionar otro estimador cuando se utiliza la misma muestra.
2.1.2. Distribución muestral de la media, n ormal y “t de Student” En general, existen tres tipos de información que se desea conocer sobre una distribución:
¿Dónde está el centro? ¿Qué tanto varía? ¿Cómo está repartida?
Por supuesto, querríamos conocer esta misma información respecto a una distribución muestral, por ejemplo la distribución muestral de x . Con el siguiente ejemplo, se muestra la manera en que se procede para obtener la información y dar respuesta a las preguntas previas.
Ejemplo (1) Considere que en la siguiente tabla se representa a toda una población, que consiste en el número de pizzas que la sucursal de cierta empresa vende en una hora determinada del día: Sucursal Calle Real Puente grande Plaza El centro Niño perdido
Número de pizzas 2 3 6 8 9
A continuación se pide que se hagan algunos procedimientos y cálculos, y se dan recomendaciones y resultados para verificar. a) Haz los cálculos pertinentes para demostrar que: 5.60 , 7.440 y 2.728 2
b) Haz una lista de todas las posibles muestras de tamaño 2 que se pueden generar de dicha población, considerando que se hace un muestreo con remplazo (son 25 en total)
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
7
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Núm. de pizzas 2
2
3
6
8
9
3 6 8 9 c) Determina la media de cada una de las muestras y verifica que se obtienen los valores de la tabla del inciso d). Con los datos de la tabla del inciso a), completa la distribución de medias muestrales: __
2
x
P X
__ x
2.5
3
4
4.5
5
5.5
6
7
7.5
8
8.5
1
1
4
2
2
25
25
25
25
25
9
d) Haz los cálculos pertinentes para demostrar que la media de la distribución de medias muestrales es: __ 5.60 x
e) Haz los cálculos pertinentes para demostrar que la varianza y la desviación estándar de la distribución de medias muestrales son, respectivamente: 2
x
y
3.720
x
1.923
f) Grafica las distribuciones de probabilidad de los incisos b) y d) y analiza las gráficas usando los valores de las medias y desviaciones estándar para cada distribución. Lo que se hará a continuación es un tratamiento común y consiste en agrupar las medias en intervalos; recuérdese que existen distintos criterios para determinar el número
k
de intervalos. Si se usa el criterio
2
k
n 2
25
2
, siendo
k
el menor
número que cumple con la desigualdad, se concluye que k 4 , es decir, se deben usar cuatro intervalos; sin embargo, también se puede determinar el número de
intervalos haciendo
k
n
25
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
8
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población g) Para el presente ejercicio, se considera el que necesarios y completa la tabla siguiente. Límites de clase 2.0 – 3.4 3.4 – 4.8 4.8 – 6.2 6.2 – 7.6 7.6 - 9.0
k
__ Marca de clase x 2.7
5 . Realiza los cálculos
Frecuencia de clase 4 4 9 4 4
h) Grafica el histograma para los datos del inciso h) Al analizar los resultados obtenidos hasta ahora, es posible ver que: La media de la población y la media de la distribución de medias muestrales es igual, es decir:
__ x
La varianza de la población es el doble de varianza de la distribución de medias muestrales, es decir:
2
2
2
x
El rango de la población es el mismo que el de la distribución de medias muestrales.
La población tenía una distribución de probabilidad uniforme, mientras que la distribución de medias muestrales parece ser una distribución normal.
Tratar de generar una distribución de medias muestrales para muestras de tamaño 3, es un ejercicio que puede llevarse a cabo con un poco de paciencia y que lleva a tener casi las mismas conclusiones que las descritas anteriormente; el único cambio es que 3 , lo que da una pista sobre la relación existente entre la varianza de la población y la varianza de la distribución de medias muestrales. 2
2
x
Otro ejercicio interesante, mucho menos costoso en tiempo y que se recomienda hacer, es construir la distribución de medias muestrales cuando el muestreo se realiza sin restitución. Si se consideran los casos n 2 y n 3 , en cada uno de ellos solo hay 10 muestras, y las conclusiones son parecidas, estas se enuncian a continuación:
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
9
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
La media de la población y la media de la distribución de medias muestrales es igual, es decir:
__ x
La varianza de la población es n veces la varianza de la distribución de medias muestrales, es decir:
2
2 __ n x
El rango de la población es el mismo que el de la distribución de medias muestrales.
La distribución de medias muestrales tiende a una distribución normal conforme aumenta el tamaño de la muestra.
En resumen, la distribución de medias muestrales es normal con media
2 __ x
y varianza
2
. Esto significa que es posible calcular la probabilidad de que un valor de
x
se
n
encuentre en un rango de valores, para lo que se deberá estandarizar mediante
z
x
n
Como puede apreciarse, a través de la información generada de una muestra, es posible caracterizar a toda una población, ya que la distribución de medias muestrales se comporta como una distribución normal. Sin embargo, todo el análisis se puede llevar a cabo porque se conoce a toda la población y consecuentemente, se conocen sus parámetros. Sin embargo, lo más frecuente es que no sea posible trabajar con todos los elementos de la población, porque esta fuera muy grande, sino únicamente con una muestra (pequeña en comparación con el tamaño de la población). En este caso, la distribución de probabilidad que se usa es denominada t de Student. Las condiciones bajo las que se usa esta distribución son:
Población con distribución normal. Si esto no sucede, no es posible usar t de Student . Varianza desconocida. Por tal motivo se debe estimar mediante la varianza muestral.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
10
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Las características (Nieves & Dominguez, 2010. 382) de la distribución t de Student, son: 1. 2. 3. 4.
Tiene media igual a cero. Están distribuidas simétricamente alrededor de su media. Hay una distribución diferente para cada grado de libertad. Tienen varianzas mayores que uno, pero, a medida que aumenta el número de grados de libertad, la varianza tiende a uno. En comparación con la distribución normal estándar, las curvas son más bajas en la media, pero sus colas son más altas.
5.
Para la distribución t de Student , la “estandarización” es
t
x
s n
La t calculada de esta manera, tiene una función de probabilidad grados de libertad
t
de Student con
n
1
Ejemplo (2) Una compañía fabricante de lámparas, asegura que estas tienen una vida media útil de 60 meses y una desviación estándar de 6 meses, para verificar la información, una empresa prueba una muestra aleatoria de 50 lámparas. a) ¿Qué tipo de distribución se puede usar para inferir sobre la media poblacional? Justificar. b) ¿Cuál es la estandarización pertinente? c) ¿Cuál es la probabilidad de encontrar una muestra con una vida útil promedio de menos de 58 meses?
Solución: a) Como el tamaño de muestra es grande 30 y la desviación estándar es conocida, se puede usar la distribución normal. n
b) La estandarización que se puede usar es
z
x
x
x
x
n
__ c) Lo que se pide es P x 58 . Para determinar el valor de esta __
probabilidad, primero se debe estandarizar 58 z
x
58 , es decir:
60
6 50
2
50
6 2.35
Al consultar en la tabla para la distribución normal:
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
11
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población __ 2.35 0.0094
P x
Este resultado significa que la probabilidad es de 0.0094, o bien, que en el 0.94% de las ocasiones que se tome una muestra se tendrán lámparas que duren menos de 58 meses. Aunque debe aclararse que esto será así solo si la información que proporciona el fabricante es cierta.
Ejemplo (3) Un fabricante de cigarrillos afirma que su producto tiene un contenido promedio de nicotina de 1.83 miligramos. Se toma una muestra aleatoria de 8 de estos cigarrillos y se determina que el contenido de nicotina de cada uno de ellos es: 2.0, 1.7, 2.1, 1.9, 2.2, 2.1, 2.0 y 1.6 miligramos. a) Calcular la media y la desviación estándar de la muestra. b) ¿Qué tipo de distribución se puede usar para inferir sobre la media poblacional? Justificar. c) ¿Cuál es la estandarización pertinente? d) Con esta información, y con una certeza del 95%, se quiere responder la pregunta: ¿la afirmación del fabricante es cierta?
Solución: a) Para determinar la media de la muestra. n
x
i
x
i 1
n
2.0 1.7 2.1 1.9 2.2 2.1 2.0 1.6 8
1.95
Para determinar la desviación estándar de la muestra, primero se calcula la varianza: 2
__ 1 x x n 1 2.0 1.952 1.7 1.952 2.1 1.952 1.9 1.952 n
i
s
2
i
2.2 1.952 2.1 1.952 2.0 1.952 1.6 1.952 7
0.0429 Entonces, la desviación estándar es
s
0.2071
b) Como no conocemos el valor de , la estamos estimando a partir de y además, la muestra es pequeña, se debe usar la distribución t de
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
s
,
12
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Student para inferir sobre la media poblacional.
c) La estandarización que se usa para la distribución t de Student es t
x s n
d) Al sustituir en la expresión anterior, y realizar los cálculos indicados, se tiene: t
x s n
1.95
1.83
0.207 8
1.64
Al buscar el valor de t en la distribución t de Student con 7 grados de libertad, se ve que t está contenido en la región del 90%
Probabilidad de 0.9
t 0.05,7 1.89
t
1.64
t 0.05, 7
1.89
Lo anterior quiere decir que con una certeza del 90%, la información del fabricante es cierta; por tanto, la afirmación del fabricante no es cierta con el nivel de certeza que dijo tener.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
13
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población 2.1.3. Teorema del límite central Como ya se mencionó, hay tres cosas que es deseable conocer acerca una distribución:
¿Dónde está el centro? ¿Qué tanto varía? ¿Cómo está repartida?
El siguiente enunciado, conocido como el Teorema del límite central , proporciona información sobre los tres aspectos. Si se toman todas las muestras posibles, de tamaño n , sin remplazamiento, de una población finita de tamaño N , con media µ y desviación estándar σ, entonces la distribución de las medias muestrales:
Serán de tipo normal cuando la población de la que proceden las muestras es de tipo normal, en caso contrario, se aproximará a una normal para valores grandes de n n 30 . Tendrán media
__
x
Tendrán desviación estándar
x
n
o
x
N
n
N
n 1
respectivamente. N n El término es conocido como factor de corrección por población N 1 finita y puede omitirse cuando n 0.05 N , es decir, cuando el tamaño de la muestra es menos del 5% del tamaño de la población.
2.1.4. Intervalo de confianza para la media Si para una población normal se quiere conocer la probabilidad de que un valor esté contenido entre la media y una desviación estándar usando la gráfica para la distribución normal, fácilmente puede verse que la región en la que debería estar el valor es la parte central y se puede tener una idea del valor esperado:
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
14
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
3
2
3
2
Por otra parte, y sabiendo que la gráfica es simétrica, la probabilidad se puede escribir
P 1 z 0 P 0 z 1 2 P 0 z 1 2 P 1 z 0
P x P x P x
Al buscar en la tabla correspondiente, se concluye: P
x 2 0.3413 0.6826
De manera similar, se puede demostrar que:
P 3 x 3 99.74%
P 2 x 2 95.44%
Sin embargo, en muchas ocasiones lo que se desea conocer es la probabilidad de que la media poblacional esté contenida en un cierto rango de valores, si se conoce el valor de la media de una muestra. A continuación se muestra cómo determinar un intervalo para el cual existe una probabilidad conocida de que la media poblacional esté contenida en dicho intervalo.
Ejemplo (4) Se desea saber entre qué valores puede estar la media de la población con una probabilidad del 0.95
Solución: se expresa la probabilidad dada en términos del intervalo donde puede estar contenido el valor normalizado y se despeja :
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
15
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población P
1.96 z 1.96 0.95
__ x P 1.96 1.96 0.95 n __ P 1.96 x 1.96 0.95 n n __ P 1.96 x 1.96 n __ P 1.96 x 1.96 n
0.95 n 0.95 n
De donde, finalmente, se obtiene que: __ __ x 1.96 P x 1.96 n
0.95 n
Esto quiere decir que la media de la población se encuentra contenida en el __
rango dado por x 1.96
__
x
1.96
n
, que también puede ser
n
__ __ , x 1.96 expresado como un intervalo x 1.96 ; a este intervalo se n n le denomina intervalo de confianza para una probabilidad de 0.95
El resultado encontrado significa que para una población, el intervalo de confianza depende de la media de la muestra, sin embargo, aunque cada muestra que se tome proporciona un intervalo diferente, esta metodología garantiza que la media de la población está contenida en el 95% de ellos. La siguiente tabla de valores, permite determinar el valor correspondiente de intervalo de confianza dado.
z
para un
Nivel de confianza
99.7
99.0
98.0
96.0
95.5
95.0
90.0
80.0
68.3
z
3.00
2.58
2.33
2.05
2.00
1.96
1.65
1.28
1.00
Cuando se está considerando la distribución muestral de medias para estimar , el intervalo de confianza para la media poblacional se encuentra con la expresión dada a continuación, siendo z el valor correspondiente al nivel de confianza deseado: __
x z
n
__
x z
n
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
16
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población __
La “fórmula” significa que, conociendo
contenga a confianza:
x
y , puede encontrarse un intervalo que con una confianza dada. Otras formas de expresar el intervalo de
z
x
,
x z
x
x
x z
y
,
x
z
n
n
2.2. Estimación puntual y por intervalo de la proporción Frecuentemente, la información que se obtiene de una muestra es solamente un sí o un no. Por ejemplo:
Una encuesta reveló que el 80% de las amas de casa compran sus artículos de primera necesidad en las tiendas de autoservicio. Un estudio indicó que el 60% de los hombres de entre 28 y 50 años creen que los dos cónyuges deben compartir los gastos del hogar.
Estos ejemplos muestran el significado de “Proporción: fracción, razón o porcentaje que indica la parte de la muestra de la población que posee un rasgo de interés particular ” (Lind, Marchall &Wathen, 2008. 310)
El valor de la proporción se determina mediante
__ p
x
, siendo
x
el número de éxitos y
n
n
el número de elementos de la muestra; este valor se usa como un estimador de la proporción de éxitos en la población de estudio. Debido a la forma de encontrar la proporción, es natural pensar en una distribución binomial como el modelo para las proporciones, siempre y cuando el tamaño de la muestra sea pequeño n 30 ya que en caso contrario, resulta mucho mejor utilizar la aproximación normal a la binomial. Por lo anterior, se utiliza la distribución normal para calcular la estimación de la proporción por intervalo; que equivale a encontrar el intervalo de confianza para p poblacional.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
17
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población 2.2.1. Estimador puntual y sus propiedades Se sabe que
__ p
x
y que la variable
x
tiene un modelo de probabilidad binomial, cuya
n
media es
np
y varianza
npq ,
por tanto,
__
np
p
n
p
Lo anterior quiere decir que la media de la distribución muestral de proporciones es la probabilidad de éxito p . En el caso de la varianza se tiene que
2
npq
n
2
2.2.2. Distribución muestral de la proporción Considérese una población en la que los elementos son o éxitos o fracasos, en la que la probabilidad de éxito es p , siendo q 1 p la probabilidad de fracaso.
Si se obtienen todas las posibles muestras de tamaño
n
y para cada muestra se determina
__
la proporción p de éxito y con esta información se construye una distribución de probabilidad, esta tiene las siguientes propiedades:
la media es
__
p
p
la desviación estándar es
__ p
p q
n
La distribución construida se denomina distribución muestral de proporciones y tiene las siguientes características: 1. Proviene de una población con distribución binomial: a. Los datos de la muestra son el resultado de contar. b. Únicamente hay dos resultados posibles: éxito o fracaso. c. La probabilidad de éxito es constante de un evento a otro. d. Los eventos son independientes. 2. Si se cumple que n p 5 y n q 5 se puede recurrir a la distribución normal para aproximar a la binomial y la estandarización es
z
__ p
p
p q n
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
18
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
2.2.3. Cálculo de un intervalo de confianza para la proporción En este caso, la mejor manera de explicar cómo se determina un intervalo de confianza para las proporciones es resolviendo el siguiente:
Ejemplo (7) Se desea estimar el porcentaje de varones adultos de cierta ciudad que fuman al menos una cajetilla de cigarrillos al día. Supóngase que se toma una muestra aleatoria de 300 individuos y que de ellos, 36 individuos fuman. Responder las siguientes tres preguntas, que también fueron respondidas para
.
a) ¿Cuál es la exactitud de la proporción de la muestra como estimación de p ? b) ¿Qué tamaño de muestra se necesitaría si deseamos una probabilidad de 0.95 de que el error de la estimación no exceda a 0.02 unidades? c) ¿Cuál es el intervalo de confianza a 95% para p ?
Solución: Por principio debemos resaltar el hecho de que el tamaño de muestra es lo bastante grande para justificar el uso de los métodos de la curva normal. a) Como la proporción de la muestra
__ p
x
tiene una distribución normal
n
entonces tiene: media
p
pq
y desviación estándar
pq
n
300
__
Se considera una probabilidad de 0.95 de que p se encuentre a una distancia menor de 1.96 desviaciones estándar de p , es decir, el error de estimación debe ser menor que 1.96
pq
300
; por otra parte, como
es desconocida, debe estimarse haciendo:
p
__
p
x n
36 300
0.12
Por tanto, el error de estimación es aproximadamente 1.96
(0.12)(0.88) 300
0.037
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
19
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población __
Es decir, con una probabilidad de 0.95, la estimación de la muestra p no difiere de p por más de 0.037 unidades, lo que da una buena idea de la exactitud del valor de muestra 0.12 como estimación de p . b) Para determinar el tamaño de la muestra necesaria, para obtener una precisión dada en la estimación de p , se selecciona n de manera que el número apropiado de desviaciones estándar de deseado en la estimación.
__ p
sea igual al error máximo
Sea e el error de estimación máximo seleccionado y sea z el valor correspondiente a la probabilidad deseada para no exceder este error máximo. Entonces
n
debe satisfacer la ecuación
z
pq
e,
de donde
n 2
n
z pq
e
2
Para el problema que estamos resolviendo, sabemos que p no se conoce, de manera que debe estimarse según el valor de la muestra, es decir, __
usando
p
0.12
y para
e
y
0.02
z
1.96
tenemos:
1.96 0.120.88 0.02 2
n
2
1014
Por tanto, se necesitará una muestra adicional de 714 para obtener la precisión deseada de la estimación. c) El intervalo de confianza del 95% para razonamiento que para tiene:
,
solo que
__ p
p
se calcula usando el mismo __
toma el lugar de
__ __ __
p
p q
1.96
0.120.88 300
, con lo que se
__ __ __
p
p
1.96
p q
n
0.12 1.96
x
n
p
0.12 1.96
0.120.88 300
0.083 p 0.157
Por tanto, un intervalo de confianza al 95% para 0.083
p
está dado por
p 0.157
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
20
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Es necesario aclarar que la solución a cada uno de esto incisos está basada en métodos de muestras grandes; afortunadamente los métodos son bastante buenos también para muestras pequeñas, siempre que np 5 para p 0.5 y nq 5 para p
0.5
Actividad 1. Estimadores puntuales Hemos aprendido el significado de estimador puntual y revisado sus propiedades; así mismo, analizamos el significado de intervalo de confianza y encontramos estos intervalos para las distribuciones muestrales de la media y la proporción. El objetivo de la actividad es que, a partir de la información proporcionada, reconozcas la distribución que debes usar para realizar las estimaciones. Para completar la información presentada aquí y reforzar lo aprendido, realiza lo siguiente: 1. Elabora un mapa conceptual donde se vean claramente las diferencias entre las estimaciones puntuales para poblaciones grandes y pequeñas. 2. Por último, describe cómo se determina un intervalo de confianza y elabora un reporte donde integres los resultados previos con tus conclusiones. 3. Al terminar, envía tu documento a la sección de tareas, con la nomenclatura EISP_U2_A1_XXYZ, y espera la retroalimentación del Facilitador(a).
*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta al momento de calificar tu trabajo.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
21
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Actividad 2. Estimaciones puntuales e intervalos de confianza El objetivo de esta actividad es que compartas información y que verifiques la información de tus compañeros(as). Entra al Foro denominado Estimaciones puntuales e intervalos de confianza y realiza lo siguiente: 1. Lee con atención los ejercicios que ahí se presentan. 2. Documéntate sobre los tópicos que se correspondan con los ejercicios planteados. 3. Responde los ejercicios y sube tus aportaciones al foro. 4. Revisa las aportaciones de tus compañeros(as), compara sus opiniones con las tuyas e intercambia comentarios a fin de establecer un diálogo fructífero y de cercanía.
*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta al momento de calificar tu trabajo.
2.3. Prueba de hipótesis Una hipótesis estadística es una aseveración o conjetura respecto a una o más poblaciones; por lo anterior, es muy importante tener claro que una hipótesis estadística se formula sobre la población o distribución que se está estudiando, no sobre la muestra. Para realizar una prueba de hipótesis es necesario establecer dos hipótesis estadísticas, conocidas como hipótesis nula e hipótesis alternativa , respectivamente. La hipótesis nula H 0 siempre se usa para establecer que el parámetro de interés, que es desconocido, es igual a un valor dado. Por ejemplo, si no se conoce la media poblacional µ, la hipótesis nula es: H 0 : 0 La hipótesis alternativa H establece que el parámetro es menor que (<), mayor que (>), o diferente de (≠) el valor especificado. 1
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
22
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Ejemplo (8) Se sabe que la tasa de incineración de un sólido es una variable aleatoria que puede describirse mediante una distribución de probabilidad. Se quiere saber si la media de la taza de incineración (parámetro) es distinta de
50
cm s
Expresar la hipótesis nula y la hipótesis alternativa:
Solución: Como en la hipótesis nula H 0 se establece que el parámetro desconocido es igual a un valor especificado que sí se conoce, se tiene que la hipótesis nula es: H 0 :
50
cm s
En el caso de la hipótesis alternativa
H 1
diferente del valor especificado para investigación es:
0
H 1 : 50
, esta es para establecer que el parámetro es
, por lo que la hipótesis alternativa o hipótesis de
cm s
2.3.1. Conceptos generales de la metodología Al procedimiento mediante el cual se toma la decisión sobre una hipótesis en particular, se le denomina prueba de hipótesis. Los procedimientos para realizar una prueba de hipótesis dependen de la información contenida en una muestra aleatoria de la población de interés; si la información es consistente con la hipótesis, se concluye que esta es verdadera, y en caso contrario que es falsa. La hipótesis nula H 0 debe formularse de manera que al rechazarla se apoye la conclusión de la investigación; mientras que la hipótesis de investigación debe expresarse como la hipótesis alternativa H . 1
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
23
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Ejemplo (9) Se seleccionará una muestra aleatoria de cigarrillos producidos a partir de hojas secadas con un nuevo método y se medirá el contenido de nicotina. Se quiere saber si el contenido medio de nicotina por cigarrillo es menor que 1.5 miligramos.
Solución: Lo primero que se debe identificar es el parámetro de interés, que en este caso es la media poblacional. En segundo lugar, debe establecerse claramente lo que se quiere probar; según el enunciado, se quiere probar que la media sea menor o igual a 1.5 miligramos, es decir, que: 15 mg . Por tanto, la formulación del juego de hipótesis es: H 0 : 15 mg H 1 : 15 mg
Al tomar decisiones, se pueden cometer dos tipos de errores, cuyos nombres y descripciones son: Error tipo I. Se refiere al hecho de rechazar la hipótesis nula H 0 cuando esta es verdadera. Error tipo II. Hace referencia al hecho de no rechazar la hipótesis nula H 0 cuando esta es falsa.
Podemos resumir en el siguiente cuadro: es verdadera
es falsa
Decisión
H 0
No rechazar H 0
No error
Error tipo II
Rechazar
Error tipo I
No error
H 0
H 0
Puesto que una decisión está basada en variables aleatorias, es posible asignarle probabilidades a los errores, y estos son representados como:
α = P (error tipo I)
= P( rechazar | es verdadera) α también recibe por nombre nivel de significancia .
β = P( error tipo II)
= P( No rechazar | es falsa)
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
24
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
A continuación se describe el procedimiento general para realizar una prueba de hipótesis: 1. Leer cuidadosamente el problema para identificar el parámetro de interés. 2. Estructurar la hipótesis nula H 0 , sin olvidar que contiene a la igualdad. 3. Especificar la hipótesis alternativa H , tomando en cuenta que se trata de la 1
hipótesis de investigación, esto quiere decir que se espera rechazar H 0 y, en consecuencia, aceptar H . Escoger un nivel de significancia para α (controla la probabilidad de cometer el error tipo I) Escoger una estadística de prueba apropiada. Tomar una muestra aleatoria del parámetro. Con los datos, calcular el estadístico de prueba. Decidir si H 0 debe ser o no rechazada y reportar los resultados en el contexto del problema. 1
4. 5. 6. 7. 8.
2.3.2. Prueba de hipótesis de la media Debido a lo descrito anteriormente, las pruebas de hipótesis para un parámetro poblacional asumen una de estas tres formas: H 0 : 0 Esta es denominada prueba de cola derecha . : H 1 0
H 0 : 0 H 1 : 0
Esta es denominada prueba de cola izquierda.
H 0 : 0 H 1 : 0
Esta es denominada prueba de dos colas.
A continuación se describirá cómo se realiza la prueba de hipótesis para la media poblacional, y luego se resolverá un ejemplo, en los casos en los que:
es conocida. es desconocida, el tamaño de la muestra es pequeño y la población es normal.
Prueba de hipótesis para la media poblacional con conocida Los supuestos para poder realizar la prueba de hipótesis son: La población o distribución de interés tiene media µ y varianza . La población se distribuye normalmente y es aplicable el teorema de límite central.
El estadístico de prueba es
z0
x
0
n
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
25
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
A continuación se analizan los tres casos presentados al inicio de este apartado, aunque no en el mismo orden. H 0 : 0 1) El primer juego de hipótesis es H 1 : 0 Si la hipótesis nula es verdadera, el
que se calcula caerá en la región de no
z0
rechazo de H 0 , en caso contrario, z0 caerá en la región de rechazo, lo que significa que la muestra produjo un valor inusual del estadístico de prueba; lo anterior quiere decir que la información contenida en la muestra no apoya el supuesto de que H 0 es verdadera. La regla de decisión se define como: Se debe rechazar H 0 si z z 0
o
z0 z
2
No se debe rechazar H 0 si
Región de rechazo
2
z
2
1
Región de no rechazo de Ho
z
2
2
z0 z
2
Región de rechazo
2
z
0
2
H 0 : 0 2) El segundo juego de hipótesis es: H 1 : 0 La regla de decisión se define como: Se debe rechazar H 0 si z0 z
No se debe rechazar H 0 si
1
Región de no rechazo de Ho 0
z 0 z
Región de rechazo
z
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
26
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población H 0 : 0 3) El tercer juego de hipótesis es: H 1 : 0 La regla de decisión se define como: Se debe rechazar H 0 si z 0 z
No se debe rechazar H 0 si
Región de rechazo
z 0 z
1
Región de no rechazo de H o 0
z
Ejemplo (10) Una muestra aleatoria de 100 muertes registradas en México durante el año pasado, muestra una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es diferente que 70 años? Utilice un nivel de significancia de 0.05.
Solución: Siguiendo los pasos descritos anteriormente: Parámetro media poblacional (µ) H 0 : 70 años Hipótesis nula
Hipótesis alternativa
H 1 : 70 años
Nivel de significancia
0.05
Probabilidad del 0.95 95% de confianza
Estadística
z 0 __
Datos
x
Estandarización
z
71.8 años ,
71.8 0
70
8.9
8.9 años
2.02
100
Valor crítico
Decisión Conclusión
z
1.96 2
Rechazar dado que
z0 z
2
La vida media hoy día es diferente a 70 años.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
27
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Región de rechazo
1
1.96
z
Región de rechazo
Región de no rechazo de H o
z
1.96
z0
2
2
2.02
Ejemplo (11) Del ejemplo anterior se vio que la media es distinta a 70 años, ahora se tiene interés en saber si la vida media, hoy en día, es mayor que 70 años. Utilice un nivel de significancia de 0.05.
Solución: siguiendo los pasos descritos con anterioridad tenemos: 1) Parámetro 2) Hipótesis nula
media poblacional (µ)
3) Hipótesis alternativa 4) Nivel de significancia
H 1 : 70 años
H 0 :
70 años
0.05
Probabilidad del 0.95 95% de confianza 5) Estadística
z 0 __
6) Datos
x
7) Estandarización
z
71.8 años , 71.8
0
70
8.9
8.9 años
2.02
100
Valor crítico 8) Decisión Conclusión
z
1.96
Rechazar y aceptar dado que z0 z La vida media hoy día es mayor a 70 años.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
28
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Región de rechazo
Región de no rechazo de Ho z
1.645
Prueba de hipótesis para la media poblacional con
z0
2.02
no conocida
Los supuestos para poder realizar la prueba de hipótesis son:
El tamaño de muestra es pequeño. La media y varianza son desconocidas. Tenemos una muestra aleatoria de tamaño n de una población normal de la cual se 2
__
determinan
x
y
s
2
.
El estadístico de prueba es
t 0
x
0
s
, es decir, una distribución t de Student con
n
n-1 grados de libertad.
A continuación se analizan los tres casos presentados al inicio de este apartado, aunque no en el mismo orden. H 0 : 0 1) El primer juego de hipótesis es H 1 : 0 La regla de decisión se define como: Se debe rechazar H 0 si t t o t 0
No se debe rechazar H 0 si
0
2
t
t
2
t 0 t 2
2
1
Región de rechazo
2
t
2
Región de no rechazo de H o 0
Región de rechazo
2 t 2
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
29
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población H 0 : 0 2) El segundo juego de hipótesis es: H 1 : 0 La regla de decisión se define como: Se debe rechazar H 0 si t 0 t , 1 n
No se debe rechazar H 0 si
t 0 t , n 1
1
Región de rechazo
Región de no rechazo de H o
t
H 0 : 0 3) El tercer juego de hipótesis es: H 1 : 0 La regla de decisión se define como: Se debe rechazar H 0 si t 0 t , 1 n
No se debe rechazar H 0 si
t 0
t , n1
1
Región de rechazo
Región de no rechazo de Ho
t
Ejemplo (12) El instituto eléctrico Edison publica cifras del número anual de kilowatt-hora (kWh) que gastan varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kWh al año. Si una muestra aleatoria de 12 hogares indica que las aspiradoras gastan un promedio de 42 kWh al año con una desviación estándar de 11.9 kWh. ¿La información de la muestra sugiere, a un nivel de significancia de 0.05, que las aspiradoras gastan en promedio menos de 46 kWh anualmente? Suponga que el gasto de kWh es normal.
Solución: Siguiendo los pasos descritos anteriormente: 1) Parámetro 2) Hipótesis nula
media poblacional (µ)
3) Hipótesis alternativa
H 1 : 46kWh
H 0 : 46kWh
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
30
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población 4) Nivel de significancia 5) Estadística
0.05
42kWh , s
t 0 __
6) Datos
x
7) Estandarización
t 0
42
46
11.9
11.9kWh
1.16 ,
12
con 1 grados de libertad Valor crítico
t 0.05,11
8) Decisión
1.796
No rechazar pues
Conclusión
t 0 t ,n1
La información contenida en la muestra no permite afirmar que el gasto promedio de kWh es menor que 46.
2.3.3 Relación entre una prueba de hipótesis de la media y un intervalo de confianza La prueba de hipótesis para la inferencia estadística está estrechamente relacionada con el enfoque de intervalo de confianza porque la estimación del intervalo de confianza incluye el cálculo de límites para los que es “razonable” que el parámetro en cuestión se
encuentre dentro de ellos. Para el caso de una media poblacional µ con conocida, la prueba de hipótesis y la estimación del intervalo de confianza se basan en la variable aleatoria estandarizada x z
n
La prueba de
H 0 :
0
contra
H 1 : 0
a un nivel de confianza de
100 1 %
equivale a calcular un intervalo de confianza de 1001 % sobre µ y rechazar si no está dentro del intervalo calculado y de no rechazarla si está dentro del intervalo de confianza. Con un valor observado ̅ , no rechazar con una confianza z
2
z0 z
100 1 %
implica:
2
__
z
2
x
0
z
2
n __
x z
2
n
__
0 x z
2
n
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
31
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Así, regresando al ejemplo (10), acerca de las muertes registradas en México, el intervalo de confianza del 95% se determina haciendo: 71.8 1.96
8.9 100
0 71.8 1.96
8.9 100
70.0556 0 73.5444
Como no está en el intervalo, se rechaza . Con esto, se llega a la conclusión de que la vida media hoy día es diferente que 70 años.
2.3.4. Prueba de hipótesis de la proporción Las pruebas de hipótesis para la proporción, asumen una de las formas: H 0 : p p0 H 1 : p p0
H 0 : p p0 H 1 : p p0
H 0 : p p0 H 1 : p p0
Las dos primeras son denominadas pruebas de una cola y la tercera prueba de dos
colas. En este caso, el estadístico a utilizar es:
z0
p
p0 1
p0
p0
n
Ejemplo (13) Un informe reciente de la industria de seguros indicó que el 40% de las personas implicadas en accidentes de tránsito menores había tenido por lo menos un accidente los pasados cinco años. Un grupo de asesoría decidió investigar dicha afirmación, pues creía que la información era muy grande. Una muestra de 200 accidentes de este año mostró que 74 personas también estuvieron involucradas los pasados cinco años, utilizando un nivel de confianza del 99%. Solución: Siguiendo los pasos descritos para la prueba de hipótesis: 1) Parámetro Proporción poblacional (p) H 0 : p 0.4 2) Hipótesis nula 3) Hipótesis alternativa 4) Nivel de significancia 5) Estadística de prueba
H 1 : p 0.4
0.01
z 0
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
32
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población 6) Datos
p
7) Estandarización
z 0
0.37 , q
0.37
0.40 1
0.63 ,
n
200
0.40
0.40
0.87
200
Valor crítico 8) Decisión Conclusión
z 2.33
No rechazar H 0 porque z0 z La información contenida en la muestra no permite afirmar que la proporción es menor que 0.4
Ejemplo (14) Se considera que una medicina comúnmente prescrita para aliviar la tensión nerviosa es efectiva en el 60% de los casos. Resultados experimentales con un nuevo medicamento muestran que 70 de 100 adultos que padecen de tensión nerviosa, tuvieron alivio al tomar el medicamento. ¿La evidencia es suficiente para concluir que el nuevo medicamento es más eficaz que la que prescrita comúnmente? Utilizar un nivel de confianza de 95%.
Solución: Siguiendo los pasos descritos para la prueba de hipótesis: 1) Parámetro 2) Hipótesis nula 3) Hipótesis alternativa 4) Nivel de significancia 5) Estadística de prueba
Proporción poblacional (p) H 0 : p 0.6 H 1 : p 0.6
0.05
0.7 , q
z 0
6) Datos
p
7) Estandarización
z 0
0.3 ,
n
0.7 0.6
0.60 1 0.60
100
2.04
100
Valor crítico 8) Decisión
z
1.65
Rechazar H 0 porque z0
z
y
aceptar H Se puede afirmar que la nueva medicina es más eficaz a la que se prescribe actualmente. 1
Conclusión
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
33
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
2.3.5. Relación entre una prueba de hipótesis de la proporción y un intervalo de confianza Igual que la prueba de hipótesis de la media se relaciona con su intervalo de confianza, la prueba de hipótesis de la proporción también se relaciona con su respectivo intervalo de confianza. En el caso de una proporción poblacional
p
la estructura de la prueba de hipótesis y de la __
estimación del intervalo, se basan en la variable aleatoria
z 0
p
p0
1
p0
p0
, mientras que
n
la prueba de H 0 : p
p0 contra H 1 : p p0 a un nivel de confianza
equivalente a calcular un intervalo de confianza de
100 1 %
100 1 %
sobre
p
.
Por tanto, se rechaza H 0 si p0 no está dentro del intervalo de confianza, y si dentro del intervalo de confianza, la hipótesis no se rechaza. Se sabe que con un valor observado implica: z
__ p
es
, no rechazar H 0 con una confianza
está
p0
100 1 %
z0 z 2
2
Es decir __
z
2
p p0 p0
1 p 0
z
| 2
n
De donde se obtiene: __
p z
p0 2
1 p 0
n
__
p0 p z
p0 2
1 p 0
n
Así, retomando el ejemplo (14) tenemos que el intervalo de confianza del 95% se desarrolla de la siguiente manera:
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
34
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población 0.7 1.96
0.7 1 0.7 100
p0
0.7 1.96
0.7 1 0.7
100
0.7 0.089 p0 0.7 0.089 0.6101 p0 0.789
Como p0 0.6 cae fuera del intervalo de confianza, entonces rechazamos H 0 con lo cual llegamos a la misma conclusión acerca de la mayor eficacia del nuevo medicamento.
Actividad 3. Pruebas de hipótesis Hemos aprendido cómo realizar pruebas de hipótesis, cómo determinar un intervalo de confianza y cuál es la relación entre estos. El objetivo de la actividad es que con la información proporcionada realices las pruebas de hipótesis, para que decidas sobre la validez de las aseveraciones planteadas en los diversos problemas. Para completar la información presentada aquí y reforzar lo aprendido, realiza lo siguiente: 1. Revisa el archivo Actividad 3 Prueba de hipótesis. Ahí encontrarás ejercicios sobre pruebas de hipótesis e intervalos de confianza y determina la relación existente entre ambos. 2. Consulta a tu Facilitador(a) y a tus compañeros(as) en caso de tener alguna duda. 3. Integra en un archivo las soluciones a los ejercicios una vez que estés seguro de que no hay errores y súbelo a la plataforma. 4. Después de desarrollar los puntos que se solicitan, envía tu documento a la sección de tareas, con la nomenclatura EISP_U2_A3_XXYZ, y espera la retroalimentación del Facilitador(a).
*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta al momento de calificar tu trabajo.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
35
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Actividad 4. Problemario El objetivo de esta actividad es que pongas a prueba los conocimientos adquiridos durante el curso resolviendo ejercicios asociados con cada uno de los temas y subtemas. Para completar esta actividad realiza lo siguiente: 1. Revisa el archivo Actividad 4. Problemario. Ahí encontrarás ejercicios sobre pruebas de hipótesis para la media y la proporción, así como para los intervalos de confianza correspondientes. 2. Resuelve cuidadosamente cada uno de los problemas según vayas avanzando en el curso. 3. Consulta a tu Facilitador(a) y a tus compañeros(as) en caso de tener alguna duda. 4. Integra en un archivo las soluciones a los ejercicios una vez que estés seguro de que no hay errores y súbelo a la plataforma. 5. Después de desarrollar los puntos que se solicitan, envía tu documento a la sección de tareas, con la nomenclatura EISP_U2_A4_XXYZ, y espera la retroalimentación del Facilitador(a).
*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta al momento de calificar tu trabajo.
Autoevaluación Con la finalidad de realizar un ejercicio de repaso acerca de los conceptos más importantes estudiados en la unidad, resuelve el ejercicio de autoevaluación que se encuentra en la pestaña de la unidad.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
36
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población
Evidencia de aprendizaje. Resolución de ejercicios sobre pruebas de hipótesis e intervalos de confianza La evidencia de aprendizaje tiene como propósito que integres todas tus actividades como portafolio. 1. Revisa el archivo EA. Resolución de ejercicios sobre pruebas de hipótesis e intervalos de confianza. Ahí encontrarás ejercicios sobre pruebas de hipótesis e intervalos de confianza. 2. Resuelve cuidadosamente cada uno de los problemas. 3. Consulta a tu Facilitador(a) y a tus compañeros(as) en caso de tener alguna duda. 4. Escribe las soluciones a los ejercicios, en un archivo de Word, una vez que estés seguro de que no hay errores. 5. Envía tu documento a la sección de tareas, con la nomenclatura EISP_U2_EA_XXYZ, y espera la retroalimentación del Facilitador(a).
*Consulta la rúbrica de evaluación para conocer los criterios que serán tomados en cuenta al momento de calificar tu trabajo.
Actividades de Autorreflexión Además de enviar tu trabajo de la Evidencia de aprendizaje, es importante que ingreses al foro Preguntas de Autorreflexión y consultes las preguntas que tu Facilitador(a) presente. A partir de ellas, debes: 1. Elaborar tu autorreflexión en un archivo de texto llamado EISP_U2_ATR_XXYZ. 2. Enviar tu archivo mediante la herramienta Autorreflexión .
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
37
Estadística para la investigación en seguridad pública Unidad 2. Estadística inferencial para una población Cierre de la unidad En la primera parte de la unidad hemos visto cómo se construye la metodología para hacer inferencia sobre una población. Vimos cómo se genera una distribución muestral de medias, estudiamos la manera de determinar los estadísticos que la caracterizan y la forma en que estos se relacionan con sus parámetros correspondientes. También conocimos una nueva distribución de probabilidad para muestras pequeñas, el significado de estimador puntual y por intervalo, así como la metodología para encontrarlos. En la segunda parte usamos los contenidos previos para el cálculo de los estimadores puntual y por intervalo de la proporción. Finalmente, conocimos la metodología para dar certeza a las hipótesis de investigación y la usamos al realizar pruebas de hipótesis para la media y la proporción. Con todo lo anterior, obtuvimos los conocimientos y herramientas necesarias que nos permitirán comparar dos muestras poblacionales independientes para interpretar información que oriente en la toma de decisiones a través de técnicas de estadística inferencial.
Ciencias Sociales y Administrativas | Licenciatura en Seguridad Pública
38