ESTADÍSTICA II CUESTIONARIO #2
1. ¿Qué es una población? población? ¿Qué es una muestra?
Una población es el conjunto de individuos, objetos o fenómenos de los cuales se desea estudiar una o varias características. Una muestra es una parte representativa de la población que es seleccionada para par a ser estudiada, ya que la población es demasiado grande para ser estudiada en su totalidad.
2. ¿Qué es un estadístico?
Estadístico es una medida de resumen que se calcula para describir una característica a partir de una sola muestra de la población. Si un estadístico se usa para aproximar un parámetro también se le le suele llamar estimador. estimador.
3. ¿Cómo se calcula la media de una muestra aleatoria de tamaño n?
La media se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muestrales.
4. ¿Qué indica la variabilidad variabilidad de una muestra?
Las medidas de variabilidad son valores numéricos numérico s que indican o describen la forma en que als observaciones están dispersas o diseminadas, con respecto al valor central. Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.
5. ¿Cómo se calcula la variabilidad de una muestra de tamaño n en unidades cuadradas?
La varianza es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones.
6. ¿Cómo se calcula la variabilidad de una muestra de tamaño n, en unidades absolutas?
La desviación típica o desviación estándar (denotada con el símbolo σ o s) es una
medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
7.
¿Qué es la distribución muestral de z?
La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua que se utiliza más comúnmente en estadística. La Normal es la distribución de probabilidad más importante. Multitud de variables aleatorias continuas siguen una distribución normal o aproximadamente normal. Una de sus características más importantes es que casi cualquier distribución de probabilidad, tanto discreta como continua, se puede aproximar por una normal bajo ciertas condiciones. 8.
¿Como se puede verificar gráficamente el supuesto de normalidad?
Se puede verificar mediante el grafico de dispersión . Para verificar el supuesto se puede usar una gráfica de probabilidad normal de los residuales. La gráfica debe tener una apariencia de línea recta. Una distribución de los errores que tienen colas considerablemente más gruesas o delgadas que la distribuci ón normal es “grave”.
9.
¿Como se llama la distribución muestral de un estadístico?
La distribución de probabilidad de un estadístico se denomina distribución muestral.
10.
̅ ? ¿Cual es la distribución muestral de X
̅ con tamaño muestral n es la distribución que resulta La distribución muestral de X cuando un experimento se lleva a cabo una y otra vez (siempre con un a muestra de ̅ .Por lo tanto, esta distribución tamaño n) y resultan los diversos valores de X muestral describe la variabilidad de los promedios muestrales alrededor de la media de la población μ 11.
Explique el teorema del límite central.
Teorema del límite central: Si ̅X es la media de una muestra aleatoria de tamaño n, tomada de una pobl ación con media μ y varianza finita σ 2 , entonces la forma límite de la distribución de
a medida que n → ∞, es la distribución normal estándar n(z; 0, 1). La aproximación normal para Xˉ por lo general será buena si n ≥ 30, siempre y
cuando la distribución de la población no sea muy asimétrica. Si n < 30, la aproximación será buena sólo si la población no es muy diferente de una distribución normal y, como antes se estableció, si se sabe que la población es normal, la distribución muestral de ̅X seguirá siendo una distribución normal exacta, sin importar qué tan pequeño sea el tamaño de las muestras. El tamaño de la muestra n = 30 es un lineamiento para el teorema del límite central. Sin embargo, como indica el planteamiento del teorema, la suposición de normalidad en la distribución de ̅X se vuelve más precisa a medida que n se hace más grande. De hecho, la fi gura 8.1 ilustra cómo funciona el teorema. La fi gura indica cómo la distribución de ̅X se acerca más a la normalidad a medida que aumenta n, empezando con la distribución claramente asimétrica de una observación individual (n = 1). También ilustra que la media de ̅X sigue siendo μ para cualquier tamaño de la muestra y que la varianza de ̅X se vuelve más pequeña a medida que aumenta n.
12.
Que es la distribución de muestreo de la media.
Se deberían considerar las distribuciones muestrales de
̅
y
2
como los
mecanismos a partir de los cuales se puede hacer inferencias acerca de los parámetros μ y 2 . La distribución muestral de
̅
con tamaño muestral n es la
distribución que resulta cuando un experimento se lleva a cabo una y otra vez (siempre con una muestra de tamaño n) y resultan los diversos valores de
̅
. Por
lo tanto, esta distribución muestral describe la variabilidad de los promedios muestrales alrededor de la media d e la población μ.
13.
Que es la distribución t y para que se utiliza.
Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student pa ra la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra. La distribución t se usa ampliamente en problemas relacionados con inferencias acerca de la media de la población o en problemas que implican muestras comparativas, es decir, en casos donde se trata de determinar si las medias de dos muestras son muy diferentes. 14.
A que se parece la distribución t.
La distribución de T se parece a la distribución de Z en que ambas son simétricas alrededor de una media de cero. Ambas distribuciones tienen forma de campana, pero la distribución t es más variable debido al hecho de que los valores T dependen de las fluctuaciones de dos cantidades, ̅ y 2 ; mientras que los valores Z dependen solo de los cambios en ̅ de una muestra a otra. La distribución de T difiere de la de Z en que la varianza de T depende del tamaño de la muestra n y siempre es mayor
que 1. Solo cuando el tamaño de la muestra
n →
∞ las
dos distribuciones serán
iguales. 15.
Que es estimación por intervalos.
Una estimación por intervalo de un parámetro de la población θ es un intervalo de para una la forma θ̂ < θ < θ̂ , donde θ̂ y θ̂ dependen del valor del estadístico Θ . muestra específica, y también de la distribución de muestreo de Θ
16.
Que es el nivel de confianza.
El intervalo de confianza del 100(1 – α) % ofrece un estimado de la precisión de nuestra estimación puntual. Si μ es realmente el valor central del intervalo, entonces ̅
estima μ sin error. La mayoría de las veces, sin embargo, ̅ no será exactamente
igual a μ y la estimación puntual será errónea. La magnitud de este error será el valor absoluto de la diferencia entre μ y ̅, de manera que podemos tener 100(1 – α) % de confianza en que esta diferencia no excederá. Los valores que se suelen
utilizar para el nivel de confianza son el 95%, 99% y 99,9%
17.
¿Cuál es la interpretación de la estimación por intervalo?
Es posible tener una visión gráfica de los intervalos de confianza. Los límites del intervalo pueden ser representados por curvas en el plano formado por el parámetro que queremos estimar y el estadístico utilizado para construir el pivote. Esta visión nos puede ayudar en la interpretación y la comprensión de los intervalos o de sus propiedades. Por ejemplo, el intervalo del 95 % para la esperanza de una distribución Normal con varianza conocida y para una muestra de tamaño n = 9, de fórmula
De los distintos intervalos numéricos construidos a partir de sucesivos muestreos, un porcentaje del (1-α) 100% contiene al verdadero valor del parámetro desconocido ϴ
18. Elabora un cuadro resumen de las fórmulas que se utilizan para estimar la media de una población por intervalos de confianza, para los siguientes casos:
Cuando se conoce la varianza de la población/muestra grande Cuando no se conoce la varianza de la población/muestra grande Cuando se conoce la varianza de la población/muestra pequeña Cuando no se conoce la varianza de la población/muestra pequeña Fórmulas para estimar la media de una población por intervalos de confianza Conocida la varianza
Desconocida la varianza
Muestra grande Muestra pequeñ a 19. ¿Cómo se puede calcular el tamaño de la muestra cuando se conoce la desviación estándar de la población?
20. ¿Cómo se puede calcular el tamaño de la muestra cuando no se conoce la desviación estándar de la población?
21.
¿Cómo se interpreta el intervalo de confianza para una sola muestra?
Una estimación puntual sólo nos proporciona un valor numérico, pero no proporciona información sobre la precisión y confiabilidad de la estimación del parámetro. Entonces una alternativa es calcular lo que llamaremos intervalo de confianza. Notación: Denotaremos al parámetro de interés con la letra estimador para .
y con
un
Un Intervalo de Confianza (IC) para permite tener una medida de la CONFIABILIDAD y PRECISION de la estimación del parámetro. La PRECISION de un IC tiene que ver con su longitud, cuanto menor sea su longitud mayor precisión. La CONFIABILIDAD es medida con el nivel de confianza del intervalo, que denotaremos con ( − ). Los niveles más usados son de 0,95 ; 0,99 y 0,90. Cuanto mayor sea el nivel de confianza mayor es la chance que el IC contenga al verdadero valor poblacional. Luego es bueno pedirle a un IC que tenga una longitud pequeña y una alta confiabilidad que contenga al parámetro poblacional.