DESARROLLO DEL TRABAJO COLABORATIVO ESTADISTICA II
PRESENTADO POR: SONIA RODRIGUEZ TELLEZ 1811980236 ERYKA ORDOÑEZ TRIANA 1811980488 JULIE GOMEZ BARON 1811983500 DEISY ALEJANDRA OCAMPO AREVALO 1811980976 LAURA CAMILA PEÑA COCA 1721980648
PRESENTADO A: SEBASTIAN MORENO RODRIGUEZ
ADMINISTRACION ADMINISTRACION DE DE EMPRESAS POLITECNICO GRAN COLOMBIANO BOGOTÁ 2018
OBJETIVO GENERAL Este trabajo colaborativo está basado en el aprendizaje del módulo Estadística en el cual aprenderemos temas de estadística descriptiva, el muestreo de una población y estimación de parámetros también planteamientos de pruebas de hipótesis y un análisis de datos.
OBJETIVOS ESPECIFICOS Buscamos aprender, evaluar e implementar las distintas metodologías de estadística, utilizando histograma, población, muestra y variable para hallar los resultados de los datos solicitados. Aprendizaje en temas como tamaño muestral, variable en la cual se encuentra cada una donde podemos medir condiciones dadas en el trabajo colaborativo que será de gran importancia para aplicar en nuestras vidas.
DESARROLLO DE LA ACTIVIDAD A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo), además de las características generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera resto, regional, departamental, y para cada una de las capitales de los departamentos. Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre las características generales de las personas que respondieron en un mes en particular. Para este trabajo colaborativo, realice lo siguiente: (Semana 3) Selección de muestra 1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la base de datos dada . Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).
Para sacar nuestra muestra hacemos uso del método aleatorio simple en cada estrato y así tenemos nuestra muestra total de 1049 individuos, lo que hice inicialmente fue dividir el censo por estratos o departamentos, de cada uno tomar ciertas cantidades y finalmente consolidar lo que sería la muestra total de 1049 individuos.
2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando adecuadamente y justificando: a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres, según nuestra muestra determinamos que:
c. Nivel de confiabilidad, 95% d. Error de estimación, 3%
(Semana 4) Intervalo de confianza para dos variables numéricas Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3: 1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias?
En la realización de los histogramas se tomó el nivel de escolaridad tanto de hombres como mujeres y se agrupo de la siguiente manera
En el análisis de estos histogramas se ve una tendencia muy similar en los niveles de escolaridad de hombres y mujeres teniendo presente la relación de cantidad de ellos. Resalta que en el grado de escolaridad de estudios superiores (17 al 23) se ve más cantidad de hombres que mujeres aproximadamente un 50% más que las mujeres. 2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.
El intervalo de confianza para estimar la escolaridad estará medido por el nivel de escolaridad y el margen de error, recordemos que nuestra muestra es de 1049 individuos, de los cuales 501 son hombres y 549 mujeres, dentro del grupo de los hombres tenemos que: 128 son Bachilleres, 30 Tecnólogos y 43 Universitarios, tal como se muestra en la siguiente tabla; lo primero que hago es calcular el Promedio de escolaridad, entonces tomo la sumatoria del nivel de escolaridad para los 128 Bachilleres Hombres de mi muestra y eso me da como resultado 1476 y lo divido por el total de bachilleres hombres de la muestra y tengo como resultado un Promedio de escolaridad o Media de 11.53, es así como primero halle la medio de los niveles de escolaridad de Bachilleres, Tecnólogos y universitarios, tanto de hombres como mujeres
Luego se debe calcular el sigma o varianza, que es la sumatoria de todos los X, menos los X promedio y todo elevado al cuadrado sobre "n", y a ese resultado le sacamos raíz cuadrada. Para el ejercicio entonces mi X sera el valor de escolaridad, si es bachiller vale en promedio 11, a ese valor le resto 11.53 que es mi X promedio o Media, luego a ese resultado le saco raíz cuadrada y tengo un resultado de 0.28, hice ese procedimiento con los 128 bachilleres, lo mismo para los tecnólogos y universitarios tanto de hombres como mujeres, continuando con el caso de bachilleres hombres sume los 128 resultados (0.28+0,22+6,99....) aclaro que no todos los 128 dieron el mismo resultado(0.28), pues dentro de dicho grupo entran personas que tiene nivel de escolaridad 10, 11, 12 o 14 y hacen parte de los bachilleres, entonces tenemos que la suma total es de 248 que se dividen sobre "n" que para bachilleres es 128 personas y al resultado le saco la raiz cuadrada teniendo un resultado de 1.39, confirmo nuevamente, el mismo proceso es para hombres y mujeres:
Luego necesito determinar mi margen de error, nos piden utilizar un nivel de confianza de 95%, lo que equivale a decir 1.96, ese valor se multiplica por el Zigma y se divide sobre la Raíz cuadrada de N, tenemos entonces para los bachilleres que: 1.96*(1.39/ 128)=0.24, de la misma manera se aplicó el procedimiento tanto en hombres como mujeres:
Ya con esta información puedo construir los intervalos de confianza de hombre y mujeres para los niveles de escolaridad de Bachilleres, Tecnólogos y Universitarios: 3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.
(Semana 5) Prueba de hipótesis para dos variables nominales Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:
1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?
La diferencia que podemos encontrar es que los hombres asisten mas a los establecimientos oficiales que las mujeres. 2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de mujeres que asisten a un establecimiento oficial.
Una vez aplicada la fórmula de proporción, podemos confirmar como se hizo en el diagrama que son los hombres los que asisten más a los establecimientos oficiales. 3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior? Lo primero es plantear dos hipótesis, una donde se afirma que efectivamente de los 501 hombres de la muestra, 103 asisten a establecimientos oficiales, la otra hipótesis seria lo contrario a dicha afirmación, nos dan un nivel de significancia del 5% el cual debemos trabajar en porcentaje, tendremos entonces 0.05; otro elemento que necesitamos para el cálculo de la hipótesis es el probabilístico de prueba o P estimado, que se obtiene de dividir la población favorable, es decir las personas que asisten a establecimientos oficiales (hombre y mujeres) sobre el total de la muestra
:
Ya con esta información podemos determinar si se acepta o no la hipótesis, Teniendo en cuenta que alfa es 0.05, la dividimos en dos para cada región y tenemos un resultado de 0.025, Es necesario hallar dicho valor en la siguiente tabla de valores de probabilidad
CONCLUSIONES
En estadística se centra en la descripción de un conjunto de observaciones que pueden ser una población o una muestra, los resultados se pueden considerar exactos. La concentración de datos es más realista con este método Al realizar este trabajo nos damos cuenta de que en la enseñanza-aprendizaje en el uso de casos reales para tratar temas de estadística se consideran de gran utilidad para comprender de mejor manera la importancia de esta área además de saber su correcta utilización la cual nos facilitara nuestro trabajo profesional y formación académica.
REFERENCIAS
Cartillas 1 ,2 3, 4 y 5 Conferencias https://www.netquest.com/blog/es/que-tamano-de-muestra-necesito