Examen de SPSS Nombre: Marcos Oswaldo Rios Chipana. De la base de datos encuesta USA.sav realice: Describir cada una de las variables e indicar si son variables cualitativas o cuantitativas. Además indicar de que tipo. Sexo: variable cualitativa nominal. Raza: Variable Cualitativa nominal. Región: Variable Cualitativa nominal. Feliz: Variable Cualitativa Ordinal. Vida: Variable Cualitativa Ordinal. Hermanos: Variable Cuantitativa Escala. Hijos: Variable Cuantitativa Escala. Edad: Variable Cuantitativa Escala. Educacion: Variable Cuantitativa Escala. Educacion padre: Variable Cuantitativa Escala. Educacion madre: Variable Cuantitativa Escala. Educacion esposa: Variable Cuantitativa Escala. Puntuacion prestigio: Variable Cuantitativa Escala. Categoria ocupacional: Variable Cualitativa Ordinal. Impuesto: Variable Cualitativa Ordinal. Usaimp: Variable Cualitativa Ordinal. Obedecer: Variable Cualitativa Ordinal. Popular: Variable Cualitativa Ordinal. Pensprop: Variable Cualitativa Ordinal. Trabajar: Variable Cualitativa Ordinal. Ayudar: Variable Cualitativa Ordinal. Salud1: Variable Cualitativa Nominal. Salud2: Variable Cualitativa Nominal. Salud3: Variable Cualitativa Nominal. Salud4: Variable Cualitativa Ordinal. Salud5: Variable Cualitativa Nominal. Salud6: Variable Cualitativa Nominal. Salud7: Variable Cualitativa Nominal. Salud8: Variable Cualitativa Nominal. Salud9: Variable Cualitativa Nominal. Trabajo1: Variable Cualitativa Ordinal. Trabajo2: Variable Cualitativa Nominal. Trabajo3: Variable Cualitativa Nominal. Trabajo4: Variable Cualitativa Nominal. Trabajo5: Variable Cualitativa Nominal. Trabajo6: Variable Cualitativa Ordinal. Trabajo7: Variable Cualitativa Nominal. Trabajo8: Variable Cualitativa Nominal.
Trabajo9: Variable Cualitativa Nominal.
Realizar tablas de frecuencias y gráficos correspondientes para cada una de las variables teniendo en cuenta todas las recomendaciones que se dieron en clases (si es q viniste).
Variable: Sexo del encuestado. Tabla de frecuencias Frecuencia Válido
Porcentaje
Hombre
636
41,9
Mujer
881
58,1
Total
1517
100,0
Interpretacion: El 41.9% de os encuestados son hombres. Y el 58.1% de los encuestados son mujeres.
Grafico de Barras.
Variable: Raza del Encuestado. Tabla de Frecuencias. Frecuencia
Porcentaje
Válido
Blanca
1264
83,3
Negra
204
13,4
Otra
49
3,2
Total
1517
100,0
Interpretacion: El 83.3% de los encuestados son de Raza Blanca, el 13.4% de los encuestados son de raza negra y por ultimo el 3.2 % de los encuestados son de otra raza. Grafico de Barras.
Variable: Nivel de Felicidad. Tabla de Frecuencias. Frecuencia
Válido
Muy feliz
467
30,8
Bastante feliz
872
57,5
No demasiado feliz
165
10,9
1504
99,1
13
,9
1517
100,0
Total Perdidos
Porcentaje
No contesta
Total
Interpretacion: El 57.5% de los encuestados están bastante felices, el 30.8% de los encuestados están muy Feliz y el 10.9% no esta demasiado feliz. Asimismo un 0.9% no contesto a la pregunta.
Grafico de Barras.
Variable: Region de los estados Unidos Tabla de Frecuencias Frecuencia Válido
Porcentaje
Nor-Este
679
44,8
Sur-Este
415
27,4
Oeste
423
27,9
Total
1517
100,0
Interpretacion: El 44.8% de los encuestados viven en la región Nor este de los EE.UU, el 27.4% viven en el sur este de los EE.UU y el 27.9% de los encuestados viven en el oeste de los EE.UU.
Grafico de Barras.
Variable: Deben los EE.UU. tomar parte activa en los acontecimientos mundiales. Tabla de Frecuencias. Frecuencia Válido
Perdidos
Porcentaje
Parte activa
752
49,6
Permanecer al margen
247
16,3
Total
999
65,9
No procede
493
32,5
25
1,6
518
34,1
1517
100,0
No sabe Total Total
Interpretacion: El 49.6% de los encuestados opinan que si debe tomar parte activa, un 16.3% opinan que debe permanecer al margen asimismo un 34.1% no procede o no sabe.
Grafico de Barras
Variable: Problemas con el Alcohol. Tabla de Frecuencias. Frecuencia
Válido
Sí
17
1,1
No
995
65,6
1012
66,7
500
33,0
5
,3
505
33,3
1517
100,0
Total Perdidos
Porcentaje
No procede No responde Total
Total
Interpretacion: En las opiniones validas el 65.6% no tiene problemas con el alcohol solo el 1.1% si tiene problemas con el alcohol y hay un 33.3% de encuestados qu no procede o no responde. Grafico de Barras.
Variable: Negocio Propio con problemas o perdiendo dinero. Tabla de frecuencias. Frecuencia Válido
Perdidos
Porcentaje
Sí
20
1,3
No
951
62,7
Total
971
64,0
No procede
500
33,0
No responde
46
3,0
546
36,0
1517
100,0
Total Total
Interpretacion: el 62.7% de los encuestados no tiene problemas solo un 1.3% de los encuestados tienen problemas.mientras que hay un 36% que no procede ni no responde. Grafico de Barras.
Variable: Edad del Encuestado. Estadísticos
Edad del encuestado N
Válido Perdidos
Media Desviación estándar
1517 0 45,73 17,948
Rango
81
Mínimo
18
Máximo
99
Interpretacion: la edad media de los encuestados es de 45.73 años, su desviación estándar es de 17.94 años, el rango de las edades es de 81 años, la edad minima es
18 años y la edad
máxima es de 99 años. Tabla de frecuencias edad por grupos. Frecuencia Válido
menor de edad
Porcentaje 3
,2
adolecentes
489
32,2
mayores
495
32,6
adultos
263
17,3
adulto mayor
267
17,6
1517
100,0
Total
Interpretación: Un 32.6% de los encuestados son personas mayores, un 32.2% de los encuestados son adolecentes, un 17.3% de los encuestados son adultos y un 17.6% de los encuestados son adultos mayores. Grafico de barras.
Variable: opinión sobre el nivel de impuestos. Frecuencia
Válido
Demasiado alto
541
35,7
Justo
380
25,0
11
,7
Total
932
61,4
No procede
524
34,5
No sabe
46
3,0
No contesta
15
1,0
585
38,6
1517
100,0
Demasiado bajo
Perdidos
Total Total
Porcentaje
Interpretacion: De la opinión valida un 35.7% opina que los impuestos son demasiados altos, un 25% opina que los impuestos son justos y solo un 0.7% opina que los impuestos son demasiados bajos. Grafico de barras.
Variable: categoría ocupacional. Tabla de frecuencias. Frecuencia
Válido
Direcctivo o profesional liberal Empleado técnico, administrativo o comercial Servicios Agricultura, forestal y pesca Producción de precisión, manufactura o reparación Operario, fabricación y mano de obra en general Total
Perdidos
Sistema
Total
Porcentaje
339
22,3
456
30,1
204
13,4
36
2,4
163
10,7
220
14,5
1418
93,5
99
6,5
1517
100,0
Interpretacion: El 30.1% de los encuestados son empleados técnicos,el 22.3% son directivos, el 13.45 de los encuestados trabajan en servicios. Grafico de barras.
Mostrar 3 cuadros de 3 variables segmentadas por la variable sexo, ejemplo edad por sexo, etc etc… Variable : Edad x Sexo. Frecuencias en sexo hombre. Frecuencia Válido
menor de edad
Porcentaje 1
,2
adolecentes
215
33,8
mayores
219
34,4
adultos
107
16,8
94
14,8
636
100,0
adulto mayor Total
Interpretación: El 33.8% de los encuestados hombres son adolecentes,el 34.4% de los encuestados hombres son mayores…. Grafico de Barras.
Frecuencias en sexo Mujer.
Frecuencia Válido
menor de edad
Porcentaje 2
,2
adolecentes
274
31,1
mayores
276
31,3
adultos
156
17,7
adulto mayor
173
19,6
Total
881
100,0
Interpretación: De las mujeres encuestadas el 31.3% son adolecentes, el 31.1% son adolecentes, el 19.6% son adultos mayores….. Grafico de barras.
Variable : Categoria ocupacional x Sexo. Sexo del encuestado hombre. Frecuencia
Válido
Perdidos
Porcentaje
Direcctivo o profesional liberal
160
25,2
Empleado técnico, administrativo o comercial
122
19,2
Servicios
57
9,0
Agricultura, forestal y pesca
26
4,1
Producción de precisión, manufactura o reparación
136
21,4
Operario, fabricación y mano de obra en general
120
18,9
Total
621
97,6
15
2,4
636
100,0
Sistema
Total
Interpretación:
Del total de encuestados hombres 25.2% son directivos, el 21.4% son de producción, el 19.2% son empleados técnicos,….. Grafico de barras.
Sexo del encuestado: Mujer. Tabla de frecuencias. Frecuencia Válido
Perdidos
Porcentaje
Direcctivo o profesional liberal
179
20,3
Empleado técnico, administrativo o comercial
334
37,9
Servicios
147
16,7
Agricultura, forestal y pesca
10
1,1
Producción de precisión, manufactura o reparación
27
3,1
Operario, fabricación y mano de obra en general
100
11,4
Total
797
90,5
84
9,5
881
100,0
Sistema
Total
Interpretación: del total de encuestados mujeres el 37.9% son empleadas técnicas, el 20.3% son directivos, el 16.7% trabajan en servicios,…..
Graficos de barras.
Variable : Raza x Sexo. Frecuencias en sexo hombre Frecuencia Válido
Porcentaje
Blanca
545
85,7
Negra
71
11,2
Otra
20
3,1
Total
636
100,0
Interpretación: de los encuestados hombres el 85.7% son de raza blanca, el 11.2% son de raza negra y el 3.1% son de otras razas. Grafico de Barras.
Frecuencias Raza x sexo ,mujer.
Frecuencia Válido
Porcentaje
Blanca
719
81,6
Negra
133
15,1
Otra
29
3,3
Total
881
100,0
Interpretación: de las encuestadas mujeres el 81.6% son de raza blanca, el 15.1% son de raza negra y el3.3% son de otras razas. Grafico de barras.
Realizar 3 tablas cruzadas o tablas de contingencia. (con interpretaciones). 1. Reduccion en el salario y problemas con el jefe.
Ho: La reducción en el salario no influye en problemas con el jefe. (no se relacionan) Ha: La reducción en el salario influye en problemas con el jefe. (si se relacionan) Reducción en el salario o en el horario*Problemas con el jefe tabulación cruzada Problemas con el jefe Sí Reducción en el salario o en
Sí
Recuento
el horario
porcentaje No
Recuento porcentaje
Total
Recuento porcentaje
No
Total
13
48
61
21,3%
78,7%
100,0%
29
881
910
3,2%
96,8%
100,0%
42
929
971
4,3%
95,7%
100,0%
Interpretación: Del total de trabajadores que si tuvieron reducción en el salario el 78.7% no tiene problemas con el jefe y un 21.3% si tiene problemas con el jefe. Del total de trabajadores que no tuvieron reducción en el salario el 96.8% no tiene problemas con el jefe y un 3.2% si tiene problemas con el jefe. Prueba de chi cuadrado. Sig. asintótica (2 Valor Chi-cuadrado de Pearson Corrección de continuidad Razón de verosimilitud
caras) 1
,000
41,106
1
,000
25,827
1
,000
45,333
1
,000
45,380 b
gl a
Prueba exacta de Fisher Asociación lineal por lineal N de casos válidos
971
Interpretación: Si el sig<0.05 se acepta la Ha. Si el sig>0.05 se acepta la Ho. Como sig>0.05 entonces puedo afirmar que la reducción en el salario influye en los problemas con el jefe.
Grafico de Barras.
2. Raza del encuestado y categoría ocupacional.
Ho: La raza del encuestado no influye en la categoría ocupacional. (no se relacionan) Ha: La raza del encuestado influye en la categoría ocupacional. (si se relacionan)
Interpretación: Del total de encuestados de raza blanca el 32.7% son empleados técnicos, el 26% son directivos, el 14.2% son operarios. Del total de encuestados de raza negra el 28.7% son empleados técnicos, el 26.4% trabajan en servicios, el 24.1% son operarios. Pruebas de chi-cuadrado Sig. asintótica (2 Valor
gl
caras)
54,349a
10
,000
56,116
10
,000
Asociación lineal por lineal
8,201
1
,004
N de casos válidos
1418
Chi-cuadrado de Pearson Razón de verosimilitud
Interpretación:
Si el sig<0.05 se acepta la Ha. Si el sig>0.05 se acepta la Ho. Como sig <0.05 se acepta la Ha. Entonces puedo afirmar que la raza del encuestado influye en la categoría ocupacional. Grafico de Barras.
3. Problemas con el alcohol y nivel de felicidad. Ho: Los problemas con el alcohol no influye en el nivel de felicidad. (no se relacionan) Ha: Los problemas con el alcohol influye en el nivel de felicidad. (si se relacionan)
Problemas con el alcohol*Nivel de felicidad tabulación cruzada
Nivel de felicidad No demasiado Muy feliz Problemas con el alcohol
Sí
Recuento porcentaje
No
Recuento porcentaje
Total
Recuento porcentaje
Bastante feliz
feliz
Total
2
9
6
17
11,8%
52,9%
35,3%
100,0%
314
565
106
985
31,9%
57,4%
10,8%
100,0%
316
574
112
1002
31,5%
57,3%
11,2%
100,0%
Interpretación: De los encuestados que si tienen problemas con el alcohol el 52.9% es bastante feliz, el 35.3% no demasisado feliz y el 11.8% muy feliz. De los encuestados que no tienen problemas con el alcohol el 57.4% es bastante feliz, el 31.9% es muy feliz y el 10.8% no es demasiado feliz. Pruebas de chi-cuadrado Sig. asintótica (2 Valor
gl
caras)
11,199a
2
,004
Razón de verosimilitud
8,626
2
,013
Asociación lineal por lineal
8,628
1
,003
N de casos válidos
1002
Chi-cuadrado de Pearson
a. 1 casillas (16,7%) han esperado un recuento menor que 5. El recuento mínimo esperado es 1,90.
Interpretación: Si el sig<0.05 se acepta la Ha. Si el sig>0.05 se acepta la Ho. Como sig <0.05 se acepta la Ha. Entonces puedo afirmar que los problemas con el alcohol influye en el nivel de felicidad. Grafico de Barras.
Realizar 3 pruebas t de Student para variables como:((t de student muestras independientes) Número de años de escolarización del padre por sexo Edad del encuestado por sexo. Etc Entrar a analizar-comparar medias-prueba t para muestras independientes-variable de prueba(edad del encuestado)-variable de agrupación(sexo) Prueba T 1. Edad del encuestado – sexo. Ho: la edad del encuestado no influye en el sexo del encuestado. (no se relacionan) Ha: La edad del encuestado influye en el sexo del encuestado. (si se relacionan)
Estadísticas de grupo
Sexo del encuestado Edad del encuestado
N
Media
Desviación
Media de error
estándar
estándar
Hombre
636
44,18
17,033
,675
Mujer
881
46,85
18,510
,624
Interpretación: Si el sig<0.05 se acepta la Ha. Si el sig>0.05 se acepta la Ho. Como sig <0.05 se acepta la Ha. Entonces puedo afirmar que la edad del encuestado influye en el sexo del encuestado.
2. Numero de años de escolarización del padre - sexo. Ho: el numero de años de escolarización del padre no influye en el sexo del encuestado. (no se relacionan) Ha: el numero de años de escolarización del padre influye en el sexo del encuestado. (si se relacionan)
Estadísticas de grupo
Sexo del encuestado
N
Media
Desviación
Media de error
estándar
estándar
Número de años de
Hombre
633
13,23
3,143
,125
escolarización
Mujer
877
12,63
2,839
,096
Interpretación: Si el sig<0.05 se acepta la Ha. Si el sig>0.05 se acepta la Ho. Como sig <0.05 se acepta la Ha. Entonces puedo afirmar que el numero de años de escolarización del padre influye en el sexo del encuestado. 3. Puntuacion de prestiguio profesional - sexo Ho: la puntuación de prestiguio profesional no influye en el sexo del encuestado. (no se relacionan) Ha: la puntuación de prestiguio profesional influye en el sexo del encuestado. (si se relacionan) Estadísticas de grupo
Sexo del encuestado
N
Media
Desviación
Media de error
estándar
estándar
Puntuación de prestigio
Hombre
621
43,85
13,278
,533
profesional (1980)
Mujer
797
42,22
12,864
,456
Interpretación: Si el sig<0.05 se acepta la Ha. Si el sig>0.05 se acepta la Ho. Como sig>0.05 se acepta la Ho.Entonces puedo afirmar que la puntuación de prestiguio profesional no influye en el sexo del encuestado. (no se relacionan).
De la base de datos MUNDO.SAV Realizar tres regresiones lineales simples (puedes escoger los q creas convenientes) además interpretar como se hizo en clases . 1. Poblacion vs producto interior bruto. Coeficientesa Coeficientes Coeficientes no estandarizados Modelo 1
B (Constante)
Error estándar
6042,739
653,523
-,004
,004
Población x1000
estandarizados Beta
t
-,087
Sig.
9,246
,000
-,900
,370
a. Variable dependiente: Producto interior bruto per-capita
Y=A+BX Producto interior Bruto=6042.739-0.004(población). Interpretación: Por 1000 habitantes espero tener un producto interior bruto de 6038.738 unidades. Resumen del modelo
Modelo 1
R ,087a
R cuadrado
R cuadrado
Error estándar
ajustado
de la estimación
,008
-,002
6485,524
a. Predictores: (Constante), Población x1000
R=Coeficiente de correlacion Cuando R tiende a uno la relación es directa o positiva. Cuando R tiende a -1 relacion inversa o negativa. Cuando R tiende a 0 no hay relación Como R=0.087 se puede afirmar que las variables no presentan relación directa. Rcuadrado= coeficiente de determinación. Mide cuan bueno es el modelo. El modelo es bueno en un 0.8%.
Dispersion de Puntos.
Con el grafico se puede visualizar que las variables no tienen relación.
2. Ingesta diaria de calorías vs tasa de mortalidad. Coeficientesa Coeficientes Coeficientes no estandarizados Modelo 1
B (Constante) Ingesta diaria de calorías
Error estándar 17,470
2,413
-,003
,001
estandarizados Beta
t
-,352
7,239
,000
-3,217
,002
Variable dependiente: Tasa de mortalidad (por 1.000 habitantes)
Y=A+BX Tasa de mortalidad=17470-0.003(ingesta diaria de calorias). Interpretación: Por 1000 unidades de calorias espero tener una tasa de mortalidad de 17467 unidades de tasa de mortalidad.
Resumen del modelo
Modelo 1
R ,352
R cuadrado a
,124
R cuadrado
Error estándar
ajustado
de la estimación ,112
a. Predictores: (Constante), Ingesta diaria de calorías
4,193
Sig.
Variable dependiente: Tasa de mortalidad (por 1.000 habitantes)
Y=A+BX Tasa de mortalidad=17470-0.003(ingesta diaria de calorias). Interpretación: Por 1000 unidades de calorias espero tener una tasa de mortalidad de 17467 unidades de tasa de mortalidad.
Resumen del modelo
Modelo 1
R ,352
R cuadrado a
,124
R cuadrado
Error estándar
ajustado
de la estimación ,112
4,193
a. Predictores: (Constante), Ingesta diaria de calorías
R=Coeficiente de correlacion Cuando R tiende a uno la relación es directa o positica. Cuando R tiende a -1 relacion inversa o negativa. Cuando R tiende a 0 no hay relación Como R=0.352 se puede afirmar que las variables no presentan relación. Rcuadrado= coeficiente de determinación. Mide cuan bueno es el modelo. El modelo es bueno en un 12.4%. Dispersion de puntos:
Con el grafico se puede visualizar que las variables no tienen relación.
3. Tasa de natalidad vs habitantes por km2 Coeficientesa Coeficientes Coeficientes no estandarizados Modelo 1
B (Constante) Tasa de natalidad (por 1.000 habitantes)
Error estándar
419,670
149,865
-8,342
5,223
estandarizados Beta
t
-,153
2,800
,006
-1,597
,113
a. Variable dependiente: Habitantes por Km2
Y=A+BX Habitantes por km2=419.670-8.342(tasa de natalidad). Interpretación: Por 1000 unidades de tasa de natalidad espero tener 7922 habitantes por km2. Resumen del modelo
Modelo 1
R
R cuadrado a
,153
,023
R cuadrado
Error estándar
ajustado
de la estimación
,014
670,9038
a. Predictores: (Constante), Tasa de natalidad (por 1.000 habitantes)
R=Coeficiente de correlacion Cuando R tiende a uno la relación es directa o positica. Cuando R tiende a -1 relacion inversa o negativa. Cuando R tiende a 0 no hay relación Como R=0.153 se puede afirmar que las variables no presentan relacion. Rcuadrado= coeficiente de determinación. Mide cuan bueno es el modelo. El modelo es bueno en un 2.3%.
Sig.
Dispersion de puntos.
Con el grafico se puede visualizar que las variables no tienen relación.
De la base de datos DIETAS.sav Verificar que INCREMENTO LONG. (cm.) es diferente según las dietas que consumen Si este incremento es igual o es diferente de acuerdo su dieta.
INTERPRETACION: El incremento de longitud de las personas que consumieron Pobre Ca es de 5.4cm, mientras que las personas que consumieron: Mayor Ca es de 6.3cm mientras que las personas que consumieron en el nivel normal tienen una media de 8.5cm. Ho=las medias de incremento de longitud son iguales. Ha=Las medias de incremento de longitud son diferentes. ANOVA INCREMENTO LONG. (cm.) Suma de
Media
cuadrados
gl
cuadrática
Entre grupos
50,867
2
25,433
Dentro de grupos
65,000
27
2,407
115,867
29
Total
F
Sig.
10,565
,000
Como el Sig=0.000 <0.05 entonces : Acepto la hipotesis Ha=las medias de incremento de longitud son diferentes. Comparaciones múltiples Variable dependiente: INCREMENTO LONG. (cm.) HSD Tukey 95% de intervalo de confianza
Diferencia de (I) dieta
(J) dieta
POBRE Ca
medias (I-J)
NORMAL Ca
NORMAL Ca
POBRE Ca RICA Ca
RICA Ca
POBRE Ca NORMAL Ca
-1,3796
-,90000
,69389
,409
-2,6204
,8204
3,10000
*
,69389
,000
1,3796
4,8204
2,20000
*
,69389
,010
,4796
3,9204
,90000
,69389
,409
-,8204
2,6204
*
,69389
,010
-3,9204
-,4796
-2,20000
INCREMENTO LONG. (cm.) HSD Tukey
Subconjunto para alfa = 0.05 1
2
POBRE Ca
10
5,4000
RICA Ca
10
6,3000
NORMAL Ca
10
Sig.
8,5000 ,409
1,000
Se visualizan las medias para los grupos en los subconjuntos homogéneos.
Límite superior
-4,8204
a
N
Límite inferior
,000
*. La diferencia de medias es significativa en el nivel 0.05.
dieta
Sig.
,69389
-3,10000
RICA Ca
Error estándar *
INTERPRETACION: El incremento de longitud es diferente de acuerdo a la dieta si deseamos un mayor incremento de longitud se deberá tomar una dieta normal en Ca, si deseamos un incremento de longitud medio se deberá tomar una dieta Rica en Ca y por ultimo si deseamos un corto incremento de longitud se deberá tomar una dieta Pobre en Ca.
GRAFICO DE MEDIAS DE INCREMENTO DE LONGITUD.