Diseño de la investigación
Plan de tratamiento de datos
Dra. María Hinalaf
Datos Teoría
Análisis
Hipótesis corrobora refuta
Interpretación
Proporcionar el instrumento para el análisis. Trabaja con ciertas medidas que caracterizan a una población o a una muestra, denominadas:
Posición Medidas de
Dispersión
Forma
Permiten por medio de un valor conocer la posición de tendencia central del conjunto de datos y se acompañan de otras medidas denominadas dispersión, que informan cómo se encuentran distribuidos en torno a un valor central.
Posición Medidas de
Dispersión
Forma
Las medidas de tendencia central son índices que se expresan mediante una sola cifra y que representan el promedio o valor típico de un conjunto de puntuaciones.
MEDIA ARITMÉTICA O PROMEDIO: se calcula como la suma de todos los valores que toma la característica en estudio dividida por el número total de unidades experimentales observadas.
S uj et o
H ip oa cu si a
1
Leve
2
Profunda
3
Moderada
4
Leve
5
Hipoacusia Frecuencia Absoluta Leve
6
Moderada
5
Severa
Normal
4
6
Moderada
Profunda
4
7
Profunda
8
Leve
Severa
1
9
Normal
Total
20
10
Profunda
11
Leve
12
Normal
13
Profunda
14
Moderada
15
Leve
16
Normal
17
Leve
dominante.
18
Normal
Es adecuado para variables cualitativas en escala nominal u ordinal.
19
Moderada
20
Moderada
¿Cuál es el modo? Modo = Mo =Leve Podemos decir entonces que la categoría Leve presenta mayor frecuencia. El Modo es un buen indicador del centro de los datos sólo si hay una frecuencia
Días
Consultas de lenguaje
Lunes
28
Martes
30
Miércoles
25
Jueves
35
Viernes
42
Días
Consultas de lenguaje
Lunes
28
¿Cuál es la mediana? 25 28 30 35 42 Me = 30 consultas
Martes
30
Miércoles
25
Jueves
35
Viernes
42
Sábado
29
25 28 29 30 35 42
Me =
29+30
29,5
2
Si n es par, la mediana es igual al promedio de los dos datos centrales.
¿Qué pasa si incluimos las consultas del sábado? ¿Cuál es la mediana?
Ej. Si el promedio de la respuesta total de las OAEs es 12 en un grupo investigado, y la mediana es 10,5, implica que el 50 % de ese grupo tiene un valor menor a ese valor. Permite una interpretación más ajustada a la realidad.
Permiten por medio de un valor conocer la posición de tendencia central del conjunto de datos y se acompañan de otras medidas denominadas dispersión, que informan cómo se encuentran distribuidos en torno a un valor central.
Posición Medidas de
Dispersión
Forma
Se restan
Pesos Desviación
Desviación al cuadrado
2,800
-0,500
0,250
3,600
0,300
0,090
3,700
0,400
0,160
2,500
-0,800
0,640
3,900
0,600
0,360
16,500
0,000
1,500
Desviación al cuadrado
Pesos
Promedio
Desviación
2,800
3,300
-0,500
0,250
3,600
3,300
0,300
0,090
3,700
3,300
0,400
0,160
2,500
3,300
-0,800
0,640
3,900
3,300
16,500
0,600
0,360
0,000
1,500
Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza)
V(x) = 1,50/5 = 0,30 Kg2
V(x) = 1,50/5 = 0,30 Kg2 Al elevar las desviaciones al cuadrado, nos ha quedado alterada la unidad de medida. Para evitar este inconveniente la desviación estándar.
La desviación estándar es la raíz cuadrada de la varianza, expresada en las mismas unidades de los datos de la variable objeto de estudio.
D(x) = V(x) = 0,30 = 0,55 Kg
Los desvíos estándares pequeños en relación al valor de la media indican distribuciones que se concentran y la muestra o población es mas homogénea, desvíos grandes, distribuciones que se dispersan y la muestra o población es más heterogénea con respecto a la variable.
Otro ejemplo:
Media=53,1 Desviación estándar=10,3
La varianza y la desviación éstandar son adecuadas para variables cuantitativas.
Se extrae una muestra de 10 niños recién nacidos y 10 niños con 1 año de edad Ej. Se calcula realizando un cociente entre el desvío estándar y la media de los datos multiplicado por cien.
el año 2014
Traten de hacer el ejercicio:
CV= DE * 100 X
CV RN: 25% CV 1A: 18,18% Si bien el desvío estándar de los niños al año de edad es mayor al nacer, su coeficiente de variación es menor, lo cual indica que el peso es más homogéneo en este grupo que en el de recién nacidos.
Permiten por medio de un valor conocer la posición de tendencia central del conjunto de datos y se acompañan de otras medidas denominadas dispersión, que informan cómo se encuentran distribuidos en torno a un valor central.
Posición Medidas de
Dispersión
Forma
Medidas de forma Consiste en estudiar la forma de la distribución.
Simétrica: presenta un solo valor modal (unimodal), a ambos lados de dicho valor muestra igual frecuencia para valores equidistantes. Coincide la media, modo y mediana
Asimétricas: un conjunto de observaciones no se encuentra simétricamente distribuido esta sesgado.
El sesgo es positivo si la mayor proporción de las observaciones son menores o iguales que la media, esto indica que la media es mayor que la mediana. El histograma de una distribución positivamente sesgada generalmente tendrá una cola más larga a la derecha de la distribución, por ello esta distribución se conoce como sesgada a la derecha.
Asimétricas: un conjunto de observaciones no se encuentra simétricamente distribuido esta sesgado.
Por otro lado, una distribución negativamente sesgada tiene más observaciones mayores o iguales a la media. Tal distribución tiene una media que es menor a la mediana. El histograma de una distribución negativamente sesgada generalmente tiene una cola más larga a la izquierda de la distribución por eso se la conoce como sesgada a la izquierda.
El investigador se pregunta si las diferencias encontradas en los resultados pueden ser pequeñas, medianas o grandes en magnitud. La pregunt a q ue el invest igad or se hace es si est as dife renci as son reales o sólo producto del azar. En este nivel de análisis: se calcula la probabilidad de que las diferencias halladas (media, porcentaje), obtenido en dos o más muestras independientes, sean resultados del azar; si la probabilidad es muy pequeña, se considerarán a las diferencias como reales o estadísticamente significativas.
Generalmente se representa por el símbolo griego (alfa) y tiene un valor numérico que expresa la probabilidad de equivocarnos al rechazar una HN. = 0,01 (1%); 0,05 (5%); 0,10 (10%) o p <0,01; p < 0,05; p < 0,1 = Probabilidad de aceptar una diferencia que no existe.
Nivel de Confianza 99% Si los resultados obtenidos en el Test caen dentro de alguna de las zonas de rechazo, significa que es poco probable que se deban al azar de la muestra. La HN se rechaza como improbable, nunca como imposible. Existe siempre una probabilidad de rechazarla siendo que es verdadera. Ese riesgo de error se puede estrechar optando por un nivel de significación más exigente como por ej. 0,01 o 1% en cuyo caso solo admitimos la probabilidad de equivocarnos en una ocasión de cada cien.
95%
90%
Nivel de Significación p<0,01
p<0,05
p<0,1
Por medio de la estadística inferencial se pueden extraer conclusiones respecto de una población con los datos obtenidos de una muestra. El análisis en este nivel per mite establecer si los parámetros de una variable en dos o más grupos difieren estadísticamente o si dos variables son independientes entre sí.