Distribución de frecuencias, tabulación cruzada y prueba de hipótesis Una vez terminado los primeros pasos de la investigación que son la recolección de los datos viene el análisis y comprensión de la información obtenida para lo cual necesitamos de la distribución de frecuencias.
DISTRIBUCIÓN DE FRECUENCIAS A menudo los investigadores de mercado necesitan responder preguntas sobre una sola variable. Las respuestas las obtenemos a través de distribución de frecuencias por medio del análisis de los datos obtenidos. El objetivo es obtener un conteo del número de respuestas asociadas con distintos valores de la variable. La ocurrencia relativa o frecuencia de los diferentes valores de la variable se expresa en porcentajes. Una distribución de frecuencias de una variable produce una tabla de conteo de frecuencias, porcentajes y porcentajes acumulativos de todos lo s valores asociados con esa variable. Una distribución de frecuencias ayuda a determinar la magnitud de la falta de respuesta a los reactivos. Además, indica la magnitud de respuestas ilegítima. Se podrían identificar los casos con estos valores y tomar medidas correctivas. También es posible detectar la presencia de datos o valores extremos. Los datos de frecuencia se emplean para construir un histograma, que es una gráfica de barras vertical donde los valores de la variable se muestran a lo largo del eje X , y las frecuencias absolutas o relativa de los valores se colocan a lo largo del eje Y .
ESTADÍSTICOS ASOCIADOS CON LA DISTRIBUCIÓN DE FRECUENCIAS Una tabla de frecuencias es fácil de leer y proporciona información básica, aunque en ocasiones esta información suele ser demasiado detallada y el investigador debe resumirla mediante estadísticos descriptivos. Los estadísticos más utilizados que se asocian con las frecuencias son las medidas de localización (media, moda y mediana), las medidas de variación (rango, rango intercuartílico, desviación estándar y coeficiente de variación), y las medidas de la forma (asimetría y curtosis).
PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPÓTESIS La prueba de hipótesis incluye los siguientes pasos: 1. Formular la hipótesis nula H0 y la hipótesis alternativa H1. 2. Elegir una técnica estadística adecuada a decuada y su estadístico de prueba correspondiente. 3. Seleccionar el nivel de significancia, 4. Determinar el tamaño de la muestra y reunir los datos. Calcular el valor del estadístico de prueba. 5. Determinar la probabilidad asociada con el estadístico de prueba con respecto a la hipótesis nula, utilizando la distribución de la muestra del estadístico de prueba. Como alternativa, determinar los valores críticos asociados con el estadístico de prueba, que dividen las regiones de rechazo y no rechazo. 6. Comparar la probabilidad asociada con el estadístico de prueba, al nivel de significancia especificado. Como alternativa, determinar si el estadístico de prueba cae en la región de rechazo o de no rechazo. 7. Tomar la decisión estadística de rechazar o no rechazar la hipótesis nula. 8. Expresar la decisión estadística en términos del problema de investigación de mercados. En la investigación de mercados, la hipótesis nula se formula de tal manera que su rechazo conduce a la aceptación de la conclusión deseada. La hipótesis alternativa representa la conclusión para la cual se busca la evidencia. El estadístico de prueba mide cuánto se aproxima la muestra a la hipótesis nula y suele deducirse de una distribución bien conocida, como la distribución normal, o chi cuadrada. t La conclusión a la que se llega con la prueba de hipótesis debe expresarse en términos del problema de investigación de mercados.
TABULACIONES CRUZADAS
Mientras que una distribución de frecuencias describe una variable a la vez, una tabulación cruzada describe dos o más variables de forma simultánea. Una tabulación cruzada es la combinación de la distribución de frecuencias de dos o más variables en una
sola tabla, y nos ayuda a entender la manera en que una variable, como la lealtad hacia la marca, se relaciona con otra variable, como el sexo. La tabulación cruzada produce tablas que reflejan la distribución conjunta de dos o más variables con un número limitado de categorías o valores distintos. Las categorías de una variable se cruzan con las categorías de otra u otras variables. Así, la distribución de frecuencias de una variable se subdivide de acuerdo con los valores o las categorías de las otras variables. A las tablas de tabulación cruzada también se les conoce como tablas de contingencia. Se considera que los datos incluidos son cualitativos o categóricos, ya que se asume que cada variable sólo tiene una escala nominal. La tabulación cruzada se utiliza ampliamente en la investigación de mercados comercial, ya que: 1. El análisis y los resultados de una tabulación cruzada pueden interpretarse y comprenderse fácilmente por parte de gerentes sin conocimientos de estadística; 2. La claridad de la interpretación ofrece un vínculo más fuerte entre los resultados de la investigación y las acciones gerenciales; 3. Una serie de tabulaciones cruzadas puede dar más información sobre un fenómeno complejo, que un solo análisis multivariado; 4. La tabulación cruzada puede resolver el problema de celdas escasas, el cual sería grave en los análisis multivariados discretos; y 5. El análisis de una tabulación cruzada es sencillo de hacer y atractivo para los investigadores menos expertos.
Es posible hacer tabulaciones cruzadas de más de tres variables, aunque la interpretación sería bastante compleja. Además, debido a que el número de celdas aumenta multiplicativamente, mantener un número adecuado de sujetos o casos en cada celda puede ser problemático. Como regla general, debe haber por lo menos cinco observaciones esperadas en cada celda para calcular los estadísticos. De esta manera, la tabulación cruzada es una forma ineficiente de examinar relaciones en las que existen muchas variables. Observe que la tabulación cruzada muestra la asociación entre variables, pero no la causalidad. Para examinar la causalidad se debe adoptar un esquema de diseño de investigación causal.
ESTADÍSTICOS ASOCIADOS CON LA TABULACIÓN CRUZADA La significancia estadística de la asociación observada generalmente se mide usando el estadístico chi cuadrada. La fuerza de la asociación o el grado de relación es importante desde una perspectiva práctica o sustantiva. Por lo general, la fuerza de la asociación sólo nos interesa si ésta es estadísticamente significativa. La fuerza de la asociación se puede medir mediante el coeficiente de correlación fi , el coeficiente de contingencia, la V de Cramer y el coeficiente lambda.