CAPITULO 14: PREPARACION DE LOS DATOS Este capítulo describe el proceso de recolección de los datos, el cual comienza con la revisión de los cuestionarios para verifcar que estén completos. Enseguida, se analiza la depuración de los datos y se orecen lineamientos para manejar las respue respuesta stas s ilegi ilegible bles, s, incomp incomplet letas, as, incong incongrue ruentes ntes,, ambigu ambiguas as o insati insatisa sacto ctoria rias. s. También se describe la codifcación, trascripción y limpieza de los datos, y se ace énasis en el tratamiento de las respuestas altantes y en el ajuste estadístico de los datos. !e analiza la elección de una estrategia de an"lisis de los datos y se clas clasif ifca can n
las las técn técnic icas as esta estadí díst stic icas as.. !e e#pl e#plic ican an los los eno enoqu ques es intr intrac acul ultu tura ral, l,
pancultural y transcultural para el an"lisis de datos en la investigación investigación de mercados inte intern rnac acio iona nale les. s.
!e
iden identi tifc fcan an
los los
prob proble lema mas s
étic éticos os
rela relaci cion onad ados os
con con
el
procesamiento de los datos, destacando la eliminación de las respuestas insatisactorias, el incumplimiento de las suposiciones que subyacen a las técnicas de an"lisis de datos, y la evaluación e interpretación de los resultados. $or %ltimo, se analiza el uso de programas estadísticos para la preparación y an"lisis de los datos. El
proceso
para
la
muestra en la diagrama de
preparación de datos se &ujo siguiente'
El primer paso consiste en verifcar que los cuestionarios sean aceptables, seguido por la verif cación, codifcación y trascripción de los datos. !e depuran los datos y se recomienda un tratamiento para las respuestas altantes. (on recuencia resulta necesario un ajuste estadístico de los datos para que sean representativos de la población de interés. El investigador debe entonces elegir la estrategia apropiada para el an"lisis de los datos. )a estrategia fnal de an"lisis de los datos difere del plan preliminar de an"lisis, debido a la inormación y los conocimientos obtenidos desde que se ormuló el plan original. )a preparación de los datos debe empezar tan pronto como se reciba el primer grupo de cuestionarios del campo, mientras el trabajo de campo contin%a. *e este modo, si se detecta alg%n problema, es actible modifcar el trabajo de campo para incorporar alguna acción correctiva.
Revisión Revisión del Cuestionario. )a preparación de los datos comienza con una revisión preliminar de todos los cuestionarios para verifcar que estén completos y la calidad de las entrevistas. )uego se ace una edición m"s minuciosa.
Ediión )a edició edición n consis consiste te en revisa revisarr los cuesti cuestiona onario rios s para para ident identifc ifcar ar las respue respuesta stas s ilegibles, incompletas, incongruentes o ambiguas. $ara manejar esas respuestas pueden regresarse los cuestionaros al campo, asignarles valores altantes o descartar a los encuestados insatisactorios.
Codi!aión El siguiente paso es la codifcación. !e asigna un código numérico o alanumérico, para representar una respuesta específca específca a una pregunta en particular, particular, junto con la posición en la columna que ocupar" dico código. + menudo es %til preparar un libro de códigos que contenga las instrucciones para la codifcación y la inormación necesaria sobre las variables en el conjunto de datos.
Transri"ión )os datos codifcados se trascriben en discos o cintas magnéticas, o se capturan en comp computa utado dora ras s por por medi medio o del del tecl teclad ado. o. Tambi ambién én pued pueden en usarse usarse las las orma ormas s de marcado sensorial, lector óptico o an"lisis sensorial computarizado.
De"uraión de Datos )a depuración de los datos requiere revisiones de la congruencia y el tratamiento de las respuestas altantes. )as opciones disponibles para el tratamiento de las respuestas altantes incluyen la sustitución con un valor neutro como la media, sustitución por una respuesta atribuida, eliminación por casos y eliminación por pares.
A#uste estad$stio de los datos )os ajustes estadísticos como la ponderación, la redefnición de las variables y las transormaciones de la escala suelen mejorar la calidad del an"lisis de los datos.
Eleión de una estrate%ia de an&lisis de datos )a elección de la estrategia de an"lisis de datos debe basarse en los primeros pasos del proces proceso o de invest investiga igació ción n de mercad mercados, os, las caract caracterí erísti sticas cas conoci conocidas das de los datos, las propiedades de las técnicas estadísticas, y la e#periencia y flosoía del investigador. )as técnicas estadísticas se clasifcan como univariadas o multivariadas. +ntes de analizar los datos en la investigación de mercados internacionales, el investigador debe asegurarse de que las unidades de medición son comparables entre países o unidades culturales. El an"lisis de datos se realiza en tres niveles' - indi indivi vidu dual al,, - dentro de un país país o una unidad cultural cultural /an"lis /an"lisis is intracultura intracultural-y l-y 0- entre países países o unidades unidades culturales culturales /an"lisis /an"lisis pancultural, pancultural, transcult transcultural-. ural-. 1arios arios aspect aspectos os éticos éticos est"n est"n relaci relaciona onados dos con el proces procesami amient ento o de datos, datos, en particular el eco de descartar respuestas insatisactorias, el incumplimiento de las suposiciones que subyacen a las técnicas de an"lisis de datos, y la evaluación e interpretación de los resultados. 2nternet y las computadoras desempe3an un papel importante en la preparación y an"lisis de los datos.
CAPITULO 1': DISTTRI(UCION DE )RECUENCIAS* TA(ULACION CRU+ADA , -ERI)ICACION DE IPOTESIS 4na vez que los datos est"n preparados para su an"lisis , el investigador debe realizar ciertos an"lisis b"sicos. En este capítulo se describe el an"lisis b"sico de datos, incluyendo la distribución de recuencias, la tabulación cruzada y la prueba de ipótesis. En primer lugar, se describe la distribución de recuencias y se e#plica la manera en que proporciona indicadores del n%mero de valores que se ubican uera uera de rango, rango, altan altantes tes o e#trem e#tremos, os, así como como inorm inormac ación ión sobre sobre la tenden tendencia cia central, la variación y la orma de la distribución subyacente. )uego, se e#amina la prueba de ipótesis al describir el procedimiento procedimiento general. )os procedimientos de prueba de ipótesis se clasifcan en pruebas de asociaciones o pruebas de dierencias. !e escribe el uso de la tabulación cruzada para entender las relaciones entre variables, considerando dos o tres de ellas a la vez. +unque la naturaleza de la asociación se puede observar en tablas, e#isten estadísticos para e#aminar la signifcancia y la uerza de la asociación. $or %ltimo, se presentan pruebas para estudiar ipótesis relacionadas con dierencias basadas en una o dos muestras.
DISTRI(UCION DE )RECUENCIAS El an"lisis b"sico de datos brinda conocimientos valiosos y guía el resto del an"lisis, así como la interpretación de los resultados. Es necesario tener una distribución de recuencias para cada variable de los datos. Este an"lisis produce una tabla de rec recue uenc ncia ias, s, porc porcen enta taje jes s y porc porcen enta taje jes s acum acumula ulati tivo vos s para para todo todos s los los valo valore res s asociados con esa variable. +dem"s, indica el grado de valores altantes, e#tremos o que caen uera del rango. )a media, moda y mediana de una distribución de
recuencias son medidas de tendencia central. )a variación de la distribución se describe mediante el rango, la varianza o desviación est"ndar, el coefciente de variación y el rango intercuartílico. )a asimetría y la curtosis dan inormación sobre la orma de la distribución.
TA(ULACION CRU+ADA )as tabulaciones cruzadas son tablas que re&ejan la distribución conjunta de dos o m"s variables. En la tabulación cruzada, los porcentajes se pueden calcular por columna, a partir de los totales de columna, o por renglón, a partir de los totales de renglón. )a regla general consiste en calcular los porcentajes en la dirección de la variable independiente, por la variable dependiente. + menudo la introducción de una tercera variable brinda inormación adicional. El estadístico ci cuadrada orece una prueba prueba de la signif signifcan cancia cia estadí estadísti stica ca de la asocia asociació ción n observ observada ada en una tabulación cruzada. El coefciente f , el coefciente de contingencia, la 1 de (ramer y el coefciente lambda lambda miden la uerza de la asociación asociación entre las variables.
PRUE(A DE IPOTESIS E#isten pruebas paramétricas y no paramétricas para ipótesis de dierencias. (on resp respec ecto to a las las para paramé métr tric icas as,, la prue prueba ba t se util utiliz iza a para para e#am e#amin inar ar ipó ipóte tesi sis s relacionadas con la media de la población. 5ay distintas ormas de la prueba t para probar ipótesis basadas en una muestra, dos muestras independientes o muestras pareadas. (on respecto a las no paramétricas, las pruebas de una muestra m"s populares son la de 6olmogorov7!mirnov 6olmogorov7!mirnov,, la ci cuadrada, la prueba de racas y la prueba binomial. $ara dos muestras no paramétricas independientes se puede utilizar la prueba 4 de 8ann79itney, la prueba de la mediana y la prueba de 6olmogorov7!mirnov. $ara muestras pareadas, la prueba de rangos con signo de 9ilco# 9ilco#on on para para muestr muestras as paread pareadas as y la prueba prueba del del signo signo sirven sirven para para e#amin e#aminar ar ipótesis relacionadas con medidas de localización. $rocedimiento general para la prueba de 5ipótesis )a prueba de ipótesis incluye los siguientes pasos' . :ormular la ipótesis nula 5; y la ipótesis alternativa 5. .
Ele Elegir gir
una una
téc técnic nica
esta estadí díst stic ica a
correspondiente. 0. !eleccionar el nivel de signifcancia.
adec adecua uada da y
su
est estadís adísti tico co
de
prue prueb ba
<. *eterminar el tama3o de la muestra y reunir los datos. (alcular el valor del estadístico de prueba. =. *eterminar la probabilidad asociada con el estadístico de prueba con respecto a la ipótesis nula, utilizando la distribución de la muestra del estadístico de prueba. (omo alternativa, determinar los valores críticos asociados con el estadístico de prueba, que dividen las las regiones de recazo y no recazo. recazo. >. (ompar (omparar ar la probab probabili ilidad dad asociada asociada con el estadí estadísti stico co de prueba prueba,, al nivel nivel de signifcancia especifcado. (omo alternativa, determinar si el estadístico de prueba cae en la región de recazo o de no recazo. ?. Tomar Tomar la decisión estadística de recazar o no recazar la ipótesis nula. @. E#presar la decisión estadística en términos del problema de investigación de mercados.
CAPITULO 1/: ANALISIS DE -ARIAN+A , CO-ARIAN+A
En este capítulo se analizaron procedimientos para e#aminar las dierencias entre m"s de dos medias o medianas. + estos procedimientos se les denomina an"lisis de varian varianza za y an"lis an"lisis is de covari covarianz anza, a, los cuales cuales tradic tradicion ionalm alment ente e se utiliz utilizan an para para analizar datos e#perimentales, aunque también se emplean para analizar datos de encuesta o de observaciones. +quí se describe el an"lisis de varianza y el an"lisis de covarianza, y se estudia su relación con otras técnicas. )uego, se revisa el an"lisis de varianza de un actor, que es el procedimiento m"s sencillo, seguido por el an"lisis de varianza de n actor actores es y el an"lis an"lisis is de covar covarian ianza. za. !e da especi especial al atenci atención ón a aspect aspectos os de la interpretación de los resultados con respecto a las interacciones, la importancia rela relati tiva va
de
los los
ac actore tores s
y
las
compa ompara raci cion ones es
m%l m%ltip tiples. es.
+lguno gunos s
temas emas
especializados, como el an"lisis de varianza de medidas repetidas, el an"lisis de varianza no métrico y el an"lisis de varianza multivariado, se estudian brevemente.
ANALISIS DE -ARIAN+A -ARIAN+A 0ETRICO En el +AB1 +AB1+ + y en el +A(B +A(B1 1+ la vari variab able le depe depend ndie ient nte e es métr métric ica a y toda todas s las las vari variab able les s inde indepe pend ndie ient ntes es son son cate categó góri rica cas, s, o una una comb combin inac ació ión n de vari variab able les s categóricas y métricas. +AB1+ +AB1+ El +AB1+ +AB1+ de un actor incluye sólo una variable independiente categórica. El interés reside en poner a prueba la ipótesis nula que plantea que las medias de las categorías son iguales en la población. )a variación total en la variable dependiente se sepa separa ra en dos dos comp compon onen ente tes' s' la vari variac ació ión n rela relaci cion onad ada a con con la vari variab able le independiente y la variación relacionada con el error. )a variación se mide en términos de la suma de cuadrados corregida para la media /!(-. El cuadrado medio se obtiene al dividir la !( entre los grados de libertad correspondientes /gl-. )a ipótesis nula de medias iguales se prueba por medio del estadístico :, :, que es la razón del cuadrado medio con respecto a la variable independiente y el cuadrado medio relacionado con el error. error. El an"lisis de varianza de A actores implica el e#amen simult"neo de dos o m"s variables independientes categóricas. 4na de sus principales ventajas es que se pueden estudiar las interacciones interacciones entre las variables independientes. independientes.
)a signif signifcan cancia cia del eecto eecto genera general, l, los términ términos os de intera interacci cción ón y los eecto eectos s principales de actores individuales se e#aminan a través de pruebas : adecuadas. !ólo tiene sentido poner a prueba la signifcancia de los eectos principales si los términos de interacción correspondientes no son signifcativos. +A(B1+ +A(B1+ El +A(B1+ incluye por lo menos una variable independiente categórica y por lo meno menos s
una una
vari varia able ble
inde indep pendi endien ente te
de
inter nterva valo lo
o
métr métric ica a.
)a
vari varia able
inde indepe pend ndie ient nte e métr métric ica, a, o cova covari riab able le,, gene genera ralm lment ente e se util utiliz iza a para para elim elimin inar ar variación e#tra3a de la variable dependiente. (uando se realiza un an"lisis de varianza de dos o m"s actores, pueden surgir int intera eraccio ccione nes. s.
4na 4na
int interac eracc ción ión
ocur ocurre re
cuan cuand do
el
eec ecto de una una
vari varia able ble
independie independiente nte sobre una variable variable dependiente dependiente difere difere en distintas distintas categorías categorías o niveles de otra variable independiente. !i la interacción es signifcativa, ésta puede ser ordinal o disordinal. )a interacción disordinal se clasifca como cruzada o sin cruce. En los dise3os equilibrados, la importancia relativa de los actores al e#plicar la variación de la variable dependiente se mide con la omega cuadrada . )as comparaciones m%ltiples en orma de contrastes a priori o a posteriori se pueden utilizar para e#aminar las dierencias entre medias específcas. En el an"lisis de varianza de medidas repetidas, se obtienen observaciones sobre cada sujeto en cada condición de tratamiento. Este dise3o sirve para controlar las dierencias entre los sujetos antes del e#perimento. El an"lis an"lisis is de varian varianza za no métric métrico o implic implica a el estudi estudio o de las dierenc dierencias ias de las tendencias centrales de dos o m"s grupos, cuando la variable dependiente se mide en una escala ordinal. El an"l an"lis isis is de vari varian anza za mult multiv ivar aria iado do /8+A /8+AB1 B1++- incl incluy uye e dos dos o m"s m"s vari variab able les s dependientes métricas.