Descripción: Lógica Manual Matemática I Aprende solo aprende ya ! Matemática Ecuaciones líneales Juego Matemática Fácil Matemáctica Aprende Fácil
Problemas de matematica para la educacion basica Autor: MSc. Eladio BustamanteDescripción completa
Muy interesante
Full description
Descripción completa
Psicologia Para LeigosDescrição completa
Descrição: muito bom
Descripción completa
Full description
Psicologia para principiantes
MATEMATICA PARA QUINTO DE PRIMARIADescripción completa
E
SEI
PJ
DI73e
D,mcey. Christine P. Estatística sem matemática para psicologíCl / Christine P. Reidy : tradução Lorí Víali. Porto Alegre: Anmcd. 2006. 608 p. : i1. , 25 cm. ISBN 978-85-363-0688-9 I. Estatística - Psicologia. L Reidy. John. II. Título.
cm: 311:159.9 '-A.H."'~'''''',''V
na publicação: Júlia Angst COclh" - CRB 10/1712
John
Christine P. Dancey University of East London
John Reidy University Sheffield Hallarn
,
ESTATISTICA
.,. SEM MATEMATICA
PARA PSICOLOGIA
Usando SPSS para Windows 3a edição
Tradução, consultoria e supervisão desta edição: Lorí Vialí
Professor Titular da Faculdade de Matemática da PUCRS
Professor Adjunto do Instituto de Matemática da UFRGS
Reimpressão 2007
2006
Pearson Education Limited 200.+ This tran,lation of Srarilrin l\írl/lilllll/arhs Education Limited.
psYCllOlog\'. 3 edition i, publi,héd hy arrangement with Pearson
ISBN Q-13-12'+9"+I-X Capa: Puo/a iV!iilliw Preparação do original: Kâria Michelle Lopes Aires Leitura tlnal: Júlia Angsr Coelho Supervisão editorial: Mônica Baí/ejo Canto Editoração eletrônica: Laser House
Reservados todos os direitos de publicação, em língua portuguesa. it ART'\IIED') EDITORA S.A. Av. Jerónimo de Omelas. 670 .. Santana 90040-340 Porto Alegre RS Fone (51) 3027-7000 Fax (5 I ) 3027-7070
É proibida a duplicação ou reprodução deste volume, no todo ou em parte. sob quaisquer formas ou por quaisquer meios (eletrónico. mecânico. gra\açilo. fotocópia, distribuição na Web e outros). sem permissão expressa da Editora. SÃO PAULO Av. Angélica. 1.091 - Higienópolis 01227 -100 Silo Paulo SP Fone (II) 3665-1100 Fax (II) 3667-1333 SAC 0800 703-3444 r:VIPRESSO NO BRASIL PRIAIED lN BRAZIL
<;~ment
with Pearson
Christine dedica este livro a 1. Johnstone, pelo amor e apoio nos últimos 18 anos. E também para Heike e Heinz Karsfens por seu carinhoso apoio. John dedica este livro para Lisa, 1.1.1)', Ollie e Arsenal. Obrigado a vocês por manter o sorriso em meu rosto,
Agradecimentos
Gostaríamos de agradecer a valiosa contribuição feita às duas edições anteriores do Estatística sem matemática para psicologia pela equipe do curso de psicologia da Open Uni versiry Psycholog:y e particularmente por Martin Le Voi e Jarrod Hollis. Agradecimentos são também devidos a Elizabeth Attree, Lisa Heavey. Joan Painter, Mary Fox e Katja Lippert. Somos gratos a John Todman pelas informações sobre pf(:~jetos pré e pós-teste e à Barbara Alexander por nos fornecer os dados originais utilizados no Capítulo 12. Gostaríamos de agradecer, ainda, as seguintes pessoas por suas contribuições para a ter ceira edição deste livro: Aiden P.. Brian Everitt. Dr. Chong Ho (Alex) Yu e aos revisores anônimos que gastaram seu tempo nos fornecendo um retorno de grande utilidade. Christine P. Dancey John Reidy
Agradecimentos do Editor Somos gratos às seguintes instituições pela permissão de reprodução de material prote gido por direitos autorais:
À SPSS pela utilização das imagens do programa. O SPSS é uma marca registrada e os nomes de outros produtos são propriedades da SPSS lnc.: aos editores Lawrence Erlbaum Associados pela tabela da página 223 reproduzida de Statistical Power for BelU/l'iollraf Scien ces, segunda edição, de J. Cohen, 1988. A Sage Publications pela Tabela 6,4 reproduzida do artigo "Denial 01' depression as an independent correlate of coronary artery disease" de M. W. Ketterer e colaboradores, publicado no foumal of'Health Psycholog\. \. I. n. I. de 1996. A Taylor & Francis Ltda. pela Tabela 7.1 reproduzida do artigo de Maclean e colaboradores, de 2000, publicado no JOllrnal ofReproductive and Inf'allt Ps\'clwlog:r. \. 18. 11. 2. p. 153-162. À Sociedade Britânica de Psicologia e ao autor S. Golombok pela Tabela 8.9 retirada do artigo "The role of coping strategies in protecting individuais against long-term tranquilizeI" publi cado no British fOllrnal of Medical Psychology. v. 69. n. 2. p. 10 1-15 em 1996. A Elsevier pela Tabela 9.6 reproduzida do artigo "Eating attitude'i and the irritable bowel syndrome" de Sullivan e outros e publicado no General Hospiw{ Píychiutry. v. 19 p. 62-4 em 1997. À So ciedade Britânica de Psicologia e a M. R. Kebbell pela T~lbela 9.9 reimpressa do artigo "The ínfluence of item difficulty on the relationship between confidence and accuracy" publicado no British JOllmal of' Psychologr. v. 87. p. 653-62 em 1996. A Taylor & Francis Ltda. pela Tabela 11.3 reproduzida do artigo publicado no Psychology aml Health, v. 12. n. 12, p. 265-275 de Emery e colaboradores em 1997. AEIsevier Inc. pela tabela da página 437 reproduzida do artigo publicado no P.\."c1wsomatíc Resellrch.. v. 45, n. 2, p. 171-178 de Tang e outros em 1998. A Taylor & Francis Ltda. pela Tabela 15.4 reproduzida do artigo publicado no Psveholog\'. Health. mui lvfedicine. v. 7, n. 1, p. 99-112 de Sher e colaboradores em 1996. A Sage Publícations pela Tabela 15.7 reproduzida do artigo "An academic detaílíng interven tion to decrease esposure to HIV infection uf110ng health-care workers". publicado no fournal
viii of Health Psyc!7o!ogy v. 1, n. 4 de Treloan e colaboradores em 1996. A Blackwell Publishing Ltda., pelo poema 'The problem, the implications ", de Robert Rosenthal, retirado do artigo "Cumulating Psychology: an apreciation", de Donald T Campell. publicado no Psychologi cal ScienCf, v. 2 de 1991. The Guardian Services Limited. por conteúdos do "Labour Website Spin Like Orwell's 1984", de David Walker, publicado no Tlle GlIardian de 08 de outubro de 2002.
Em alguns casos não conseguimos determinar o proprietário do material protegido por direitos autorais. e apreciaríamos qualquer informação que tornasse isto possível.
E~,,':
matem:::: progran: os cák~l Nós que análise ~ pos, nl" Em:ontr. na is de , estlldan: apena, ~ OUI depenJ~
tic1l1dac: confian, mas sin' mos qUe QUe relatórié recenter tendem. forlllJ c2 de ganho o deseI:' Ten tretam\.' cuidaJ,' POSSl\
análisee" esse p~" E,i' bém ~lr:' ClalS
Blackwell Publishing ~';Jl. retirado do artigo -: :'::1e10 no Psychologi , elo "Labour Website . ele 08 de outubro de
I
<>
Prefácio à Primeira Edição
·:~.ltelül
protegido por :' ['l'"hel.
Escrevemos este livro primeiramente para nossos alunos, muitos dos quais não gostam de matemática e não conseguem entender porque precisam aprender fórmulas quando existem programas de computador para fazer isto. Eles não foram convencidos pelo argumento de que os cálculos realizados servem para dar-lhes um maior entendimento do teste, aliás, nem nós. Nós queremos que eles tenham um entendimento conceituai da estatística e que gostem da análise de dados. Durante a última década tivemos que adaptar nosso ensino a grandes gru pos, nos quais uma boa parte das pessoas não tinha um treinamento formal em matemática. Encontramos dificuldade para recomendar a esses alunos alguns dos livros didáticos tradicio nais de estatística. Estes textos estavam cheios de fórmulas matemáticas e eram vistos pelos estudantes como difíceis ou chatos, ou então, forneciam meras "receitas", isto é, mostravam apenas como fazer os cálculos sem fornecer um entendimento conceituai de estatística. Outro problema que tivemos ao recomendar livros-texto de estatística foi a grande dependência dos valores probabilísticos para a interpretação dos resultados. Encontramos di ficuldades para convencê-los a levar em consideração o tamanho do efeito e os intervalos de confiança quando os textos disponíveis não faziam considerações sobre testes de hipóteses, mas simplesmente recomendavam que p < 0,05 é significativo e que p > 0,05 não é! Espera mos que com este livro os leitores fiquem mais atentos a tais assuntos. Queremos ainda mostrar aos alunos como incorporar os resultados das suas análises nos relatórios laboratoriais e como interpretar a seção de resultados de artigos de periódicos. Até recentemente os livros de estatística ignoravam este aspecto da análise de dados. É claro, en tendemos que a forma que escrevemos nosso exemplo "resultados da seção" será diferente da forma que outros psicólogos o fariam. Os estudantes podem utilizar esta seção como forma de ganhar confiança para escrever seus próprios resultados e esperamos que eles o façam com o desenvolvimento dos seus cursos. Tentamos simplificar conceitos complexos, e, algumas vezes, bastante complexos. En tretanto, ao simplificar existe uma perda de acurácia. Estamos cientes disso e tentamos ser cuidadosos ao máximo possível, enquanto tentamos dar, também, a explicação mais simples possível. Além disso, estamos cientes de que os estudantes não utilizam o SPSS em suas análises de dados. O SPSS, no entanto, é o pacote estatístico mais popular para as ciências so ciais e é por isso que o texto está tão ligado a esse programa. Os estudantes que não utilizam esse pacote deverão achar o livro útil de qualquer modo. Esperamos que os estudantes que leiam o livro não apenas aprendam com ele, mas tam bém apreciem nossas explicações e exemplos.
Prefácio à Segunda Edição
Pref
Desde que escrevemos a primeira edição de ESf({tr~fi('(/ sem matemúti('(/ pura psicologia tivemos muito retorno, tanto em relação ao conleúdo quanto ao estilo e projeto do livro: como resultado desse retorno, revisamos e reescrevemos seções ,ubstanciais deste texto. Simpli ficamos e esclarecemos partes do material e acrescentamos também novos conteúdos. Cm novo capítulo introduzindo Análise de Fatores foi adicionado e a estatístíca não-paramétrica também ganhou um capítulo próprio. A revisão do lino proporcionou-nos a oportunidade de corrigir alguns dos erros tipográficos que se infiltraram na primeira edição. Esta edição foi atualizada para o uso do SPSSPW versão 10. Esperamos que você aprecie esta edição do Estatística sem matemática para psicologia. Os conjuntos de dados utilizados pelos autores no texto podem ser acessados no endere ço: www.booksites.net/dancey.
Dê tivenh h
des~e
r"
livro Ul.: agradd _ expli..: "" esse, COI11<::I1'
para ~1':: possí\ explic,:, rêncúl' . lemhL:' COnCê): .. um eqL. çõe~ l'l'
da are.: tulo. E<
adeqLl":'~
achê
Prefácio à Terceira Edição
psico/ngia do livro: como , JC',tC' texto, Simpli ...... (" ,:onteúdos. Um <::.( :JJl)-paramétrica .. -': " ,1 oportunidade -.. ~.:-;::'l). Esta edição .. :--~, lC' e'W edição do -, "(tI /'(//'(/
::"~, 'lC'h)
. --, >",J,,, no endere-
Desde a publicação da segunda edição do Estatística sem matemática para psico[()gia, tivemos um retorno bastante útil dos leitores, sendo alguns anônimos, outros não. Boa parte desse retorno tem sido positiva, e isto tem ajudado a confirmar nossa crença de que este é um livro que apresenta um apelo bastante amplo. Um livro que objetiva ser simples, é claro, não agrada a todos, mas mesmo o retorno negativo tem servido ele auxílio para tornar mais claras explicações de alguns dos conceitos mais complicados. Gostaríamos de agradecer a todos esses leitores pelos seus comentários: percebemos que o texto teve melhorias por força dos eomentários de pessoas que lecionam estatística. Algumas sugestôes que recebemos foram para aumentar a acurácia matemática. Nós levamos em conta esses conselhos sempre que possíveL mas em alguns casos seguir as suge~tões significaria aumentar a complexidade das explicaçôes, o que fugiria ao objetivo principal do texto. Em alguns casos, fornecemos refe rências para outras fontes, e, em outros, adicionamos notas de rodapé. É sempre conveniente lembrar que alguma matemática pode ser perdida quando são dadas explicações conceituais ou quando se simplifica conteúdos mais complicados. Esperamos ter conseguido um equilíbrio razoável entre os dois propósitos. A forma de melhorar o entendimento das se onde os leitores melhor clareza foi incluir exemplos atualizados da literatura da área da psieologia em conjunto com questões de múltipla escolha ao final de cada capí tulo. Esta edição foi, ainda, atualizada eom o SPSSPW versões II e 12; contudo, ela ainda é adequada para LISO se você estiver utilizando a versão lOdo programa. Esperamos que você ache útil esta terceira edição do Estatística sem matemática para psicologia e aumente seu encantamento com a estatística e com a pesquisa em psicologia.
Sumário
Panorama do capítulo
23
1.1 1.2 1.3 IA
Por que ensinar estatística sem fórmulas matemáticas'! Variáveis Planejamento da pesquisa Delineamentos entre e dentre participantes SPSS para Windows (SPSSPW)
23
24
29
36
39
Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
51
52
53
54
Panorama do capítulo
56
2.1 2.2 2.3
56
58
63
66
70
80
82
84
86
88
90
93
95
95
Amostras e populações Medidas de tendência central Erro amostral SPSSPW: obtenção de medidas de tendência central 2A Descrição gráfica dos dados SPSSPW: geração de descritivas gráficas 2.5 Diagramas de dispersão SPSSPW: geração de diagramas de dispersão 2.6 Erro de amostragem e relacionamento entre variáveis 2.7 Distribuição normal 2.8 Variação ou dispersão de distribuições SPSSPW: obtenção de medidas de variação 2.9 Outras características da~ distribuições 2.10 Distribuiçõe~ não-normais SPSSPW: geração de curvas normais e histogramas 2.11 Obtenção de estatísticas descritivas
101
102
14 Sumário Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
103
104
105
107
Panar;: ),1
Panorama do capítulo
108
3.1
Probabilidade Distribuição normal padrão Aplicação da probabilidade à pesquisa Distribuições amostrais Intervalos de confiança e erro padrão SPSSPW: obtenção de intervalos de confiança Diagramas de barras de erros Sobreposição de intervalos de confiança SPSSPW: geração de diagramas de barras de elTO Intervalos de confiança e outras estatísticas SPSSPW: uso do instrutor de resultados (ResuJr, COilch)
108
I II
Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
139
139 141
3.2 3.3 3.4
3.5 3.6 3.7 3.8
I! 8 118
c
),2
5.3
F
F
121 129
131
132
134
137
137
142
Panara 6, I
r
Panorama do capítulo
143
Outra forma de aplicar probabilidades à pesquisa: teste de hip6teses Hipótese nula Lógica dos lestes de hipóteses Nível de significância 4.5 Significância estatística 4.6 Interpretação correta do valor p 4,7 Testes estatísticos 4,8 Erro do Tipo I 4.9 Erro do Tipo II 4. J O Por que estabelecer a. = O,05? 4.11 Testes unilaterais e bilaterais 4,12 Hipóteses subjacentes ao uso dos testes estatísticos SPSSPW: conselheiro estatístico (Swtisrics COilch)
143
148
149 151
152
154 155
157 158
F 4.1 4.2 4.3 4.4
Resumo Exercícios para o SPSSPW
160
1.60 165
169
173
173
-~~
Panar;: 7,1 7.2 7.3 7..+ 7,) 7.6
(
I
(
.
Surr,aro
Questões de múltipla escolha Referências
103
104
15 176
17"
105
107
108
108
111
118
118
J21
129
131
132
134
137
137
Panorama do capítulo
178
5.1
Correlações bivariadas SPSSPW: cOITelações bivariadas - o rde Pearson SPSSPW: obtenção uma matriz de diagramas de dispersão Correlaçõe~ de primeira e segunda ordens SPSSPW: correlações parciais rde Pearson Padrões de correlações
178
192
201
205
206
212
Resumo Exercícios para o SPSSPW Questôes de múltipla escolha Referências
213
214
215
218
5.2 5.3
139
139
141
142
Panorama do capítulo
219
6.1
220
231
Resumo
Exercícios para o SPSSPW
Questões de múltipla escolha
Referências
143
...... -::; ...
143
148
149
151
152
154
155
157
158
160
160
165
169
173
173
Análise de duas condições SPSSPW: para um teste t independente SPSSPW: delineamento de medidas repetidas para duas amostras: leste t pareado
238
244
244
246
248
Panorama do capítulo
249
7.1 7.2 7.3 7,4 7.5 7.6
Critérios de significância Tamanho do efeito Poder Fatores que intluenciam o poder Cálculo do poder Intervalos de confiança
250
251
252
253
258
261
Resumo Questões de múltipla escolha Referências
262
263
266
16
Sumário
10.5 10.6
Panorama do capítulo
267
8.1 8.2
267 269 272
8.3 8.4
10.-
Freqüências (dados categóricos) Variávell ou teste de aderência SPSSPW: X2 de uma variável SPSSPW: X2 de uma variável. utilizando freqüência~ diferentes das esperadas sob a hipótese nula Teste para independência: 2 x 2 SPSSPW: X' 2 x 2 2 Teste de independência X ; rx c
277 281 284 290
Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
294 294 296 299
i
Panora 11.1
F
S
S 11.2
R
R
E
Panorama do capítulo
300
9.1 9.2
Visualização do delineamento Significado da análise de variância SPSSPW; execução da ANOVA de uma classificação Estatísticas descritivas Comparações planejadas Controle para múltiplos testes Testes post hoc ANOVA de medidas repetidas SPSSPW: instruções para a ANOVA de medidas repelidas
301 302 307 309 311 311 312 315 317
Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
323 323 324 328
9.3 9.4 9.5 9.6 9.7
Panorama do capítulo
329
10.1 10.2 lO.3 10.4
329 330 331 333
Introdução Fontes de variação Delineamentos apropriados para uma ANOVA fatorial Terminologia da ANOVA
(
R
Panora
12.1 Q 12.2 P 12.3 l 12.4 \ 12.5 O 12.6 O 12.7 C ] 2.8 \ 12.9 \ 12.10 P 12.11 R 12.12 E 12.13 l 12.14 S S
R
Q
R
Sumáno
10.5 10.6
267 267
269
272
10.7
-...-.-:'
277
281
284
290 294 294 296 299
17
Duas variáveis independentes entre participantes SPSSPW: análise de dois fatores entre participantes Duas variáveis dentre participantes SPSSPW: ANOVA, dentre participantes com dois fatores Uma variável entre e outra dentre participantes SPSSPW: ANOVA com um fator entre participantes e um dentre participantes
33-1 3-+9 356
36-+
367
37-+
Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
375
376
378
380
Panorama do capítulo
381
I I. I
Propósito da análise de regressão SPSSPW: traçando a linha de melhor aderência SPSSPW: análise de regre"são linear Regressão múltipla
381
385
398
405
Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
Qual é o objetivo da análise de fatores') Principais tipos de análise de fatores Uso da análise de fatores na psicometria Visualização de fatores O conceito de análise de fatores Denominação de fatores Cargas de variáveis em fatores Matriz das correlações Matrizes com rotação e sem rotação Plotagem das variáveis no espaço dos fatores Rotação da matriz Execução da análise de fatores Uso de fatores ou componentes em outras análises Significado das cargas SPSSPW: análise de fatores análise de componentes principais
420
422
423
424
425
427
427
429
431
432
43-+ 435
-+-+1 -+-+2
Resumo Questões de múltipla escolha Referências
-+:'2
-+52
.-+55
1 .' -+4_"
18 Sumário 1:'.2
E
Panorama do capítulo
456
SPSSPW: obtenção de um diagrama das linhas de regres:-,ão 13.1 Grupos preexistentes 13.2 Delineamentos pré e pós-testes SPSSPW: obtenção de resultados de uma ANCOVA
458
Resumo
Exercícios para o SPSSPW
Questões de múltipla escolha
Referências
463 470 473
15.: ..;
" ~
"
482
483 484 486
R E ( R
.R d
Panorama do capítulo
487
14.1 14.2 14.3 14.4 J4.5 14.6 14.7 14.8 14.9
487 488 488 489 491 496 497 499 500
Estatísticas multivariadas Por que utilizar a análise multivariada de variflllcül') Análise multívariada de variância A lógica da MANOVA Condições da MANOVA Qual o valor F'? Post-hoc: análise de variáveis dependentes indiúdualmente VarÍúveis dependentes correlacionadas Como relatar essas análises SPSSPW: execução da MA NOVA com uma \ariá\el independente entre participantes e duas variáveis dependentes 14.10 Delineamentos dentre participantes SPSSPW: uma variável independente dentre participantes e duas variáveis dependentes Resumo Exercícios para o SPSSPW Questões de múltipla escolha Referências
502 504 512 515 516 518
523
Panorama do capítulo
524
15.1 Aternativas ao r de Pearson: o p de Spearman SPSSPW: análise de correlação o p de Spearman
525 525
A n
A
Íl
Passeio Guiado pelo Livro e Site*
Panorama dos
capítulos. cista
o que você ceve entender ao final de cada capítlilo.
2
Caixas de atividades.
Estatistica Descritiva
Fornece oportu ~ idades adicionais para você testar sua compreersão das teorias e idéias discutidas.
Caixas de cuidado. Ac_ longo do textc servem de aViSG sobre passiveis problemas Oli questões a sereI" considerados.
Pontos de discussão. Exp:ora diferentes idéias ou em detalhe.
Caixas de exemplos. Destaca as idé.as· chave que sendo discutidas para facilitar o entendimento.
í
I
Exemplos da literatura.
Captura de telas comentadas. ",
Enriquece teonas mostrando outras áreas de pesquisa Oli opinião
São dicas visuais que ilustram exemplos práticos
Sumários de fim 'I~' d e capltu o. Permitem urra revisão d::s pontos princlpa s de cada capitule
de R. ~o endereço \vww,booksite..:;.nel/danct:y. o leitor encontrará mak'riai\ para ~!'>tl!do. LJue incluem: Que~tõc~ de múltipla é\colhu, que auxi liam a 1e~1ar ii aprendizagem: arqui\os de dado:.. do SPSSP\V: ~uj~j de estudo:.: é hnks com Ou!ro\ sun relevantes. CONTEVDO EM INGLÊS,
" )J.
-----
_______ Caixas de atividades. ~ :,crtl.; ~dades
",::c:onas para testar sua ~J","IPreen5ao das :~Or as Idéias : scutidas.
Caixas de cuidado. Ao longo do texto servem de aVISO sobre possíveis problemas ou questões a serem considerados.
I~AtM:\a(klU:i
Diagramas e figuras. Servem
tt&":'"';;"::l~;J1I
Pontos de discussão.
~~
: <: :'a .. "·>"";('5
"'.
..
de auxílio ao entendimento à do texto .
as em
Exemplos da teratura.
ê,
as .y
Gslrando
··cê "'235
Captura de telas comentadas.
Exercícios com o SPSSPW. Ao fina:
São dicas visuaiS que Ilustram exemplos práticos
de cada capitulo, fornecem VTl3 oportunidade testai· a aprendizagem.
- ~ :.: -:-~''::l;:5a ou
Sumários de fim de capítulo. Permitem uma revisão dos pontos príncípais cada caoítulo.
Statistics Without Maths Cnn",,,,,P D'I1("" for Psychology ... T1",dedll'üI' ~ JolmRoidy
procura" fórmula, computa,
que
pOl:[.
A e,
trê., tiPl"
Vari«bles Me:
não é da ,>omething tllat
r:.<'!i1
vary iu terms of
prücision.
Questões de escolha múltipla adicionais.
r
sonletlUluj that \-'H! Celll lHe('l<,ur(~
('
lhe If1din fOt~lI .. o( research in ,>r:iptlce,
r
ali of the dbo>Jp.,
na políti,
seguinte " r\. de T r\. de '<. de
1
Variáveis e Projeto de Pesquisa
Panorama do capítulo Na tentativa de explicar como utilizar e entender estatística, talvez seja melhor iniciar com o destaque dos principais tópicos para o delineamento de uma pesquisa. Descreveremos, então, os aspectos mais importantes de um projeto de pesquisa com o objetivo de mostrar como ele influencia o uso da estatística. Assim, neste capítulo queremos ensinar a você o seguinte: ■ ■ ■ ■
1.1
variáveis contínuas, discretas e categóricas variáveis dependentes e independentes projetos correlacionais, experimentais e quase-experimentais projetos entre e dentre participantes
Por que ensinar estatística sem fórmulas matemáticas? A estatística como um conteúdo tende a despertar medo em corações e mentes de muitos estudantes de ciências sociais e em muitos palestrantes* também. Entender os conceitos estatísticos não deve, no entanto, ser mais difícil do que compreender qualquer outro conceito teórico (por exemplo, o conceito de inteligência). De fato, alguém poderia pensar que entender um conceito bastante concreto tal como o de média aritmética seria mais fácil do que compreender o conceito psicológico, bem mais vago, de “uma atitude”. Ainda assim, a cada ano, parece que a maioria dos estudantes, que aparentemente percebem muitos conceitos não-estatísticos como um caso consumado, lutam para entender estatística. No nosso modo de ver, muitas pessoas temem a estatística porque os conceitos estão perdidos em meio às fórmulas matemáticas. Desta forma, procuramos explicar a estatística de um modo conceitual, sem confundir os estudantes com fórmulas matemáticas desnecessárias – isto é, desnecessárias hoje em dia, na era dos pacotes computacionais. Se o estudante quer aprender estas fórmulas para melhorar o seu conhecimento, que ponto de partida melhor do que um entendimento conceitual da estatística? A estatística tende a ter uma má reputação, como ilustra a máxima de Disraeli**: “Existem três tipos de mentiras: mentiras, mentiras deslavadas e estatísticas”. Entretanto, o problema não é da estatística, mas sim da forma como ela é utilizada. Com freqüência, particularmente na política, a estatística é utilizada fora de contexto. Esse problema é claramente ilustrado no seguinte trecho extraído de um artigo publicado, em 2002, no Guardian***: * N. de T. O termo no original é lecturer que é uma categoria de professor nas universidades inglesas. ** N. de T. Benjamin Disraeli (1804-1881), primeiro ministro britânico em 1868 e 1874 a 1880. *** N. de T. Jornal britânico fundado em Manchester em 1821.
24
Christine P. Dancey & John Reidy
O site do partido gira como o 1984, de Orwell* Por David Walker O partido dos trabalhadores tem sistematicamente manipulado dados em seu site para mostrar melhorias na saúde, escolaridade e outros serviços, de acordo com um estudo não-publicado. Essa prática foi iniciada no correr das eleições do último ano e tem continuado desde então, com o partido dos trabalhadores apresentando ao público estatísticas tendenciosas de crimes e desemprego, bem como de gastos com escolas e hospitais. Os números têm sido manipulados para fornecer uma melhor impressão sobre o desempenho do partido em nível local. Em um artigo de pesquisa circulando entre acadêmicos, após ter sido apresentado recentemente em uma conferência de uma associação de estudos políticos, quatro renomados geógrafos se detiveram nos números publicados no site para áreas locais. Liderados pelos professores Danny Dorling da Universidade de Leeds e por Ron Johnston da Universidade de Bristol, a equipe verificou que o partido consistentemente ajustou e manipulou dados sem conhecê-los. Em vez de fornecer a impressão de uma série de meias verdades ocasionais, está começando a parecer que este suprimento de valores distorcidos é uma estratégia de longo prazo do partido, disse o jornal. O webmaster do partido é comparado a Winston Smith, personagem do livro 1984 de George Orwel, que passava o seu tempo no ministério do abastecimento reescrevendo a história. Nenhum número individualmente é falso no sentido estrito da palavra. É a forma como são agrupados – misturando e emparelhando áreas e anos para dar a impressão de que as coisas melhoraram – que não é sincera como um todo. Por meio do código postal, os visitantes do site do partido podem, ao que parece, acessar informações detalhadas sobre o local onde vivem. No entanto, alguns dos números apresentados referem-se ao Reino Unido ou à Inglaterra como um todo, outros a regiões inteiras, alguns à área de uma cidade ou município, mas muitos poucos a uma área específica e muito menos à rua onde as pessoas vivem. Os visitantes do site são informados sobre o aumento de enfermeiras sem ser dito que os ** números se referem às regiões do NHS em vez de hospitais específicos. Melhorias na educação são anunciadas sem que o público seja informado que se referem a toda uma área educacional – a qual pode conter até 20 regiões. As taxas de criminalidade no site não são específicas ao código postal, mas a toda uma área policial, algumas muito grandes ou até mesmo à Inglaterra e ao País de Gales como um todo. 1 (Extraído do Guardian de 8 de outubro de 2002)
O estudo mencionado nesta reportagem foi de fato publicado em 2002 no The Political Quarterly (Dorling et al., 2002). Este artigo ilustra claramente a importância de se colocar estatísticas em um contexto correto. Se for dito a você, por exemplo, que a altura média de um adulto é 173 cm, isto pode ser correto para um homem brasileiro, mas não necessariamente para um homem de uma tribo africana de pigmeus, na qual a altura média pode ser tão baixa quanto 145 cm.
1.2
Variáveis Explicamos um aspecto muito importante das estatísticas: elas só tem sentido em um contexto. Mas o que é que a estatística realmente faz? Essencialmente, a estatística nos fornece informações sobre fatores que podemos medir. Na pesquisa, as coisas que medimos são denominadas variáveis. * N. de T. George Orwell (1903-1950), escritor inglês. ** N. de T. NHS (National Health Service) – Serviço Nacional de Saúde. 1 Veja página 55 do Guardian.
Estatística sem Matemática para Psicologia
25
As variáveis são o foco principal da pesquisa em ciências. Uma variável é simplesmente algo que pode variar, isto é, pode assumir valores ou categorias diferentes. Alguns exemplos de variáveis são gênero (sexo), velocidade de digitação, velocidade máxima de um carro, número de sintomas registrados de uma doença, temperatura, público em um festival de rock, nível de ansiedade, número de gols em uma partida de futebol, inteligência, número de encontros sociais ao levar o cachorro para passear, quantidade de violência na televisão, ocupação e cores favoritas. Estes são exemplos de itens que se pode medir e registrar e que variam de uma situação ou pessoa para outra. Por que estamos interessados em variáveis? Geralmente nos interessamos por variáveis porque queremos entender o motivo da sua variação. De forma a compreender esta variação, devemos ter capacidade de medir e registrar as alterações nestas variáveis em qualquer situação dada.
1.2.1
Características das variáveis Pode ser notado nos exemplos de variáveis dados que elas apresentam diferentes características. Enquanto se pode medir a temperatura em termos de graus Celsius ou Fahrenheit e atribuir um valor ao resultado, não se pode fazer o mesmo com o tipo de ocupação, por exemplo. Isso representa uma característica importante das variáveis: o quão precisamente podem ser avaliadas. No topo, mais preciso, da escala uma variável é dita contínua, ou seja, ela pode assumir qualquer valor em um intervalo dado. Dito de outra forma, a variável não varia em passos discretos. Um exemplo de variável contínua é a temperatura. Ela é contínua porque se pode medir a temperatura, digamos, como sendo 40 oC ou, então, se pode medi-la de forma mais precisa como 40,2558 oC. Outro exemplo, menos óbvio, é a quantidade de violência na televisão. Pode-se medi-la em termos da quantidade de tempo que aparece na tela por dia. Se avaliada desta forma, isto é, em termos de tempo, a variável pode assumir qualquer valor em termos de segundos ou partes de segundo, como 1000 s ou 1000,1235672 s por dia. A única limitação na precisão da medida de tal tipo de variável é a acurácia do equipamento de medida. Com variáveis contínuas, existe a hipótese implícita de que seja contínua mesmo que a forma de medi-la não o seja. Dos exemplos fornecidos anteriormente, temperatura, nível de ansiedade, velocidade máxima de um carro, velocidade de digitação e inteligência podem ser consideradas contínuas, enquanto as demais não (veja Tabela 1.1). Uma variável pode, também, ser discreta, ou seja, ela pode assumir somente valores discretos dentro de um determinado intervalo. Um exemplo deste tipo de variável é o número de sintomas observados de uma doença que uma pessoa possui. Isso somente pode ser
Tabela 1.1
Exemplos de variáveis contínuas, discretas e categóricas
Contínuas
Discretas
Categóricas
■
Temperatura
■
■
Gênero (sexo)
■
Velocidade máxima de um carro Velocidade de digitação
■
■
■
■
Ocupação Cor favorita
■
Inteligência
■
■
Tipo de restaurante
■
Nível de ansiedade
■
■
■
Número de sintomas registrados de uma doença Número de carros possuídos Número de gols em uma partida de futebol Número de encontros sociais enquanto passeia com o cachorro Participantes de um festival de rock Número de filhos de uma família
26
Christine P. Dancey & John Reidy
registrado em termos de presença ou não do sintoma. Outro exemplo seria se escolhêssemos medir a quantidade de violência na televisão de acordo com o número de incidentes violentos por semana. Não podemos medir esta variável em termos de frações de incidentes violentos por semana. Assim, o número de incidentes violentos semanais na televisão é uma variável discreta. Dos exemplos dados anteriormente, as variáveis discretas mais óbvias são o número de “sintomas registrados de uma doença”, o de “encontros sociais enquanto passeia com o cão”, o de “freqüentadores de um festival de rock”, o de “carros possuídos”, o de “filhos por família” e o de “gols em uma partida de futebol”. Quando estudamos variáveis discretas e contínuas, existe o perigo de confundir a variável subjacente – a variável propriamente dita – com a forma de mensurá-la. Uma variável pode ser teoricamente contínua, mas a forma de medi-la é sempre discreta, não importa o grau de precisão da medida utilizada. Poderíamos medir a ansiedade (uma variável teoricamente contínua) utilizando um questionário (p. ex., o Inventário das Características e Estados da Ansiedade,* Spielberger et al., 1983) no qual o escore total no questionário fornece uma indicação do nível de ansiedade de uma pessoa. O escore total pode aumentar somente em unidades, digamos de 38 para 39 ou de 61 para 62. Assim, a forma de mensuração da ansiedade é discreta, enquanto a variável envolvida é de fato contínua. Ademais, na análise de variáveis discretas, é comum tratá-las como contínuas. Muitos dos testes estatísticos usados indicam que estamos tratando com variáveis contínuas. Freqüentemente, quando uma variável discreta pode assumir um grande número de valores dentro de certo intervalo (p. ex., público de um festival de rock pesado), pode, para efeitos práticos, ser tratada como se fosse contínua na utilização do teste estatístico. Outro tipo de variável é a categórica: aquela em que os valores assumidos são categorias. Um bom exemplo é gênero, que pode ter apenas dois valores: masculino e feminino. Variáveis categóricas podem, algumas vezes, apresentar muitos valores possíveis, como o tipo de ocupação (p. ex., juiz, professor, advogado, engenheiro, etc.). Quando lidamos com dados categóricos temos um grande número de variáveis que gostaríamos de investigar. Poderíamos, se desejássemos, categorizar pessoas com base em “se elas comeram ou não bolo de chocolate às 6h30min desta manhã’ ou talvez (ou pouco mais bizarro) ‘se elas deram ou não contribuições ao time de futebol Manchester United”. Os únicos exemplos óbvios de variáveis categóricas apresentadas na lista do início desta seção são ocupação, gênero e cor favorita. Tente se assegurar de que você entendeu os diferentes tipos de variáveis que está medindo, pois isto é importante quando se decidir como analisar os dados.
1.2.2
Dicotomização de variáveis contínuas e discretas Existem casos em que os pesquisadores convertem variáveis discretas e contínuas em variáveis categóricas. Por exemplo, poderíamos querer comparar a habilidade espacial de pessoas altas e baixas. Podemos fazer isto comparando pessoas que são mais altas do que 193 cm com aquelas que são mais baixas do que 147 cm em um teste de habilidade espacial. Desta maneira, escolhemos pontos na escala contínua (altura) e decidimos comparar aqueles participantes que estão acima e abaixo destes pontos (veja Figura 1.1). Outro exemplo poderia ser a comparação da habilidade de memória de pessoas ansiosas e não-ansiosas. Pode-se medir os níveis de ansiedade utilizando um questionário, isto é, uma
* N. de T. STAI (State-Trait Anxiety Inventory).
Estatística sem Matemática para Psicologia
27
Valores da variável categórica
Altura (cm) Alto
Baixo 200
150
100
Valores da variável contínua
Figura 1.1
Ilustração da conversão de variáveis contínuas em categóricas.
variável contínua medida em uma escala discreta. Por exemplo, a escala hospitalar de ansiedade e depressão apresenta valores que variam de 0 a 21. Para convertê-la em uma variável categórica, iremos simplesmente comparar os escores superiores a certo valor (p. ex., digamos, 11) com aqueles abaixo deste mesmo valor. Essa dicotomização (divisão em duas categoriais) de variáveis discretas e contínuas é comum na psicologia e permite que se encontrem diferenças entre grupos que podem estar nos extremos de variáveis discretas ou contínuas, por exemplo, pessoas altas e baixas. No entanto, não recomendamos tal prática, pois ela reduz a sensibilidade da análise estatística. Existe uma boa discussão de tais problemas em Streiner (2002) e Maxwell e Delaney (1993). Mencionamos isto aqui para que você possa estar ciente do que ocorre na literatura científica e, assim, entenda o que o pesquisador fez.
PONTO DE DISCUSSÃO: DICOTOMIZAÇÃO DE VARIÁVEIS CONTÍNUAS Por que os pesquisadores dicotomizam variáveis? Streiner (2002) ressalta o fato de que muitas decisões em psicologia, psiquiatria e medicina são binárias. Neste tipo de decisão, têm-se apenas duas escolhas, tais como se a pessoa apresenta ou não problema mental, se tem ou não uma determinada doença, se precisa ou não ser hospitalizada, ou se deve ou não receber alta do hospital. O argumento utilizado é que, se estes profissionais precisam tomar decisões binárias, então é legítimo investigar estes tipos de variáveis. Tal raciocínio é utilizado para dar suporte à prática disseminada de dicotomizar variáveis contínuas. Streiner argumenta que não precisamos ver as decisões que os médicos tomam como binárias. Ele sugere que seria melhor pensar em uma doença mental, por exemplo, como um contínuo. Quantos mais sintomas alguém apresenta mais afetado está. Devemos medir tais
28
Christine P. Dancey & John Reidy
constructos de forma contínua, e não dicotomizá-los. Assim, em vez de se utilizar questionários para categorizar pessoas, poderíamos usá-los para obter uma medida na qual estejam em um contínuo. Tal informação pode então ser utilizada na decisão de como tratar certas pessoas ou de alguma outra forma. Um exemplo pode ilustrar melhor a dicotomização. Foi sugerido anteriormente que é possível categorizar pessoas em ansiosas e não-ansiosas com base em escores obtidos num questionário. Pesquisadores investigando ansiedade utilizam regularmente questionários desta forma. Aqueles participantes que apresentam altos escores são classificados como de alta ansiedade, enquanto os que têm pouca pontuação são classificados como de baixa ansiedade. O método de divisão pela mediana é muitas vezes utilizado com este propósito, categorizando os que ficaram acima da mediana como ansiosos e os que ficaram abaixo como não-ansiosos (p. ex., Egloff e Hock, 2003). Streiner argumenta que a prática de dicotomizar variáveis contínuas tende a diminuir o poder da pesquisa (o poder de um teste será tratado nos Capítulos 4 e 7). A razão disto é que se perdem muitas informações sobre os participantes. Por exemplo, suponha que duas pessoas tenham os escores de 20 e 38 em um teste de ansiedade e que, quando a variável for dicotomizada, eles serão contados como de baixa ansiedade (os dois estão abaixo da mediana). Em qualquer análise subseqüente baseada na categorização feita, ambos serão tratados como se possuíssem o mesmo nível de ansiedade, isto é, serão considerados não-ansiosos. Entretanto, de acordo com os escores originais, o nível de ansiedade entre eles é bastante diferente. Tratar estas duas pessoas como idênticas em termos de níveis de ansiedade não parece fazer sentido. Seria mais sensato tentar incluir os valores reais de ansiedade em qualquer análise estatística realizada. Além disso, pode-se observar uma diferença muito maior entre os níveis de ansiedade das duas pessoas classificadas como não-ansiosas do que entre uma classificada como ansiosa e a outra não. Por exemplo, suponha que a mediana fosse 39, então todos aqueles acima deste escore seriam classificados como ansiosos e todos os abaixo como não-ansiosos. Pode-se ver aqui que uma pessoa não-ansiosa que tenha um escore de 38 tem muito mais em comum com uma ansiosa cujo escore seja 41 do que com outra não-ansiosa cujo escore seja 20. Ainda em qualquer análise posterior, os participantes com escores de 20 e 38 são classificados como idênticos em termos de ansiedade, e estes são classificados como diferentes de uma pessoa que tenha um escore de 41. Isso não faz sentido. Streiner ainda ressalta pesquisas que mostram que análises utilizando variáveis dicotômicas apresentam aproximadamente 67% da eficiência das que utilizam as variáveis contínuas ou discretas originais. Isso é uma grande perda de sensibilidade do estudo. Significa que você tem apenas 67% de probabilidade de detectar relacionamentos entre variáveis se estiver utilizando variáveis contínuas ou discretas dicotomizadas. Isso é uma séria desvantagem na condução de uma pesquisa. Além do mais, a perda de poder não é o único problema que surge quando variáveis são dicotomizadas. Maxwell e Delaney (1993) mostraram que esta prática pode levar a achados espúrios na análise estatística. Conseqüentemente, aconselhamos a não dicotomizar variáveis contínuas.
Estatística sem Matemática para Psicologia
29
Atividade 1.1 Quais das seguintes variáveis são categóricas, discretas ou contínuas? ■ ■ ■ ■ ■ ■ ■ ■
Velocidade do vento Tipos de títulos oferecidos por uma universidade Nível de extroversão Marcas de carros Times de futebol Número de peças de xadrez capturadas em um jogo Peso de pandas gigantes Número de pinturas expostas em galerias de arte
As respostas corretas podem ser encontradas no final do livro.
1.3
Planejamento da pesquisa Existem muitas técnicas estatísticas que podem ser usadas para se analisar dados coletados em uma pesquisa. Neste livro serão apresentadas algumas das mais utilizadas. Muitas destas técnicas apresentam fórmulas matemáticas complexas para calcular as estatísticas envolvidas. Estas fórmulas não serão abordadas, pois preferimos fornecer ajuda para que você entenda as técnicas a partir de um ponto de vista conceitual. Um dos principais fatores na determinação de qual teste estatístico será utilizado para analisar os dados é a forma como o estudo foi projetado ou planejado. Existem várias maneiras de projetar ou planejar um estudo, e a forma como este é feito exercerá grande influência nos tipos de procedimentos estatísticos disponíveis. Algumas vezes, os pesquisadores querem observar diferenças entre dois grupos de participantes em uma variável particular. Em outra situação pode-se querer verificar se duas variáveis apresentam algum tipo de relacionamento. Um exemplo de procura de diferenças entre dois grupos pode ser a pesquisa relatada por Nicholas e Collis (2000). No estudo, eles compararam o número de encontros sociais que pessoas tinham enquanto levavam o cão para passear com a quantidade de encontros sociais sem o cão. Constataram que caminhar com o cão aumenta o número de encontros sociais. Um exemplo de pesquisa correlacional foi relatado por Walsh e Ugumba-Agwunobi (2002). Neste estudo, entre outras coisas, investigou-se o relacionamento entre ansiedade causada pelo estudo da estatística e a procrastinação. Os autores verificaram que existem relações entre vários componentes da ansiedade causada pelo estudo da estatística (doravante denominada ansiedade estatística) (p. ex., temor do professor de estatística) e a procrastinação. Os testes estatísticos que seriam utilizados nestes exemplos são denominados de testes de diferenças e testes correlacionais, respectivamente. A forma de planejar o estudo influenciará a decisão de qual destes testes será utilizado. Nas seções seguintes serão apresentadas várias maneiras de se planejar estudos e os tipos de testes disponíveis para que o pesquisador analise os resultados.
30
1.3.1
Christine P. Dancey & John Reidy
Variáveis de confusão* Caso se pense no exemplo da caminhada com o cão, percebe-se que existem outros fatores, além da posse do cachorro, que podem afetar o número de encontros sociais das pessoas enquanto caminham. Alguns destes fatores incluem a timidez de quem está caminhando, a atratividade, o gênero, a raça do cão e diversas outras variáveis. Todos são fatores que o pesquisador não levou em consideração, mas que podem ter influenciado a interação social. Esses fatores são denominados variáveis de confusão. Em qualquer situação de pesquisa, quer em química, física, quer em psicologia, deve-se levar em conta a influência destas variáveis. Se elas forem negligenciadas, as conclusões obtidas do estudo podem não ser confiáveis. Assim, no estudo da caminhada com o cachorro, se as variáveis de confusão não são controladas, não é possível dizer, ao certo, que as diferenças obtidas se devem à propriedade do cachorro. As diferenças podem ocorrer por quaisquer outras combinações das variáveis mencionadas. A principal razão para se fazer pesquisa em condições de laboratório é tentar manter o controle sobre as variáveis de confusão tanto quanto possível. Poderá ser notado que muitas das questões de pesquisa abordadas neste capítulo foram projetadas com o objetivo de reduzir a influência das variáveis de confusão. Você deve estar ciente de que para cada variável medida existirão várias outras que podem estar relacionadas a ela (veja Figura 1.2, por exemplo). Quando um estudo como o da caminhada com o cachorro é conduzido, não é possível termos certeza se é a existência ou não do cão responsável pelas diferenças na interação social. Assim, precisamos tentar eliminar as outras variáveis (as de confusão) como possíveis razões para as alterações observadas. Fazemos isto tentando controlar estas variáveis, por exemplo, tentar combinar o máximo possível os participantes com e sem o cão nos aspectos timidez, atratividade e gênero. Ainda, pode-se assegurar que todos os participantes façam a caminhada com o mesmo tipo de cão e que caminhem nos mesmos horários e dias da semana. Uma vez que se tenha controlado estas variáveis, então é possível se ter mais confiança na conclusão de que caminhar com um cão exerce influência sobre o número de interações sociais que uma pessoa terá.
Tipo de cão Caminhar com ou sem o cão
Timidez
Número de interações sociais em uma caminhada no parque Dia da semana e hora do dia da caminhada
Gênero
Atratividade
Figura 1.2
Ilustração das variáveis que podem influenciar o número de interações sociais de uma pessoa.
* N. de T. São também utilizados os termos variável de confundimento ou confundidora.
Estatística sem Matemática para Psicologia
1.3.2
31
Delineamentos correlacionais Expusemos que o principal objetivo da ciência é o entendimento das variáveis. Mais especificamente, desejamos entender como e por que certas variáveis estão relacionadas. Talvez a forma mais simples de examinar o relacionamento entre variáveis seja a utilização de delineamentos correlacionais. Em tais projetos, medimos a variável de interesse e verificamos como cada variável se altera em relação às mudanças provocadas na variável de interesse. Um exemplo pode auxiliar a entender a situação. Anteriormente, nesta seção, descrevemos, de forma breve, o estudo de Walsh e Ugamba-Agwunobi (2002) investigando o relacionamento entre ansiedade estatística e procrastinação. Neste estudo, os pesquisadores mediram a ansie* dade estatística com a Escala de Ordenação da Ansiedade Estatística (Cruise et al., 1985). A escala mede seis componentes da ansiedade estatística, incluindo medo do professor de estatística, autoconceito de habilidades computacionais, ansiedade em aulas e provas, medo de fazer perguntas, ansiedade de interpretação e valor da estatística. Os autores realizaram uma análise correlacional e descobriram que existem relações entre procrastinação e três componentes da ansiedade estatística (medo dos professores de estatística, medo de solicitar ajuda e ansiedade de interpretação). Os pesquisadores concluíram que as variáveis medo da estatística e procrastinação estavam correlacionadas. Isto é, se uma das variáveis mudar a outra também mudará, ou ainda as duas variáveis covariam. Deve-se notar que os termos “relacionar”, “correlacionar” e “covariar” são muitas vezes utilizados indistintamente. Outro exemplo excelente de pesquisa conduzida com a utilização de desenho correlacional é a que verifica a relação entre o hábito de fumar e o câncer. Tem sido geralmente verificado que, à medida que aumenta o consumo de cigarros, o mesmo ocorre com a incidência de câncer. Portanto, existe um relacionamento entre o número de cigarros consumidos e a chance de desenvolver câncer. Se você usar um delineamento correlacional, então o tipo de técnica estatística provavelmente utilizada será o coeficiente de correlação momento-produto de Pearson** ou talvez o coeficiente de correlação rô de Spearman.*** Tais coeficientes serão abordados nos Capítulos 5 e 15, respectivamente.
Oh, não! Acho que lerei isto amanhã.
Est atís tica
com ma tem átic a
Estat ística co mate m mátic a
Figura 1.3
Relação entre ansiedade estatística e procrastinação.
* N. de T. STAR (Statistics Anxiety Ratings Scale, Cruise et al., 1985). ** N. de T. Karl Pearson (1857-1936). *** N. de T. Charles Edward Spearman (1863-1945).
32
Christine P. Dancey & John Reidy
1.3.3
Causação A questão da causação é problemática em ciência, ainda mais quando utilizamos delineamentos correlacionais. Um dos principais objetivos da ciência, é descobrir a causa dos acontecimentos. Em todos os ramos da ciência pesquisadores estão tentando determinar relações causais entre variáveis. Por exemplo, Newton* produziu uma teoria elegante para explicar o que causa a queda de maçãs. Estabeleceu uma relação causal entre a queda das maçãs e a gravidade. Em muitas pesquisas psicológicas também tentamos estabelecer tal relação causal. Quando usamos delineamentos correlacionais, no entanto, é difícil estabelecer se a alteração em uma variável causa a mudança em outra variável. Isso ocorre porque em tais delineamentos estamos simplesmente observando e registrando mudanças em variáveis e tentando estabelecer se elas covariam de alguma forma que faça sentido. Em virtude de que estarmos apenas observando como as variáveis mudam, é difícil (para não dizer impossível) estabelecer a relação causal entre elas. Para sermos capazes de fazer isto de forma mais fácil, é necessário manipularmos uma das variáveis (mudá-la sistematicamente) e então observar o que acontece com a outra variável. Esta abordagem será discutida mais tarde nesta seção. Uma das regras de ouro do delineamento correlacional é não se poder inferir causação a partir de uma correlação. A indústria do tabaco tem se valido desta fraqueza da correlação para argumentar que não existe evidência de que o fumo cause câncer. Estritamente falando, isso pode estar correto, pois os estudos têm sido principalmente correlacionais. Todavia, considerado a quantidade de pesquisas feitas corroborando uma relação causal entre o hábito de fumar e o câncer, alguém seria tolo em ignorar as pesquisas e acreditar nas pessoas que estão tendo lucro com a venda de tabaco. Descobrir que ansiedade estatística e procrastinação estão relacionadas não nos informa muito sobre a relação causal entre estas duas variáveis. Pode ser que o aumento na ansiedade estatística aumente a procrastinação, ou então que alterações na procrastinação causem alterações na ansiedade estatística. De forma alternativa, podem existir outras variáveis, tais como uma neurose, que pode causar mudanças tanto na ansiedade estatística quanto na procrastinação (veja Figura 1.4). Você pode ver, portanto, que a existência de um relacionamento entre duas variáveis não nos informa, necessariamente, muita coisa sobre causa e efeito.
Neurose
Ansiedade estatística
Figura 1.4
Procrastinação
Possível relação causal entre neurose, ansiedade estatística e procrastinação.
* N. de T. Isaac Newton (1642-1727).
Estatística sem Matemática para Psicologia
33
Um outro exemplo da limitação do delineamento correlacional é o relacionamento entre ansiedade e depressão. Muitos estudos mostraram que ansiedade e depressão estão altamente relacionadas (veja Clark e Watson, 1991). Pessoas que apresentam altos níveis de ansiedade também apresentam altos níveis de depressão. Poderíamos dizer, então, que depressão causa ansiedade ou ansiedade causa depressão? Não, não podemos. É bastante provável que alguma variável interveniente esteja entre estes dois estados de humor. De fato, o que se tem verificado é que a ansiedade e a depressão apresentam um elemento angustiante geral em comum, e é ele que explica o alto valor do relacionamento entre as duas variáveis (veja Figura 1.5). É possível estabelecer relacionamento causal utilizando delineamentos correlacionais, mas estas situações são bem mais complexas do que os delineamentos indicados nesta seção e envolvem a medida das variáveis em vários pontos no tempo.
Angústia
Ansiedade
Depressão
Aqui não existe uma conexão causal direta
Figura 1.5
1.3.4
Ilustração do elemento comum compartilhado por ansiedade e depressão e a ausência de uma conexão causal entre eles.
Projeto experimental Para estabelecermos relações causais entre variáveis com mais facilidade, precisamos manipular uma das variáveis de modo sistemático e ver qual o efeito obtido na outra variável. Tal processo é, essencialmente, o realizado no projeto experimental*. Um dos delineamentos ou projetos mais utilizado em ciência é o projeto de experimentos, também denominado de experimento verdadeiro. Se você lembrar de experimentos típicos que realizou, na escola, em química ou física, perceberá que eles representam o projeto de experimentos. Por exemplo, queremos ver o que ocorre com o sódio quando exposto ao ar e comparar isto com o resultado de sua exposição à água. Observaríamos uma reação lenta na condição “ar” (a superfície brilhante do sódio torna-se opaca) e uma reação rápida na condição “água” (o sódio torna-se efervescente e pode entrar em combustão). Em um experimento temos uma variável que estamos mensurando (o estado do sódio, denominada de variável dependente) e queremos descobrir que efeito sofrerá a outra variável, denominada de variável independente (por exemplo, ao que o sódio está exposto). A variável manipulada pelo observador é denominada de variável independente, isto é, o seu valor não é dependente das outras variáveis investigadas. A outra variável do experimento é denominada de variável dependente. Ela é denominada de * N. de T. Os termos em inglês são DOE (Design Of Experiments) e experimental design (utilizado pelos autores). No Brasil são utilizadas as versões: projeto de experimentos, desenho de experimentos ou ainda delineamento de experimentos.
34
Christine P. Dancey & John Reidy
dependente porque depende dos valores da variável independente. De fato, o propósito de um experimento é comprovar ou descartar tal dependência. Podemos conduzir tal pesquisa em psicologia, por exemplo, se quisermos verificar que caminhar com o cão de fato influencia o número de encontros sociais. Para conduzirmos tal estudo, tomamos um grupo de pessoas e aleatoriamente sorteamos alguns para caminhar com o cão, enquanto os demais caminham sem o cão. Poderíamos prever que caminhar com o cão acarretará mais encontros sociais do que caminhar sozinho. Dessa forma, estabelecemos uma hipótese que será testada por meio da estatística. Vamos supor que o experimento foi realizado e verificou-se que os que caminharam com o cão tiveram mais encontros sociais do que aqueles que caminharam sozinhos. Este resultado confirmaria a nossa previsão. Entretanto, existem vários outros fatores que podem ter influenciado na verificação de uma diferença de encontros sociais entre as duas condições (veja Figura 1.2). Como saberemos que a diferença observada foi causada pela manipulação da variável independente em vez de uma das possíveis variáveis de confusão? Não sabemos. O que é possível fazer, neste caso, é tentar limitar o impacto das variáveis de confusão sobre o estudo, pela alocação aleatória dos participantes às condições da variável independente. Por meio da alocação aleatória dos participantes às condições, pode-se reduzir a probabilidade de que os dois grupos difiram em aspectos como timidez, atratividade, gênero e, assim, eliminar estes fatores enquanto causas possíveis da diferença no número de encontros sociais entre os dois grupos. Se a alocação dos participantes às condições for feita de forma aleatória, então poderemos ter mais confiança na nossa habilidade para inferir um relacionamento causal entre a variável independente e a variável dependente (caminhar com ou sem cão e número de encontros sociais). É a alocação aleatória que torna o projeto de experimentos tão útil na determinação do relacionamento causal entre variáveis. Dessa forma, uma das principais características definidoras de um projeto de experimentos é a alocação aleatória dos participantes às condições. Para utilizar a alocação aleatória, no exemplo mencionado, atribui-se a cada participante um número, ao acaso, gerado em um computador. Pode-se, então, solicitar a todos aqueles cujo número seja inferior a um determinado valor que caminhem com o cão e aos demais que caminhem sozinhos. Assim, teremos alocado aleatoriamente os participantes a cada uma das duas condições do estudo. É claro que a alocação aleatória é mais útil para controlar fatores interpessoais, tais como timidez. Existem, entretanto, outros fatores relacionados ao projeto de experimentos que não podem ser controlados pela alocação aleatória dos participantes às condições. Dê uma nova olhada na Figura 1.2 e irá notar que variáveis de confusão, como a hora do dia e o tipo de cão, não serão controladas pela alocação aleatória dos participantes às condições da variável independente. Estas são questões que deverão ser tratadas por outros aspectos do projeto de experimentos, como assegurar que variados tipos de cão sejam utilizados no estudo e que as duas condições sejam realizadas na mesma hora do dia e no mesmo dia da semana.
1.3.5
Projetos quase-experimentais Muitas vezes em psicologia queremos trabalhar com variáveis que não podemos manipular diretamente. Se quisermos comparar homens e mulheres de alguma forma, não podemos manipular o grupo ao qual cada participante pertence. Não é possível alocar aleatoriamente participantes às condições masculino e feminino. Assim, estritamente falando, não temos um projeto experimental. Para ressaltar o fato de que tais projetos não são estritamente experimentais, são denominados de projetos quase-experimentais. Como um exemplo, suponha que estejamos conduzindo o estudo da caminhada com o cão mencionado anteriormente e que desejemos remover o gênero como variável de confusão. Podemos conduzir um estudo no qual tentamos descobrir se as mulheres têm mais encontros sociais quando caminham sem cão do que os homens. Pode-se ver que neste estudo
Estatística sem Matemática para Psicologia
35
os participantes não são alocados aleatoriamente às condições, pois já são homens ou mulheres. Assim, temos um projeto quase-experimental. Se for verificado que as mulheres têm mais encontros sociais do que os homens, então será possível argumentar que o fato de ser mulher encoraje mais a interação social. Um dos problemas com os projetos quase-experimentais é a alocação não-aleatória das várias condições que constituem a variável independente. Não podemos ter certeza de que a manipulação da variável independente (ou deveríamos dizer pseudomanipulação) é a responsável pelas diferenças entre as várias condições. Assim, é mais difícil inferir relações causais de projetos quase-experimentais do que de projetos experimentais. Como ilustração, o exemplo anterior pode apresentar algum fator, além do gênero, que distingue os dois grupos (tamanho, por exemplo). Pode ser que as mulheres sejam vistas como menos ameaçadoras em virtude de serem menores do que os homens. Desta forma, uma variável de confusão importante infiltrou-se em nosso estudo. Em virtude do aumento do risco das variáveis de confusão estarem associadas com estudos quase-experimentais, os estudos experimentais devem ser preferidos sempre que possível. Caso você não saiba se está lidando com um projeto experimental ou quase-experimental, observe a alocação aleatória dos participantes às condições. Se ela não for uma característica do estudo, então é mais provável que você esteja lidando com um estudo quase-experimental. Outra razão importante para preferir estudos experimentais é o fato de muitas das técnicas estatísticas utilizadas indicarem que os participantes foram atribuídos aleatoriamente às condições. Se a alocação não foi ao acaso, pode-se ter uma redução na validade das conclusões baseadas nestas técnicas estatísticas. Na prática este não é um grande problema, mas você precisa estar ciente de que ele existe. Se você está utilizando um estudo experimental ou quase-experimental, então algumas das técnicas disponíveis para você são: o teste t, o teste U de Mann-Whitney*, o teste de Wilcoxon** e a análise de variância (ANOVA). Todos eles serão abordados mais adiante no livro.
1.3.6
Panorama dos delineamentos de pesquisa Descrevemos três dos principais delineamentos de pesquisa e como eles influenciam os diferentes tipos de análises estatísticas que podemos utilizar. A Tabela 1.2 fornece um breve sumário das principais características destes delineamentos em conjunto com os testes estatísticos que seriam apropriados a cada tipo. Tabela 1.2
Panorama das principais características dos vários delineamentos de pesquisa
Delineamento
Características
Teste estatístico
Experimental
■
■
■ ■
Quase-experimental
■ ■ ■
Manipulação da variável independente Alocação aleatória dos participantes aos diversos grupos Análise por comparação entre os grupos Pseudomanipulação da variável independente Alocação não-aleatória dos participantes Análise por comparação entre os grupos
■ ■ ■ ■ ■ ■
Correlacional
■ ■ ■
Investigar o grau com que as variáveis co-variam Não se pode inferir causação a partir de correlação Analisar por meio de testes de correlação
* N. de T. Henry Berthold Mann (1905-2000) e Donald Ransom Whitney (1915- ). ** N. de T. Frank Wilcoxon (1892-1965).
■ ■
Testes t ANOVA Teste U de Mann-Whitney Testes t ANOVA Teste U de Mann-Whitney Teste de Wilcoxon Correlação de Pearson ρ de Spearman
36
Christine P. Dancey & John Reidy
Atividade 1.2 Classifique os seguintes estudos em correlacionais, experimentais ou quase-experimentais: (a) Relação entre o consumo de cafeína e a incidência de dor de cabeça (b) Diferença entre homens e mulheres na habilidade verbal (c) Efeito no desempenho em uma prova na qual participantes são alocados aleatoriamente a condições sem ruído e com alto ruído (d) Diferenças na auto-estima de pessoas altas e baixas (e) Relacionamento entre estresse e horas gastas trabalhando (f) Diferença em escores de ansiedade entre dois grupos de participantes aleatoriamente alocados, considerando que um grupo aprendeu técnicas de relaxamento e o outro não
1.4
Delineamentos entre e dentre participantes Outra característica importante dos delineamentos de pesquisa é verificar se os participantes fazem parte de mais de uma condição. Retomando o exemplo da caminhada com o cão e encontros sociais, temos um experimento no qual a variável independente é o participante estar caminhando com o cão, e a variável dependente é o número de encontros sociais. Como podemos alocar os participantes às condições neste experimento? ■
■
Você deve lembrar que se sugeriu como melhor alternativa alocar os participantes aleatoriamente às condições de caminhar com o cão e sem o cão. Existe, no entanto, a alternativa de que cada participante tome parte nas duas condições.
O primeiro procedimento é denominado de delineamento entre participantes (algumas vezes também denominado de delineamento independente ou não-correlacionado); o segundo, de delineamento dentre participantes (algumas vezes denominado de medidas repetidas ou delineamento relacionado). Para decidir qual destes dois procedimentos utilizar, é preciso levar em consideração as vantagens e desvantagens de cada um.
1.4.1
Delineamentos dentre participantes A principal vantagem de utilizarmos o delineamento dentre participantes é podermos controlar muitas das variáveis de confusão interindividuais. Quando utilizamos grupos diferentes de pessoas em cada condição, corremos o risco de que exista alguma variável, além da variável independente, que influencie na diferença entre os grupos. Você terá, se isto acontecer, uma variável confundidora ou de confusão. Quando usamos o delineamento dentre participantes teremos um controle, muito maior, sobre tais variáveis. Em virtude de termos as mesmas pessoas em todas as condições da variável independente, existirão muito menos variações externas entre as condições. Em geral a mesma pessoa trará os mesmos problemas ou vantagens para todas as condições da variável independente. Uma segunda vantagem da utilização deste tipo de delineamento é a necessidade de trabalhar com menos participantes para realizar o experimento. Por exemplo, se existirem duas condições e necessitamos de um mínimo de 12 participantes por condição, o total necessário para completar o estudo é de 24 pessoas com o delineamento entre participantes, mas apenas 12 no delineamento dentre participantes. Se você estiver realizando um estudo em que os custos envolvidos forem altos, então este delineamento deverá ser levado em consideração.
Estatística sem Matemática para Psicologia
37
Entretanto, nem tudo são rosas no jardim do delineamento dentre participantes. Se você pensar um pouco sobre o estudo da caminhada com o cão, será capaz de identificar alguns possíveis problemas. Poderá ocorrer, se utilizadas as mesmas pessoas em ambos os casos, que a familiaridade com o caminho e com outras pessoas, já encontradas, encoraje a interação. Assim, na segunda condição os participantes podem ter mais encontros sociais em virtude desta familiaridade do que pelo fato de ter o cachorro. Por outro lado, eles podem ficar aborrecidos ou cansados quando completarem a caminhada na segunda condição, e isto, talvez, afete o número de encontros sociais que teriam. Esses fatores serão variáveis de confusão e podem dificultar a interpretação dos dados. Qualquer diferença no número de encontros sociais detectada entre as duas condições poderá ter origem nesses fatores, em vez da manipulação experimental da variável independente. Esses fatores são denominados de efeitos de ordem. Uma forma de eliminar os efeitos de ordem é introduzir um contrabalanço no estudo. Para contrabalançar, pode-se fazer metade dos participantes completar a primeira condição e em seguida a segunda condição, enquanto a outra metade segue o mesmo procedimento, mas na ordem contrária. Como forma de introduzir o contrabalanço no estudo da caminhada com o cão, é preciso que a metade dos participantes caminhe primeiro com o cão e depois sem o mesmo, enquanto a outra metade faz o contrário. Qualquer efeito como fadiga ou tédio será, desta maneira, distribuído entre as duas condições da variável independente e não será mais variável de confusão (veja Figura 1.6). Você ainda verificará que cada participante caminhará sob as duas condições, retendo, assim, as vantagens da utilização do delineamento dentre participantes. Outra limitação do delineamento dentre participantes é a maior probabilidade de os participantes perceberem o objetivo do experimento por terem tomado parte nas duas condições. Trata-se de um problema porque os participantes podem querer fazer o que o experimentador deseja que façam, e não o que normalmente fariam. Isso é denominado de efeito de demanda. É mais provável que ocorra no delineamento dentre participantes porque cada participante é exposto a mais condições experimentais do que no delineamento equivalente entre participantes. Em certo sentido, o contrabalanceamento pode reduzir, mas não necessariamente eliminar, os efeitos de demanda. Um problema adicional associado ao delineamento dentre participantes é a impossibilidade de poder utilizá-lo em muitos projetos quase-experimentais. Por exemplo, se você
Todos os participantes
Caminhando com o cão
Caminhando sem o cão
Todos os efeitos de ordem na condição “sem o cão”
Delineamento dentre participantes sem contrabalanceamento Metade dos participantes
Caminhando com o cão
Caminhando sem o cão
Metade dos participantes
Caminhando sem o cão
Caminhando com o cão
Delineamento dentre participantes com contrabalanceamento
Figura 1.6
Ilustração da forma de eliminar efeitos de ordem pela utilização de contrabalanceamento.
Efeitos de ordem afetando igualmente as duas condições
38
Christine P. Dancey & John Reidy
quiser comparar encontros sociais de homens e mulheres enquanto estão caminhando, não será possível a utilização do delineamento dentre participantes. Não se pode ter uma pessoa que seja homem e mulher simultaneamente em duas ocasiões separadas, e uma pessoa não pode tomar parte nas duas condições (a menos, é claro, que faça uma mudança de sexo entre a participação nas duas condições).
Atividade 1.3 Como você introduziria o contrabalanceamento no seguinte estudo? Um estudo é conduzido para testar os efeitos da motivação no desempenho na tarefa de desenhar sobre um espelho. Os participantes são solicitados a desenhar uma estrela utilizando o equipamento para desenho sobre o espelho. O tempo decorrido para desenhar a estrela e o número de erros são registrados. Os participantes devem, então, realizar a tarefa novamente, mas desta vez ganharão R$ 30,00 se completarem a tarefa mais rápido e com menos erros.
1.4.2
Delineamentos entre participantes Uma das mais importantes características positivas do delineamento entre participantes é, em virtude de se ter grupos diferentes em cada condição das VI, cada participante estar menos sujeito a ficar chateado, cansado ou frustrado com o experimento. Como conseqüência, há maior probabilidade de apresentarem desempenho ótimo. De modo semelhante, o experimento será menos suscetível a efeitos práticos, e os participantes estarão menos propensos a racionalizar sobre os objetivos do estudo. Esse tipo de delineamento, portanto, reduz os efeitos de demanda e de ordem, e pode-se, de modo geral, eliminar do experimento esses fatores como variáveis de confusão. O fator negativo é a necessidade de um número maior de participantes do que em um experimento dentre participantes. Ainda, em virtude de cada uma das condições utilizar diferentes participantes, perde-se um certo grau de controle sobre as variáveis de confusão interparticipantes. Por exemplo, suponha que você está conduzindo o estudo sobre a caminhada com o cão descrito previamente como um delineamento entre participantes. O que ocorre se realmente constatarmos que caminhar com o cão leva a mais encontros sociais? Antes de podermos aceitar isso como verdadeiro, precisamos nos assegurar de que não existem variáveis de confundimento. Uma variável confundidora importante, em tal estudo, talvez seja a timidez dos que estão caminhando. Pode acontecer, por acaso, de os caminhantes sem o cão serem mais tímidos, e, desta forma, o menor número de encontros se deve a esta variável. Se tivéssemos feito este experimento como um delineamento dentre participantes, teríamos condições de controlar essa variável de confusão, pois cada pessoa caminha com e sem o cão. Isso significa que o nível geral de timidez seria o mesmo sob as duas condições, e essa variável de confusão não existiria. Da discussão referida você pode ver que um problema do delineamento entre participantes é pessoas diferentes trazerem características diferentes às condições do experimento. Quando estamos aleatoriamente alocando participantes às condições, podemos, por acaso,
Estatística sem Matemática para Psicologia
39
alocar todos os participantes com uma determinada característica a um grupo, e isso talvez confunda ou mascare os resultados. As técnicas estatísticas que descrevemos neste livro darão indicações da probabilidade de tais circunstâncias aparecerem na nossa pesquisa. A Tabela 1.3 fornece um sumário das vantagens e desvantagens dos delineamentos entre e dentre participantes. Deve ficar claro que as vantagens do delineamento dentre participantes tendem a ser desvantagens no delineamento entre participantes e vice-versa. Tabela 1.3
Sumário das vantagens e desvantagens dos delineamentos entre e dentre participantes
Delineamento
Vantagens
Desvantagens
Entre participantes
■
■
■
Dentre participantes
■ ■
Ausência relativa de efeitos práticos e de fadiga Participantes menos sujeitos a se comportarem de acordo com os objetivos do estudo Necessidade de um número maior de participantes Inexistência de muito controle das variáveis de confusão entre condições
■
■ ■
Necessidade de um número menor de participantes Grande controle das variáveis de confusão entre as condições Aumento da probabilidade de efeitos práticos e de fadiga Participantes com maior probabilidade de adivinhar os objetivos do estudo
Atividade 1.4 Como você projetaria um estudo para investigar a possível relação entre cafeína e habilidade matemática?
SPSS para Windows (SPSSPW) Esta seção fornece uma breve introdução ao SPSS para Windows e explica como entrar e salvar dados em um arquivo. Explica ainda a diferença na entrada de dados para os delineamentos entre e dentre participantes.
O básico Primeiro você deve saber algumas coisas básicas sobre programas. O Windows é uma interface gráfica que permite ao usuário manipular ícones e informação textual na tela. Muitos programas, tais como o SPSS, apresentam diferentes janelas que você poderá manipular quando necessário. Quando você roda o SPSS para Windows versões 10, 11 e 12 (SPSSPW), verá uma janela perguntando o que quer fazer.
40
Christine P. Dancey & John Reidy
Botões de minimizar e reduzir/ampliar*
Barras e setas de rolagem
A primeira decisão que você precisa tomar é se quer abrir um arquivo de dados já existente ou criar um novo (entrar com novos dados). Para abrir um arquivo existente, selecione a opção Open an existing data source (Abrir uma fonte de dados já existente) da caixa de diálogo (janela) What would you like to do? (O que você gostaria de fazer?). Você deve, então, selecionar o arquivo de interesse e clicar em OK para continuar. Se quiser inserir dados, então você deve selecionar a opção Type in data (digitar dados) e clicar em OK. Feito isso, aparecerá a seguinte tela: Variáveis = colunas Participantes (casos) = linhas
Painéis (orelhas): Data View (Ver Dados) e Variable View (Visualizar Variáveis)
* N. de T. Os autores não falam sobre o ícone , que fecha a janela ativa e também não mencionam que os botões de reduzir e ampliar são um só e funcionam como uma chave liga/desliga.
Estatística sem Matemática para Psicologia
41
Você pode pensar que a janela ativa é muito pequena para mostrar toda a informação disponível. É possível aumentar o tamanho da janela ativa clicando nos botões Minimizar, Reduzir/Ampliar ( , ou ) no canto superior direito da janela ativa. Aqui, o botão minimiza a janela ativa; reduz uma janela ampliada, e aumenta uma janela reduzida. Minimizar a janela ativa consiste em reduzi-la a um ícone que aparecerá na parte inferior da tela. Se uma janela estiver reduzida, você poderá visualizar mais informações se clicar no botão . Se a janela já estiver em seu tamanho máximo, então, para se poder ver mais informações, ela deverá ser rolada (para cima ou para baixo) por meio da barra ou setas situadas no lado direito da janela.
Entrada de dados Antes de executar qualquer análise, você precisa fornecer os dados. Note que existem células, que são o encontro das linhas com as colunas. Cada linha de dados que você fornecer representará os dados de um participante, e cada coluna representará os dados de uma variável. Por exemplo, suponha que você deseja rodar um estudo que esteja procurando relações da ansiedade estatística com a procrastinação. Digamos que temos os seguintes dados de entrada: Participantes: P1 P2 P3 P4 P5 P6 Ansiedade estatística: 55 59 48 60 62 50 Procrastinação: 125 132 94 110 140 96 A primeira coisa a fazer é declarar as variáveis no SPSSPW. Para determinar o nome e demais características das variáveis, é preciso selecionar o painel Variable View (Visualizar Variáveis) no final esquerdo da tela. A tela mudará para uma na qual você poderá caracterizar as variáveis do seu arquivo de dados.
Uma célula
Painéis: Ver Dados e Visualizar Variáveis
Na tela de visualização de variáveis (Variable View), as linhas representam variáveis, e as colunas algum tipo de formatação da variável. Você precisa fornecer o nome de cada variável na primeira coluna, denominada de Name (Nome). Clique na primeira linha desta coluna e digite o nome da variável. Temos duas variáveis para serem declaradas, a ansiedade estatística
42
Christine P. Dancey & John Reidy
e a procrastinação. Digite no nome da primeira variável: statsanxiety. Você precisa levar em conta as seguintes regras quando quiser nomear variáveis: ■
■ ■
■
Não se usa mais do que 16 caracteres. Por exemplo, statsanxiety é válido, mas statisticsanxiety não. Nas versões anteriores ao SPSS 12, o nome só pode ter até 8 caracteres. Não é possível utilizar marcas de pontuação ou espaços. Por exemplo, statsanxiety é válido, mas stats anxiety não.* Não é preciso se preocupar com letras maiúsculas, pois o SPSSPW converterá todo o nome para letras minúsculas.
Uma vez que você tenha digitado statsanxiety na primeira célula, clique na próxima célula abaixo e digite o nome da segunda variável. Lembre que ele só pode ter até 16 caracteres (8 para as versões anteriores ao SPSS 12). Você poderá denominá-la procrastination. Quando tiver digitado o nome da segunda variável, a tela deverá ser semelhante à seguinte.
Nomes das variáveis
As variáveis foram declaradas, então você pode agora entrar com os dados. Para fazer isso, você precisa selecionar o painel (no fundo esquerdo da tela) Data View (Visualizar Dados), obtendo a seguinte tela:
* N. de T. Se quiser ou precisar separar o nome de uma variável, utilize o underscore ( _ ).
Estatística sem Matemática para Psicologia
43
Os dados da ansiedade estatística devem ser digitados nesta coluna
Os dados da procrastinação devem ser digitados nesta coluna
Você poderá notar que as duas primeiras colunas estão rotuladas como statsanxiety e procrastination. Lembre-se que na tela de visualização de dados (Data View) as colunas são variáveis e as linhas são participantes. Desta forma, todos os dados da ansiedade estatística (statsanxiety) deverão ser digitados na primeira coluna, e os da variável procrastinação (procrastination), na segunda. Vá adiante e entre com os dados apresentados anteriormente. Uma vez feito isso, a tela deverá ser semelhante à seguinte:
Menu File (Arquivo)
Você pode visualizar aqui os dados que foram digitados.
44
Christine P. Dancey & John Reidy
Salvando os dados Após ter fornecido os dados, é uma boa idéia salvá-los em um arquivo. Isso evitará que tenha de digitá-los novamente caso queira realizar outras análises no futuro. Para salvar os dados, é necessário colocar o ponteiro do mouse sobre o item de menu File (Arquivo) e clicar com o botão esquerdo do mouse. O seguinte menu será apresentado.
Selecione a opção Save As (Salvar Como)
Mova o ponteiro do mouse e clique na opção Save As... (Salvar Como) e então a seguinte caixa de diálogo irá aparecer. Ela é denominada de caixa de diálogo porque é onde você diz ao SPSSPW o que ele deve fazer. Digite o nome do arquivo na linha (em branco) denominada File name (Nome do arquivo) e clique no botão OK. Seus dados estarão salvos neste arquivo. Convém lembrar que o nome de um arquivo deve obedecer às seguintes regras: ■ ■
■
A primeira parte é um nome que faça sentido para você (p. ex., statsanxiety). A segunda parte deve ser sempre SAV para um arquivo do SPSSPW (esta parte é denominada de extensão do arquivo). A primeira e a segunda parte serão sempre separadas por um ponto.*
Assim, o nome do nosso arquivo de dados será statsanxiety.sav. De fato, você não digitou .sav nem precisará fazê-lo, pois o SPSSPW faz isso automaticamente. Sempre que você visualizar um nome de arquivo terminando em .sav, poderá ter uma confiança razoável de que ele é um arquivo de dados do SPSSPW. Se você esquecer o nome do seu arquivo, procure entre os que apresentam a extensão .sav.
* N. de T. Variáveis e projeto de pesquisa.
Estatística sem Matemática para Psicologia
45
Digite o nome do arquivo aqui
Entrando com os dados para os delineamentos dentre e entre participantes Descrevemos como fornecer e salvar dados no SPSSPW. No entanto, diferentes delineamentos requerem diferentes entradas de dados. A maneira recém descrita é para um delineamento correlacional. Se você quiser fornecer dados para os delineamentos entre participantes, então o procedimento é o seguinte. Digamos que você conduziu recentemente o estudo da caminhada com o cão com um delineamento entre participantes. Suponha que os dados obtidos para a variável “número de encontros sociais” sejam os seguintes: Caminhando com o cão: 9 7 10 12 6 8 Caminhando sem o cão: 4 5 3 6 5 1 Neste delineamento, caminhar com e sem o cão é a variável independente, e o número de encontros sociais, a variável dependente. Quando entrarmos com os dados no SPSSFW, precisamos determinar uma variável independente e uma variável dependente. A primeira coisa a ser feita é nomear as variáveis, na tela Variable View (Visualizar Variáveis). Quando se declarar a variável independente, é necessário prestar atenção, pois é aqui que a maioria dos erros ocorre. Quando tivermos grupos diferentes de pessoas em cada condição da variável independente, precisamos definir uma variável de agrupamento (grouping variable) no SPSSPW. Devemos deixar o SPSSPW saber em qual dos dois grupos cada participante está. Defina a variável conforme a seguinte ilustração:
46
Christine P. Dancey & John Reidy
Clique nas reticências
Se você deixar as variáveis como definidas pelo software, poderá ter dificuldades para interpretá-las, uma vez que não haverá rótulos para identificá-las de acordo com as diferentes condições da VI. Assim, é uma boa idéia detalhar os nomes das condições da VI. Você deve notar que, quando clica na primeira célula da coluna rotulada como Values (Valores), reticências aparecem. Isso indica que você pode fornecer informações adicionais para esta coluna. Clique nas reticências e obterá a seguinte caixa de diálogo. Digite o número do primeiro grupo aqui Digite o nome do grupo aqui Clique em Add (Adicionar) para confirmar os detalhes
Estatística sem Matemática para Psicologia
47
Temos duas condições para a variável independente, às quais precisamos atribuir números. Iremos rotular o grupo “caminhando com o cão” de grupo 1 e o grupo “caminhando sem o cão” como grupo 2 (ou vice-versa). Digite 1 na linha (caixa) Value (Valor) e “caminhando com o cão” (Walking with a dog) na linha (caixa) Value Label (Rótulo). Feito isso, clique em Add (Adicionar), e você verá que os detalhes aparecem na última linha (caixa). Agora digite 2 na linha Value e “caminhando sem o cão” (Walking without a dog) na linha Value Label e clique Add. A caixa de diálogo deverá ser semelhante a esta:
Clique em OK para retornar à tela Data View (Ver Dados). Sempre que desejar que o SPSSPW saiba os nomes dos grupos, você pode fazer isso adicionando informações na coluna Values (Valores). Agora vamos definir as variáveis. Para entrar com os valores reais dos dados, clique no painel Data View (Visualizar Dados). Quando os dados forem postos na coluna group (grupo), digite 1 se a pessoa estiver no grupo com o cão e 2 se a pessoa estiver no grupo sem o cão. Assim, você poderá verificar que a primeira coluna conterá apenas os valores 1 ou 2. Na segunda coluna, você deverá entrar com o número de encontros sociais de cada pessoa, como está na sua variável dependente. Você deverá ser capaz, observando a tela de entrada, de ver que o participante número 4 está no grupo com o cão (grupo 1) e que ele teve 12 encontros sociais. Também verá que o participante numero 12 está no grupo sem o cão (grupo 2) e que teve uma caminhada solitária com apenas um encontro.
48
Christine P. Dancey & John Reidy
Variável de agrupamento
Variável dependente
Delineamentos dentre participantes Quando há um delineamento dentre participantes, temos que entrar com os dados de uma maneira diferente. Se utilizarmos o exemplo anterior, no delineamento dentre participantes cada pessoa completará a caminhada, tanto na condição com o cão quanto sem o cão. Os dados para este estudo terão a aparência mostrada na tela seguinte:
Cada pessoa tem um escore nas duas condições
Estatística sem Matemática para Psicologia
49
Você pode estar se perguntando por que temos de entrar com os dados de forma diferenciada para cada um dos diferentes delineamentos. É que cada linha da entrada de dados representa a informação de um participante. Se você tem um delineamento entre participantes, precisa informar ao SPSSPW qual o escore de cada participante e a qual grupo pertence. Quando o delineamento é dentre participantes, cada um atua sobre as duas condições, e desta forma, se tem dois escores. Você precisa fazer com que o SPSSPW saiba o que ambos estes escores significam. Em virtude de cada participante atuar nos dois grupos, não será necessário informar ao SPSSPW o grupo, por meio de uma variável de agrupamento. Você pode perceber, assim, a diferença dos delineamentos dentre e entre participantes através da variável de agrupamento. Se esta variável existir, trata-se do delineamento entre participantes. Você deve notar, a partir do detalhe da tela, que definimos duas variáveis, uma para a condição com o cão e outra para a condição sem o cão. Ainda, em virtude de não haver a variável de agrupamento, não temos de atribuir rótulos de grupos para qualquer variável na tela Variable View (Visualizar Variável). Definir as variáveis para esse tipo de delineamento é, dessa forma, mais simples do que para o delineamento entre participantes.
Utilizando as facilidades da ajuda (Help) do SPSSPW É uma boa idéia praticar utilizando as facilidades da ajuda do SPSS para Windows. Você pode iniciar rodando o tutorial que está disponível para você. O tutorial pode ser iniciado sempre que se iniciar o SPSSPW. Você pode notar que a primeira opção na primeira caixa de diálogo que você vê no SPSSPW é rodar o tutorial (Run the tutorial).
Selecione esta opção para rodar o tutorial
Você pode acessar o tutorial a qualquer hora durante uma sessão. Basta clicar no menu Ajuda (Help) e selecionar o tutorial (Tutorial) a partir daí.
50
Christine P. Dancey & John Reidy
Botões de navegação
Uma vez iniciado o tutorial, você estará na introdução às facilidades da ajuda do SPSSPW. Você irá notar quatro ícones no canto inferior direito da tela. Estes ícones permitem que você navegue da forma que desejar em torno dos tópicos do tutorial. O ícone com a lupa fornece um índice de tópicos. O ícone com a casa leva você aos conteúdos de cada tópico, enquanto os ícones com as setas à esquerda e à direita levam para as telas anteriores e posteriores, respectivamente. Quando você clica no ícone de conteúdo (casa), obtém uma lista de assuntos. Você deve então clicar no tópico desejado para que o tutorial possa ajudá-lo.
Estatística sem Matemática para Psicologia
51
Clique no tópico para obter um tutorial sobre ele
Lembre que você pode chamar o tutorial sempre que precisar.
Resumo Neste primeiro capítulo expusemos os conceitos básicos para um entendimento da pesquisa e do projeto de pesquisa. Você aprendeu que: ■
Variáveis se diferenciam em termos de precisão. Isto é, elas podem ser: – Contínuas quando assumem qualquer valor em dado intervalo (p. ex., 10 ou 10,2365) – Discretas quando assumem apenas certos valores especificados dentro de um determinado intervalo (p. ex., 9 ou 10) – Categóricas quando os valores assumidos são categorias, em vez de valores puramente numéricos (p. ex., gênero: masculino ou feminino).
■
Existem três principais delineamentos de pesquisa: – Delineamentos correlacionais, que examinam as relações entre variáveis e não apresentam, num sentido estrito, variáveis dependentes ou independentes. Você não pode inferir causação a partir de correlações. – Delineamentos experimentais, que envolvem alocação aleatória de participantes às condições de variável independente. – Delineamentos quase-experimentais, que envolvem investigar grupos fechados, tais como homens e mulheres, e, desta forma, não utilizam alocação aleatória de participantes às condições.
■
Nos experimentos, a variável independente é manipulada pelo pesquisador para verificar como ela afeta a variável dependente.
■
Os delineamentos entre participantes são aqueles nos quais nós temos participantes diferentes para cada condição da variável independente.
■
Os delineamentos dentre participantes são aqueles nos quais cada participante é avaliado sob todas as condições da variável independente.
52
Christine P. Dancey & John Reidy
Exercícios para o SPSSPW As respostas de todos os exercícios e das questões de escolha múltipla podem ser encontradas em seção própria ao final do livro.
Exercício 1 A Dra. Gênio realizou um estudo comparando a memorização de adjetivos com a de substantivos. Ela alocou aleatoriamente 20 participantes a duas condições. Então, apresentou a um dos grupos de 10 participantes uma lista de 20 adjetivos e ao outro grupo (também com 10 participantes) uma lista de 20 substantivos. Em seguida, solicitou a cada grupo que tentasse lembrar o número máximo possível de palavras apresentadas. Ela obteve os seguintes resultados: Adjetivos: 10, 6, 7, 9, 11, 9, 8, 6, 9, 8 Substantivos: 12, 13, 16, 15, 9, 7, 14, 12, 11, 13 1. Qual é a variável independente neste estudo? 2. Qual é a variável dependente? 3. Este é um delineamento dentre ou entre participantes? 4. É um projeto experimental, quase-experimental ou correlacional? 5. Entre com os dados no SPSSPW de forma apropriada para o delineamento do experimento e salve os dados em um arquivo.
Exercício 2 Utilizando os dados do exercício 1: ■
■
Se você entrou com os dados como um delineamento dentre participantes, entre com os dados agora como um delineamento entre participantes. Se você entrou com os dados como um delineamento entre participantes, entre com os dados agora como um delineamento dentre participantes.
Salve os dados em um arquivo utilizando um nome diferente do anterior.
Estatística sem Matemática para Psicologia
QUESTÕES DE MÚLTIPLA ESCOLHA 1. Qual das seguintes constitui uma variável contínua? (a) Número de vezes que um escore de 180 é alcançado em um jogo de dardos (b) Gênero (c) Temperatura (d) Todas as anteriores 2. O projeto experimental é caracterizado por: (a) Menos do que duas condições (b) Sem controle das condições (c) Alocação aleatória dos participantes às condições (d) Nenhuma das anteriores 3. Em um estudo no qual o gênero é a variável a ser manipulada, a VI é: (a) Dentre participantes (b) Correlacional (c) Entre participantes (d) Nenhuma das anteriores 4. Qual das seguintes assertivas é verdadeira para o delineamento correlacional? (a) Ele não apresenta variável independente nem variável dependente (b) Procura relacionamentos entre variáveis (c) Não se pode inferir causação a partir de correlação (d) Todas as anteriores 5. Qual das seguintes pode ser considerada uma variável categórica? (a) Gênero (b) Marca de carro (c) Cor do cabelo (d) Todas as anteriores 6. O delineamento dentre participantes pode ser: (a) Tanto quase-experimental quanto experimental (b) Somente experimental (c) Somente quase-experimental (d) Somente correlacional 7. Qual das seguintes declarações é verdadeira para experimentos? (a) A variável independente é manipulada pelo pesquisador (b) A variável dependente é assumida como dependente sobre a variável independente (c) Os experimentos são difíceis de serem realizados (d) Alternativas (a) e (b) 8. O projeto quase-experimental apresenta: (a) Uma variável independente e uma variável dependente
53
(b) Alocação não-aleatória dos participantes às condições (c) Nem variável independente nem variável dependente (d) Alternativas (a) e (b) 9. Qual assertiva descreve uma variável contínua? (a) Pode assumir certos valores discretos em um faixa de valores (b) Pode assumir qualquer valor dentro de uma faixa de escores (c) Pode ser caracterizada por categorias (d) Nenhuma das anteriores 10. Quais dos seguintes são problemas associados com o delineamento dentre participantes? (a) Existe uma maior probabilidade de efeitos práticos e de fadiga (b) Os participantes apresentam maior probabilidade de perceber a natureza do estudo (c) Não pode ser utilizado com projetos quaseexperimentais (d) Todas as anteriores 11. De acordo com Streiner (2002), qual a eficiência de estudos que dicotomizam variáveis quando comparados com estudos que não o fazem? (a) (b) (c) (d)
100% 95% 67% 50%
12. Certo pesquisador acabou de conduzir um estudo correlacional investigando o relacionamento da quantidade de álcool ingerida por fãs do time da casa antes de um jogo de futebol e o número de gols marcados pelo time. Constatou-se que existe um relacionamento entre as duas variáveis. Qual das seguintes afirmações é válida? (a) A quantidade de álcool ingerido está relacionada com a habilidade do time de fazer gols, mas não se pode afirmar que seja a causa dos gols marcados (b) A habilidade do time da casa de marcar gols não está relacionada com a quantidade de álcool ingerida, mas com a quantidade de incentivo dada pelos fãs que bebem (c) Um aumento na quantidade ingerida de álcool causa um aumento no número de gols marcados (d) Todas as anteriores 13. Em um projeto dentre participantes com duas condições, se você não utilizar o contrabalanceamento das condições, seu estudo poderá sofrer: (a) Efeitos de ordem (b) Efeitos da hora do dia
54
Christine P. Dancey & John Reidy
(c) Falta de participantes (d) Todas as anteriores 14. Você conduziu um estudo mostrando que, quanto mais cedo as pessoas levantam, mais tarefas elas conseguem executar. Qual das seguintes conclusões é válida? (a) Não existe necessariamente uma relação causal entre levantar cedo e a quantidade produzida de trabalho (b) Pessoas que levantam cedo precisam trabalhar mais (c) Levantar cedo é a causa de mais trabalho ser produzido (d) As alternativas (b) e (c) 15. Com qual dos seguintes projetos (delineamentos) é menos provável que se possa estabelecer relacionamentos causais entre variáveis? (a) Projeto experimental (b) Projeto quase-experimental (c) Projeto correlacional (d) Delineamento dentre participantes
um escore sobre o quanto roem as unhas. Após, classificar os participantes como “depressivos” e “não-depressivos” com base nos resultados do questionário. Podemos verificar, então, se existe ou não diferenças no quanto roem as unhas. (b) Como a situação (a) acima, mas sem dividir os participantes em dois grupos. Utilizar os escores de depressão obtidos e verificar se existe uma relação entre roer as unhas e depressão. (c) Este tipo de estudo é impossível de ser executado; portanto não deve ser tentado. (d) Nenhuma das anteriores 18. Qual das seguintes seria a variável independente apropriada em um estudo quase-experimental? (a) Gênero (b) Se alguém apresenta ou não distúrbio de ansiedade generalizada (c) Estudantes versus não-estudantes (d) Todas as anteriores
16. Efeitos de demanda são possíveis variáveis de confusão nas quais: (a) Os participantes se comportam de acordo com o que o pesquisador quer (b) Os participantes apresentam baixo desempenho, pois estão cansados ou chateados (c) Os participantes apresentam bom desempenho, pois praticaram as tarefas do experimento (d) Nenhuma das anteriores
19. Em um delineamento dentre participantes, os efeitos de ordem ocorrem quando:
17. Suponha que você quer conduzir um estudo para verificar se pessoas depressivas roem mais as unhas do que pessoas não-depressivas. Qual dos seguintes será a melhor maneira de proceder? (a) Medir a depressão dos participantes com um questionário e então solicitar que atribuam
20. Qual dos seguintes problemas está associado com a dicotomização de variáveis contínuas?
(a) Os participantes ficam cansados nas últimas condições (b) Os participantes têm o mesmo desempenho em todas as condições (c) Os participantes têm problemas para obter bebida no bar (d) Nenhuma das anteriores
(a) (b) (c) (d)
Perda de poder experimental Ocorrência de efeitos espúrios Existência de uma séria perda de informação Todas as anteriores
Referências AITKEN, M. A personality profile of the student procrastinator. Tese de doutorado não-publicada, Universidade de Pittsburg. (Dissertation Abstracts International, 43, p. 722-32 A), 1982. CLARK, L. A., WATSON, D. Tripartite model of anxiety and depression: psychometric evidence and taxonomic implications. Journal of Abnormal Psychology. v. 100, p. 316-36, 1991. CRUISE, R., CASH, R., BOLTON, D. Development and validation of an instrument to measure statistical anxiety. 1985. Artigo apresentado na reunião anual da Seção de Educação Estatística e reimpresso nas atas da Associação Americana de Estatística. DORLING, D. et al. A good place to bury bad news? Hiding the detail in the geography on the Labour Party’s website. The Political Quarterly. v. 73, p. 476-92, 2002. EGLOFF, B. HOCK, M. Assessing attention allocation toward threat-related stimuli: a comparison of the emotional Stroop task and the attentional probe task. Personality and Individual Differences. v. 35, p. 475-83, 2003.
Estatística sem Matemática para Psicologia
55
MAXWELL, S. E., DELANEY, H. D. Bivariate median splits and spurious statistical significance. Psychological Bulletin. v. 113, p. 181-90, 1993. McNICHOLAS, J., COLLIS, G. M. Dogs as catalysts for social interactions: robustness of the effect. British Journal of Psychology. v. 91, p. 61-70, 2000. SPIELBERGER, C. D. et al. Manual for the State-Trait Anxiety Inventory (Form Y). Palo Alto (CA): Consulting Psychologists Press, 1983. STREINER, D. L. Breaking up is hard to do: the heartbreak of dichotomizing continuous data. Canadian Journal of Psychology. v. 47, p. 262-66, 2002. WALSH, J. J., UGUMBA-AGWUNOBI, G. Individual differences in statistics anxiety: the roles of perfectionism, procrastination and trait anxiety. Personality and Individual Differences. v. 33, p. 239-51, 2002.
Nota 1
Correção do artigo feita pelo Guardian (publicado em 10 de outubro de 2002):
Na nossa reportagem, “O site do partido gira como o 1984 de Orwell”, página 7, de 8 de outubro, dissemos: “O webmaster do partido é comparado a Winston Smith, o personagem do livro 1984 de George Orwell que passava o tempo no ministério do abastecimento reescrevendo a história’’. De fato, Winston Smith trabalhava para o ministério da verdade. Entre suas tarefas, entretanto, estava o “reajustamento” dos números do ministério do abastecimento. “Não foi nem mesmo uma falsificação. Foi meramente a substituição de uma peça absurda por outra” (página 36 da edição da Penguin de 1983). No nosso artigo nos referimos ao relatório em discussão como “não-publicado”. De fato, ele apareceu na edição de outubro (volume 73, número 4) do Political Quarterly, publicado pela Blackwells.
Estatística Descritiva
Panorama do capítulo No Cêpí1u o I, apresentarnoi â guns Íatores importanter dê um proleto de p€squ sa. Neíe capítulo remos eip icar as pr nc pèÈ mane ras de trat.r dados coleiados poí o d€ pesqlisa 'Ìe qldntitètva. São ar estatÁt/cas .lescrtiyar Um pãso impoúante parã qlaqu€rum qle enela lentando entender a aná ise eíàtGticã é obter Lrmè bo. idé a do5 conceitot bási.os. Por sso. exp icèremos a guns dor concelos eÍatGllcos Íundanìenta s q!e seruirão de apoo parè o enten d nìento de aná ises comp exas àpresentadas md s 1èrdê no lvro. Ao flna deÍe cãpituo, vocé dò qa ró. Ja boa ê,ìrê1o n ènro oo. .êgL nr,. rop o
. r . r r sso,
âmonras € popu açôes medidas de tendência ceniraÌ (p. ex , mód ã) técn.âs gráfcas pãra des.rev€r or dados (p €x, o h stograma) distribu ção normê medidasdevarãbildade(p ex, o desvio p.drão)
Encs são conceitos lmportènter que èparecerão sob v;.ãe fôrmas èo longo do textoj por é m portè nte Ìenia r enÌ€nd è os. Co n e deÍe os .omo os b ocos básicos pa Ía a comprêênsão
.ôn.êinrâ dã êsìâ1ísÍ..
No Uapítulo 1. expÌìcimos que estâtísticas sìo cssencialmente naneirâs de descrcver, comparar e reÌacionaÍ !âriívcis. Quando eltas est,ìrísricas foreìì prcduzidas. devemos lcvar em conta unìa difèrençâ impoúante entrc dmurrlds c lDp!/dçnrr. Quando psicólosos lâìan lobre populâções, nno cÍão necessariaÌnente se reicrindo à população do pâís ou da cidade. Estão. geralmente, sc referindo a grupos distinr{)s de pessoas. poÌ exempÌo. todos aqueles conì autisnìo. ou lodos os homens canhotos. Em termos esrarísticos. umapopuìâção pode até mesmo se rclcnr a objebs inaninìados. como. por exenìpÌo. a popüÌâçno dos canos de uma Umâ âmostrã é !inìplesnìente umâ seÌcção de eÌenenros de um! populaçâo (veja FiguÌa 2.1). Os pcsquisadores utilizam âmosrrâs por várias râzões, principâlnrente porque são mais b!r!t!s. nÌais rápidâs de obleÌ c mâis convenientes px.Í examinar do que toda uma popuhção- Imagine que queÌemos vcÍificar se â ansìedâde cíâtística está relacionada com p.ocrastinação, como Wâlsh c Ugunba-Agwunobi (2002) fi7eraln. Podenos simplesmente medir o nível de ânsicdâde estatísticâ e de procrâsrinrção de rodo mundo
Estêtislica s€m Matemátca para Ps.o 09 a
-
57
posivel de .inco Íaces
Possivêl de cinco Íaces
p![!|
unrâção dÊ v:riès êmoÍra' .lc c nco íâcÊs ret ra.tãs de !mê pop'r âr;o de íac-ês
c obscrlar o quaÌt{) estão reÌacionâdas cnLrc si. lsso seria. no erlanto. ca() dcmris. tiìÌa lorÌna nìais coDvcnicDrc é selecìon:ìÍ unì deteÌÌÌìi .rdo Dúncro de pelsoa! ao acaso d.ì população e deleÍnÌnìar os scus Ìí!ei! de snsiedade esrar(lic.ì c p()crastin.Ìçào. Podenos. cDtno, gcneralizâr o resuÌtado dcÍa rìÌoíra para o populâçâo. UtiÌìzanìos csrrrísricr. nrlis cspccilìcamcnte estalística ìntèrencial. pâr.ì gcnÈüli/{rÌos os re!uìtados obtidos dc âmostfus para ìodr â toÌrulação. QÌtando rcaÌiâmos uma pesqLrisa. devemos estar seguros dc quc srbeìno! quaÌ é a po pullçio e.rJaddr c r\'^lhr' ,, Jm,ar-J re\rJ fntr L!J. L rnur I Í(il /rr urn s,L,l..J.,rn n l rn,.\rrJ de norn(n..( t pop,,lJi.r' in(lui ",u.i,,c\". | ,
EÍa corìclusìo eíá corch l l)e fato. Ìão s.ìbenìos a resposta I paÍÌir dr Ìrcsqui!a que n)i feìta. Iila pode eÍar certa. ÌÌìas não sc utìlirou umr {ìÌoiÌü correta sobre a qUal sc ptrdcssc bascr LrÌcoÌclusão. istoé, pode haler unì pmrl.nd,J. an,JlrdS?/n. O probÌenÌa aqui é que os proprierÍìos dc cecs seguidos podenì ser rodos. por cÌcÌnplo. ììuin) tírìidos. e é isso. e não o 1ìto dc possuir o c&), que explica â dìferençã no núÍÌìcro dc cnconrrx sociâì\. Aqui. é possivel que exista o viés do pcsquisrdor, no qual ele inconscienteÍrrnrc trLilì/r pessors quc 4udanr ! connrnrar a sua hipóÌesc. Po.lc sc. quc scjrm questões ligadas à hora do dia enr quc as pc\soas crminhânr conì seüs cães. Por cxenrpìo, pcssors caminh.ìndo benì cedo peh
58
christine P Dâncey &lohn RedY e ììânhà. tal!cz. estejrnì conl prcssaparair âo tÍabâlho
se
nrmenr nenos ptup
..'"'..it"", p".,r..*.'''i'*'""^i"'.',ç5.""':'i'rp J("J' o
'o !,\.,. drJ.:ì:';::.ì:t.,1:1.ìi;l;"Ì:l'ï:.ìïlì::ïl
n,t,ieÍo tlc nl\oui\.r çn, o\ que Lrntrm
::.lii,.ïl;ì..::,ì':':;''':;;;
r'\ÈlurrÌ
;"c""'
[ìï;;ìì;.'*';..;'""*,,*l'*'r',"-"'
..r.'; ('' J'u "'t! q.'e"r e rn'e\'f'e De' ô"ÌJ e'ÌJri'ìmJi''eruro'']
suas am(xüas represeúam a poluÌação
- '___ìÍÌantc: () êrcmDlo Jnlcri' { rlu\tÍou um lonLrt rnrlìrj
.. .r"'ll".'n"- |,
p,'f
""et
e
'lrpen'lenlr
de
I'nnr':'
a
h'ìbil;dadc de generrlizar Íesultrdos \L( d'm' 1re 'eflr'enrJn' J loou
qL'nd"
VÚcejrJ\flrliri r.'e'enLamo' squr :rdrlcren\iì
*' rl:;. De*r n{m! ,f r,. o, p"r,ç".' Lnrirdm nre l:rl3n'lú / r""hrrd "t'' 't""' ''r"''ta' enranÌ" 1'r \e no à Ìr'rn ' umJ eJ ..u1" A "---;;; "",,."". tnqudnr''.tnJ r:' "'""llt, i;""" r,,ouraiiu. LoJ,1 le\ fl d"1ô n|rJ de r' 'íi''lr' "'' p:ïli:t: J' ftr A"im J me'ri:ì 'oJ ì:,ì.;.:ì:.;".; " .. '"r' p'imn,r J*'rer"r' ep r''rr'^i 1" F\rJêurnrrdrrrn J. urn:r rmosr" < L'rr'' . "", "",1. "".i.",.. r"e"re lll'l'5i.'.,ì*,",i"rì,,';0,'4.',r"q* 'o.:''"-<'|(\r'r 'J'rer"nçr\enrr('eLni'J' riri(rm' 41< uirrr .:,,::;:I;;: Ë.;.ì:, ' .'""'*' 'r"q'"',"' ""r 'purdioe' \4Ji' e'..trrì' rmerre' nlr' ;;;';' ;''';ii'"' " ' "'"di' prrd e 'rmJr râíJnrÌ o púprr'Jcr' ítr\/rrrrl'r'!J'drìro\r'â\"Ji Í ì" ã..,.",r,"i,*,.,,,,,.,,'r"./,',rirn rufl.iidlptrê gÈnerrlizaÌ
r' fJr:roe\-(
cstes resültados parr a popuìaçio
Arividade 2.1 ê nê'ìo5 \e\,o{Àque de\.oo.rq,. qJDo o lo dó ÍuLebo' o_ de 'ugbr' dproorrddâ' tê nàr' qudl d"s sêgu,nlps àmo.Í.s 'a
r . r r ! r
íutêbol quanto de íúgbi Um grupo dê pessoas que são tênto Íã5 de qeral população pessoas da aleatória de
um: amostra
Um qrupo de Íãs de Íltebol e outÍo de fás de rúgbi U"1 q'Lpo de l'omêns e o'rlro dê nLll'eres Um gÍupo de estudantês de psicoìogia Urìì gÌupo de chimPanzés
'nrÍJr Ìllr./ a I'r Inr nì:r' Jon um de ('rirr'ri' r rlc'crrr;!r qLc \'\;um\ c'rr rrrrr'^ de de de l(n'lincrlenrrJl nìediJ Urr'J ,./,,/ /" .r. ,''..i'4"'i. , ,lrr, ' medi&s conj unio Exiícm rrôsdifcrent's r'"" i"uo"ào aìo cscorc rípìco iì0"' 'lesrc nossos d'ìdos vamos iriciâÍcom a pâÍa dcscrever utili^das '1."... i"ì."lã.ii".*,*r,U."nìcnte jA*. que tânrbóÌÌì é conheciclacomo ìnédi! rritmética' p,,p"1,"
(nc
a orirnerrJ (
",ì
";zaid.
Estâtístca sem Matemáticà pârâ Psi.olog ê
2.2.1
59
Média A nadir ó fâciÌnìente caÌculadâ por meio dâ soma de todos os \akÌes d.ì amoÍra e. en tào. I'cladivisão pclo núÌneÍo rotrl de valores. A médiadr ann)srrr 15.6,9.l) çeri:
I '<
= 5.51ì
CoÌÌì ouÌro exenìplo. se tivésseÌnos o seguinlc conjuÌno de dados '0. podr n. no, Lrlc r JÍ neÍl J cnnr' ,i . :
:
. r
\
SornaÌírìrÌìos todo! o\ \' lores trr{ obtcr 1.19. Dilidiríanìos. então. a soÌÌìa por t) (qu. ó o l(ÍnÌ dc valoÍes ,in nniliâ de l6 56
l+20+
20+ ì2+ l2+ l9+ 25+ 20 9
l.
10, 20. Ì 2. I 2. ì 9, I 9.
da nìo\trâl p,ìra oblcÍ
= 16.56
llso rìos dá unra indicrçà{) clo cscore lipÌco da nossa anx)strr. É b.ìstxnre ditíciÌ sxììples mcnLc uÌilizar a médiâ de nnìr anrostra conìo uma estìÌnati!^ d{ ììadiâ dc unÌa popuÌaçào Nuncr círrìos ceÍÌos de quão tróxinÍ)s clâ üédia da popuìação está { módia cìa nossì amos rfu. emborâ crìsìam iécrìicas que podeìÌos ustrcono âuxiÌio (p. ex.. nrtcr!aÌos de contiança. \er p. l2l).
2.2.2
Mediana A s.gundi ìÌÌcdida de tendência ccnLÍrÌ é a,LZ@rr. oficixlììcnrc deftìÌdr coÌno o
lrloÍ
que estíì no nrcn) cìa.ìmostra. iÍo é. quc tprcseÌrÌrì o nìe\nú nirm.ro cìe lalores rcinÌa e {baì \o deÌâ. A ììedirnxé calcLrlada com â ordcnaçÌo de rodo\ os lal(tr.\ c coÌn a tonìada do vrlor que eÍí no ìÌeio. Utilizìndo os didos l. 20, 2{). ll. Ì2. 19. ìt). 25. 20 (\ìÌores rnteriorct pàra ilustrar o cÍlculo d.ì Ìnedirna. prinreiro ordcoarnos os d.ìdos eìì ordeÌn cresce|te e lrri btríÌos urn posto a cadr unì.
^çsìm:
? 1. 12
ì9
.r(s) o
r o posÌo mediano
V)cô pode ler que os valores foÍxrÌì odenado! (linha dc cina) e a cada um n)i ltÍibuído urÌ posto (,t,rt). Dessa fonna, o \{lor Ìnais bajxo teÌn posLo um. o próxino poslo dois e as otr mais valores igu,Ìis (como no iguais. Assnn, os postos dos dados exemplo). os tosros rtribuídos a valores iguais devem ser apresentrdos dcvcrÌì reaÌnìente ser o\ scguinles:
IlslÍitanìcúle tìlando. no entrÌt(). qu.ìndo tN€rmo! dois
60
chrst ne P Dãn.ey & John
ReLdY
Posições dos postos:
2
12
t2
l9
I
2.5
2.5
.1,5
I
t, í:ì
+
t9 20 20 20 :1.5 111 ô ô(*) \,/
25
9
-1ÍZ
V)cê pode vcrilicdr quc todo! os valores ignais po\sucm o JnesìÌo posto AÌribuímos os post$. no ca$. romaììdo r nìédiadrs posições que eÌes oüupanr. corÌo iÌusÌrrdo acima' Prr.ì enconrrr a oÌediâna. precisâmos locâlizar o elcore que cs{á no nìcn) da ljstr dos postos. Temos nove valorcs. desta foÍna. o escore do Ìneb é o quinro A ìnediam é assim o
quirÌo ltlor da listâ ordenadt dos \41üe\ da amostÍa' No eremplo acimr, loi tãcil dclermìn[ .ì nedìanr' fois Ìínhrmos um número ímpar
lalor
19. que ó o
de
vaìores. Quando !e tcn1 unr núnrero ímpâÌ de vakr.e\. leÌnlre vâi existir unì que cstârá ro nrcio. Estc não é o ct$. enÍetrnlo. quândoexistir unr núÌnero pâÍ de vâk)res Se agrcgaÍnìos o \,âÌor 26 no conjunlo de dados anteri(' leremos !gor.ì Lrm número par de valore! NesÌe caso é preciso rômâr a média destes dôis valôres do meio
2 ì Posições dos postos: I
VaÌore!: IÌìsrôs:
12
ll
2.5
2.5
19 .1.5
2
íÁ
20 25
20
1ì r 7ì
1
:ã
1
26
7 9 Ì0 910
O ponto médio está entre estès dois Postos
Neste crso a nledianâ será a ìnédiâ entre o\ doi\ centrai!.
Moda A trceìÍa nedida{ìe lendêncir ccntral é a'roda q're é simpìc\nenie o !ak)Í Íìais reperido Noconjuntode vâk)rcs apreseÌtâdo acinìa l)arâ ihAtraÍa ìrìéditc a medianr, aÍroda seria20, que é o !âlorque mâis se repeie. O vãld do conjunto que maG se Íepete é a moda
2
12 L2
ra
rq
Q9gqQ9 2s
26
EstãtisÌicà sem Matemálica pãrâ Pncologiâ
61
Atividade 2.2 Determin€ ê riìédi., a med ana e a modà dos 5eguinies conluntos.
Qual medida de tendência central você deve usar? DescreveÌÌìos para locô Ìris dilèrentes nredida! de terdência cenrral. isro é. rìôs nrcdidâs de nnì \'.ìÌoÍ lítico cnì uma {ììo\ÌÍì. Um.r questão pernìanece. no cnlrüÌor qual dcstrs m. dicìr\ \ocô d.\e utili^r faü descÍever iìs seus dado! 1,\ i:spoía a cstd qu.stìo ilel)ende do conlunto que locê tenr. O ponto imporÌanÌe a seÍ Ìcvado cm conta quando for escolher unra medidr de tendêrcia cenÌr.ìl é quc ch cìcvc dâr â você uDra boa indicaçío do vaÌor lípico dâ arÌxÁtr!. Se há Rra)cs prìa {spcitar que x Ìnedida de teddência centraÌ que usou nio tornccc unú boa indì cação do valortípico do conjunto. então locê pro!a\'elÌnenÌc cscolhcu r ìncdida errdr. A Ìnédìa é a medida nìais IìcqücnÌenÌenlc utìlizâdr c ú ch quc dclc \cr usrd{. unrNcr
qr(\ô.eererrJú|\flrJrJo.r.,ì,,..1.,r'ir.arLr,.'b., ',lri., l"r.' . r'f... J".rJ,,,r" l:.' crlculadaatr ir do\ \xlorc! rcri!. c nìo N fxÌlirdos pstos. crso dr ìÌcdirDr c dâ freqúêÌciâ dc oconêÌrci!!. ! rÌo.h [xiÍc uìn pn)blcnìr com n média. no êntanlo. LÌn \ irtude de utiliT,rr o\ plóprios valores .,. .IJ <.er.r.e J \ rla e. (\rÍ( r ... Ol-.fl
medìda r sercscoÌhid.ì porquc a
coìÌo
JJ
ó o
l l:1 A nìédla
5671t9
to
deste conjunto de dâdos é 5.5 (a\sìm como a nìedianrì. Se alrerarÍÌbs rìÌÌÌ dos
\aloÍes auoìcnllìndo o Íazoa\clmcDtc. obÌeÍcmos o scguìnte conjunlo:
l2
3.1 56711
920
A nìédl.ì desle ciìrjunto é 6,5. enquanto lì nÌediana pemìarece 5.5.
\' ü. obleÍeÌÌìo!: l2i,l 5ó7
Se aunìenÌaÍnos o
úÌtìnìo
89100
Túmos. agorr. unra nradir de 1,1.5. quc nÌo J. ob\irncntc. una boa indicrção cìt) coD.juDk) .le d,Ìdos. Com) exist. o nì.sm) núÌnero de !rl(nes em cadr uÌn destes conjuntos e alteranros soDrente o nraiff valor de cÂda urn. a medìana pernrane ce corÌìo 5.5. A nìedìana é. ìssrm. unìâ nedidn de tendência central nìeÌhor p:rÍa o! dois últimos conluntos. Este e)ienrpÌo ìluslra a necessjdade de checâÍ os dados pâÍd lcriiicar se existeÍÌì !âlorei exÌrcÌÌìos (ircmos intÍoduzir unìa nÌânciÍâ dc ÍlzcÍ isto. mâis adiànte) ântcs dc cìccidir quc mcdidâ dc tendôncir ccntral urili/ar. Nr nr{i{)ri{ dos crso!. !oca. pr)\r\clncntc. lcrifi.rrá que é,Ìc.itiìvel o uso dâ média conú Ìnedida de tendôÌcia
\rlor túrico.le!i.
Se você encontrar vaÌoÍes extÍenìos. enlão iì ÌÌÌédi.ì Ììão cìelerá ser ulilizacìa. nesre caso o melhor é utiliz.ìr.ì nÌcdian!. A mcdirna nno ó scnsílcl x lalorcs cxt o cxcrÌìpìo ìnostrou. I\so ocorre porque eh é o \rlor do ììeìo dos deìì{i! qtrândo estes
62
ChnÍt ne P Dancey & lohn R€idy
\Ìo ordcnrcbs. O pÍocedinenrc para locrìiriì o vâlor nìedìaro não depende do! valores eìÌ \i. r não scÌ cìo lãlo de colocá lo! eìn oÌdcìn. AssiìÌ, o nìajoÍ lalor no nosso exemplo t.'dr iJ.. ô l" lin)ou l'\Jnllllròe. c:' rìcJiJn,,. irJ- n,h. \ .,l.crJar. L e rJr.r'erì.rbilidâde a \âlor.! cxtrcmos que fàz a mediana útil quaDdo nno podúÌnos utilizar a média. Conìo a ìÌod{ ó \implcsnìente o valff que ocore com n ior frcqiiôncia, não envolve qÌralquer cálcul{) ou ordcnaìÌenÌo dos dados. Então. elr todc scr utilizadr coÌn qualquer Ìipo de dado!. tJnì dos probìeÌÌì.ìs dr ÌÌìédia e da mediatr J r cxistôncir de cÈrtos lipos de dados eÌì] que não podcnr ser usadas. Quando tenros catesorits dc umt !âriÍel,1âl colÌìo ,:ÌcÌrfação. não fu scntìdo tcn{ar ordená las l)essa tìüì1. nno podcÍìos ulìliz:rÍ a úìédia ou r nÌedi.rna. Se vocô lcnì eíe tipo de dador. nào tem outrr cscoÌha a não seÍ a nìoda. EntretrnÌo. qu.rndo utili/rm)s a nrcd:ì. precisanìo\ Ìer cert.rt d. quc ela eslá re:ìlnerÈ lÌrrnecendo unra boa indicrçÌo do v.ìÌor Ípìco. Dê unÌ.r olh.ìdr Dos scguinrcs coÌìjLrrÌos de
l2 ll
2:r.1 567t )))22 Ìl 1345678910
Você de\e tcr nolrdo que. no pri eiro conjìrnÌo de dddo\. o \alor 2 se repelè beÌÌì nìaìs do que qualquôroutro. A modlì. neÍe caso. será unrr nredjdx dc tcDdôncia cenÌraÌ aproprìa dx. jí que el{ ó uììa indicação razoálel do !alor titìi.o \o 'cgunLìo conlunLr o lalor 2 seri novanìenle a m)da, poi\ é o valor que ocorre coÌr nrxior ü.qiiôncia. No enÌanlo. aqui, ela nio será uìÌ bonr indicrdor poìs sua treqüêncìa de o.orrêncir c: rpcnas lèveÌtìeÌìle superior ao de qualquer outro. Então, Ììeste caso. a Ìnoda Ìrio de\erir ser cscolhida conÌo ìediür de Ìendência cenÌ.rl. Alguìì{s vczcs \ocê rão teri rnì.r Ìnedid.ì de teDdôncit ccnLrtÌ .ìpro priada. Enr tai! situâç(ìcs. roci dc\c âceitar o 1ìÌo de que a ,ìnx)\lrâ nào aprcsenla um \rloí
tifico.
Atividade 2.3 Que medlda de lendênca centralé mdls aproprièda pèrè os segu ntes conjuntos de dâdos?
Módia da população nìedidâs de Ìendêncìâ centnÌl que descÍev.nì(^ \ao úÌeis para dar unÌa indicação do dc unìr roìoslÍ.ì. Suponh.ì que quercÌnos uìÌ.Ì i dicação do \'âlor típico em umr população. PodcnÌos. tcoric.ìrìcrìrc. câÌcuÌar a oÌadir dt popuÌ.ìção ('rÌÌì parâÌnetro) de mlìneiÍ.ì scmcÌh.ìnlc âo cálcuÌo cìâ nìédia da amoÍÌrÌ: obÌcr o\ \xlor.ç dc lodos ra populâção. roÌnar e cìi\ìdirâ sonì.ì pclo lanxìúhocìâ populaçio. N.ì pÌáricx. cntretiìÌìlo. ìsto Ìrão é. orrnaÌrìenle. possíleÌ. Vocè podeÍia inâgìn corìo serìa lenÌâr mcdir o ní\el de ansied:ìde causada pela eíalí\tìca c x pÌocrâÍifuçio de cada nìd íduo no muDdol'Pcìrta to. deveÌÌìos eíim:ìr os