GRUPO
Educação a Distância
Caderno de Estudos
BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
Prof.ª Ma. Grazielle Jenske
UNIASSELVI 2016
NEAD
CENTRO UNIVERSITÁRIO UNIVERSITÁRIO LEONARDO LEONARDO DA VINCI Rodovia BR 470, Km 71, nº 1.040, Bairro Benedito 89130-000 - INDAIAL/SC www.uniasselvi.com.br
Copyright UNIASSELVI 2016 Elaboração: Prof.ª Ma. Grazielle Jenske
Revisão, Diagramação e Produção: Centro Universitário Leonardo da Vinci - UNIASSELVI
Ficha catalográca elaborada na fonte pela Biblioteca Dante Alighieri Alighieri UNIASSELVI – Indaial. 519.5024574 J51b
Jenske; Grazielle Bioestatística em educação física / Grazielle Jenske : UNIASSELVI, 2016. 181 p. : il
ISBN 978-85-515-0018-7 1. Bioestatística. I. Centro Universitário Leonardo da Vinci
APRESENTAÇÃO Prezado acadêmico! Bem-vindo à disciplina de Bioestatística em Educação Física. A estatística é um ramo da matemática que surgiu como Ciência a serviço do Estado, sendo esta tão antiga quanto quanto a própria matemática. matemática. Ao falarm fal armos os em estatís est atístic tica, a, logo log o pensamos pens amos em dados dado s numéric numé ricos os ordenado orde nadoss e sistematizados, pois estamos acostumados com essa ideia cada vez mais popularmente
difundida. Porém, quando tratamos da área do conhecimento especíco em Ciências Biológicas, vericamos que a bioestatística é uma importante ferramenta ferramenta cientíca, porque utiliza os métodos para coletar os dados biológicos, passando pela classicação, síntese, correção e análise desses dados. Então, a partir disso, é possível inferir i nferir sobre as análises e tomar decisões. Desta forma, a bioestatística é uma tentativa de aplicar regras matemáticas a uma ciência experimental. Para utilizar essa ferramenta, precisamos nos basear em suposições, que são a base de todo o procedimento, procedimento, e serão estudadas com necessário número de detalhes com os quais devemos ter prudência para tomarmos a decisão correta. Nesta perspectiva, surge este
caderno de estudos, que tem como propósito principal contribuir para esclarecer e minimizar as diculdades existentes entre os diversos domínios deste conhecimento. Este caderno de estudos está dividido em três unidades que contemplam partes importantes da Bioestatística em Educação Física, como: fases do método estatístico, agrupamento de dados, estudo das medidas de tendência central e de dispersão, estudo
das medidas de correlação, análise de tabelas e grácos, testes de hipóteses, bem como a aplicação destes conteúdos. Na primeira unidade serão apresentados os conceitos iniciais para a aprendizagem
da própria Estatística, assim como denições e maneiras para organizar e apresentar dados estatísticos, de modo que os objetivos para a utilização desses métodos sejam alcançados, pois ao organizar dados coletados por meio de pesquisa, observação ou experimentos, tem-se a intenção de comunicá-los de maneira coerente e assim facilitar uma interpretação dedigna dedigna dos dados.
Na unidade seguinte, trataremos sobre as medidas de posição, elas representam uma série de dados, orientando quanto à posição da distribuição com relação ao eixo horizontal. Dentre as várias medidas de posição, descreveremos a média, a moda, a mediana, o desvio
padrão e o coeciente de variação. Por m, na terceira unidade, conheceremos conheceremos as funcionalidades funcionalidades dos testes estatísticos aplicados à Educação Física. Estes testes são utilizados util izados em situações em que se faz necessário e útil estabelecer relações entre duas ou mais medidas. BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
iii
Queremos aqui lembrar, que este material traz um curso introdutório da Bioestatística em Educação Física. Você deve se sentir curioso e instigado a pesquisar outros materiais para
ampliar e complementar seu aprendizado. Durante o texto, deixamos algumas sugestões e outras podem ser vericadas nas referências bibliográcas. Você, acadêmico, deve saber que além da curiosidade, existem outros fatores importantes para um bom desempenho: a disciplina, a organização e um horário de estudos predenido são essenciais para que se obtenha sucesso nesta trajetória. Esperamos que, ao término deste estudo, você tenha aprimorado os conhecimentos
sobre a Bioestatística, nos seus conceitos e denições, pois a melhoria constante deve ser o objetivo de todo acadêmico. Desta forma, esta disciplina pretende oportunizar a compreensão da construção dos conhecimentos aqui trabalhados e servir de subsídio para as disciplinas subsequentes. Bons estudos! Prof.ª Ma. Grazielle Jenske
U N I Oi! Eu sou o UNI, você já me conhece das outras disciplinas. Estarei com você ao longo deste caderno. Acompanharei os seus estudos e, sempre que precisar, farei algumas observações. Desejo a você excelentes estudos! UNI
BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
iv
BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
v
BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
vi
SUMÁRIO
UNIDADE 1 - CONCEITOS BÁSICOS DA ESTATÍSTICA ESTATÍSTICA ..................... ...................................... ............................ ........... 1 TÓPICO 1 - O MÉTODO ESTATÍSTICO .................................. .................................................. ................................. ........................... .......... 3 1 INTRODUÇÃO ................................ ................................................. ................................. ................................. .................................. ............................... .............. 3 2 CONCEITO DE ESTATÍSTICA............... ESTATÍSTICA................................ .................................. .................................. ................................. ....................... ....... 4 3 GRANDES ÁREAS DA ESTATÍSTICA ................................ ................................................. .................................. ........................... .......... 4 4 O MÉTODO ESTATÍSTICO ................................ ................................................ ................................. .................................. ............................. ............ 6 4.1 MÉTODO EXPERIMENTAL EXPERIMENTAL ................................. .................................................. ................................. ................................. ........................ ....... 6 4.2 MÉTODO ESTAT ESTATÍSTICO ÍSTICO................................. ................................................. ................................. .................................. ............................. ............ 7 5 FASES DO MÉTODO ESTATÍSTICO ................................ ................................................. ................................. ............................. ............. 7 5.1 DEFINIÇÃO DO PROBLEMA.................................. .................................................. ................................. .................................. ..................... .... 7 5.2 PLANEJAMENTO................................. ................................................. ................................. .................................. .................................. ....................... ...... 8 5.3 COLETA COLETA DE DADOS ................... .................................... .................................. ................................. ................................. ................................ ............... 8 5.4 CRÍTICA DOS DADOS................................. ................................................. ................................. .................................. ................................ ............... 9 5.5 ORGANIZAÇÃO DOS DADOS .................................... ..................................................... ................................. ................................ ................ 9 5.6 ANÁLISE DOS RESULT RESULTADOS ............................ ............................................. .................................. .................................. ...................... ..... 10 6 TERMOS BÁSICOS ............................... ................................................ .................................. .................................. ................................. ..................... ..... 10 6.1 POPULAÇÃO ................................. .................................................. ................................. ................................. .................................. ........................... .......... 10 6.2 AMOSTRA ................................. ................................................. ................................. .................................. .................................. ................................. ................1 11 6.3 AMOSTRAGEM............................................... ............................................................... ................................. .................................. ........................... .......... 14 ................................................ .................................. .................................. ...................... ..... 14 6.3.1 Amostragem probabilística ............................... ................................................. .................................. ............................... .............. 17 6.3.2 Amostragem não probabilística ................................ 6.4 TAMANHO DE UMA AMOSTRA................................ ................................................ ................................. .................................. ................. 18 RESUMO DO TÓPICO 11................ ................................ ................................. .................................. ................................. ................................. ................. 22 AUTOATIVIDADE ............................... ................................................ .................................. .................................. ................................. ........................... ........... 23 TÓPICO 2 - ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM ..... PORCENTAGEM ..................... ........................... ........... 25 1 INTRODUÇÃO ................................. .................................................. .................................. .................................. ................................. ........................... ........... 25 2 ARREDONDAMENTO DE NÚMEROS ............................... ................................................ .................................. .......................... ......... 25 2.1 REGRAS DE ARREDONDAMENTO ARREDONDAMENTO................................ ................................................. .................................. .......................... ......... 27 3 FRAÇÕES ................................ ................................................. .................................. ................................. ................................. .................................. ................... .. 28 3.1 TRANSFORMAÇÕES ................................. ................................................. ................................. .................................. ............................... .............. 29 3.2 OPERAÇÕES........................................... ............................................................ .................................. ................................. ................................. ................. 33 4 PORCENTAGENS ................................ ................................................. .................................. .................................. ................................. ...................... ...... 41 RESUMO DO TÓPICO 22............... ................................ .................................. ................................. ................................. .................................. ................. 45 AUTOATIVIDADE .................................. .................................................. ................................. .................................. .................................. ......................... ........ 46 TÓPICO 3 - AGRUPAMENTO DE DADOS ................................ ................................................. .................................. ..................... .... 49 1 INTRODUÇÃO ................................. .................................................. ................................. ................................. .................................. ............................ ........... 49 2 VARIÁVEIS ESTATÍSTICAS .................................. .................................................. ................................. .................................. ....................... ...... 49 2.1 VARIÁVEIS VARIÁVEIS QUALITA QUALITATIVAS TIVAS ............................... ................................................ .................................. .................................. ....................... ...... 50 BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
vii
2.2 VARIÁVEIS QUANTITA QUANTITATIVAS TIVAS .................................. .................................................. ................................. .................................. ................... 50 3 AGRUPAMENTO AGRUPAMENTO DE DADOS ................................. .................................................. ................................. ................................. ..................... .... 52 3.1 DADOS BRUTOS .................... .................................... ................................. .................................. .................................. ................................. .................. 53 3.2 ROL ................................. .................................................. .................................. ................................. ................................. .................................. ......................... ........ 53 3.3 AGRUPAMENTO SIMPLES OU DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS INTERVALOS DE CLASSE ................................ ................................................. .................................. ................................. ....................... ....... 54 3.4 AGRUPAMENTO POR FAIXA DE VALOR OU DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS INTERVALOS DE CLASSE ................................. .................................................. ................................. ............................. ............. 56 RESUMO DO TÓPICO 3 ............................... ................................................ .................................. ................................. ................................. ................... 62 AUTOATIVIDADE ................................. .................................................. .................................. ................................. ................................. .......................... ......... 63 UNIDADE 2 - MEDIDAS DE POSIÇÃO ................................ ................................................. .................................. ........................... .......... 67 TÓPICO 1 - MEDIDAS DE TENDÊNCIA CENTRAL CENTRAL ................................................ ....................................................... ........ 69 1 INTRODUÇÃO ................................ ................................................. .................................. .................................. ................................. ............................ ............ 69 2 MÉDIA ARITMÉTICA ................................. .................................................. .................................. ................................. ................................. ................... 70 2.1 MÉDIA ARITMÉTICA ARITMÉTICA PARA DADOS NÃO AGRUPADOS AGRUPADOS .......................................... .......................................... 70 2.2 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO INTERVALO DE CLASSE ................................. .................................................. ......................... ........ 72 2.3 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO INTERVALO DE CLASSE ................................ ................................................. ......................... ........ 79 3 MODA................ MODA................................. .................................. ................................. ................................. .................................. .................................. ......................... ........ 82 3.1 DADOS NÃO AGRUPADOS AGRUPADOS ................................. ................................................. ................................. .................................. ..................... .... 82 3.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSES ............................... ................................................ .................................. .................................. ................................. ............................ ............ 83 3.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSES .................................. ................................................... ................................. ................................. .................................. .......................... ......... 83 4 MEDIANA ................................ ................................................ ................................. .................................. .................................. ................................. .................... .... 86 4.1 DADOS NÃO AGRUPADOS ...................................... ....................................................... ................................. ................................ ................ 86 4.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSES .................................. .................................................. ................................. .................................. .................................. .......................... ......... 88 4.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSES ................................. .................................................. .................................. .................................. ................................. .......................... .......... 90 RESUMO DO TÓPICO 11................ ................................. .................................. ................................. ................................. ................................. ................ 93 AUTOATIVIDADE ................................ ................................................. ................................. ................................. .................................. ........................... .......... 95 TÓPICO 2 - MEDIDAS DE DISPERSÃO ................................ ................................................. ................................. ......................... ......... 97 1 INTRODUÇÃO .................................. ................................................... ................................. ................................. .................................. ........................... .......... 97 2 AMPLITUDE TOTAL ................................. .................................................. ................................. ................................. .................................. ................... .. 98 3 DESVIO PADRÃO ............................... ................................................ .................................. .................................. ................................. ........................ ........ 98 3.1 DESVIO PADRÃO AMOSTRAL E DESVIO PADRÃO POPULACIONAL.................... .................... 99 3.2 CÁLCULO DO DESVIO PADRÃO.................................. ................................................... ................................. ............................ ............ 99 3.2.1 Dados não agrupados ...................... ...................................... ................................. .................................. .................................. ...................... ..... 99 ........... 102 3.2.2 Dados agrupados em distribuição de frequência sem intervalo de classes .......... BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
viii
3.2.3 Frequência de classes............................ classes............................................ ................................. .................................. ............................... .............. 104 4 COEFICIENTE DE VARIAÇÃO ................................ ................................................. .................................. ................................. .................. 107 RESUMO DO TÓPICO 22................ ................................. .................................. ................................. ................................. ................................ ...............1 110 AUTOATIVIDADE ................................ ................................................. ................................. ................................. .................................. ..........................11 .........111 1 TÓPICO 3 - SÉRIES E GRÁFICOS ESTATÍSTICOS ................................ ................................................. ......................1 .....113 13 1 INTRODUÇÃO .................................. .................................................. ................................. .................................. .................................. ..........................1 .........113 13 2 SÉRIE ESTATÍSTICA ................................ ................................................. ................................. ................................. .................................. ..................1 .113 13 2.1 TIPOS DE SÉRIES ......................... ......................................... ................................. .................................. ................................. ..........................1 ..........117 17 2.1.1 Séries históricas, cronológicas ou temporais ........................ ......................................... .................................. .................1 117 2.1.2 Séries geográcas, espaciais, territoriais ou de localização ...................................118 .................................................. .................................. .........................1 ........119 19 2.1.3 Séries especícas ou categóricas ................................. 2.1.4 Séries conjugadas ................................. .................................................. ................................. ................................. ................................ ............... 121 3 GRÁFICO ESTATÍSTICO ................................. .................................................. .................................. .................................. .......................... ......... 121 3.1 GRÁFICOS EM LINHA OU CURVA CURVA .................................... ..................................................... .................................. ..................... .... 122 3.2 GRÁFICOS EM COLUNAS OU EM BARRAS .................................. .................................................. ........................ ........ 124 3.3 GRÁFICO EM SETORES................................. .................................................. .................................. ................................. ....................... ....... 125 3.4 PICTOGRAMAS PICTOGRAMAS .................................. ................................................... ................................. ................................. .................................. .................... ... 126 RESUMO DO TÓPICO 33............... ................................ .................................. ................................. ................................. ................................ ............... 128 AUTOATIVIDADE ............................... ................................................ .................................. ................................. ................................. .......................... ......... 129 AVALIAÇÃO ................................ ................................................. .................................. .................................. ................................. ................................. ................. 130 UNIDADE 3 - INTRODUÇÃO AOS TESTES ESTATÍSTICOS ESTATÍSTICOS .............. ............................... ......................... ........ 131 TÓPICO 1 - INTRODUÇÃO À PROBABILIDADE................. PROBABILIDADE.................................. .................................. ........................ ....... 133 1 INTRODUÇÃO .................................. .................................................. ................................. .................................. ................................. ......................... ......... 133 2 DISTRIBUIÇÃO NORMAL ................................ ................................................ ................................. .................................. .......................... ......... 133 2.1 TABELA Z ................................. .................................................. .................................. ................................. ................................. ............................... .............. 134 RESUMO DO TÓPICO 11................ ................................ ................................. .................................. ................................. ............................... ............... 140 AUTOATIVIDADE ............................... ................................................ .................................. .................................. ................................. ......................... ......... 141 TÓPICO 2 - TESTES DE HIPÓTESES ................................ ................................................ ................................. ........................... .......... 143 1 INTRODUÇÃO .................................. .................................................. ................................. .................................. ................................. ......................... ......... 143 2 TESTES CLÁSSICOS................. CLÁSSICOS................................. ................................. .................................. ................................. ............................... ............... 143 3 ERROS DO TIPO I E II ................................. .................................................. ................................. ................................. ............................. ............ 146 ................................................. .................................. ................................. ............................... ............... 147 3.1 ERRO DO TIPO I (α) ................................ ................................................ .................................. ................................. ............................... ............... 147 3.2 ERRO DO TIPO II (β) ............................... 4 EXEMPLOS DE TESTES DE HIPÓTESES............... HIPÓTESES ................................ .................................. .............................. ............. 148 4.1 TESTE DE HIPÓTESES PARA A MÉDIA QUANDO O DESVIO PADRÃO DA POPULAÇÃO É CONHECIDO................................. .................................................. ................................. .......................... .......... 150 4.1.2 Teste de hipóteses para a média quando o desvio padrão da população é desconhecido................................. .................................................. .................................. ............................. ............ 154 ........................ 155 4.2 TESTE DE HIPÓTESES PARA A VARIÂNCIA POPULACIONAL σ2 ........................ 4.3 TESTE DE HIPÓTESES PARA A PROPORÇÃO POPULACIONAL P ..................... ..................... 157 BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
ix
RESUMO DO TÓPICO 2 ............................... ................................................ .................................. ................................. ................................ ................ 159 AUTOATIVIDADE ................................. .................................................. .................................. ................................. ................................. ........................ ....... 160 TÓPICO 3 - REGRESSÕES E CORRELAÇÕES .................................. ................................................... ......................... ........ 163 1 INTRODUÇÃO ................................. ................................................. ................................. .................................. ................................. .......................... .......... 163 2 DIAGRAMA DE DISPERSÃO .................................. ................................................... ................................. ................................. ................... .. 163 3 CORRELAÇÃO DE PEARSON .................................. .................................................. ................................. ................................. ................ 165 4 REGRESSÃO LINEAR SIMPLES ................................. ................................................. ................................. .............................. ............. 168 4.1 EQUAÇÃO LINEAR......................... LINEAR.......................................... .................................. .................................. ................................. ....................... ....... 169 RESUMO DO TÓPICO 33............... ................................ ................................. ................................. .................................. ................................ ............... 174 AUTOATIVIDADE .................................. .................................................. ................................. .................................. .................................. ....................... ...... 175 APÊNDICE A ................................. ................................................. ................................. .................................. .................................. ............................... .............. 177 APÊNDICE B ................................. ................................................. ................................. .................................. .................................. ............................... .............. 178 APÊNDICE C ................................. ................................................. ................................. .................................. .................................. ............................... .............. 179 AVALIAÇÃO ................................ ................................................. ................................. ................................. .................................. .................................. ................. 180 REFERÊNCIAS ................................ ................................................. .................................. ................................. ................................. ............................. ............ 181
BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA
x
UNIDADE 1
CONCEITOS BÁSICOS BÁSIC OS DA ESTATÍSTICA
OBJETIVOS DE APRENDIZAGEM A partir desta unidade, você será capaz de:
identificar a terminologia, símbolos usuais e conhecimentos básicos encontrados em bioestatística; descrever e interpretar informações do campo da Educação Física sob o aspecto estatístico; compreender os procedimentos técnicos e de cálculos essenciais
ao trabalho estatístico quanto aos dados biológicos;
utilizar a linguagem bioestatística como instrumento de apoio na execução de atividades do cotidiano.
PLANO DE ESTUDOS Esta unidade está dividida em três tópicos, em cada um deles você encontrará atividades que o auxiliarão a xar os conhecimentos abordados.
TÓPICO 1 – O MÉTODO ESTATÍSTICO TÓPICO 2 – ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM TÓPICO 3 – AGRUPAMENTO DE DADOS
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 1
TÓPICO 1 O MÉTODO ESTATÍSTICO ESTATÍSTICO
1 INTRODUÇÃO Os primeiros registros da Estatística datam de aproximadamente 3000 anos a.C.
na Babilônia, China e Egito. Essas civilizações já possuíam a necessidade de registrarem numericamente questões questões de seu convívio social, ou seja, já realizavam uma espécie de censo. Os censos estavam relacionados ao número de habitantes, registros de nascimento, nasciment o, de óbitos, estimativas de riquezas, taxas cobradas pelos governos, entre outras. Esses processos, ao longo dos anos, foram ganhando mais importância, até que em
meados do século XVII o acadêmico alemão Gottfried Achenwall (1719-1772) acabou atribuindo à Estatística proporção cientíca. A Alemanha teve grande inuência no desenvolvimento da Estatística, visto vis to que foi na Escola Alemã que foram feitas as primeiras tabelas mais complexas, compl exas, representações representações grácas e cálculos de probabilidades. A partir daí a Estatística foi estabelecida com o propósito de ser um conjunto de métodos, a m de sistematizar os processos de organização de dados que as sociedades necessitavam. As tabelas foram se aprimorando, os primeiros cálculos foram surgindo e a estatística como conhecemos hoje foi sendo moldada. Nas últimas décadas, a Estatística tem se mostrado presente nas mais diversas áreas de conhecimento, como a Educação, a Engenharia, a Administração, as Ciências Contábeis, a Medicina, a Agronomia, a Educação Física, a Biologia, a Psicologia e muitas outras. Destacamos
ainda que a área da Educação Física que atua em diversas linhas de pesquisa (saúde, lazer, educação e esporte, entre outras), também utiliza o tratamento estatístico analítico para inferir sobre seus parâmetros. Acadêmico, nesta disciplina você terá a oportunidade de aprender sobre a área da matemática que mais desperta o interesse das pessoas. Seja Sej a na empresa, com suas metas, ou
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
4
TÓPICO 1
UNIDADE 1
no período eleitoral, com a antecipação do possível candidato eleito, a estatística é a área da
matemática que mais atrai curiosidade. Acreditamos que seja o motivo pelo qual a Estatística estar, de alguma forma, mais próxima do cotidiano das pessoas, pois nenhum dos métodos
estatísticos é restrito a qualquer campo de aplicação, mesmo mesm o que alguns problemas necessitem de técnicas estatísticas mais sosticadas, ou até mesmo a utilização de softwares devido à quantidade de informações a serem estudadas. Serão apresentados alguns dos conceitos iniciais para a aprendizagem da própria
Estatística, assim como denições e maneiras para organizar e apresentar dados estatísticos de modo que os objetivos para a utilização desses métodos sejam alcançados, pois ao organizar dados coletados por meio de pesquisa, observação ou experimentos tem-se a intenção de comunicá-los de maneira coerente, e assim facilitar uma interpretação dedigna dedigna dos dados.
2 CONCEITO DE ESTATÍSTICA ESTATÍSTICA A Estatística é denida por Crespo (2002) como uma parte da Matemática Aplicada que fornece métodos para coleta, organização, análise e interpretação de dados e para a utilização B I O E S T A T Í S T I C A
dos mesmos na tomada de decisões. Aprofundamos Aprofundamos essa denição e a conceituamos como sendo o estudo de um grupo de indivíduos, objetos ou de qualquer comportamento coletivo, através de métodos, onde interpretamos os resultados deste estudo através de valores numéricos.
São exemplos de aplicabilidade da Estatística: a) A média da idade dos alunos ingressantes i ngressantes no curso de E Educação ducação Física é de 23 anos. b) A taxa de conversão do site da Uniasselvi variou 5% no último mês. c) Os prossionais da área de Educação Física tem uma renda mensal média variando
E M
entre R$ 1800,00 e R$ 2000,00.
E D U C A Ç Ã O
3 GRANDES ÁREAS DA ESTATÍSTICA ESTATÍSTICA
F Í S I C A
A Estatística é uma parte da matemática aplicada que, por meio da coleta, organização, organização,
descrição, análise análi se e interpretação de dados auxilia na tomada de decisões futuras. Atualmente, a Estatística pode ser dividida em três áreas: Estatística Descritiva, Probabilidade e Inferência Estatística.
UNIDADE 1
TÓPICO TÓPICO 1
5
A Estatística Descritiva é denida como um conjunto de técnicas utilizadas com a intenção de descrever e resumir dados, de modo a possibilitar que sejam tiradas conclusões a respeito de determinado fenômeno de interesse. Geralmente, a Estatística Descritiva é utilizada utili zada em uma fase inicial da pesquisa, a partir do primeiro contato com os dados que ainda estão, muitas vezes, desorganizados, tendo uma grande importância ao lidarmos com quantidades expressivas de dados. Nesses casos, é necessária a utilização de algumas técnicas que
simpliquem e representem a totalidade dos dados, como, por exemplo, a organização destes em tabelas e grácos. A probabilidade lida com a incerteza, com a possibilidade de um evento ocorrer ao acaso, como em jogos de dados ou de cartas, sorteio de uma pessoa que tem determinada característica em um grupo de pessoas que tem e que não tem essa característica.
Por último, a inferência estatística é o estudo de técnicas que permite uma generalização por meio de uma determinada quantidade de dados, que se aplicam ao total da população envolvida. Para ser possível a realização de uma inferência a respeito de determinada situação,
inicialmente temos que ter uma problemática bem estabelecida, por exemplo: a necessidade de abrir uma academia em determinada região da cidade, e a opinião dos consumidores a respeito de uma nova marca de produtos para a saúde, pesquisas eleitorais para direcionar as próximas atitudes da assessoria dos candidatos.
Após denida a problemática, é possível iniciar a coleta de dados, sendo que esta deve ser muito bem planejada para que a análise não gere informações incorretas. i ncorretas. A coleta de dados pode ser realizada de maneira direta ou indireta, como veremos adiante.
Após a coleta dos dados, é preciso observá-los observá-los com a intenção de vericar imperfeições imperfeições e falhas, para que estas não causem erros no resultado. Frequentemente, Frequentemente, acontecem falhas
em pesquisas que realizam perguntas tendenciosas, ou seja, que tentam induzir i nduzir a resposta do entrevistado. Vejamos um exemplo de pergunta tendenciosa: fazer exercícios físicos frequentes é mais importante do que ter uma alimentação al imentação saudável? saudável ? Talvez Talvez não percebamos, percebamos , mas o modo como essa pergunta é feita induz ao entrevistado que é importante fazer exercícios físicos e ter uma alimentação saudável, o que na opinião do entrevistado pode não ser verdade e ainda tentar nos conduzir a responder que é mais importante fazer exercícios físicos. Ao formularmos a pergunta que fornecerá fornecerá os dados dados para a pesquisa pesquisa temos temos que tomar alguns cuidados. Não se deve utilizar uma linguagem que possivelmente o entrevistado não
compreende e também não devemos fazer questões que induzam a uma resposta, isso pode alterar os dados, o que levará a uma pesquisa que gerou um resultado falso.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
6
TÓPICO 1
UNIDADE 1
Após organizar os dados, frequentemente os expomos por meio de tabelas, quadros ou grácos, o que facilita, caso seja necessária a aplicação de um cálculo estatístico. Por meio da Estatística indutiva ou inferencial podemos tirar conclusões e realizar previsões relativas ao total da população, mesmo que apenas parte desta tenha sido entrevistada, ou seja, utilizou-se uma amostra, mas os resultados podem ser generalizados para toda a população. Este ciclo descreve as fases do método estatístico, que veremos de forma mais aprofundada a seguir.
4 O MÉTODO MÉTO DO ESTATÍSTICO ESTATÍSTICO No grego, methodos signicava caminho para se chegar a um m. Atualmente, um
método consiste em um conjunto de etapas, ordenadamente dispostas, a serem vencidas: • na investigação da verdade;
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
• no estudo de uma ciência; • ou para alcançar um determinado m.
Dos métodos cientícos, vamos destacar o método experimental e o estatístico.
4.1 MÉTODO EXPERIMENTAL As primeiras investigações foram realizadas na primeira metade do século XIX, por Gustav Ferchner e conforme o próprio termo sugere este método, através da experimentação, consiste em limitar as áreas investigadas, mantendo constantes todas as causas, menos uma,
variando-a de modo que se possa descobrir suas implicações, caso existam. Este método tem um papel importante para o conhecimento do comportamento humano
e animal. Um exemplo de aplicação do método experimental é na testagem da ecácia de um determinado medicamento, medicamento, onde criam-se dois grupos, em que um grupo recebe a medicação em teste e o outro recebe placebo, ou seja, com as mesmas causas (perl dos participantes, hábitos, doenças preexistentes), no entanto, altera-se a composição da medicação.
UNIDADE 1
TÓPICO TÓPICO 1
7
4.2 MÉTODO ESTATÍSTICO Em situações em que não é possível manter as causas constantes, utilizamos utilizam os o método estatístico. O método estatístico considera todas as causas envolvidas no processo como
variável e procura determinar no resultado nal e que inuências cabem a cada uma delas. Como exemplo, pode-se citar a viabilidade ou não da abertura de uma academia, a partir de uma pesquisa de mercado. Pelo processo do método experimental, neste caso, poderia ser custoso e inadequado. inadequado. A seguir, seguir, vamos detalhar detalhar cada uma das das fases do método método estatístico. estatístico.
5 FASES DO MÉTODO MÉTOD O ESTATÍSTICO ESTATÍSTICO São seis as fases do método estatístico, a saber: • Denição do problema. • Planejamento. • Coleta de dados. • Crítica dos dados. • Organização
de dados. • Análise dos resultados. Adiante detalharemos detalharemos cada uma delas.
B I O E S T A T Í S T I C A E M
5.1 5.1 DEFINIÇÃO DO P ROBLEMA Esta fase consiste na denição e formulação correta do problema a ser estudado. Outra parte importante desta fase é analisar outros estudos já realizados sobre a questão para traçar estratégias assertivas para a pesquisa.
São sugestões de temas a tratar: • Variação
de altura, peso.
E D U C A Ç Ã O F Í S I C A
8
TÓPICO 1
UNIDADE 1
Tratamento de dados relativos aos desempenhos dos alunos no salto em altura, lançamento de pesos. •
• Frequência de batimentos cardíacos. • O tempo necessário para a realização de uma prova.
5.2 PLANEJAMENTO Após a denição do do problema, neste neste momento, ocorre ocorre o plano de como os processos serão realizados. É nesta fase que se decide de qual forma serão obtidos os dados, quais serão as variáveis abordadas, qual a população de interesse e o tipo de amostragem, termos estes que detalharemos adiante.
5.3 COLETA DE DADOS DA DOS
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Após delimitar o problema de pesquisa e denir um plano de ação, é preciso pensar em como obter os dados. Para isso, existem duas maneiras: uma é usar dados já coletados por outra pessoa (dados secundários), outra é coletar os próprios dados (dados primários). Isso caracteriza a coleta como indireta e direta, respectivamente.
A coleta indireta indireta é indicada indicada quan quando do há disponibilidad disponibilidadee de dado dadoss secund secundários ários adequ adequados, ados, assim economiza-se a coleta dispendiosa de dados primários. No entanto, quando se usam
dados secundários, as denições, a nalidade, a cobertura, a frequência (quantas vezes), a temporalidade (atualidade), o nível de desagregação (os detalhes) e a exatidão (incluindo o tamanho da amostra e a tendenciosidade dos questionamentos feitos) podem ser inadequados aos objetivos propostos. Podemos fazer uso da coleta secundária ao utilizar, por exemplo, os dados do censo, visto ser esta uma estatística ocial (que segue os critérios e fases do método estatístico). A coleta direta ocorre quando não há disponibilida disponi bilidade de de dados primários, primári os, sendo necessário obter os dados diretamente da fonte. Um exemplo disso é quando uma indústria de medicamentos realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.
A coleta coleta direta de dados pod podee ser classicada com com relação ao fator fator tempo, como: como: a) Contínua (registro) - quando é feita continuamente, conti nuamente, tal como a de nascimentos, óbitos, os registros da scalização eletrônica de velocidade etc.
UNIDADE 1
TÓPICO TÓPICO 1
9
b) Periódica - quando é feita em intervalos de tempo constantes, como os censos demográcos, matrículas semestrais e/ou anuais dos estudantes etc. c) Ocasional - quando feita ocasionalmente, a m de atender a uma conjuntura ou uma emergência, como no caso de epidemias, pesquisas eleitorais, avaliações etc.
5.4 CRÍTICA DOS DADOS Realiza-se neste processo uma auditoria dos dados, em busca de possíveis falhas e imperfeições ou dados a serem desconsiderados (repetições, omissões etc.), a m de não incorrer em erros que possam inuir sensivelmente nos resultados. A crítica crítica dos dados pode ser de origem interna ou externa.
a) Crítica Interna: quando visa observar os elementos originais dos dados da coleta. b) Crítica Externa: quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas.
Por exemplo, ao aplicar o questionário, temos que fazer uma crítica para vericar se as respostas obtidas condizem com a nossa necessidade (crítica interna), no caso de haver erros precisamos saber o motivo da ocorrência dos mesmos para futura correção, vericamos se o pesquisado estava desatento, ou se a questão foi mal interpretada etc. (crítica externa).
5.5 ORGANIZAÇÃO DOS DADOS Após os processos comentados anteriormente, anteriormente, necessitamos organizá-los, ou seja, realizar a soma e o processamento dos dados obtidos, bem como sua disposição mediante critérios de classicação. Este resumo dos dados pode ser feito através de contagem e/ou agrupamento. A importância desta fase do método se encontra na facilidade posterior do
entendimento entendimento das informações. Já os dados podem ser apresentados de duas formas, que não se excluem mutuamente:
a apresentação tabular, que é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas xadas pelo Conselho Nacional de Estatística; e a apresentação apresentação gráca, que constitui uma apresentação geométrica, permitindo uma visão rápida e clara do fenômeno.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
10
TÓPICO 1
UNIDADE 1
5.6 ANÁLISE DOS RESULTADOS Trata-se do principal objetivo da estatística, apurar resultados e interpretá-los. Está ligada essencialmente ao cálculo de medidas e coecientes, e sua nalidade principal é descrever o fenômeno. Estes números, ao serem interpretados, irão traduzir informações importantes nas tomadas de decisão acerca do experimento desejado. Assim, completamos as as fases do método método estatístico. estatístico. FIGURA 1 - FASES DO MÉTODO ESTATÍSTICO
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
FONTE: A autora
6 TERMOS BÁSICOS Até aqui usamos usa mos divers div ersos os termos term os caracte car acterís rístic ticos os da estatís est atístic tica a e que irão irã o nos acompanhar durante o estudo desta disciplina. Desta forma, faz-se necessário descrevê-los
com maior detalhamento. Assim, a seguir, apresentaremos os termos básicos da Estatística.
6.1 POPULAÇÃO Denimos população (ou universo estatístico) o conjunto de todos os indivíduos ou a todos os objetos do grupo em que serão estudados a partir dos métodos estatísticos. São exemplos de população:
UNIDADE 1
TÓPICO TÓPICO 1
11
a) SITUAÇÃO: Um professor quer saber a altura média dos acadêmicos do terceiro semestre do curso de Educação Física da Uniasselvi. POPULAÇÃO: Todos Todos os acadêmicos do terceiro tercei ro semestre do curso de Educação Educaç ão Física da Uniasselvi.
b) SITUAÇÃO: Analisar os batimentos cardíacos de homens fumantes na faixa dos 35 a 40 anos, residentes em Indaial – Santa Catarina, quando expostos expostos a atividades físicas. POPULAÇÃO: Todos os homens fumantes na faixa dos 35 a 40 anos, residentes em Indaial – Santa Catarina
c) SITUAÇÃO: O Conselho Federal de Educação Física está realizando um censo e quer saber qual a área de intervenção dos prossionais habilitados em Educação Física. POPULAÇÃO: Todos Todos os prossionais habilitados em Educação Física no Brasil. FIGURA 2 - POPULAÇÃO
FONTE: Adaptado de: . Acesso em: 26 jun. 2016.
Em situações em que o número de indivíduos ou elementos for muito grande, inviabilizando inviabil izando estudar toda a população, utilizamos utiliza mos uma parte da população que denominamos de amostra.
B I O E S T A T Í S T I C A E M
6.2 AMOSTRA Amostra é um conjunto conjunto que que está contido na população população estatística. Em outras outras palavras, palavras, é uma parcela representativa da população a ser estudada. Por este fato, a amostra deve
caracterizar a população através das mesmas congurações, porém em menor escala de quantidade de elementos a serem estudados.
Certamente você já vivenciou uma situação semelhante à apresentada a seguir:
E D U C A Ç Ã O F Í S I C A
12
TÓPICO 1
UNIDADE 1
FIGURA 3 - SITUAÇÃO DE AMOSTRA
FONTE: Disponível em: . Acesso em: 26 jun. 2016.
Ao criar uma amostra referente a uma população ganhamos em tempo e redução de
esforços para realizar os estudos solicitados. Veja os exemplos: a) Foram entrevistados 400 acadêmicos de uma determinada instituição para saber sua satisfação com os serviçõs oferecidos por ela. Note que 400 acadêmicos são uma amostra do total de acadêmicos desta instituição. B I O E S T A T Í S T I C A
b) Uma empresa coletou 200 cartelas do medicamento X contidas em diversos lotes de produtos, para testar sua qualidade.
Repare que 200 cartelas não é o conjunto de todas as cartelas de todos os lotes produzidos pela empresa. Logo, é uma amostra. FIGURA 4 - DIFERENÇA ENTRE POPULAÇÃO E AMOSTRA
E M E D U C A Ç Ã O F Í S I C A
FONTE: Adaptado de: . Acesso em: 26 jun. 2016.
UNIDADE 1
TÓPICO TÓPICO 1
13
Desta forma, podemos destacar cinco principais razões que levam o pesquisador a trabalhar com amostras: a) Economia: Quanto maior a amostra, maior o custo de obtenção dos dados. b) Tempo: Muitas vezes o fator tempo é determinante numa pesquisa. Por exemplo, em uma pesquisa epidemiológica ou de “boca de urna”, não haveria tempo suciente para se abordar toda a população, mesmo havendo recursos nanceiros disponíveis. c) Conabilidade dos Dados: Considerando o fator “fadiga” como elemento limitador das potencialidades humanas. No caso de uma amostra, pode se dedicar mais atenção aos
casos individuais, evitando erros de mensuração e/ou processamento. Atente que geralmente é mais eciente estudar um grupo pequeno de forma intensiva i ntensiva do que estudar um grande grupo de maneira supercial – quantidade versus qualidade. d) Operacionalidade: É mais fácil realizar operações de pequena escala. Um dos maiores problemas nos grandes censos é controlar os pesquisadores. e) População inexistente: Dinossauros. Em contrapartida, existem três razões fundamentais que não permitem ao pesquisador optar por amostragem em determinadas pesquisas:
a) População Pequena: Sob o enfoque de amostragens aleatórias, se a população for pequena, ou seja, inferior a 100 elementos, usar a técnica da amostragem signicaria inserir uma margem de erro sem reduzir signicativamente o tamanho da amostra. b) Característica de Fácil Mensuração: Mesmo que a população não seja tão pequena, quando a variável que se quer observar é de tão fácil fáci l de mensuração que não compensa investir num Plano de Amostragem.
c) Necessidade de Alta Precisão: Quando o parâmetro for, por exemplo, o censo demográco de um país, esse parâmetro precisa ser avaliado com grande precisão pois é fundamental fundamental para o planejamento desse país. Nesse caso se pesquisa toda a população. No Brasil isso ocorre a cada dez anos e é desenvolvido pelo Instituto Brasileiro de Geograa e Estatística - IBGE -, certamente você ou seus familiares já participaram desta pesquisa.
B I O E S T A T Í S T I C A E M
Ç Ã O ! A T E N
Acadêmico, toda pesquisa por amostragem tem o risco de um erro, esse erro é previsto e determinado, no caso de população pequena, o número de indivíduos da amostra representa quase toda a população. Mais adiante veremos como esse erro aparece no cálculo do tamanho da amostra.
Você deve estar se perguntando: Como uma amostra pode representar uma i nformação
correta de um conjunto muito grande de dados? Por que, em uma eleição, cidades com altas
E D U C A Ç Ã O F Í S I C A
14
TÓPICO 1
UNIDADE 1
populações são escolhidas apenas cerca de 2000 pessoas para darem suas intenções de voto e assim prever o candidato eleito? Dois fatores são fundamentais para que uma amostra represente uma população, uma delas é o tipo de amostragem utilizada e o outro corresponde a determinados cálculos
estatísticos que devemos fazer para chegar a estas comprovações. Veremos Veremos isto de maneira detalhada a seguir:
6.3 AMOSTRAGEM Temos várias maneiras de extrair e utilizar amostras. No entanto, o método a ser utilizado utili zado
deve estar de acordo com os objetivos do estudo. Em primeiro lugar, temos de determinar a população-alvo, isto é, se é composta por todos as pessoas que vivem numa área de inuência, os alunos da academia, ou só as mulheres, por exemplo.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Uma vez denida a população, temos que elaborar uma lista desses elementos. Por lista l ista entendemos a descrição de todos eles. Isso parece levantar alguns problemas, por exemplo: como é que obtenho a lista de todos as pessoas da área de inuência de uma academia? Ou: como é que obtenho a lista de todas as mulheres que praticam atividade física numa determinada cidade? Nestes casos, temos que dar resposta a esta situação mudando para um quadro
de amostragem que seja compatível com a população a estudar. A dimensão da amostra é importante, sobretudo se pretendermos realizar inferência estatística e probabilidades para as médias e proporções que viermos a encontrar. Mais adiante veremos como isso é possível. Os passos seguintes serão a extração da amostra e a sua validação, isto é, a forma de
nos assegurarmos que ela é sucientemente representativa. Neste ponto você vericará os principais métodos de amostragem, através de exemplos práticos. Numa ideia generalista, as probabilísticas e não probabilísticas. probabilísticas. amostragens podem ser divididas em probabilísticas e
6.3.1 Amostragem probabilística Neste tipo de amostragem, todos os elementos da população possuem probabilidade de pertencer à amostra. Este é o conjunto de amostragem mais adequado para um estudo correto e imparcial da maioria dos casos.
UNIDADE 1
15
TÓPICO TÓPICO 1
Amostragem Aleatória A amostragem amostragem aleatória ocorre quando nos métodos de escolha dos participantes da amostra é realizado um sorteio aleatório, como o próprio nome sugere, em que todos os seus
elementos possuem a mesma probabilidade de pertencerem a esta amostra. Este sorteio pode ser realizado por softwares especícos ou com tabelas de números aleatórios. Exemplo: Imaginemos uma população com número de indivíduos igual a 30.000, simbolicamente: N = 30.000. Desejamos coletar dela n = 3.000 elementos para uma amostra. 10
Ao realizar a amostragem aleatória, os elementos possuem probabilidade 100 (dez a cada cem) de participarem da amostra. Os elementos da população são numerados de 1 a 30.000 e é realizado um sorteio para a denição dos participantes. Este método mostra-se muito útil quando a população é pequena, quando quando existe uma listagem disponível e, quando a dispersão geográca não é um problema. Porém, não é indicado quando há a necessidade de se possuir uma lista completa de todos os elementos da
população e apresenta um elevado custo para a obtenção de informação sobre os elementos selecionados. Amostragem Sistemática
A amostragem sistemática é um processo processo de amostragem probabilístico não aleatório, aleatório, ou seja, é um processo em que se selecionam os sujeitos a incluir na amostra utilizando um critério. Este tipo de amostragem é utilizado quando os elementos da amostra se encontram ordenados. Ele consiste em selecionar um ponto de partida aleatório e em seguida tomar cada
“n” elementos de uma lista. Exemplo: Para realizar uma amostragem sistemática em uma população de 500
prossionais habilitados em Educação física, inicialmente devemos numerá-los de 1 até 500. Então realizamos um sorteio e, suponhamos que saiu o número 37, logo esse funcionário será o primeiro pesquisado. Após efetuar os cálculos (que aprenderemos posteriormente) vericamos que uma boa amostra dessa população é formada por 25 indivíduos, então fazemos a divisão de 500 por 25, o que resulta 20. Esse 20 representa o “passo” que daremos para “escolher” outro prossional, como começamos no prossional de número 37, vamos somando de 20 em 20 para determinar os outros pesquisados, nesse caso seriam os funcionários de números: 57, 77, 97, ..., até determinar os 25 indivíduos da amostra. Neste exemplo, cada prossional possui probabilidade de participar da amostra. 25
500
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
16
TÓPICO 1
UNIDADE 1
Amostragem Estraticada
A amostragem amostragem estraticada estraticada é muito indicada indicada para pesquisas pesquisas em sua área, acadêmico de Educação Física! Ela é indicada quando evidenciamos que existem diferenças signicativas entre subgrupos da população que pretendemos estudar. Esses subgrupos são denominados de “estratos” e devem estar representados na amostra de forma proporcional ao seu “peso” na população.
Para realizar a amostragem estraticada devemos iniciar inic iar por identicar esses subgrupos signicativos (estratos), depois calcular o peso relativo (%) de cada um dos estratos na população (iremos relembrar estes cálculos no tópico a seguir) e, por m, utilizar, em cada um dos estratos, o procedimento de amostragem aleatória para determinar os sujeitos de cada estrato que irão integrar a amostra na mesma proporção em que estão representados na população.
! N T E R T A I M P O
B I O E S T A T Í S T I C A
É importante destacar que os estratos devem ser mutuamente exclusivos, isto é, cada elemento da população apenas deve estar incluído num estrato e exaustivos, ou seja, nenhum elemento da população pode car fora de um estrato.
Utilizar este processo antes do sorteio da amostra é fundamental, fundamental, ao passo que esta
amostra deve ser representativa. Seria bastante estranho, por exemplo, numa população de 100 pessoas onde 80% são mulheres, criarmos uma amostra com 90% de homens. Com certeza
esta amostra não representaria “de forma justa” esta população. Exemplo: Em uma pesquisa sobre os benefícios do hábito de atividades físicas na vida das pessoas que têm entre 20 e 40 anos de idade de uma determinada cidade, precisamos levar
E M
em consideração que existem diferenças signicativas entre a população feminina e masculina. Desta forma, é importante que a nossa amostra inclua um número de homens e de mulheres
E D U C A Ç Ã O
que fosse proporcionalmente igual ao que existe na população em estudo.
F Í S I C A
amostra?
Vamos supor que esta cidade possui uma população de N = 20.000 habitantes entre 20 e 40 anos e para uma análise acerca do benefício do hábito de atividades físicas desta população é necessária uma amostra de tamanho n = 500. Além disto, nos deparamos com 6.000 homens e 14.000 mulheres. Como devemos escolher de forma justa os elementos desta
Como já citamos anteriormente, para este caso, devemos ter mais elementos do estrato de mulheres, pois são maioria nesta cidade. Para realizar esta separação de forma “justa”
UNIDADE 1
17
TÓPICO TÓPICO 1
utilizaremos a proporcionalidade. Chamaremos de das mulheres. Assim: • Para homens:
E 1
• Para mulheres:
=
E 1
( )
n E 1
=
N
6000
=
( )
14000
N
20000
n E 2
=
20000
=
=
0, 3
0, 7
=
=
E 1
o estrato dos homens e
E 2
o estrato
30%
70%
Destes resultados, resultad os, segue que 30% da amostra deve ser escolhida escolhi da do grupo de homens e 70% do grupo de mulheres.
Ç Ã O ! A T E N
Veja, acadêmico, que a soma das porcentagens de todos os estratos deve sempre fechar 100%, que representam o total da população.
Posteriormente, devemos calcular cal cular em termos absolutos a quantidade real de elementos componentes componentes da amostra: • Homens: n1
=
• Mulheres: n2
n
=
⋅
30%
=
n 70% ⋅
500 0, 3 150
=
⋅
=
500 0, 7 ⋅
=
350
E assim, a amostra será composta por 150 homens e 350 mulheres, completando 150
+ 350 = 500 participantes, conforme solicitado.
6.3.2 Amostragem não probabilística Este tipo de amostragem é utilizado quando, no experimento desejado, é impossível encontrar as probabilidades probabilidades para que os elementos participem da amostra ou são escolhidos pela simplicidade de seu processo. Vejamos os principais casos de amostragem não probabilística. Inacessibilidade à População Utilizamos esta amostragem quando a população não é acessível em sua totalidade.
Um exemplo dessa situação é quando se deseja encontrar uma característica importante de todo o minério coletado em uma jazida. Por simplicidade e custo iremos coletar o minério existente na parte mais supercial, sendo que coletá-lo em profundidades maiores seria muito demorado e custoso.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
18
TÓPICO 1
UNIDADE 1
Amostragem a Esmo (ou sem Norma) Podemos utilizar este processo de amostragem ao passo que a população que
desejamos realizar o experimento seja bastante homogênea. Por exemplo, se desejamos retirar uma amostra de tamanho n = 300 de uma população de N = 30.000 bolas de voleibol de um mesmo lote, realizar uma amostragem aleatória seria o ideal, porém, demasiadamente
trabalhoso num contexto em que se necessitam resultados rápidos. Neste caso, realizando uma amostragem a esmo, podemos selecionar as 300 primeiras bolas, sem talvez perder o valor estatístico do processo. Amostragem Intencional A pessoa pessoa responsável pela pela amostra escolhe, a seu critério, os elementos elementos da amostra, por aferir os elementos que mais representam a população. população.
Deixamos claro aqui que este processo é bastante perigoso, por talvez permitir manipulações e parcialidade em pesquisas importantes, por exemplo, pesquisas eleitorais. Assim, fechamos fechamos os principai principaiss métodos métodos de amostrag amostragem. em. É válido válido frisar frisar que a amostrag amostragem em B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
dene a forma (método) com que a amostra é selecionada, de modo que faça uma representação dedigna da população, conforme exemplica a ilustração a seguir. seguir. FIGURA 5 - CICLO PARA DETERMINAR UMA AMOSTRA
FONTE: Adaptado de: . Acesso em: 26 jun. 2016.
6.4 TAMANHO DE UMA AMOSTRA
Quando iniciamos este tópico fomos questionados sobre como conseguimos descobrir qual deve ser a quantidade exata de elementos de uma amostra para que ela realmente
represente a população estudada e que seus resultados possam gerar conabilidade. Para tanto, deve-se seguir as quatro etapas descritas abaixo:
UNIDADE 1 n0
=
19
TÓPICO TÓPICO 1
1 2
E 0
1a Etapa: Cálculo da Amostra Ideal: n
=
N ⋅ n0 N
+
n0
2a Etapa: Cálculo da Amostra Mínima: 3a Etapa: Cálculo do Estimador da Amostra:
x
=
n N
4a Etapa: Aplicação do Estimador aos Estratos (cada categoria):
estrat ato o)⋅ x ( estr
Sendo:
N = Tamanho da População; n = Tamanho da Amostra; no = Tamanho da Amostra Ideal (primeira aproximação); E 0 = Erro Amostral Tolerável (admissível) Ç Ã O ! A T E N
O erro amostral é tolerável na forma de coeciente, ou seja: 7 34 = 0, 07 , ou ainda: 34% = 7% = = 0, 34 . 100
100
Exemplo 1: Numa população de N = 30.000 elementos, qual deve ser o tamanho n da amostra ideal para que a pesquisa tenha erro inferiror a 4%? Resolução: Como E 0 = 4% = 0, 04 temos:
n0
1 =
( 0, 04 )
1 2
=
0, 0016
=
625
Que representa a amostra ideal para o caso. Incluindo agora o peso da população, vem:
n =
625 625 ⋅ 30000 625 625 + 30000 300 00
≅
613
U N I
Note que apesar do arredondamento para inteiro do número 612,24489... ser 612, usamos 613. Para tamanho de amostra, sempre arredondamos para cima, para garantirmos o tamanho mínimo da amostra e carmos abaixo do erro amostral admitido.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
20
UNIDADE 1
TÓPICO 1
Sendo assim, a amostra para esta pesquisa deve ter 613 elementos para ter erro inferior a 4%.
Exemplo 2: Planeja-se um levantamento por amostragem para avaliar diversas características da população de estudantes da Instituição X. Estas características (parâmetros) são especialmente: idade média, renda per capita , local de origem etc. Utilizando a tabela a seguir, com dados referentes a 2016, qual deve ser o tamanho mínimo de uma amostra aleatória al eatória
simples, por curso (estratos), tal que possamos admitir que o risco de estarmos errados não ultrapassem 5%? TABELA 1 - MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA INSTITUIÇÃO X EM 2016
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
CURSO
ALUNOS
Educação Física
870
Engenharia Civil
662
Direito
1 555
Finanças
245
Moda
529
Marketing
340
Serviço Social
2 423
TOTAL
6 624
AMOSTRA
FONTE: A autora
Para determinar o número de indivíduos de cada curso para fornecer a amostra, seguimos as quatro etapas citadas anteriormente: anteriormente:
1ª etapa: cálculo da Amostra Ideal: (lembrete: (l embrete: E 0 = Erro amostral = 5% = 0,05) n0
1
=
( E 0 )
1
2
=
( 0, 05)
1
2
=
1
=
0, 05 0 , 05 ⋅
=
0, 0025
400 alunos
2ª etapa: cálculo da Amostra Mínima: (Lembrete: (Lem brete: N = população, ou seja, soma s oma de todos os alunos dos cursos = 6 624.) n
=
N ⋅ n0 N
+
n0
=
6624 6624 ⋅ 400 6624 6624 + 400 400
=
2649600 7024
=
377 377, 221 221 ≅ 378 378 alunos
3ª etapa: cálculo do Estimador da Amostra:
str at at o ) ⋅ x 4ª etapa: aplicação do Estimador aos Estratos: ( e st
UNIDADE 1 ! N T E R T A IM P O M
21
TÓPICO TÓPICO 1
Nesta etapa, deve-se multiplicar a quantidade de alunos de cada curso pelo valor do estimador. estimador.
! N T E R T A O P M I M
Os valores de cada turma foram arredondados em função de ser uma variável discreta – pessoas – além disso, para garantir o erro mínimo temos que arredondar sempre para cima, não importando os dígitos decimais.
TABELA 2 - MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA INSTITUIÇÃO X EM 2016
CURSO
ALUNOS
AMOSTRA
Educação Física
870
50
Engenharia Civil
662
38
Direito
1 555
89
Finanças
245
14
Moda
529
31
Marketing
340
20
Serviço Social
2 423
139
TOTAL
6 624
381
FONTE: A autora
S ! U R O F U T S U D O E S T
No próximo tópico iremos recordar conceitos de arredondamento, frações e porcentagens. Caso estejas com dificuldades para compreender estes cálculos, avance para o Tópico 2 e depois retorne para realizar estas autoatividades.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
22
UNIDADE 1
TÓPICO 1
RESUMO DO TÓPICO 1
Neste tópico, vimos que: que: • Um método de pesquisa pode ser experimental ou estatístico. O
método estatístico é composto
por seis fases: denição do problema, planejamento, coleta de dados, crítica dos dados, organização de dados e análise dos resultados. Sobre eles, devemos saber: o A coleta
de dados pode ser direta ou indireta, sendo que a coleta direta pode ser contínua, ocasional ou periódica. o A crítica dos dados pode pode ser externa externa ou interna. interna. o A organização de dados nada mais é que um resumo dos dados e pode ser feito
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
através de contagem e/ou agrupamento. A importância desta fase do método se encontra na facilidade posterior do entendimento das informações. Após realizado esse “resumo”, os dados podem ser apresentados de duas formas: a apresentação tabular e a apresentação apresentação gráca. o A análise dos resultados é o objetivo principal da estatística; consiste em apurar resultados e interpretá-los. • Quando, em uma pesquisa, decide-se analisar uma amostra, devemos recorrer
aos métodos de amostragem. Estes métodos consistem no processo de seleção e escolha dos elementos de
uma população para formar uma amostra que represente dedignamente dedignamente a população. • Existem dois grandes grupos dentro o Amostragem
da amostragem:
probabilística, que pode ser: amostragem aleatória, sistemática ou
estraticada. o Amostragem não probabilística: por inacessibilidade à população, a esmo (ou sem norma) ou intencional. • Para obter uma amostra
ideal, devemos seguir quatro etapas:
1a Etapa: Cálculo da Amostra Ideal:
n0
=
2a Etapa: Cálculo da Amostra Mínima:
n
1 2
E 0 =
N ⋅ n0 N
3a Etapa: Cálculo do Estimador da Amostra:
+
x
n0
=
n N
4a Etapa: Aplicação do Estimador aos Estratos (cada categoria):
est estrato ato
⋅x
UNIDADE 1
23
TÓPICO TÓPICO 1
E D A D T I V I A O A U T
Acadêmico, um dos princípios da Uniasselvi é “Não basta saber, saber, é preciso saber fazer”. Agora chegou chegou a sua vez de colocar em prática os conceitos conceitos sobre matrizes, estudados estudados neste tópico. 1 A natação é uma atividade física praticada na água que surgiu na Grécia Antiga e é amplamente praticada até os dias atuais, por ser considerada um dos esportes mais
benécos ao corpo humano. Ao realizar um estudo sobre o tempo gasto, em segundos, por 60 indivíduos, na modalidade dos 50 metros Crawl (também (também conhecido como nado livre), registrou-se o tempo gasto por 16 desses atletas. Os resultados foram os seguintes: 22,1 21,6
23,5 22,2
23,0 21,8
22,2 21,9
21,6 22,0
23,7 22,3
23,1 21,9
22,4 23,3
Considerando estas informações, responda: Os dados coletados são sucientes para que a pesquisa tenha um erro amostral de 4%? Se não, qual deveria ser o tamanho desta amostra?
a) ( ) Sim, os 16 atletas são sucientes para que a pesquisa apresente um erro amostral de 4%.
b) ( ) Não, será necessário registrar registrar o tempo de 54 atletas. atletas. c) ( ) Não, será necessário registrar registrar o tempo de 55 atletas. atletas. d) ( ) Não, será necessário registrar registrar o tempo de 56 atletas. atletas. 2 O atletismo é um conjunto de atividades esportivas de corrida, saltos e arremessos. A mais tradicional tradicional competição do atletismo é a corrida de pista pista e envolve várias provas, provas, entre elas, a maratona. A maratona mais famosa no Brasil e na América Latina é a Corrida Internacional Internacional de São Silvestre. Essa maratona é uma corrida de rua realizada
anualmente na cidade de São Paulo, no dia 31 de dezembro. Ela foi criada em 1925, atualmente tem um percurso de 15 km. Apenas a partir de 1945 tivemos a participação de atletas de outros países e tornou-se uma corrida mista em 1975, quando começou
a participação ocial das mulheres. Em 2015, a 91ª edição da Corrida de São Silvestre teve tev e a participação de 30 mil pessoas de 37 países, porém, apenas 23.268 corredores completaram a prova. Dos corredores
que nalizaram a prova, tivemos, aproximadamente, 70% homens e 30% mulheres.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
24
TÓPICO 1
UNIDADE 1
Agora, suponha que você fará uma pesquisa por amostragem estraticada, levando em conta um erro de, no máximo 5%, com as mulheres que completaram esta prova.
Qual deve ser o número mínimo de mulheres entrevistadas para a amostra? a) ( b) ( c) ( d) (
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
) O número mínimo de mulheres entrevistadas para a amostra deve ser de 119. 119. ) O número mínimo de mulheres mulheres entrevistadas para para a amostra deve ser de 350. 350. ) O número mínimo de mulheres entrevistadas entrevistadas para a amostra deve deve ser de 1.164. ) O número mínimo de mulheres mulheres entrevistadas para a amostra amostra deve ser de 6.981. 6.981.
UNIDADE 1
TÓPICO 2 ARREDONDAMENTO, FRAÇÃO E PORCENTAGEM
1 INTRODUÇÃO No tópico anterior, tivemos uma noção geral de como planejar uma pesquisa através do método estatístico. De agora em diante estudaremos ferramentas para poder efetivar cada
uma das seis etapas. Iniciaremos fornecendo os subsídios matemáticos necessários para que você, acadêmico, possa compreender em plenitude os cálculos apresentados. Assim, neste
tópico, iremos rever como realizar reali zar o arredondamento, como operar com frações e como realizar os cálculos de porcentagem. porcentagem.
2 ARREDONDAMENTO DE NÚMEROS Diversas operações matemáticas resultam em números não inteiros, com várias casas decimais, ou seja, com vários dígitos após a vírgula. Quando um número desse tipo apresentar uma quantidade de casas decimais maior que a desejada, devemos realizar o arredondado do número baseado em regras especícas. Inicialmente, precisamos saber se o arredondamento arredondamento desejado é por inteiro, decimal, centésimo, milésimo etc.
! N T E R T A M P O I M
Se o arredondamento for: • Inteiro, signica que não teremos casas após a vírgula. • Decimal, signica que teremos uma única casa após a vírgula. • Centésimo, signica que teremos duas casas após a vírgula. • Milésimo, signica que teremos três casas após a vírgula.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
26
UNIDADE 1
TÓPICO 2
Para aplicar qualquer uma das regras, é necessário primeiramente denir o número de casas a ser trabalhado após a vírgula, conforme acabamos de ver. A partir daí, devemos identicar qual é o dígito remanescente e analisar os dígitos posteriores. • Dígito remanescente é o algarismo da casa decimal a
ser conservada. • Dígitos posteriores são os algarismos que irão indicar se o arredondamento é “para
cima” ou “para baixo”. Exemplo: Arredondar, para duas casas decimais, o número 7,4318976. Veja:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
O dígito remanescente indica a posição do decimal que cará no número e os dígitos posteriores serão arredondados (serão zeros). Todos esses dígitos formam a parte decimal a ser considerada. Para todo arredondamento, arredondamento, temos duas opções, uma “para cima” e outra “para baixo”, com relação à parte decimal a ser considerada. Nesse caso especíco, teríamos:
E ! A N T O R T P M I
Há duas coisas a observar:
• Somente uma das opções acima é a correta. • Os zeros à direita de um número decimal não
escritos.
Vejamos como determinar a forma correta de arredondamento.
precisam ser
UNIDADE 1
TÓPICO TÓPICO 2
27
2.1 REGRAS DE ARREDONDAMENTO Quando for necessário o arredondamento de dados, deve-se proceder de acordo com
a resolução número 886/66, da Fundação IBGE (1993), que orienta: I- Quando o primeiro algarismo a ser abandonado for 0,1, 2, 3 ou 4, ca inalterado o último algarismo a permanecer (dígito remanescente). remanescente). Exemplos:
a) 13,24 arredondado ao décimo mais próximo será 13,2. b) 38,473 arredondado ao centésimo mais próximo será 38,47. II- Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer (dígito remanescente). Exemplos:
a) 72,87 arredondado ao décimo mais próximo será 72,9. b) 3,7 arredondado ao inteiro mais próximo será 4. III- Quando o primeiro algarismo a ser abandonado for o 5 há duas situações a considerar: Ç Ã O ! A T E N
Acadêmico, tenha muita atenção nesta situação, pois a maioria dos erros cometidos na etapa de arredondamento de dados, ocorre aqui.
(i) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade no algarismo a permanecer (dígito remanescente). remanescente). Exemplos:
a) 7,352 arredondado ao centésimo mais próximo será 7,4. b) 45,6501 arredondado ao décimo mais próximo será 45,7. c) 106,250002 arredondado arredondado ao décimo mais próximo será 106,3. (ii) Se o 5 for o último algarismo ou se ao 5 só seguirem zeros, o último algarismo a ser conservado (dígito remanescente) só será aumentado de uma unidade se for ímpar. No caso de ser par, ca inalterado i nalterado o último algarismo a permanecer (dígito remanescente). remanescente).
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
28
TÓPICO 2
UNIDADE 1
Exemplos:
a) 56,75 arredondado ao décimo mais próximo será 56,8. b) 56,65 arredondado ao décimo mais próximo será 56,6. c) 56,7500 arredondado ao décimo mais próximo será 56,8. d) 56,6500 arredondado ao décimo mais próximo será 56,6.
S ! D I C A
Ao realizar cálculos em calculadoras cientícas, você pode congurar sua calculadora para que os resultados já apareçam da forma arredondada para facilitar o processo. As calculadoras mais comuns trabalham, normalmente, com 10 dígitos. Ao trabalhar com valores decimais, você congurará os resultados utilizando a tecla MODE, que normalmente se encontra na parte superior do teclado. Você deve pressionar esta tecla 3 vezes, até que no visor apareça:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Para que a máquina apresente os resultados como decimal aperte 1 para escolher “FIX”. Em seguida aparecerá “FIX 0 ~ 9?”. Neste momento, você escolhe a quantidade de casas decimais com que deseja realizar os arredondamentos. Simples assim! Por exemplo, caso você tenha escolhido Fixar em 2 casas: O valor 27,4768 irá aparecer como 27,48.
Além dos números decimais, também haverá em nossos cálculos números fracionários. fracionários. Calma, não se desespere, a seguir iremos recordar os conceitos necessários para que tenhas
segurança ao trabalhar com eles.
3 FRAÇÕES Ao se questionar questionar sobre o motivo de revisar frações e porcentagem numa disciplina de estatística, basta nos remetermos aos cálculos das amostras estudados no tópico anterior, em que foram necessárias segmentações segmentações de seus participantes. Um exemplo disso é um caso em que apenas 1/4 (um quarto), ou 25%, de uma população de interesse é acessível para uma pesquisa. Precisamos saber calcular qual é a quantidade exata dos elementos da população para depois obter a amostra.
UNIDADE 1
29
TÓPICO TÓPICO 2
Obviamente, este caso citado acima acim a é apenas um entre vários existentes em que iremos precisar de um apoio das frações e percentuais para conseguir resolver problemas com os quais podemos nos deparar.
Sendo assim, neste tópico, revisaremos as transformações entre frações e números decimais, bem como as operações possíveis com esse conjunto de números e, em seguida, veremos a aplicação disto nas porcentagens.
3.1 TRANSFORMAÇÕES TRANSFORMA ÇÕES A seguir veremos como realizar a transformação de um número fracionário em um número decimal e vice-versa.
E ! A N T O R T P M I
Vamos lembrar, lembrar, neste momento, o que uma fração representa. Fração é uma palavra que vem do latim “fractus” e signica “partido “par tido””, “quebrado “que brado””, assim, assi m, podemos pode mos dizer dize r que fração é a representação das partes iguais de um todo. Cada fração é formada por três elementos: o numerador (o número da parte de cima da fração), o traço (que serve para separar os dois valores e representa uma divisão) e, nalmente, o denominador (o número da parte de baixo). numerador denominador
O denominador representa quantas partes iguais estão contidas no todo (ou seja, em quantas partes algo foi dividido). E, o numerador representa a quantidade de partes consideradas de um todo (quantas partes do todo nós possuímos). Por exemplo: 1) 3 4
2) 9 4
+
+
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
30
TÓPICO 2
UNIDADE 1
Transformação Transformação de Número Fracionário em Número Decimal Para transformar um número fracionário em número decimal basta dividir numerador pelo denominador. Exemplos:
B I O E S T A T Í S T I C A
Esse traço sobre os dois últimos seis indicam que se trata se uma dízima periódica, isto é, que esse valor se repete innitamente.
E M E D U C A Ç Ã O F Í S I C A
Transformação Transformação de Número Decimal em Número Fracionário Para transformar números decimais em um número fracionário, nós temos três diferentes situações. Atente-se Atente-se para cada uma delas.
UNIDADE 1
31
TÓPICO TÓPICO 2
Situação 1: O número decimal é nito Inicialmente, vamos observar a leitura de cada um dos seguintes números: 0,6 (lemos, seis décimos), ou seja,
6 10
.
0,75 (lemos, setenta e cinco centésimos), ou seja,
75 100
. 438
4,38 (lemos, quatro e trinta e oito centésimos), ou seja,
100
0,129 (lemos, cento e vinte e nove milésimos), mi lésimos), ou seja,
1000
.
129
.
Verique que:
0, 6 =
6 10
Uma casa decimal – Um zero 4, 38 =
438 100
Duas casas decimais – Dois zeros
0, 75 =
75 100
Duas casas decimais – Dois zeros 0,129 =
129 1000
Três casas decimais – Três zeros
Desta forma, o número de zeros colocados colocado s no denominador é igual ao número de casas após a vírgula.
Situação 2: O número decimal é uma dízima periódica simples Inicialmente, vamos recordar que uma dízima periódica é a parte decimal innita (não tem m). A dízima periódica é dita simples quando for composta apenas de um período que se repete igualmente, por exemplo: 0,22222...; 2,5656565656... 2,5656565656... Já a dízima periódica composta é formada por algarismos que não fazem parte do período, por exemplo, 0,1555...; 2,354444... 2,354444...
B I O E S T A T Í S T I C A
Esta dízima será estudada na Situação 3.
E M
Esses números também podem ser escritos em forma de fração, mas apesar de serem números decimais na sua transformação, transformação, é preciso utilizar um processo diferente da Situação
E D U C A Ç Ã O
1. Acompanhe o raciocínio: Exemplo 1: Transformar 0,2222... em fração. Para isso, chamaremos a dízima de x:
x = 0,2222... (I)
F Í S I C A
32
UNIDADE 1
TÓPICO 2
O objetivo é eliminar as casas decimais. Para isso, andaremos com a vírgula para a direita uma casa decimal, pois apenas o 2 que repete. Isso é o mesmo que multiplicar o 0,2222... por 10. Ficando assim:
10x = 2,2222... (II) Temos duas equações (I) e (II). Iremos subtrair as duas: (II) – (I).
Como x = 0,2222.... , então 0,2222... 0,222 2... é o mesmo que
9 2
. Se dividirmos 2 : 9 chegaremos
a 0,2222... Exemplo 2: Transformar a dízima 0, 636363... em fração.
Repetindo o processo, temos: x = 0,636363... (I) B I O E S T A T Í S T I C A
An A n da n d o c o m a v í r gu l a d u as c a s as p a r a a d i r e i t a , p o i s o n ú m e r o q u e repete nas casas decimais é o 63. Andar Andar duas casas para a direita é o mesmo que multiplicar por 100.
100x = 63,636363...(II) Subtraindo as duas equações (II) e (I) encontradas: encontradas:
E M E D U C A Ç Ã O F Í S I C A
Como x = 0,636363... então 0,636363... é o mesmo que
63 99
.
Acadêmi Aca dêmico, co, note que na prá prátic ticaa a quan quantid tidade ade de números núm eros nove colocad col ocados os no denominador é igual ao número de dígitos que o período possui. Isso se aplica quando a parte inteira for nula. Quando tivermos 2, 777..., teremos que separar a parte inteira da decimal para 7 transformar, transform ar, fazendo 2 + 0,777..., o que resultará em 2 + . Essa soma será estudada adiante. adiante. 9
Situação 3: O número decimal é uma dízima periódica composta.
UNIDADE 1
33
TÓPICO TÓPICO 2
O processo é semelhante ao da Situação 2. Acompanhe o raciocínio utilizado ao transformar a dízima 2,35555... em fração.
x = 2,35555... Como o 3 não faz parte da dízima, devemos multiplicar a equação por 10 para que o
número 3 passe para o outro lado deixando nas casas decimais apenas a dízima. 10x = 23,5555... (I) Agora, Agora, multiplicamos multiplicamos a equa equação ção (I) por 10 novamente novamente para que possa possamos mos ter um período período fazendo parte do lado inteiro.
10 . 10 . x = 235,5555... 100x = 235,5555... (II) Subtraindo as equações (II) e (I), teremos:
Como x = 2,35555... então 2,35555... é o mesmo que
212 90
3.2 OPERAÇÕES Acadêmico, é imprescindível que tenhas domínio das operações relacionadas neste subtópico. Elas fazem parte do seu cotidiano, da sua jornada acadêmica e prossional, por este motivo é importante compreendê-las compreendê-las e não somente resolvê-las. Adição e Subtração de Frações
Só podemos somar ou subtrair frações que possuam o mesmo denominador. Ç Ã O ! A T E N
Atente para a denição: só podemos somar ou subtrair frações que possuam o mesmo denominador. Esta denição permite que você compreenda os artifícios utilizados adiante.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
34
TÓPICO 2
UNIDADE 1
Exemplo 1: 1 5
+
3 5
Veja a representação geométrica.
Como ambos os “todos” estão divididos em cinco partes, podemos “transportar” as quantidades, cando com 4 das 5 partes do todo.
Assim, 1 5
3 +
5
4 =
5
Exemplo 2: 3 4
B I O E S T A T Í S T I C A
F Í S I C A
2 4
Exemplo 3: 3
E M E D U C A Ç Ã O
+
4
3
−
4
2 −
4
2
1 =
4
4
UNIDADE 1
TÓPICO TÓPICO 2
35
Assim, para somar ou subtrair frações que possuem o mesmo denominador, denominador, basta manter o denominador e operar o numerador. 1
1
E se quisermos somar, 2 + 3 , como fazer? Geometricamente, Geometricamente, teremos:
Note que se “transportarmos” a quantidade 12 para o 13 , não irá caber. E, se 1 1 “transportarmos” “transportarmos” a quantidade 3 para o 2 irá sobrar espaço. Isso porque o todo está repartido em quantidades diferentes e, pela denição, somente podemos somar e subtrair frações que possuem o mesmo denominador, ou seja, que estejam repartidas em quantidades iguais. Para podermos efetuar essa operação, devemos recorrer a frações equivalentes. Frações equivalentes são frações que representam a mesma parte do todo. Por exemplo:
Veja a representação gráca: B I O E S T A T Í S T I C A E M
Acadêmico, observe que apesar do “todo” estar repartido repartido em quantidades diferentes, a parte pintada corresponde à metade da gura (todo) em todas as frações. Por isso dizemos que elas são frações equivalentes.
E D U C A Ç Ã O F Í S I C A
36
UNIDADE 1
TÓPICO 2
Quando as frações não possuem o mesmo denominador, devemos reduzi-las reduzi-l as ao menor denominador comum (ou mínimo múltiplo comum) e, em seguida somar ou subtrair as frações equivalentes às frações dadas.
Veja que agora o todo está repartido em partes iguais e assim podemos realizar a adição. 1 2
1 +
3
3 =
6
2 +
6
5 =
6
Exemplo:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Frações equivalentes às frações dadas, com o mesmo denominador. Veja o denominador da fração , que era 3 e aumentou para 15, ou seja, multiplicamos 1
3
por 5. Para encontrarmos o numerador que vai manter a equivalência precisamos realizar a
mesma operação feita no denominador (multiplicar por 5), assim, 1 x 5 = 5. 1 3
=
5 15
Frações equivalentes
O mesmo ocorre para a fração 45 , que tinha o denominador 5 e devido ao m.m.c., precisamos de uma fração equivalente com denominador 15, assim multiplicamos por 3 o
denominador 5, logo, precisamos fazer a mesma coisa no denominador, 4 x 3 =12. 4 5
=
12 15
Frações equivalentes
UNIDADE 1
TÓPICO TÓPICO 2
37
! I C A S D I C
É comum que ao ter aprendido este conceito, seu professor tenha ensinado que depois que você encontrou o m.m.c., basta dividir pelo denominador e multiplicar pelo numerador. Claro que na prática é a mesma coisa, mas cuidado para não interiorizar que você pode realizar uma operação com o denominador e outra com o numerador. numerador. Então a dica d ica é pensar que você está sempre realizando a mesma operação (multiplicação ou divisão) e que você faz para o denominador, denominador, precisa ser repetido r epetido para o numerador da fração.
Como obter o mínimo múltiplo comum (m.m.c.) de dois ou mais denominadores? denominadores? Vamos achar os múltiplos comuns de 3 e 5: Múltiplos de 3: 0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, ... Múltiplos de 5: 0, 5, 10, 15, 20, 25, 30, 35, 40, ... Múltiplos comuns de 3 e 5: 0, 15, 30, 45, 60, ... Dentre estes múltiplos, diferentes de zero, 15 é o menor deles. Chamamos o número 15 de mínimo múltiplo comum de 3 e 5.
! N T E R T A O P I M
O menor múltiplo comum de dois ou mais números, diferente de zero, é chamado de mínimo múltiplo comum desses números. Usamos a abreviação m.m.c.
Relembraremos uma técnica chamada de “decomposição simultânea em fatores primos”. Nesta técnica decompomos decompomo s ao mesmo tempo cada denominador em fatores primos. O produto
B I O E S T A T Í S T I C A
de todos os fatores primos que aparece nessa decomposição será o mínimo múltiplo comum.
E M
Número primo é um número que possui apenas 2 divisores (o número 1 e ele mesmo). São números primos: 2, 3, 5, 7, 11, 13, 17, 19, ...
E D U C A Ç Ã O
Utilizando essa técnica, observe como determinar o m.m.c. de 12, 8 e 6.
F Í S I C A
38
TÓPICO 2
UNIDADE 1
Vejamos como utilizar esse conceito para determinar as frações equivalentes e conseguir resolver a adição e subtração de frações com denominadores diferentes, vamos a mais um exemplo: 3 10
1 −
2
5 +
6
Como os denominadores são diferentes, iniciamos determinando o m.m.c.
B I O E S T A T Í S T I C A
Sabemos que o novo denominador deve ser 30 para que possamos escrever frações equivalentes, e assim obter frações de mesmo denominador para poder efetuar a adição e subtração.
E M E D U C A Ç Ã O F Í S I C A
Multiplicação de Frações Basta multiplicar numerador por numerador e denominador por denominador. denominador. Exemplos:
UNIDADE 1
TÓPICO TÓPICO 2
39
Ç Ã O ! A T E N
Você não deve tirar o M.M.C., ou seja, não é necessário que as frações tenham denominadores iguais.
Para ilustrar esse conceito de multiplicação, vamos recorrer à geometria, acompanhe o procedimento. Seja a multiplicação entre duas frações:
1 2
⋅
2 3
Iniciamos representando a primeira fração (se preferir é possível iniciar pela segunda, visto que a ordem dos fatores não altera o produto).
Em seguida, subdividimos cada uma dessas partes em partes menores em quantidades iguais ao denominador da segunda fração, que neste caso é 3.
Agora, para cada parte pintada, tomamos a quantidade de subdivisões iguais ao numerador da segunda fração, que no caso é 2.
B I O E S T A T Í S T I C A E M
Desta forma, o círculo original foi dividido em duas partes e depois cada parte subdividida em três, totalizando 6 subdivisões, destas 6, tomamos duas, ou seja: 2/6.
Assim, vericamos que:
1 2 ⋅
2 3
2 =
3
FONTE: Adaptado de: . Acesso em: 18 jun. 2016.
E D U C A Ç Ã O F Í S I C A
40
UNIDADE 1
TÓPICO 2
Divisão de Frações Mantenha a primeira fração e inverta a segunda passando passando a divisão para multiplicação. Exemplos:
Este é o processo prático, mas você sabe por que mantemos a primeira fração e invertemos a segunda passando a divisão para multiplicação? Na verdade, quando fazemos isso, estamos omitindo uma passagem. O que se pretende B I O E S T A T Í S T I C A
ao multiplicar numerador e denominador pelo inverso do denominador é obter um denominador igual a 1, para operar apenas com o numerador, numerador, facilitando o cálculo. Observe:
Vejamos também a forma geométrica da divisão entre frações, para isso, tomemos como exemplo a divisão
1 1
⋅
2 4
Iniciamos representando geometricamente geometricamente ambas as frações.
E M E D U C A Ç Ã O F Í S I C A
Observe que a fração 1 2
:
1 4
= 2.
1 4
cabe duas vezes na fração
Pelo artifício do algoritmo,
1 2
:
1
4
1 4 =
⋅
2 2
4 =
2
=
2
.
1 2
, portanto, podemos dizer que:
UNIDADE 1 O S ! T U R U F S U D O E S T
41
TÓPICO TÓPICO 2
A seguir, ampliaremos os conceitos aqui trabalhados, incluindo as porcentagens.
4 PORCENTAGENS Acadêmico Acadêmico,, tenha tenha em mente mente que para compreen compreender der o conceito conceito de porcenta porcentagem gem devemos devemos
vericá-la como sendo uma razão (representada por uma fração) cujo seu denominador é 100. Note como podemos representar, por exemplo, o valor 75%: 75% =
75 100
=
3 4
= 0, 75
Onde:
Neste estudo, você necessita entender muito bem como lidar com todos estes tipos de representação de percentuais. Por exemplo: Determine qual é o valor que representa 10% de 530.
Veja, que o processo pode ser feito da seguinte forma: 10% × 530 =
10 100
×
530 =
1 10
×
530 = 0,1 × 530
=
53
Repare, que neste cálculo, utilizamos todas as suas formas de representação, a qual podemos recair, recair, na forma mais simples, que é 0,1× 530 = 53 . A este valor 0,1, chamamos de fator de multiplicação percentual.
Em outras palavras, para conseguir resolver situações que envolvem percentuais, basta descobrir qual é o fator de multiplicação percentual que necessitamos utilizar para alcançar o resultado esperado. Segue uma lista de situações em que podemos encontrá-los: 1) Situação: 25% do valor 1240.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
42
TÓPICO 2
UNIDADE 1
Percentual: 25% Fator de multiplicação: 0,25
Resultado: 0,25 x 1240 = 310 2) Situação: Acréscimo de 20% em R$ 3200. Percentual: 100% + 20% = 120% Fator de multiplicação: 1,2
Resultado: 1,2 x 3200 = 3840 3) Situação: Desconto de 15% em R$ 1800. Percentual: 100% - 15% = 85% Fator de multiplicação: 0,85
Resultado: 0,85 x 1800 = 1530 Note que os fatores de multiplicação são o resultado dos percentuais divididos por 100. Outro ponto importante que podemos ressaltar é o fato de que os acréscimos e descontos são
sempre obtidos a partir de 100% (valor referência/todo). Agora, para ilustrar como este processo, do fator multiplicativo, é muito ecaz nos problemas envolvendo percentuais, iremos realizar realiz ar uma série de exemplos em que o utilizamos B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
como processo de resolução: Exemplos:
1) No curso de Educação Física há 900 alunos, 42% são rapazes. Calcule o número de rapazes.
Sabemos que 42% = 0,42, logo, basta realizar a multiplicação: 0,42 x 900 = 378 rapazes 2) Sobre um salário de R$ 2.380,00 são descontados 8% para o INSS. De quanto é o total de desconto? Podemos realizar este cálculo de duas formas:
I) 8% = 0,08 Logo, o desconto é de 0,08 x 2 380 = R$ 190,40. II) O desconto de 8% é dado por: 100% - 8% = 92% Como 92% = 0,92, temos: 0,92 x 2 380 = R$ 349,60. E ainda R$ 2.380 – R$ 2.189,60 = R$ 190,40. Outra situação importante é saber determinar o valor percentual a partir dos valores
UNIDADE 1
TÓPICO TÓPICO 2
43
envolvidos. Você Você com certeza já deve ter se deparado com alguma situação em que pode se encontrar o valor percentual envolvido. Por exemplo:
a) Em uma turma, do total de 50 acadêmicos, 20 são do sexo feminino. b) O dólar, que na semana passada era cotado em R$ 4,02, teve uma queda para R$ 3,82.
Repare que nos casos acima, podemos desejar conhecer qual é o percentual de funcionárias da empresa, ou qual foi a taxa de queda percentual percentual do dólar na última semana. Iremos demonstrar, a seguir, uma forma muito prática para esta determinação, em dois casos: Caso 1: Onde o valor é parte do todo.
Para este caso, basta dividir o valor conhecido pelo valor total, onde no caso (a):
Obviamente, se a questão fosse a quantidade de funcionários do sexo masculino, teríamos como resultado 100% - 40% = 60%. Caso 2: Onde conhecemos o valor inicial e nal de um processo. Note que em (b) conhecemos o valor inicial e nal do dólar, naquela naquela semana. Nestes casos, utilizaremos a seguinte fórmula:
Veja que para (b), temos:
Que representa em uma queda de 4,975%. Onde, se o valor fosse (+), teríamos uma alta! Para nalizar, vejamos mais alguns exemplos: 1) Numa turma de 30 acadêmicos faltaram 12 devido às fortes chuvas dos últimos dias. Qual a taxa de acadêmicos presentes?
Sabemos que se faltaram 12 acadêmicos, é porque os outros 18 estavam presentes. Logo:
2) Uma medicação custa R$ 40,00 e é vendida por R$ 52,00. Qual é a taxa de lucro?
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
44
TÓPICO 2
UNIDADE 1
Conhecemos o valor inicial e nal da medicação. Logo:
3) Comprei um par de óculos de sol por R$ 250,00 e vendi por R$ 200,00. De quanto por cento foi o prejuízo? Conhecemos o valor inicial e nal dos óculos. Logo:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 1
TÓPICO TÓPICO 2
45
RESUMO DO TÓPICO 2
Neste tópico, vimos: vimos: Quando for necessário o arredondamento de dados, deve-se proceder de acordo com
a resolução número 886/66, da Fundação IBGE (1993), que orienta: I- Quando o primeiro algarismo a ser abandonado for 0, 1, 2,3 ou 4, ca inalterado o último algarismo a permanecer (dígito remanescente). remanescente). II- Quando o primeiro algarismo a ser abandonado for 6, 7,8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer (dígito remanescente). III- Quando o primeiro algarismo a ser abandonado for o 5, há duas situações a considerar: – Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma
unidade no algarismo a permanecer (dígito remanescente). remanescente). – Se o 5 for o último algarismo algarismo ou se ao 5 só seguirem seguirem zeros, o último algarismo algarismo a ser conservado (dígito remanescente) remanescente) só será aumentado de uma unidade se for ímpar. No caso de ser par, ca inalterado o último algarismo a permanecer (dígito remanescente). remanescente). A transformação de um número fracionário em um número decimal e vice-versa. Na transformação de decimal para fracionário existem três situações, que atento! As quatro operações operações básicas da matemática envolvendo frações. frações. Vale Vale lembrar: Só podemos somar ou subtrair frações que possuam o mesmo denominador. Para isso, basta manter o denominador e somar ou subtrair o numerador. Quando os denominadores forem diferentes, precisamos buscar frações equivalentes. o Para multiplicar frações, basta multiplicar numerador por numerador e denominador o
por denominador. o
Para dividir frações, mantenha a primeira fração e inverta a segunda passando a
divisão para multiplicação.
Por m, o conceito de porcentagem, onde devemos sempre vericá-la vericá-l a como sendo uma razão (representada por uma fração) cujo denominador é 100.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
46
TÓPICO 2
E D A D T I V I A O A U T
UNIDADE 1
Prezado acadêmico, chegou a hora de você testar seus conhecimentos sobre os conteúdos de arredondamento, frações e porcentagens. Lápis e borracha em mãos e boa atividade! 1 Em uma pesquisa sobre o tempo, em minutos, gasto por acadêmicos para resolver um teste psicológico observou-se os dados listados abaixo. Para padronizar a quantidade de casas após a vírgula dos resultados, faça o arredondamento de cada um dos números abaixo para o décimo mais próximo: • 23,40
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
= • 234,7832 = • 45,09 = • 48,85002 = • 120,4500 = A resposta resposta que apresenta apresenta os arredondamen arredondamentos tos de forma correta é:
a) ( b) ( c) ( d) (
) 23,4 – 234,8 – 45,1 – 48,9 – 120,4 ) 23,4 – 234,8 – 45,0 – 48,9 – 120,5 ) 23,4 – 234,8 – 45,1 – 48,8 – 120,5 ) 23,4 – 234,8 – 45,1 – 48,8 – 120,4
2 Um prossional de Educação Física tem uma jornada semanal de trabalho de 30 horas. Devido ao acúmulo de atendimento personalizado na semana passada, ele precisou fazer 12 horas extras. A fração que corresponde a quanto ele trabalhou a mais do que o previsto é:
a) ( b) ( c) ( d) (
) 1/4. ) 1/5. ) 2/5. ) 2/3.
3 Uma academia realizou compras de novas máquinas para uma de suas liais no valor de R$ 35.000,00, efetuando pagamento à vista e recebendo por isso um desconto de 7% no valor da nota scal. Qual o valor do desconto que recebeu esta empresa?
UNIDADE 1
a) ( b) ( c) ( d) (
TÓPICO TÓPICO 2
47
) R$ 2.450,00 ) R$ 3.150,00 ) R$ 3.169,00 ) R$ 4.150,00
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
48
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
TÓPICO 2
UNIDADE 1
UNIDADE 1
TÓPICO 3 AGRUPAMENTO DE DADOS
1 INTRODUÇÃO Uma das fases do método estatístico refere-se ao agrupamento de dados, que trata
de como organizar os dados de uma certa pesquisa e como realizar algumas considerações a partir desta organização. A organização organização dos dados é uma das formas mais primitivas de se ter um resultado com relação a uma pesquisa.
Todo fenômeno apresenta diversas variações que devem ser analisadas sob diversos aspectos, de modo que possamos compreendê-lo e agir sobre ele. Desta forma, antes de tratarmos das formas de agrupamento de dados, este tópico também apresentará os tipos de variáveis com as quais nos deparamos ao estudar qualquer fenômeno e qual o melhor tratamento a ser dado.
2 VARIÁVEIS ESTATÍSTICAS Variável estatística é o conjunto de resultados possíveis de um fenômeno quando são feitas sucessivas medidas. São as características que podem ser observadas (ou medidas) em cada elemento da população. Por exemplo, um estudo de análise biomecânica do movimento humano durante a realização de lançamento de dardos será realizado por um pesquisador,
e o problema básico que se coloca nesta pesquisa é denir quais variáveis irão participar do estudo. Nesse caso, podemos denir as variáveis como: idade, i dade, altura, peso, cor dos cabelos, renda familiar, sexo etc. Notem a importância de denir bem as variáveis, pois é claro que a “cor do cabelo” não tem importância para a pesquisa em questão. Na maior parte das vezes, a escolha do método de análise ou descrição dos dados
depende do tipo de variável (dados) considerada. Alguns conjuntos de dados (como alturas,
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
50
TÓPICO 3
UNIDADE 1
pesos) consistem em números, enquanto outros são não numéricos numéri cos (como sexo, cor do cabelo). Para distinguir esses dois tipos de dados aplicam-se, respectivamente, as expressões dados quantitativos e dados qualitativos. Vamos entender melhor estes dois conceitos.
2.1 VARIÁVEIS QUALITATIVAS Como o próprio nome sugere, estes dados representam objetos de estudo em que a informação se refere a alguma qualidade, categoria, não se associando a números, mas, sim, à classicação, por exemplo, o sexo de um indivíduo, que pode ser classicado como masculino ou feminino.
Os dados qualitativos ainda podem ser subdivididos em: Nominais: As opções de caracterização do objeto de estudo não possuem ordem B I O E S T A T Í S T I C A E M
denida para que possam ser entendidas. Exemplo: Sexo (masculino, feminino), raça, cor de pele (parda, branca, negra), evolução (morte ou sobrevivência), cor dos olhos (castanho, azul, verde) etc. Ordinais: As opções de caracterização do objeto de estudo necessitam de uma ordem
para classicação. Exemplo: Escolaridade (analfabeto, educação infantil, ensino fundamental, ensino médio, universitário); classicação em um campeonato (1 o lugar, 2 o lugar, 3 o lugar); desempenho em uma prova (baixo, moderado e alto) etc.
2.2 VARIÁVEIS QUANTITATIVAS As variáveis variáveis quantitativas representam características que são identicadas através de valores numéricos, ou seja, são aqueles que resultam de uma contagem ou de uma mensuração m ensuração
E D U C A Ç Ã O
subdivididos em:
F Í S I C A
constituem um conjunto enumerável de valores, ou seja, é uma variável que só pode assumir valores pertencentes ao conjunto dos números naturais (resultado de uma contagem). Exemplo: O número de lhos (0,1,2,3...); o número de alunos na turma (1,2,3...); o número de alunos de uma escola (500, 800, 110...); produção de peças; faltas dos funcionários; livros de uma biblioteca etc.
e podem nos revelar qual é a intensidade da situação. Os dados quantitativos podem ser
Discretos: Discretos: As variáveis quantitativas discretas são aquelas resultantes de contagens e
UNIDADE 1
TÓPICO TÓPICO 3
51
Contínuos: Contínuos : As variáveis quantitativas contínuas resultam de uma mensuração e podem
assumir qualquer valor (inteiro, fração etc.). Exemplo: o tempo; a temperatura; a estatura ou a massa de um indivíduo etc.
Na ilustração a seguir, apresentamos apresentamos um resumo sobre os tipos de variáveis: FIGURA 6 - TIPOS DE VARIÁVEIS
FONTE: A autora
Acadêmico, observe ainda que uma mesma população pode originar vários tipos de dados.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
52
UNIDADE 1
TÓPICO 3
QUADRO 1 - COMPARAÇÕES ENTRE OS TIPOS DE VARIÁVEIS População
Variável
Variável
Variável
Variável
quantitativa
quantitativa
qualitativa
qualitativa
contínua
discreta
nominal
ordinal grau de
Estudantes
idade, peso, alturas.
número de irmão, número de faltas.
sexo, cor da pele,
escolaridade,
descendência.
desempenho escolar.
velocidade, Automóveis
massa, aceleração.
número de defeitos, ano de fabricação, cores, marca,
grau de
unidades
de satisfação do
modelo.
fabricadas.
luxuosidade, luxuosidade, grau cliente. qualidade
Eletrodomésticos
preço (R$), peso, potência.
número de ofertas, quantidades vendidas,
cor, caro ou
barato, marca.
do produto,
classicação no selo de economia procel.
FONTE: A autora B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Agora que já estudamos estudamos a estrutura estrutura do método método de pesquisa estatístico estatístico e conhecemos conhecemos os tipos de variáveis possíveis chegou o momento de aprender a organizar esses dados de tal forma que facilite sua leitura e descrição.
3 AGRUPAMENTO AGRUPAMENTO DE DADOS DADO S Caro acadêmico, você já deve ter observado que existem formas diferentes de apresentar os dados de uma pesquisa. Em alguns momentos, os dados podem aparecer como uma simples
“lista”, ou estarem em uma tabela que apresenta ou não uma distribuição de frequência. A seguir, apresentaremos cada uma das possíveis formas de se apresentar os dados coletados em uma pesquisa.
Ç Ã O ! N E T A
Fique atento à nomenclatura de cada forma de apresentar os dados, isto é, aprenda a relacionar o nome da organização dos dados com sua forma visual. Isto é fundamental para que acompanhes a próxima unidade deste material, visto que iremos realizar inferências (cálculos) nestes dados e para cada forma de apresentação, o cálculo a ser realizado é diferente.
UNIDADE 1
53
TÓPICO TÓPICO 3
3.1 DADOS BRUTOS Já vimos que toda pesquisa envolve coleta de dados, seja na forma quantitativa ou qualitativa, que devem ser organizadas, analisadas, criando conclusões sobre uma determinada pesquisa. Quando estes dados são coletados sem que haja qualquer tipo de organização, dizemos que os dados se apresentam na forma bruta. A forma bruta de dados é o primeiro contato que um pesquisador se depara após a união de todos os dados registrados. É em cima destes dados que serão feitas possíveis
conclusões e vericações. Exemplo: Ao realizar uma pesquisa em julho de 2016, com uma turma t urma de 50 acadêmicos do Curso de Educação Física da Faculdade X, sobre o tempo (em segundos) que levaram para cumprir uma prova de resistência. Os dados a seguir demonstram o resultado bruto obtido: 61
65
43
53
55
51
58
55
59
56
52
53
62
49
68
51
50
67
62
64
53
56
48
50
61
44
64
53
54
55
48
54
57
41
54
71
57
53
46
48
55
46
57
54
48
63
49
55
52
51
Como podemos notar, fazer qualquer tipo de observação em dados apresentados desta forma é algo demorado e cansativo. Por isso, é importante que os dados apresentados
em uma pesquisa sejam organizados, pois existem análises estatísticas que só poderão ser realizadas se os dados estiverem realmente organizados, dando uma clareza visual para os
resultados obtidos.
B I O E S T A T Í S T I C A E M
3.2 ROL A organização organização de dados dados em ROL é a simples tarefa de colocar os dados dados quantitativos quantitativos
em ordem crescente ou decrescente, podendo ser por meio de uma tabela ou simplesmente si mplesmente um ao lado do outro. Esta simples forma de ordenação dos dados já aumenta a capacidade de informação do comportamento dos dados. Exemplo: Utilizando os dados anteriores e ordenando-os ordenando-os em ROL, temos:
E D U C A Ç Ã O F Í S I C A
54
UNIDADE 1
TÓPICO 3
41
43
44
46
46
48
48
48
48
49
49
50
50
51
51
51
52
52
53
53
53
53
53
54
54
54
54
55
55
55
55
55
56
56
57
57
57
58
59
61
61
62
62
63
64
64
65
67
68
71
Ç Ã O ! A T E N
Para organizar os dados em uma planilha eletrônica, deve-se digitar os dados apenas em uma coluna. Selecionar os dados e clicar em DADOS – CLASSIFICAR – CRESCENTE – OK. Ou, simplesmente no ícone crescente que aparece na Barra de Menus.
Note que, neste exemplo, os dados foram alinhados de forma crescente. Poderiam
também estar na forma decrescente, mas foram organizados um ao lado do outro. No entanto, poderíamos tê-los apresentados um embaixo do outro, criando colunas de organização. B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Quando a quantidade de dados coletados coletado s não for muito grande, a organização organizaç ão em ROL
é bastante útil. Por outro lado, para dados em quantidades grandes, esta forma de organizar pode ser compreendida como inecaz, pois analisar um grande número de dados em ordem numa tabela acaba confundindo em muitos casos a veracidade dos dados apresentados. apresentados. S ! U R O F U T S O U D E S T
Veremos nos próximos itens como proceder com este volume de dados, através de agrupamentos simples ou por agrupamentos por faixa de valor. valor. Estes agrupamentos também també m são conhecidos como distribuição de frequência.
3.3 AGRUPAMENTO SIMPLES OU DISTRIBUIÇÃO DISTRIBUIÇÃ O DE FREQUÊNCIA FREQ UÊNCIA SEM INTERVALOS DE CLASSE A distribuição de frequência sem intervalos de classe ou agrupamento agrupamento simples consiste em juntar os dados que possuem valores iguais e transformar este aglomero de dados em uma tabela organizada por colunas (mais comum) ou linhas. Este agrupamento deve ser realizado após os dados estarem organizados em ROL, pois facilita a contagem.
UNIDADE 1
55
TÓPICO TÓPICO 3
Exemplo: Para colocar os dados do exemplo trabalhado anteriormente em uma distribuição de frequência sem intervalo de classes, é necessário registrar a quantidade de vezes que determinado tempo apareceu. Por exemplo, o tempo 41s apareceu uma vez, o tempo
43s apareceu também uma vez, o tempo 44s apareceu uma vez, o tempo 46s apareceu duas vezes e assim por diante. Após realizar este registro, colocamos estas informações em uma tabela, conforme mostramos a seguir: TABELA 4 - TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA FACULDADE X LEVARAM PARA CUMPRIR A PROVA DE RESISTÊNCIA - JULHO - 2016
Tempo empo (em (em seg segun undo dos) s)
Núme Número ro de acad acadêm êmic icos os
41
1
43
1
44
1
46
2
48
4
49
2
50
2
51
3
52
2
53
5
54
4
55
5
56
2
57
3
58
1
59
1
61
2
62
2
63
1
64
2
65
1
67
1
68
1
71
1
Total
50
FONTE: A autora
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
56
TÓPICO 3
UNIDADE 1
Acadêmico, perceba perceba como os 50 dados dados anteriores, anteriores, listados um a um, foram reduzidos reduzidos e organizados de forma que nenhum dado foi perdido ou ocultado.
Ç Ã O ! A T E N
Observe que usamos a mesma relação de dados que estamos usando desde o início deste tópico. Iniciamos com os dados brutos, zemos o ROL e agora a distribuição de frequência sem intervalo de classes.
Podemos resumir que a distribuição de frequência sem intervalos de classe é a simples condensação dos dados conforme as repetições de seus valores. Porém, note que para esta situação razoável, esta distribuição de frequência é inconveniente, já que exige muito espaço. Assim, podemos realizar realizar um agrupamento agrupamento com intervalos intervalos de classes.
3.4 AGRUPAMENTO POR FAIXA DE VALOR OU DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Há casos em que a quantidade de dados diferentes, apresentados em uma pesquisa,
é grande. Não havendo com isso, a possibilidade de agrupar muitos valores, deixando assim a tabela extensa em quantidade de linhas, o que diculta a visualização das informações. Os agrupamentos em classes são intervalos de valores que podem representar um
grupo de valores em uma única linha, com a proposta de diminuir a quantidade de linhas de uma tabela. Para tal, devemos realizar algumas observações e seguir alguns passos, os quais veremos agora.
Método prático para a construção de uma distribuição de frequência com intervalos de classe: 1º Passo - Organize os dados brutos em um ROL. 2º Passo - Calcule a amplitude total da amostra (AA). Amplitude total da amostra: é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = X max - Xmin. 3º Passo - Calcule o número de classes através da “Regra de Sturges”.
UNIDADE 1
57
TÓPICO TÓPICO 3
Classe: são os intervalos de variação dos dados. É simbolizada por i e o número total de classes simbolizada por k. Regra de Sturges : i = 1 + 3,3.log n
Onde: i = o número de classes da distribuição de frequência. Log n = logaritmo do número de elementos envolvidos.
! N T E R T A I M P O
Acadêmico, você precisará de uma calculadora cientíca para determinar o logaritmo de um número. Na calculadora, devese primeiro descobrir o log n, depois multiplicar por 3,3 e, por último, somar 1.
Caro acadêmico, é importante que você tenha em mente que qualquer regra para
determinação do número de classes da tabela não nos leva a uma decisão nal. O número de classes vai depender de um julgamento pessoal, que deve estar ligado à natureza dos dados, como, por exemplo, quando se está trabalhando com notas de alunos (de zero a dez), a regra perde o seu verdadeiro objetivo, mesmo porque normalmente trabalha-se com amostras superiores a 100 elementos. Neste caso, aplicando a regra de Sturges para uma amostra de 1200 elementos encontrar-se-ia 11 11 classes, o que se torna inviável. i nviável. 4º Passo - Decidido o número de classes, calcule então a amplitude do intervalo de
classe (h). A amplitude amplitude do intervalo intervalo de classe é sempre o número número arredonda arredondado do para cima, resultante resultante da divisão entre a amplitude total da amostra (AA) e o número de classes (i) encontrada no cálculo da Regra de Sturges.
B I O E S T A T Í S T I C A E M
Ç Ã O ! A T E N
AA
O símbolo > signica maior que, ou seja, a desigualdade h i . Signica que h é maior que a razão entre AA (amplitude total da amostra) e i (número de classes). >
E D U C A Ç Ã O F Í S I C A
58
UNIDADE 1
TÓPICO 3
5º Passo: Montar a tabela com as classes. Colocamos inicialmente o menor valor da amostra na parte inferior da primeira classe e na parte superior ela aumentada pela amplitude da classe seguimos este raciocínio para as demais classes. 6º Passo: Contar as aparições. Finalizaremos Finalizarem os a tabela com a distribuição da frequência
absoluta para cada classe. Basta contar o número de aparições em cada intervalo, não se esquecendo que o intervalo à direita é aberto, ou seja, os valores que apresentarem este dado devem pertencer à próxima classe.
Exemplo: Vamos seguir estes passos para a construção de uma tabela de distribuição de frequência de classes com os dados já usados anteriormente. 1º Passo - Organize os dados brutos em um ROL. Já temos essa etapa pronta:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
41
43
44
46
46
48
48
48
48
49
49
50
50
51
51
51
52
52
53
53
53
53
53
54
54
54
54
55
55
55
55
55
56
56
57
57
57
58
59
61
61
62
62
63
64
64
65
67
68
71
2º Passo - Calcule a amplitude total da amostra (AA).
Vamos lembrar que a amplitude total da amostra é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). AA = Xmax - Xmin. Para este exemplo, o valor máximo é 71 e o valor mínimo é 41. Logo:
AA = 71 71 – 41 AA = 30w 30w Registre isso! Amplitude total é 30! 3º Passo - Calcule o número de classes através da "Regra de Sturges". Regra de Sturges : i = 1 + 3,3.log n
Para o nosso exemplo, i é o número de classes da distribuição de frequência que queremos descobrir e n é o número de dados da nossa amostra, ou seja, n = 50. Portanto: i = 1 + 3,3 ∙ log 50
UNIDADE 1
TÓPICO TÓPICO 3
59
Em uma calculadora cientíca, você consegue determinar que log 50 = 1,6990 (valor arredondado). i = 1 + 3,3 ∙ 1,6990 Lembre-se que em uma expressão i = 1 + 5,6067 numérica devemos resolver primeiramente i = 6,6067 a multiplicação e depois a adição. Registre mais esta informação! 4º Passo - Decidido o número de classes, calcule então a amplitude do intervalo de
classe (h). h
AA >
i
Substituindo os valores já determinados determinados nesta fórmula, temos: h h
>
30 6,6067
> 4,5408
h = 5s
! N T E R T A O P M I M
A amplitude do intervalo deve ser arredondado (sempre para cima), levando-se em consideração o número de casas após a vírgula dos dados brutos.
5º Passo - Montar a tabela com as classes. Colocamos inicialmente o menor valor da amostra na parte inferior da primeira classe e na parte superior ela aumentada pela amplitude
da classe e seguir este raciocínio para as demais classes. Observe o exemplo: TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA FACULDADE X, LEVARAM PARA CUMPRIR A PROVA DE RESISTÊNCIA - JULHO DE 2016
Tempo (em segundos) 41 ├ 46 46 ├ 51 51 ├ 56 56 ├ 61 61├ 66 66 ├ 71 71 ├ 76 Total FONTE: Dados ctícios
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
60
UNIDADE 1
TÓPICO 3
Acadêmico, preste atenção nas nas observações a seguir: • Este símbolo ├ indica um intervalo, note que ele é
fechado à esquerda, ou seja, inclui
o número e aberto à direita, ou seja, exclui o número. • O intervalo representado por 41 ├ 46 compreende os tempos de 41 segundos até antes de chegar aos 46 segundos, ou seja, quem fez 46 segundos não irá contar neste intervalo i ntervalo e sim no próximo. • Na terceira linha, onde temos o intervalo i ntervalo 51 ├ 56, há
19 acadêmicos que realizaram
a prova em 51, 52, 53 e 54 segundos. •
Se todos os dados fossem contemplados até o intervalo 66 ├ 71, não haveria
necessidade de ter mais uma classe. 6º Passo - Contar as aparições. Finalizaremos a tabela com a distribuição da frequência
absoluta para cada classe. Basta contar o número de aparições em cada intervalo, não se esquecendo que o intervalo à direita é aberto, ou seja, os valores que apresentarem este valor devem pertencer à próxima classe. TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA FACULDADE X, LEVARAM PARA CUMPRIR A PROVA DE RESISTÊNCIA - JULHO DE 2016 B I O E S T A T Í S T I C A E M
Tempo empo (em (em segu segund ndos os)) 41 ├ 46 46 ├ 51 51 ├ 56 56 ├ 61 61├ 66 66 ├ 71 71 ├ 76
Núme Número ro de acad acadêm êmic icos os
Total
50
3 10 19 7 8 2 1
FONTE: Dados ctícios
E assim, nalizamos o agrupamento de dados em uma distribuição de frequência com
E D U C A Ç Ã O
intervalos de classe.
F Í S I C A
5 segundos por classe. Exemplo: 46 – 5 = 41.
Desta tabela, ainda podemos destacar alguns termos: Amplitude de cada classe: classe: note que cada classe segue um padrão de valor acrescentado para cada linha. No caso do nosso exemplo, podemos ver que a amplitude é de •
• Amplitude da tabela: tabela: refere-se à diferença entre o menor e o maior valor apresentado
nas classes que estão dispostas no primeiro valor da primeira prim eira classe e no último valor da sétima classe. Exemplo: 76 – 41 = 35, ou seja, a amplitude da tabela é de 35 segundos.
UNIDADE 1
61
TÓPICO TÓPICO 3
Limites de cada classe: classe: o limite de cada classe se refere aos extremos inferior e superior de cada linha. Para a classe 41 46, o limite inferior (Li) é 41 e o limite superior (Ls) •
é 46. O símbolo indica que à esquerda o intervalo interval o é fechado e à esquerda é aberto. Isso signica que o valor de 46 não pertence a essa classe e sim à segunda classe 46 51. Ponto médio da classe: classe : é o ponto que divide o intervalo de classe em duas partes , ou seja, xi= L + L . iguais. No exemplo anterior, em 41 ├ 46 o ponto médio x i = i
s
2
Acadêm Aca dêmico ico,, estes est es termos ter mos serão ser ão muito mui to utili uti lizad zados os na próxim pró xima a unidad uni dade, e, na qual qua l
desenvolveremos desenvolveremos cálculos a partir das organizações de dados que aprendemos aqui.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
62
TÓPICO 3
UNIDADE 1
RESUMO DO TÓPICO 3
Neste tópico, vimos que: que: Acadêmic Acad êmico, o, neste nest e tópico tópic o você estudou estu dou que as variávei vari áveiss estatísti estat ísticas cas podem ser
classicadas em qualitativas e quantitativas. As qualitativas ainda podem ser nominais ou ordinais e as quantitativas podem ser discretas ou contínuas.
Estudou ainda, que podemos organizar os dados brutos de três formas: ROL: é a ordenação dos dados de forma crescente ou decrescente. - ROL: classe: trata-se do agrupamento simples dos - Distribuição de frequência sem intervalo de classe:
dados que possuem valores iguais, transformando este aglomero de dados em uma tabela organizada por colunas (mais comum) ou linhas. - Distribuição de frequência com intervalo de classe: classe : trata-se do agrupamento em classes, B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
em que os intervalos de valores possibilitam representar um grupo de valores em uma única linha, com a proposta de diminuir a quantidade de linhas de uma tabela. Para realizar esse tipo de agrupamento, deve-se seguir os passos a seguir: 1º Passo - organize os dados brutos em um ROL. 2º Passo - calcule a amplitude total da amostra (AA).
Em que AA = X max - Xmin. 3º Passo - calcule o número de classes através da “Regra de Sturges”. Regra de Sturges: i = 1 + 3,3.log n
Em que: i = o número de classes da distribuição de frequência; Log n = logaritmo do número de elementos envolvidos. 4º Passo - decidido o número de classes, calcule, então, a amplitude do intervalo de classe (h).
5º Passo - elabore a tabela com as classes. Colocamos inicialmente o menor valor da amostra na parte inferior da primeira primeir a classe e na parte superior ela aumentada pela ampli tude da classe, seguindo este raciocínio para as demais classes. 6º Passo Passo - conte as aparições.
UNIDADE 1
63
TÓPICO TÓPICO 3
E D A D T I V I A O A U T
1 Nas aulas de Bioestatística em Educação Física estudamos que em uma pesquisa estatística temos dois grupos de dados: os dados quantitativos e os dados qualitativos. Responda qual das alternativas a seguir representa um dado qualitativo:
a) ( b) ( c) ( d) (
) O volume em mililitros dos xampus produzidos produzidos pela Empresa A. ) O comprimento em centímetros centímetros de placas de aço produzidas produzidas por uma máquina. máquina. ) A altura em centímetros centímetros dos alunos de uma academia. academia. ) Grupo sanguíneo sanguíneo disponíveis no banco banco de sangue do hospital hospital “Doação”.
2 Nas aulas de Bioestatística em Educação Física estudamos que em uma pesquisa estatística, temos dois grupos de dados: os dados quantitativos e os dados qualitativos. Responda qual das alternativas a seguir representa um dado quantitativo:
a) ( b) ( c) ( d) (
) O volume, em mililitros de sucos fabricados fabricados pela empresa A. ) Qualidade das das peças fabricadas fabricadas pela máquina máquina B. ) Sexo (feminino ou masculino) masculino) dos nascituros da maternidade maternidade X. ) Cor dos cabelos cabelos das modelos da agência Belle. Belle.
3 Uma das formas mais simples de organizar dados brutos é ordená-los em Rol. Com relação a essa classicação, qual das alternativas a seguir apresenta uma organização em Rol.
a) ( b) ( c) ( d) (
) 3, 5, 12, 22, 18, 27, 33 ) 81, 67, 63, 57, 34, 21, 12 ) 9, 7, 3, 1, -5, -5, -3, -1 ) - 1, 2, - 4, 5, 7, 9,12
B I O E S T A T Í S T I C A E M
4 Os dados a seguir apresentam o número de acertos de arremessos, realizados real izados por 20 estudantes, durante um treino de basquetebol, sendo que cada estudante teve direito a 6 arremessos. Observe os dados e responda qual das alternativas alternati vas apresenta a quantidade de linhas de dados que uma tabela com agrupamento simples de dados deve conter: 3
5
4
1
6
6
5
1
3
4
4
6
1
1
3
4
5
6
4
4
E D U C A Ç Ã O F Í S I C A
64
a) ( b) ( c) ( d) (
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
TÓPICO 3
)4 )5 )6 )7
UNIDADE 1
UNIDADE 1
TÓPICO TÓPICO 3
65
A Ç Ã O I A A V A L
Prezado acadêmico, agora que chegamos ao final da Unidade 1, você deverá fazer a Avaliação referente a esta unidade.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
66
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
TÓPICO 3
UNIDADE 1
UNIDADE 2
MEDIDAS DE POSIÇÃO
OBJETIVOS DE APRENDIZAGEM A partir desta unidade, você será capaz de:
descrever e interpretar informações informaç ões do campo da Educação Física sob o aspecto estatístico; compreender os procedimentos técnicos e de cálculos essenciais
ao trabalho estatístico quanto aos dados biológicos;
utilizar a linguagem bioestatística como instrumento de apoio na execução de atividades do cotidiano; analisar, descrever, organizar e interpretar informações sobre o aspecto bioestatístico para a tomada de decisões; criar tabelas e grácos que auxiliem na tomada de decisões, partindo de uma situação problema da Educação Física.
PLANO DE ESTUDOS Esta unidade está dividida em três tópicos e em cada um deles você encontrará atividades visando à compreensão dos conteúdos apresentados.
TÓPICO 1 - MEDIDAS DE TENDÊNCIA CENTRAL TÓPICO 2 - MEDIDAS DE DISPERSÃO TÓPICO 3 - SÉRIES E GRÁFICOS ESTAT ESTATÍSTICOS ÍSTICOS
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 2
TÓPICO 1 MEDIDAS DE TENDÊNCIA CENTRAL
1 INTRODUÇÃO Na unidade anterior vimos que o estudo de distribuição distribuiç ão de frequência permite descrever os grupos dos valores dos dados de uma pesquisa. Desta forma, podem ser localizados onde
ocorrem em maior concentração de valores, ou seja, se a concentração se localiza no início, no meio ou no nal da distribuição, ou ainda, se há uma distribuição normal. Para ressaltar as tendências características característi cas de cada distribuição é necessário introduzir conceitos que se expressem através de números, que permitam traduzir estas tendências. Estes conceitos são denominados elementos típicos das medidas de posição, assunto desta unidade. As medidas de posição representam uma série séri e de dados, orientando quanto à posição
da distribuição com relação ao centro. Dentre as várias medidas de posição, descreveremos neste tópico as Medidas de Tendência Central.
As Medidas de Tendência Tendência Central são números que indicam o valor médio de uma distribuição de frequência procurando reduzir todos os valores num só, e de preferência, tomam como mais representativo aquele que esteja no centro da distribuição. São três as medidas de posição: • Média: medida de uniformização • Mediana: medida de posição • Moda: medida de
concentração
Acadêmico, é importante você notar que cada grupo de dados está devidamente
estabelecido na dependência do que está sendo vericado e que, desta forma, há três maneiras manei ras diferentes de calcular essas medidas, que dependem de como os dados se encontram: dados
não estão agrupados, dados agrupados em distribuição de frequência sem intervalo de classe e dados agrupados em distribuição de frequência com intervalo de classe.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
70
TÓPICO 1
UNIDADE 2
2 MÉDIA ARITMÉTICA É o elemento representativo da série mais usado, procura uniformizar os dados em
torno de um valor médio, por isto é também chamado de medida de uniformização. Há várias situações em que a média aritmética deve ser utilizada, dando como resultado um único valor que represente represente um “ajuste” “ajuste” de todos todos os outros outros valores. Operacionalmente, Operacionalmente, a média ( ) é o quociente entre a soma de todos os valores (Σ) pelo número total dos dados (n).
U N I A letra grega Σ (sigma) é usada na matemática, como símbolo de um somatório.
B I O E S T A T Í S T I C A
2.1 MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS Essa média é calculada a partir da soma de todos os valores, dividindo-os pela quantidade de valores que foram somados. Podemos representar matematicamente matematicamente a média aritmética pela seguinte expressão:
Onde:
E M E D U C A Ç Ã O F Í S I C A
Vejamos exemplos que demonstram em quais situações a média aritmética pode ser utilizada. Exemplo 1: O café é uma das bebidas favoritas da população brasileira e pesquisas
sobre seus benefícios e malefícios malefí cios não param de surgir. Um treinador de futebol quer analisar a relação entre o consumo de café e a energia concentrada nos treinos de seus jogadores. Para isso, foram anotados o consumo de café de quatro dos seus jogadores. O primeiro consumiu
UNIDADE 2
TÓPICO 1
71
em um dia 8 xícaras de café, o segundo 7, o terceiro 4 e o quarto 5 xícaras. Qual a média de
café consumido por esses jogadores? FIGURA 7 - CAFÉ
FONTE: Disponível em: . Acesso em: 15 ago. 2016.
Resposta:
Os valores registrados pelo consumo de café nestes jogadores foram: 8, 7, 4 e 5. Com isso, a média é representada por:
Exemplo 2: Um professor de Educação Física vericou que as notas da prova teórica
B I O E S T A T Í S T I C A
sobre atletismo dos seis meninos da turma foram: 8,5; 5,0; 9,0; 3,5; 7,5 e 8,5. Com o intuito de vericar como foi o desempenho desempenho geral destes meninos, o professor decidiu encontrar a média
E M
O que implica que cada um dos quatro jogadores poderia tomar seis cafés que o consumo seria o mesmo. Dizemos então que a média de consumo diário é de seis cafés por
jogador, jogador, mesmo observando observando que nenhum dos quatro jogadores jogadores analisados analisados tomou esta quantia.
aritmética. Qual valor encontrou? Resposta: Somando os valores das notas e dividindo pelas seis notas somadas:
E D U C A Ç Ã O
A média média aritmética destas destas notas é 7. 7.
F Í S I C A
72
TÓPICO 1
UNIDADE 2
Exemplo 3: Na 3: Na Universidade em que Maria estuda, os professores utilizam a média
aritmética para calcular a média nal obtida pelas notas parciais. A média mínima para que o aluno seja aprovado é 7,0. Maria já tirou as seguintes notas na disciplina de Bioestatística em Educação Física: 7,0; 4,5 e 8,0. Como a professora desta disciplina deseja fazer mais uma prova, qual deverá ser a nota mínima que Maria pode tirar para permanecer na média para não reprovar? Resposta: Como sabemos que a média mínima exigida pela escola é 7, podemos desenvolver a questão da seguinte forma, adotando com x a nota ainda a ser feita:
Concluímos que a nota mínima que Maria pode tirar é 8,5 para que sua média que dentro das expectativas da Universidade. A seguir, seguir, trataremos do cálculo da média aritmética em dados agrupados em uma B I O E S T A T Í S T I C A
distribuição de frequência sem intervalo de classe.
2.2 MÉDIA ARITMÉTICA PARA PARA DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSE Para determinar a média aritmética em dados agrupados em uma distribuição de frequência sem intervalo de classe, multiplicamos a variável (dados) pela frequência (f i), depois somamos todos os produtos e dividimos o resultado pela quantidade de dados, simbolicamente:
E M E D U C A Ç Ã O F Í S I C A
Onde:
UNIDADE 2
73
TÓPICO 1
Vejamos os exemplos a seguir: Exemplo 1: Na distribuição a seguir estão relacionadas as notas de 35 acadêmicos do 7º semestre do curso de Educação Física na disciplina de Bioestatística em Educação Física. TABELA 5 - NOTAS DOS ACADÊMICOS DO 7 O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI - 2016
Notas (xi)
Número de Acadêmicos ()
3
3
4
6
5
9
6
8
7
6
8
3
Total
35
FONTE: A autora Para ter uma visão geral do desempenho destes acadêmicos nesta avaliação, a professora calculou a média aritmética. Resolução: Iniciamos calculando na própria tabela o produto somatório.
e calculando seu
TABELA 6 - NOTAS DOS ACADÊMICOS DO 7 O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI - 2016
Notas (xi)
Número de Acadêmicos ()
3
3
4
6
5
9
6
8
7
6
8
3
xi ∙ 3∙3=9 4 ∙ 6 = 24 5 ∙ 9 = 45 6 ∙ 8 = 48 7 ∙ 6 = 42 8 ∙ 3 = 24
Total
35
192
FONTE: A autora
Feito isso, basta substituir as informações necessárias na fórmula:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
74
TÓPICO 1
UNIDADE 2
Assim, a média da turma nesta avaliação, avaliação, em uma escala de 0 até até 10, foi de de 5,49. Exemplo 2: O basquetebol é um esporte disputado por duas equipes de cinco jogadores,
em que sai vencedora aquela que, no decorrer dos 40 minutos de jogo, somar o maior número de pontos encestando uma bola. O jogo é altamente conhecido e disputado nos Estados Unidos e a NBA (Associação Nacional de Basquetebol) é considerada uma das mais importantes ligas de basquetebol em nível mundial, sendo que os seus jogadores são os que recebem os mais elevados salários. A média de altura dos jogadores da NBA é de 2,05 metros. No Brasil, nós temos vários atletas de expressão que deixaram suas marcas e que são mundialmente conhecidos, como é o caso de Hortência, Paula, Janeth e Oscar Schmidt.
B I O E S T A T Í S T I C A
Em uma escola de Basquetebol, em São Paulo, o treinador busca bus ca manter uma média de altura de seus atletas de 1,95m. Sabendo que, atualmente, treinam nesta escola 30 atletas, os quais as alturas estão relacionadas na tabela a seguir, responda se a média de altura pleiteada por este treinador está sendo mantida.
FIGURA 8 - BASQUETEBOL
E M E D U C A Ç Ã O F Í S I C A
FONTE: Disponível em: . Acesso em: 15 ago. 2016.
UNIDADE 2
75
TÓPICO 1
TABELA 7 - ALTURA, ALTURA, EM METROS, DOS ATLETAS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO – 2016
Alturas (xi)
Número de Atletas ()
1,90
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
Total
30
FONTE: A autora Resolução: Assim como no exemplo anterior, anterior, iniciamos calculando na própria tabela o produto e calculando seu somatório. TABELA 8 - ALTURA, ALTURA, EM METROS, DOS ATLETAS ATLETAS DA ESCOLA DE BASQUETEBOL - SÃO PAULO - 2016
Alturas (xi)
Número de Atletas ()
1,90
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
xi ∙ 1,90 · 4 = 7,6 1,93 · 7 = 13,51 1,95 · 3 = 5,85 1,96 · 2 = 3,92 1,98 · 9 = 17,82 2,03 · 5 = 10,15
Total
30
58,85
FONTE: A autora
Agora, basta substituir as informações informações necessárias necessárias na fórmula:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O
Assim, a média das alturas dos atletas desta escola é de 1,96 cm. Portanto, sim, o treinador mantém e supera a meta de ter uma média das alturas em 1,95 cm.
F Í S I C A
76
UNIDADE 2
TÓPICO 1
Antes de calcularmos a média média para dados distribuídos em frequência de classe, vamos aprender a “preparar” a nossa tabela de classes para par a que consigamos calcular, além da média, a moda, a mediana, os quartis e, futuramente, o desvio padrão.
Para isso, usaremos uma tabela de exemplo, com poucas classes, uma vez que, se aprendermos a fazer numa linha, basta repetir para todas as outras. A partir das colunas iniciais, construídas conforme explicado na Unidade 1, temos que construir outras colunas. Explicaremos cada coluna detalhadamente.
Ç Ã O ! A T E N
A frequência das aparições que utilizamos das distribuições são chamadas de frequência absoluta. É com ela que vericamos por quantas vezes algum evento aconteceu.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
acumulada, este Além da frequência absoluta, também temos a frequência absoluta acumulada, tipo de frequência tem como interesse mostrar o número de aparições até um certo ponto de uma tabela de dados. Com ela podemos fazer outras comparações e observações que até eram possíveis antes, mas que com a inclusão de uma outra coluna cam bem mais visíveis. Esta coluna é formada pela soma da frequência até cada linha de dados. EXEMPLO: Tomaremos como modelo a tabela resultante do exemplo 2 do assunto
anterior para realizarmos a inclusão da coluna da frequência absoluta acumulada. acumulada. TABELA 9 - ALTURA, ALTURA, EM METROS, DOS ATLETAS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016
Alturas (xi)
Número de Atletas ()
Frequência Absoluta Acumulada (fa)
1,9
4
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
4 + 7 = 11 4 + 7 + 3 = 14 4 + 7 + 3 + 2 = 16 4 + 7 + 3 + 2 + 9 = 25 4 + 7 + 3 + 2 + 9 + 5 = 30
Total
30
-
FONTE: A autora Note que a nova coluna apresentada é constituída pela soma dos valores da frequênc ia
absoluta até cada linha, sempre somando todos os valores anteriores. Com a inclusão desta nova coluna é possível responder rapidamente rapidamente a perguntas do tipo: Quantas atletas medem até 1,96 m.? Observando na tabela, imediatamente vericamos que são 16 atletas.
UNIDADE 2
77
TÓPICO 1
Além da frequência frequência acumulada, acumulada, em estatística estatística também é interessante interessante representar representar estes dados por meio de porcentagem, porcentagem, que permite realizar comparações e análises de forma mais objetiva. Os dados apresentados em forma de porcentagem porcentagem são denominados de frequência relativa. E para determinar esta frequência, basta dividir o valor de cada frequência absoluta pelo total da própria frequência absoluta multiplicada por 100, ou seja:
EXEMPLO: Ainda tomando como modelo a tabela do exemplo anterior, vamos inserir uma coluna para os valores da frequência relativa. TABELA 10 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016
Alturas (xi)
Número de Atletas ()
1,9
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
Frequência Relativa Relativa (fr) 4/30 ∙ 100 = 13,33 % 7/30 ∙ 100 = 23,33 % 3/30 ∙ 100 = 10,00 % 2/30 ∙ 100 = 6,67 % 9/30 ∙ 100 = 30,00 % 5/30 ∙ 100 = 16,67 %
Total
30
100,00%
FONTE: A autora
Perceba que basta pegar individualmente os valores da frequência absoluta, dividir pela soma (total) da frequência absoluta e multiplicar por 100 para cada linha, deixando os valores na forma de porcentagem. Com essa nova visão, a inferência se torna mais clara. Deixando a
tabela somente com os valores e observe as duas análises a seguir da tabela:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
78
UNIDADE 2
TÓPICO 1
TABELA 11 11 - ALTURA, EM METROS, DOS ATLETAS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016
Alturas (xi)
Número de Atletas ()
Frequência Relativa Relativa (fr)
1,9
4
13,33%
1,93
7
23,33%
1,95
3
10,00%
1,96
2
6,67%
1,98
9
30,00%
2,03
5
16,67%
Total
30
100,00%
FONTE: A autora
Sobre estes dados, podemos concluir: O menor grupo de atletas desta escola são os que medem 1,96 m com 6,67% dos atletas. • O maior grupo de atletas desta escola são os que medem 1,98 m com 30% do total de atletas. • O grupo de atletas que medem 2,03 metros representa 16,67% dos atletas desta escola. •
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Assim como na frequência absoluta acumulada, podemos também proceder com a frequência relativa e fazer suas acumulações de cima para baixo. Fazendo isso, neste exemplo, temos: TABELA 12 - ALTURA, ALTURA, EM METROS, DOS ATLETAS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO
Alturas Número de
Frequência Relativa
Frequência Relativa Acumulada (fra)
(xi)
Atletas ()
1,9
4
13,33%
13,33%
1,93
7
23,33%
1,95
3
10,00%
1,96
2
6,67%
1,98
9
30,00%
2,03
5
16,67%
13,33 + 23,33 = 36,66% 13,33 + 23,33+ 10,00 = 46,66% 13,33 + 23,33+ 10,00 + 6,67 = 53,33% 13,33 + 23,33+ 10,00 + 6,67 + 30,00 = 83,33% 13,33 + 23,33+ 10,00 + 6,67 + 30,00 + 16,67 = 100,00%
Total
30
100,00%
FONTE: A autora
(fr)
UNIDADE 2
TÓPICO 1
79
Nesta tabela temos os valores diferentes da pesquisa, frequência absoluta (), a frequência relativa (fr) e a frequência relativa acumulada (fra). Com as informações desta última coluna, podemos identicar dados como: • 53,33% dos atletas medem no máximo 1,96 m. • 83,33% dos atletas representam os atletas da escola que medem até 1,98 m.
A seguir, seguir, trataremos do cálculo da média aritmética em dados agrupados em uma
distribuição de frequência com intervalo de classe.
2.3 MÉDIA ARITMÉTICA PARA PARA DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSE Para dados agrupados em intervalos de classes usamos a fórmula a seguir para encontrar a média:
Onde:
Vejamos os exemplos a seguir: Exemplo 1: Na tabela de distribuição de frequência com intervalos de classe, a seguir, estão relacionadas as estaturas de 100 acadêmicos do curso de Educação Física da UNIASSELVI no ano de 2016.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
80
UNIDADE 2
TÓPICO 1
TABELA 13 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Número de Acadêmicos ()
Total
100
5 10 30 40 10 5
FONTE: A autora
Para calcularmos a média para dados distribuídos em frequência de classe, vamos aprender a “preparar” a nossa tabela de classes para que consigamos calcular não apenas a média, mas também a moda, a mediana, os quartis e mais adiante o desvio padrão. Inicialmente, vamos calcular o ponto médio do intervalo de classe xi (já aprendemos a calcular na Unidade 1 desde caderno de estudos). Para isso, em cada linha devemos subtrair B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
o limite inferior do limite superior e dividir por dois.
Vejamos na tabela: TABELA 14 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
Estatura (cm) 140 Ⱶ 150 0 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Número de Acadêmicos (f)
xi
5
145
10
155
30
165
40
175
10
185
5
195
Total
100
FONTE: A autora
150-140 2
180-170 2
UNIDADE 2
81
TÓPICO 1
Calculados os pontos médios (xi), devemos multiplicá-los pela frequência absoluta () de cada classe, conforme apresentamos apresentamos na tabela a seguir: TABELA 15 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI – 2016
Estatu Estatura ra (cm) (cm) Número Número de Acadê Acadêmic micos os () 5 140 Ⱶ 150 10 150 Ⱶ 160 30 160 Ⱶ 170 40 170 Ⱶ 180 10 180 Ⱶ 190 5 190 Ⱶ 200 Total
100
xi 145 155 165 175 185 195
xi ∙ 145 ∙ 5 = 725 155 ∙ 10 = 1550 165 ∙ 30 = 4950 175 ∙ 40 = 7000 185 ∙ 10 = 1850 195 ∙ 5 = 975 17 050
FONTE: A autora
• Somatório de
todos os xi∙
Com estas informações, é possível calcularmos a média das estaturas dos 100 acadêmicos do curso de Educação Física da Uniasselvi no ano de 2016.
Substituindo na fórmula,
Assim, a média média dos acadêmicos do curso de Educação Educação Física da UNIASSEL UNIASSELVI VI no ano de 2016 é de 170,5 centímetros.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
82
TÓPICO 1
UNIDADE 2
Ç Ã O ! A T E N
Acadêmico, veja algumas características da média quanto à importância, vantagens e desvantagens: • • • • • • • • •
a média de um conjunto de números pode sempre ser calculada; para um dado conjunto de números a média é única; a média de uma constante sempre é uma constante; é descritiva de todos os dados de uma série e de fácil compreensão; é facilmente calculável; depende de cada valor da série e qualquer alteração de um deles altera seu valor; é inuenciada por valores excepcionais, podendo em alguns casos não representar a série; é das medidas de tendência central de maior emprego; é usada para operações estatísticas estatísticas mais avançadas, como testes para tomada de decisão.
3 MODA B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
É o elemento representativo da série que indica a concentração. É o valor que ocorre com maior frequência, é o que mais aparece. Às vezes, num conjunto conjunto de dados podemos podemos ou
não ter moda. Não existindo moda ele será amodal; havendo mais de uma moda ele será multimodal – bimodal para duas modas; trimodal para três modas. Assim como no estudo estudo da da média, média, vamos vamos separar separar o estudo do cálculo cálculo da moda nas nas três
apresentações apresentações dos dados vistos:
E ! A N T O R T P M I
A moda é representada pelo símbolo M o.
3.1 DADOS NÃO AGRUPADOS Basta colocar os valores no ROL e depois vericar qual valor que ocorreu com maior frequência. Esse valor será a moda da distribuição.
UNIDADE 2
83
TÓPICO 1
Ex.: a) 2, 4, 5, 5, 6, 7. M o = 5 b) 5, 6, 7, 8, 9. M o = Não existente. Classe amodal. c) 3, 4, 4, 5, 5, 6, 7, 8, 9. M o = 4 e 5. Classe bimodal.
3.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DISTRIB UIÇÃO DE FREQUÊNCIA F REQUÊNCIA SEM INTERVALO DE CLASSES A moda será o valor com maior frequência, ou seja, basta olhar a linha em que o f i é maior, veja a tabela a seguir como exemplo. TABELA 16 - NOTAS DOS ACADÊMICOS DO 7 O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA DISCIPLINA DE BIO BIOESTA ESTATÍSTICA TÍSTICA – UNIASSELVI UNIA SSELVI - 2016
Notas
Número de Acadêmicos (f i)
3
3
4
6
5
9
6
8
7
6
8
3
Total
35
FONTE: A autora
Como podemos observar, a terceira linha é portadora do maior f i, desta forma, a nota modal nesta turma foi 5. Representamos por: M o = 5.
3.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DISTRIB UIÇÃO DE FREQUÊNCIA F REQUÊNCIA COM INTERVALO DE CLASSES Quando os dados estiverem agrupados em uma distribuição de frequência com intervalos de classe, devemos inicialmente encontrar a classe modal (classe de maior f i) e depois calcular a moda pelo seguinte modelo matemático:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
84
UNIDADE 2
TÓPICO 1
Onde: d 1 =
diferença entre a frequência da classe modal e a anterior; d = diferença entre a frequência da classe modal e a posterior. = limite inferior da classe modal. h = amplitude da classe modal. (l s – li) 2
i
i
Vejamos como calcular a moda para o exemplo já utilizado no cálculo da média para esse mesmo tipo de dados. Exemplo: Na tabela de distribuição de frequência com intervalos de classe, a seguir, estão relacionadas as estaturas de 100 acadêmicos do curso de Educação Física da UNIASSELVI no ano de 2016. TABELA 17 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Número de Acadêmicos ()
Total
100
5 10 30 40 10 5
FONTE: A autora
Para calcular a moda em um conjunto de dados agrupad agrupados os em intervalos de classes, devemos observar os seguintes passos: 1º Passo: Identicar a classe onde a Moda se encontra (Classe Modal), ou seja, vamos destacar a linha onde temos o maior f i.
UNIDADE 2
85
TÓPICO 1
TABELA 18 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Número de Acadêmicos ()
Total
100
5 10 30 40 10 5
FONTE: A autora Neste exemplo, a classe modal é a quarta classe (i 4) da distribuição, pois é ali que se encontra a maior frequência, que é 40. 2º Passo: Denida a classe modal, vamos aplicar a fórmula para o cálculo da moda:
Sendo: d1 = maior f i menos f i anterior; (f 4 – f 3 = 40 – 30 = 10) d2 = maior f i menos f i posterior. (f 4 – f 5 = 40 – 10 = 30)
U N I Não se esqueça do que signica li (limite inferior da classe) e hi (amplitude da classe). Caso não lembre, retorne ao estudo nos tópicos anteriores.
B I O E S T A T Í S T I C A E M
Neste exemplo, l i = 170 e h i = ls – li = 180 – 170 = 10. Substituindo na fórmula, temos:
Desta forma, a altura modal para este grupo de acadêmicos é de 172,5 centímetros e representamos por, M o = 172,5 cm.
E D U C A Ç Ã O F Í S I C A
86
UNIDADE 2
TÓPICO 1
E ! A N T O R T I M I M P
Veja algumas observações sobre a moda: • • •
é a menos útil para problemas estatísticos, porque se presta à análise matemática; a utilidade da moda se acentua quando um ou dois valores ocorrem aproximadamente com a mesma frequência; a moda nada acrescenta em termos de descrição dos dados.
4 MEDIANA A mediana mediana é o elemento elemento de tendência tendência central central que, estando estando os dados dados em ordem ordem crescente crescente,, indica o valor médio ou a média dos valores centrais, cent rais, por isto é chamada de medida de posição. Divide a série em duas partes iguais.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Novamente, iremos apresentar como determinar essa medida, para os três tipos de apresentação de dados.
4.1 DADOS NÃO AGRUPADOS Quando todas as observações estão ordenadas em rol, a mediana é o valor da observação central. A mediana não é calculada como a média, ao invés disso, para determinar a mediana, calculamos a sua posição, o valor que estiver naquela posição será a mediana. Em dados não agrupados, determinamos a posição da mediana, através do cálculo:
, sendo n o número de dados da distribuição. Vejamos Vejamos alguns exemplos: Exemplo 1: Qual 1: Qual a mediana dos dados a seguir? 4
7
8
Acadêmico, Acadêmico, sabemos sabemos que a mediana mediana é o termo que se encon encontra tra no centro da distribuição distribuição e, nesse caso, podemos intuitivamente armar que a mediana é 7.
UNIDADE 2
87
TÓPICO 1
Ainda, Aind a, podemos podemo s vericar veri car o valor da mediana, medi ana, usand usandoo a fórmula: fórmu la: primeira prim eiramente mente calculamos a posição da mediana usando . Como temos três dados, então n = 3. Assim A mediana mediana é o dado dado da 2ª posição, posição, logo Md = 7.
E ! A N T O R T I M I M P
Quando o número de dados é par, a posição será um valor “quebrado”; “quebrado”; com isso, a mediana é a média dos dois dados centrais. centrais.
Exemplo 2: Qual 2: Qual a mediana dos dados a seguir? 3
5
9
16
Intuitivamente percebemos percebemos que não há um valor no centro da distribuição, e sim si m dois valores (5 e 9). A mediana será, então, a média desses valores: Usando a fórmula, temos quatro dados, então n = 4. Assim,
que representa a posição entre o 2º e o 3º dado, que não existe. Nesse caso, calculamos a média
entre o 2º (5) e o 3º (9), que é 7. Exemplo 3: A seguir estão dispostos dis postos em ROL os salários salários,, em reais, de 50 prossionais prossi onais
habilitados em Educação Física, referentes a uma carga horária de 20h, no mês de julho de 2016, no Estado de Santa Catarina. 578,90
885,85
1000,00
1234,32
1785,3
595,45
899,76
1000,76
1280,70
1798,24
671,45
900,00
1009,65
1290,12
1865,43
678,12
904,90
1010,43
1345,54
1900,00
683,92
908,99
1029,12
1383,90
1900,43
777,23
920,98
1055,90
1408,30
1920,01
786,43
965,00
1080,67
1600,00
2000,00
800,00
976,45
1100,00
1654,25
2043,89
850,80
980,12
1100,45
1670,98
2080,00
880,76
990,54
1100,99
1782,39
2109,88
Para determinar o salário mediano, devemos seguir os passos: 1º Passo: Calcular Passo: Calcular a posição da mediana:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
88
TÓPICO 1
UNIDADE 2
2º Passo: Determinar Passo: Determinar o valor da mediana: Como a posição 25,5 não existe, temos que pegar os valores da posição 25 e da posição
26, depois disso fazer a média entre os dois valores (sempre que o número de dados n for par acontecerá isso). Posição 25:
Posição 26:
Mediana será a média dos dois valores encontrados, ou seja, Portanto, o salário mediano é de R$ 1.042,51.
Ç Ã O ! A T E N
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Para determinar os valores das posições calculadas, colocamos os valores em ROL, e contamos até a posição desejada. Volte na tabela acima e conte, na ordem em que os dados crescem, até a posição 25 e 26 e perceba per ceba que são os valores 1029,12 e 1055,90. Se o número de dados n for ímpar, o cálculo da posição dará um número inteiro, com isso bastará encontrar o valor no ROL que está na posição calculada. Como teremos apenas um valor, esse valor será a mediana.
4.2 DADOS AGRUPADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSES
Para dados agrupados em distribuição de frequência sem intervalo i ntervalo de classes ou em frequência simples, também iremos determinar a mediana calculando sua posição. Vejamos o exemplo, já trabalhado anteriormente: anteriormente: Exemplo: Na distribuição a seguir estão relacionadas as notas de 35 acadêmicos do 7º semestre do curso de Educação Física na disciplina de Bioestatística em Educação Física.
UNIDADE 2
89
TÓPICO 1
TABELA 19 - NOTAS DOS ACADÊMICOS DO 7 O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA – UNIASSELVI – 2016
Notas (xi)
Número de Acadêmicos ()
3
3
4
6
5
9
6
8
7
6
8
3
Total
35
FONTE: A autora
Para determinar a mediana, novamente devemos seguir os passos: 1º passo: Cálculo passo: Cálculo da posição:
Logo, queremos o valor da posição 18, ou, em outras palavras, o valor x 18. 2º passo: Determinar passo: Determinar o valor da mediana. Para isso, temos que olhar a coluna da
frequência acumulada (Fa), e encontrar a linha do primeiro valor igual ou maior que a posição calculada, que no nosso caso é 18. TABELA 20 - NOTAS DOS ACADÊMICOS DO 7 O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA DISCIPLINA DE BIO BIOESTA ESTATÍSTICA TÍSTICA EM EDUCAÇÃO E DUCAÇÃO FÍSICA FÍSI CA - UNIASSELVI
Notas (x (xi)
Número de Acadêmicos ()
Frequência Acumulada (Fa)
3
3
3
4
6
9
5
9
18
6
8
26
7
6
32
8
3
35
Total
35
FONTE: A autora
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
90
UNIDADE 2
TÓPICO 1
Na tabela, a terceira linha li nha nos apresenta na coluna Fa o valor da posição 18. Logo, o valor da mediana é 5, porque é o x i da linha 3, ou seja, Md = 5. Ç Ã O ! A T E N
Se o número de dados n for par, acontecerá novamente uma posição intermediária. Se essa posição car entre duas linhas, tira-se a média entre os dois doi s valores das respectivas linhas, caso contrário, a mediana será o valor da linha, como no caso de n ímpar mostrado acima.
4.3 4.3 DADOS AGRUPADOS EM DISTRIBUIÇÃO DISTRIBUI ÇÃO DE FREQUÊNCIA F REQUÊNCIA COM INTERVALO DE CLASSES Para calcular a mediana em dados agrupados em distribuição de frequência com intervalo de classes, iremos retomar o exemplo já trabalhado anteriormente e, assim como zemos para as demais maneiras de apresentação de dados, vamos seguir alguns passos. B I O E S T A T Í S T I C A
Exemplo: Na tabela de distribuição de frequência com intervalos de classe a seguir, estão relacionadas as estaturas de 100 acadêmicos do curso de Educação Física da Uniassel vi no ano de 2016. TABELA 21 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
E M E D U C A Ç Ã O F Í S I C A
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Número de Acadêmicos ()
Total
100
5 10 30 40 10 5
FONTE: A autora
1º Passo: Continua Passo: Continua sendo determinar a posição em que a mediana se encontra, igual aos casos anteriores. Posição:
UNIDADE 2
91
TÓPICO 1
2º Passo: Determinar Passo: Determinar a classe da mediana, que nada mais é que a linha em que
a posição calculada (no caso 50,5) se encontra. Novamente, para determinar essa linha (classe), basta olhar a coluna da frequência acumulada (Fa). O primeiro valor dessa coluna Fa igual ou maior que a posição calculada indicará a classe da mediana. Assim, vamos preparar a tabela com os valores de x i e Fa. TABELA 22 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 Total
Número de Acadêmicos ()
xi
Fa
5
145
5
10
155
15
30
165
45
40
175
85
10
185
95
Classe da Mediana
100
FONTE: A autora
Neste exemplo, o primeiro valor igual ou maior que 50,5 é o 85, que está na 4ª classe
(linha 4), ou seja, a classe da mediana será 170 ├ 180. 3º Passo: Calcular Passo: Calcular a mediana usando a fórmula a seguir:
Onde:
= limite inferior da classe da mediana. = frequência acumulada da classe anterior à da mediana. = frequência da classe mediana. = amplitude da classe modal. Neste exemplo, temos:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
92
TÓPICO 1
UNIDADE 2
Substituindo na fórmula, temos:
Ç Ã O ! A T E N
Algumas observações sobre a Mediana: •é •é •é
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
menos sensível a valores extremos do que a média; difícil de determinar para grande quantidade de dados; mais adequada para distribuição muito assimétrica.
UNIDADE 2
TÓPICO 1
93
RESUMO DO TÓPICO 1
Neste tópico, você estudou as Medidas de Tendência Tendência Central, e vimos que estes números indicam o valor médio de uma distribuição de frequência, procurando reduzir todos os valores num só, e de preferência, tomam como mais representativo aquele que esteja no centro da distribuição. São três as medidas de posição: • Média: medida de uniformização. • Mediana: medida de posição. • Moda: medida de
concentração.
Já vimos também que os dados podem estar apresentados apresentados de três formas: dados não agrupados, dados agrupados agrupados em distribuição de frequência sem intervalo de classes e dados agrupados em distribuição de frequência com intervalo de classes. E, para cada maneira de apresentar os dados de uma pesquisa, existe uma maneira para se calcular a média, moda e mediana. • Dados não agrupados
Média:
Moda: basta colocar os valores no ROL e depois vericar qual valor que ocorreu com maior frequência. Mediana: em dados não agrupados, determinamos a posição da mediana, através do cálculo: , sendo n o número de dados da distribuição. • Dados Agrupados em Distribuição de Frequência sem Intervalo de Classe
Média:
Moda: basta olhar a linha em que o f i é maior, o xi correspondente será o valor da moda.
, buscamos o valor encontrado na coluna da frequência acumulada (Fa) e localizamos o respectivo x i, este Mediana: determinamos a posição da mediana através do cálculo:
será o valor da mediana.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
94
TÓPICO 1
UNIDADE 2
• Dados Agrupados em Distribuição de Frequência com Intervalo de Classe
Média:
Moda:
Mediana: após determinar a posição da mediana, aplicar a fórmula a seguir:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 2
TÓPICO 1
E D A D T I V I A O A U T
95
Prezado acadêmico, chegou a hora de você testar tes tar seus conhecimentos sobre as medidas de tendência central. Lápis e borracha em mãos e boa atividade!
1 A energia energia hidráulica ou energia hídrica é a energia obtida a partir da energia potencial de uma massa de água. A forma na qual ela se manifesta na natureza é nos uxos de água, como rios e lagos, e pode ser aproveitada por meio de um desnível ou queda d’água. Considere os maiores consumidores consumidores de energia hidráulica no quadro a seguir:
Maiores consumidores de energia hidráulica (em milhões de toneladas de equivalentes de petróleo) P aís China Canadá Brasil Estados Unidos
Rússia Noruega Índia Japão Outros Total
Consumo em 2006 94,3 79,3 79,2 65,9 39,6 27,1 25,4 21,5 255,8 688,1
FONTE: Disponível em:
ovosolhos.doc%26servidor%3Darq_material/43_41.doc+&cd=2&hl=ptBR&ct=clnk&gl=br>. Acesso em: 19 ago. 2016.
Observando estes dados, responda: qual a frequência relativa do consumo no Brasil? a) Aproximadamente 0,37. b) Aproximadamente Aproximadamente 0, 20. c) Aproximadamente 0,40. d) Aproximadamente 0,12.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
96
UNIDADE 2
TÓPICO 1
2 Considere a seguinte distribuição das frequências absolutas dos salários salári os mensais, em R$, referentes a 200 trabalhadores de uma indústria de Santa Catarina em julho de 2016.
Classe Classess de de salá salário rioss (R$) (R$)
Número Número de funcio funcioná nário rioss () ()
400|— 500
50
500|— 600
70
600 |— 700
40
700 |— 800
30
800 |— 900
10
∑ fi = Fonte: Dados ctícios
Sobre essa distribuição de salários, é correto armar que:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
a) O salário mediano encontra-se na classe de R$ R $ 600 até R$ 700. b) O salário modal encontra-se na classe de R$ 600 até R$ 700. c) O salário modal encontra-se na classe de R$ 700 até R$ 800. d) O salário mediano encontra-se na classe de R$ R $ 500 até R$ 600.
UNIDADE 2
TÓPICO 2 MEDIDAS DE DISPERSÃO
1 INTRODUÇÃO No capítulo anterior vimos algumas medidas de localização do centro de uma
distribuição de dados, ou seja, as medidas de posição: média, moda e mediana. Porém, estas medidas descrevem apenas uma das características dos valores numéricos de um conjunto de observações, o da tendência central. O que, às vezes, é insuciente para representar dedignamente dedignamente os dados analisados. Um exemplo disso é que grupos diferentes de dados observados podem apresentar a mesma média, como no caso a seguir: • Grupo 1: 5, 5, 5. • Grupo 2: 4, 5, 6. • Grupo 3: 0, 5, 10. • Grupo 4: 3, 4, 8.
Acadêmico, observe que nos quatro grupos a média é a mesma (5), porém no grupo 1 não há variação entre os dados, enquanto no grupo 2 a variação é menor que no grupo 3 e no grupo 4.
Dessa forma, podemos observar que em qualquer grupo de dados os valores val ores numéricos não são semelhantes e apresentam desvios variáveis com relação à tendência geral de média.
Uma maneira mais completa de analisar os dados é aplicar uma medida de dispersão, também conhecidas conheci das como com o medidas medi das de variabilidade, indicam se os valores estão relativamente relativamente próximos uns dos outros. As principais medidas de dispersão são: amplitude, desvio padrão e variância. Neste tópico, aprenderemos a determinar as medidas de dispersão e interpretar seus resultados.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
98
TÓPICO 2
UNIDADE 2
2 AMPLITUDE TOTAL Já denimos este conceito na Unidade 1 deste caderno de estudos e é a única medida de dispersão que não tem na média o ponto de referência. Vamos recordar que a amplitude
total representa a diferença entre o maior e o menor valor de um conjunto de dados, ou seja, é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então: AT = Li máximo – L i mínimo = L max – Lmin Exemplo: Para Exemplo: Para os valores: 40, 45, 48, 62 e 70, a amplitude total será: AT = 70 - 40 = 30 A amplitude total tem a característica de só levar em conta os dois valores extremos
da série, descuidando do conjunto de valores intermediários. Seu cálculo é oportuno para identicar se os dados estão afastados ou não. Se a amplitude for um número elevado, então os valores da série estão distribuídos afastados, e se a amplitude for um número baixo, então, B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
os valores na série estão próximos uns dos outros.
3 DESVIO PADRÃO O desvio padrão é uma medida de dispersão que indica a regularidade de um conjunto de dados em função da média aritmética, ou seja, nos informa o quão “conável” é esse valor. O desvio padrão é uma medida que só pode assumir valores não negativos, e quanto maior
for, maior será a dispersão e a variabilidade dos dados. Desta forma, quanto menor for o desvio padrão com relação à média, maior a
homogeneidade da distribuição, distri buição, ou seja, mais agrupados os dados estarão estar ão em torno da média. Se o desvio padrão for grande, indica que os dados da distribuição estão muito dispersos, ou seja, estão longe da média. Existem dois tipos de desvio padrão, o amostral e o populacional, populacional, os quais trataremos a seguir.
UNIDADE 2
TÓPICO 2
99
3.1 DESVIO PADRÃO PADRÃO AMOSTRAL E DESVIO DESVI O PADRÃO POPULACIONAL Na Unidade 1 deste caderno de estudos tratamos a diferença entre população e amostra.
E, na maioria das vezes, trabalhamos com amostras. Com isso, é mais comum utilizarmos o desvio padrão amostral, que é representado por S. No entanto, há também o desvio padrão populacional, representado representado por σ (sigma). A seguir, seguir, veremos veremos qual a diferença no cálculo de cada um deles.
3.2 CÁLCULO DO DESVIO PADRÃO Assim como nos cálculos das medidas de tendência central, as quais estudamos no
tópico anterior, o desvio padrão também deve ser calculado observando-se o tipo de dados que temos. Assim, trataremos cada um deles, iniciando pelos dados não agrupados.
3.2.1 Dados não agrupados Para calcular o desvio padrão em dados não agrupados, devemos observar os seguintes passos: 1º passo: Calcular passo: Calcular a média dos elementos. 2º passo: Calcular passo: Calcular a diferença entre cada elemento e a média. ( x − x ) 3º passo: Elevar passo: Elevar essas diferenças à segunda potência.
( x − x )
2
4º passo: Somar todos os resultados obtidos no passo 3. 5º passo: Dividir a soma por n (se for populacional) ou dividir por n-1 (se for amostral).
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
100
UNIDADE 2
TÓPICO 2
Ç Ã O ! A T E N
A diferença no cálculo dos dois desvios padrões (populacional e amostral) é o denominador (o divisor), enquanto que na populacional dividimos pelo número total de elementos n, no amostral dividimos por n-1. n-1 . A seguir, seguir, veremos exemplos de cálculos cálculo s dos dois tipos, para que não quem dúvidas.
6º passo: Calcular a raiz quadrada do resultado da divisão obtida no passo 5. Acompanhe o exemplo: Exemplo: Um professor de Educação Física vericou que as notas da prova teórica
sobre atletismo dos seis meninos da turma foram: 8,5; 5,0; 9,0; 3,5; 7,5 e 8,5. Com o intuito de vericar como foi o desempenho geral destes meninos, o professor decidiu encontrar a média aritmética e seu respectivo desvio padrão. 1º passo: Média passo: Média B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
2º passo: Fazer passo: Fazer cada elemento menos a média (
)
Nota (x)
Nota menos a média ( x − x )
8,5
8,5 – 7,0 = 1,5 5,0 – 7,0 = - 2,0 9,0 – 7,0 = 2,0 3,5 – 7,0 = - 3,5 7,5 – 7,0 = 0,5 8,5 – 7,0 = 1,5
5,0 9,0 3,5 7,5 8,5
3º passo: Elevar passo: Elevar cada resultado acima à segunda potência. potência. 2
Nota (x)
( x − x )
(x − x)
8,5
8,5 – 7,0 = 1,5 5,0 – 7,0 = - 2,0 9,0 – 7,0 = 2,0 3,5 – 7,0 = - 3,5 7,5 – 7,0 = 0,5 8,5 – 7,0 = 1,5
(1,5) 2 = 2,25 (- 2,0) 2 = 4,00 (2,0) 2 = 4,00 (- 3,5) 2 = 12,25 (0,5) 2 = 0,25 (1,5) 2 = 2,25
5,0 9,0 3,5 7,5 8,5
UNIDADE 2
101
TÓPICO 2
4º passo: Somar passo: Somar os resultados do passo 3. 2
Nota (x)
( x − x )
8,5
8,5
8,5 – 7,0 = 1,5 5,0 – 7,0 = - 2,0 9,0 – 7,0 = 2,0 3,5 – 7,0 = - 3,5 7,5 – 7,0 = 0,5 8,5 – 7,0 = 1,5
(x − x) (1,5) 2 = 2,25 (- 2,0) 2 = 4,00 (2,0) 2 = 4,00 (- 3,5) 2 = 12,25 (0,5) 2 = 0,25 (1,5) 2 = 2,25
Total
-
25
5,0 9,0 3,5 7,5
5º passo: Dividir passo: Dividir o resultado da soma do passo 4 por n ou por n-1 (dependendo se é populacional ( σ ) ou amostral (S).
! N T E R T A I M P O
Acadêmico! Nesse passo acabamos de calcular calc ular a variância amostral S² e a populacional σ². Sobre a variância, é válido saber: •
•
num conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante cada valor desse conjunto está do valor central (médio); quanto menor é a variância, mais próximos os valores estão da média, No entanto, quanto maior ela é, mais os valores estão distantes da média.
6º passo: Extrair passo: Extrair a raiz quadrada dos resultados do passo 5.
Para este caso, o desvio padrão é o populacional, pois analisamos os dados de todo
o grupo selecionado (meninos da turma X). Note que a média foi 7,0 e o desvio padrão cou em 2,04, o que indica que há dados distantes desta média, e voltando para os dados brutos, realmente conrmamos isso, visto que há menino com nota 9,0 e menino com nota 3,5.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
102
UNIDADE 2
TÓPICO 2
3.2.2 Dados agrupados em distribuição de frequência sem intervalo de classes Para este agrupamento de dados, iremos repetir os mesmos passos para determinar o
desvio padrão com frequência simples. Vamos retomar a tabela já utilizada para outros cálculos. TABELA 23 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL - SÃO PAULO – 2016
Alturas (xi)
Número de Atletas ()
1,90
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
Total
30
FONTE: A autora B I O E S T A T Í S T I C A
Vamos calcular o desvio padrão amostral e populacional. 1º passo: Calcular passo: Calcular a média. TABELA 24 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016
Alturas (xi)
Número de Atletas ()
1,90
4
1,93
7
E M
1,95
3
1,96
2
E D U C A Ç Ã O
1,98
9
2,03
5
xi ∙ 1,90 · 4 = 7,6 1,93 · 7 = 13,51 1,95 · 3 = 5,85 1,96 · 2 = 3,92 1,98 · 9 = 17,82 2,03 · 5 = 10,15
Total
30
58,85
F Í S I C A
FONTE: A autora
UNIDADE 2
103
TÓPICO 2
Assim, a média das alturas dos atletas atletas desta escola escola é de 1,96 cm. 2º passo: Subtrair a média dos valores x ( x − x ) . i
TABELA 25 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016
Alturas (xi)
Número de Atletas ()
xi ∙
( x − x )
1,90
4
1,90 · 4 = 7,6
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
1,93 · 7 = 13,51 1,95 · 3 = 5,85 1,96 · 2 = 3,92 1,98 · 9 = 17,82 2,03 · 5 = 10,15
1,90 - 1,96 = - 0,06 1,93 - 1,96 = - 0,03 1,95 - 1,96 = - 0,01 1,96 - 1,96 = 0 1,98 - 1,96 = 0,02 2,03 - 1,96 = 0,07
Total
30
58,85
i
FONTE: A autora 3º passo: Elevar passo: Elevar os resultados de ( x − x ) a segunda potência. i
TABELA 26 - ALTURA, ALTURA, EM METROS, DOS ATLETAS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016
Alturas (xi) Número de Atletas ()
( x − x )
( x − x )
1,90 1,90 - 1,96 1,96 = - 0,06 0,06 1,93 1,93 - 1,9 1,966 = - 0,0 0,033 1,95 1,95 - 1,96 1,96 = - 0,01 0,01 1,96 - 1,96 = 0 1,98 - 1,96 = 0,02 2,03 - 1,96 = 0,07
(-0,06 (-0,06)) 2 = 0,0036 (-0, (-0,03 03)) 2 = 0,0009 (-0, (-0,01 01)) 2 = 0,0001 02 = 0 (0,02) 2 = 0,0004 (0,07) 2 = 0,0049
1,90
4
1,90 · 4 = 7,6
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
1,93 1,93 · 7 = 13, 13,51 51 1,95 1,95 · 3 = 5,85 5,85 1,96 · 2 = 3,92 1,98 · 9 = 17,82 2,03 · 5 = 10,15
Total
30
58,85
FONTE: A autora
2
xi ∙
i
i
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
104
UNIDADE 2
TÓPICO 2
4º passo: Multiplicar passo: Multiplicar cada resultado do passo anterior pela frequência da classe e somar os resultados. TABELA 27 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO PAULO - 2016 Alturas Número de 2 2 ( x − x ) xi ∙ ( x − x ) ( xi − x ) . fi i
(xi)
Atletas ()
1,90
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
1,90 ,90 · 4 = 7,6 1,93 1,93 · 7 = 13, 13,51 51 1,95 1,95 · 3 = 5,85 5,85 1,96 · 2 = 3,92 1,98 · 9 = 17,82 2,03 · 5 = 10,15
Total
30
58,85
1,90 - 1, 1,96 = - 0,0 0,066 1,93 1,93 - 1,9 1,966 = - 0,0 0,033 1,95 1,95 - 1,96 1,96 = - 0,01 0,01 1,96 - 1,96 = 0 1,98 - 1,96 = 0,02 2,03 - 1, 1,96 = 0,07
i
(-0 (-0,06 ,06) 2 = 0,0 0,0036 036 (-0, (-0,03 03)) 2 = 0,0 0,0009 009 (-0, (-0,01 01)) 2 = 0,0 0,0001 001 02 = 0 (0,02) 2 = 0,0 0,000 0044 (0,07) 2 = 0,0 0,004 0499
0,0036 0,0036 · 4 = 0,01 0,0144 44 0,0009 0,0009 · 7 = 0,00 0,0063 63 0,0001 0,0001 · 3 = 0,00 0,0003 03 0·2=0 0,00 0,0004 04 · 0 = 0,0 0,003 0366 0,00 0,0049 49 · 5 = 0,0 0,024 2455 0,0491
FONTE: A autora
5º passo: Dividir a soma 0,049 obtida no passo 4 por ∑ fi = 30 se for populacional ou por ∑ fi − 1 = 30 − 1 = 29 se for amostral. B I O E S T A T Í S T I C A
6º passo: Extrair passo: Extrair a raiz quadrada dos resultados do passo 5.
Note o quanto esse desvio padrão é wpequeno, isso indica i ndica que os dados estão próximos da média.
E M E D U C A Ç Ã O F Í S I C A
3.2.3 Frequência de classes Quando os dados estão agrupados em uma distribuição de frequência com intervalo de classe, usaremos a seguinte fórmula para calcular o desvio padrão:
UNIDADE 2
105
TÓPICO 2
Essas fórmulas só resumem os passos que já zemos anteriormente, anteriormente, veja no exemplo das estaturas dos 100 acadêmicos do curso de Educação Física. TABELA 28 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Número de Acadêmicos ()
Total
100
5 10 30 40 10 5
FONTE: A autora
1º passo: Calcular passo: Calcular a média. Para isso, precisamos calcular a coluna x i (pontos médios das classes) e a coluna f i.xi ∑ ( x ∗ f ) para calcular a média: X = ∑ f . i
i
i
TABELA 29 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI – 2016
Estatu Estatura ra (cm) (cm) Número Número de Acadêm Acadêmico icoss () () 5 140 Ⱶ 150 10 150 Ⱶ 160 30 160 Ⱶ 170 40 170 Ⱶ 180 10 180 Ⱶ 190 190 Ⱶ 200 5 Total FONTE: A autora
100
xi 145 155 165 175 185 195
xi ∙ 145 ∙ 5 = 725 155 ∙ 10 = 1550 165 ∙ 30 = 4950 175 ∙ 40 = 7000 185 ∙ 10 = 1850 195 ∙ 5 = 975 17 050
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
106
UNIDADE 2
TÓPICO 2
Substituindo na fórmula,
Portanto, a média dos acadêmicos do curso de Educação Física da UNIASSELVI no ano de 2016 é de 170,5 centímetros. 2º passo: Subtrair a média dos pontos médios x i, ou seja, fazer x − x i
TABELA 30 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI – 2016
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Esta Estatu tura ra (cm) (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200
Núme Número ro de Acad Acadêm êmic icos os () ()
xi
xi ∙
( x − x )
5
145
725
10
155
1550
30
165
4950
40
175
7000
10
185
1850
5
195
975
145 - 170,5 = - 25,5 155 - 170,5 = - 15,5 165 - 170,5 = - 5,5 175 - 170,5 = 4,5 185 - 170,5 = 14,5 195 - 170,5 = 24,5
Total
100
i
17 050
FONTE: A autora
3º passo: Elevar passo: Elevar os resultados de
xi − x
à segunda potência.
TABELA 31 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI – 2016
Estatura (cm) 140 Ⱶ 150 150 Ⱶ 160 160 Ⱶ 170 170 Ⱶ 180 180 Ⱶ 190 190 Ⱶ 200 Total FONTE: A autora
Número de Acadêmicos ()
xi
xi ∙
( x − x )
( x − x )
5
145
725
10
155
1550
30
165
4950
40
175
7000
10
185
1850
5
195
975
145 - 170,5 = - 25,5 155 - 170,5 = - 15,5 165 - 170,5 = - 5,5 175 - 170,5 = 4,5 185 - 170,5 = 14,5 195 - 170,5 = 24,5
(- 25,5) 2 = 650,25 (- 15,5) 2 = 240,25 (- 5,5) 2 = 30,25 (4,5) 2 = 20,25 (14,5) 2 = 210,25 (24,5) 2 = 600,25
100
17 050
i
2
i
UNIDADE 2
107
TÓPICO 2
4º passo: Multiplicar passo: Multiplicar os resultados de x − x pela frequência da classe, ou seja, faremos: i
( xi − x )
. fi
TABELA 32 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA DA UNIASSELVI – 2016
Estatura
(cm)
Número de Acadêmic Acadêmicos os
140 Ⱶ 150 150 Ⱶ 160
Xi
xi ∙
2
2
( x − x )
( x − x )
145 - 170,5 =
(- 25,5)2 =
650,25 · 5 =
- 25,5
650,25
3251,25
155 - 170,5 =
(- 15,5)2 =
240,25 · 10 =
- 15,5
240,25
2402,5
165 - 170,5 =
(- 5,5)2 =
30,25 · 30 =
- 5,5
30,25
907,5
175 - 170,5 =
(4,5)2 =
4,5
20,25
185 - 170,5 =
(14,5)2 =
210,25 · 10 =
14,5
210,25
2102,5
195 - 170,5 =
(24,5)2 =
600,25 · 5 =
24,5
600,25
3001,25
i
i
( xi − x )
. fi
() 5 10
145 155
725 1550
160 Ⱶ 170
30
165
4950
170 Ⱶ 180
40
175
7000
180 Ⱶ 190
10
185
1850
190 Ⱶ 200
5
Total
100
195
975 17 050
20,25 · 40 = 810
12 475
FONTE: A autora
5º passo: Dividir a soma 12 475 obtida no passo 4 por ∑ fi = 100 se for populacional populacional ou por ∑ fi − 1 = 99 se for amostral.
6º passo: Extrair passo: Extrair a raiz quadrada dos resultados do passo 5.
B I O E S T A T Í S T I C A E M
4 COEFICIENTE DE VARIAÇÃO
E D U C A Ç Ã O
Na Estatística utilizamos diversas medidas para descrever fenômenos. Algumas Algumas são as de tendência central e outras as de dispersão. Dentre as medidas de dispersão, já estudamos o desvio padrão. Porém, o desvio padrão por si só tem algumas limitações, por exemplo, um
F Í S I C A
Acadêmico, Acadêmico, perceba perceba que quan quanto to maior é o desvio padrã padrão, o, mais os dado dadoss estão dispersos dispersos com relação à média.
108
TÓPICO 2
UNIDADE 2
desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores
cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita
o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente a sua dispersão ou variabilidade, quando expressas em unidades diferentes. Entretanto, uma medida muito utilizada, principalmente para se comparar medidas distintas, é o coeciente de variabilidade ou apenas coeciente de variação (CV). O coeciente de variação é uma medida de variabilidade relativa, pois é a relação entre o desvio padrão ( S) e a média aritmética aritmética ( ), multiplicad multiplicadaa por 100. Portan Portanto, to, o coeciente coeciente de variação (CV) é uma medida de dispersão cujo objetivo é apresentar a variabilidade da distribuição em termos percentuais (%). A fórmula fórmula do
(o resultado resultado neste caso é expresso expresso em percentual, percentual, entretanto entretanto
pode ser expresso também através de um fator decimal, desprezando assim o valor 100 da fórmula). Quando o desvio padrão calculado for o populacional, usa-se:
Ç Ã O ! A T E N
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Interpretação do CV: Até 15% variação pequena; De 15% a 30% variação média; 30% ou mais variação grande.
Exemplo: Observe a tabela a seguir, seguir, com os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos. TABELA 33 - COMPARAÇÃO ENTRE A MÉDIA E O DESVIO PADRÃO
Discriminação
Média
Desvio Padrão
Estaturas
170 cm
10 cm
Pesos
68 kg
7 kg
FONTE: A autora
Agora responda, responda, qual das medidas (estatura (estatura ou peso) possui possui maior homogeneidade? homogeneidade? Resposta: Teremos Teremos que calcular o coeciente de variação var iação da estatura e o coeciente de
variação do peso, porque só o desvio padrão não informará qual a distribuição é mais dispersa (como discutido acima), uma vez que os valores são numericamente diferentes (enquanto a
UNIDADE 2
TÓPICO 2
109
altura varia na casa das centenas, o peso está na casa das dezenas). O resultado menor será o de maior homogeneidade homogeneidade (menor dispersão ou variabilidade). Para isso, basta substituir os dados na fórmula:
CV estatura = CV peso =
= 5,88% = 10,29% .
Assim, apesar de nesse grupo de indivíduos o desvio padrão padrão ser menor nos nos dados relativos aos pesos, as estaturas apresentam menor grau de dispersão que os pesos, visto
apresentarem um coeciente de variação menor.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
110
TÓPICO 2
UNIDADE 2
RESUMO DO TÓPICO 2
Neste tópico, você viu que: • O desvio padrão é a
medida de dispersão mais empregada na Estatística.
• Para o cálculo do desvio
padrão para dados amostrais é feito usando-se a fórmula:
• Para dados populacionais, usamos a fórmula:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
O CV é usado para comparar a variabilidade entre duas grandezas com unidades diferentes, uma vez que apresenta o resultado da variabilidade em percentual. •
• O coeciente de variação
populacional: populacional:
• O coeciente de variação
amostral:
UNIDADE 2
111
TÓPICO 2
E D A D T I V I A O A U T
Acadêmico, o processo de cálculos na Estatística pode parecer complicado no começo. Porém, não desista! É normal escolhermos caminhos que não nos levem à resposta esperada nas primeiras tentativas, mas o importante é reconhecer que a escolha foi errada e recomeçar outra vez. Lápis, borracha e mãos à obra!
1 (ENADE 2012) . As ações ações das companhias AAA e ZZZ apresentaram apresentaram a seguinte série histórica de cotações em determinado mês, em reais. DIAS
AAA
ZZZ
1
10,00
20,00
2
10,00
23,00
3
12,00
22,00
4
12,00
24,00
5
16,00
25,00
6
13,00
28,00
7
12,00
28,00
8
15,00
25,00
9
10,00
28,00
10
10,00
27,00
AAA
ZZZ
Média
12,00
25,00
Moda
10,00
28,00
Mediana
12,00
25,00
Variância
4,6667
7,7778
Desvio padrão
2,1602
2,7889
Dados estatísticos
Com base nas estatísticas apresentadas apresentadas acima, avalie as proposições que seguem: I. O desvio padrão das cotações das ações da empresa AAA mostra que houve uma variação em torno da mediana de 2,1602 pontos para cima ou para baixo.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
112
TÓPICO 2
UNIDADE 2
II. A média da soma dos quadrados dos erros (variância) da cotação das ações da empresa AAA é 4,6667.
III. A média das cotações das ações da empresa ZZZ mostra que R$ 25,00 é o valor mais frequente na sua série histórica.
IV. IV. A mediana da cotação das ações da empresa AAA corresponde à média dos extremos de sua série histórica.
V. O valor mais frequente da cotação das ações da empresa ZZZ foi 28,00. Assinale a alternativa alternativa CORRETA: CORRETA:
a) As sentenças I e V estão corretas. b) As sentenças I, III e IV estão corretas. c) As sentenças II e V estão corretas. d) As sentenças III e IV estão corretas. 2 Uma pesquisa estatística que buscou vericar o perl do estilo de vida considerando cinco fatores (nutrição, atividade física, comportamento preventivo, relacionamento
social e controle do estresse) foi observada em dois grupos (A e B) de empresas, B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
apresentando apresentando os resultados seguintes: A: Média 20 - Desvio padrão 4 B: Média 10 - Desvio padrão 3 Assinale a alternativa alternativa CORRETA: CORRETA:
a) No grupo B, os dados apresentam maior dispersão absoluta. absoluta. b) A dispersão absoluta de cada grupo é igual à dispersão relativa. c) A dispersão relativa do grupo B é maior do que a dispersão relativa do grupo A. d) A dispersão relativa dos dados entre os grupos A e B é medida pelo quociente da diferença de desvios padrão pela diferença de médias.
UNIDADE 2
TÓPICO 3 SÉRIES E GRÁFICOS GRÁFICO S ESTATÍSTICOS ESTATÍSTICOS
1 INTRODUÇÃO Caro acadêmico, tanto na Unidade 1 como nos tópicos anteriores, trabalhamos com diversas tabelas, que têm por objetivo fornecer informações rápidas e seguras a respeito das variáveis em estudo, para que assim se cumpra com a função da estatística, que é analisar dados, compreendendo o comportamento deles. Em uma pesquisa estatística, além do tamanho da amostra e da preocupação com os valores apresentados, visto que são provenientes de diversas fontes e, por isso, suscetíveis
a diferentes interpretações mediante a forma como são apresentados, apresentados, também é preciso ter atenção em como apresentamos esses dados.
Por este motivo, existem critérios cientícos, que vão além de calcular o número de classes e a amplitude do intervalo, que são utilizados para mel hor organizar os dados coletados
através da pesquisa estatística e reproduzir este conjunto de informações de uma forma que apresentem signicado claro e de fácil compreensão. Como você já observou, existem diversos tipos de tabelas e grácos e cada um deles deve ser utilizado para um m especíco. Desta forma, neste tópico iremos estudar quais os elementos necessários para construir uma tabela e um gráco que representem os dados de forma dedigna.
2 SÉRIE ESTATÍSTICA ESTATÍSTICA Séries estatísticas são tabelas que apresentam o agrupamento de um conjunto de dados estatísticos em função de uma época, local ou espécie. Assim, podemos dizer que uma
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
114
TÓPICO 3
UNIDADE 2
série estatística é um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. É também um meio eciente de apresentar os resultados estatísticos obtidos, por proporcionar uma maior clareza, objetividade e compreensão do conjunto, oferecendo vantagens vantagens para a análise matemática das variáveis relacionadas. Porém, essa representação não deve ser realizada conforme o entendimento de cada
um. Você já se perguntou por que uma tabela tem título, ou já observou que ela não é fechada nas laterais?
Nós respondemos: porque no Brasil a apresentação tabular (através de tabelas) é regida pelas normas de apresentação tabelar do IBGE (1993) / NBR 14724 da ABNT. Nesta norma estão descritos alguns elementos principais para a elaboração de uma série estatística. São eles: Título: conjunto de informações sobre a tabela ( O quê? Quando? Onde?) localizado no a) Título: topo da tabela. Corpo: conjunto de linhas e colunas que contém os valores das variáveis em estudo. b) Corpo: c) Casa ou célula: espaço destinado a uma só informação, encontro de uma linha com
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
uma coluna. Cabeçalho: parte superior da tabela (1ª linha) que especica o conteúdo das colunas. d) Cabeçalho: e) Linha: retas imaginárias no sentido horizontal que auxiliam na leitura das informações. indicadora: é a primeira coluna que indica o conteúdo das linhas. f) Coluna indicadora: g) Coluna numérica: parte da tabela que contém os dados apresentados. h) Elementos complementares: colocados no espaço abaixo da tabela (rodapé): • fonte: é a indicação da entidade responsável pelo fornecimento dos dados ou sua • •
elaboração; notas: são informações de natureza geral identicadas por algarismos romanos; chamadas: são informações de natureza especíca identicadas por algarismos arábicos, entre parênteses, escritos escr itos no corpo da tabela à esquerda das casas e à direita da coluna indicadora.
FONTE: Adaptado de: . Acesso em: 21 ago. 2016.
UNIDADE 2
TÓPICO 3
115
Exemplo: Observe a tabela abaixo: Título. Obrigatoriamente deve responder às perguntas: O que? Onde? Quando? TABELA 34 - PAÍSES RECORDISTAS DE MEDALHAS DOS
JOGOS OLÍMPICOS DE VERÃO (DE 1896 A 2008) Cabeçalho
s e r s a o t t n n e e m m e e l l p E m o c
País
Número Total de Medalhas
Estados Unidos
2296
União Soviética
1010
Alemanha
851
Grã-Bretanha
715
França
632
C o r p o d a t a b e l a / s é r i e
FONTE: Adaptado de:
eua-lideram/>. Acesso em: 16 jul. 2016.
1. (chamada) I. (nota)
É importante, acadêmico, que você perceba que nesta tabela podemos observar todos os elementos essenciais e complementares complementares apresentados até o momento.
O título da Tabela é “Países recordistas de medalhas dos Jogos Olímpicos de Verão (de 1896 a 2008)”. Pelo título é possível sabermos que as informações contidas na série se referem aos países com o maior número de medalhas nos Jogos Olímpicos de Verão no período de 1896 a 2008. No cabeçalho, observamos que a tabela está dividida em País e Número Total de Medalhas. Na coluna indicadora, temos os países recordistas de medalhas nos Jogos Olímpicos de Verão. Na coluna numérica, a quantidade de medalhas conquistadas
por cada país. Abaixo da T Tabela, abela, temos o elemento complementar compl ementar (fonte) indicando indi cando a entidade responsável pelo fornecimento dos dados. Além destes elementos essenciais, devemos seguir algumas regras para apresentação apresentação
da tabela/série: toda tabela/série deve ser clara, simples e completa, dispensando a consulta ao texto; • as tabelas/série não são fechadas nas laterais; • as tabela/série são fechadas em cima e embaixo com traços horizontais mais grossos; • uma casa nunca deve car em branco; • para englobar várias especicações usamos “outros”. •
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
116
TÓPICO 3
UNIDADE 2
Algumas normas para para o preenchimento preenchimento das células: células: •
usar um traço horizontal (—) quando o valor é nulo quanto à natureza das coisas ou
resultado do inquérito. • três pontos (...) quando não
temos dados. • um ponto de interrogação (?) quando temos dúvida quanto à exatidão do valor. • zero (0; 0,0; 0,00) quando o valor é muito pequeno para ser expresso pela grandeza utilizada.
Por m, para a data de referência dos dados, devemos: • indicar
sempre a data do fenômeno estudado; • não pontuar m de data; • os meses são observados pelas três primeiras letras, exceto maio, que se escreve por extenso; • série de anos consecutivos. Exemplo: 1890-990 (quando diferem os séculos), 1987-92 (quando for o mesmo século); • série de anos
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
não consecutivos. Exemplo: 1989-1998.
FONTE: Disponível em: . Acesso em: 21 21 ago. 2016. 2016.
! N T E R T A I M P O
Todas estas normas têm por objetivo padronizar o tratamento dos dados estatísticos, permitindo uma maior clareza, objetividade e melhor visão do conjunto.
Toda série é uma tabela, mas nem toda t oda tabela é uma série, pois exige ex ige homogeneidade, homogeneida de, classicação, critério de modalidade: espécie, local ou época. As séries estatísticas representam um conjunto de informações ou observações através do tempo ou dentro de um determinado espaço ou, ainda, com relação a um fenômeno. Série é um conjunto de números associados a fenômenos dispostos em correspondência com critério de modalidade, ou seja, apresenta a distribuição de um conjunto de dados estatísticos em função da época, local ou espécie. Até o momento estudamos os elementos que constituem uma séri série e estatística. A partir de agora, veremos que uma série estatísti ca pode
ser classicada segundo o tipo de informação que representa.
UNIDADE 2
117
TÓPICO 3
2.1 TIPOS DE SÉRIES SÉ RIES Como vimos, séries estatísticas consistem na apresentação dos dados estatísticos
em forma de tabelas com o objetivo de sintetizar as informações obtidas em uma pesquisa estatística, tornando-as mais compreensíveis.
As séries estatísticas levam em consideração um fenômeno observado, podendo se referir a uma época, a um espaço geográco, a uma categoria ou, ainda, podemos ter uma junção de dois tipos de séries. Portanto, na sequência veremos as classicações das séries estatísticas e quais elementos que são comuns a elas.
2.1.1 Séries históricas, cronológicas ou temporais São as séries que descrevem uma determinada informação da variável em determ inado
local, apresentados em intervalos de tempo, ou seja, o tempo varia, porém o lugar e o fato permanecem os mesmos. Exemplo: TABELA 35 - SEDENTARISMO POR GÊNERO NO BRASIL A CADA 100 HABITANTES – 1991/2000
Anos de referência
Homens
Mulheres
1991
62,6
69,8
1998
60,4
67,2
1999
55,6
62,3
2000
54,8
57,6
FONTE: A autora
Note, acadêmico, que o fenômeno (sedentarismo por gênero no Brasil a cada 100 habitantes) e o local (Brasil) são elementos xos. Enquanto que a época (tempo de 1991 a 2000) é um elemento variável, ou seja, a cada ano observa-se dados diferentes para o fato analisado.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
118
UNIDADE 2
TÓPICO 3
2.1.2 Séries geográcas, espaciais, territoriais ou de localização São as séries em que os valores da variável são descritos em determinado instante conforme a região. Desta forma, há a variação do local, porém a época e a espécie permanecem
xas. Exemplo 1: Um levantamento que representa uma série geográca foi realizado
pelo Instituto Brasileiro de Geograa e Estatística (IBGE) para o Ministério do Esporte, e o apresentamos apresentamos a seguir: TABELA 36 - ÍNDICE DE POPULAÇÃO SEDENTÁRIA POR PAÍS - 2013
B I O E S T A T Í S T I C A
F Í S I C A
Sedentários (em %)
Itália
48
Espanha
35
França
22
Inglaterra
17
Portugal
53
FONTE: Adaptado de: . Acesso em: 19 1 9 jul. 2016.
Observe que o fenômeno (índice de população sedentária por país) e a época (2013) são elementos xos. Enquanto que o local (países) é o elemento variável, ou seja, para cada país citado têm-se dados diferentes para o fato analisado. Exemplo 2: Na sequência, apresentamos outro exemplo sobre séries geográcas: TABELA 37 - INDICADORES DE GASTO NACIONAL EM SAÚDE DE ALGUNS PAÍSES - 2007
E M E D U C A Ç Ã O
P aí s
País
Gasto geral do governo Gasto total em saúde Gasto total em Gasto geral do como proporção do como proporção do saúde per capita governo p er gasto total em saúde PIB (%) (US$) capita (US$) (%)
Argentina
10
50,8
1.322
671
Austrália
8,9
67,5
3.357
2.266
Brasil
8,4
41,6
837
348
Canadá
10,1
70
3.900
2.730
Chile
6,2
58,7
863
507
Dinamarca
9,8
84,5
3.513
2.968
Espanha Reino Unido
8,5 8,4
71,8 81,7
2.671 2.992
1.917 2.446
FONTE: Ministério da Saúde
UNIDADE 2
TÓPICO 3
119
Neste exemplo, o fenômeno são os indicadores de gasto nacional em saúde de alguns países no ano de 2007, que são elementos xos. O elemento variável é o local onde estes indicadores foram analisados.
2.1.3 Séries especícas ou categóricas Os valores da variável são escritos em um determinado tempo e local, classicados conforme categorias. Sendo assim, varia v aria a espécie, porém a época e o local permanecem xos. x os. Exemplo:
U N I
Acadêmico, veja um trecho da pesquisa realizada pelo IBGE (Instituto Brasileiro de Geograa e Estatística) para o Ministério do Esporte em 2013 sobre a prática do esporte no Brasil. Na fonte, você encontra a pesquisa completa. B I O E S T A T Í S T I C A E M
FONTE: Disponível . Acesso em: 19 jul. 2016.
E D U C A Ç Ã O F Í S I C A
120
UNIDADE 2
TÓPICO 3
TABELA 38 - CONDIÇÃO FÍSICA DE 8.902 PESSOAS NO BRASIL EM 2013
Condição Física
Número de Pessoas
Sedentários
4.005,9
Praticantes de Atividade Física
2.537,07
Praticantes de Esportes
2.278,912
FONTE: IBGE
Acadêmico, perceba que a condição física de 8.902 pessoas é o elemento variável desta série, uma vez que a condição física de uma pessoa nesta pesquisa foi classicada em sedentária, praticante de atividade física ou praticante de esportes. Por outro lado, a época
(2013) e o local (Brasil) são os elementos xos.
2.1.4 Séries conjugadas São as tabelas de dupla entrada, também denominadas de mistas. Constituem-se da conjugação de uma ou mais séries. B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Exemplo: Podemos ter a conjugação de uma série geográca com uma série histórica. TABELA 39 - TERMINAIS TELEFÔNICOS EM SERVIÇO NO BRASIL
Regiões
1991
199 2
Norte
342.938
375.658
Sudeste
6.234.501
6.729.467
Sul
1.497.315
1.608.989
FONTE: Ministério das Comunicações
Exemplo: Podemos ter a conjugação de uma série geográca com uma série especíca. TABELA 40 - MATRÍCULAS NA INSTITUIÇÃO X - 2015
Curso
Blumenau
Indaial
Administração
32
45
Direito
28
51
Educação Física
24
41
Engenharia Civil
23
35
FONTE: A autora
Acadêm Aca dêmico ico,, vistos vis tos os tipos tip os de séries sér ies estatí est atísti sticas cas,, estuda est udarem remos os ago agora ra sob sobre re a representação representação gráca destas séries.
UNIDADE 2
TÓPICO 3
121
3 GRÁFICO ESTATÍSTICO ESTATÍSTICO
O gráco estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os grácos falam mais rápido à compreensão que as séries. A representação gráca de um fenômeno fenômeno deve obedecer a certos certos requisitos requisitos fundamentais: fundamentais: a) simplicidade: o gráco deve ser destituído de detalhes com importância i mportância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros; b) clareza: o gráco deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo; c) veracidade: o gráco deve expressar a verdade sobre o fenômeno em estudo. Assim como para as as tabelas, os grácos grácos possuem as as seguintes normas normas de construção: construção: • • • • • •
título e fonte: os mesmos da série; notas e chamadas: os mesmos da série; legendas: todas iguais colocadas abaixo ou ao lado direito do gráco; leitura da esquerda para a direita; são incluídas no gráco, apenas as coordenadas indispensáveis à leitura; as linhas dos grácos devem ser destacadas das demais, usando cores ou espessuras diferentes.
FONTE: Adaptado de: . 95>. Acesso em: 21 ago. 2016.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
122
UNIDADE 2
TÓPICO 3
U N I Acadêmico, note estes elementos nos gráficos que apresentaremos a seguir, pois agora que aprendemos as normas de construção dos grácos estatísticos, dedicaremos nossos estudos aos tipos de grácos mais utilizados para representar dados.
3.1 GRÁFICOS EM LINHA OU CURVA Este tipo de gráco é composto por dois eixos, um vertical e outro horizontal, e por uma linha poligonal para representar a série estatística. Exemplo: NATAÇÃO DA ACADEMIA X TABELA 41 - ALUNOS NO CURSO DE NA B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Ano
Número de alunos
2010
47
2011
53
2012
32
2013
71
2014
63
2015
51
FONTE: A autora
Com os dados estatísticos apresentados na série temporal acima, podemos elaborar um gráco em linha que representa a evolução das matrículas matrí culas no curso de natação da academia X.
UNIDADE 2
TÓPICO 3
123
GRÁFICO 1 - ALUNOS NO CURSO DE NATAÇÃO DA ACADEMIA X
FONTE: A autora
O gráco de linha é mais utilizado nas séries cronológicas, em que a variável tempo é representada representada no eixo horizontal e as quantidades quantidades respectivas, no eixo vertical.
Acadêmico, note que os grácos são representações representações visuais dos dados estatísticos que correspondem às tabelas estatísticas, que devem trazer simplicidade e veracidade para as informações apresentadas. apresentadas.
3.2 GRÁFICOS EM COLUNAS COLUNA S OU EM BARRAS Este tipo de gráco é composto por dois eixos, um vertical e outro horizontal, em que os dados estatísticos são representados através de retângulos dispostos verticalmente (colunas) ou horizontalmente (barras) de acordo com sua intensidade. Exemplo: Observe a seguinte situação: A Copa do Mundo FIFA, FIFA, mais conhecida tradicionalmente no Brasil pelo antigo nome
"Copa do Mundo", é uma competição internacional de futebol que ocorre a cada quatro anos. O formato atual do Mundial é com 32 equipes nacionais disputando por um período de cerca de um mês. A Copa do Mundo FIFA é o evento esportivo mais assistido em todo o mundo e,
principalmente para o povo brasileiro, simboliza a união de uma nação em prol do esporte. Apenas oito países foram campeões mundiais até hoje, conforme podemos observar na tabela a seguir. O Brasil, a única seleção a ter jogado em todas as competições, é o maior campeão, com cinco títulos.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
124
UNIDADE 2
TÓPICO 3
TABELA 42 - PAÍSES CAMPEÕES DA COPA DO MUNDO, 1930 - 2014
País
Número de Copas Ganhas
Argentina
2
Alemanha
4
Brasil
5
Espanha
1
França
1
Inglaterra
1
Itália
4
Uruguai
2
Total
20
FONTE: . Acesso em: 19 jul. 2016.
A partir dos dados apresentados na tabela acima, é possível construir os seguintes grácos: GRÁFICO 2 - NÚMERO DE TÍTULOS POR PAÍS EM COPAS DO MUNDO, 1930 - 2014 B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
FONTE: A autora
UNIDADE 2
TÓPICO 3
125
GRÁFICO 3 - NÚMERO DE TÍTULOS POR PAÍS EM COPAS DO MUNDO,1930 - 2014
FONTE: A autora
O primeiro gráco apresentado trata-se de um gráco de colunas, enquanto que o segundo é um gráco de barras. Observe que em ambos a representação gráca dos dados apresentados apresentados na série estatística foi feita de forma clara e concisa.
3.3 GRÁFICO EM SETORES S ETORES É a representação gráca dos dados estatísticos em um círculo através de setores. As áreas são diretamente proporcionais aos valores da série, que podem ser expressos em números ou em porcentagens. Este gráco é utilizado quando queremos evidenciar
tendências percentuais e não apenas os totais absolutos pesquisados. Usado em séries geográcas e especícas.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
126
TÓPICO 3
UNIDADE 2
GRÁFICO 4 - NÚMERO DE TÍTULOS POR PAÍS EM COPAS DO MUNDO, 1930 - 2014
FONTE: A autora.
B I O E S T A T Í S T I C A
! N T E R T A O P I M
Acadêmico, observe que neste gráco os setores circulares devem ter cores diferentes e devem ser colocadas legendas leg endas relativas aos setores, de modo a ser possível interpretar o gráco.
3.4 PICTOGRAMAS
E M
A representação representação gráca por pictogramas, pictogramas, como o próprio nome sugere, utiliza guras que remetem à ideia dos dados em questão. Este tipo de representação tem como objetivo
E D U C A Ç Ã O
atrair a atenção do leitor.
F Í S I C A
Exemplo:
UNIDADE 2
TÓPICO 3
127
FIGURA 9 - NÚMEROS DO ESPORTE
FONTE: Disponível em: <le:///C:/Users/User/Documents/estatisica-01%20(1).pdf>. Acesso em: 20 jul. 2016.
Estes grácos são uma ilustração relacionada com o fenômeno em estudo sem a preocupação de mostrar dados precisos. São muito utilizados em propagandas (de jornais, revistas e televisão, entre outras formas). Acadêmico, Acadêmic o, vimos nesta unidade que grácos são instrumentos instrum entos que possibilitam possibi litam transmitir o signicado das séries estatísticas de uma forma mais eciente e clara. Lembre-se de que para criar um gráco é preciso conhecer o tipo de informação que se deseja transmitir, pois cada tipo de gráco é adequado para representar um determinado fenômeno.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
128
TÓPICO 3
UNIDADE 2
RESUMO DO TÓPICO 3
Neste tópico, estudamos sobre os critérios que devem ser utilizados util izados para construir séries e grácos estatísticos, bem como suas classicações. Sobre este assunto, destacamos que: •
Tabela é um conjunto de dados estatísticos associados a um fenômeno, dispostos numa ordem de classicação, numa organização racional e prática de apresentação. apresentação.
•
Série é uma forma de organização mais completa e requer certas regras de construção.
•
Toda série é uma tabela, mas nem toda tabela é uma série, pois esta exige homogeneidade, classicação, critério de modalidade, segundo espécie, local ou época.
• •
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
O gráco estatístico é uma forma de apresentação dos dados estatísticos cujo objetivo objetiv o é o de produzir uma impressão mais rápida e viva do fenômeno em estudo. Os principais grácos estatísticos são: gráco de linhas, colunas, barras ou setores.
UNIDADE 2
E D A D T I V I A O A U T
TÓPICO 3
129
Acadêmico, um dos princípios princípi os da UNIASSELVI é “Não basta saber, é preciso saber fazer”. Agora, chegou a sua vez de colocar em prática os conceitos sobre séries e grácos estatísticos, estudados neste tópico.
1 Os grácos são uma forma de representação dos dados estatísticos, que têm o objetivo de produzir uma impressão rápida e viva de um determinado fenômeno em estudo. Diante dos conceitos estudados estuda dos neste tópico, assinale a alternativa alternat iva CORRETA:
( ) Um gráco de barras ou colunas colunas é aquele aquele em que os retângulos retângulos que o compõem compõem estão dispostos horizontalmente. horizontalmente.
( ) Um gráco de barras ou colunas colunas é aquele aquele em que os retângulos retângulos que o compõem compõem estão dispostos verticalmente.
( ) Um gráco de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e um gráco de colunas, horizontalmente. ( ) Um gráco de barras é aquele em que os retângulos que o compõem estão dispostos horizontalmente horizontalmente e um gráco de colunas, verticalmente. 2 As séries estatísticas podem ser classicadas de acordo com o critério de modalidade em espécie, local ou época. Pelo exposto, quando uma série estatística é denominada Temporal?
( ( ( ( (
) Quando Quando o elemento variável é o tempo. tempo. ) Quando Quando o elemento variável é o local. ) Quando Quando o elemento variável é a espécie. espécie. ) Quando é o resultado da combinação de séries estatísticas estatísticas de tipos diferentes. diferentes. ) Quando os os dados são agrupados em em subintervalos do do intervalo observado. observado.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
130
TÓPICO 3
UNIDADE 2
A Ç Ã O I A A V A L
Prezado acadêmico, agora que chegamos ao final da Unidade 2, você deverá fazer a Avaliação referente a esta unidade.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 3
INTRODUÇÃO AOS TESTES ESTATÍSTICOS OBJETIVOS DE APRENDIZAGEM A partir desta unidade você será capaz de: •
utilizar os conceitos e as definições de variáveis aleatórias nas distribuições de probabilidade; probabilidade;
•
realizar testes de hipótese;
•
relacionar linearmente duas variáveis quantitativas;
•
planejar, estruturar e realizar trabalhos de pesquisa voltados à Educação Física, obedecendo aos tópicos ensinados sob os aspectos bioestatísticos;
•
discutir e relatar os resultados obtidos a partir de pesquisas.
PLANO DE ESTUDOS Esta unidade está dividida em três tópicos e em cada um deles você encontrará atividades que o ajudarão a aplicar os conhecimentos apresentados.
TÓPICO 1 - INTRODUÇÃO À PROBABILIDADE TÓPICO 2 - TESTES DE HIPÓTESES TÓPICO 3 - REGRESSÕES E CORRELAÇÕES
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 3
TÓPICO 1 INTRODUÇÃO À PROBABILIDADE
1 INTRODUÇÃO Já destacamos que a bioestatística é um esforço de aplicar regras matemáticas a uma ciência experimental. E, para utilizar essa ferramenta, além da estatística paramétrica,
precisamos nos basear em suposições, que constituem no pilar de todo o procedimento, e estas serão estudadas com os detalhes necessários para que você, acadêmico, saiba tomar decisões. Para isso, adentraremos ao mundo das probabilidades, em que aprenderemos sobre distribuição de probabilidades e, ao nal, será possível calcular as probabilidades probabilidades de aceitar ou rejeitar os dados de uma amostra.
2 DISTRIBUIÇÃO NORMAL A distribuição de probabilidade probabilidade normal trabalha trabalha com variáveis variáveis aleatórias aleatórias contínuas, contínuas, e é de longe a mais comum, pois é a que ocorre com mais frequência na natureza. A distribuição normal é denida pelos parâmetros parâmetros e σ (média (média e desvio padrão), padrão), e a sua função densidade de probabilidade é denida por:
Como é possível observar a seguir, a curva Normal tem o aspecto de sino.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
134
TÓPICO 1
UNIDADE 3
FIGURA 10 - GRÁFICO DA CURVA DE DISTRIBUIÇÃO NORMAL
FONTE: A autora
= 0 e σ = 1, chamamos essa curva de distribuição Normal Padrão e sua função densidade de probabilidade se reduz a: Quando tivermos
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
É possível transformar qualquer distribuição Normal para uma distribuição Normal Padrão, inclusive já existe uma tabela Z (Apêndice A) que contém todas as soluções de que você precisará, portanto não terá que usar as funções anteriores para determinar os resultados das probabilidades. O que se faz é transformar uma distribuição Normal qualquer para uma distribuição Normal Padrão e, a partir daí, chegar à probabilidade procurada procurada por meio da tabela Z.
2.1 TABELA Z Existem vários tipos de tabelas que apresentam as probabilidades sob a curva Normal Padrão. A que será utilizada apresenta a probabilidade de a variável aleatória Z ser menor que z. (Apêndice A).
UNIDADE 3
TÓPICO 1
135
Como a área sob a curva de densidade é 1, a probabilidade de a variável aleatória Z ser maior que z é obtida fazendo: • P (Z > z), se z
> 0.
• P (Z > z), se z
< 0.
Ainda podemos podemos ter a probabilidade probabilidade de a variável aleatória Z estar entre 0 e z. • P (Z < z) – 0,5, se z
>0
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
136
TÓPICO 1
• 0,5 – P(Z < z), se z
UNIDADE 3
<0
Para saber a probabilidade de Z estar entre z 1 e z2, com z2 < z1, precisamos fazer: • P(Z < z2 ) – P(Z
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
! N T E R T A O P I M
Na tabela Z, o número padronizado z é formado por três dígitos: a (parte inteira), b (parte decimal) e c (parte centesimal), z = a,bc. A parte inteira e a decimal (a,b) aparecem na primeira coluna da tabela z, e a parte centesimal você procura na primeira linha da tabela Z.
Vejamos, agora, alguns exemplos: Exemplo 1: Utilize a tabela Z (Apêndice A) para calcular a probabilidade de Z ser maior
que 1,75. Em símbolos: P(Z > 1,75). Solução: Em z = 1,75 deve-se procurar 1,7 na 1ª coluna e 0,05 na 1ª linha, o cruzamento
dessas duas coordenadas é a P(Z < 1,75) = 0,9599. Como você precisa encontrar P(Z > 1,75), deverá fazer 1 - P(Z < 1,75), então:
UNIDADE 3
TÓPICO 1
137
P(Z > 1,75) = 1 – 0,9599 = 0,0401. Exemplo 2: Utilize Utiliz e a tabela Z (Apêndice A) para calcular a probabilidade de Z ser menor
que – 1,6. Em símbolos: P(Z < -1,6). Solução: Como a curva é simétrica em relação à média 0, a P(Z < -1,6) é igual a P(Z >
1,6). Assim, P(Z < -1,6) = P(Z > 1,6) = 1 – P(Z > 1,6). Procurando z = 1,6 na tabela Z (1,6 parte inteira e a decimal, e 0,00 parte centesimal), temos que P(Z > 1,6) = 0,9452, então: P(Z < -1,6) = P(Z > 1,6) = 1 – P(Z > 1,6) = 1 – 0,9452 = 0,0548. Exemplo 3: Utilize a tabela Z (Apêndice A) para calcular a probabilidade de Z ser maior
que 0 e menor que 2,65. Em símbolos: P(0 < Z < 2,65). Solução: Acadêmico, note que P(0 < Z < 2,65) = P(Z < 2,65) – 0,5. Procurando z =
2,65 na tabela Z (2,6 parte inteira e a decimal, e 0,05 parte centesimal), temos que P(Z < 2,65) = 0,9960, então: P(0 < Z < 2,65) = 0,9960 – 0,5 = 0,4960. Além desses tipos de exemplos, nos testes de hipóteses é comum querer saber que valor de z produz uma determinada determinada área sob a curva Normal Padrão, Padrão, de –z até z; ou seja, realizar o processo inverso que zemos. Vejamos um exemplo disso. Responda: para que valor val or de z temos uma área sob a curva curv a normal padrão de 0,90, de –z até z?
A gura gura a seguir ilustra ilustra essa pergunta: pergunta:
B I O E S T A T Í S T I C A E M
Acadêmico, lembre-se de que que a curva normal padrão é simétrica e sua área total total sob a curva é 1, logo, se a parte pintada tem área 0,90, falta 0,10 para fechar a área 1. Observe que a área branca sob a curva vale 0,05 (0,10/2). Assim, podemos substituir a pergunta para: qual valor de z deixa uma área menor que 0,95?
E D U C A Ç Ã O F Í S I C A
138
TÓPICO 1
UNIDADE 3
Para solucionarmos, basta localizar 0,95 no corpo da tabela Z (Apêndice A) para encontrar o valor de z.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Verica-se que na tabela o valor 0,95 está entre 0,9495 e 0,9505, então podemos dizer que z está entre 1,64 e 1,65. Calculando a média [(1,64 + 1,65)/2] entre esses dois valores, z = 1,645. Agora que você já sabe como usar a tabela Z, acompanhe acompanhe a resolução do exemplo a seguir, seguir, que pode ser resolvido através de uma distribuição normal. Exemplo 4: As 4: As alturas de uma população têm média 1,70 m e desvio padrão de 0,2 m. Um
pesquisador, pesquisador, ao tomar uma pessoa desta população, pretende determinar qual é a probabilidade de:
i) encontrar alguém com altura superior a 1,80 m; ii) encontrar alguém com altura entre 1,40 m e 1,65 m; iii) encontrar alguém com altura inferior a 1,60 m. Solução: Note que = 1,70 e σ = 0,2, ou seja, tem-se um caso de distribuição normal, mas ainda
não se tem uma distribuição normal padrão, ou seja, não se pode usar a tabela Z. É preciso transformar essa distribuição normal em distribuição normal padrão usando:
UNIDADE 3
TÓPICO 1
139
i) Queremos calcular a probabilidade de encontrar alguém acima de 1,80 m, ou seja, P(X > 1,80). Transformando Transformando x = 1,80 em z padrão, temos:
O problema agora consiste em encontrar P(Z > 0,5). Como P(Z > 0,5) = 1 – P(Z < 0,5), temos que P(Z > 0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X > 1,80) = P(Z > 0,5) = 0,3085. Assim, o valor 0,3085 representa a probabilidade de encontrar alguém com mais de 1,80 m de altura.
ii) Devemos encontrar P(1,40 < X < 1,65), para isso precisamos transformar os valores x1 = 1,40 m e x 2 = 1,65 m em z 1 e z2 respectivamente. respectivamente.
Agora, o problema problema consiste em em encontrar P(-1,5 P(-1,5 < Z < -0,25) -0,25) usando a tabela Z. Como P(-1,5 < Z < -0,25) = P(Z < -0,25) – P(Z < -1,5) e P(Z < -1,5) = P (Z > 1,5) = 1 – P(Z < 1,5) = 1 – 0,9332 = 0,0668 P(Z < -0,25) = P (Z > 0,25) = 1 – P(Z < 0,25) = 1 – 0,5987 = 0,4013, temos: P(-1,5 < Z < -0,25) = 0,4013 – 0,0668 = 0,3345. Portanto, a P(1,40 < X < 1,65) = P(-1,5 < Z < -0,25) = 0,3345. iii) Queremos determinar a P(X < 1,60). Transformando o valor x = 1,60 em z padrão, obtemos:
Note que agora o problema consiste em encontrar a P(Z < -0,5) na tabela Z. Como a P(Z < -0,5) = P(Z > 0,5) e P(Z > 0,5) = 1 – P(Z < 0,5), temos que: P(Z < -0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X < 1,60) = P(Z < -0,5) = 0,3085.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
140
TÓPICO 1
UNIDADE 3
RESUMO DO TÓPICO 1
Neste tópico, você viu que: que:
Se uma variável aleatória X tem distribuição normal de média μ e variância σ 2 , podemos transformá-la numa variável aleatória Z de distribuição normal padrão de média 0 e •
variância 1, através da fórmula:
• A curva Normal
Padrão Padrão é simétrica simétrica em em relação relação à média 0 e a área área sob essa essa curva curva é 1.
• A tabela Normal Padrão (Apêndice A) apresenta apresenta a probab probabilidade ilidade de a variável aleatória
Z ser menor que z. B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 3
E D A D T I V I A O A U T
TÓPICO 1
141
Acadêmico, agora é a sua vez de exercitar o que aprendeu até aqui! Lembre-se de que você tem à disposição materiais complementares em seu Ambiente Virtual de Aprendiza Aprendizagem. gem. Consulte-o Consulte-oss sempre sempre que nece necessári ssário. o. Conte Conte também também com a tutoria tutoria interna, interna, que está disponível por meio do 0800, contato e atendimento on-line. Bons estudos!
1 É possível transformar qualquer distribuição Normal para uma distribuição Normal Padrão, inclusive já existe uma tabela Z que contém todas as soluções. Utilize a tabela Z para calcular a probabilidade de Z ser menor que 3,75. a) ( b) ( c) ( d) (
) P = 0,0001. ) P = 0,5000. ) P = 0,1000. ) P = 0,9999.
2 Em estatística, um intervalo de conança é o intervalo estimado em que a média de um parâmetro de uma amostra tem uma dada probabilidade de ocorrer. Quando, num teste, é dito que o nível de signicância é de 3%, então o nível de conança será: a) ( b) ( c) ( d) (
) de 97%. ) de 0,03%. ) de 0,97%. ) de 3%.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
142
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
TÓPICO 1
UNIDADE 3
UNIDADE 3
TÓPICO 2 TESTES DE HIPÓTESES
1 INTRODUÇÃO Até este momento já aprendemos aprendemos muitos conceitos importantes para interpretar as características de uma determinada determinada população população ou amostra, como: como: média, variância, desvio padrão e proporção, bem como apresentá-los em séries e tabelas estatísticas. E nesta terceira
unidade daremos continuidade a esse estudo, aprendendo como testar nossas suposições e a elaborar uma hipótese estatística, relacionadas à estatística não paramétrica e aos estudos de correlação e regressão. Testes como estes são necessários necess ários porque em alguns casos não é possível pos sível reunir todos
os dados de uma população para aferir o parâmetro desejado. Assim, os testes de hipóteses se baseiam na amostra, ou seja, em uma parte da população. Para obter um resultado conável em qualquer teste estatístico, o pesquisador deve se preocupar com a coleta de dados da amostra, pois se você cometer um “vício” na coleta da amostra, certamente comprometerá o resultado do teste, tornando-o tendencioso. Para
evitar essa possível inuência externa, existem metodologias de amostragem abordadas detalhadamente na Unidade 1 deste caderno de estudos. Se preciso, retorne àquelas
orientações. Assim, neste tópico, tópico, serão apresentados apresentados os testes testes de hipóteses. hipóteses.
2 TESTES CLÁSSICOS Em estatística, uma hipótese é uma alegação, ou armação, sobre uma característica de uma população, levando-se em consideração a observação de uma amostra. Por exemplo:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
144
TÓPICO 2
UNIDADE 3
“Pesquisadores médicos armam que a temperatura média do corpo humano não é igual a 37 °C”. A diculdade diculdade nestas nestas pesq pesquisas uisas é que a caracterís característica tica de interesse interesse varia em cada amostra, amostra, visto que a temperatura média do corpo humano varia de pessoa para pessoa, por esse motivo existe a necessidade de métodos estatísticos.
Desta forma, os testes de hipóteses servem para vericar se a diferença entre um parâmetro populacional populacion al e uma estimativa é atribuída à aleatoriedade da amostra ou a diferença é tão grande a ponto de haver desconança na integridade da amostra, ou seja, a intenção é analisar uma amostra para distinguir entre resultados que podem ocorrer facilmente e os que
dicilmente ocorrem. Para realizar um teste de hipóteses você deve formular duas hipóteses a respeito da armação, denominadas de H 0 e H1.
! N T E R T A O P M I
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Saiba que a hipótese H0 é chamada de hipótese nula, ou seja, é a hipótese que “anula” o teste. Enquanto a hipótese H1 ou hipótese alternativa é a que o teste quer provar. provar.
Acompanhe os exemplos a seguir seguir para compreender compreender estes conceitos. conceitos. Exemplo 1: Numa pesquisa para comparar a ecácia de emagrecimento em pessoas adultas entre duas enzimas, tem-se as seguintes hipóteses:
Considerando que podemos comparar a ecácia de emagrecimento por meio das médias de emagrecimento das duas enzimas (enzima 1 e 2), temos que 1 e 2 são as médias populacionais de emagrecimento de pessoas adultas tratadas pelas enzimas 1 e 2, respectivamente.
FONTE: Disponível em: . Acesso em: 20 jul. 2016.
UNIDADE 3
TÓPICO 2
145
Assim:
= da enzima 2). H0:
1
H1:
1
≠
(média de emagrecimento da enzima 1 é igual à média de emagrecimento
2
(média de emagrecimento da enzima 1 é diferente da média de emagrecimento
2
da enzima 2).
Ç Ã O ! A T E N
Acadêmico, é importante lembrar que: H0 hipótese nula, ou seja, a hipótese que “anula” o teste. H1 hipótese alternativa, a que o teste quer provar.
Exemplo 2: Numa pesquisa de qualidade, o INMETRO quer vericar se a resistência da cama elástica para Jump de uma determinada marca é menor que o valor K anunciado na
embalagem.
FONTE: < http://cdn1.mundodastribos.com/wp-admin/ uploads/2010/12/cama-elastica-para-ginasticapre%C3%A7os-onde-comprar.jpg> Acesso em: 20 jul. 2016.
Nesse caso: H0: = K (média de resistência da cama elástica para Jump é igual ao valor anunciado K). H1: < K (média de resistência da cama elástica para Jump é menor que o valor
anunciado X). Exemplo 3: Numa pesquisa para vericar se a média de idade de uma população é diferente de 30 anos, temos as seguintes hipóteses:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
146
TÓPICO 2
H0: H1:
UNIDADE 3
= 30 (média populacional é igual a 30 anos) ≠ 30 (média populacional é diferente de 30 anos)
Acadêmico, é válido destacar que quando você efetua um teste de hipótese sempre
obterá a resposta tendo como referência H 0, ou seja, se após o teste você vericar que a hipótese certa é a hipótese nula pode aceitar H0, mas se vericar que a hipótese certa é a hipótese alternativa deve rejeitar H0, ao invés de citar H 1.
U N I Claro que você já aprendeu, mas caso tenha esquecido, recorde agora! Igualdade (=). Exemplo: 7 = 3 + 4 (sete é igual a três mais quatro). Diferença (≠). Exemplo: 7 ≠ 3 + 3 (sete é diferente de três mais três). Maior que (>). Exemplo: 7 > 3 + 3 (sete é maior que três mais três). Menor que (<). Exemplo: 7 < 3 + 5 (sete é menor que três mais cinco).
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
3 ERROS DO TIPO I E II Por mais cuidado que se tenha ao coletar os dados de uma pesquisa, a estimação dos
dados jamais estará livre de erros. E, ao realizar um teste de hipóteses, existem dois tipos de erros que podem ser cometidos: Erro do tipo I ( a) Erro do tipo II ( β) A seguir, seguir, estudaremos o que cada um um representa.
U N I
Você já deve ter percebido, percebi do, em sua trajetória escolar esc olar,, que a utilização utilizaçã o das letras gregas é bem comum na matemática. Aqui iremos utilizar as letras gregas Alfa (a) e Beta (β).
UNIDADE 3
TÓPICO 2
147
3.1 ERRO DO TIPO I ( α) O erro do tipo I ( Α) signica rejeitar a hipótese nula (H 0), sendo que na verdade deveria
ter aceitado. É importante que essa probabilidade de cometer o erro do tipo I seja pequena, pois assim a chance de rejeitar uma hipótese verdadeira também será pequena. A essa proba probabilidad bilidadee dá-se o nome de nível de signicância signicância do teste, que é representad representadoo por α. O valor 1 – α representa a probabilidade de aceitar uma hipótese verdadeira quando ela é verdadeira, e a esse valor damos o nome de nível de conança. Cometer um erro do tipo I, no exemplo 1 visto anteri ormente, seria ter dito que as médias são diferentes quando na verdade elas são iguais.
! N T E R T A O P I M
O nível de signicância do teste a é denido no início do teste.
3.2 ERRO DO TIPO II ( β) O erro do tipo II ( Β) signica aceitar a hipótese nula (H 0) sendo que na verdade você
deveria ter rejeitado. Para este tipo de erro também se deseja que a probabilidade de cometêlo seja pequena, para que a chance de aceitar uma hipótese falsa seja, igualmente, pequena. pequena. Essa probabilidade é representada pela letra β e a diferença 1 – β representa a probabilidade de rejeitar uma hipótese falsa quando quando ela é falsa, e este valor (1 – β) é chamado de poder do teste. Cometer um erro do tipo II, no exemplo 1 visto anteriormente, seria ter dito que as médias são iguais quando na verdade elas são diferentes.
O quadro a seguir resume esses dois erros, veja:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
148
UNIDADE 3
TÓPICO 2
DECISÃO Rejeitar H0
REALIDADE H0 ve v erdadeira H0 falsa Sem erro Erro do tipo I (α)
Aceitar H0
Sem erro
Erro do tipo II (β)
Ç Ã O ! A T E N
O risco do erro do tipo I é dado por a. a é a probabilidade de rejeitarmos H0, quando H0 é verdadeira. 1 - a é a probabilidade (contrária) de aceitar H0, quando ela é verdadeira. E, neste caso, não cometemos erro, ou seja, sej a, a decisão é correta. O risco do erro do tipo II é dado por β. β é a probabilidade de aceitarmos H0, quando H0 é falsa. 1 - β é a probabilidade (contrária) de rejeitar H0, quando ela é falsa. E, neste caso, não cometemos erro, ou seja, a decisão é correta.
A seguir seguir veremos alguns alguns exemplos sobre sobre testes de hipóteses. hipóteses. B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
4 EXEMPLOS DE TESTES DE HIPÓTESES Este item é destinado às resoluções de alguns casos de testes de hipóteses, os conceitos que serão utilizados serão explicados passo a passo e os exemplos trabalhados em ordem crescente de diculdade. Acadêmico, os testes de hipóteses podem ser de três tipos diferentes, onde o que muda é a hipótese alternativa (H 1). Vejamos cada um deles a seguir:
a) teste bicaudal ou bilateral H0: = 150 H1:
≠ 150
UNIDADE 3
TÓPICO 2
149
U N I No caso do teste bicaudal, o valor α ca dividido para as duas regiões amarelas com área a 2 .
b) teste unicau dal à direita ou unilateral à direita H0: = 150 H1: > 150
c) teste unicaudal à esquerda ou unilateral à esquerda H0: = 150 H1:
< 150
A área das regiões regiões amarelas amarelas sob as cauda caudass da curva normal normal correspond correspondee à prob probabilid abilidade ade de cometer o erro do tipo I ( a). Essas regiões são limitadas pelo valor crítico a que divide a área sob a curva normal em duas regiões: Região de aceitação de H 0 e Região de rejeição de H 0. Acadêmico, não se preocupe com como e quando usar usar cada um dos tipos anteriores, anteriores, bem como a compreensão do que signica e como denir a(s) área(s) de rejeição de H 0 e a área de aceitação de H 0 nos testes de hipóteses. Isso será explicado nas resoluções dos próximos exemplos para desvio padrão conhecido e desvio padrão desconhecido, acompanhe!
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
150
TÓPICO 2
UNIDADE 3
4.1 TESTE DE HIPÓTESES PARA A MÉDIA QUANDO O DESVIO PADRÃO DA POPULAÇÃO É CONHECIDO O INMETRO fará uma inspeção numa fábrica de aparelhos para ginástica que arma que o diâmetro das suas camas elásticas de Jump segue uma distribuição normal com a média = 94 cm e desvio padrão populacional σ = 2 cm. Para a vericação, o inspetor recolheu uma amostra com 10 unidades em que obteve as seguintes medidas (em cm): 92, 97, 94, 95, 96, 97, 96, 95, 95, 94. O INMETRO admite um erro estatístico de 5% (nível de signicância 5%), ou seja, nível de conança 95%, em outras palavras a = 0,05. Solução: Fazendo a estimativa da média dos diâmetros das camas elásticas de Jump , temos:
Um pesquisador que não entende de estatística falaria que a média dos diâmetros das camas elásticas de Jump é maior que o informado pela fábrica, contudo nós sabemos que
estamos lidando com uma amostra e por isso temos que tomar cuidado nas conclusões, por B I O E S T A T Í S T I C A
isso que o teste de hipóteses é essencial. É esse teste que indicará se a diferença entre a média populacional ( = 94 cm) informada pela empresa e a estimativa θ 95,1 cm obtida através da amostra recolhida pelo pesquisador =
é signicante ou apenas casual devido à aleatoriedade da amostra. Como o objetivo do INMETRO é inspecionar se a média dos diâmetros das camas elásticas de Jump é diferente de 94 cm, devemos confrontar as seguintes hipóteses: H0: H1:
E M E D U C A Ç Ã O F Í S I C A
= 94 cm ≠ 94 cm
A distribuição distribu ição da média amostral , convenientemente padronizada, se comporta segundo um modelo Normal com = 0 e σ2 = 1. Essa padronização é feita por meio da fórmula:
Agora, para resolver o teste, teste, calcule calcule o valor z padronizado e o compare com os os valores valores críticos tabelados z tab. O valor ztab é obtido entrando na tabela Z (Apêndice A) com o valor 1 – a/2
= 1 – 0,05/2 = 1 – 0,025 = 0,975. Localizando este valor na tabela Z:
UNIDADE 3
TÓPICO 2
151
Para obter z tab devemos somar o valor inicial da linha com o valor inicial da coluna. Assim ztab = 1,9 + 0,06 = 1,96. Calculando z:
O valor 95,1 cm na curva normal é equivalente a 1,74 na curva normal padrão, veja o esquema:
E ! A N T O R T I M P
O Teorema Teorema Central do Limite garante ga rante que essa padronização, padronizaçã o, para n grande, segue um modelo normal, com média 0 e desvio padrão 1.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
152
TÓPICO 2
UNIDADE 3
Se a média amostral padronizada estiver na área de rejeição, ou seja, no exemplo for maior que o valor crítico 1,96 ou menor que o valor crítico -1,96, nós devemos rejeitar H 0, do contrário devemos aceitá-la. Neste caso, a média amostral (já padronizada) é 1,74, então temos: -1,96 < 1,74 < 1,96
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
O que indica que 1,74 está na região de aceitação de H 0. Assim, podemos concluir que as médias amostrais e populacionais são iguais a um
nível de signicância de 5% (ou dizemos: a um nível de conança de 95%). Em outras palavras, a diferença diferenç a obtida através da amostra não é signicativa, signicati va, então não se pode armar que as especicações da empresa estão incorretas. Tem-se 5% de chance de você estar errado nessa conclusão (nível de signicância). Agora, acadêmico, acadêmico, caso o INMETRO desejasse desejasse inspecionar inspecionar se a média dos diâmetros diâmetros das camas elásticas de Jump é menor que 94 cm ou maior que 94 cm, você estaria diante de um teste unilateral. Com isso, seria necessário adequar a hipótese alternativa para cada tipo de teste, H 1: < 94 cm (unilateral à esquerda) e H 1: > 94 cm (unilateral à direita). Como a média amostral é maior que a média populacional, não é preciso testar a hipótese H 1: < 94 cm, pois o valor z (padronizado) (padronizado) cará sempre na região de aceitação de H0, considerando a pequeno. Assim, teste apenas a hipótese H 1: >94 cm! Unilateral à direita
Solução: H0: = 94 cm H1: > 94 cm
UNIDADE 3
TÓPICO 2
153
A padronização padronização da da estimativa da média média populacional populacional permanece a mesma
O que muda é o valor crítico (z tab), pois o nível de signicância corresponde somente à
área sob a cauda direita. O valor z tab é obtido entrando na tabela Z (Apêndice A) com o valor 1 – = 1 – 0,05 = 0,950.
Observe que o valor 0,950 não aparece na tabela, mas está entre os valores 0,9495 e 0,9505. Assim, fazemos a média aritmética dos valores encontrados na coluna e somamos com o valor da linha. Logo, z tab = (0,04 + 0,05)/2 + 1,6 = 1,645. Veja o esquema a seguir:
B I O E S T A T Í S T I C A E M
Observe que o fato de o teste ser unilateral aumenta a área sob a cauda direita da curva, diminuindo o valor crítico (z tab). Nesse caso, rejeita-se H 0 a um nível de signicância de 5% porque o valor z padronizado (1,74) está na região de rejeição de H 0 (1,645 < 1,74). Assim, a média populacional é maior que 94 cm a um nível de conança de 95%.
E D U C A Ç Ã O F Í S I C A
154
UNIDADE 3
TÓPICO 2
4.1.2 Teste de hipóteses para a média quando o desvio padrão da população é desconhecido Suponha que você precisa testar a hipótese de que a média da estatura dos jogadores brasileiros de basquetebol adultos de sexo masculino seja 1,95 m contra a hipótese de que é diferente, a um nível de signicância de 5%. Na amostra feita são obtidas as seguintes alturas: ALTURA, ALTURA, EM METROS, METROS, DOS JOGADORES JOGADORES DE BASQUETEBOL BASQUETEBOL - BRASIL BRASIL – 2016
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Alturas (xi)
Número de Atletas ()
1,90
4
1,93
7
1,95
3
1,96
2
1,98
9
2,03
5
Total
30
FONTE: A autora
Solução: Observe que não há o desvio padrão populacional, e na maioria dos problemas
práticos não haverá mesmo! Porém, na resolução, o que muda apenas é a tabela a ser utilizada. A amostra amostra dá as seguintes seguintes estimativas:
n = 30,
(número de elementos, média e desvio padrão). Agora, temos as seguintes hipóteses:
H0: H1:
= 1,95m ≠ 1,95m
Como a variância populacional é desconhecida, desconheci da, a padronização da estimativa da média amostral deve ser feita com a estimativa da variância amostral s 2, o que torna a função densidade dessa padronização diferente difere nte da normal. Essa nova densidade é denominada t-Student e essa θ x . padronização é calculada através da fórmula: t −
calc
=
s
n
Para resolver o teste é preciso comparar o valor do t calculado (t calc) com o valor crítico
t tabelado (t tab). O valor t tab é encontrado na tabela t-Student (Apêndice C) na intersecção da
UNIDADE 3
linha 29 (“n – 1”) com a coluna 2,5% (
TÓPICO 2 a
2
155
) = 2,5/100 = 0,025. Com isso, temos t tab = 2,0452.
Obtendo o valor t calc:
Conclusão: Rejeitamos H0.
A média populacional populacional é diferente a 1,95 m a um nível de signicância de 5%. Você pode armar isso, pois o valor 32,2190 está fora dos valores críticos, ou seja, está na região de rejeição de H 0.
4.2 TESTE DE HIPÓTESES PARA A VARIÂNCIA POPULACIONAL σ2 A Patinação Artística é um esporte de inverno e foi incluso nos Jogos Olímpicos
no ano de 1908 em Londres, na Inglaterra. Além de esporte, é um espetáculo e atletas já aposentados continuam fazendo shows e apresentações de gala. Nas competições existem categorias individuais e em duplas e há inúmeros elementos, como tipos de piruetas e saltos, que constituem a apresentação e somam pontos para a avaliação.
Agora, vamos supor que desejamos desejamos testar a hipótese hipótese de que a variância das médias dos patinadores homens na categoria individual, indivi dual, no Campeonato Mundial de Patinação Artística Artístic a de
2015, tenha sido 5,3 contra a hipótese de que é diferente, a um nível de signicância de 10%. Para realizar o teste foi coletada uma amostra com as seguintes notas:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
156
UNIDADE 3
TÓPICO 2
5,9
6,5
8,0
9,6
4,0
3,4
8,0
6,0
6,5
8,4
4,0
8,5
9,3
8,5
8,2
6,0
5,1
3,5
6,0
5,2
6,2
7,0
5,5
7,0
7,9
6,4
4,6
4,0
7,0
7,0
A amostra nos dá as seguintes estimativas: n = 30, elementos, média e variância).
θ
=
6, 44
e
s
2
=
2, 97 (número de
Assim, temos as seguintes seguintes hipóteses: hipóteses: H0: 2 = 5,3 H1: σ2 ≠ 5,3
Em uma distribuição normalmente distribuída, a razão (
n
− 1) s σ
2
2
segue uma distribuição
qui-quadrado. qui-quadrado. Assim, o cálculo usado para o teste de hipóteses para a variância populacional ( n 1) s . é: 2
χ calc
σ
B I O E S T A T Í S T I C A
2
−
=
2
Para resolver o teste é necessário comparar os valores de χ2tab (χ2 A e χ2B, pois o teste é bicaudal) com o valor crítico χ2calc. O valor χ2 A é encontrado na tabela qui-quadrado (Apêndice B) na intersecção da linha 29 ( n – 1 ) com a coluna 0,05 ( a/2),χ2 A = 42,5569, e o valor χ2B na intersecção da linha 29 com a coluna 0,95 (1- a/2), χ2B = 17,7084.
Obtendo o valor χ2calc:
E M E D U C A Ç Ã O F Í S I C A
Conclusão: Rejeitamos H0.
A variância populacional populacional é diferente a 5,3 a um nível de signicância de 10%. Você Você pode armar isso, pois o valor 16,25 é menor que o valor crítico 17,7084, ou seja, está na região de rejeição de H0.
UNIDADE 3
157
TÓPICO 2
4.3 TESTE DE HIPÓTESES PARA A PROPORÇÃO POPULACIONAL P O futebol é o esporte dos brasileiros e o sonho de se tornar um grande jogador já nasce na infância. A Escola de Futebol Ocial Oc ial do Time XX promove testes e avaliações para par a encontrar novos craques em todo o Brasil. Os jogadores são selecionados por observadores ociais do Time XX. E os jogadores que são selecionados passam um período de experiência na escola do Time XX. Os alunos são observados diariamente em seus treinamentos. Aqueles que se destacam são indicados para participar das equipes das categorias de Base do Time XX.
Segundo o treinador de futebol do Time XX, existe uma taxa de 15% de reprovação entre seus candidatos já na primeira etapa. Para vericar se a taxa de reprovação é diferente, com α = 2%, selecionou-se aleatoriamente aleatoriamente uma amostra de 300 candidatos e vericou-se que 36 reprovaram. Solução: O treinador arma que a proporção proporç ão de reprovados p = 15% = 0,15. Da amostra am ostra selecionada, estimamos uma proporção . Assim, temos as seguintes hipóteses: H0: p = 0,15 H1: p ≠ 0,15
Considerando que a distribuição da proporção amostral pode ser aproximada por um modelo Normal, resolve-se o problema comparando o valor de z padronizado com os valores críticos tabelados (z tab). O valor ztab é obtido entrando na tabela Z (Apêndice A) com o valor 1 – α/2 = 1 – 0,02/2 = 1 – 0,01 = 0,99, assim z tab = 2,33. O valor z padronizado para proporção proporção é obtido pela fórmula: Calculando z:
.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
158
TÓPICO 2
UNIDADE 3
Conclusão: Aceitamos Conclusão: Aceitamos H0.
A proporção populacional populacional não é diferente de 15% a um nível de signicância de 2%. Armamos isso porque o valor padronizado -1,45 está entre -2,33 e 2,33 (-2,33 < -1,455 < 2,33), ou seja, está na região de aceitação de H 0. Ç Ã O ! A T E N
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Acadêmico, estes testes podem parecer difíceis, mas com concentração, dedicação e persistência você conseguirá compreender estes conceitos.
UNIDADE 3
159
TÓPICO 2
RESUMO DO TÓPICO 2
Neste tópico, estudamos os testes de hipóteses e destacamos: • Roteiro para realizar um teste de hipóteses:
1º: estabelecer as hipóteses H 0 e H1; 2º: com base na H 1 e no nível de signicância ( a) estabelecer as regiões de aceitação e rejeição de H 0 e o valor crítico; 3º: calcular o valor da variável do teste; 4º: aceitar ou rejeitar H 0 pela comparação do valor calculado no 3º passo com a região de aceitação ou rejeição. • Nos testes de hipótese para a média, quando o desvio padrão populacional populac ional é conhecido,
a estimativa amostral da média é padronizada pela fórmula:
.
Nos testes de hipótese para a média, quando o desvio padrão populacional é θ x desconhecido, desconhecido, a estimativa amostral da média é padronizada pela fórmula: t . •
−
calc
• Nos testes de hipótese para a variância populacional,
o cálculo usado é
=
s
2
χ calc
n
=
(n
−
)
1 s
σ
2
2
Nos testes de hipótese para a proporção populacional, a estimativa amostral da proporção é padronizada pela fórmula: . •
.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
160 E D A D T I V I A O A U T
TÓPICO 2
UNIDADE 3
Prezado acadêmico! Agora chegou a sua vez de colocar em prática seu conhecimento sobre os testes de hipóteses.
1 Um teste de hipótese é um método de inferência estatística muito útil em casos em que não é possível reunir todos os dados de uma população para aferir o parâmetro
desejado. Assim, os testes de hipóteses se baseiam na amostra, ou seja, em uma parte da população. Portanto, em diversas pesquisas estatísticas são utilizados os testes de
hipóteses para avaliar a veracidade dos dados observados. Sobre o teste de hipótese, assinale a alternativa CORRETA: CORRETA:
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
a) ( ) A hipótese H0 será chamada de hipótese nula, enquanto a hipótese H 1 ou hipótese alternativa alternati va é a que o teste quer provar. O erro do tipo I ( Α) signica rejeitar H 0 sendo que na verdade deveria ter aceitado, enquanto o erro do tipo II ( Β) signica aceitar H 0 sendo que na verdade você deveria ter rejeitado. b) ( ) A hipótese H0 será chamada de hipótese el, enquanto a hipótese H1 ou hipótese inel é a que o teste quer provar. E, em um teste estatístico, em que o “poder do teste” é de 0,84, o erro do tipo II será 0,16.
c) ( ) A hipótese H0 será chamada de hipótese certa, enquanto a hipótese H1 ou hipótese errada é a que o teste quer provar. E, em um teste estatístico, em que o “poder do teste” é de 0,84, o erro do tipo I será 0,16. d) ( ) A hipótese H0 será chamada de hipótese nula, enquanto a hipótese H 1 ou hipótese alternativa alternati va é a que o teste quer provar. O erro do tipo I ( Α) signica aceitar H 0 sendo
que na verdade deveria ter rejeitado, enquanto enquanto o erro do tipo II (Β) (Β ) signica rejeitar H 0 sendo que na verdade você deveria ter aceitado.
2 Uma equipe de corrida de bicicletas está testando a durabilidade de duas marcas de freios. Para isso, testou cinco freios de cada marca e constatou, para a marca A, uma
durabilidade média de 5.000 km e variância 2.500 km 2; para a marca B uma durabilidade média de 4.910 km e variância 2.300 km 2. Sabendo-se que as variâncias populacionais são desconhecidas e iguais, teste a hipótese de que a durabilidade dos freios da marca A é maior que da marca B, em nível de signicância signicância de 5%. Nessas Nessas condições, condições, analise analise as seguintes sentenças:
UNIDADE 3
TÓPICO 2
161
Assinale a alternativa alternativa CORRETA: CORRETA:
a) ( b) ( c) ( d) (
) O item II está correto. ) O item I está correto. ) O item III está correto. ) O item IV está correto.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
162
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
TÓPICO 2
UNIDADE 3
UNIDADE 3
TÓPICO 3 REGRESSÕES E CORRELAÇÕES
1 INTRODUÇÃO Uma parte importante da estatística é a análise da regressão entre uma variável
dependente e uma variável independente de um modelo matemático, com o objetivo de determinar o nível de interação entre elas. A determinação determinação dessa relação auxilia na simulação
da previsão do comportamento de um fenômeno, possibilitando a análise das tendências e as relações de causa e efeito de um determinado evento. evento. Neste tópico temos por objetivo o estudo da regressão entre duas variáveis e a vericação da existência de uma correlação entre elas. Para tornarmos a compreensão deste conteúdo mais simples, abordaremos algumas situações que fazem parte do cotidiano do prossional da Educação Física.
2 DIAGRAMA DE DISPERSÃO Diagramas de dispersão são grácos que permitem a identicação entre causas e efeitos, com o propósito de avaliar o tipo de relação entre as variáveis estudadas.
De uma maneira mais simples, é a representação representação gráca de valores de duas variáveis relacionadas a um mesmo fenômeno, mostrando o quanto uma variável é afetada por outra, ajudando desta forma a visualizar se existe, ou não, alguma relação entre elas. Neste gráco, cada ponto plotado representa um par observado de valores para as variáveis estudadas (x, y), num sistema de eixos ei xos cartesianos, formando uma “nuvem” de pontos, que denirá qual o tipo de correlação está sendo analisada. A seguir, seguir, apresentamos apresentamos alguns exemplos exemplos de diagramas diagramas de dispersão.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
164
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
UNIDADE 3
TÓPICO 3
Observe, acadêmico, acadêmico , que cada combinação de dados indica um eixo e uma direção que caracteriza a relação entre as variáveis x e y. A relação entre as variáveis é direta quando os valores de y aumentam em decorrência do aumento dos valores de x. A relação é considerada inversa quando os valores de y variam inversamente em relação aos de x. E não há relação quando os valores de y não variam com o aumento dos valores de x. Exemplo: Acadêmico, Exemplo: Acadêmico, vamos vericar a relação entre os valores informados na tabela
de peso e altura para crianças, construindo um gráco de dispersão: TABELA 43 - VARIAÇÃO DO PESO E DA ALTURA PARA CRIANÇAS BRASILEIRAS ENTRE 1 E 12 ANOS
Idade
Altura (cm)
Peso (Kg)
1 ano
74
9,8
2 anos
85
12,3
3 anos
96
14,7
4 anos
101
16,5
5 anos
108
18,6
6 anos
112
20,5
7 anos
117
23,1
8 anos
125
25,4
9 anos
132
28,7
10 anos
137
32,4
11 anos
143
35,3
12 anos
149
40,7
FONTE: A autora
UNIDADE 3
TÓPICO 3
165
Representando Representando os dados em um gráco de dispersão que relaciona as variáveis x e y: GRÁFICO 5 - VARIAÇÃO DO PESO E DA ALTURA PARA CRIANÇAS BRASILEIRAS ENTRE 1 E 12 ANOS.
FONTE: A autora
Note que o gráco de dispersão que relaciona a altura e o peso conforme a idade das crianças brasileiras sugere que as variáveis possuem uma relação linear direta. Veremos Veremos no próximo tópico que podemos quanticar a força dessa relação através da determinação do coeciente de correlação de Pearson.
O coeciente de correlação de Pearson é uma medida do grau da relação linear entre duas variáveis quantitativas. É um índice adimensional que estabelece o quanto uma linha reta se ajusta em uma de nuvem de pontos (diagrama de dispersão).
B I O E S T A T Í S T I C A
quando se trata de O coeciente de correlação costuma ser representado pela letra R quando
E M
3 CORRELAÇÃO DE PEARSON
uma amostra ou por ρ quando o estudo refere-se a uma população. Possui valores situados entre -1,0 e 1,0, sendo que: • R= • •
1: signica que as variáveis são diretamente proporcionais, proporcionais, e os pontos da reta
caem exatamente sobre uma linha crescente; proporcionais, e os pontos da reta R = -1: signica que as variáveis são inversamente proporcionais, caem exatamente sobre uma linha decrescente; R = 0: Signica que não existe correlação entre as duas variáveis.
O coeciente de correlação é dado por:
E D U C A Ç Ã O F Í S I C A
166
UNIDADE 3
TÓPICO 3
Usualmente, multiplicamos o valor do coeciente por 100 para termos o seu valor em porcentagem. porcentagem . A partir dos valores de R ou ou ρ, podemos vericar o tipo da correlação existente entre as variáveis estudadas: •
0 < r < 0,3: a correlação é muito fraca e não é possível estabelecer relação efetiva entre as variáveis;
•
0,3 r < 0,6: a correlação é fraca, mas pode-se considerar considerar a existência de uma relação
•
entre as variáveis; 0,6 ≤ r < 1: a correlação é média para forte e a relação entre as variáveis é signicativa, signic ativa, havendo uma forte relação entre as variáveis.
Acadêmic Acad êmico, o, note que no estudo estu do estatíst esta tístico ico as correla cor relações ções resumem res umem o grau de relacionamento entre duas variáveis, e as regressões têm como nalidade a obtenção de uma equação matemática que descreve o relacionamento entre estas variáveis.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
Exemplo 1: A busca por uma vida saud saudável, ável, que alie alimentaç alimentação ão equ equilibra ilibrada da a exercício exercícioss físicos, vem crescendo entre todos os grupos da população. Diante disso, uma empresa
buscou fazer uma pesquisa para vericar se há correlação signicativa do gasto mensal com suplementos dos praticantes regulares regulares de atividade física com a renda de cada um deles.
A partir partir dos dados coletados foi possível possível elaborar a seguinte tabela: tabela: TABELA 44 - RELAÇÃO ENTRE GASTO MENSAL COM SUPLEMENTO E RENDA INDIVIDUAL POR ALUNOS DA ACADEMIA XX NA CIDADE DE BLUMENAU - 2016
Ativ Ativid idad adee Pra Prati tica cada da
Rend Re ndaa IInd ndiv ivid idua uall (R$ (R$))
Gast Ga sto o com com Supl Suplem emen ento to (R$) (R$)
Musculação
2470,98
61,53
Ginástica localizada
2357,89
58,48
Corrida
2233,18
56,79
Funcional
2128,47
54,91
Esportes coletivos
2002,95
47,38
Natação
1926,56
44,98
Step
1818,27
39,25
Zumba
1801,32
37,5
Pilates
1789,56
33,15
FONTE: A autora.
UNIDADE 3
167
TÓPICO 3
Para podermos visualizar a relação entre as variáveis, construímos o gráco de dispersão com os dados do gasto com suplemento em relação à renda individual, conforme apresentado a seguir: GRÁFICO 6 - GASTO MENSAL COM SUPLEMENTO E RENDA INDIVIDUAL POR ALUNOS DA ACADEMIA XX NA CIDADE DE BLUMENAU - 2016.
FONTE: A autora
Acadêmico, note que os grácos grácos de dispersão exibem quão bem os dados dados se adaptam a um certo ajuste (linha (li nha de tendência) Depois de observarmos a dispersão dos dados estatísticos no gráco, vimos que se trata de uma relação linear direta. Agora, devemos organizar as informações necessárias para calcularmos o coeciente de correlação de Pearson. Para facilitar a compreensão dos cálculos realizados, elaboramos a tabela a seguir: TABELA 45 - CÁLCULO DO COEFICIENTE DE PEARSON PARA O GASTO MENSAL COM SUPLEMENTO E RENDA INDIVIDUAL POR ALUNOS DA ACADEMIA XX NA CIDADE DE BLUMENAU - 2016
Atividade Praticada
Renda Individual (xi)
Gasto com Suplemento (yi)
xiyi
x2i
y2i
2470,98
61,53
152039,40
6105742,16
3785,94
Musculação Ginástica localizada Corrida
2357,89
58,48
137889,41
5559645,25
3419,91
2233,18
56,79
126822,29
4987092,91
3225,10
Funcional
2128,47
54,91
116874,29
4530384,54
3015,11
Esportes coletivos
2002,95
47,38
94899,77
4011808,70
2244,86
Natação
1926,56
44,98
86656,67
3711633,43
2023,20
Step
1818,27
39,25
71367,10
3306105,79
1540,56
Zumba
1801,32
37,50
67549,50
3244753,74
1406,25
Pilates
1789,56
33,15
59323,91
3202524,99
1098,92
TOTAL
18529,18
433,97
913422,34 38659691,53 21759,86
FONTE: A autora
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
168
TÓPICO 3
UNIDADE 3
A partir destas destas informações, informações, podemos calcular o coeciente de correlação correlação de de Pearson: Pearson:
Com base no resultado encontrado para o coeciente de Pearson, podemos dizer que a relação entre a renda mensal e o gasto com suplementos é uma correlação forte e tem
signicância. Acadêmico, Acadêmico, após compreend compreendermos ermos que uma correlação correlação é a relação relação entre duas variáveis, variáveis,
partiremos para um novo desao: encontrar uma equação que represente a variação v ariação da variável independente em relação à variável dependente dependent e em um determinado fenômeno, ou seja, nosso próximo objetivo é estudar a regressão linear. B I O E S T A T Í S T I C A E M
4 REGRESSÃO LINEAR SIMPLES O coeciente de correlação de Pearson é uma medida do grau da relação linear entre duas variáveis quantitativas. É um índice adimensional que estabelece o quanto uma linha reta se ajusta em uma de nuvem de pontos (diagrama de dispersão). quando se trata de O coeciente de correlação costuma ser representado pela letra R quando uma amostra ou por ρ quando o estudo refere-se a uma população. Possui valores situados entre -1,0 e 1,0, sendo que:
E D U C A Ç Ã O
• R=
F Í S I C A
O coeciente de correlação é dado por:
• •
1: signica que as variáveis são diretamente proporcionais, proporcionais, e os pontos da reta
caem exatamente sobre uma linha crescente; proporcionais, e os pontos da reta R = -1: signica que as variáveis são inversamente proporcionais, caem exatamente sobre uma linha decrescente; R = 0: Signica que não existe correlação entre as duas variáveis.
UNIDADE 3
169
TÓPICO 3
Na maioria das vezes, ao visualizarmos o diagrama de dispersão conseguimos supor que exista uma relação de causa-efeito entre as duas variáveis quantitativas. A partir dessa
observação, surgiu o desao de como expressar matematicamente essa relação. Neste tópico abordaremos a análise de regressão como uma técnica estatística que tem por objetivo investigar e modelar a relação entre duas variáveis. Regressão linear signica determinar uma equação da reta que melhor se ajuste ao padrão seguido pelos dados, para ser possível determinar um modelo que permita prever uma estimativa linear entre duas variáveis aleatórias.
Existem diversas situações em que devemos utilizar a regressão linear na estatística. Podemos estimar os valores de uma variável, com base em valores conhecidos da outra, ou em situações em que seja necessário conrmar uma relação de causa e efeito entre variáveis. No estudo da regressão, iniciamos denominando a variável dependente (ou variável
resposta) de y e a independente (fator) de x. Acadêmico, note que as expressões a seguir possuem o mesmo signicado: • y depende de x (linguagem coloquial); • y é função de x
(linguagem matemática); • existe regressão de y sobre x (linguagem estatística). O estudo da regressão linear deve iniciar pela elaboração de um gráco de dispersão dos pontos. Esse passo é fundamental, pois a partir dele podemos determinar a existência
ou não da regressão, assim como evita com que a técnica seja aplicada em um conjunto de dados que não são adequados. O segundo passo é determinarmos a equação da reta, como veremos na sequência.
B I O E S T A T Í S T I C A
4.1 EQUAÇÃO LINEAR
E M
Para aplicar regressão, os dados estatísticos precisam atender às seguintes condições conjuntas:
E D U C A Ç Ã O
• Ser signicativo; para isso, é necessário realizar um • Existir homocedasticidade, vericando os
resíduos; • A variável variável y apresentar apresentar distribuição normal. normal. Acadêmico, é importante importante lembrarmos lembrarmos que:
teste de hipóteses;
F Í S I C A
170
TÓPICO 3
UNIDADE 3
• Para um valor x i podem existir um ou mais valores de y i amostrados; • Porém, para esse mesmo valor x i apenas um valor será
projetado; • Sempre teremos observações que não são pontos da reta, ou seja, pontos fora do padrão dos dados. FONTE: Disponível em: < http://docslide.com.br/documents/analise-de-regressao-55bd18966ba31. html>. Acesso em: 20 ago. 2016.
Sabemos que a equação de uma reta é representada por y = ax + b. Para determinarmos qual a equação que melhor se ajusta a um conjunto de dados, precisamos calcular os valores dos parâmetros a e b, conforme as seguintes fórmulas:
Onde: • n é o número de
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
dados a serem analisados; • e y são as médias dos valores de x i e yi, respectivamente. respectivamente. Podemos determinar as médias através das equações:
É importante ressaltarmos que quando aplicamos estas fórmulas a um conjunto de dados, estamos fazendo uma estimativa da verdadeira equação de regressão. Deste modo, devemos escrever , onde é o y estimado. Exemplo 1: Uma academia de ginástica decidiu realizar uma pesquisa de como a prática de exercícios pode afetar na perda de peso. Para isto, foram selecionados 12 alunos iniciantes
na academia que realizavam os exercícios com o objetivo de emagrecer. emagrecer. No entanto, na fase inicial da pesquisa, estes alunos não poderiam diminuir a quantidade de calorias ingeridas
diariamente, para que os dados referentes à perda de peso fossem somente inuenciados pelos exercícios físicos realizados. Foi solicitado aos alunos que registrassem no decorrer de
duas semanas o número de minutos de exercícios que praticaram, com a perda de peso após o período de duas semanas.
UNIDADE 3
171
TÓPICO 3
TABELA 46 - PERDA DE PESO COM RELAÇÃO À PRÁTICA DE EXERCÍCIOS FÍSICOS
Indivíduo Exercí Exercício cioss xi (min) (min) Perda Perda de de Peso Peso yi (Kg) (Kg) 1
237
1,71
2
235
1,49
3
228
1,49
4
193
1,26
5
190
1,17
6
186
1,17
7
185
1,13
8
176
0,9
9
171
0,73
10
148
0,63
11
109
0,5
12
100
0,27
FONTE: A autora
A partir da tabela acima, construímos um gráco de dispersão para avaliar se existe relação entre a variável dependente perda de peso (y i) e a variável independente tempo de atividade física praticada (x i): GRÁFICO 7 - PERDA DE PESO COM RELAÇÃO AO TEMPO REALIZADO DE ATIVIDADE ATIVIDADE FÍSICA.
B I O E S T A T Í S T I C A E M
FONTE: A autora
Observe que os pontos que formam o gráco de dispersão representam uma correlação que se assemelha a uma reta ascendente, sendo, portanto, uma correlação linear positiva.
E D U C A Ç Ã O F Í S I C A
172
UNIDADE 3
TÓPICO 3
TABELA 56 - CÁLCULOS AUXILIARES PARA DETERMINAÇÃO DA EQUAÇÃO DA RETA PARA A DETERMINAÇÃO DA PERDA DE PESO EM RELAÇÃO À PRÁTICA DE ATIVIDADE FÍSICA
Indivíduo Exercícios xi (min) Perda de Peso yi (Kg)
xiyi
x2i
y2i
1
237
1,71
405,27
56169
2,9241
2
235
1,49
350,15
55225
2,2201
3
228
1,49
339,72
51984
2,2201
4
193
1,26
243,18
37249
1,5876
5
190
1,17
222,3
36100
1,3689
6
186
1,17
217,62
34596
1,3689
7
185
1,13
209,05
34225
1,2769
8
176
0,9
158,4
30976
0,81
9
171
0,73
124,83
29241
0,5329
10
148
0,63
93,24
21904
0,3969
11
109
0,5
54,5
11881
0,25
12
100
0,27
27
10000
0,0729
TOTAL
2158
12,45
2445,26
409550
15,0293
FONTE: A autora B I O E S T A T Í S T I C A
Com base nas informações da tabela acima, podemos calcular os parâmetros a e b:
E M E D U C A Ç Ã O F Í S I C A
Substituindo os valores encontrados para os parâmetros a e b na fórmula genérica que representa a equação da reta, chegaremos à seguinte função de regressão linear: y = 0,009611x – 0,69088. Com esta função, poderemos estimar a perda de peso de um indivíduo que passa a praticar exercícios físicos regularmente.
UNIDADE 3
! N T E R T A O P I M
TÓPICO 3
173
Acadêmico, você pode utilizar o programa Microsoft Excel para auxiliá-lo na obtenção da linha de tendência dos pontos num gráco de dispersão e para a determinação da equação da reta que representa estes pontos.
Na barra de ícones principal do programa você pode inserir um gráco de dispersão. Após selecionar selecionar os dados da série, série, basta clicar com o botão botão direito direito do mouse sobre os pontos do gráco e adicionar uma linha de tendência. Abrirá uma janela que lhe permite congurar a linha de tendência. Para obter a equação da reta que melhor se ajusta aos pontos do gráco, selecionar “Exibir equação no gráco”. Observe o gráco a seguir, baseado no exemplo anterior: GRÁFICO 8 - LINHA DE PERDA DE PESO COM RELAÇÃO AO TEMPO REALIZADO DE ATIVIDADE ATIVIDADE FÍSICA.
FONTE: A autora
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
174
TÓPICO 3
UNIDADE 3
RESUMO DO TÓPICO 3
Neste tópico, você viu que: que: • Coeciente de correlação de Pearson é uma medida do
grau da relação linear entre
duas variáveis quantitativas, sendo representado pela equação:
Regressão linear tem por objetivo determinar uma equação da reta que melhor se ajuste a um conjunto de dados estatísticos. O resultado de uma regressão linear segue a equação da reta: y = ax + b. •
• A fórmula fórmula para o cálculo dos parâmetros parâmetros
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
a=
; b=
a e b é: é:
UNIDADE 3
E D A D T I V I A O A U T
175
TÓPICO 3
1 A correlação e a regressão linear simples são métodos estudados pela estatística
que compreendem a análise de dados amostrais para saber se, e como, duas ou mais variáveis estão relacionadas entre si numa população. Sobre estes métodos, assinale a alternativa CORRETA:
a) ( ) A regressão regressão e a correlação são técnicas qualitativas qualitativas utilizadas para para estimar a qualidade de uma relação entre uma população e uma variável; b) ( ) A correlação mede a intensidade da força de relacionamento entre duas variáveis e a regressão fornece a equação que descreve o relacionamento em termos matemáticos.
c) ( ) Os dados para análise de regressão e correlação são obtidos através de informações aleatórias; sendo assim, as variáveis não precisam tratar de uma mesma população. d) ( ) Na regressão pressupõe-se pressupõe-se que que não haja uma uma relação de causa causa e efeito entre entre duas variáveis. 2 Selecione a alternativa alternativ a que possui a regressão linear que melhor representa represen ta os dados
da tabela a seguir: RELAÇÃO ENTRE O PREÇO E A QUANTIDADE DE PRODUTOS VENDIDOS
Produto
Quantidade
Preço
P1
71
40,7
P2
84
37,3
P3
96
35,9
P4
102
32,7
P5
108
31,8
P6
112
28,1
P7
119
27,5
P8
127
26,4
P9
132
25,6
P10
139
24,7
P11
147
24,3
P12
156
23,8
FONTE: A autora
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
176
a) ( b) ( c) ( d) (
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
TÓPICO 3
) y = -0,2141x + 54,753 ) y = 0,2141x - 54,753 ) y = -4,3526x + 246,23 ) y = 4,3526x - 246,23
UNIDADE 3
UNIDADE 3
177
TÓPICO 3
APÊNDICE A
Tabela Z (Normal Padrão) z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7
0,00 0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,9938 0,9953 0,9965 0,9974 0,9981 0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999
0,01 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,9649 0,9719 0,9778 0,9826 0,9864 0,9896 0,9920 0,9940 0,9955 0,9966 0,9975 0,9982 0,9987 0,9991 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999
0,02 0,5080 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 0,9066 0,9222 0,9357 0,9474 0,9573 0,9656 0,9726 0,9783 0,9830 0,9868 0,9898 0,9922 0,9941 0,9956 0,9967 0,9976 0,9982 0,9987 0,9991 0,9994 0,9995 0,9997 0,9998 0,9999 0,9999
0,03 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,8907 0,9082 0,9236 0,9370 0,9484 0,9582 0,9664 0,9732 0,9788 0,9834 0,9871 0,9901 0,9925 0,9943 0,9957 0,9968 0,9977 0,9983 0,9988 0,9991 0,9994 0,9996 0,9997 0,9998 0,9999 0,9999
0,04 0,5160 0,5557 0,5948 0,6331 0,6700 0,7054 0,7389 0,7704 0,7995 0,8264 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,9671 0,9738 0,9793 0,9838 0,9875 0,9904 0,9927 0,9945 0,9959 0,9969 0,9977 0,9984 0,9988 0,9992 0,9994 0,9996 0,9997 0,9998 0,9999 0,9999
0,05 0,5199 0,5596 0,5987 0,6368 0,6736 0,7088 0,7422 0,7734 0,8023 0,8289 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0,9599 0,9678 0,9744 0,9798 0,9842 0,9878 0,9906 0,9929 0,9946 0,9960 0,9970 0,9978 0,9984 0,9989 0,9992 0,9994 0,9996 0,9997 0,9998 0,9999 0,9999
0,06 0,5239 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 0,9131 0,9279 0,9406 0,9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0,9948 0,9961 0,9971 0,9979 0,9985 0,9989 0,9992 0,9994 0,9996 0,9997 0,9998 0,9999 0,9999
0,07 0,5279 0,5675 0,6064 0,6443 0,6808 0,7157 0,7486 0,7794 0,8078 0,8340 0,8577 0,8790 0,8980 0,9147 0,9292 0,9418 0,9525 0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0,9949 0,9962 0,9972 0,9979 0,9985 0,9989 0,9992 0,9995 0,9996 0,9997 0,9998 0,9999 0,9999
0,08 0,5319 0,5714 0,6103 0,6480 0,6844 0,7190 0,7517 0,7823 0,8106 0,8365 0,8599 0,8810 0,8997 0,9162 0,9306 0,9429 0,9535 0,9625 0,9699 0,9761 0,9812 0,9854 0,9887 0,9913 0,9934 0,9951 0,9963 0,9973 0,9980 0,9986 0,9990 0,9993 0,9995 0,9996 0,9997 0,9998 0,9999 0,9999
0,09 0,5359 0,5753 0,6141 0,6517 0,6879 0,7224 0,7549 0,7852 0,8133 0,8389 0,8621 0,8830 0,9015 0,9177 0,9319 0,9441 0,9545 0,9633 0,9706 0,9767 0,9817 0,9857 0,9890 0,9916 0,9936 0,9952 0,9964 0,9974 0,9981 0,9986 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
178
UNIDADE 3
TÓPICO 3
APÊNDICE B
Distribuição Qui-Quadrado P(χ2(n-1) ≥ χ2tab) = α
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 50
0,990 0,0002 0,0201 0,1148 0,2971 0,5543 0,8721 1,2390 1,6465 2,0879 2,5582 3,0535 3,5706 4,1069 4,6604 5,2293 5,8122 6,4078 7,0149 7,6327 8,2604 8,8972 9,5425 10,1957 10,8564 11,5240 12,1981 12,8785 13,5647 14,2565 14,9535 15,6555 16,3622 17,0735 17,7891 18,5089 19,2327 19,9602 20,6914 21,4262 22,1643 22,9056 23,6501 24,3976 25,1480 25,9013 29,7067
0,950 0,0039 0,1026 0,3518 0,7107 1,1455 1,6354 2,1673 2,7326 3,3251 3,9403 4,5748 5,2260 5,8919 6,5706 7,2609 7,9616 8,6718 9,3905 10,1170 10,8508 11,5913 12,3380 13,0905 13,8484 14,6114 15,3792 16,1514 16,9279 17,7084 18,4927 19,2806 20,0719 20,8665 21,6643 22,4650 23,2686 24,0749 24,8839 25,6954 26,5093 27,3256 28,1440 28,9647 29,7875 30,6123 34,7643
0,900 0,0158 0,2107 0,5844 1,0636 1,6103 2,2041 2,8331 3,4895 4,1682 4,8652 5,5778 6,3038 7,0415 7,7895 8,5468 9,3122 10,0852 10,8649 11,6509 12,4426 13,2396 14,0415 14,8480 15,6587 16,4734 17,2919 18,1139 18,9392 19,7677 20,5992 21,4336 22,2706 23,1102 23,9523 24,7967 25,6433 26,4921 27,3430 28,1958 29,0505 29,9071 30,7654 31,6255 32,4871 33,3504 37,6886
0,500 0,4549 1,3863 2,3660 3,3567 4,3515 5,3481 6,3458 7,3441 8,3428 9,3418 10,3410 11,3403 12,3398 13,3393 14,3389 15,3385 16,3382 17,3379 18,3377 19,3374 20,3372 21,3370 22,3369 23,3367 24,3366 25,3365 26,3363 27,3362 28,3361 29,3360 30,3359 31,3359 32,3358 33,3357 34,3356 35,3356 36,3355 37,3355 38,3354 39,3353 40,3353 41,3352 42,3352 43,3352 44,3351 49,3349
0,100 2,7055 4,6052 6,2514 7,7794 9,2364 10,6446 12,0170 13,3616 14,6837 15,9872 17,2750 18,5493 19,8119 21,0641 22,3071 23,5418 24,7690 25,9894 27,2036 28,4120 29,6151 30,8133 32,0069 33,1962 34,3816 35,5632 36,7412 37,9159 39,0875 40,2560 41,4217 42,5847 43,7452 44,9032 46,0588 47,2122 48,3634 49,5126 50,6598 51,8051 52,9485 54,0902 55,2302 56,3685 57,5053 63,1671
0,050 3,8415 5,9915 7,8147 9,4877 11,0705 12,5916 14,0671 15,5073 16,9190 18,3070 19,6751 21,0261 22,3620 23,6848 24,9958 26,2962 27,5871 28,8693 30,1435 31,4104 32,6706 33,9244 35,1725 36,4150 37,6525 38,8851 40,1133 41,3371 42,5570 43,7730 44,9853 46,1943 47,3999 48,6024 49,8018 50,9985 52,1923 53,3835 54,5722 55,7585 56,9424 58,1240 59,3035 60,4809 61,6562 67,5048
0,025 5,0239 7,3778 9,3484 11,1433 12,8325 14,4494 16,0128 17,5345 19,0228 20,4832 21,9200 23,3367 24,7356 26,1189 27,4884 28,8454 30,1910 31,5264 32,8523 34,1696 35,4789 36,7807 38,0756 39,3641 40,6465 41,9232 43,1945 44,4608 45,7223 46,9792 48,2319 49,4804 50,7251 51,9660 53,2033 54,4373 55,6680 56,8955 58,1201 59,3417 60,5606 61,7768 62,9904 64,2015 65,4102 71,4202
0,010 6,6349 9,2103 11,3449 13,2767 15,0863 16,8119 18,4753 20,0902 21,6660 23,2093 24,7250 26,2170 27,6882 29,1412 30,5779 31,9999 33,4087 34,8053 36,1909 37,5662 38,9322 40,2894 41,6384 42,9798 44,3141 45,6417 46,9629 48,2782 49,5879 50,8922 52,1914 53,4858 54,7755 56,0609 57,3421 58,6192 59,8925 61,1621 62,4281 63,6907 64,9501 66,2062 67,4593 68,7095 69,9568 76,1539
0,005 7,8794 10,5966 12,8382 14,8603 16,7496 18,5476 20,2777 21,9550 23,5894 25,1882 26,7568 28,2995 29,8195 31,3193 32,8013 34,2672 35,7185 37,1565 38,5823 39,9968 41,4011 42,7957 44,1813 45,5585 46,9279 48,2899 49,6449 50,9934 52,3356 53,6720 55,0027 56,3281 57,6484 58,9639 60,2748 61,5812 62,8833 64,1814 65,4756 66,7660 68,0527 69,3360 70,6159 71,8926 73,1661 79,4900
UNIDADE 3
179
TÓPICO 3
APÊNDICE C
Distribuição t-Student P(t(n-1) ≥ ttab) = α gl 1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 120 ∞
0,25 1,0000 0,8165
0,10 3,0777 1,8856
0,05 0,025 0,01 0,005 6,3137 12,7062 31,8210 63,6559 2,9200 4,3027 6,9645 9,9250
0,7649 0,7407 0,7267 0,7176 0,7111 0,7064 0,7027 0,6998 0,6974 0,6955 0,6938 0,6924 0,6912 0,6901 0,6892 0,6884 0,6876 0,6870 0,6864 0,6858 0,6853 0,6848 0,6844 0,6840 0,6837 0,6834 0,6830 0,6828 0,6807 0,6794 0,6786 0,6765 0,6745
1,6377 1,5332 1,4759 1,4398 1,4149 1,3968 1,3830 1,3722 1,3634 1,3562 1,3502 1,3450 1,3406 1,3368 1,3334 1,3304 1,3277 1,3253 1,3232 1,3212 1,3195 1,3178 1,3163 1,3150 1,3137 1,3125 1,3114 1,3104 1,3031 1,2987 1,2958 1,2886 1,2816
2,3534 2,1318 2,0150 1,9432 1,8946 1,8595 1,8331 1,8125 1,7959 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247 1,7207 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973 1,6839 1,6759 1,6706 1,6576 1,6449
3,1824 2,7765 2,5706 2,4469 2,3646 2,3060 2,2622 2,2281 2,2010 2,1788 2,1604 2,1448 2,1315 2,1199 2,1098 2,1009 2,0930 2,0860 2,0796 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423 2,0211 2,0086 2,0003 1,9799 1,9600
4,5407 3,7469 3,3649 3,1427 2,9979 2,8965 2,8214 2,7638 2,7181 2,6810 2,6503 2,6245 2,6025 2,5835 2,5669 2,5524 2,5395 2,5280 2,5176 2,5083 2,4999 2,4922 2,4851 2,4786 2,4727 2,4671 2,4620 2,4573 2,4233 2,4033 2,3901 2,3578
2,3264
5,8408 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693 3,1058 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 2,8784 2,8609 2,8453 2,8314 2,8188 2,8073 2,7970 2,7874 2,7787 2,7707 2,7633 2,7564 2,7500 2,7045 2,6778 2,6603 2,6174 2,5758
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
180
TÓPICO 3
UNIDADE 3
A Ç Ã O I A A V A L
Prezado acadêmico, agora que chegamos ao final da Unidade 3, você deverá fazer a Avaliação referente a esta unidade.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A
181
REFERÊNCIAS
BRASIL. Ministério do Esporte. Disponível em: . Acesso em: 20 ago. ago. 2016.
BRASIL. Rede Interagencial de Informação para a Saúde. Indicadores básicos para a
saúde no Brasil: conceitos e aplicações. aplicações. 2. ed. Brasília: Organização Pan-Americana Pan-Americana da
Saúde, 2008. Disponível em: . Acesso em: 20 ago. 2016. CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. 5. ed. Curitiba:
Ibpex, 2010.
fácil. São Paulo: Saraiva, 2005. CRESPO, Antônio A. Estatística fácil. FARBER, Larson. Estatística Aplicada. 4º São Paulo: Pearson Education, 2010. MORRETTIN, Luiz Gonzaga. Estatística Básica. Probabilidade e Inferência. São Paulo. Pearson: 2010. básica. 2. ed. São Paulo: TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica.
Atlas, 2009.
ciências. São Paulo: WALPOLE, Ronald E. Probabilidade e estatística para engenharia e ciências. São Pearson Prentice Hall, 2009.
B I O E S T A T Í S T I C A E M E D U C A Ç Ã O F Í S I C A