Bioestatística
a
Prof Claudia M. G. G. Franchi
APOSTILA DE BIOESTATÍSTICA
Curso: Tecnologia em Radiologia Médica
Profa. Claudia Franchi
1
Bioestatística
a
Prof Claudia M. G. G. Franchi
Sumário 1.
Capítulo 1 – Noções Básicas ........................................................................................... 5 1.1. Variáveis Variáveis.................................. ................................................... ................................. ................................. .................................. .................................. ................. 5 1.2. Apuração de Dados ..................................................................................................... 5 1.3. População e Amostra .................................................................................................. 6 1.4. Técnicas de Amostragem ............................................................................................ 6 1.4.1. Amostra Casual Simples ......................................................................................... 6 1.4.2. Amostra Amostra Sistemátic Sistemáticaa ............................... ................................................ .................................. .................................. ............................... .............. 7 1.4.3. Amostra Estratificada .............................................................................................. 7 1.4.4. Amostra de Conveniência ........................................................................................ 8 1.5. Exercícios – Capítulo Capítulo 1 ............................... ................................................ .................................. .................................. ............................... .............. 8
2.
Capítulo 2 - Apresentação Apresentação de Dados em Tabelas Tabelas ................... .......... ................... ................... .................. ................. ........ 10 2.1. Componentes das Tabelas ........................................................................................ 10 2.2. Tabelas de Contingência ........................................................................................... 11 2.3. Exercícios – Capítulo Capítulo 2 ............................... ................................................ .................................. .................................. ............................. ............ 12
3.
Capitulo 3 - Tabelas de Distribuição de Frequências .................. ......... ................... ................... .................. .............. ..... 13 3.1. Tabela primitiva ou dados brutos: .............................................................................. 13 3.1.1. ROL ............................... ................................................ .................................. ................................. .................................. .................................. .................... .... 13 3.2. Distribuição de frequência sem intervalos intervalos de classe ................... ......... ................... .................. ................... ............. ... 13 3.3. Distribuição de frequência com intervalos intervalos de classe ................... ......... ................... .................. ................... ............. ... 13 3.4. Exercícios – Capítulo Capítulo 3 ............................... ................................................ .................................. .................................. ............................. ............ 17
4.
Elementos de uma distribuição de frequência (com intervalos de classe) ................ 20 4.1. Classe Classe ............................... ................................................ .................................. ................................. .................................. .................................. .................... .... 20 4.2. Limite superior e limite inferior da classe ................................................................... 20 4.3. Amplitude de classe ................................................................................................... 20 4.4. Amplitude total da distribuição ................................................................................... 20 4.5. Amplitude total da amostra (ROL) .............................................................................. 21 4.6. Ponto Médio de classe............................................................................................... 21 4.7. Exercícios – Capítulo Capítulo 4 ............................... ................................................ .................................. .................................. ............................. ............ 21 5. GRÁFICOS ESTATÍSTICOS ............................................................................................ 24 5.1. Gráfico Gráfico de Barras Barras................................ ................................................. ................................. ................................. .................................. ..................... .... 24 5.2. Gráfico Gráfico de Colunas Colunas ................................ ................................................. ................................. ................................. .................................. ................... 25 5.3. Gráfico Gráfico de Setores Setores .................................... .................................................... ................................. ................................. ................................ ................ 25 5.4. Gráfico Gráfico de Linhas.......... Linhas........................... ................................. ................................. ................................. ................................. ........................... .......... 26 5.5. Exercícios – Capítulo Capítulo 5 ............................... ................................................ .................................. .................................. ............................. ............ 27 6.
REPRESENTAÇÃO REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO ................... .......... .................. .................. ................... .......... 28 6.1. Histograma Histograma ................................. ................................................. ................................. .................................. .................................. ............................. ............ 28 6.2. Polígono de Frequências ........................................................................................... 28 6.3. Exercícios – Capítulo Capítulo 6 ............................... ................................................ .................................. .................................. ............................. ............ 29 2
Bioestatística
7.
a
Prof Claudia M. G. G. Franchi
MEDIDAS DE POSIÇÃO .................................................................................................. 30 7.1. Introduçã Introdução.......... o........................... ................................. ................................. ................................. ................................. .................................. ..................... .... 30 7.2.
Média Média Aritmética: Aritmética:
............................... ................................................ ................................. ................................. .................................. ................... 30
7.2.1. Dados não agrupados ........................................................................................... 30 7.2.2. Desvio em relação à média: .................................................................................. 30 7.2.3. Propriedades da média aritmética ......................................................................... 31 7.2.4. Dados agrupados sem intervalo de classe ............................................................ 31 7.3. Exercícios – Capítulo Capítulo 7 ............................... ................................................ .................................. .................................. ............................. ............ 32 7.3.1. Dados agrupados com intervalo de classe ............................................................ 33 7.4. Exercício Exercícios: s: ............................... ................................................ ................................. ................................. .................................. ................................ ............... 34 7.5. MODA - Mo............................... ............................................... ................................. .................................. .................................. ............................. ............ 35 7.5.1. Dados não agrupados ........................................................................................... 35 7.5.2. Dados agrupados sem intervalo de classe ............................................................ 35 7.5.3. Dados agrupados com intervalo de classe ............................................................ 36 7.5.4. Cálculo da Moda: Método mais m ais elaborado pela fórmula de CZUBER: ................... ......... .......... 36 7.6. Exercício Exercícios: s: ............................... ................................................ ................................. ................................. .................................. ................................ ............... 37 7.7.
MEDIANA MEDIANA
................................ ................................................ ................................. ................................. .................................. ........................... ......... 38
7.7.1. Dados não agrupados ........................................................................................... 38 7.7.2. Dados Dados agrupados agrupados ................................. ................................................. ................................. ................................. ................................ ................ 39 7.7.3. Dados Agrupados sem intervalo de classe ............................................................ 39 7.8. Exercício Exercícios: s: ............................... ................................................ ................................. ................................. .................................. ................................ ............... 39 7.8.1. Dados Agrupados com intervalos de classe .......................................................... 41 7.9. Resolva: Resolva: .................................. ................................................... ................................. ................................. .................................. ................................ ............... 42 7.10. Exercícios – Capítulo Capítulo 7 ............................... ................................................ .................................. .................................. ............................. ............ 43 8.
Medidas de Dispersão ou de Variabilidade ................................................................... 47 8.1. Dispersão ou variabilidade ......................................................................................... 47 8.2. Amplitude Amplitude Total......................................... ......................................................... ................................. ................................. ................................ ................ 48 8.2.1. Dados não agrupados ........................................................................................... 48 8.2.2. Dados agrupados sem intervalo de classe ............................................................ 48 8.2.3. Dados agrupados com intervalo de classe ............................................................ 49 8.3. Variância / Desvio padrão ................... ......... ................... ................... ................... .................. .................. ................... ................... ............. 49 8.3.1. Dados não agrupados ........................................................................................... 51 8.4. Resolva: Resolva: .................................. ................................................... ................................. ................................. .................................. ................................ ............... 51 8.4.1. Dados Agrupados sem intervalo de classe ............................................................ 52 8.5. Exercício Exercícios: s: ............................... ................................................ ................................. ................................. .................................. ................................ ............... 53 8.5.1. Dados Agrupados com intervalo de classe ............................................................ 54 8.6. Exercício Exercícios: s: ............................... ................................................ ................................. ................................. .................................. ................................ ............... 54 8.7. Coeficiente de Variação ............................................................................................. 55 8.8. Exercícios – Capítulo Capítulo 8 ............................... ................................................ .................................. .................................. ............................. ............ 56 3
Bioestatística
9.
a
Prof Claudia M. G. G. Franchi
Bibliografia Bibliografia................................. .................................................. .................................. ................................. ................................. .................................. ................... 58
4
Bioestatística
1.
a
Prof Claudia M. G. G. Franchi
CAPÍTULO 1 – NOÇÕES BÁSICAS
Nas áreas médicas, biológicas e engenharias, coletam-se dados de pessoas, de animais experimentais e de fenômenos físicos e químicos. Interessam aos pesquisadores dessas áreas, dados sobre mortalidade infantil, eficiência de medicamentos, incidência de doenças, causa de morte, etc. Os dados referem-se a variáveis que são classificadas em Estatística, como qualitativas, ordinais e quantitativas.
1.1.
Variáveis
Em estatística, uma variável é um atributo mensurável que tipicamente varia entre indivíduos. As variáveis são divididas em qualitativas e quantitativas.
Variável Quantitativa - São aquelas que são numericamente mensuráveis, por exemplo, a idade, a altura, o peso. Estas ainda se subdividem em:
Variável Quantitativa Contínua: São aquelas que assumem valores dentro de um conjunto contínuo, tipicamente os números reais. São exemplos, o peso ou a altura de uma pessoa. Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito ou enumerável, tipicamente números inteiros. Um exemplo é o número de filhos de uma pessoa.
Variável Qualitativa - São aquelas que se baseiam em qualidades e não podem ser mensuráveis numericamente. numericamente. Estas ainda se subdividem em:
Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem, por exemplo, a classe social (A,B,C,D, ou E) e a variável "Peso" medida em 3 níveis (pouco pesados, pesados, muito pesados). São variáveis qualitativas ordinais também, grau de instrução, status social, estágio da doença. Variável Qualitativa Nominal: São aquelas que não podem ser hierarquizadas ou ordenadas, como a cor dos olhos, o local de nascimento, peso, altura.
1.2.
Apuração de Dados
Os dados são registrados em fichas, com várias outras informações. Para obter apenas os dados é preciso fazer uma apuração. apuração. Se a variável variável é qualitativa ou ordinal, a apuração apuração resume-se a simples contagem. contagem . Por exemplo, para obter o número de nascidos vivos de cada sexo, é preciso tomar os prontuários e escrever numa folha de papel: Feminino Masculino Depois, é preciso examinar os prontuários e fazer um traço, na linha correspondente a um dos sexos, toda vez que o prontuário registrar registrar que o nascido vivo vivo é desse sexo. No exemplo, cada traço representa um nascido vivo e cada quadrado, cortado pela diagonal, representa cinco nascidos vivos. O total é dado pelo número de traços de cada linha. Feminino -
= 52
Masculino -
= 48 5
Bioestatística
a
Prof Claudia M. G. G. Franchi
Se a variável é quantitativa, a apuração consiste em anotar cada valor observado. Por exemplo, para apurar dados de peso ao nascer, basta escrever os pesos, uma folha de papel. O número do prontuário, escrito ao lado do peso ao nascer, facilita a posterior verificação da apuração. Veja o exemplo:
1.3.
Número do Prontuário
Peso ao nascer
10.525 10.526 ..... ..... ..... 10.624
3,25 2,00 ..... ..... ..... 3,20
População e Amostra
Entende-se por população, o conjunto de elementos que têm em comum, determinada característica. Todo subconjunto subconjunto não vazio e com com menor numero de elementos do que a população população constitui uma amostra dessa população. As populações podem ser finitas, como o conjunto de alunos de uma escola em determinado ano ou, infinitas, como o número de vezes que se pode jogar um dado. Para certas finalidades, finalidades, as populações populações finitas muito grandes são consideradas consideradas infinitas. Como exemplo, considere as pessoas do sexo masculino com mais de 35 anos de idade, residentes na cidade de São Paulo. O número dessas pessoas pessoas é matematicamente finito, mas tão grande grande que um registrador ao analisar uma amostra de 500 pessoas, pode considerar a população como infinita. Os pesquisadores trabalham com amostras, amostras, por vários motivos. motivos. Primeiro, é fato que as populações populações finitas só podem ser estudadas através através de amostras. Por exemplo, por maior que seja o número de vezes que uma pessoa pessoa possa pesar um corpo sólido, o resultado será sempre uma amostra por que, teoricamente, todo corpo pode ser pesado um número infinito de vezes. Depois, as populações finitas muito grandes grandes só podem ser estudadas através através de amostras. Por exemplo, o número de cobaias existentes no mundo em determinado período é, matematicamente, finito, mas as pesquisas que usam cobaias só podem ser feitas com amostras, por que nenhum pesquisador dispõe de todas as cobaias do mundo para o seu trabalho. Finalmente, o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo sumário de toda a população. Por exemplo, para estudar o efeito do flúor sobre a prevenção de cáries em crianças, é melhor submeter uma amostra de crianças a exames periódicos minuciosos, do que examinar rapidamente todas as crianças antes, e determinado tempo após o uso do flúor.
1.4.
Técnicas de Amostragem
Definida a população, é preciso estabelecer a técnica de amostragem, amostragem , isto é, o procedimento que será adotado para escolher escolher os elementos que irão compor a amostra. Conforme a técnica utilizada, tem-se um tipo de amostra.
1.4.1. Amostra Casual Simples A amostra casual simples é composta por elementos retirados ao acaso da população. Então todo elemento da população tem igual probabilidade de ser escolhido para a mostra. Um exemplo ajuda a entender essa técnica de amostragem. amostragem. 6
Bioestatística
a
Prof Claudia M. G. G. Franchi
Imagine que um professor quer obter uma mostra casual simples dos alunos de sua escola. Para isso, pode organizar organizar um sorteio com fichas numeradas, numeradas, de zero a nove. nove. Para fazer o sorteio, o professor retira uma uma ficha de uma urna urna e anota o número. número. Esse número será o primeiro dígito do número do aluno que será sorteado para para a amostra. Feito isso, o professor recoloca recoloca a ficha na urna, mistura, retira outra ficha e anota o número, que será o segundo dígito do número do aluno que será sorteado para a amostra. amostra. Esse procedimento deve deve ser repetido até que sejam retirados todos os dígitos do número do aluno sorteado. Se a escola tem, por exemplo, exemplo, 832 alunos, os números números dos alunos têm três dígitos. dígitos. Para sortear um aluno, é preciso retirar três fichas da urna, uma de cada vez, sempre lembrando que a ficha retirada deve ser recolocada recolocada na urna antes de nova nova retirada. O número de um dos dos alunos sorteados poderia poderia ser, por exemplo, 377 assim obtido: Primeira ficha: 3 Segunda ficha: 7 Terceira ficha: 7
É claro que devem ser desprezados números maiores do que 832 (se a escola tem 832 alunos, nenhum aluno recebeu número maior do que 832), números que já foram sorteados e o número 000. O professor sorteia tantos números quantos são os alunos que ele quer na amostra.
1.4.2. Amostra Sistemática Na amostra sistemática, os elementos elementos são escolhidos não por por acaso, mas por um sistema. sistema. No exemplo, o professor terá organizado uma amostra sistemática se, em lugar de sortear os alunos, chamar para a amostra amostra todo aluno com número número terminado em determinado determinado dígito. Veja o esquema dado em seguida. O professor chamou, para a amostra, amostra, todos os alunos com números números terminados em zero, assinalados no esquema esquema com asteriscos. Então organizou organizou uma amostra sistemática. o
N
Nome
1 . . *10 . . *20
o
N
Nome
21 . . *30 . . *40
o
N
Nome
41 . . *50 . . *60
Quando a população está organizada, é mais fácil obter uma amostra sistemática do que uma amostra casual simples. Por exemplo, para obter uma amostra de 2% dos prontuários dos pacientes de uma clínica, é mais fácil pegar o último de cada 50 prontuários do que fazer um sorteio até conseguir 2% do total de prontuários. prontuários. As amostras sistemáticas são muito usadas, mas exigem especial preocupação com o sistema de seleção. Por exemplo, se os elementos da população estão em fila, não se devem selecionar os “primeiros”, ou os “últimos”, nem mesmo “os do meio”, é preciso percorrer toda a fila e escolher, por
exemplo, o décimo de cada grupo de dez.
1.4.3. Amostra Estratificada A amostra estratificada é composta por elementos provenientes de todos os estratos da população. No exemplo, se o professor considera que os alunos de diferentes séries apresentam reais 7
Bioestatística
a
Prof Claudia M. G. G. Franchi
diferenças, cada série é um estrato. O professor deve então, obter uma amostra amostra de cada série (estrato) e depois reunir reunir todas as as amostras, em uma só. Essa amostra final é estratificada. Devem ser obtidas amostras estratificadas sempre que a população for constituída por diferentes estratos. estratos. Por exemplo, exemplo, se as pessoas que residem residem nos vários bairros bairros de uma cidade cidade são diferentes, cada bairro é um estrato. Para obter uma amostra de pessoas pessoas dessa cidade, seria razoável obter uma amostra de cada bairro e depois reunir todas as informações numa amostra estratificada.
1.4.4. Amostra de Conveniência A amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente por que dispunha deles. Então, se o professor tomar os alunos de sua classe como amostra de toda a escola, estará usando uma amostra de conveniência. Os estatísticos têm muitas muitas restrições ao uso de amostras amostras de conveniência. conveniência. Mesmo assim, as as amostras de conveniência são comuns na área de saúde, onde se fazem pesquisas com pacientes de uma só clínica ou de um só hospital. hospital. Mais ainda, as amostras de de conveniência constituem constituem muitas vezes a única maneira de estudar determinado problema. De qualquer forma, o pesquisador que utiliza amostras de conveniência precisa de muito sendo crítico. Os dados podem ser ser tendenciosos. tendenciosos. Por exemplo, exemplo, para estimar estimar a probabilidade probabilidade de de morte por por desidratação não se deve deve recorrer aos dados de um hospital. Como só são internados os casos graves, graves, é possível que a mortalidade entre pacientes internados seja muito maior do que entre pacientes não internados. Consequentemente, Consequentemente, a amostra amostra de conveniência conveniência – constituída, neste exemplo, por pacientes internados no hospital – seria tendenciosa t endenciosa.. Finalmente, o pesquisador que trabalha com amostras sempre pretende fazer inferência, inferência, isto é, estender os resultados da amostra para toda a população. Então é muito importante caracterizar bem a amostra e estender os resultados obtidos na amostra apenas para a população de onde a amostra proveio.
1.5.
Exercícios – Capítulo 1
1. Os prontuários dos pacientes de um hospital estão organizados em um arquivo, por ordem alfabética. Qual é a maneira mais rápida de amostrar amostrar 1/3 do total dos prontuários? prontuários? 2. Um pesquisador trem dez gaiolas que contém contém cada uma, seis ratos. Como o pesquisador pesquisador pode solucionar dez ratos para a mostra? 3. Para levantar dados sobre o número de filhos por casal, em uma comunidade, um pesquisador organizou organizou um questionário que enviou, enviou, pelo correio, a todas as residências. A resposta ao questionário era facultativa, pois o pesquisador não tinha condições de exigir a resposta. Nesse questionário perguntava-se perguntava-se o número número de filhos por casal morador morador na residência. Você acha que os os dados assim obtidos têm algum tipo de tendenciosidade? 4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio usando a técnica de amostragem amostragem sistemática. sistemática. Para isso, o pesquisador pesquisador visitará cada domicílio domicílio selecionado. Se nenhuma pessoa estiver presente na ocasião da visita, o pesquisador excluirá o domicílio da amostra. Esta última determinação determinação introduz introduz tendenciosidade? tendenciosidade? Por quê? 5. Muitas pessoas acreditam acreditam que as famílias se tornaram menores. menores. Suponha que, para estudar estudar essa questão, foi selecionada uma amostra de 2.000 casais e perguntou-se quantos filhos eles tinham, quantos filhos tinham seus seus pais e quantos filhos tinham seus avós. O procedimento procedimento introduz tendenciosidade nos dados? Por quê? 8
Bioestatística
a
Prof Claudia M. G. G. Franchi
6. Dada uma população de 4 indivíduos, X, W, Y, Z, quantas amostras casuais simples de tamanho 2 podem ser obtidas? Quais são essas amostras? 7. Dada uma população de 8 elementos, A, B, C, D, E, F, G, e H, descreva três formas diferentes de obter uma amostra sistemática de 4 elementos. 8. Dada uma população de 40 alunos, descreva uma forma de obter uma amostra casual simples de 6 alunos. 9. Organize uma lista com 10 nomes de pessoas em ordem alfabética. Depois escreva uma forma de obter uma amostra sistemática de 5 indivíduos. 10. Em uma pesquisa de mercado para serviços odontológicos tomou-se a lista telefônica, onde os nomes dos assinantes estão organizados em ordem alfabética do último sobrenome, e se amostrou o décimo de cada 10 assinantes. Critique esse procedimento. procedimento. 11. Classifique as variáveis em qualitativa (nominal ou ordinal) e quantitativa q uantitativa (discreta ou contínua) e dê exemplo de um valor (numérico ou não numérico) para cada item. a) b) c) d) e) f) g) h) i)
Estado civil de uma pessoa: Marcas de carros carros em um estacionamento: estacionamento: Salário de de um funcionário de uma uma empresa: empresa: Número de acidentes de trabalho em uma empresa: empresa: Cor dos cabelos das modelos de uma agencia de modelos: Cor dos olhos: Grau de instrução: Número de filhos de um um casal: casal: Peso e altura dos alunos de uma escola:
9
Bioestatística
2.
a
Prof Claudia M. G. G. Franchi
CAPÍTULO 2 - APRESENTAÇÃO DE DADOS EM TABELAS
Os dados devem ser apresentados em tabelas construídas de acordo com as normas técnicas ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE.
2.1.
Componentes das Tabelas
As tabelas têm têm título, corpo, cabeçalho cabeçalho e coluna indicadora. indicadora. O título explica o que a tabela contém. O corpo é formado pelas pelas linhas e colunas de dados. dados. O cabeçalho especifica conteúdo conteúdo das colunas, e a coluna indicadora especifica especifica o conteúdo das linhas. Como exemplo, veja a tabela a seguir: População brasileira residente, com 15 anos e mais, segundo a alfabetização, de acordo com o senso demográfico de 1980 Alfabetização
Sabem ler e escrever Não sabem ler e escrever Sem declaração
Frequência
54.793.268 18.716.847 31.828
Fonte: IBGE (1988)
Na tabela acima, observe o título: População brasileira residente, com 15 anos e mais, segundo a alfabetização, de acordo com o senso demográfico de 1980
O cabeçalho é constituído pelas palavras: Alfabetização
Frequência
A coluna indicadora é constituída pelas especificações: Sabem ler e escrever Não sabem ler e escrever Sem declaração O corpo da tabela é formado pelos números: 54.793.268 18.716.847 31.828
As tabelas podem podem apresentar, apresentar, além das frequências, frequências, as frequências relativas e o total. Para obter a frequência relativa de uma dada categoria, divide-se a frequência dessa categoria pela soma das frequências. frequências. O resultado, multiplicado por 100, é uma uma porcentagem. porcentagem. O total da coluna é escrito entre dois traços horizontais.
10
Bioestatística
a
Prof Claudia M. G. G. Franchi
População brasileira residente, com 15 anos e mais, segundo a alfabetização, de acordo com o senso demográfico de 1980 Alfabetização
Frequência
Sabem ler e escrever Não sabem ler e escrever Sem declaração Total.......................................................
Frequência Relativa
54.793.268 18.716.847 31.828 73.541.943
74,51 25,45 0,04 100,00
Fonte: IBGE (1988)
As tabelas podem conter conter fonte ou notas. A fonte dá indicação da entidade, ou do pesquisador, pesquisador, ou dos pesquisadores que publicaram ou forneceram os dados. Como exemplo na tabela citada como exemplo, a fonte é o IBGE, pois foi essa fundação que publicou os dados. As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apuração. Observe a tabela abaixo. A nota informa que que só foram apurados apurados nascimentos nascimentos ocorridos no no ano de registro. Nascidos vivos registrados segundo o ano do registro Ano do Registro
Frequência
1984 1985 1986
2.559.038 2.619.604 2.779.253
Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro
2.2.
Tabelas de Contingência
Muitas vezes os elementos da amostra ou da população são classificados de acordo com dois fatores. Os dados devem então ser apresentados em tabelas de contingência, contingência, isto é, em tabelas de dupla entrada, entrada, cada entrada relativa a um dos fatores. Como exemplo, veja a tabela abaixo que representa o número número de nascidos vivos registrados. registrados. Note que eles estão classificados segundo segundo dois fatores: o ano de registro e o sexo.
Nascidos vivos registrados segundo o ano de registro e o sexo Ano de Registro
Sexo Masculino
1984 1985 1986
1.307.758 1.339.059 1.418.050
Total
Feminino
1.251.280 1.280.545 1.361.203
2.559.038 2.619.604 2.779.253
Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro
As tabelas de contingência podem apresentar frequências relativas, além de frequências simples. As frequências relativas relativas dão estimativas de riscos, riscos, isto é, dão estimativas de probabilidades probabilidades de dano. Veja o exemplo abaixo: 11
Bioestatística
a
Prof Claudia M. G. G. Franchi
Recém-nascidos Segundo Segundo a Época do Ataque de Rubéola na Gestante e a Condição de Normal ou Defeituoso Época do ataque
Até o 3º mês Depois do 3º mês
Condição
Normal
Defeituoso
36 51
14 3
Total
Frequência Relativa de defeituosos
50 54
28,0% 5,6%
Fonte: HILL et all. (1958)
As frequências relativas apresentadas na tabela acima estimam o risco de um recém-nascido ser defeituoso em função da época em que a gestante foi atacada de rubéola. Note que a frequência relativa de defeituosos (risco) é maior quando a gestante foi atacada de rubéola no primeiro trimestre da gestação. Diz-se então que a época do ataque de rubéola é um fator de risco na ocorrência de recémnascidos defeituosos.
2.3.
Exercícios – Capítulo 2
1. Faça uma pesquisa pesquisa sobre os dados dos dos seus colegas de sala e monte tabelas tabelas com as seguintes seguintes variáveis: a. b. c. d. e. f. g.
Idade Sexo Cidade de Residência Idade Número de Filhos Estado Civil Número de Irmãos
12
Bioestatística
3.
a
Prof Claudia M. G. G. Franchi
CAPITULO 3 - TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS
É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).
3.1.
Tabela primitiva ou dados brutos:
É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
3.1.1. ROL É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
3.2.
Distribuição de frequência sem intervalos de classe
É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 Total
3.3.
Frequência 3 2 1 1 1 2 2 1 1 1 1 2 2 20
Distribuição de frequência com intervalos de classe
Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. 13
Bioestatística
a
Prof Claudia M. G. G. Franchi
Classes
Frequências 7
41 45 45 49 53 57
3
49
4
53
1
57
5
61 Total
20
As tabelas com grande número de dados são cansativas e não dão ao leitor visão rápida e global do fenômeno. Para isso, é preciso que os dados estejam organizados em uma tabela de distribuição de frequências. frequências. A partir de agora, explicaremos passo a passo, a construção desse tipo de tabela usando, como exemplo os dados na tabela Peso ao nascer de nascidos vivos em quilogramas. quilogramas. Imagine que, para dar uma ideia sobre o peso ao nascer de nascidos vivos, o pesquisador irá apresentar não não os pesos observados, observados, mas o número de nascidos vivos vivos por faixas de peso. Deve, então, construir uma tabela de distribuição de frequências. Peso ao nascer de nascidos vivos, em quilogramas 2.522
3.200
1.900
4.100
4.600
3.400
2.720 3.125 2.250 3.220 3.000 3.725
3.720 2.800 2.900 2.950 2.480 3.800 2.500 3.550 3.000 4.100 3.200 3.450 3.100 3.150 2.800 2.900
3.600 3.200 3.300 2.900 2.500 3.600 2.500 2.300 2.950 3.000 3.750 3.150 3.200 2.500 2.900 3.200
2.400 2.700 2.450 3.400 2.400 3.120 3.400 3.200 2.700 3.150 2.800 2.700 3.300 3.200 3.200 2.800
1.720 2.750 4.200 2.100 4.450 2.900 2.920 2.720 2.900 2.000 2.720 2.480 3.900 2.500 2.480 2.450
3.400 1.570 3.800 2.700 2.900 3.700 2.120 3.150 2.400 3.450 3.120 2.120 2.450 2.700 ....... .......
2.890 3.110 3.520 3.100 3.200 2.780 3.155 2.150 3.300 3.250
Primeiro, é preciso definir as faixas de peso que recebem tecnicamente o nome de classes. Observe os dados dados apresentados apresentados na tabela acima. O menor valor é de 1.570 Kg e o maior é de 4.600 Kg. Podem então ser definidas classes de 1,5 a 2,0 Kg, de 2,0 a 2,5 Kg, e assim por diante, como mostra o esquema dado a seguir: 1,5
2,0
14
Bioestatística
a
Prof Claudia M. G. G. Franchi
2,0
2,5
2,5
3,0
3,0
3,5
3,5
4,0
4,0
4,5
4,5
5,0
Na classe de 1,5 a menos de 2,0 Kg são colocados desde nascidos com 1,5 Kg até os que nasceram com 1.999 Kg; na classe de 2,0 a menos de 2,5 Kg, são colocados desde nascidos com 2,0 Kg até os que nasceram com 2,499 Kg, e assim por diante. Logo, cada classe cobre um intervalo de 0,5 Kg, ou seja, cada intervalo de classe é de 0,5 Kg. É mais fácil trabalhar com intervalos de classe iguais. As distribuições das frequências, obtidas a partir da tabela do Peso ao nascer de nascidos vivos, em quilogramas, é dada a seguir: Classe 1,5 2,0 2,5 3,0 3,5 4,0 4,5
2,0 2,5 3,0 3,5 4,0 4,5 5,0
Frequência = 3 = 16 = 31 = 34 = 11 = 4 = 1
Denominam-se extremos de classe os limites dos intervalos de classe. Deve ficar muito claro se os valores iguais aos extremos devem ou não ser incluídos na classe. Recomenda-se adotar a notação 1,5 2,0, 2,0 2,5 etc. Isto significa que o intervalo „e fechado à esquerda, esquerda, isto é, pertencem à classe os valores iguais ao extremo inferior inferior (por exemplo, exemplo, 1,5 na primeira classe). Também significa que o intervalo é fechado à direita, direita, isto é, não pertencem à classe os valores iguais ao extremo superior (por exemplo, 2,0 na primeira classe). 15
Bioestatística
a
Prof Claudia M. G. G. Franchi
Numa tabela de distribuição de frequências também podem ser apresentados os pontos médios da classe. O ponto médio é dado pela soma dos extremos da classe, dividia por 2. Para a classe 1,5 2,0, o ponto médio é:
Uma tabela típica de distribuição de frequências tem então, três colunas: a da esquerda, onde estão escritas as classes; a do meio, onde estão escritos os pontos médios; e a da direita, onde estão escritas as frequências, isto é, o numero de elementos elementos de cada classe. Veja a tabela a seguir: Nascidos vivos segundo o peso ao nascer, em quilogramas Classe 1,5 2,0 2,5 3,0 3,5
2,0 2,5 3,0 3,5 4,0
4,0
4,5
4,5
5,0
Ponto Médio
Frequência
1,75
3
2,25
16
2,75
31
3,25
34
3,75
11
4,25
4
4,75
1
Nem sempre estarão definidos o extremo inferior da primeira classe ou o extremo superior da última classe. Observa a tabela abaixo. O extremo superior superior da última classe não esta definido. Esta tabela também exemplifica o uso de intervalos de classe diferentes. Mulheres com 30 anos de Idade Segundo a Pressão Sanguínea Sistólica, em Milímetros de Mercúrio Classe
Ponto Médio
Frequência
90 100 100 105 105 110 110 115 115 120 120 125 125 130 130 135 135 140
95 102,5 107,5 112,5 117,5 122,5 127,5 132,5 137,5
6 11 12 17 18 11 9 6 4 16
Bioestatística
a
Prof Claudia M. G. G. Franchi
140 150 150 160 160 e mais
145 155 ...
4 1 1
As tabelas de distribuição de frequências mostram a distribuição da variável, mas perdem em exatidão. Isso porque todos os dados passam a ser representados pelo ponto médio da classe a que pertencem. Por exemplo, a tabela acima mostra que seis mulheres apresentaram pressão sanguínea sistólica com o ponto médio igual a 95, mas não d‟ a informação exata sobre a pressão de cada uma delas. O numero de classes deve ser escolhido pelo pesquisador, em função do que ele quer mostrar. Em geral, convém estabelecer de 5 a 20 classes. Se o numero de classes for demasiado pequeno (por exemplo, 3) perde-se muita informação. Se o numero de classes for grande (por exemplo, 30) tem-se pormenores desnecessários. Mas não existe um numero “ideal” de classes, embora existam até formulas para estabelecer quantas classes devem ser construídas. Uma dessas fórmulas „e a seguinte:
Onde n é o número de dados. O número de classes é um inteiro próximo de k. Para entender como se aplica esta fórmula, veja a tabela t abela peso ao nascer dos nascidos vivos, como n=100, tem-se que:
ou seja, deveriam ter sido construídas 7 ou 8 classes. É importante deixar claro, aqui, que o resultado obtido por esta formula pode ser usado como referencia, mas cabe ao pesquisador determinar o numero de classes que pretende organizar. Finalmente, quando se constrói uma tabela de distribuição de frequências, é melhor usar, como extremos de classes, números fáceis de trabalhar. No caso do peso ao nascer dos nascidos vivos, foram definidas 7 classes e foram estabelecidos extremos com valores fáceis, como 1,5 e 2,0.
3.4.
Exercícios – Capítulo 3
1. De acordo com o IBGE (1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por doença mental, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela. 2. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela abaixo, apresente também as frequências relativas: Pressão arterial, em milímetros de mercúrio, de cães adultos anestesiados e após laparotomia 130,0 107,5 135,0 100,0 134,5
105,0 125,0 130,0 145,0 158,5
120,0 100,0 135,0 125,0 110,0
111,5 107,5 127,5 104,5 102,5
99,0 120,0 90,5 101,5 90,5
116,0 143,0 104,5 102,5 107,5
82,5 115,0 136,5 101,5 124,0 17
Bioestatística
121,5 107,5
a
Prof Claudia M. G. G. Franchi
135,0 140,0
102,0 121,5
119,5 107,5
115,5 113,0
125,5 93,0
117,5 103,5
3. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de Trânsito, 27.306 casos de vitimas fatais, assim distribuídos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faça uma tabela para apresentar esses dados. Apresente também as frequências f requências relativas e o total. 4. De posse da tabela abaixo, calcule as frequências relativas de não sobreviventes. Pacientes com câncer de mama segundo a faixa de idade por ocasião Do diagnostico e sobrevivência por três anos Sobrevivência Faixa de idade Menor de 50 anos De 50 a 70 anos Mais de 70 anos Fonte: MORRISON (1973)
Sim 11 18 15
Não 6 8 9
5. De posse da tabela abaixo, calcule as frequências relativas em cada linha, isto „e, calcule a proporção de estabelecimentos de saúde, públicos e particulares, de cada espécie. Estabelecimentos de saúde, públicos e particulares Por espécie. Brasil, 1985. Estabelecimentos Públicos Particulares 1.002 5.132 150 156 1.531 6.136 14.393 472
Faixa de idade Hospital Pronto-socorro Policlínicas Outros Fonte: IBGE (1988)
6. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela abaixo usando intervalos de classes iguais. Depois faça outra tabela, com os seguintes intervalos: 1 dia, 2 ou 3 dias, de 4 a 7 dias, de 8 a 14 dias, mais de 14 dias. Tempo de internação, em dias, de pacientes acidentados no trabalho, em um dado hospital h ospital 7 12 4 10 2 1
8 12 15 8 7 6
1 3 2 9 14 4
7 17 14 8 12 7
13 4 3 5 10 7
6 2 5 3 8 11
7. Ao nascer, os bebês são pesados e medidos, para saber se estão dentro das tabelas de peso e altura esperados. esperados. Estas duas variáveis são: a) qualitativas b) ambas discretas 18
Bioestatística
a
Prof Claudia M. G. G. Franchi
c) ambas contínuas d) contínuas e discretas e) discreta e contínua 8. A parcela da população convenientemente convenientemente escolhida para representa-la é chamada de: a) variável b) rol c) amostra d) dados brutos e) nada podemos afirmar, porque a informação i nformação é incompleta 9. Um conjunto de 100 notas de matemática, de alunos do sexo masculino, tiradas dos arquivos da secretaria da escola, constitui: a) um rol b) uma tabela c) uma relação de dados brutos d) uma distribuição de frequência f requência 10. Por definição, rol é qualquer série ordenada de valores referentes a uma mesma variável. variável . Então, dadas as séries da mesma variável x: I. –2, 4, 5, 6, 7 II. 1, 3, 3, 6, 7 III. 8, 7, 5, 2, 1 IV. 5, 4, 4, -1 Podemos afirmar que: a) todas elas constituem róis b) só a série I constitui um rol c) a série II não é um rol, mas as outras sim d) apenas as séries I e IV não são róis e) somente a série III é um rol, as demais não
19
Bioestatística
4.
a
Prof Claudia M. G. G. Franchi
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (COM INTERVALOS DE CLASSE) Classe 1,5 2,0 2,5
4.1.
Frequência
1,75
3
2,25
16
2,75
31
3,25
34
3,75
11
4,25
4
4,75
1
2,0 2,5 3,0
3,0
3,5
3,5
4,0
4,0
4,5
4,5
Ponto Médio
5,0
Classe
São os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Exemplo, na na tabela acima, K=7 K=7 e 2,5 3,0 é a terceira terceira classe, classe, onde i=3.
4.2.
Limite superior e limite inferior da classe
São os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número é o limite superior ( Li ) da classe. Exemplo, em 2,5 3,0 l 3=2,5 e L 3=3,0. O símbolo representa um intervalo fechado à esquerda e aberto à direita. O dado 3,0 do ROL não pertence à classe 3 e sim a classe 4 representada por 3,0 3,5.
4.3.
Amplitude de classe
É obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por . Exemplo, na tabela acima, na classe k=1, h i = 2,0 - 1,5 = 0,5.
4.4.
Amplitude total da distribuição
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = –1,5 = 3,5. L(max) - l(min) . Ex: na tabela anterior AT = 5,0
20
Bioestatística
a
Prof Claudia M. G. G. Franchi
4.5.
Amplitude total da amostra (ROL)
É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = X max max - X min min . Em nosso exemplo AA = 4.600 –1.570 = 3.030. ( AT sempre será maior que AA).
4.6.
Ponto Médio de classe
É o ponto ponto que que divide divide o intervalo de classe em duas duas partes partes iguais. iguais. Exemplo, em 2,0 2,0
2,5 , o
ponto médio x 3 3= (2,0+2,5)/2= 2,25.
4.7.
Exercícios – Capítulo 4
1. A tabela abaixo apresenta a distribuição de frequência dos salários mensais em reais, de 65 empregados da companhia P & R.
1
5.000
6.000
8
2
6.000
7.000
10
3
7.000
8.000
16
4
8.000
9.000
14
5
9.000
10.000
10
6
10.000
11.000
5
7
2
11.000 12.000 Total ............................................
65
Determinar: a) b) c) d) e) f) g) h)
A amplitude Total; O limite superior da quinta classe O limite inferior da sexta classe; A amplitude amplitude do quinto intervalo de classe; classe; A classe do 40º empregado; A percentagem de empregados cuja renda ultrapassa ultrapass a R$10.000,00 R$10.000, 00 por mês; A percentagem de empregados que ganham menos de R$8.000,00 por mês; A percentagem percentagem de empregados empregados que ganham ganham menos de R$10.000,00 R$10.000,00 e pelo menos R$6.000,00 por mês;
2. A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:
Áreas (m2) No de Lotes
300
400 14
500 46
600 58
700 76
800 68
900 62
1000 48
1100 22
1200 6
Com referência a essa tabela, determine: a) A amplitude total. 21
Bioestatística
b) c) d) e) f) g) h) i) j) k) l) m) n) o)
a
Prof Claudia M. G. G. Franchi
O limite superior da quinta classe. O limite inferior da oitava classe. O ponto ponto médio da sétima classe. A amplitude do intervalo intervalo da segunda classe. A frequência da quarta classe. A frequência relativa da sexta classe. A frequência frequência acumulada da quinta quinta classe. classe. O número número de lotes cuja área não atinge 700m 2. O número de lotes cuja área atinge e ultrapassa ultrapassa 800m 2. A percentagem dos lotes cuja área não atinge 600m 2. A percentagem percentagem dos lotes cuja área seja maior ou ou igual igual a 900m 2. A percentagem dos lotes cuja área é de 500m 2, no mínimo, mas inferior i nferior a 1000m 2. A classe do 72º lote. Até que classe estão estão incluídos incluídos 60% os lotes.
3. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus. No de Acidentes No de Motoristas
a) b) c) d) e)
0
1
2
3
4
5
6
7
20
10
16
9
6
5
3
1
Determine: O número de e a percentagem percentagem de motoristas que não sofreram nenhum nenhum acidente. O número e a percentagem percentagem de motoristas motoristas que sofreram pelo menos 4 acidentes. acidentes. O número e a percentagem de motoristas motorist as que sofreram menos de 3 acidentes O número e a percentagem percentagem de motoristas motoristas que sofreram sofreram no mínimo 3 e no máximo máximo 5 acidentes. A percentagem percentagem dos motoristas motoristas que sofreram sofreram no máximo 2 acidentes. acidentes.
4. Complete a tabela abaixo:
i 1 2 3 4 5
Classes 0 8 8 16 16 24 24 32 32 40
fi 4 10 14 9 3
fr
= 40
f%
F
= 1,00
5. Complete os dados que faltam na distribuição de frequência:
i 1 2 3
xi 0 1 2
fi 1
fri 0,05 0,15
Fi 4
4 22
Bioestatística
a
Prof Claudia M. G. G. Franchi
4 5 6 7 8
3 4 5 6 7
0,25 0,15
3 2
13 18 19
6. Complete os dados que faltam na distribuição de frequência:
i 1 2 3 4 5 6 7 8
Classes 0 2 2 4 4 6
xi 1
fi 4 8
5 7
8 10 10 12
Fi
30 27 15
13
10
72 83 93
14 16 100
7. Considerando as notas de um teste de inteligência aplicado a 100 alunos:
64 73 78 86 76 82 68 71 95 94
78 95 86 84 80 90 96 73 94 75
66 82 78 86 92 83 86 63 88 67
82 74 89 73 101 85 76 76 102 73 81 85 70 72 105 74 62 91 95 108
103 92 98 83 87 72 74 98 83 98
78 85 75 103 70 81 84 78 98 71
86 80 73 86 85 96 99 78 93 92
103 81 90 84 79 81 81 83 83 72
87 90 86 85 93 85 89 96 76 73
Forme uma distribuição de frequência.
23
Bioestatística
5.
a
Prof Claudia M. G. G. Franchi
GRÁFICOS ESTATÍSTICOS
São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Os gráficos são de extrema importância na visualização e interpretação de informações e dados acerca de temas de aspectos naturais, sociais e econômicos. Os gráficos são representações bastante difundidas em diferentes tipos de informativos, dentre eles, os principais estão em livros, revistas, jornais impressos, além da televisão e a internet, que fazem o uso continuamente para apresentar informações à população em geral ou grupos específicos de pesquisas. Diante dessas afirmações os gráficos consistem em uma representação constituída por formas geométricas elaboradas de maneira precisa, oriundas de dados numéricos resultados de pesquisas e organizadas em uma tabela. Os gráficos são classificados segundo sua forma e podem ser de colunas, de linhas e circulares. Existem normas adicionais para a construção de gráficos, ditadas pela fundação IBGE. Assim, todo gráfico deve apresentar título e escala. O título pode ser colocado tanto acima como abaixo do gráfico. As escalas devem devem crescer da esquerda esquerda para a direita, e de baixo para cima. As legendas legendas explicativas devem ser colocadas de preferência, à direita do gráfico. Observe os tipos de gráficos a partir do exemplo da tabela com os dados da população brasileira residente, com 15 anos e mais segundo o estado conjugal. População Brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o censo demográfico de 1980 Estado conjugal
Solteiros (1) Casados (2) Separados Viúvos Sem declaração
Frequência
25.146.484 41.974.865 1.816.046 3.616.046 1.005.234
Percentual
34,18 57,06 2,47 4,92 1,37
Fonte: IBGE Nota: Estão computados, como separados, os separados, os desquitados e os divorciados (1) Exclusive as pessoas solteiras, vivendo em união consensual estável (2) Inclusive 4.939.528 pessoas vivendo em união consensual estável
5.1.
Gráfico de Barras
O gráfico de barras é usado para apresentar variáveis qualitativas ou ordinais. Para fazer um gráfico de barras, barras, primeiro se traça o sistema de eixos cartesianos. Depois se colocam, no eixo das abscissas, as categorias da variável em estudo. Em seguida constroem-se barras retangulares, com base no eixo das abscissas e altura igual à frequência, ou à frequência relativa, da respectiva categoria. As barras devem ser desenhadas separadas para ficar claro que a variável é qualitativa ou ordinal.
24
Bioestatística
a
Prof Claudia M. G. G. Franchi
Figura 1: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.
5.2.
Gráfico de Colunas
Figura 2: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.
5.3.
Gráfico de Setores
O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais. Para fazer um gráfico de setores, primeiro se traça uma uma circunferência que, como se sabe, sabe, tem 360º. Essa circunferência representa o total, ou seja, 100%. Dentro dessa circunferência devem ser representadas as categorias da variável em estudo. Para isso, toma-se a frequência relativa de cada categoria e calcula-se o ângulo central, da seguinte maneira: se 100% correspondem a 360º, uma categoria com frequência relativa de f% terá um ângulo central x, tal que:
Logo, valor do ângulo central x será:
25
Bioestatística
a
Prof Claudia M. G. G. Franchi
Os ângulos centrais das demais categorias são obtidos da mesma maneira. Para fazer o gráfico de setores marcam-se, na circunferência, os ângulos calculados, separando-os com o traçado dos raios. Observe o gráfico de setores apresentado abaixo: abaixo:
5.4.
Gráfico de Linhas
Gráfico de Linhas: É um gráfico que apresenta os dados por meio de linhas, sempre que as categorias utilizadas representarem um intervalo de tempo.
26
Bioestatística
5.5.
a
Prof Claudia M. G. G. Franchi
Exercícios – Capítulo 5
1. Faça um gráfico de barras e um gráfico de setores para apresentar os dados da tabela a seguir: Suicidas segundo o sexo. Brasil, 1986 Sexo
Frequência
Percentual
Masculino ............. Feminino ..............
3.562 1.192
74,93 25,07
Fonte: IBGE: 1988
2. Utilizando o gráfico em colunas, represente a tabela:
3. Utilizando o gráfico em linhas, represente a tabela:
27
Bioestatística
6.
a
Prof Claudia M. G. G. Franchi
REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO 6.1.
Histograma
Os dados apresentados em tabelas de distribuição de frequências são apresentados graficamente em histogramas. Para construir um histograma, primeiro se traça o sistema de eixos cartesianos. Depois, se os intervalos de classe são iguais, traçam-se barras retangulares com bases iguais, correspondendo aos intervalos de classe, e com alturas determinadas pelas respectivas frequências. Quando os intervalos de classe são diferentes, para construir um histograma é preciso calcular as densidades densidades de frequência relativa. Entende-se por densidade de frequência relativa o quociente entre a frequência relativa e o intervalo de classe, isto é:
6.2.
Polígono de Frequências
Os dados apresentados na tabela de distribuição de frequências também podem ser apresentados em gráficos denominados polígonos de frequências. Para fazer esse tipo de gráfico, primeiro se traça traça o sistema sistema de eixos eixos cartesianos. Depois, se os os intervalos de classe são são iguais, marcam-se pontos com abscissas iguais aos pontos médios de classes e ordenadas iguais às respectivas frequências. Se os intervalos de classe são diferentes, marcam-se pontos com abscissas iguais aos pontos médios de classes e ordenadas iguais às respectivas densidades de frequência relativas. Para fechar o polígono, unem-se os extremos da figura com o eixo horizontal, nos pontos de abscissas iguais aos pontos médios de uma classe imediatamente inferior à primeira, e de uma classe imediatamente superior à última.
28
Bioestatística
a
Prof Claudia M. G. G. Franchi
6.3.
Exercícios – Capítulo 6
1. Consideremos os dados dados da Tabela a seguir. Preço médio da gasolina comum para áreas selecionadas dos Estados Unidos, março de 1975, em centavos de dólar.
Área
Preço por galão
Atlanta Baltimore Boston Buffalo Chicago Cincinnati Cleveland Dallas Detroit Houston Kansas City
53.4 55.1 53.9 53.4 54.8 53.3 53.9 49.1 53.7 47.9 49.6
Área
Preço por galão
Los Angeles Milwaukee Minneapolis New York Philadelphia Pittsburgh St. Louis San Diego San Francisco Seattle Washington
53.5 50.1 50.3 55.2 52.9 53.4 52.3 55.3 56.8 52.7 55.2
Vamos supor que quiséssemos organizar aqueles preços em uma distribuição de frequências com cerca de 5 classes. Determinar a amplitude conveniente de cada intervalo, de tal forma que todos os intervalos de classe tenham iguais amplitudes, e construir a tabela de frequências fixando o limite inferior da primeira classe em 47.0. Construir o histograma e o polígono de frequência da distribuição. 2. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe. 162 164 170 160 166
163 165 157 158 169
148 159 176 163 152
166 175 157 165 170
169 155 157 164 172
154 163 165 178 165
170 171 158 150 162
166 172 158 168 164
a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo intervalo de classe? c) Construir uma tabela de frequências simples simples absoluta e relativa relativa das alturas dos alunos alunos admitindo a que o limite inferior da 1 classe seja 148 cm. d) Determinar os pontos pontos médios das classes. classes. 3. Os dados seguintes seguintes representam representam 20 observações observações relativas relativas ao índice pluviométrico em determinados determinados municípios do Estado: 144 152 159 160 160 151 157 146 154 145 141 150 142 146 142 141 141 150 143 158 Construir a tabela de frequências simples e acumuladas (“abaixo de” e “acima de”) tanto absolutas quanto relativas. 29
Bioestatística
7.
a
Prof Claudia M. G. G. Franchi
MEDIDAS DE POSIÇÃO 7.1.
Introdução
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência central mais utilizadas são : média aritmética, aritmética , moda e mediana. mediana. Outros promédios menos usados são as médias: geométrica, geométrica, harmônica, harmônica, quadrática, cúbica e biquadrática. biquadrática. As outras medidas de posição são as separatrizes,que separatrizes ,que englobam: a própria mediana, mediana, os decis, decis, os quartis e os percentis. percentis. .
7.2.
Média Aritmética:
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
onde xi são os valores da variável e n o número de valores.
7.2.1. Dados não agrupados Quando desejamos conhecer a média dos dados não agrupados em tabelas de frequências, determinamos a média aritmética simples. simples . Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 quilos, temos, para venda média diária na semana de:
7.2.2. Desvio em relação à média: É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja: 30
Bioestatística
a
Prof Claudia M. G. G. Franchi
Designando o desvio por , temos: d 1 = 10 - 14 = - 4 , ... d 2 2 = 14 - 14 = 0 , d 3 3 = 13 - 14 = - 1 , ... d 4 4 = 15 - 14 = 1 ,... d 5 5 = 16 - 14 = 2 ,... d 6 6 = 18 - 14 = 4 ...e. .. d 7 7 = 12 - 14 = - 2. .
7.2.3. Propriedades da média aritmética 1ª Propriedade: A soma algébrica dos desvios em relação à média é nula.
No exemplo anterior : d 1+d2+d3+d4+d5+d6+d7 = 0
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos: Y = 12+16+15+17+18+20+14 12+16+15+17+18+20+14 / 7 = 16 quilos ou Y = .+ 2 = 14 +2 = 16 quilos
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos: Y = 30+42+39+45+48+54+36 / 7 = 42 quilos ou
7.2.4. Dados agrupados sem intervalo de classe 31
Bioestatística
a
Prof Claudia M. G. G. Franchi
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família: Nº de meninos 0 1 2 3 4
frequência = fi 2 6 10 12 4 34
Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, ponderada , dada pela fórmula:
..xi. 0 1 2 3 4
..fi. 2 6 10 12 4
..xi.fi . 0 6 20 36 16 34
78
Onde temos:
7.3.
Exercícios – Capítulo 7
1. Complete o esquema para cálculo da média aritmética da distribuição: xi fi
1 2
2 4
3 6
4 8
5 3
6 1
Temos:
1 2 3 4
2 3 6 8
2
32
Bioestatística
a
Prof Claudia M. G. G. Franchi
5 6
3 1
7.3.1. Dados agrupados com intervalo de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio e determinamos a média aritmética ponderada por meio da fórmula:
Onde,
é o ponto médio da classe:
Consideremos a distribuição: I
Estaturas (cm)
fi
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
4 9 11 8 5 3 40
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outras para os produtos xi.fi. i
Estaturas (cm)
fi
xi
xi.fi
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
4 9 11 8 5 3
152 156 160 164 168 172
608 1404 1760 1312 840 516 33
Bioestatística
a
Prof Claudia M. G. G. Franchi
40
6440
Como, neste caso:
7.4.
Exercícios:
1. Complete o esquema para cálculo da média aritmética da distribuição de frequência: f requência: 1150
Custo (R$)
450
550 8
650
750
10
11
1
500
850 16
950 13
1050 5
1
Temos:
8
2
10
3
11
4
16
5
13
6
5
7
1.100
4.000
1
Logo,
34
Bioestatística
a
Prof Claudia M. G. G. Franchi
7.5.
MODA - Mo
É o valor que ocorre com maior frequência em uma série de valores. valores . Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados empregados dessa fábrica.
.
7.5.1. Dados não agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda . A série é amodal .
.Em outros casos, pode haver dois ou mais valores de concentração. concentração . Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas : 4 e 7 . A série é bimodal .
7.5.2. Dados agrupados sem intervalo de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Ex: Qual a temperatura mais comum medida no mês abaixo:
Temperaturas 0º C 1º C 2º C 3º C
Frequência 3 9 12 6 35
Bioestatística
a
Prof Claudia M. G. G. Franchi
Resposta: 2º C é a temperatura modal, pois é a de maior frequência .
7.5.3. Dados agrupados com intervalo de classe A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. modal . O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. bruta.
Onde: l* = limite inferior da classe modal e L* = limite superior da classe modal Assim, para a distribuição: I
Estaturas (cm)
fi
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
4 9 11 8 5 3 40
Temos que a classe modal modal é i = 3, l* = 158 e L* = 152. Como,
Vem:
7.5.4. Cálculo da Moda: Método mais elaborado pela fórmula de CZUBER:
36
Bioestatística
a
Prof Claudia M. G. G. Franchi
na qual: = limite inferior da classe modal..... = amplitude da classe modal = ; = ; sendo: a frequência simples da classe modal; a frequência simples da classe anterior à classe modal a freqüência simples da classe posterior à classe modal Assim, para a distribuição da tabela das estaturas, temos:
Onde,
7.6.
Exercícios:
1. Complete o esquema para o cálculo da moda da distribuição de frequência: f requência: Custo (R$) fi
450
550 8
650 10
750 11
850 16
950 13
1150
1050 5
1
A classe modal é da ordem... Logo:
Temos, pois:
37
Bioestatística
a
Prof Claudia M. G. G. Franchi
7.7.
MEDIANA
A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estando estes dispostos segundo uma uma ordem. Em outras palavras, a medida de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.
7.7.1. Dados não agrupados Dada uma série de valores como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9 de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18 Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, 10, já que, nessa série, há quatro elementos acima dele e quatro abaixo.
Md = 10 Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. médio. Assim, a série de valores: 1, 6, 7, 10, 12, 13, 18, 21 tem para a mediana a média aritmética entre 10 e 12. 12. Logo:
Md=11
38
Bioestatística
a
Prof Claudia M. G. G. Franchi
7.7.2. Dados agrupados Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não agrupados, implicando, porém a determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos é dada por:
7.7.3. Dados Agrupados sem intervalo de classe Nesse caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Tomemos a distribuição relativa à tabela abaixo correspondente à frequência acumulada:
Númerode meninos 0 1 2 3 4
2 6 10 12 4
2 8 18 30 34
35 Sendo:
A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo:
Md = 2 meninos
7.8.
Exercícios:
1. Complete o esquema para o cálculo da mediana das distribuições:
a) 2 3
4 7
6 12
8 8
10 4 39
Bioestatística
a
Prof Claudia M. G. G. Franchi
2 4 6 8 10
10 30
Como:
Temos que:
Md = ___________ b) 0 2
0 1 2 3 4 5
1 5
2 9
3 7
2
4 6
5 3
2
9
Como:
Temos que:
Md = ___________
40
Bioestatística
a
Prof Claudia M. G. G. Franchi
7.8.1. Dados Agrupados com intervalos de classe Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se encontra a mediana – classe mediana. mediana. Tal classe será evidentemente, aquela correspondente à frequência acumulada imediatamente superior a
.
Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Assim, considerando a distribuição da tabela a seguir: i
Estaturas (cm)
fi
Fi
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
4 9 11 8 5 3
4 13 24 32 37 40
40 A 3ª Classe é a classe mediana. Temos:
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências dessas classes estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar a partir do limite inferior a distancia:
e a mediana será dada por:
Logo:
Na prática, executamos os seguintes passos: 41
Bioestatística
a
Prof Claudia M. G. G. Franchi
1º) Determinamos as frequências acumuladas. 2º) Calculamos 3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à - e em seguida, empregamos a fórmula:
na qual: é o limite inferior da classe mediana é a frequência acumulada da classe anterior à classe mediana é a frequência simples da classe mediana é a amplitude do intervalo da classe mediana Tomando como exemplo, a distribuição anterior, temos:
Logo, a classe mediana é a de ordem 3. Então:
Substituindo esses valores na fórmula, obtemos:
isto é: Md = 160,5 cm
7.9.
Resolva:
1) Calcule a mediana da distribuição de frequência: Custo (R$)
450
550 8
fi
650 10
750 11
850 16
950 13
1150
1050 5
1
Temos: 42
Bioestatística
a
Prof Claudia M. G. G. Franchi
1 2 3 4 5 6 7
450 550 550 650 750 850 950 1050
650 750 850 950 1050 1150
8
8
10
18
11 16 13 5 1
Substituindo esses valores na fórmula, obtemos:
Logo,
7.10.
Exercícios – Capítulo 7
1. Considerando os conjuntos de dados: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 8, 6. b) 20, 9, 7, 2, 12, 12, 7, 20, 15, 7. c) 51,6; 48,7; 50,3; 49,5; 48,9; d) 15, 18, 20, 13, 10, 16, 14. Calcule: I. a média; II. a mediana; 43
Bioestatística
a
Prof Claudia M. G. G. Franchi
III. a moda; 2. Os salários-hora de cinco funcionários de uma companhia são: R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88. Determine: a) a média dos salários-hora; b) o salário-hora mediano; 3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) a nota média; b) a nota mediana; c) a nota modal 4. Considerando a distribuição abaixo: 3
4
5
6
7
8
4
8
11
10
8
3
Determine: a) a média; b) a mediana; c) a moda; 5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição: 2
3
4
5
6
7
8
9
10
1
3
6
10
13
8
5
3
1
Calcule: a) a nota média; b) a nota mediana; c) a nota modal. 6. Determine a média aritmética de: a) 50
60
80
90
8
5
4
3
b) 50
58
66
20
50
30
44
Bioestatística
a
Prof Claudia M. G. G. Franchi
7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual é a soma dos desvios?
8. Calcule a média aritmética, a mediana e a moda das distribuições de frequência abaixo: a)
5 8 14 10 7
44 b)
5 12 18 27 8
70 c)
18
45
Bioestatística
a
Prof Claudia M. G. G. Franchi
31 15 3 1 1 1
70 d)
10 9 8 6 3 3 1
40
46
Bioestatística
8.
a
Prof Claudia M. G. G. Franchi
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE 8.1.
Dispersão ou variabilidade
Vimos anteriormente que um conjuntos de valores pode ser convenientemente sintetizado por meio de procedimentos procedimentos matemáticos, em poucos valores representativos – média aritmética, mediana e moda. moda. Tais valores podem podem servir de comparação comparação para para dar a posição posição de qualquer qualquer elemento do conjunto. No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, é necessário ter-se uma ideia retrospectiva de como se apresentavam esses dados nas tabelas. Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a mesma, e igual a 24 oC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em uma delas poderá a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24 oC, A outra poderá ter uma variação pequena de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável. Vemos então, que a média – ainda que considerada como um número que tem a faculdade de representar uma série de valores – não pode por si mesma, destacar o grau de homogeneidade ou heterogeneidade heterogeneidade que existe entre os valores que compõe o conjunto. Consideremos os seguintes conjuntos de valores das variáveis x, y e z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160 Calculando a média aritmética de cada um desses conjuntos, obtemos:
Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Chamado de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer 47
Bioestatística
a
Prof Claudia M. G. G. Franchi
que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z. Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade. variabilidade. Dessas medidas, estudaremos a amplitude total, total, a variância, variância, o desvio padrão e o coeficiente de variação. variação.
8.2.
Amplitude Total
8.2.1. Dados não agrupados A Amplitude Total é a diferença entre o maior e o menor valor observado:
Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70 Temos:
Quando dizemos que a amplitude total dos valore é 30, 30, estamos afirmando alguma coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. Relativamente aos três conjuntos de valores mencionados no início desse capítulo, temos: ATx = 70 – 70 = 0 (dispersão nula) ATy = 72 – 68 = 4 ATz = 160 – 5 = 155
8.2.2. Dados agrupados sem intervalo de classe Nesse caso, ainda temos:
Exemplo: Considerando a tabela abaixo:
48
Bioestatística
a
Prof Claudia M. G. G. Franchi
0
1
2
3
4
2
6
12
7
3
Temos:
8.2.3. Dados agrupados com intervalo de classe Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe:
Exemplo: Considerando a distribuição abaixo: i
Estaturas (cm)
fi
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
4 9 11 8 5 3 40
Temos:
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade.
8.3.
Variância / Desvio padrão
Como vimos, a amplitude total é instável por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso. 49
Bioestatística
a
Prof Claudia M. G. G. Franchi
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados. A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. desvios . Assim, representando a variância por
, temos:
Ou, lembrando que
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente. Por isso mesmo, imaginou-se uma nova medida que têm utilidade e interpretação práticas, denominada desvio padrão, padrão, definida como a raiz quadrada da variância e representada por s:
Assim,
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, compreensão, ela não é uma boa fórmula fórmula para fins de computação, computação, pois em geral, a média aritmética aritmética , é um número fracionário, o que torna pouco prático o cálculo das quantidades
.
Podemos simplificar escrevendo a fórmula do seguinte modo:
50
Bioestatística
a
Prof Claudia M. G. G. Franchi
Não apenas este método é usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. Para o cálculo do desvio padrão, consideremos os seguintes casos:
8.3.1. Dados não agrupados Tomemos como exemplo, o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para
e outra para
. Assim:
40 45 48 52 54 62 70
1600 2025 2304 2704 2916 3844 4900 371
20.293
Como n = 7, temos:
Logo,
8.4.
Resolva:
1. Complete o esquema esquema para o cálculo do do desvio padrão, dados os valores da variável: 8, 10, 11, 15, 16, 18 Temos: 51
Bioestatística
a
Prof Claudia M. G. G. Franchi
8
64
n=
Logo,
Isto é,
8.4.1. Dados Agrupados sem intervalo de classe Como, neste caso, temos a presença de frequências, devemos levá-las em consideração, resultando a fórmula:
Consideremos como exemplo a distribuição na tabela abaixo: 0
1
2
3
4
2
6
12
7
3
52
Bioestatística
a
Prof Claudia M. G. G. Franchi
O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos
e outra para
, lembrando que para obter
basta multiplicar cada
pelo
seu respectivo , assim:
0 1 2 3 4
2 6 12 7 3
0 6 24 21 12
0 6 48 63 48
Logo:
8.5.
Exercícios:
1. Complete o esquema paras o cálculo do desvio padrão na distribuição: 1
2
3
4
5
6
2
5
8
6
3
1
Temos:
1
2
2
2
2 3 4 5 6 53
Bioestatística
a
Prof Claudia M. G. G. Franchi
Logo:
8.5.1. Dados Agrupados Agrupados com intervalo de classe Tomemos como exemplo, a distribuição abaixo. Começamos por abrir as colunas i
Estaturas (cm)
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
(ponto médio), para
4 9 11 8 5 3 40
152 156 160 164 168 172
e para
608 1.404 1.760 1.312 840 516 6.440
.
92.416 219.024 281.600 215.168 141.120 88.752 1.038.080
Logo:
8.6.
Exercícios:
1. Complete o esquema par o cálculo do desvio padrão da distribuição: 54
Bioestatística
a
Prof Claudia M. G. G. Franchi
Custo (R$)
30
50 2
70 8
90 12
130
110 10
5
Temos:
i
1 2 3 4 5
8.7.
40
2
Coeficiente de Variação
O desvio padrão por por si só não nos diz muita coisa. Assim, um desvio padrão de de duas unidades unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; 200; no entanto, se a média for igual a 20, ser dito. Além disso, o fato de o desvio padrão padrão ser expresso 20, o mesmo não pode ser na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada Coeficiente de Variação (CV):
55
Bioestatística
a
Prof Claudia M. G. G. Franchi
Exemplo: Tomemos os resultados das medidas das estaturas e dos presos de um grupo gr upo de indivíduos:
Estaturas
175 cm
5,0 cm
Pesos
68 Kg
2,0 Kg
Temos:
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estaturas.
8.8.
Exercícios – Capítulo 8
1. Calcule a amplitude total dos conjuntos de dados: a) 1, 3, 5, 9 b) 20, 14, 15, 19, 21, 22, 20 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2; d) -10, -6, 2, 3, 7, 9, 10 2. Calcule a amplitude total das distribuições: Xi
2
3
4
5
6
7
8
fi
1
3
5
8
5
4
2
Classes Fi
1,5
1,6 4
1,7 8
1,8 12
1,9 15
2,0 12
2,2
2,1 8
4
3. Calcule os desvios padrões dos conjuntos de dados do exercício 1. 4. Calcule os desvios padrões dos conjuntos de dados do exercício 2. 56
Bioestatística
a
Prof Claudia M. G. G. Franchi
5. Dada a distribuição de cem lançamentos de cinco moedas simultaneamente: Número de caras
0
11
12
13
14
5
Número de coroas
4
14
34
29
16
3
Calcule o desvio padrão: 6. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão respectivamente, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação: 7. Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi de 7,8 e o desvio padrão, padrão, 0,80. Em estatística, entretanto, o grau médio médio foi de 7,3 e o desvio padrão, padrão, 0,76. Em que disciplina foi maior a dispersão? 8. Medidas as estaturas de 1.017 indivíduos, obtivemos
. O peso
médio desses indivíduos é 52 Kg, com um desvio padrão de 2,3 Kg. Esses indivíduos apresentam apresentam maior variabilidade em estatura ou em peso? 9. Um grupo de 85 moças tem estatura estatura média de 160,6 cm, com um desvio desvio padrão igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? homogêneo? 10. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 11. Uma distribuição apresenta apresenta as seguintes seguintes estatísticas: s=1,5 e VC=2,9%. VC=2,9%. Determine a média da distribuição
57
Bioestatística
9.
a
Prof Claudia M. G. G. Franchi
BIBLIOGRAFIA
1. CRESPO, Antônio A., A., Estatística Fácil, 19ª ed. atual. – São Paulo, Ed. Saraiva, 2009. 2. DORIA FILHO, Ulysses, Introdução à Bioestatística: Bioestatística: para simples mortais, mortais, 14ª reimpressão – São Paulo, Ed. Elsevier, 1999. 3. GUEDES, Marilda Laurenti Laurenti da silva, José da Silva, Bioestatística, Bioestatística, Rio de Janeiro, CNPQ, 1988. 1988. 4. JAQUES, Sidia M. Callegari, Bioestatística Bioestatística – Princípios e Aplicações, São Paulo, Ed. Artmed 2003 – reimpressão: 2008. 5. VIEIRA, Sonia, Introdução à Bioestatística, Bioestatística, Rio de Janeiro, Ed. Campus, 1997 – 5ª reimpressão.
58