http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Resumo de Bioestatística Introdução até Medidas de Tendência Central Fonte: http://www.fernandokb.pro.br/
Introdução à Bioestatística A ciência não é um conhecimento definitivo sobre a realidade, mas um conhecimento hipotético, que pode ser questionado e corrigido. •
•
Ensinar ciência não significa apenas descrever fatos, enunciar leis e apresentar novas descobertas. Mas ensinar o método científico, que a maneira crítica de buscar o conhecimento.
O método científico cient ífico exige, porém, organizar dados, analisar e tomar decisões em condições de incertezas. •
•
Dá suporte técnico a esse trabalho a Estatística, que pode ser vista, pelo pesquisador, como uma ferramenta do método científico. Bioestatística é a Estatística aplicada à certas ciências médica e biológica.
Costuma-se dividir a Estatística em duas partes: •
•
Descritiva: encarrega-se do levantamento, organização, classificação e descrição
dos dados em tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros representativo desses dados. Analítica: trabalha com os dados de forma a estabelecer hipóteses em função desses dados, procede a sua comprovação e, posteriormente, elabora conclusões científicas.
População e Amostra Uma População é o conjunto de elementos que têm, em comum, determinada característica. Todo subconjunto, não vazio e com menor número de elementos do que a população, constitui uma Amostra Amostra. Amostra Quando são coletadas informações de toda população, diz-se que foi feito um Recenseamento. Recenseamento Recenseamento •
Censo é o conjunto de dados obtidos através de recenseamento.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Quando são coletadas informações de apenas parte da população, diz-se que foi feita uma Amostragem Amostragem. •
Amostra é tanto a parte retirada da população para estudo como, também, o conjunto de dados obtidos nessa parte da população.
Os pesquisadores trabalham sempre com amostras. •
Um estudo cuidadoso de uma amostra tem mais valor científico do que o estudo sumário de toda população. Exemplo: Para estudar o efeito do flúor sobre prevenção de cáries em crianças, é melhor submeter uma amostra de crianças a exames periódicos minuciosos, do que examinar rapidamente todas as crianças antes, e determinado tempo após o uso do flúor. o
Variáveis Qualitativas (Categóricas ou Atributos– Variáveis que fornecem dados de natureza não-numérica. Tem-se dois tipos de variáveis qualitativas: •
Variáveis Qualitativas de Nível Nominal: nesse tipo de variável diferencia-se uma
categoria da outra somente por meio da denominação da categoria; Exemplo: SEXO (Feminino; Masculino). Podem ser divididas em binomiais, binárias ou dicotômicas, quando compostas por duas categorias e polinomiais ou politômicas, quando apresentam mais de duas categorias possíveis. o o
•
Variáveis Qualitativas de Nível Ordinal: nesse tipo de variável, não só é possível
identificar diferentes categorias, mas também reconhecer graus de intensidade entre elas, o que possibilita uma ordenação das várias categorias; Exemplo: COMPORTAMENTO DE UM ANIMAL (Submisso; Neutro; Agressivo). o
Observação: Os dados em uma variável qualitativa podem ser representados numericamente (Feminino = 1; Masculino = 2–. Os números aqui são apenas símbolos sem valor quantitativo.
Variáveis Quantitativas
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Variáveis cujos dados são valores numéricos que expressam quantidade. Tem-se dois tipos de variáveis quantitativas: •
Variáveis Quantitativas Discretas: são aquelas em que os dados somente podem
apresentar valores com números inteiros; Exemplo: IDADE (15; 33; 35; 40); o
•
Variáveis Quantitativas Contínuas: são aquelas em que os dados somente podem
apresentar valores com números fracionários; Exemplo: PESO (60,4; 56,4; 80,0). o
Apresentação dos dados em Tabelas Os dados devem ser apresentados em tabelas construídas de acordo com as normas técnicas ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística (Fundação IBGE–.
Figura 1 - Componentes das Tabelas (Distribuição de Freqüências–
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 2 - Freqüência Relativa e Total das Freqüências
Construção de Tabela para Variáveis Qualitativas Para construção da distribuição de freqüência para variáveis qualitativas, vamos partir do seguinte exemplo: •
Exemplo: Foi feita uma pesquisa para saber a preferência de cor de um determinado
•
grupo. Foram obtidos os seguintes dados desse grupo: Sexo; Cor preferida. Os dados brutos estão na tabela abaixo: o o
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Tabela 1 - Dados Brutos (SEXO e COR PREFERIDA– •
•
Com base nesses dados, quer saber quantas pessoas do sexo masculino e feminino o grupo é formado e a cor de preferência do mesmo grupo. Para isso serão feitas duas distribuições de freqüências (tabelas), uma para a variável SEXO e outra para variável COR PREFERIDA. O processo de construção da distribuição de freqüência (tabela) para variáveis qualitativas é feito através da identificação e contagem dos valores apresentados em cada variável. VARIÁVEL VARIÁVEL SEXO
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Tabela 2 - Variável Sexo •
Identificação dos Valores e Tamanho da Amostra: Valores: FEMININO e MASCULINO Tamanho da Amostra: 20 pessoas Tem-se a seguinte distribuição de freqüência para variável SEXO o o
•
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Tabela 3 - Distribuição de Freqüência para Variável Sexo •
O cálculo da Frequência Relativa é realizada da seguinte maneira:
Figura 18 - Cálculo das Freqüências Relativas para Variável Sexo •
Pode-se dizer que 60% (12 pessoas) das pessoas desse grupo são do sexo feminino e 40% (8 pessoas) das pessoas são do sexo masculino. VARIÁVEL COR PREFERIDA
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Tabela 4 - Variável Cor Preferida •
Identificando Valores e Tamanho da Amostra: Valores: AZUL, ROSA, PRETO e AMARELO o o
•
Tamanho da Amostra: 20 pessoas
Tem-se a seguinte distribuição de freqüência para variável COR PREFERIDA:
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Tabela 5 - Distribuição de Freqüência para Variável Cor Preferida •
Novamente, o cálculo da Freqüência Relativa é feito da seguinte maneira:
Figura 19 - Cálculo das Frequências Relativas para Variável Cor Preferida •
Afirma-se que nesse grupo a cor de maior preferência é a cor Rosa com 40% da indicação do grupo e a cor de menor preferência é a cor Amarela com 5% da indicação do mesmo grupo.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Construção de Tabela para Variáveis Quantitativas •
Para construção da distribuição de freqüência para variáveis quantitativas, vamos partir do seguinte exemplo: Exemplo: Suponha que, ao estudar a quantidade de albumina no plasma de pessoas com determinada doença, um pesquisador obtenha, em 25 indivíduos, os seguintes valores (em g/100mL):
Figura 20 - Valores de albumina (g/100mL– •
Dos dados obtidos, o pesquisador pode concluir inicialmente que: Os valores de albumina nos pacientes variam de indivíduo para indivíduo; Alguns indivíduos apresentam valores iguais; Os valores oscilam entre 4,5 e 5,5. Organizando os dados em tabelas (distribuição de freqüências), nas quais se indicam os valores obtidos e a freqüência com que ocorrem, estas e outras conclusões podem ser obtidas mais rapidamente e com menor probabilidade erro. o o o
•
ETAPAS PARA CONSTRUÇÃO DA DISTRIBUIÇÃO DE FREQUÊNCIA AGRUPADOS POR INTEVALOS DE CLASSE passo: Colocar os valores obtidos em ROL. 1º passo •
ROL: Ordenação crescente ou decrescente dos valores numéricos.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 21 - Valores em ROL Passo: Fazer a subtração do maior valor pelo menor valor do ROL (intervalo– 2º Passo
Figura 22 - Cálculo do Intervalo 3º Passo Passo: Determinar o Número de Classes
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 23 - Cálculo do Número de Classes •
Observação: Caso o número de classes resulte em um número fracionário, utilizar o
próximo número maior inteiro. Exemplo: Número de Classes = 5,2 => Número de Classes = 6 o
Passo: Determinar a Amplitude da classe 4º Passo
Figura 24 Cálculo da Amplitude da Classe Passo: Construir a Distribuição de Freqüência por Intervalo de Classe 5º Passo •
Neste exemplo serão construídos 6 classes (3º passo). Cada classe é representada com valor do limite inferior seguido pelo símbolo |—, ou -–|, ou |—|, e em seguida pelo valor do limite superior (limite inferior + amplitude). |— : indica que o valor do limite inferior está incluído no intervalo da classe, mas o valor do limite superior, não; —| : indica que o valor do limite superior está incluído no intervalo de classe, mas o valor do limite inferior, não. |—| : indica que ambos os limites estão incluídos no intervalo. Após a construção das classes é feita a contagem (freqüência) dos valores (ROL) que pertencem a cada intervalo de classe obtida. E finalmente, calcular a Freqüência Relativa para cada freqüência. o
•
•
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 25 - Distribuição de Freqüência •
•
•
•
•
A classe 4,5 |— 4,7 é formada pelos valores 4,5 a valores menores que 4,7. Observando o ROL tem-se somente o valor 4,5, logo a freqüência é 1. A classe 4,7 |— 4,9 é formada pelos valores 4,7 a valores menores que 4,9. Observando o ROL tem-se os valores 4,7, 4,7 e 4,8, logo a freqüência é 3. A classe 4,9 |— 5,1 é formada pelos valores 4,9 a valores menores que 5,1. Observando o ROL tem-se os valores 4,9, 4,9, 4,9, 5,0, 5,0, 5,0, 5,0 e 5,0, logo a freqüência é 8. A classe 5,1 |— 5,3 é formada pelos valores 5,1 a valores menores que 5,3. Observando o ROL tem-se os valores 5,1, 5,1, 5,1, 5,1, 5,1, 5,2 e 5,2, logo a freqüência é 7. A classe 5,3 |—| 5,5 é formada pelos valores 5,3 a valores menores ou iguais a 5,5. Observando o ROL tem-se os valores 5,3, 5,3, 5,3, 5,4, 5,4 e 5,5, logo a freqüência é 6. Como o valor do limite superior da classe é o último valor do apresentado no ROL, utiliza-se o símbolo |—|. Caso o valor do limite superior da classe for maior que o último valor apresentado no ROL, utiliza-se o símbolo |—. o
Arredondamento Estatístico Para fazer o arredondamento estatístico, utilizam-se as seguintes regras:
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
•
Exemplo 01: Fazer o arredondamento estatístico do número abaixo para casa
centesimal (2 dígitos após a vírgula).
Figura 3 - Número 0,390625 1. Usar os 4 dígitos após a vírgula: 0,3906
Figura 4 - Analisando os dígitos 0 e 6 2. Regra 1: Se Y for igual a 6, 7, 8 ou 9, aumentar uma unidade em X e eliminar Y
Figura 5 - Eliminando o dígito 6 e analisando os dígitos 9 e 1 3. Regra 2: Se Y for igual a 0, 1, 2, 3 ou 4, manter X e eliminar Y
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 6 - Eliminando o dígito 1 e obtendo o número arredondado 0,39 •
•
Concluindo, o número 0,390625 arredondado estatisticamente para casa centesimal resulta em 0,39.
Exemplo 02: Fazer o arredondamento estatístico do número abaixo para casa
centesimal (2 dígitos após a vírgula).
Figura 7 - Número 12,305236 1. Usar os 4 dígitos após a vírgula: 12,3052
Figura 8 - Analisando os dígitos 5 e 2 2. Aplica-se a Regra 2 visto no Exemplo 01 eliminando o dígito 2 e mantendo o dígito 5.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 9 - Eliminando o dígito 2 e analisando os dígitos 0 e 5 3. Regra 3: Se Y for igual a 5: • •
Manter X se X for um número Par e eliminar Y; Aumentar uma unidade em X se X for Ímpar e eliminar Y.
Figura 10 - Eliminando o dígito 5 e obtendo o número arredondado 12,30 •
•
Concluindo, o número 12,305236 arredondado estatisticamente para casa centesimal resulta em 12,30.
Exemplo 03: Fazer o arredondamento estatístico do número abaixo para
casa decimal (1 dígito após a vírgula).
Figura 11 - Número 7,25545966
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
1. Regra 4: Se o número a ser desprezado for igual a 5, e após ele existir algum número diferente de 0, aumentar em uma unidade o número anterior.
Figura 12 - Aplicação da Regra 4 2. Após a aplicação da Regra 4, será feito o arredondamento estatístico sobre o número 7,2555.
Figura 13 - Analisando o último dígito 5 3. Aplica-se a Regra 3 visto no Exemplo 02 eliminando o último digito 5 e aumentando uma unidade o penúltimo dígito.
Figura 14 - Analisando os dígitos 5 e 6 4. Aplica-se a Regra 1 visto no Exemplo 01 eliminando o dígito 6 e aumentando uma unidade o dígito 5.
Figura 15 - Analisando os dígitos 2 e 6
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
5. Novamente aplica-se a Regra 1 visto no Exemplo 01 eliminando o dígito 6 e aumentando uma unidade o dígito 2.
Figura 16 - Número arredondado 7,3 •
Concluindo, o número 7,25545966 arredondado estatisticamente para casa decimal resulta em 7,3. RESUMO DAS REGRAS DO ARREDONDAMENTO ESTATÍSTICO
Figura 17 - Formato Geral do Número a ser Arredondado Regra 11: Se Y for igual a 6, 7, 8 ou 9, aumentar uma unidade em X e eliminar Y eliminar Y Regra 22:: Se Y for igual a 0, 1, 2, 3 ou 4 manter X manter X e eliminar Y eliminar Y Regra 33: Se Y for igual a 5: • •
Manter X se X for um número Par e eliminar Y; Aumentar uma unidade em X se X for Ímpar e eliminar Y.
Regra 4: 4 Se o número a ser desprezado D for igual a 5, e após ele existir algum número diferente de 0, aumentar em uma unidade o número anterior.
Medidas de Tendência Central •
•
•
Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema em estudo. Mas é conveniente apresentar, além dos dados, medidas que mostrem a informação de maneira resumida. As Medidas de Tendência Central dão o valor do ponto em torno do qual os dados se distribuem: Média Aritmética; Mediana; Moda. o o o
Média Aritmética
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS •
•
Para obter a média aritmética basta somar os valores de todos os dados e dividir o total pelo número deles. Exemplo: Calcular a média aritmética do peso, em gramas, de ratos machos da raça Wistar com 30 dias de idade.
Figura 26 - Dados obtidos sobre o peso de ratos da raça Wistar.
Figura 27 - Cálculo da Média Aritmética dos pesos dos ratos da raça Wistar. •
A média aritmética dá a abscissa do centro de gravidade do conjunto de dados.
Figura 28 - Representação da média aritmética de 67 gramas. •
Fórmula Geral da Média Aritmética:
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 29 - Fórmula Geral da Média Aritmética. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS AG RUPADOS POR INTERVALO DE CLASSE •
Exemplo: Calcular a média aritmética da quantidade de albumina no plasma de 25
pessoas com determinada doença.
Figura 30 - Distribuição de Freqüência da Taxa da Albumina em 25 pacientes. •
1º Passo: Calcular o ponto médio de cada classe:
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 31 - Cálculo do ponto médio de cada classe.
Figura 32 - Distribuição de Freqüência com os pontos médios. •
2º Passo: Multiplicar a Freqüência pelo Ponto Médio de cada classe e somar todos
os resultados dessa multiplicação:
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 33 - Cálculo da Multiplicação da Freqüência pelo Ponto Médio. •
3º Passo: Calcular a Média Aritmética:
Figura 34 - Cálculo da Média Aritmética da Taxa de Albumina de 25 pacientes.
Mediana •
•
A mediana é um valor, em uma série ordenada de dados, que divide a série em dois subgrupos de igual tamanho. Uma característica importante da mediana é a de que ela não é afetada pelos valores extremos da série. MEDIANA PARA DADOS NÃO AGRUPADOS
•
Exemplo: Calcular a mediana do peso, em gramas, de ratos machos da raça Wistar
com 30 dias de idade.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 35 - Dados brutos sobre o peso de ratos da raça Wistar •
1º Passo: Ordenar os valores (ROL):
Figura 36 - ROL dos pesos dos ratos da raça Wistar •
2º Passo: Determinar a posição do elemento mediano e calcular a mediana: o
Fórmula Geral da Mediana:
Figura 37 - Fórmula Geral da Mediana •
No exemplo do cálculo da mediana dos pesos dos ratos Wistar, temos:
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 38 - Cálculo da mediana dos pesos dos ratos Wistar
Figura 39 - Posição do elemento mediano. MEDIANA PARA DADOS AGRUPADOS POR INTERVALO DE CLASSE •
•
Exemplo: Calcular a mediana da quantidade de albumina no plasma de 25 pessoas
com determinada doença. 1º Passo: Calcular a Freqüência Acumulada (Fac): Cria-se uma coluna com o título Fac e copia-se a primeira freqüência para esta nova coluna. Para as demais classes, soma-se a freqüência com a freqüência acumulada anterior. A última freqüência acumulada deve ser igual ao tamanho da amostra. o
o
o
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 40 - Cálculo da freqüência acumulada •
2º Passo: Determinar a classe que possui a mediana: o
Divide-se o tamanho da amostra por 2.
Figura 41 - Cálculo da posição do elemento mediano •
Observa-se na coluna Fac o valor igual ou maior mais próximo do valor Emd.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 42 - Identificação da classe mediana •
•
A classe 5,1 |— 5,3 é a classe mediana, pois a sua freqüência acumulada (19) informa que nessa classe possui os elementos acima da 12º posição e abaixo ou igual da 19º posição. 3º Passo: Calcular a mediana: Fórmula Geral da Mediana o
Figura 43 - Fórmula Geral da Mediana para Dados Agrupados por Intervalo de Classe
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 44 - Cálculo da mediana da quantidade da taxa de albumina em 25 pacientes
Moda •
A moda é o valor que ocorre com maior freqüência em um conjunto de dados. MODA PARA DADOS NÃO AGRUPADOS
•
Exemplo: Calcular a moda do peso, em gramas, de ratos machos da raça Wistar
com 30 dias de idade.
Figura 45 - Dados brutos sobre os pesos dos ratos da raça Wistar •
1º Passo: Ordenar os valores (ROL):
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 46 - Dados em ROL •
2º Passo: Identificar o valor que ocorre mais vezes:
Figura 47 - A moda da variável peso •
•
A moda dos pesos dos ratos da raça Wistar é 70 gramas (aparece duas vezes na amostra) e é classificada como UNIMODAL (variável que apresenta uma moda). Outros Exemplos:
Figura 48 - Exemplo com duas modas
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 49 - Exemplo com três modas
Figura 50 - Exemplo sem moda MODA PARA DADOS AGRUPADOS POR INTERVALO DE CLASSE •
Exemplo: Calcular a moda da quantidade de albumina no plasma de 25 pessoas
com determinada doença.
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 51 - Distribuição de Freqüência da quantidade de albumina no plasma •
1º Passo: Identificar a classe que possui a maior freqüência: No exemplo (figura 51) a classe 4,9 |— 5,1 é a classe modal, pois apresenta o
•
a maior freqüência (8) na distribuição de freqüência. 2º Passo: Calcular a moda (Fórmula de King):
Figura 52 - Fórmula de King
http://www.fernandokb.pro.br/ Autor das informações: Fernando Kauffmann Barbosa
Figura 53 - Aplicação da Fórmula de King