26 4. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA PARA DADOS CONTÍNUOS 4.1 - Simulando que um professor aplicou um exame a um grupo de 71 alunos gerando a
seguinte tabela: Nota
f
Nota
f
Nota
f
Nota
f
50 1 64 1 78 8 92 1 51 1 65 0 79 1 93 0 52 1 66 6 80 2 94 0 53 0 67 4 81 1 95 1 54 1 68 5 82 3 96 1 55 0 69 3 83 0 97 0 56 1 70 9 84 1 98 1 57 0 71 4 85 2 99 0 Σ 77 58 1 72 2 86 0 59 3 73 1 87 1 60 2 74 1 88 0 61 0 75 1 89 1 62 0 76 2 90 0 63 2 77 0 91 1 Uma tabela assim representada, nada nos fornece em termos de conclusão. Se montarmos uma tabela da seguinte maneira: Intervalo de classe
f
50├56 56├62 62├68
4 7 1 3 2 4 1 3 9 3 3 1
%
5,19 Porque esta tabela foi assim organizada? Como foram 9,09 escolhidos os intervalos em cada classe? Os dados poderiam 16,89 ser organizados de outra maneira? Para respondermos estas perguntas devemos proceder da 68├74 31,17 seguinte maneira: Passo 1 – observamos a amplitude total da amostra (A T): 74├80 16,89 É a diferença entre o maior e o menor valor observado no conjunto de dados, ou seja: 80├86 11,69 AT = XMAX – XMIN. 86├92 3,89 Para o exemplo acima temos: A T = 99 – 50 = 49 92├98 3,89 Passo 2 – Número de classes (K): é a quantidade de classes 98├104 1,30 de uma distribuição de frequências Σ 7 100 No exemplo acima, temos 10 classes. Para calcularmos este núme úmero de clas lasses, ses, são são suge ugerid ridas duas uas form formaas de 7 encontrarmos, de forma aproximada: a) K = → onde n é o número total de dados ou Σ f. No exemplo temos: K = 77 8,8 ≅ 9 n
≅
b) Fórmul Fórmulaa de Stur Sturge ges: s: K= 1 + 3,8.lo 3,8.logg n No exemplo temos: K = 1 + 3,8. log 77 = 8,2 Passo 3 – Amplitude de um intervalo de classe ( h) – é a diferença entre os limite superior e inferior de uma classe. Ou seja: h = Lsuperior - Linferior Mas, para conhecermos os limites destas classes devemos calcular a amplitude dos intervalos, ou seja, h =
AT K
; onde: AT é a amplitude total da amostra e K é o número de classes.
Portanto, no exemplos temos:
h
=
49 9
=
5,4
27 4.2. Distribuição de frequências
Sua finalidade é organizar os dados coletados em um rol. 4.2.1. Limite das classes
Formas de expressão dos limites das classes. a) 50 |─| 56 significa que devemos colocar dentro do intervalo todos os números entre 50 e 56, inclusive 50 e 56. b) 50 ├ 56 significa que compreende o intervalo entre os números 50 e 56, excluindo o 56. c) 50 ─| 56 significa que compreende o intervalo entre os números 50 e 56, excluindo o 50. Vemos neste exemplo que o Limite inferior da classe é 50 e o Limite superior é 56, portanto, a amplitude da classe ou do intervalo é: h = Lsuperior - Linferior = 56 – 50 = 6. 4.2.2. Pontos médios das classes (m)
É a média aritmética entre o limite superior e o limite inferior da classe, ou seja: m
=
Linf erior
+
Lsup erior
2
Ex. Tomando do exemplo a classe 50 ├ 56, temos o ponto médio da classe ou do intervalo: m
=
Linf erior
+
Lsup erior
2
=
50 + 56 2
=
53
A tabela completa para este estudo fica: Intervalo de classe
f
50├56
4
53
4
56├62
7
59
11
62├68
65
24
71
48
77
61
80├86
1 3 2 4 1 3 9
83
70
86├92
3
89
73
92├98
3
95
76
98├104
1
101
77
Σ
7 7
68├74 74├80
m
f AC
f R
%f R
FRAC
0,051 9 0,090 9 0,168 9 0,311 7 0,168 9 0,116 9 0,038 9 0,038 9 0,013 0
5,19
5,19
1,000
9,09 14,29 16,8 9 31,1 7 16,8 9 11,6 9 3,89
31,17 62,34 79,22 90,91 94,81
3,89 98,70 1,30
100
100
EXERCÍCIOS:
1. Os pesos dos 24 alunos de uma classe do 2 o grau de um colégio são: (em Kg) 51 67 51 60 56 52 63 54 49 53 48 53 55 59 56 58 59 46 58 50 58 55 62 57
28 2. No treino de atletismo, o tempo de percurso de 400 metros foi registrado para cada um dos 18 atletas, obtendo-se os seguintes dados (tempos em segundos): 61,2 57,3 63,1 69,6 58,9 65,7 71,2 67,4 60,5 72,3 69,8 62,7 68,3 69,4 75,0 73,1 68,2 66,3 62,3 63,5 Monte uma tabela de freqüência com 5 classes. 3.Uma pesquisa coletou os pesos de uma amostra de 36 crianças, obtendo-se os seguintes dados (peso em Kg): 36,2 41,4 32,3 35,7 32,7 44,1 46,3 40,0 39,5 34,7 45,2 44,9 31,6 43,9 45,8 49,1 45,7 37,8 39,4 46,9 35,7 38,1 48,2 49,2 40,3 35,4 31,0 43,7 44,8 47,0 43,0 47,1 39,1 35,7 38,3 34,9 Monte uma tabela de freqüência com 6 classes. 4.3. HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Para representar graficamente os dados quantitativos contínuos, usamos o histograma e o polígono de freqüência para melhor visualização dos dados. Considerando os casos de classes com mesma amplitude. 4.3.1. HISTOGRAMA
O histograma é usado para dados agrupados em classes. Semelhante ao gráfico de colunas, sendo que, a área de cada retângulo é proporcional à freqüência e os retângulos adjacentes se tocam. No exemplo da tabela a seguir: CLASSE 40,0 41,0 41,0 42,0 42,0 43,0 43,0 44,0 44,0 45,0
SOMA =
FREQUÊNCIA
1 2 5 7 1 16
Representando por meio de um histograma:
Tempo de percurso dos alunos
7 6 5 4 3 2 1
29 0
39
40 41 42 43 44 45 TEMPO DE PERCURSO (segundos)
46
Histograma do tempo de percurso no campo de atletismo 4.3.2. ROTEIRO PARA CONSTRUÇÃO DO HISTOGRAMA
1)Obtenha a tabela de freqüência à partir dos dados, agrupando-os em classes. 2)Desenhe dois eixos perpendiculares de bom tamanho. 3)Divida o eixo horizontal em partes conforme o número de classes (considere, sempre uma classe à esquerda da primeira classe e uma classe sempre à direita da última classe), marque os números correspondentes aos limites inferiores e superiores de cada classe. 4)Identifique a maior freqüência da classe na tabela de freqüência; escolha um número maior ou igual àquela freqüência e marque este número na extremidade do eixo vertical. Divida o eixo em partes adequadas as freqüências e marque os números correspondentes 5)Para cada classe, desenhe um retângulo com largura igual à largura da classe e com altura igual à freqüência da classe. 6)Hachure ou preencha os retângulos com padrões ou cores. 7)Coloque o título do gráfico, o nome da variável no eixo horizontal e a palavra “freqüência” no eixo vertical.
4.3.3. POLÍGONO DE FREQUÊNCIA
Unindo-se os pontos médios da parte superior (patamar) de cada retângulo do histograma com segmentos de reta, obtemos o chamado polígono de freqüência. Tempo de percurso dos alunos
7 6 5 4 3 2 1 0 39 OBS
40
41
42
43
Tempo de percurso (segundos)
44
45
46
1.O polígono inicia com freqüência nula para uma classe abaixo da primeira classe. 2.O polígono termina com freqüência nula para uma classe acima da última classe. 3.A área delimitada pelo polígono e o eixo horizontal é igual à área total dos retângulos, ou seja, essa área é proporcional ao número total de dados.
30 O polígono de freqüência é importante, pois podemos comparar duas ou mais distribuições de freqüência, traçando os polígonos em um mesmo gráfico. Como exemplo podemos comparar o tempo de percurso, de duas turmas A e B, no campo de atletismo com 16 alunos cada. Tempo de percurso dos alunos
7
Turma B
Turma A
6 5 4 3 2 1 0 39
40
41
42
43
44
Tempo de percurso (segundos)
45
46
Observa-se que o desempenho da turma B foi melhor que o da turma A, pois o pico da distribuição de freqüência da turma B se localiza mais a esquerda em relação ao pico da distribuição da turma, significando que houve mais alunos da turma B que fizeram o percurso com menor tempo. De maneira idêntica, podemos construir histogramas e polígonos de freqüência para a freqüência relativa e para a porcentagem. EXERCÍCIOS
1. Uma enfermeira mediu a temperatura do corpo de 38 pacientes de um hospital, obtendo os seguintes dados ( oC), já organizados em forma de tabela de freqüência: CLASSE 35,0 36,0 36,0 37,0 37,0 38,0 38,0 39,0 39,0 40,0 40,0 41,0
FREQUÊNCIA
8 16 5 2 6 1 SOMA 38 Construa um histograma e o polígono de freqüência para esses dados. 2. O tempo que cada cliente de um restaurante permanece na mesa foi medido. Para uma amostra de 50 clientes, os dados obtidos (tempo em minuto) e já organizados em tabela de freqüência,
31 Tempo de permanência (min) frequência 5 10 20 13 20 30 19 30 40 9 40 50 2 50 60 1 60 70 1 70 80
SOMA 50 Construa um histograma e um polígono de frequência para esses dados.
3. O peso de cada uma das 26 laranjas foi medido, em gramas, obtendo-se os seguintes dados: 148 175 155 143 180 177 125 126 182 170 200 160 173 171 180 128 198 160 130 145 162 173 168 140 138 150 Organize estes dados em uma tabela de freqüência com 6 classes e construa um histograma e um polígono de freqüência. 4.3.4. FREQUÊNCIA ACUMULADA E OGIVA FREQÜÊNCIA ACUMULADA:
Para dados contínuos agrupados em classes, a freqüência acumulada é o número de dados menores ou iguais a uma determinada classe, ou seja: Freqüência acumulada é o número de dados menores que o limite superior da classe considerada. Frequência relativa acumulada =
Frequência número
acumulada de dados
Porcentagem relativa acumulada = (freqüência relativa acumulada) x 100
A freqüência acumulada é calculada somando todas as freqüências da classe até a classe considerada (inclusive). No exemplo do percurso dos estudantes: CLASSE
40,0 41,0 41,0 42,0 42,0 43,0 43,0 44,0 44,0 45,0 SOMA =
FREQUÊNCIA Frequência acumulada 1 1 2 1+2=3 5 1+2+5=8 7 1+2+5+7=15
1 16
1+2+5+7+1=16
Freq. Relativa Acumulada
% acumulada
0,06 0,19 0,50 0,94 1,00
6 19 50 94 100
32 4.3.5. OGIVA é a representação gráfica da freqüência acumulada. É construída por segmentos
de reta interligando os pontos definidos pela freqüência acumulada e pelo limite superior de cada classe. Tempo de percurso dos alunos
16 14 12 10 8 6 4 2 0
39
40
41 42 43 44 45 tempo de percurso (segundos)
46
A ogiva é um gráfico bastante importante, pois permite determinar aproximadamente a frequência acumulada para qualquer valor. Portanto, a partir da ogiva, é possível estimar o número de dados que pertencem a qualquer intervalo de dados. Exemplo: para determinarmos o número aproximado de alunos que fizeram o percurso com tempo menor que 42,5 segundos, basta traçar uma reta vertical e perpendicular ao eixo horizontal (eixo de dados) do ponto 42,5 até interceptar a curva da ogiva, e a partir deste ponto, traçar uma reta horizontal até interceptar o eixo vertical (eixo de frequência acumulada), obtendo o valor aproximado da freqüência acumulada de 5 (número de alunos) para o valor 42,5 segundos (tempo de percurso). 16 14 12 10 8 6 4 2 0
39
40 41 42 43 44 Tempo de percurso (segundos)
45
46
Estima-se que 5 alunos fizeram o percurso com tempo menor que 42,5 segundos. E, para 43,5 segundos, estima-se que 11 alunos fizeram o percurso. A diferença entre as freqüências acumuladas 11 e 5, ( 11 – 5 = 6) corresponde à estimativa da freqüência da classe 42,5 43,5, ou seja, aproximadamente 6 alunos fizeram o percurso com tempo maior ou igual 42,5 segundos e menor que 43,5 segundos. Esses valores obtidos através da ogiva são meramente estimativas, uma vez que é considerado uma distribuição uniforme dos dados dentro de cada classe. A ogiva pode também ser construída utilizando freqüência relativa acumulada e porcentagem acumulada. A partir da ogiva de porcentagem acumulada, podemos obter estatísticas como a mediana, o quartil e o percentil.
33 EXERCÍCIOS
1. As alturas, em metros, dos 100 alunos de um Centro Universitário estão apresentadas na tabela de freqüência abaixo: CLASSE 1,55 1,60 1,60 1,65 1,65 1,70 1,70 1,75 1,75 1,80 1,80 1,85 1,85 1,90
FREQUENCIA
3 12 24 36 15 8 2 100
SOMA
a) Construa uma tabela de freqüência com freqüência acumulada, freqüência relativa acumulada e porcentagem acumulada. b) Construa uma ogiva de porcentagem acumulada. c) Determine a proporção de alunos que tem a altura maior ou igual a 1,68 e menor que 1,72. 2. Um trabalhador mediu o tempo para ir da casa ao local de serviço, durante 30 dias, obtendo os dados da tabela abaixo (tempo em minutos): Construa a tabela de freqüência com freqüência acumulada, freqüência relativa acumulada e porcentagem acumulada e construa uma ogiva de freqüência acumulada. CLASSE 30 40 40 50 50 60 60 70 70 80 80 90
SOMA
FREQUENCIA
3 16 7 2 1 1 30
3. O preço de um televisor em cores de 14 polegadas foi pesquisado em 20 lojas da cidade, obtendo os seguintes dados: $239,00 $229,00 $259,99 $219,95 $225,00 $227,90 $246,90 $230,00 $236,90 $222,95 $225,90 $215,00 $228,90 $232,00 $227,99 $216,95 $228,99 $229,90 $249,99 $239,90 Organize estes dados em uma tabela com freqüência com 5 classes e construa um histograma, um polígono de freqüência e uma ogiva
34 AGRUPAMENTOS DE DADOS DISCRETOS EM CLASSES
Nem sempre a organização de dados discretos em forma de tabela de freqüência, é adequada para obtermos informações sobre a distribuição de freqüência. Exemplificando com os dados abaixo, referentes ao número de passageiros transportados por um ônibus urbano, em cada viagem, no total de 50 viagens. 65 93 74 102 83 80 62 75 70 96 78 55 100 86 84 77 91 88 53 70 58 71 78 72 98 65 78 83 109 95 79 97 85 68 91 102 83 108 67 80 85 101 74 106 71 97 92 99 89 82 Se organizarmos estes dados em forma de tabela de freqüência, notaremos que o tamanho desta tabela será enorme (muitas linhas), pois cada dado se repete poucas vezes,não fornecendo informações suficientes sobre a distribuição de freqüência. 5 4 3 2 1 0
50
70 80 90 100 110 número de passageiros A solução para este problema é agrupar os dados em classes, da mesma forma como foi feito com os dados contínuos. Agrupando os dados, temos a tabela: Classe 50 60 60 70 70 80 80 90 90 100 100 110
Total
60
freqüência
3 5 13 12 10 7 50
A representação gráfica dos dados da tabela deve ser feita por meio de um histograma, como mostra abaixo. Como podemos observar pela tabela e pelo gráfico, agrupando os dados discretos em classes conseguimos obter informações sobre a distribuição de frequência. As definições dos números de classes, largura da classe, ponto inicial, frequência da classe, freqüência relativa da classe, porcentagem da classe, freqüência acumulada da classe e porcentagem acumulada da classe são iguais às definições utilizadas para os dados contínuos. Da mesma forma, as representações gráficas utilizadas para os dados contínuos, como o histograma, o polígono de freqüência e a ogiva, são utilizadas da mesma forma para os dados discretos agrupados em classes.
35 14 12 10 8 6 4 2 0 40 Classe
50
60
70
80
90
100
110
120
Tabela de freqüência em classes para o número de passageiros transportados por ônibus.
50 60 60 70 70 80 80 90 90 100 100 101 total
Freq.
Freq. Rel. Porc. (%)
Freq. Acum.
Freq. Rel. Porc. Acum. Acum. (%)
3 5 13 12 10 7 50
0,06 0,10 0,26 0,24 0,20 0,14 1,00
3 8 21 33 43 50
0,06 0,16 0,42 0,66 0,86 1,00
6 10 26 24 20 14 100
6 16 42 66 86 100
O polígono de freqüência e já ogiva podem ser vistos abaixo. POLÍGONO DE FREQUENCIA para o número de passageiros de ônibus
14 12 10 8 6 4 2 0 40
50
60 70 80 90 números de passageiros
100
110
120
Anotações de aula de Estatística – Curso Ciências Contábeis – Prof.Ms. Sérgio Luiz Cabrini
35 Ogiva para o número de passageiros de ônibus 50 45 40 35 30 25 20 15 10 5 0 40 50 60 70 80 90 números de passageiros EXERCÍCIOS
100
110
120
1. Em uma prova de vestibular com 160 testes de múltipla escolha, 100 candidatos fizeram os seguintes números de pontos: 92 12 17 110 23 107 27 32 96 39 40 98 42 45 70 65 46 48 99 49 80 50 92 52 106 53 100 55 57 61 120 92 61 118 62 63 105 64 66 67 67 68 69 70 40 71 45 72 73 74 75 75 79 52 82 82 111 83 84 84 84 86 62 87 31 88 90 90 90 91 93 43 62 38 20 94 95 96 96 97 97 71 35 103 58 109 51 110 49 83 105 102 86 124 66 132 138 143 60 89 Pede-se: Organizar os dados em uma tabela de freqüência com 8 classes. Incluir uma coluna para freqüência acumulada. Construir um histograma. Construir um polígono de freqüência. Construir uma ogiva. 2. Um sensor instalado em uma rodovia conta o número de automóveis que passam por minuto. Os dados obtidos em um período de 1 hora, foram: 21 25 40 13 17 34 30 25 20 28 43 23 21 32 38 22 20 16 45 52 26 38 30 35 46 49 11 19 78 53 13 65 54 45 48 16 23 27 14 63 53 41 17 24 33 62 36 33 50 27 10 29 58 44 32 23 39 46 32 31 Organize estes dados em uma tabela de freqüência com 7 classes, e construa um histograma, um polígono de freqüência e uma ogiva. Anotações de aula de Estatística – Curso Ciências Contábeis – Prof.Ms. Sérgio Luiz Cabrini
35 3. A tabela apresentada abaixo, mostra os rendimentos brutos semanais de homens e mulheres que trabalhavam em turno completo na Grã-Bretanha, em 1989. Média de ganhos brutos semanais (em dólares) Homens Mulheres $100,00 a $150,00 13 20 $150,00 a $ 200,00 18 11 $200,00 a $ 250,00 17 7 $250,00 a $ 300,00 13 4 $ 300,00 a $ 400 24 3 soma 85 45 Montando o polígono de freqüência, comente, comparando em um só gráfico, a performance dos homens em relação as mulheres.
Anotações de aula de Estatística – Curso Ciências Contábeis – Prof.Ms. Sérgio Luiz Cabrini