Métodos Estatísticos Aplicados à Economia I Aula 1 Karina Y. Yaginuma Departamento de Estatística Universidade Universidade Federal Federal Fluminense
23 de agosto de 2017
Estatística
Por que aprender estatística? A estatística nos ensina a fazer julgamentos inteligentes e a tomar decisões na presença de incertezas e variações.
O que é Estatística? A estatística é um conjunto de técnicas que permite, de forma sistemática, recolher e organizar
⇒
explorar e descrever
analizar e gerar informação sobre os dados oriundos de estudos ou experimentos, realizados em qualquer área de
conhecimento.
⇒
Estatística
Por que aprender estatística? A estatística nos ensina a fazer julgamentos inteligentes e a tomar decisões na presença de incertezas e variações.
O que é Estatística? A estatística é um conjunto de técnicas que permite, de forma sistemática, recolher e organizar
⇒
explorar e descrever
analizar e gerar informação sobre os dados oriundos de estudos ou experimentos, realizados em qualquer área de
conhecimento.
⇒
Etapas da Análise Estatística
Conceitos básicos - População
População: é o conjunto de indivíduos (ou objetos) que apresentam pelo menos uma característica em comum, cujo comportamento deseja-se analisar ou inferir.
Exemplo: todos os habitantes da cidade de Niterói todas as lâmpadas produzidas por uma fábrica em um certo intervalo de tempo
Conceitos básicos - População
Uma população pode ser finita ou infinita.
Exemplos: População finita: produção de parafusos produzidos por uma fábrica durante um dia. População infinita: os pontos de uma reta.
Conceitos básicos - Amostra
Raramente é possível coletar as informações (dados) de todos os elementos de uma população (censo), mesmo no caso em que temos uma população finita.
Tendo em vista a dificuldade para se observar todos os elementos da população, tomaremos alguns deles para formar um grupo a ser estudado, uma amostra.
Conceitos básicos - Amostra
Amostra: Subconjunto da população, em geral, com dimensão sensivelmente menor. Corresponde à uma parcela da população selecionada para a análise.
Conceitos básicos - Amostra
Exemplos: População: Todos os estudantes matriculados em horário integral em uma faculdade.
Amostra: 50 alunos matriculados em horário integral. População: Todos os eleitores registrados na cidade de Juiz de Fora.
Amostra: 500 eleitores registrados em Juiz de Fora contactados por telefone.
Conceitos básicos - Amostra
Suponha que desejamos conhecer a proporção de sedentários em adultos (20 anos ou mais) de uma cidade, e escolhemos para participar da pesquisa metade dos universitários dos cursos de Educação Física e Nutrição da cidade.
Será que a proporção de sedentários encontrado na amostra representa a proporção de sedentários na população?
Conceitos básicos - Amostra
Provavelmente a reposta é negativa: Primeiro, entre estudantes universitários, a faixa etária acima de 40 anos teria poucas pessoas inclídas no estudo. Segundo, pessoas com baixa escolaridade também não participam do estudo. Terceiro, alunos de cursos da área de saúde podem ter um conhecimento maior sobre os malefícios do sedentários do que a população em geral.
Conceitos básicos - Amostra
Essa discussão inicial aponta que a forma de seleção dos indivíduos de uma determinada população é um processo crucial no planejamento de um pesquisa.
Se uma amostra é representativa para uma população, conclusões importantes sobre a população podem ser inferidas de sua análise.
Conceitos básicos - Amostra
Precisamos que a amostra da população seja representativa. A representividade diz respeito a forma como os indivíduos da população são selecionados para o estudo. Houve alguma tendência no sorteio? O mesmo foi completamente aleatório? Todas os indivíduos da população tiveram mesma chance de serem incluídos no estudo? Existem várias metodologias de obtenção de uma amostra. Tais metodologias buscam assegurar a representividade da amostra.
Técnicas de Amostragem
Amostragem aleatória simples: qualquer elemento da população possui a mesma probabilidade de ser escolhido.
Exemplo: Suponha que estamos interessados em uma amostra de tamanho n = 30 de uma população de 600 alunos de uma escola. Podemos numerar os alunos de 1 a 600, e escolhemos ao acaso 30 números entre 1 e 600, que correspondem aos alunos da amostra.
Técnicas de Amostragem
Amostragem sistemática: os elementos da amostra são escolhidos a partir de uma regra estabelecida.
Exemplo: Para selecionarmos os 30 alunos, depois de numerados todos os alunos da escola, podemos escolher um aluno de 20 em 20 a partir do primeiro aluno selecionado, que é escolhido ao acaso.
Técnicas de Amostragem
Amostragem estratificada: utilizada quando a população está dividida em estratos ou grupos diferenciados.
Exemplo: Suponha que a escola seja de ensino médio, podemos considerar que cada ano de escolaridade é um estrato, escolhemos um determinado número de alunos, usando alguns dos métodos anteriores, em cada ano. O número de alunos selecionados em cada estrato deve ser proporcional ao tamanho do estrato.
Amostragem
Quando ao colher uma amostra se dá preferência a determinados elementos da população, dizemos que a amostra é viesada ou tendenciosa.
Como por exemplo as amostras intencionais, onde os elementos são selecionados com auxílio de especialistas e amostras de voluntários, como ocorrem em ·
pesquisas feitas pela internet, nas quais os sujeitos podem decidir se respondem ou não.
·
pesquisas feitas pelo correio.
Exercício 1
Digamos que um professor quer saber a média de altura dos alunos de terceira série do ensino médio da escola. Para tal, ele fez uma listagem de todos os alunos (total de alunos de terceira série do ensino médio: 160) e sorteia aleatoriamente 80 para serem medidos. Ele obtém uma média de altura de 1,72 m.
Defina a população e a amostra dessa pesquisa
A amostra, em questão, é representativa? Explique.
Exercício 2
As formigas formam níveis avançados de sociedade. Estão incluídas em uma única família, Formicidae, com 12.585 espécies descritas, distribuídas por todas as regiões do planeta, exceto nas regiões polares. Esses insetos formam aproximadamente 17% da biomassa terrestre, portanto,podem ser considerados bem-sucedidos evolutivamente. Suponha duas amostras de formigas, colhidas de um mesmo formigueiro, sendo uma amostra com 100 exemplares e outra amostra com 200 exemplares. A amostra maior é mais representativa da população? Justifique sua resposta.
Conceitos básicos - Variáveis
Normalmente, estamos interessados apenas em certas características dos elementos de uma população.
Variável: é uma característica qualquer de interesse que associamos à população.
Exemplo: População: Todos os funcionários de uma escola. Variáveis: sexo, estado civil, escolaridade, idade, altura, peso, número de filhos na família, hábito de fumar, etc...
Natureza das Variáveis
As variáveis possuem naturezas diferentes em relação aos possíveis valores que podem assumir:
Exemplo: Variável escolaridade é uma qualidade ou atributo (valor não numérico).
Variável altura é um valor numérico.
Existe dos tipos de variáveis Qualitativa e Quantitativa.
Variáveis Qualitativas
Variáveis Qualitativas: descrevem características de elementos de uma população e podem ser medidas em escala nominal ou ordinal. Variáveis nominais: não existe ordenação entre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio.
Variáveis ordinais: existe uma ordenação natural entre as categorias. Exemplos: escolaridade (1
o
o
,
2
,
3
o
graus), estágio da doença
(inicial, intermediário, terminal), mês (janeiro, fevereiro,..., dezembro).
Variáveis Quantitativas Variáveis Quantitativas: medem características de elementos de uma população e são expressar por valores numéricos. As variáveis quantitativas, por sua vez, podem ser discretas ou contínuas. Variáveis discreta: assumem valores pertencentes a um conjunto enumerável; em geral, resultam de processos de contagem. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia.
Variáveis contínuas: assumem valores pertencentes a um intervalo de números reais; em geral resultam de processos de medição. Exemplos: peso (balança), altura (régua), tempo (conômetro).
Exercício 3
Classifique as variáveis abaixo:
1
Tipo sanguíneo (tipos: O, A, B, AB)
2
Número de leitos disponíveis num hospital
3
tempo da sua casa até a universidade
4
Nota na disciplina de estatística
Comentários A natureza da variável deve ser levada em consideração para interpretar os resultados.
Comentários A natureza da variável deve ser levada em consideração para interpretar os resultados. Se o indivíduo A tem 40 anos e o indivíduo B tem 20 anos, é
correto afirmar que A tem o dobro da idade de B . Agora vamos considerar o grau de especialização, podemos caracterizá-los da seguinte maneira: - não especializado ⇒ 1; - semi especializado ⇒ 2; - especializado ⇒ 3; - muito especializado ⇒ 4;
Não é correto dizer que um trabalhador muito especializado tem o dobro da especialização de um semi especializado.
Exercício 4
Um pesquisador entrevista 200 pessoas e lhes pergunta sobre o partido político de sua preferência (Democrata, Republicano, Independente ou Outro).
Qual a variável de interesse desse estudo? Classifique-a.
Exercício 4 - Continuação
Ele codifica as respostas como 0 (para Democrata), 1 (para Republicano), 2 (para Independente) ou 3 (para quaisquer outras respostas). Ele calcula, então, a média dos números e obtém 0.95.
Como se pode interpretar esse valor?
Discussão
Realizar tal operação aritmética não faz sentido.
No entanto, uma operação aritmética que pode ser interpretada é a proporção de indivíduos classificados em cada partido.
Conceitos básicos - Dados
Os dados resultam da observação de uma variável ou de duas ou mais variáveis simultaneamente de uma amostra. Os dados são classificados em: dados univariados, bivariados e multivariados.
Dados Univariados
Um conjunto de dados univariados consiste em observações
sobre uma variável.
Exemplo: Uma amostra de 5 lâmpadas foi coletada, e a variável tempo de vida (em anos) de cada lâmpada foi observado obtendo o seguinte conjunto de dados univariado. 5.6 5.1 6.2 6.0 5.8 5.5.
Dados Bivariados
Os dados são bivariados quando as observações são feitas em cada uma de duas variáveis.
Exemplo: Medimos a altura e peso de cada jogador de basquete de um time. O conjunto dos pares (peso, altura) é uma conjunto de dados bivariados.