FACULDADE DE CIÊNCIAS HUMANAS E SOCIAIS DE IGARASSU - FACIG Mantida pela ASSOCIAÇÃO IGARASUENSE DE EDUCAÇÃO E CULTURA Autorizada pela Portaria nº 584 de 26.06.1998 - DOU de 29.06.1998
Cursos: Bacharelados em Administração, Ciências Contábeis e Direito.
APOSTILA DE ME ME TODOS TODOS QUANTIT QUANTI TATIVOS
Prof. Adalberto de Oliveira Freitas
- 2013 – 1
SUMÁRIO 1. PROBABILIDADE 1.1. EVENTOS ALEATÓRIOS 1.2. CÁLCULO DE PROBALIDADES 1.3. PROBABILIDADE DOS EVENTOS 1.3.1 Teorema da soma - eventos mutuamente excludentes 1.3.2 Teorema da soma - eventos não mutuamente excludentes 1.3.3 Teorema da multiplicação - eventos independentes 1.3.4 Teorema da multiplicação - eventos dependentes 1.3.5 Teorema de Bayes 1.3.6 Síntese 1.4 0 AMOSTRAGEM 1.4.1 Amostragem sem reposição 1.4.2 Amostragem com reposição 2.0 ANÁLISES COMBINATÓRIAS 2.1 Arranjos simples 2.2 Combinação simples 2.3 Permutação simples 3.0 VARIÁVEIS ALEATÓRIAS 3.1 Variável aleatória discreta 3.2 Principais Distribuições de Probabilidades 3.2.1 Distribuição de Bernoulli 3.2.2 Distribuição Binomial 3.2.3 Distribuição de Poisson 4.0 NÚMEROS ÍNDICES 4.1Fórmula 4.2 Preço relativo 4.3 Quantidade relativa 4.4 Valor relativo. 5.0 ÍNDICES AGREGATIVOS 5.1 Índices Agregativos Simples 5.1.1 Ídice de Dutot 5.2 ÍDICES AGREGATIVOS PONDERADOS 5.2.1 Índice Aritmético de Sauerbeck 5.2.2 Índice Geométrico de Sauerbeck 5.2.3 Índice Harmônico de Sauerbeck 5.3 Índices agregativos ponderados (Laspeyere) 6.0 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 6.1 COEFICIENTE DE CORRELAÇÃO LINEAR 6.1.1 Métodos dos Mínimos Quadrados 6.2 COEFICIENTE DE EXPLICAÇÃO 6.3 FUNÇÕES LINEARIZÁVEIS BIBLIOGRAFIA
03 03 04 06 06 06 07 08 09 11 12 12 12 13 13 14 14 15 15 15 15 16 18 19 19 19 19 19 20 20 20 21 22 22 22 25 31 32 35 31 36 39 2
1.0
PROBABILIDADE
De modo geral, os autores concordam que as aplicações iniciais da matemática da probabilidade referiam-se quase todas aos jogos de azar. Assim é que: O primeiro trabalho escrito de que se tem notícia e que envolve a noção de probabilidade data de 1477. Trata-se de um comentário feito á Divina Comédia (Dante), onde há referência às probabilidades associadas aos vários resultados decorrentes do jogo de 3 dados (COSTA, p. 90).
Pode-se recorrer ao cálculo da probabilidade sempre que, independente de qual seja a aplicação em particular, exista um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um evento futuro. A probabilidade faz parte da Estatística Indutiva, ou seja, lastreia-se em processo de inferência através do qual, pelo correto exame de uma amostra pode-se inferir o que ocorrerá com a população. A maior utilidade da probabilidade, como menciona STEVENSON (p. 55) é auxiliar o desenvolvimento de estratégias, quantificando o quão provável é determinado evento. No campo Administrativo e contábil essa utilidade pode ser vista com facilidade no campo orçamentário e no campo da previsão de cenários, onde, baseado em dados históricos, devidamente mensurados e com apoio matemático para prever uma tendência (probabilidade) pode-se definir por este ou aquele cenário. COSTA (p. 92) sintetiza que "probabilidade é o número que resulta da divisão do número de casos favoráveis a um evento pelo número total de casos possíveis". Diante dessa definição, o número resultante desse cálculo somente pode estar compreendido entre 0 e 1, porque o maior número de casos favoráveis possível corresponde ao número total de casos possíveis e, em sentido inverso, o menor número possível de casos favoráveis é 0, ou seja, é quando não há possibilidade de ocorrer um evento favorável. SPIEGEL (p. 127) diz que a definição quanto à probabilidade da ocorrência do evento (denominado sucesso) é definida por: p (E) =
.
Toda probabilidade de um evento (denominado sucesso) é igual a um p(E) = 1. Por outro lado, a probabilidade do chamado insucesso, é representada da seguinte forma: 1− p (E).
1.1 EVENTOS ALEATÓRIOS GUERRA e DONAIRE (p. 14) ensinam que, para que um evento possa ser considerado aleatório, devem estar presentes duas condições essenciais, quais sejam: 3
a) deve ser sempre possível repetir as experiências indefinidamente fixadas certas condições iniciais; b) mesmo mantendo as condições iniciais, deve ser impossível influenciar no resultado de uma particular repetição da experiência. Como exemplos de eventos aleatórios podem ser considerados o lançamento de uma moeda honesta ou o lançamento de um dado não viciado.
1.2 CÁLCULOS DE PROBALIDADES Tomando como parâmetro a fórmula proposta por SPIEGEL (p. 127) pode-se concluir que o número de resultados associados ao evento (A) dividido pelo número total de resultados possíveis corresponde à probabilidade desse evento ocorrer. Tomando como paradigma de exemplificação uma moeda, constata-se que a mesma tem duas faces (cara e coroa). Logo, quando se arremessa, a chance de obter cara corresponde a 1/2 porque a moeda ó possui uma face denominada como cara, de modo que só há uma possibilidade de resultado que atenda ao requisito do lançamento (obter a f ace cara). De outro lado, como a moeda possui duas faces, há duas possibilidades de resultados (cara ou coroa).
No exemplo supram, as probabilidades são complementares, por que: P (cara)
= e P (coroa) =
, de modo que, somando-se esses dois eventos,
obtém-se a totalidade dos eventos possíveis, ou seja: + = 1 ou 100% Vários outros exemplos poderiam ser citados, pelo que destacamos os seguintes: Evento esperado Obter cara no lançamento de uma moeda Obter a face 6 no lançamento de um dado Obter uma face impar qualquer no lançamento de um dado Extrair uma carta de copas em um baralho completo
Resultados Total de associados ao resultados evento esperado Possíveis Uma face
Duas faces
Uma face
seis faces
três faces
seis faces
13 cartas de copa
52 cartas
Formulação P (cara) P (6)
=
=
P (ímpar)
P (6)
=
= 50%
= 16,67%
=
= 50%
= 25%
Quando se fala em evento é necessário observar seus tipos e associações, para o que, apoiamo-nos na classificação e nos exemplos de GUERRA e DONAIRE (p. 16), quais sejam: a) Evento simples: é aquele formado por um único elemento do espaço amostral. Exemplo: no lançamento de moedas há dois eventos simples: ou cara ou coroa: E1 = {K} E2 = {C}. 4
b) Evento composto: é aquele formado por dois ou mais elementos do espaço de amostragem. Exemplo: no lançamento de dados podem ser considerados os números pares, ou os ímpares, ou os dois primeiros números e, assim por diante: E1 = {2, 4, 6} E2 = {1, 3, 5} E3 = {1, 2}.E4 = {1, 2} c) Evento certo: é aquele que ocorre sempre, isto é, em todas as realizações da experiência. Exemplo: obter qualquer das faces de 1 a 6 no lançamento de dados. d) Evento impossível: é aquele que nunca ocorre, isto é, em nenhuma realização de experiência. Exemplo: obter face maior que 6 no lançamento de um dado. e) Evento soma (ou evento união): é o evento que consiste na realização de pelo menos um dos eventos E 1 e E2. Exemplo: na retirada de uma carta do baralho quer-se que seja uma carta de ouro ou uma carta ás. f) Evento produto (ou evento intersecção): é o evento que consiste na realização de ambos os eventos E 1 e E2, isto é, eles devem ocorrer simultaneamente. Exemplo: na retirada das cartas de um baralho quer-se um ás de ouro. g) Evento condicionado: é o evento que consiste na realização do evento E1 sob a condição de ter-se realizado o evento E 2 isto é, com a informação adicional de que o evento E 2 já ocorreu. Exemplo: na retirada de uma carta do baralho, quer-se que ocorra uma carta às, sabendo-se que a carta é de ouro. h) Eventos mutuamente exclusivos: dois eventos, associados a uma experiência aleatória, são ditos mutuamente exclusivos se a ocorrência de um deles exclui a possibilidade de ocorrência do outro, isto é, não ocorrem simultaneamente. Exemplo: no lançamento de uma moeda, os eventos cara e coroa são mutuamente exclusivos. i) Evento complementar (ou contrário): define-se como evento complementar de um evento E, associado a uma experiência aleatória, e denota-se por E ,ao evento que só ocorre se E deixar de ocorrer, isto é, é o evento formado por todos os elementos do espaço amostral que não pertencem a E.
5
Exemplos: no lançamento de uma moeda os eventos cara e coroa são mutuamente exclusivos e também são complementares. Já, no lançamento de um dado, os eventos 1 e 4 são mutuamente exclusivos mas não são complementares. j) Eventos independentes: dois eventos, associados a uma experiência aleatória, são ditos independentes quando a ocorrência de um deles não depende (ou não é condicionada ou não se vincula) à ocorrência do outro, isto é, a informação adicional de que um dos elementos já ocorreu em nada altera a possibilidade de ocorrência do outro. Exemplo: suponhamos que duas pessoas atirem numa caça; os eventos que consistem em que cada uma das pessoas acerte são independentes, pois o fato da primeira pessoa acertar em nada influencia no fato da outra também acertar.
1.3 PROBABILIDADES DOS EVENTOS STEVENSON (p. 74) sintetiza as seguintes regras das propriedades: 1.3.1 Teorema da soma - eventos mutuamente excludentes
P (A ou B), para eventos mutuamente excludentes: P(A ou B ocorrerá) = P(A) + P(B)
Exemplo: Lançar um dado e obter 1 na face ou par Na situação proposta, observamos que: a) P(A) = obter a face 1 =
b) P(B) = obter um número par =
c) Aplicando a fórmula, obtemos: P = P(A) + P(B) = + = =
= 0,67=67%.
Pode-se destacar outro exemplo: um jogo de dado em que se quer obter a face 1 ou a face 3. Observe-se que os eventos são excludentes porque, se sair à face 1 não sairá à face 3 e vice versa. Para as duas faces, a probabilidade de êxito é a mesma,
ou seja, para cada uma. Consequentemente, a probabilidade de êxito nessa situação, em que duas de 6
faces atingem o objetivo é o resultado da seguinte soma: + = = = 0,33=33%..
1.3.2 Teorema da soma - eventos não mutuamente excludentes.
P (A ou B), para eventos não mutuamente excludentes: P(A ou B ou ambos ocorrerão) = P(A) + P(B) – P (A e B). 6
Exemplo: Lançar um dado e obter a face 1 ou 2 ou par. A aplicação da fórmula e o desenvolvimento do método, observar que há um elemento no espaço amostral que atende tanto uma quanto outra condição, qual seja, o número 2. Chamando a primeira condição como P(A) e a segunda como P(B), temos:
a) P(A) = referente à ocorrência do número 1 ou do número 2 b) P(B) = atinente à ocorrência de um número par
c) P(A/B) = referente à provável ocorrência do número 2 d) Aplicando a fórmula, temos: P = P(A) + P(B) - P(A/B) =
- +
=
=
= 0,67=67%.
Outro exemplo: num jogo de cartas, quer-se uma carta 10 ou uma carta de copas. Observe-se que essa segunda opção não exclui a primeira posto que, mesmo a carta 10 pode ser de copas. Isoladamente, a probabilidade de sair à carta 10 corresponde a
enquanto que a probabilidade de sair uma carta de
10 de copas corresponde a . Aqui há um cuidado a ser tomado, que é o seguinte: pelo fato da carta 10 poder ser uma carta de copas, na probabilidade de sair uma carta desse naipe, já está computada a probabilidade de sair à carta 10, valendo dizer que a simples soma das duas probabilidades implicará em cômputo duplo dessa carta, sendo necessário um ajuste. Logo, nessa situação, somam-se as probabilidades e exclui-se o elemento comum, qual seja a probabilidade de sair à carta 10 de copas Numericamente
- +
=
=
.
= 0,31= 31%
1.3.3 Teorema da multiplicação - eventos independentes
P (A e B), para eventos independentes: P(A e B ocorrem – ou não - sem interferência de um sobre o outro) = P(A) . P (B);
A
B
Pode-se exemplificar esse tipo de cálculo com a seguinte situação: Em 70% das ocasiões um motorista excede a velocidade máxima em uma determinada via pública. Sabe-se, também, que em 30% das ocasiões, o Departamento de Trânsito coloca um radar móvel nessa mesma via. O 7
motorista deseja saber qual é a probabilidade de que ele exceda a velocidade máxima em um dia em que o radar estiver na via. Pois bem, chamando o excesso de velocidade de P(A) e a presença do radar de P(B), aplicamos a fórmula do seguinte modo: P = P(A) . P(B) = 0,70 . 0,30 = 0,21 = 21%. Admita-se outro, exemplo em que um determinado aluno chegue atrasado à aula em 25% das ocasiões e que, por outro lado, o professor falte em 10% das aulas. Nessa situação, qual é a probabilidade do aluno chegar atrasado e o professor ter faltado à aula. Observamos que um evento não depende e tampouco se relaciona com o outro, posto que ambos possam ocorrer, ambos podem não ocorrer e pode ocorrer um sem que ocorra o outro, sendo, também importante, que um não afeta a probabilidade de ocorrência do outro. Para aferir a probabilidade de ocorrência simultânea desses eventos há que se efetuar a multiplicação das probabilidades, então: 0,25 x 0,10 = 0,025 ou 2,5%.
1.3.4 Teorema da multiplicação - eventos dependentes (probabilidade condicional)
P (A e B), para eventos dependentes: P(A e B ocorrem – ou não com interferência de um sobre o outro) P(A) . P (A\B) ou P (B) . P (B \ A).
Essa é a chamada probabilidade condicional, em que os dois eventos devem ocorrer (ou não), havendo uma relação de dependência entre os mesmos, ou seja, a ocorrência (ou não) de um afetar de modo direto a probabilidade de ocorrência (ou não do outro). Citamos o seguinte exemplo: numa determinada urna existe 5 bolas, sendo 2 pretas e 3 brancas. Qual é a probabilidade de retirada de duas bolas, apenas, as quais deverão ser pretas, sendo que não haverá reposição da bola retirada.
Pois bem: a probabilidade inicial de retirar uma bola preta corresponde a , pois existem 2 bolas pretas dentre as 5 bolas que estão na urna. Contudo, na hipótese da primeira bola retirada ser preta, a probabilidade da segunda
também ser preta corresponderá a , posto que, nessa ocasião haver apenas 4 bolas, das quais somente uma é preta. Assim, temos que a probabilidade, nessa situação, corresponderá a:
. . =
=
= 10%
Numa outra situação, uma empresa possui 10 veículos, sendo que 7 são do tipo passeio e 3 são utilitários. Essa empresa deseja fazer uma inspeção nos veículos. Sem que exista reposição, qual é a probabilidade de que a empresa escolha, em duas amostras, dois veículos utilitários? Pois bem, chamando a 8
probabilidade de retirar o primeiro veículo utilitário como P(A) e a de escolher o segundo veículo utilitário como P(A/B), temos: P(A) =
pois há 3 utilitários em um universo de 10 veículos
P(A/B) = pois, após a escolha do 1º veículo remanescerão 9 veículos, dos quais 2 são utilitários. Aplicando a fórmula, temos:
P = P(A) . P (A\B) =
.
=
=
= 0,06666 = 6,67%.
A diferença básica entre o cálculo de probabilidade para eventos dependentes e para eventos independentes, com o teorema da multiplicação é que, na primeira situação (eventos dependentes) a probabilidade de ocorrência (ou não) de determinado evento não se altera com a ocorrência do outro evento. Já, na probabilidade condicional (eventos dependentes) a ocorrência de um altera a probabilidade do outro. Nos nossos exemplos verifica-se que após o primeiro evento houve alteração do espaço amostral, modificando a probabilidade de ocorrência de qualquer outro evento.
1.3.5 Teorema de Bayes - (teorema da probabilidade das causas ou partições). LIPSCHUTZ (p. 90) alude que o Teorema de Bayes, também conhecido como partições ou Teorema das Probabilidades das Causas tem como fundamento a suposição de que vários eventos formam uma partição num dado espaço amostral S.
Conforme a disposição da figura anterior, dentro do evento X o teorema (por essa razão é chamado como Teorema da Probabilidade das Causas) indica qual é a probabilidade de que o citado evento tenha sido originado de A ou B ou D e E, assim por diante. OLIVEIRA (1999:96) esclarece que o teorema permite determinar as probabilidades dos vários eventos A1, A2 , A3, ...An, que podem ser a causa da 8 ocorrência de B . Acrescenta: Sejam A1, A2, A3, ...An, eventos mutuamente excludentes cuja união é o espaço amostral Ω, ou seja, um dos eventos necessariamente deve
ocorrer. 9
LIPSCHUTZ (p. 90) apresenta a seguinte fórmula para o teorema:
P(A1 /B) =
A fórmula supra é sintetizada por OLIVEIRA (1999:96) da seguinte maneira:
P(A /B) = i
∑
Aplicando o teorema, podemos utilizar o seguinte exemplo, destacado por GUERRA e DONAIRE (p. 28): Exemplo: Numa fábrica existem três máquinas destinadas á produção de parafusos. A 1ª máquina produz diariamente 1.000 parafusos, a 2ª máquina 4.000 e a 3ª máquina 5.000. Sabendo-se que a 1ª máquina produz 4% de parafusos defeituosos, a 2ª máquina 3% e a terceira 1% e, tendo-se, ao final do dia, encontrado um parafuso defeituoso, qual a probabilidade dele ter sido produzido em cada uma dessas máquinas? Res o lu ção :
Sejam: No nosso exemplo, A1, A 2 , A3, ...An são substituídos por A, B, C, D, E, F e G o espaço amostral B é substituído por X. A = evento de ser parafuso produzido na 1ª máquina B = evento de ser parafuso produzido na 2ª máquina C = evento de ser parafuso produzido na 3ª máquina X = evento de ser parafuso defeituoso.
Então: P(A) = 1.000/10.000 = 0,10 P(B) = 4.000/10.000 = 0,40 P(C) = 5.000/10.000 = 0,50 P(X/A) = 0,04 P(X/B) = 0,03 P(X/C) = 0,01
10
Aplicando a fórmula temos: EVENTO A
P(A/X) =
P(A/X) =
= 0,19 = 19%
EVENTO B
P(B/X) =
P(B/X) =
= 0,57 = 57%
EVENTO C
P(C/X) =
P(C/X) =
= 0,24 = 24%
Atendendo à questão formulada, pode-se observar que a probabilidade do parafuso defeituoso ter sido produzido pela máquina A corresponde a 19%, pela máquina B corresponde a 57% e, para a máquina C a probabilidade é de 24%. Somando-se essas três probabilidades obtém-se a totalidade do espaço amostral (19% + 57% + 24% = 100%).
1.3.6 Síntese Genericamente quando a definição do problema permite uma opção, montando-se o esquema com a figura de um ou outro evento, estamos diante de um caso de soma de probabilidades. De outra parte, quando o problema impõe condições atingíveis ao mesmo tempo, encontramos uma situação de multiplicação das probabilidades.
11
1.4 AMOSTRAGEM SPIEGEL (p. 175) define que “a teoria da amostragem é um estudo das relações existentes entre uma população e as amostras dela extraídas”. Por
várias razões utilizam-se das técnicas de amostragem, destacando-se as de razão econômica e aquelas derivadas de outro exemplo curioso de STEVENSON (p. 158): “você não precisa beber todo o ponche para saber que gosto ele tem!”.
Exsurge daí a importância do processo de inferência que caracteriza a estatística indutiva, posto que o propósito da amostragem seja permitir inferir generalizações a cerca da população. As populações põem ser finitas (número de alunos de uma universidade, número de casa de um bairro, número de automóveis de uma frota) ou infinitas (jogadas de moeda – cara e coroa, nascimento de insetos, extração de bolas de uma urna com reposição) e, o conhecimento da natureza da população que se quer estudar interfere, de modo direto, na escolha do tipo de amostragem De modo geral, existem duas formas de amostragem: com reposição e sem reposição.
1.4.1 Amostragem sem reposição Amostragem sem reposição é aquela em que o item retirado para estudo e análise não retorna à base de dados ou à população, de sorte que não pode ser novamente retirado. STEVENSON (p. 159) aponta as seguintes razões pelas quais deve ser utilizada a amostra sem reposição:
(1) Os efeitos são desprezíveis quando a amostra é pequena em relação à população; (2) Se o teste tem caráter destrutivo, é impossível repor os itens examinados; (3) Na amostragem industrial, pode ser difícil convencer os inspetores não treinados em estatística a reporem na população os itens examinados, principalmente os itens defeituosos; (4) Quando se repõe um item examinado na população, há chance de ele ser novamente escolhido em extração futura. Assim, alguns itens são examinados mais de uma vez. Se o processo de amostragem é dispendioso, é conveniente evitar o exame repetido de um ou mais itens. 1.4.2 Amostragem com reposição A amostragem com reposição é aquela em que após o exame feito no item colhido na amostra, o mesmo retorna imediatamente à população, podendo ser novamente extraído, inclusive de forma sucessiva.
12
SPIEGEL (p. 176) destaca um fato interessante: a amostragem com reposição em uma população finita faz com que ela, no aspecto teórico, se transforme em infinita, visto que qualquer número de amostras pode ser extraído sem exaurir a população.
2.0 ANÁLISE COMBINATÓRIA LEMOS, HIGUCHI e FRIDMAN (p. 115) esclarecem que: Dado um conjunto, existem várias maneiras de agruparmos os seus elementos. Estes agrupamentos podem ser formados levando-se em conta a quantidade, a ordem e a natureza dos elementos. Na análise combinatória podemos encontrar arranjos simples, combinações simples e permutações, os quais tem como premissa de cálculo o fatorial, que consiste em um número n qualquer, inteiro e maior que a unidade. Representa-se assim:
n! = n . (n-1) . (n-2) ... 3.2.1 2.1 Arranjos simples Quando se quer calcular a quantidade de agrupamentos possíveis em um determinado conjunto, onde um grupo é diferente do outro pela ordem e pela natureza dos elementos, estamos diante de uma situação de arranjos simples. Os arranjos simples são representados através da seguinte fórmula:
An,p
Aplicando-se a fórmula, podemos destacar o seguinte exemplo: quanto número de três algarismos, sem repetição, obtém-se com os algarismos do conjunto {1,2,3,4,5,6,7,8,9}?
Solução: a) Toma-se uma resposta qualquer, por exemplo: 679 b) Inverte-se a ordem de dois elementos: 976 c) Obtivemos uma nova resposta, portanto, trata-se de um problema de arranjos simples. d) An,p e) A9,3
, Onde n = 9 e p = 3. = 504 13
Portanto, existem 504 números de três algarismos sem repetição, formados com os elementos do conjunto dado.
2.2 Combinações simples Na combinação simples, um grupo é diferente do outro apenas pela sua natureza. Assim, a ordem dos elementos não importa porque o grupo continua a ser o mesmo. LEMOS, FUGUCHI e FRIDMAN (p. 119) ensinam que, para calcular a quantidade de agrupamentos chamados co m bin ações elementos tomados p a p , utilizamos a fórmula:
Cn,p
sim ples
de n
Tomando uma situação exemplificativa, pergunta-se: quantas comissões de 4 membros são possíveis de se formar com 10 indivíduos?
Solução: Seja {A,B,C,D,E,F,G,H,I,J} o conjunto de 10 pessoas.
a) Toma-se uma resposta qualquer, por exemplo: ABCD. b) Inverte-se a ordem de dois elementos: BACD. c) Obtivemos a mesma resposta (é a mesma comissão); portanto, trata-se de um problema de combinação simples. d) Cn,p
Onde n = 10 e p = 4
e) Substituindo temos: C10,4
210
Portanto, podemos formar 210 comissões de 4 membros com um grupo de 10 indivíduos.
2.3 PERMUTAÇÃO SIMPLES Há situações, em problemas de arranjos , em que o número de elementos dos agrupamentos é igual ao número total dos elementos do grupo, como explicitam LEMOS, HIGUCHI e FRIDMAN (p. 121). Nessa situação diz-se que p = n e, essa particular situação do arranjo simples é denominada como permutação simples, que pode ser calculada por:
Pn = n! 14
Tal qual em relação aos itens anteriores da análise combinatória, vamos aplicar um exemplo 11: quanto número de 4 algarismos, sem repetição, obtém-se com os algarismos do conjunto {1,2,3,4}?
Solução: a) Observe que n = p = 4. b) Trata-se de um problema de arranjos simples, mas como n = p, é um problema que rotulamos de permutações simples. c) Pn = n! , donde P 4 = 4! = 4.3.2.1. = 24. Portanto, existem 24 números de quatro algarismos sem repetição formados com os elementos do conjunto dado.
3.0 VARIÁVEIS ALEATÓRIAS Uma variável aleatória (v.a.) associa um valor numérico a cada resultado de um fenômeno aleatório e uma distribuição de probabilidade associa uma probabilidade a cada valor de uma variável aleatória.
3.1 Variável aleatória discreta Uma variável aleatória que pode assumir um número finito de valores ou uma quantidade enumerável de valores, cujas probabilidades de ocorrência são conhecidas é denominada variável aleatória discreta. A função que atribui a cada valor da variável aleatória sua probabilidade é denominada função discreta de probabilidade ou função de probabilidade, isto é: P(X = xi) = p(xi) = pi, i = 1, 2, . . . Uma função de probabilidade satisfaz as duas condições seguintes: i) 0 ≤ pi ≤ 1; ii) ∑pi = 1.
3.2 Principais Distribuições de Probabilidades A distribuição de probabilidade de uma variável descreve como as probabilidades estão distribuídas sobre os valores da variável aleatória. A seguir veremos as distribuições de probabilidade Bernoulli, Binomial e Poisson para variáveis aleatórias discretas e a distribuição Normal para uma variável aleatória contínua.
3.2.1 Distribuição de Bernoulli Em situações em que o fenômeno aleatório é realizado uma só vez e a variável de interesse assume somente dois valores, tais como: um gestor de informação reconhece uma determinada editora ou não, um paciente sobrevive a um
15
transplante de medula-óssea ou não, um equipamento eletrônico é classificado como bom ou defeituoso. Estas situações têm alternativas dicotômicas, ou seja, podem ser representadas por respostas do tipo sucesso com probabilidade p que se atribui o valor 1 ou fracasso com probabilidade q que se atribui o valor 0. Podemos definir estes experimentos como ensaios de Bernoulli. Uma variável X tem distribuição de Bernoulli e sua função discreta de probabilidade é dada por:
P(X = x) = p x q1−x, x = 0, 1. Exemplo. Uma caixa tem 20 bolas azuis e 30 verdes. Retira-se uma bola dessa caixa. Seja X o número de bolas verdes. Determinar P(X). Para x = 0 temos q =
= 0, 4 e para x = 1, p =
Logo, P(X = x) = 0, 6 x 0, 41−x.
= 0, 6.
3.2.2 Distribuição Binomial Consideremos n tentativas independentes de ensaios de Bernoulli. Cada tentativa admite apenas dois resultados complementares: sucesso com probabilidade p ou fracasso com probabilidade q, de modo a se ter p + q = 1. As probabilidades de sucesso e fracasso são as mesmas para cada tentativa. A variável aleatória X que conta o número total de sucessos é denominada Binomial. Para indicar qual a variável aleatória X segue o modelo Binomial, usaremos a notação X b(n, p), em que n e p são denominados parâmetros dessa distribuição. A sua função de probabilidade é dada por:
∼
P(X = x) =
em que,
px qn-x
x = 0, 1, 2, . . . , n,
=
sendo n = número de tentativas, x = número de sucessos, p = probabilidade de sucesso, q = probabilidade de fracasso e P(x)= a probabilidade de se obter exatamente x sucessos em n provas. Para uma varável aleatória X com distribuição binomial a média e sua variância são dadas, respectivamente, por: μ (X) = np
Média
σ2 = npq
Variância 16
Exemplo. Uma moeda é lançada 6 vezes. Qual a probabilidade de: a) Exatamente duas caras ocorrerem?
X = 2 , p =
eq= 2
P(X = 2) =
= () 6-2
p q
=
=
= 15.
=
= 0,23
=
b) Ocorrerem pelo menos 4 caras?
P(X ≥ 4) = P(X = 4) + P(X = 5) + P(X = 6) P(X ≥ 4) =
() () () . p4
q6-4 +
p5
q6-5 +
=
+
+
=
+
+
+
+
+
+
=
= = = =
15
.
+
6 .
+
=
+
p6
q6-6
1
1 .
+
= 0,34
17
c) Pelo menos 1 cara?
()
P(X ≥ 1) = 1 − P(X = 0) P(X ≥ 1) = 1 − p0 = 1− = 1− = 1−
q6-0
= 1− = =
= 0,98
3.2.3 Distribuição de Poisson Como aplicação da distribuição de Poisson podemos citar: estudos de acidentes com veículos; número de mortes por derrame cerebral por ano, numa cidade, número de reclamações que chegam em uma operadora telefônica por hora, número de clientes que chegam numa loja durante uma hora de promoção relâmpago e número de usuários de computador l igados `a Internet. A distribuição de Poisson é uma distribuição discreta de probabilidade, aplicável a ocorrência de um evento em um intervalo especificado (tempo, distância, área, volume ou outra unidade análoga). A probabilidade do evento ocorrer x vezes em um intervalo é dada a seguir:
P(X = x) =
P(X = x) =
18
4.0 NÚMEROS ÍNDICES Números índices – é a relação entre o valor da variável em duas datas diferentes. O primeiro valor posicionado no numerador, é chamado de valor considerado ou corrente; O segundo valor é posicionado no denominador, é designado de valor-base ou referência. 4.1Fórmula
Ib,c =
. 100
Os Números Índices são expressos na forma percentual. Como os números índices relacionam o valor de uma variável socioeconômica num instante considerado com o seu valor numa data, os números índices também são designados de Valores Relativos ou simplesmente de Relativos. Um relativo é o número índice mais simples, relacionando o preço, a quantidade ou valor de um produto numa data considerada (c) com uma database ( b ). Assim, para um produto em que:
Pb é o preço na data-base; Pc é o preço na data considerada; qb é a quantidade na data-base; qc é a quantidade na data considerada; vb é o preço na data-base; vc é o preço na data considerada. 4.2 Preço relativo Pb,c =
. 100
4.3 Quantidade relativa qb,c = 4.4 Valor relativo vb,c =
. 100
. 100 19
Exemplo: Em 2006 uma empresa vendeu 625 unidades de um produto ao preço unitário de R$ 60,00. Em 2007, vendeu 1.000 unidades do mesmo produto ao preço unitário de R$ 90,00. Determine os relativos de preço, de quantidade e valor para o produto, tomando com base o ano de 2006.
Solução: Relativo de preço:
Pb,c =
. 100 =
. 100 = 150%
conclusão houve um aumento de 50%.
Relativo de quantidade:
qb,c =
. 100 =
. 100 = 160%
conclusão houve um aumento de 60%.
Relativo de preço:
vb,c =
. 100 =
.100 = 240% conclusão houve um aumento de 140%
Os resultados indicam que, 2007, houve aumento: no preço de 50%, na quantidade em 60% e no valor de vendas em 140%, em relação ao de 2006.
5.0 ÍNDICES AGREGATIVOS Considerando que uma variação geral dos preços relativos provoca uma mudança no nível de vida das unidades sociais. Os últimos três séculos, cientistas sociais tem tentado, mas sem sucesso absoluto, até o momento, que a variação necessária nas rendas para que tal nível se mantenha relativamente constante ao longo do tempo. O que os índices agregativos de preços procuram captar é o efeito global devido à evolução dos preços de uma cesta de bens e serviços entre duas datas, pressupondo que as preferências dos consumidores não se alteram significativamente ao longo dos períodos analisados.
5.1 Índices Agregativos Simples 5.1.1 Índice de Dutot Índice Dutot foi estabelecido em 1738, é definido como sendo a relação entre os somatórios dos valores de um conjunto de variáveis em duas datas diferentes (data-base e a considerada). 20
Sua expressão de cálculo é:
Dp =
∑∑
. 100
Trata-se de um índice de fácil aplicação, que apresenta as seguintes limitações: a) Não leva em consideração a importância relativa dos itens, exemplo: feijão e lagosta tem a mesma importância de custo; b) Não há homogeneidade entre as unidades dos diversos itens, exemplo: o café pode vir em quilos e o leite em litros, assim por diante.
Exemplo: A tabela a seguir apresenta os preços de quatro produtos em duas datas diferentes. Tabela – Preços de produtos em duas datas diferentes
Produtos Leite Pão Azeite de oliva Farinha ∑
Data 1 0,99 0,15 7,20 0,88 9,22
Data 2 1,34 0,20 7,90 1,03 10,47
O índice agregativo simples, segundo Dutot é:
Dp =
∑∑
. 100 =
. 100 = 113,56% houve um aumento de 13,56%.
Em geral os índices agregativo simples apresentam desvantagem o fato de não existir um peso diferente para cada item que compõe o índice, de acordo com sua importância. Além disso, o índice agregativo simples é muito afetado pelo alto preço unitário, influenciando o cálculo.
5.2 ÍNDICES AGREGATIVOS PONDERADOS É o índice que dar uma ponderação a cada item da cesta d e produtos “peso” de tal forma que cada um deles influencie mais ou menos o cálculo final. Em princípio há um índice para cada tipo de média conhecida. No caso específico das médias ponderadas é comum adotar; a) Como fator de produção, a frequência absoluta de cada classe; b) Como valor da variável, o ponto médio da classe.
21
5.2.1 Índice Aritmético de Sauerbeck É dado pela média aritmética dos relativos, isto, é:
Sa =
∑ ∑
. 100
Os termos da fórmula índice de Sauerbeck f é a frequência absoluta da i-ésima classe; X c é o valor do i-ésimo item na data considerada ou o ponto médio da i-ésima classe; X b é o valor do i-ésimo item na data-base ou o ponto médio da i-ésima classe; ∑ é o somatório; ∑ f = n é o número de itens considerados no estudo.
5.2.2 Índice Geométrico de Sauerbeck É dado pela média geométrica dos relativos, isto, é:
∑ . 100 S = g
Os termos da fórmula índice de Sauerbeck f é a frequência absoluta da i-ésima classe; X c é o valor do i-ésimo item na data considerada ou o ponto médio da i-
ésima classe; X b é o valor do i-ésimo item na data-base ou o ponto médio da i-ésima classe; ∑ é o somatório; ∑ f = n é o número de itens considerados no estudo; é o produtório.
5.2.3 Índice Harmônico de Sauerbeck É dado pela média harmônica dos relativos, isto, é:
Sh =
∑ ∑
. 100
Os termos da fórmula índice de Sauerbeck f é a frequência absoluta da i-ésima classe; X c é o valor do i-ésimo item na data considerada ou o ponto médio da i-
ésima classe; X b é o valor do i-ésimo item na data-base ou o ponto médio da i-ésima classe; ∑ f = n é o número de itens considerados no estudo; ∑ é o somatório.
22
Exemplo: Tabela 1- Preço de produtos em duas datas diferentes Produto
Unidade
Preço 1
Quantidade 1
Preço 2
Quantidade 2
Carne Feijão Óleo Pão Margarina Farinha
Kg Kg Lata 50g Pote Kg
8,20 1,40 2,89 0,15 2,10 1,99
4,5 5,0 4,0 40,0 2,0 3,0
9,90 1,40 3,15 0,20 2,38 2,49
5,0 4,5 3,0 55,0 3,0 2,0
Total
16,73
19,52
Com os valores da Tabela acima, podemos calcular os respectivos relativos. Tabela 2 - Relativos obtidos com os dado da tabela acima Valor
Relativo
Data 1
Data 2
Preço
Quantidade
Valor
36,90 7,00 11,56 6,00 4,20 5,97
49,50 6,30 9,45 11,00 7,14 4,98
120,73 100,00 109,00 133,33 113,33 125,13
111,11 90,00 75,00 137,50 150,00 66,67
134,15 90,00 81,75 183,33 170,00 83,42
71,63
88,37
701,52
630,28
742,64
Dos valores das Tabelas 1e 2, decorrem os seguintes valores: a) Índices de Sauerbeck de preços
Índice aritmético
∑ ∑
Sa =
. 100 =
. 100 = 115,92
Índice geométrico
∑ S = 100= . 100 g
=
. 100 =
. 100 = 116,33
Índice harmônico Sh =
∑ ∑
=
. 100 =
. 100=
. 100 = 115,83
23
b) Índices de Sauerbeck de qualidade
Índice aritmético
∑ ∑
Sa =
. 100 =
. 100 = 105,05
Índice geométrico
∑ . 100 S = 100= g
∑ ∑
=
. 100 = 1,0064 . 100 = 100,64
Índice harmônico Sh =
. 100 =
. 100=
. 100 = 96,15
=
c) Índices de Sauerbeck de valor
Índice aritmético
∑ ∑
Sa =
. 100 =
. 100 = 123,78
Índice geométrico
∑ . 100 S = 100= g
∑ ∑
=
. 100 = 1,1701 . 100 = 117,01
Índice harmônico Sh =
=
. 100 =
. 100=
. 100 = 110,86
24
Quadro-resumo dos índices Variável Preço Quantidade Valor
Sauerbeck Aritmética Geométrica Harmônica
116,92 105,05 123,78
116,33 100,64 117,01
115,83 96,15 110,86
5.3 Índices agregativos ponderados (Laspeyeres ) É a fixação de um peso para cada item, que permitirão calcular e interpretar as variações de preço, de quantidade e de valor dos itens. Existem vários métodos para determinar o índice ponderado. Estudaremos o de Laspeyeres.
5.3.1 Peso Relativo A ponderação baseará na participação de cada item no preço total gasto na transação em que estão presente vários itens.
∑ =
. 100
Em que:
é o relativo do i-ésimo item, i é o item e d a data-base; é o preço do i-ésimo item; é a quantidade do i-ésimo item; é o total gasto na aquisição de vários itens
∑
Exemplo: Na tabela a seguir, temos uma relação de itens que foram adquiridos em duas datas diferentes. Na data 1, temos o preço p1 e, na data 2, temos o preço p2. Nas duas compras a quantidade q foi mantida constante. Cesta de itens adquiridos nas data 1 e 2 I
Produto
Unidade
q
p1
i
p2
i
p1.q
1 2 3 4
Arroz Feijão Carne Cerveja
Kg Kg Kg Lata
5 3 10 12
1,60 1,10 8,40 1,04
2,04 1,48 10,50 1,48
8,00 3,30 84,00 12,48
10,20 4,44 105,00 17,76
107,78
137,40
∑
i
i
i
i
i
p2.q
25
Observe que, na data 1 (data-base) a cesta de produtos custou R$ 107,78. Qual a participação do relativa do arroz no custo total?
= ∑ Em que i é o número inteiro e positivo variando de 1 até n e d é a data-base. = ∑ = = 0,0742
Podemos apresentar o resultado em porcentagem, ou seja: = 7,42% O arroz teve 7,42% de peso relativo na compra efetuada na data 1. Qual a participação dos itens 2, 3 e 4? Participação do feijão
= ∑ = = 0,0306 ou 3,06% Participação da carne
= 0,7793 ou 77,93% = ∑ = Participação da cerveja
= 0,1158 ou 11,58% = ∑ =
Ao somarmos os percentuais encontrados, necessariamente deveremos obter 1,00 ou 100%. Para aquisição dos mesmos itens na data 2 (data atual) gastou-se o valor de R$ 137,40. Qual foi o percentual de aumento? Vamos calcular os relativos na data 2 considerando-se o total gasto na data 1. Então, temos:
Participação do arroz
= 0,0946 ou 9,46% = ∑ = 26
Participação do feijão
∑ ∑ =
=
= 0,0412 ou 4,12%
Participação da carne =
=
∑
= 0,9742 ou 97,42%
Participação da cerveja =
=
= 0,1648 ou 16,48%
Ao somarmos os percentuais, encontramos 127,48%, o que nos mostra que houve um aumento de 27,48% nos preços dos itens considerados. Podemos chegar ao mesmo resultado se dividindo o total gasto na data 2 pelo total gasto na data 1.
5.3.2 Índice de Laspeyres Ernst Louis Etienne Laspeyres economista alemão, professor de estatística, hoje conhecido por ter desenvolvido em 1871 o índice de Laspeyres para determinar a inflação. Laspeyres propôs que fosse adotada, como data de referência para as ponderações a data-base. Assim, o índice de Laspeyres é também denominado MÉTODO DA ÉPOCA BÁSICA. Então, usando as quantidades do período base, os pesos são calculados pela fórmula:
= ∑ Em que i é o número inteiro e positivo variando de 1 até n e d é a data-base. O índice de Laspeyres, é a média aritmética ponderada dos relativos, em que o fator de ponderação é igual à participação relativa de cada itens diante do valor total dos itens adquiridos na data-base. 27
Sua fórmula no período 1 e 2, é:
∑ ∑ =
.100 Sabemos que ∑ = 1. Então: =
5.3.2.1 Índice de Laspeyres de preço (
∑
)
O índice Laspeyres de preço é determinado pela fórmula:
∑ ∑ ∑
=
=
=
∑ ∑ ∑ ∑ =
.100
Onde:
é o índice de Laspeyres de preço; é o preço do item i , na data 1 é o preço do item i , na data 2; é a quantidade do item i na data 1. i é o número de itens, inteiro positivo, variando de 1 até n. Exemplo: Dada a tabela abaixo, calcule o índice Laspeyres de preço. Cesta de itens adquiridos nas data 1 e 2. i
Produto
Unidade
Quantidade 1
Preço 1
Quantidade 2
Preço 2
1
gasolina óleo de milho morango
Litro Litro Caixa
50 8 6
1,90 3,99 2,50
42 12 8
2,90 4,89 3,90
2 3
∑ ∑ .100
=
=
.100 =
.100 =
=
.100 = 1,1748 . 100 = 117,48%
O índice nos mostra que houve uma variação de 17,48% nos preços do conjunto dos itens considerado. No caso, houve um aumento nos preços. 28
∑ ∑
5.3.2.2 Índice de Laspeyres de quantidade (
)
O índice Laspeyres de preço é determinado pela fórmula:
∑ ∑ ∑ =
=
=
∑ ∑
.100
=
Onde:
é o índice de Laspeyres de preço; é o preço do item i , na data 1 é o preço do item i , na data 2; é a quantidade do item i na data 1. é a quantidade do item i na data 2 i é o número de itens, inteiro positivo, variando de 1 até n. Exemplo: Dada a tabela abaixo, calcule o índice Laspeyres de preço. Cesta de itens adquiridos nas data 1 e 2. i
Produto
Unidade
Quantidade 1
Preço 1
Quantidade 2
Preço 2
1
gasolina óleo de milho morango
Litro Litro Caixa
50 8 6
1,90 3,99 2,50
42 12 8
2,90 4,89 3,90
2 3
∑ ∑ .100
=
=
.100 =
.100 =
=
.100 = 1,0344 . 100 = 103,44%
Para o cálculo desse índice, consideramos os preços da data-base como os fatores de ponderação. Como nas datas consideradas, variamos as quantidades adquiridas em cada item e mantivemos o preço constante, verificamos que houve 3,44% a mais de gasto na data atual em relação à data-base.
29
5.3.2.3 Índice de Laspeyres de valor (
)
O índice Laspeyres de preço é determinado pela fórmula:
∑ ∑ ∑ ∑ =
=
.100
=
=
Onde:
é o índice de Laspeyres de preço; é o preço do item i , na data 1 é a quantidade do item i na data 1. é a quantidade do item i na data 2 i é o número de itens, inteiro positivo, variando de 1 até n. Exemplo: Dada a tabela abaixo, calcule o índice Laspeyres de preço. Cesta de itens adquiridos nas data 1 e 2. i
Produto
Unidade
Quantidade 1
Preço 1
Quantidade 2
Preço 2
1
gasolina óleo de milho morango
Litro Litro Caixa
50 8 6
1,90 3,99 2,50
42 12 8
2,90 4,89 3,90
2 3
∑ ∑ =
=
=
.100
.100 =
.100 =
.100 = 1,2420 . 100 = 124,20%
Aqui, verificamos que como tanto as quantidades adquiridas de cada item quanto os preços variam, na data atual gastou-se 24,20% a mais que na database.
30
6.0 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES Correlação É o grau de relacionamento existente entre variáveis. A correlação pode ser classificada segundo o número de variáveis envolvidas e segundo a complexidade das funções de ajuste. Correlação simples quando for considerada uma variável independente; Correlação múltipla quando for considerada mais de uma variável independente. Linear quando o ajustamento é feito por uma função é do primeiro grau. Não Linear quando o ajustamento é feito por uma função de grau maior que um. Regressão linear simples É o método de análise da relação existente entre duas variáveis: uma dependente e uma independente. A regressão linear simples é normalmente utilizada para o estudo da relação existente entre variáveis, com o propósito de fazer previsões a partir dos resultados obtidos nelas.
Correlação linear simples É a descrição do relacionamento entre duas variáveis, sendo pelo menos uma delas aleatória. Vamos ordenar esses pares segundo valores crescentes da primeira variável. Podem ocorrer diversos valores da segunda para cada valor da primeira. Para auxiliar nosso julgamento, podemos representar graficamente esses pares. A representação gráfica resultante é chamado: Diagrama de Dispersão do par de variáveis. Exemplo 1:
Diagrama de Dispersão
Dados históricos X 2 3 5 8 3 8 5 10 8 Y 40 50 60 50 70 40 50 60 70
80
Dados ordenados X 2 3 3 5 5 8 8 8 10 Y 40 50 70 60 50 50 40 70 60
40
60
20 00 1 2 3 4 5 6 7 8 9 10
31
Correlação linear forte (positiva)
Correlação linear forte Correlação linear fraca (negativa) (positiva)
6.1 COEFICIENTE DE CORRELAÇÃO LINEAR É uma medida, proposta por Karl Pearson e seu cálculo é dado pela relação:
r =
Se representarmos por:
= e = ,
= , podemos escrever o coeficiente de correlação mais simples:
r =
O coeficiente de Pearson tem variação entre – 1 e 1 ou, -1 r 1. r = -1 indica correlação linear negativa perfeita. r = 0 os pontos não estão em correlacionados. r = 1 indica correlação positiva perfeita.
Exemplo: As variáveis x e y apresentam os seguintes pares de valores no levantamento amostral: x 2 4 5 7 12 y 40 50 60 50 70 Construir um diagrama de dispersão e calcular o coeficiente de correlação, comentando os resultados.
32
Solução: n 1 2 3 4 5
40 30 20
X 2 4 5 7 12 30
∑
00 2
4 5
7
Y 20 25 24 31 40 140
xy 40 100 120 217 480 957
x 4 16 25 49 144 238
y 400 625 576 961 1.600 4.162
12
Calculamos os valores:
=
r =
=
=
=
=
=
= 58
√ √ =
= 117
= 242 = 0,9876
Comentário: O coeficiente de correlação r = 0,9876 confirma a impressão visual fornecida pelo diagrama de dispersão. As variáveis são altamente correlacionadas positivamente.
Exercícios 1. Construir o diagrama de dispersão para os dados:: X Y
3 8
5 8 10 11 15 12 20 20 26 32
Calcular o coeficiente de correlação para os dados. Observando o diagrama de dispersão, você teria estimado um valor para o coeficiente próximo ao encontrado? Por que? 2. Usando os dados do exercício 1, se você tivesse que estimar o valor de y para x = 9, qual valor você escolheria? a) Um valor menor que 19. b) Um valor maior que 19. c) Não é possível fazer uma previsão para x = 9. Justifique sua resposta. 33
3. A tabela a seguir mostra um conjunto de dados levantados em um período para as variáveis x, y e z. X 3 8 12 20 22 35 40 Y 12 26 22 30 25 40 41 z 8 10 12 15 14 27 25 a) Calcule o coeficiente de correlação para as variáveis (x, y), (x, z), (y, z) b) Se você precisasse escolher uma das duas variáveis x ou y para estimar a variável z, qual das duas escolheria? Por que? c) Usando a variável x para estimar z, para x = 25, que valor você atribuiria a z? d) Usando a variável y para estimar z, para y = 27, que valor você atribuiria a z? 4. A tabela a seguir mostra um conjunto de dados levantados em um período para as variáveis x, y e z. X 4 8 10 12 15 17 22 Y 130 110 100 90 75 65 40 a) Qual o coeficiente de correlação das variáveis x e y? b) É possível estimar com precisão o valor de y para x = 20? Por que? 5. A venda de um produto foi pesquisada para vários níveis de preços e vários níveis de rendas dos consumidores: X 3 8 12 20 22 35 40 Y 12 26 22 30 25 40 41 Z 8 10 12 15 14 27 25 Qual a variável de controle que melhor se relaciona com as vendas? Por que?
Regressão Linear Simples É um método de previsão que permite uma avaliação confiável no relacionamento de duas variáveis e a parte das incertezas transformam em risco. Vamos considerar o caso do relacionamento de duas variáveis x e y com as características: x : é a variável cujos os valores controlaremos. Os valores de x são, portanto, determinados e independentes aos valores da variável y. Ela será conhecida ainda por variável de decisão. ( seu valores depende de nossa decisão; atribuiremos seu valores). 34
y : variável aleatória. É a variável que queremos prever. Seu valor depende do valor atribuído a x, embora para cada valor de x possamos ter diversos valores para y, devido a sua característica aleatória. Ainda assim, diremos que y é variável dependente da variável x.
6.1.1 Método dos Mínimos Quadrados A ideia do método dos mínimos quadrados é construir uma estimativa para a verdadeira reta de regressão, tornando o menor possível a soma das diferenças (yi – ŷ) entre os pontos observados y i e o correspondente valor sobre a reta estimada ŷ (y chapéu). A reta estimada tem a forma funcional: ŷ = a + b. x ŷ = a + b. x
ŷ é o estimador de ; a e b são estimadores de α e β.
onde:
onde : b=
ou seja:
b=
e
a=
e
– b .
̅
a = – b .
Exemplo:
Calcular, usando o método dos mínimos quadrados, a reta que ajusta o conjunto de pontos observados. Construa o gráfico de dispersão.
N 1 2 3 4 5 ∑
X 1 2 3 4 5 15
y 10 12 16 15 17 70
xy 10 24 48 60 85 227
x 1 4 9 16 25 55
y 100 144 256 225 289 1.014
Solução:
= = = 17 = = = 10 = = 1,70 e a = b . = 1,70 . = 8,90 b=
–
–
35
portanto: ŷ = a + b. x = 8,90 + 1,70 . x 17 16 15
12 10
0 1
2
3
4
5
6.2 COEFICIENTE DE EXPLICAÇÃO É a percentagem da variação dos valores y em relação a sua média que pode ser explicada pela regressão de y em x. O coeficiente de explicação R 2 pode ser definido como sendo a percentagem da variação total representada pela variação explicada
2
R =
ou
R2 = b .
6.3 FUNÇÕES LINEARIZÁVEIS É usadas quando os pontos apresentam uma tendência não linear, isto é uma curva bem definida em torno do qual os pontos parecem agrupar. Felizmente, existe um grupo de funções que apresentam gráficos ajustáveis a muitas dessas tendências, e que possuem a qualidade de poder transformar-se em funções lineares com aplicação de logaritmos ou por mudança de variável.
36
Função Potência
Y = a . xb, com
x
y
0, a
e b 0
y
b 1
0 b 1 x
Crescente Concavidade para cima Contém a origem
Função Exponencial y
x
Decrescente Concavidade para baixo Contém a origem
Se x = 0, então y = 0. Para x 0, aplicando o logaritmo, temos:
Y = a . bx, com y
y=
a
a+b.
0, b
a
0
x
e x 0
b 1 a
0
0 b 1 x
Crescente Concavidade para cima x=0 y=a
x Decrescente Concavidade para baixo x = 0 y = a
Aplicando o logaritmo, temos: y= a+ b.x Por meio do gráfico de dispersão ( x, b ) e do coeficiente de correlação apresentado podemos julgar se devemos adotar a regressão correspondente.
Funções Logaritmo
Y = a + b. y
x, x 0 y
a
b 0
b 0 x
Crescente Concavidade para baixo x=0 y=a
x
Decrescente Concavidade para cima x = 0 y = a
37
y= a+ b.x Aplicando o logaritmo, temos: Por meio do gráfico de dispersão ( , y ) e do coeficiente de correlação apresentado podemos julgar a adequação do uso dessa forma funcional. Exemplo: Usando os dados do exemplo anterior, calcular o coeficiente de explicação da regressão de y sobre x.
Solução:
=
= 17
R2 = b .
= 1,70 .
=
= 34 b = 1,70 então, temos:
= 0,85
O resultado indica 85% das variações de y a partir de sua média são explicados pela regressão de y sobre x. Os outros 15% das variações são ditados por fatores imponderáveis.
Exercícios: 1. Um estudo sobre a oferta ao mercado de um produto revelou as quantidades que os produtos estariam dispostos a oferecer a vários níveis de preços:
X= preço 10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50 Y= oferta 427 440 447 453 460 465 470 472 (em 1.000 un.) a) Construa o gráfico de dispersão para os dados da tabela; b) Calcule o coeficiente de correlação linear das variáveis; c) O diagrama de dispersão sugere o uso de alguma forma linearizável para ajustar os pontos; d) Construa o gráfico da forma linear correspondente à função escolhida em c; e) Calcule o coeficiente de correlação dos pares em (d); f) Comente os resultados obtidos; g) Calcule a regressão de y sobre x para a função de maior correlação; h) Calcule o coeficiente de explicação para a função escolhida em (g); i) Calcule a oferta esperada para 15,00.
38