Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 31
Módulo 3 Variável aleatória discreta As variáveis aleatórias possuem importância fundamental na Estatística, visto que através delas, os eventos definidos nos problemas de probabilidades são transformados em números e, daí, podermos criar modelos matemáticos para aplicar na Estatística. Nos problemas os eventos de um espaço amostral são descritos em linguagem comum, e para usar us arm mos mo mode delo loss ma mate tem mát átic icos os prec precis isam amos os de nú núme mero ros. s. Assi Assim, m, pa para ra faze fazerm rmos os a transformação das “palavras”, que exprimem os eventos no espaço amostral, em números, usamos a variável aleatória. É importante que, em cada problema a ser resolvido, definamos a “variável aleatória” de forma inequívoca. Vamos dar um exemplo, para que se entenda melhor o que é a variável aleatória. Vamos estudar o caso do lançamento de duas moedas, cujoo espaç cuj espaçoo amost amostral ral é: é: (CC) (CC) (KC) (KC) (CK) (CK) (KK) (KK) sendo sendo qu quee esses esses eve evento ntoss podem podem ser descritos por números bastando definirmos como variável aleatória uma das possibilidades existentes para o resultado desses lançamentos que pode ser: X = número de caras obtidas Com essa definição, podemos descrever aquele espaço amostral com os seguintes números que representarão todos os eventos possíveis. X = 0 ⇒ significa que não saiu nenhuma cara, portanto, saíram duas coroas. X = 1 ⇒ significa que saiu uma cara, portanto, saiu uma coroa. X = 2 ⇒ significa que saíram duas caras, portanto, não saiu nenhuma coroa. As variáv variáveis eis ale aleató atória rias, s, em Estatí Estatísti stica, ca, pod podem em ser cla classi ssific ficada adass em doi doiss tip tipos, os, discretas, discretas, quando são obtidas de uma contagem e contínuas, contínuas, quando forem resultado de umaa med um ediç içãão. As fo forrmas de se tra trabalha alharr com essa ssas variá ariávveis eis alea leatóri tórias as sã sãoo matematicamente diferentes, pois representam eventos completamente diferentes. Neste módulo, vamos estudar as variáveis discretas.
Distribuição de probabilidades probabilidades As variáveis aleatórias discretas só podem ser representadas por números inteiros positivos, a partir de zero, e a sua quantidade é finita. Denominamos “Função distribuição de probabilidades” uma função matemática, tabela ou gráfico, que associa a cada valor da variável aleatória uma probabilidade. A chamada “distribuição de probabilidades”, é obtida através de uma tabela em que colocamos todos os possíveis valores da variável aleatória do problema que estamos estudando com os seus respectivos valores de probabilidades. Sempre antes de começarmos a resolver um problema devemos definir a variável aleatória que queremos estudar, e em função dessa definição é que iremos determinar, todos os possíveis valores de x, bem como calcular suas respectivas probabilidades.
Esperança matemática È o nome dado a média aritmética de todos os possíveis valores de “x” de uma distribuição de probabilidades. Este conceito, porém, deve ser entendido como sendo o valor que conseguiríamos, para a media da variável aleatória “x” se os experimentos a que o
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 32
problema se refere fossem realizados infinitas vezes. Por definição, a esperança matemática é calculada na forma: E[ x] x] xiP( xi )
na Estatística este valor é representado por: E[ x] = µ
Função repartição ou distribuição de probabilidades acumuladas Esta função é definida na forma: F( x a) a) Σ P( xi a)
Ou seja, esta função fornece o valor da probabilidade acumulada da soma dos valores anteriores à variável qualquer "a" do problema em estudo, mais o valor da sua probabilidade. Portanto, conhecida a distribuição de probabilidades de uma variável aleatória pode po demo moss de dete term rmin inar ar a su suaa fu funç nção ão repa repart rtiç ição ão ou vice vice-ve -vers rsa. a. Nu Numa ma dist distri ribu buiç ição ão de probabilidades a função repartição da última variável é igual a um, caso isso não ocorra a distribuição está errada.
Mediana O valor da mediana é definida como sendo o valor da variável aleatória que divide a distribuição de probabilidades probabilidades em duas partes equiprováveis. Portanto, teremos: teremos: F( x = Md ) = 0,5. No caso de variáveis discretas, esta condição não é normalmente satisfeita. Dai a razão de definirmos a mediana pela expressão: F( x = Md Md ) ≥ 0,5 o que significa dizer que o valor da mediana, é o valor de x, cuja soma acumulada das probabilidades é igual a 0,5 ou o primeiro valor de "x", cuja soma for maior que 0,5. O cálculo da mediana pode ser generalizado para outros valores de "x" como, por exemplo, os que dividem a distribuição em 4 partes (quartil), ou em 10 partes (decil) ou em 100 partes (percentil).
Moda É o valor da variável aleatória x que corresponde ao maior valor da probabilidade. Pode acontecer que, numa distribuição, exista mais de uma moda.
Variância É uma medida que nos mostra como os valores da distribuição estão dispersos em torno da média, ou seja, esta medida nos dá a idéia da homogeneidade da distribuição da variável variável em estud estudo. o. Quanto maior for o seu valor, valor, mais dispersos dispersos estarão os elem elementos entos da distribuição em torno da média. Por definição, a variância é calculada na forma:
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 33 σ
2 ( x ) E[( x μ )2 ]
Aplicando as propriedades propriedades da esperança na expressão expressão acima, ela poderá ser escrita na forma: σ
onde:
2 ( x) x)
E[ x 2]
E[ x ]2
E [ x 2 ] xi2P( xi )
Desvio padrão O problema problema da variância variância é que seu resultado resultado apresenta apresenta o quad quadrado rado da unida unidade de que estamos estudando, qualquer qualquer que seja a variável aleatória. Assim, a única forma para para voltar à unidade original é extrair a raiz quadrada. Então, por definição, o desvio padrão é a raiz quadrada da variância, ou seja: (x)
σ
σ
2 (x)
Coeficiente de variação É uma grandeza que nos dá idéia da dispersão relativa em função da média. Por definição, é calculada na forma: C.V
σ μ
%
Exercícios de aplicação 1) Uma caixa contém 3 válvulas boas e 2 queimadas. As válvulas são testadas uma a uma, sem reposição. Seja a variável aleatória X definida como sendo a ordem do teste em que a queimada é localizada. Faça a distribuição de probabilidades dessa variável aleatória. X=
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 34
2) Uma caixa contém 3 bolas brancas e 3 bolas pretas. Estabeleça a distribuição de probabilidade do número de bolas retiradas, uma a uma, sem reposição, até sair a última bola preta. Faça a distribuição dessa variável aleatória. X=
3) Um disco está está dividido em 5 setores iguais, numerados numerados de 1 a 5. Definimos uma uma variável aleatória igual, em cada experimento, ao número do setor indicado, ao se girar um ponteiro fixado no centro do disco. Feitos 2 experimentos, define-se uma nova variável alea aleató tória ria,, igua iguall ao mó módu dulo lo da dife difere renç nçaa do doss va valo lore ress ob obtid tidos os em ca cada da ex expe peri rime ment nto. o. Determinar a distribuição de probabilidades desta nova variável aleatória. Y= X=
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 35
4) Uma urna tem 2 bolas brancas e 3 pretas. Retiram-se 3 bolas, uma a uma, sem reposição, da caixa. Seja a variável aleatória X, o número de bolas brancas observadas. Determinar a distribuição de probabilidades de X. X=
5) Um par de dados é lançado. Seja a variável aleatória X, definida como sendo o maior dos números obtidos. Faça a distribuição de probabilidades dessa variável aleatória.
X=
6) Um dado é jogado 3 vezes. Seja X o número de pontos dois que aparece. Estabeleça a distribuição de probabilidades de X . X=
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 36
7) Uma pessoa joga 3 moedas e ganha R$ 6,00 se obtiver só caras ou coroas. Quanto deve pagar se perder, para que o jogo seja eqüitativo? Um jogo é eqüitativo quando sua esperança é igual a zero. X=
9) Um joga jogado dorr A ap apos osta ta co com m B, R$ R$10 100, 0,00 00 e lanç lançaa do dois is da dado dos, s, no noss qu quai aiss as probabilidades de sair cada face são proporcionais aos valores da face. Se sair soma 7, ganha R$50,00 de B. Se sair soma 11, ganha R$100,00. Se sair soma 5, ganha R$ 200,00. Nos demais casos, perde. Qual a esperança de ganho do jogador A? X=
Tarefa mínima 1) Um dado é jogado 4 vezes. Seja x o número de pontos “dois” que aparece. Calcule a média e o desvio padrão de x, a moda e a mediana. R: 0,66 ; 0,75 ; 0 e 1 2) Uma caixa contém 2 bolas brancas e 1 preta. Uma pessoa vai retirar as bolas, uma por uma, até conseguir apanhar a bola preta. Seja x, o número de tentativas que serão
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 37
necessárias. Calcule a média, moda, mediana e desvio padrão dessa variável. R: 2; plurimodal; 2 ; 0,81 3) Em um jogo, dois dados são lançados ganhando-se R$1,00 por ponto de diferença entre os seus resultados. resultados. Até quanto é razoável razoável pagar para entrar entrar nesse nesse jogo? R: R$1,94 4) Um jogador lança um dado. Se aparecerem os números 1, 2, ou 3 recebe R$ 10,00. Se, no entanto, aparecerem, 4 ou 5, recebe R$ 5,00. Se aparecer 6, ganha R$ 20,00. Qual o ganho médio do jogador? R$ 10,00 5) As probabilidades de que haja em cada carro que vá a Santos, num sábado, 1, 2, 3, 4, 5, ou 6 pessoas, são respectivamente: respectivamente: 0,05; 0,05; 0,20; 0,40; 0,15; 0,12 e 0,08. a) Qual o número médio de pessoas por carro, se chegam 4.000 carros por hora? b) Qual o número médio esperado de pessoas na cidade, em 10 horas de contagem? R: 3,33 e 133.200 6) Num jogo de dados, A paga R$ 20,00 a B e lança 3 dados. Se sair face 1, em apenas um dos dados, A ganha R$ 20,00. Se sair face 1, em apenas dois dados, A ganha R$ 50,00; e se sair 1, nos 3 dados, A ganha R$ 80,00. Calcular o lucro líquido médio de A por jogada. R: –R$0,78 7) Dois tetraedros regulares têm suas faces numeradas de 1 a 4. Jogam-se ambos e somam-se os pontos das faces que ficarem voltadas para baixo. Sabendo-se que a soma obtida é maior que 4, calcule a média, a moda, a mediana e o desvio padrão dessa distribuição. R: 6 ; 5 ; 6 ; 1 8) Sabe-se que uma moeda apresenta cara, freqüentemente, três vezes mais que a coroa. Essa moeda é jogada jogada três vezes. vezes. Seja x o número de de caras que que aparece. Calcule Calcule a média, a moda, a mediana, o desvio padrão dessa variável. R: 2,25 ; 2 e 3 ; 2 e 0,74 9) Um relógio indica as horas com um correspondente número de badaladas, ou com uma badalada às meias horas. Um instante é escolhido ao acaso entre 0 e 6 h. Construa a dist distri ribu buiç ição ão de prob probab abililid idad adee de ba bada dala lada dass ou ouvi vida dass no noss 20 mi minu nuto toss se segu guin inte tes. s. R: 1/3 7/18 1/18 1/18 1/18 1/18 1/18 10) De um lote de 15 peças das quais 5 são defeituosas, 4 são escolhidas ao acaso. Seja X o nº de defeit def eituos uosas as enc encont ontrad radas. as. Estabe Estabeleç leçaa a dis distri tribui buição ção de probab probabili ilidad dadee de X, qua quando ndo:: a) as peç peças as forem forem escolhidas com reposição; b) as peças forem escolhidas sem reposição. R: a) 0,1975 0,3950 0,2962 0,0987 0,0123 b) 0,1538 0,4396 0,3296 0,0733 0,0036
11) Uma moeda honesta é lançada sucessivamente até sair cara ou até serem feitos 3 lançamentos. Seja X igual ao número de lançamentos realizados. Calcule sua média, moda, mediana e variância. R: 1,75 1 1 12) Dois tenistas de igual força iniciaram uma partida de 5 “sets” valendo R$50,00. Sendo a partida interrompida, quando um deles vencia por 2 x 0, quanto esse tenista deverá receber do rival para que haja justiça? R: R$43,75 13) Dois tetraedros possuem suas faces numeradas de 1 a 4. Os dois são jogados simultaneamente. Seja X a variável aleatória definida como sendo o produto dos números
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 38
que aparecem nas faces em que os dois tetraedros se apóiam. Calcule a média, a moda, a mediana e a variância dessa variável. R: 6,25 ; 4 ; 4 ; 17,18 14) Sabe-se que uma moeda mostra a face “cara” o quádruplo das vezes do que a face “coroa”, quando lançada. lançada. Esta moeda é lançada 4 vezes. Seja X o nº. de caras que aparece. Determinar Determinar:: a) média; b) variância; c) P (x 2); d) P (1 < x 3). R: 3,2; 0,64; 0,1536; 0,5887 =
Propriedades Propriedades da variância e da esperança A esperança matemática possui as seguintes propriedades 1) E [ x ] = μ 2) E [ k ] = k 3) E [ k x ] = K E [ x ] 4) E [ x ± y ] = E [ x ] ± E [ y ] 5) E [ x.y ] = E [ x ].E [ y ]
As propriedades da variância são: 2 1) E x2 E x σ2 ( x )
2) σ2 (k ) 0 3) σ2 (kx ) k2σ2 ( x) 4) σ2 ( x k ) σ2 ( x) 5) σ2 ( x y ) σ2 ( x) σ2 ( y)
Função de variável aleatória Vam amos os co cons nsid ider erar ar du duas as va variá riáve veis is inde indepe pend nden ente tess "x" "x" e "y" qu quee es este teja jam m relacionadas com uma outra variável "w" dependente delas na forma: w x y Aplica Aplicando ndo as propri proprieda edades des da es esper peranç ançaa e da variân variância cia nes nesta ta exp expres ressã sãoo teremos: μw
μx μy
2 σ 2 σ2 x y
σw
ATENÇÃO: a variância é sempre somada!
Exercícios de aplicação 1) Dadas as distribuições das variáveis aleatórias independentes, x e y mostradas abaixo, calcular a esperança e variância da variável z definida na forma z = 3x + y . R: 8,4 ; 2,28
Variável Aleatória
P(x) x
0,2 1
Prof. M.Sc. Julio Cezar Ribeiro 39
0,3 2
0,5 3
P(y) y
0,1 0
0,3 1
0,6 2
2) De uma barra de alumínio, serram-se 20 corpos de prova, sendo que cada corpo mais a limalha pesam (50 ± 2) g. Sobra um pedaço da barra, pesando (40 ± 12) g . Qual a média e desvio padrão da barra? R: 1040 ± 8 g
3) Uma máquina enche garrafas, garrafas, saindo a produção com peso peso bruto médio de 850g e desvio padrão de 4,5g. As garrafas utilizadas têm peso médio médio de 220g, e desvio padrão de 2,7g. Determine o peso líquido médio e o seu desvio padrão se: a) a máquina pesa o líquido dentro da garrafa; b) a máquina pesa o líquido antes e depois o coloca dentro da garrafa.
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 40
4) Qual o desvio padrão da folga que fica numa prateleira de 22cm de vão onde são guardadas, lado a lado, 10 embalagens de 2cm de largura cada, sabendo-se que o vão da prateleira tem desvio padrão de 1cm e, cada embalagem, desvio padrão de 0,2cm?
Tarefa mínima 1) Sabe Sabe-s -see qu quee E[x E[x ] = 3 e VAR (x ) = 2 e qu quee E [ y ] = 4 e VAR ( y ) = 3. Determine a média média e a variância variância das funções :a) z = 5x + 3y – 4 b) z = 2x – y R: ( 23, 19 19 ) ; ( 2, 7 ) 2) Uma pessoa está querendo ouvir uma melodia que sabe estar gravada em uma das oito faixas de um disco. Como não sabe em qual das faixas está a melodia gravada, ela experimenta a primeira faixa, depois a segunda, e assim sucessivamente, até encontrar a melodia procurada. Qual o número médio e o desvio padrão do número de faixas que que deverá experimentar até encontrar a melodia procurada? R: 4,5; 2,29
3) Um processo de fabricação produz peças com peso médio de 20g e desvio padrão de 0,5g. Estas peças são acon acondicio dicionadas nadas em paco pacotes tes de uma dúzia cada. As emba embalagen lagenss pesam em média média 30g com desvio padrão de 1,2g. 1,2g. Qual a média e desvio padrão do peso peso total do pacote? R: 270 2,1 4) Um rebite é montado num furo; o diâmetro médio dos rebites fabricados vale 12mm e seu desvio padrão 0,2mm; o diâmetro médio dos furos produzidos vale 13 mm e seu desvio padrão 0,5 mm. Chamando de folga a diferença entre o diâmetro do furo e o do rebite, qual a média e o desvio padrão do furo? R: 1; 0,53 5) Um produto tem custo médio de R$10,00 e desvio padrão de R$0,80. Estipular o seu preço de venda médio, bem como seu desvio padrão, de forma que o lucro médio seja de R$4,00 e seu desvio padrão de R$1,00. R: $14,00; $1,28
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 41
6) De fitas metálicas, cuja largura média vale 300mm e desvio padrão 3mm, são retiradas as rebarbas laterais, de largura constante igual a 10mm cada uma, e depois são cortadas doze tiras do tipo A, as quais têm uma largura média unitária de 15mm e desvio padrão 0,8mm, além de quatro tiras do tipo B, as quais têm uma largura média unitária de 20mm e desvio padrão 1,2mm. Supondo que a largura primitiva da fita e das tiras cortadas sejam independentes, calcular a largura média e o desvio padrão dos pedaços de fita que sobram. R: 20mm; 4,73mm 7) Um fundo de investimento recebe diariamente pedidos de compra de cotas de participação, os quais distribuem-se segundo uma média, por pessoa, de 2.000 cotas e desvio padrão de 400 cotas. Por outro lado, os resgates efetuados diariamente distribuem-se segundo uma média, por pessoa, de 1.200 quotas e desvio padrão de 300 cotas. Ao ence en cerra rrarr um dia dia de traba trabalh lho, o, ve verif rific icou ou-s -see qu quee o nú núme mero ro de co cota tass ad adqu quir irid idas as era era de 3.500.000. Sabendo-se que, no dia seguinte, 20 pessoas irão adquirir cotas e outras 15 irão efetuar resgates, e supondo que as compras e os resgates sejam independentes entre si, calcular a média e desvio-padrão do número de cotas já adquiridas pelo fundo, ao final desse outro dia. R: 22.000 2.113 8) Numa chapa são produzidos furos retangulares, cujo comprimento unitário vale em média 200mm, com desvio padrão de 0,6mm. Cada furo deve ser fechado por 4 pinos reta retang ngul ular ares es igua iguais is e po porr 1 ca calç lçoo em ca cada da po pont nta. a. Pret Preten ende de-s -see qu quee a folg folgaa tota totall no comprimento, que é a diferença entre o comprimento do furo e a soma dos comprimentos dos pinos e dos calços, valha em média 4mm, com desvio padrão de 0,8mm. Sabemos que cada calço tem um comprimento constante de 10mm, calcular o comprimento médio unitário dos pinos colocados, bem como o seu desvio padrão. R: 46,5mm; 0,264mm
Trabalho 1) De um lote de 15 peças, das quais 5 são defeituosas, 4 são escolhidas ao acaso. Seja X o nº. de defeit def eituos uosas as enc encont ontrad radas. as. Estabele Estabeleça ça a dis distri tribui buição ção de probab probabili ilidad dadee de X, qua quando: ndo: a) as peç peças as forem forem escolhidas com reposição; b) as peças forem escolhidas sem reposição.
2) Num jogo de dados, A paga R$ 20,00 a B e lança 3 dados. Se sair face 1, em apenas um dos dados, A ganha R$ 20,00. Se sair face 1, em apenas dois dados, A ganha R$ 50,00; e se sair 1, nos 3 dados, A ganha R$ 80,00. Calcular o lucro líquido médio de A por jogada. 3) Um fundo de investimento recebe diariamente pedidos de compra de cotas de participação, os quais distribuem-se segundo uma média, por pessoa, de 2.000 cotas e desvio padrão de 400 cotas. Por outro lado, os resgates efetuados diariamente distribuem-se segundo uma média por pessoa de 1.200 quotas e desvio padrão de 300 cotas. Ao encerrar um dia de trabalho, verificou-se que o número de cotas adquiridas era de 36.000. Sabendose que, no dia seguinte, 20 pessoas irão adquirir cotas e outras 15 irão efetuar resgates, e supondo que as compras e os resgates sejam independentes entre si, calcular a média e desvio-padrão do número de cotas adquiridas pelo fundo, ao final desse outro dia. R: 58.000 2.113 4) Seja x o número de caras, e y o número de coroas, quando são lançadas duas moedas. Calcular Calcular a média e a variância de z, sabendo-se que z = 2x + y .
Variável Aleatória
Prof. M.Sc. Julio Cezar Ribeiro 42
Se não houver vento, reme