Resumo – Elementos de Probabilidades e Estatística
Capítulo 1 – Dados Estatísticos 1.2 •
•
•
•
• •
•
•
•
•
Amostra, População Colecção de Dados : conjunto de observações de certo(s) atributo(s), qualquer que seja a forma como foram recolhidas Categorias Básicas de Dados : a) Dados temporais : dados cujas observações se referem a uma mesma entidade, para vários momentos ou periodos de tempo ; caracterizados essencialmente pela sua ordem cronológica ; a frequência temporal das observações é outro aspecto importante ; descrição da evolução no tempo → série temporal / cronograma ; b) Dados seccionais : dados cujas observações se referem a determinadas entidades (unidades estatísticas) em certo momento ou periodo de tempo ; a característica fundamental é que a ordem das observações é irrelevante irrelevante ; c) Dados seccionais combinados : dados com aspectos seccionais e temporais ; conjunto de dados seccionais, cada um referente a certa data ; comparação de comportamentos entre as datas ; d) Dados de painel : conjunto fixo de entidades observadas em várias datas ; característica essencial → o conjunto de entidades a observar é sempre o mesmo para todas as observações temporais (dificulta a obtenção) / várias observações temporais para a mesma entidade População : conjunto dos elementos cujos atributos são objecto de um determinado estudo conjuntos fundamentais para efectuar análises estatísticas Unidade Estatística : facto ou entidade elementar que é objecto de observação, qualquer que seja a sua natureza Censo / Indagação Completa : análise de todos os elementos de uma população Amostra : subconjunto finito de uma população sobre o qual incide o estudo dos atributos da população (conjunto de unidades estatísticas) Processo de Amostragem : forma de selecção de uma amostra a partir da população ; determinante para a qualidade das inferências ; geralmente aleatório Tipos de Atributos : 1) Atributos Quantitativos : os seus valores determinam as suas intensidades 2) Atributos Qualitativos : a) Representação em Escalas Nominais : atribuição dos valores não tem qualquer significado (ex: “mulher” = 0 ; “homem” = 1) b) Representação em Escalas Ordinais : numeração deve respeitar a ordem das várias modalidades (ex: graus de especialização de 1 a 5) Variável e Dimensão : O valor númerico de um atributo é representado por uma variável . Se a amostra observada tem dimensão (ou seja, elementos), tem-se onde é o valor do atributo da -ésima observação. Tipos de Variáveis : a) Variáveis Discretas : variáveis que podem tomar somente um número finito ou uma infinidade numerável de valores (ex: contagens, escalas nominais/ordinais, etc) b) Variáveis Contínuas : variáveis que podem tomar qualquer valor dentro de um intervalo de números reais (ex: altura, peso, taxas de juro, etc)
( = 1,1,2, … , )
Resumo – Elementos de Probabilid Probabilidades ades e Estatística
1/30
, ,…,
João Marques
1.3 •
•
Gráfico caule-e-folhas Gráfico caule-e-folhas : método semigráfico usado quando a amostra é pequena ; permite que o observador se torne mais sensível ao aspecto global dos dados e comece a explorar a existência de padrões Construção/Elementos dos gráficos caule-e-folhas : Número de folhas : número de dígitos dominados de cada dígito dominante Caule : dígitos dominantes Folhas : dígitos dominados : número total de folhas (dimensão da amostra) unidade : primeiro dígito dominado Excepções : e / dígito dominado : Caules com demasiadas folhas : Valores anormalmente pequenos/grandes : novas linhas rotuladas com “Pe” e “Gr” Número de linhas de um gráfico caule-e-folhas : parte inteira de Propriedades que se podem identificar graças à construção de gráficos caule-e-folhas : a) Existência de valores em torno dos quais se concentram os restantes b) Maior ou menor dispersão dos valores c) Simetrias ou assimetrias d) Presença de valores extremos (“pequenos” e “grandes”)
•
• •
1.4
12+ 12 + 12− 12 −
•
Distribuições de Frequências, Histogramas Frequência Absoluta : número de vezes que um valor de propriedade :
•
Frequência Relativa :
•
•
•
∑ = =
∑ = 1
é observado ; notação:
ℎ = 1 ℎ= −
altura do rectângulo :
ou
• •
Ponto médio de uma classe :
•
;
∩ = ∅ ≠ = = , ℎ = − ( = 1,1,2, … , )
Características Numéricas : Média e Desvio-Padrão Média : (medida de localização)
•
Variável contínua classes de valores : , → os intervalos de classe não têm pontos em comum : da variável deve ser igual à união de todos os intervalos : → o domínio → os intervalos devem ser abertos à esquerda e fechados à direita : → a amplitude deve ser constante : Representação gráfica de distribuições de frequências de variáveis discretas : diagramas de barras Representação gráfica de distribuições de frequências de variáveis contínuas : diagrama de áreas / histograma, formado por uma sucessão de rectângulos adjacentes áreas dos rectângulos = resp. frequências relativas Intervalos de classe com amplitude constante : base do rectângulo : − altura do rectângulo : ou − Intervalos de classe com amplitudes diferentes : base do rectângulo : − −
1.5
; propriedade :
0∗,,,,0∙,1∗, … 2√
= ⋯ = ∑ = + ℎ = = ∑ = ∑ ∑ ( ) − = 0
Média (de dados agrupados em classes) : Propriedade da Média : A soma dos desvios em relação à média é nula.
Resumo – Elementos de Probabilid Probabilidades ades e Estatística
2/30
João Marques
1.3 •
•
Gráfico caule-e-folhas Gráfico caule-e-folhas : método semigráfico usado quando a amostra é pequena ; permite que o observador se torne mais sensível ao aspecto global dos dados e comece a explorar a existência de padrões Construção/Elementos dos gráficos caule-e-folhas : Número de folhas : número de dígitos dominados de cada dígito dominante Caule : dígitos dominantes Folhas : dígitos dominados : número total de folhas (dimensão da amostra) unidade : primeiro dígito dominado Excepções : e / dígito dominado : Caules com demasiadas folhas : Valores anormalmente pequenos/grandes : novas linhas rotuladas com “Pe” e “Gr” Número de linhas de um gráfico caule-e-folhas : parte inteira de Propriedades que se podem identificar graças à construção de gráficos caule-e-folhas : a) Existência de valores em torno dos quais se concentram os restantes b) Maior ou menor dispersão dos valores c) Simetrias ou assimetrias d) Presença de valores extremos (“pequenos” e “grandes”)
•
• •
1.4
12+ 12 + 12− 12 −
•
Distribuições de Frequências, Histogramas Frequência Absoluta : número de vezes que um valor de propriedade :
•
Frequência Relativa :
•
•
•
∑ = =
∑ = 1
é observado ; notação:
ℎ = 1 ℎ= −
altura do rectângulo :
ou
• •
Ponto médio de uma classe :
•
;
∩ = ∅ ≠ = = , ℎ = − ( = 1,1,2, … , )
Características Numéricas : Média e Desvio-Padrão Média : (medida de localização)
•
Variável contínua classes de valores : , → os intervalos de classe não têm pontos em comum : da variável deve ser igual à união de todos os intervalos : → o domínio → os intervalos devem ser abertos à esquerda e fechados à direita : → a amplitude deve ser constante : Representação gráfica de distribuições de frequências de variáveis discretas : diagramas de barras Representação gráfica de distribuições de frequências de variáveis contínuas : diagrama de áreas / histograma, formado por uma sucessão de rectângulos adjacentes áreas dos rectângulos = resp. frequências relativas Intervalos de classe com amplitude constante : base do rectângulo : − altura do rectângulo : ou − Intervalos de classe com amplitudes diferentes : base do rectângulo : − −
1.5
; propriedade :
0∗,,,,0∙,1∗, … 2√
= ⋯ = ∑ = + ℎ = = ∑ = ∑ ∑ ( ) − = 0
Média (de dados agrupados em classes) : Propriedade da Média : A soma dos desvios em relação à média é nula.
Resumo – Elementos de Probabilid Probabilidades ades e Estatística
2/30
João Marques
∗
•
Moda ( ) : valor com maior frequência Classe modal : classe com maior frequência Variância : (medida de dispersão)
•
Variância corrigida (quando a amostra tem dimensão pequena) :
•
Desvio-Padrão :
•
Variância (para dados classificados) :
•
Variância corrigida (para dad. class.) :
•
Variância (forma simplicifada) :
•
Desvio-absoluto médio :
• •
•
1.6 • •
= ∑ ( − ) = ∑ ( − ) = √ = ∑ ( − ) = ∑ ( − ) = ∑ − =∑ − ∑ ∑ = − = − = ∑ ( − ) = ∑ () − = ∑ | − | = ∑ − = ou
ou
Coeficiente de Variação : ; observações com sinal positivo / independente da unidade em que se exprime a variável / permite comparação entre distribuições Características Numéricas : Estatísticas da Ordem Extremos : ; Mediana : valor da colecção que tem de observações inferiores e
() = ( ()
( () = ( ) 50% 50% = 2 + 1 ))() = (() ) = 2 ( ) 1 − ( ) = 1 + −1 − 1 ∈∉ ℤℤ == () + − = (1 − ) + () () () () ) () ) 0 ≤ < 1 +4 3 +3 +2 1 +1 3+1 4 = =()−−()
de
observações superiores ; •
•
Quantil de ordem : valor da colecção que tem observações superiores ; calcula-se a ordem: , → se , → se Quartis : Quartis Ordem aproximada
observações inferiores e ; , onde
é a parte inteira é a parte fraccionária
1º quartil : Mediana :
3º quartil : • • • •
•
Amplitude do Intervalo de Variação : (medida de dispersão absoluta) Amplitude do Intervalo de Interquartis : (medida de dispersão absoluta) Uma medida de dispersão relativa (qdo todas as obs. têm o mesmo sinal) : Resumo dos 5 números : mínimo, 1º quartil, mediana, 3º quartil, máximo Gráfico : caixa-de-bigodes caixa formada por 1º e 3º quartis − mediana atravessa a caixa − “bigodes” → mínimo e máximo − caixa contém das observações −
50%
() ∈ () = + − − ∗ − + +⋯+
Estimativa da estatística de ordem − − − −
∗ ℎ
:
: limite inferior da classe ; : frequência absoluta acumulada até à classe : amplitude da classe ; : frequência absoluta da classe ;
Resumo – Elementos de Probabilid Probabilidades ades e Estatística
3/30
:
, onde:
;
João Marques
∈ = ×+ ∗ ℎ ℎ = √ × .× × / × × × × × × × ×× × × × × × × × ) <> −3( − ) +3( − )< ( ) −3( − < −1, 5 − ( )< ) +1, 5 − < +3( − ) −3( − ) +3( − ( ) −1, 5 − +1,5( −)
•
Estimativa do quantil
•
Amplitude dos intervalos de classe :
•
1.7 •
•
:
Principais medidas de localização e de dispersão : Medidas Localização Dispersão absoluta Dispersão relativa Atributo quantitativo Atributo qualitativo nominal Atributo qualitativo ordinal Outliers Outlier Severo :
é um outlier severo quando
Outlier Moderado :
ou é um outlier moderado quando ou
• • • • •
1.8
Barreira externa inferior : Barreira externa superior : Barreira interna inferior : Barreira interna exterior : Caixa-de-bigodes (modificada) : → bigodes : barreiras internas superior e inferior → outliers moderados/severos representados por símbolos gráficos diferentes
•
Correlação Covariância :
•
Coeficiente de correlação de Pearson : →
= ∑( −)( −) = ∑∑(( )()−) = = ∑( ) ∑() −1 ≤ ≤ −1 ou
CC mede o grau de associação linear → sinal → correlação positiva ou negativa → valor absoluto → intensidade da associação linear → CC próximo de dados dispostos essencialmente nos 1º e 3º quadrantes (linear) → CC próximo de dados dispostos essencialmente nos 2º e 4º quadrantes (linear) Coeficiente de correlação de Spearman : Substitui-se cada par é substituído pelo par , onde representa a ordem de na colecção. Calcula-se o coeficiente de correlação com a fórmula habitual. mesmos valores → média das ordens − outliers podem influenciar CC → retirar outliers − →
•
(∘,∎)
1−1 (),() ()
Resumo – Elementos de Probabilidades e Estatística
( ) ,
4/30
João Marques
Capítulo 2 – Probabilidades 2.1 •
2.2 •
•
•
•
•
•
2.3 •
Introdução Experiência aleatória : Diz-se que uma experiência é aleatória se apresentar as seguintes características: a) O conjunto dos resultado possíveis é fixado antecipadamente; b) O resultado da experiência nunca pode ser previsto de forma exacta, mesmo que se desenvolvam todos os esforços para manter sob controlo as circunstâncias relevantes para o resultado. Espaço de resultados / Acontecimentos Espaço de resultados ou Espaço-amostra : conjunto fundamental (não vazio) formado por todos os resultados que hipoteticamente é possível obter quando se efectua uma determinada experiência aleatória Acontecimento : subconjunto do espaço formados por um só elemento → Acontecimentos elementares : subconjuntos Realização de um acontecimento : Ao efectuar a experiência aleatória associada com , diz-se que o acontecimento se realiza, se o resultado da experiência é um ponto que pertence a : Álgebra dos acontecimentos : Implicação de acontecimentos : Identidade de acontecimentos : ( ) ; União de acontecimentos : ( ) Intersecção de acontecimentos : ; e são incompatíveis sse Acontecimentos incompatíveis / mutuamente exclusivos : a realização de um implica a não realização do outro (acontecimentos disjuntos) são incompatíveis sse ) Acontecimento impossível : (exemplo : e (para qualquer da experiência aleatória tém-se ) Acontecimento certo : Diferença de acontecimentos : ( ) Acontecimento contrário/complementar : ; ; Propriedades das operações definidas sobre acontecimentos : 1) Associatividade : ; 2) Comutatividade : ; 3) Distributividade : ; 4) Leis de Morgan : ; Operações sobre infinidades numeráveis de acontecimentos : 1) União numerável : 2) Intersecção numerável :
⊂ Ω ∈
() Ω ⊂ Ω
Ω
(( ⊂= )< = >( ∈ = > ∈ ) )< = > ( ∈ < = > ∈ ) = ∪Ω = Ω ∪∩ = := ∈:∨∈ ∈∧ ∈∪∅ ∩∅ = ∅ ∩Ω = ∅ ∩ = ∅ Ω − = ∩ = : ∈ ∧ ∉ ∈ Ω = : ∉ ∪ = Ω ∩ = ∅ = ∪( ∪)=( ∪)∪ ∩( ∩)=( ∩)∩ ∪ = ∪ ∩ = ∩ ∩(=∪)=( ∪ ∩ ∩)∪( ∩ =∩) ∪ ∪( ∩)=( ∪)∩( ∪)
Medida de Probabilidade. Axiomática de Kolmogorov Medida de probabilidade : função que a cada acontecimento , faz corresponder um número real, , probabilidade do acontecimento , que verifica os 3 axiomas seguintes : P1) P2) P3) Se e forem acont. incompatíveis, , então forem acontecimentos em número finito numerável, → P3*) Se dois a dois incompatíveis, , então
( )
, ⊂ Ω
((Ω)= )≥ 01 ,,,…,,… ∩ = ∅ ( ∪)= ( )+() ∩ = ∅( ≠ ) = ∑
Resumo – Elementos de Probabilidades e Estatística
5/30
João Marques
•
2.4 •
•
• •
•
2.5 •
•
•
•
•
Propriedades da medida de probabilidade : 1) 2) 3) 4) 5) 6)
((∅)= )= 01−( ) ( −)= ()−( ∩) )+()−( ( ⊂∪)= ( ∩) )≤ ⇒ ( () ( )≤ 1
Interpretações do conceito de probabilidade Regra de Laplace : Sejam os acontecimentos elementares equiprováveis, então temos
º á ( )= = #() = #(Ω) º í
Como reconhecer que os casos são igualmente possíveis? 1) O princípio da indiferença faz apelo às propriedades de simetria ou de homogeneidade da situação experimental (se o dado é perfeito, porque seriam umas faces preferidas em detrimento de outras?); 2) O princípio da razão insuficiente diz que se não há razão para crer em que qualquer dos casos é mais provável do que os outros, pode actuar-se como se todos os casos fossem igualmente prováveis. Lei dos grandes números : As propriedades das frequências relativas verificam a axiomática de Kolmogorov : E1) E2) E3) Se e forem acont. incompatíveis, então Probabilidade subjectiva (grau de credibilidade) : aproximação quantitativa à credibilidade que se atribui a um determinado acontecimento. (deve respeitar o princípio da coerência)
lim→ (| ( )−( )|< )= 1
((Ω)= )≥ 01
( ∪)= ( )+()
Métodos de contagem Regra fundamental da contagem : Suponha-se que uma experiência aleatória é composta por etapas. Se na primeira etapa há casos possíveis, na segunda etapa há casos possíveis, …, na -ésima etapa há casos possíveis, então o número total de resultados da experiência aleatória, combinando as etapas é . Amostra ordenada : Se elementos são seleccionados de um conjunto de elementos e se a ordem da selecção é registada, o conjunto de elementos forma uma amostra ordenada de dimensão . Amostragem sem reposição : Quando se selecciona um elemento e o mesmo não é reposto no conjunto, diz-se que se seguiu um processo de amostragem sem reposição. Amostragem com reposição : Um processo de amostragem com reposição ocorre quando se selecciona um elemento e o mesmo é reposto no conjunto antes de se seleccionar o elemento seguinte. Conceitos fundamentais de Análise Combinatória : Arranjos (sem repetição) :
× ×…×
! = ()! = = = ! ! = = = !()!
Arranjos completos (com repetição) : Permutações :
Combinações :
Permutações de elementos não todos distintos :
Resumo – Elementos de Probabilidades e Estatística
(coeficiente binomial)
6/30
! !!…! (coeficiente multinomial)
João Marques
2.6 • •
•
•
•
•
Probabilidade Condicionada. Teorema de Bayes
( |= ∩
>0 = ×| ∩=× | + ∩∩= ×|×|∩ , , , … , ,… = ∑ =1 ∩ =∅≠ =Ω , , , … , , … >0 =1, 2 , … , , … =∑ ×| , , , … , , … >0 =1, 2 , … , , … |= ×| =1, 2 , … , , …>0 ∑ ×| ∑∑ |×| =1 = | | probabilidade ∝ probabi l i d ade × v erosi m i l h ança ∝ × ∩= |= >0 |= >0 ∩== × =0 =1 ∩∩= ×× ∩=× ∩= × ∩∩= ∩= × ×× ∩|= |×| =Ω Probabilidade Condicionada :
se
Regra da multiplicação de probabilidades : acont. (Ex: ) → Generalizável para 3 ou Partição do espaço de resultados : Diz-se que a classe de acontecimentos é uma partição de quando e → Consequência : Regra da Probabilidade Total : Se é uma partição de e se , vem, para qualquer acontecimento , Teorema de Bayes : Se é uma partição de , vem, para qualquer acontecimento , a verificar
e se ,
Nota 1 : Nota 2 : Interpretação do Teorema de Bayes : → Probabilidade a priori : → Probabilidade a posteriori : para cada : → Verosimilhanças de
→ “proporcional a”
2.7 •
•
•
•
•
•
Acontecimentos Independentes Acontecimentos independentes : Dois acontecimentos, e , do mesmo espaço de resultados, dizem-se independentes, se e só se Teorema : Se e forem acontecimentos independentes, então se ; se Nota sobre o Exemplo 2.38 (Lançamento de uma moeda regular/viciada) : A igualdade verifica-se apenas nos casos triviais, e , e no caso simétrico, (moeda “regular”). Assim, e podem ser ou não independentes, consoante a natureza da moeda. Casos com 3 (ou mais) acontecimentos : Os acontecimentos , e podem ser independentes dois a dois e não se verificar ou vice-versa. Independência completa ou mútua : Os acontecimentos , e do mesmo espaço de resultados dizem-se completamente independentes ou mutuamente independentes se e só se: , , , Nota : Definição extensível a quatro ou mais acontecimentos. Independência condicional : Dois acontecimentos, e , são independentes condicionalmente em relação a um acontecimento se e só se Nota : A independência condicional não implica independência no sentido corrente a não ser, obviamente, quando .
Resumo – Elementos de Probabilidades e Estatística
7/30
João Marques
Capítulo 3 – Variável Aleatória / Função de Distribuição 3.1 •
3.2 •
•
•
•
•
3.3 • •
Variável Aleatória Variável Aleatória : Uma variável aleatória contradomínio . Assim:
ℝ
∶ ∈ Ω → ()∈ ℝ
, é uma função com domínio
Função de Distribuição Função de Distribuição : A função real de variável real,
()= ( ≤ )
Ω
e com
ℝ
, com domínio , definida por
designa-se por função de distribuição da variável aleatória . Propriedades da Função de Distribuição : 1) 2) é não decrescente: 3) e 4) , 5) é contínua à direita: 6) , Acontecimentos com probabilidade zero : Estes acontecimentos têm probabilidade zero, mas não são impossíveis. Exemplo: “Obter na escolha de um número real qualquer no intervalo ”. Voltar a calhar é praticamente impossível, daí ser um acontecimento com probabilidade zero. Mais Propriedades da Função de Distribuição : a) b) c) d) e) f) Teorema : A função real de variável real, , é uma função de distribuição se e só se verifica as propriedades 2, 3 e 5.
0 ≤ ()≤ 1 Δ > 0 ⇒ ()≤ ( +Δ) (−∞)= l i m ()= 0 (+∞)= l i m ()= 1 → → ( < ≤ )= ()−() ∀,: > ( = )= ()−((−0)+0)=∀li∈mℝ→ ()= () 3,4 (( <> )= (−0) )= 1−() (( <≥ )=< )= 1−(( −0) −0)−() ( ≤ < )= ( −0)−( −0) ( ≤ ≤ )= ()−( −0)
Classificação das Variáveis Aleatórias Conjunto dos Pontos de Descontinuidade : Classificação das Variáveis Aleatórias : é uma variável aleatória discreta se e só se , ou seja, se e só se a soma dos saltos da função de distribuição for igual a 1. A ssim:
= ∶ ( = )= ( )−( −0)> 0 ( ∈ )= 1 ( ∈ )=∑∈ ( == )∅ = 1 ()= () ∀ ∈ ℝ
é uma variável aleatória contínua se e só se variável real , não negativa, tal que
e se existe uma função real de
, uma função de distribuição associada a uma variável aleatória discreta, , e Seja outra função de distribuição carterizadora de uma variável aleatória contínua, . Diz-se que é uma variável aleatória mista se e só se a respectiva função de distribuição puder ser escrita do seguinte modo: , onde Existem variáveis aleatórias que não são nem discretas, nem contínuas nem mistas. A) Variáveis Aleatórias Discretas Nota : Uma variável aleatória é discreta quando toda a massa de probabilidade está • concentrada nos pontos de descontinuidade da função de distribuição.
()= ()+(1−)()
Resumo – Elementos de Probabilidades e Estatística
8/30
0<<1
João Marques
•
)> 00 ∉∈ ()= (( == )=
Função Probabilidade : A função aleatória discreta se e só se:
→
chama-se função probabilidade da variável
Suporte da Distribuição : Subdomínio de ; valores de que pertencem a ; habitualmente, refere-se a função probabilidade apenas para os valores do suporte
(()= ∈ )= ()=∑ () ∈∩ ( ≤ )=∑ () ∀ ∈ ℝ () = ,(),… ()= () 0() (nos pontos onde exi s te deri v ada) ()= (nos outros pontos) = (+∞)−(−∞)= 1 ()= () ( ∈ )= () =, < () = ( < ≤ () = = ()= ) = () −() ( = )= 0 ( < ≤ )= ( ≤ < )= ( < < )= ( ≤ ≤ ) < () () ()= ()+(1−)() 0 < < 1 = ( ) = () = →
, com ou . → É indiferente representar-se uma v.a. discreta por B) Variáveis Aleatórias Contínuas Função Densidade de Probabilidade : A função , tal que • chama-se função densidade de probabilidade ou simplesmente função densidade. →
,
→
→ → → →
Se , com , tem-se Devido à continuidade da função de distribuição, pode escrever-se:
, e
, com
É indiferente representar-se uma v.a. discreta por ou . C) Variáveis Aleatórias Mistas Variável Aleatória Mista : Seja uma função de distribuição associada a uma • variável aleatória discreta, , e outra função de distribuição carterizadora de uma variável aleatória contínua, . Diz-se que é uma variável aleatória mista se e só se a respectiva função de distribuição puder ser escrita do seguinte modo: , onde →
3.4 •
•
Funções de uma variável aleatória Mudança de Variável : Seja uma variável aleatória, e considere-se uma função é também uma variável aleatória que assume o valor quando . Conhecida a função de distribuição de , , pretende-se determinar a função de distribuição de , . Ao substituir a variável aleatória pela variável aleatória , está a efectuar-se uma mudança de variável. → Utilidade : facilita a interpretação e o tratamento quando da variável aleatória original Caso 1 : Variável Aleatória Discreta : Conjunto dos pontos que assume com probabilidade positiva : ; − Função Probabilidade de : , para Caso 2 : Variável Aleatória Qualquer : Função de Distribuição de : onde − Condição suficiente para que uma variável aleatória seja também contínua : Seja , onde é uma variável aleatória contínua e é uma função real de variável real com domínio em ; supõe-se que este domínio contém o conjunto dos valores assumidos por com densidade positiva. Se tem derivada não nula em todos os pontos do seu domínio e é estritamente monótona em , então é uma variável aleatória contínua. −
•
•
= ∶ ()= , ∈ = () ()= ( = )= ( ∈ )=∑∈ () ∈ ()= ( ≤ )== (∗ ) ∗ = ∶ ()≤ = ( )
Resumo – Elementos de Probabilidades e Estatística
9/30
João Marques
3.5 •
•
•
•
•
•
3.6 •
• •
Variáveis Aleatórias Bidimensionais Variável Aleatória Bidimensional : Uma variável aleatória bidimensional, função com domínio e com contradomínio . Assim,
ℝ
Ω ( ,)∶ ∈ Ω → (),()∈ ℝ ( ) , ℝ , ( ,,)(,)= ( ≤ , ≤ )
, é uma
Função de Distribuição Conjunta : Seja uma variável aleatória bidimensional. A função real de duas variáveis reais, , com domínio , definida por , é a função de distribuição de , ou função de distribuição conjunta das variáveis e . Propriedades da Função de Distribuição Conjunta : 1) 2) é não decrescente, separadamente, em relação a e em relação a : e 3) e 4) 5) é contínua à direita, separadamente, em relação a e em relação a : , Função de Distribuição Marginal : A função definida por designase por função de distribuição marginal da variável aleatória . A função dada por é a função de distribuição marginal da variável aleatória . Variáveis Aleatórias Independentes : Considere-se uma variável aleatória bidimensional . Sejam e dois acontecimentos quaisquer tais que envove apenas , e refere-se apenas a . As variáveis aleatórias e são independentes se e só se
0 ≤ (,)≤ 1 ) Δ > 0 ⇒ (,)≤ ( +Δ, Δ > 0 ⇒ (,)≤ (,+Δ) )= (−∞, (, − ∞)= 0 (+∞, + ∞)= 1 ()= ( < ≤ , < ≤ )= (,)−(,)−(,)+(,) ( +0,)= (,) (,+0)=()= (,),(,+∞) ()= ,(+∞,) ( ,) ( ∈ , ∈,)=(,)= ( ∈() )(()∈ ) = ( ) = ()
ou então Teorema : Se e são variáveis aleatórias independentes, e se e são duas funções, então as variáveis aleatórias e são também independentes. Variáveis Bidimensionais Discretas Variável Aleatória Bidimensional Discreta : é variável aleatória bidimensional discreta se e só se e são variáveis aleatórias discretas. Conjunto dos Pontos de Descontinuidade : Função Probabilidade Conjunta : Seja é variável aleatória bidimensional discreta. A função real de duas variáveis reais, , com domínio , definida por
( ) , ( = ,)∶ ( = , = )> 0 ( ) , ℝ , ( ,,)(,)= ( = , = ) )> 00 (,)∈ (,)= (( == ,, == )= (,)∉ ∑(,)= (,)∈ (,) = 1 ( ,)∈ =∑(,)∈∩ (,) ( ≤ , ≤ )=∑ ∑ (,) ( ) , = ∶ ( = )= ()−( −0)> 0 ( = )> 0 ∈ ()= ( = )= 0 ∉ ( = )> 0 ∈ ()= ( = )= 0 ∉ = ∶ ( = )= ()−( −0)> 0
é a função probabilidade de → → → •
( ,)
, ou função probabilidade conjunta das variáveis
e .
;
Função Probabilidade Marginal : Considere-se uma variável bidimensional discreta, Seja a função de distribuição marginal de , e
.
o conjunto dos pontos de descontinuidade de . A função probabilidade marginal de , , é definida da seguinte maneira:
Do mesmo modo se define a função probabilidade marginal de ,
,
onde
Resumo – Elementos de Probabilidades e Estatística
10/30
João Marques
→
()= ( = )=∑∈ ( = , = ) =∑∈ ,(,) ,(,)= () ()
A função probabilidade marginal de obtém-se somando, para cada probabilidade conjunta para todos os :
idem para Teorema : As variáveis aleatórias discretas, →
•
•
, a função
e , são independentes se e só se
isto é, se e só se a função probabilidade conjunta for igual ao produto das funções probabilidade marginais. Função Probabilidade Condicionada : Seja a função probabilidade conjunta de e . A função probabilidade de condicionada pela realização do acontecimento , com , é dada por:
,
=
( = )> 0 , , |= =|== , =
| = =>0 , , = ==|== , ∑∈ | =1 ∑∈ | =1 |= >0 |= >0 , , , ,,= ,,, ∀,∈ℝ , ,+∞,+∞= , , =1 , ,= , = = ,, = = ,, ,,= , , = >0 |= ,, |= = ,, >0 | =1 ,, <<|== | = ( fixo)
De modo análogo, a função probabilidade de condicionada pela realização do acontecimento , com , é dada por: ( fixo)
→ →
3.7 •
•
e
;
, se
Variáveis Bidimensionais Contínuas Variável Aleatória Bidimensional Contínua : A variável aleatória , com função de distribuição , é uma variável aleatória bidimensional contínua se e só se existe uma função real de duas variáveis reais, não negativa, , tal que , Função Densidade Conjunta : A função (introduzida na definição anterior) chama-se função densidade de ou função densidade conjunta de e → →
•
Se
e são independentes, então , se
Se a função densidade
for contínua no ponto
, então
Funções Densidade Marginais : A função densidade marginal de ,
, é dada por
De forma análoga,
•
•
é a função densidade marginal de , . Teorema : As variáveis aleatórias e dizem-se independentes se e só se
isto é, se e só se a função densidade conjunta for igual ao produto das funções densidade marginais. Função Densidade Condicionada : Seja a função densidade conjunta de e . A função densidade de condicionada por , com , é definida da seguinte maneira: ( fixo)
A função densidade de
condicionada por
, com
, é dada por:
( fixo)
→
→
Resumo – Elementos de Probabilidades e Estatística
11/30
João Marques
→
Factorização da Funç. de Dens. Conj. : Fórmula de Bayes para Densidades :
,(,)= () |= |
|= | = || >0 = ,≥2 … , = , … , ≤ , … , ≤ −∞,, … , =⋯=, , … , − ∞=0 +∞,+∞,…,+∞=1 = ,= … , ,< … , , + ∞, … , + ∞ ,+∞,…,+∞= ≤= , … , =,,= , … , = … , … , = , … , =1, … , = , … , , … , = … , … , … →
, com
3.8 • •
Distribuições Multidimensionais Vectores Aleatórios : Variáveis Aleatórias -dimensionais (com Função de Distribuição : A função de distribuição de de variáveis reais definida por → → →
)
,
, é a função real
é não decrescente e contínua à direita em relação a cada variável ; A noção de função de distribuição marginal abrange agora não só as situações unidimensionais mas também todos os possíveis subconjuntos das variáveis. Exemplo 1 : Seja , com , então −
Exemplo 2 : Vectores Aleatórios Independentes : Os vectors aleatórios e dizem-se independentes se e só se ou seja, se e só se a função de distribuição conjunta é igual ao produto das funções de distribuição marginais. Variáveis Aleatórias Independentes : As variáveis aleatórias dizem-se independentes se e só se Variável Aleatória -dimensional Discreta : é variável aleatória dimensional discreta se e só se as variáveis aleatórias , com , são discretas. → As restantes propriedades das variáveis aleatórias discretas são generalizáveis. Variável Aleatória -dimensional Contínua : A variável aleatória -dimensional , onde é a respectiva função de distribuição, é contínua se e só se existe uma função real de variáveis reais, não negativa, , a verificar −
•
•
•
•
→
As restantes propriedades das variáveis aleatórias discretas são generalizáveis.
Capítulo 4 – Distribuições Discretas 4.2 •
quando
•
= =∑∈ ∑∈|| <+∞
Valor Esperado Valor Esperado de uma Variável Aleatória Discreta : Se com função probabilidade , a expressão
é uma variável aleatória discreta
(4.2) define o valor esperado, média ou esperança matemática de . → centro de gravidade da distribuição → parâmetro de localização Valor Esperado de uma Função de uma Variável Aleatória Discreta : Se aleatória discreta com função probabilidade , a expressão
∑ = ∈ ∑∈ =∑∈ < = >=
é o valor esperado de →
é uma variável
, impondo-lhe uma condição semelhante a (4.2)
Resumo – Elementos de Probabilidades e Estatística
12/30
João Marques
•
•
•
Propriedades do Valor Esperado : 1) Se é uma constante, então 2) Se é uma constante e se existe , então e 3) Se existirem , então Outra Propriedade : O valor esperado de uma combinação linear de funções de variável aleatória é a respectiva combinação linear dos valores esperados:
()=( ) ( )= ( ) ( ) ( ) ( )+( )= ( )+( ) ∑ ( )= ∑ ( ) ( +)=( ()= )+() ( )() = =∑ () ∈ = ( )=∑ ∈ () < = ( −) =∑∈( −) () ( −) = ( −) =∑∈( −) () )= ( ( )≥ 0 ( )= 0 < = > ( = )= 1 ()= 0 ( ) ()= ( +)= ( ) ( )= ( )− ) = + ( = = = () => 00 < 0 ( +)+( )+() Resultados Importantes : e são duas variáveis aleatórias discretas, então Se
4.3 •
•
•
•
Se
e
são duas variáveis aleatórias discretas independentes , então
Momentos Momento de Ordem
em Relação à Origem : O valor esperado,
se existir, é o momento de ordem em relação à origem, ou momento ordinário de ordem da variável aleatória . → Nota : valor esperado Teorema : Se existe o momento ordinário de ordem de uma variável aleatória, então também existe o momento ordinário de ordem , com , da mesma variável aleatória. Momento de Ordem em Relação à Média : O valor esperado, se existir, é o momento de ordem em relação à média, ou momento central de ordem da variável aleatória . Variância : Designa-se por variância de o valor esperado, se existir, de ,
; em torno da média → parâmetro de dispersão da distribuição de Propriedades da Variância : 1) Se é uma constante, 2) Se é uma constante, 3) Se e são constantes, Fórmula mais operacional para o cálculo da variância : Desvio Padrão : Ao valor positivo da raíz quadrada da variância, , chamase desvio padrão da variável aleatória . → medida de dispersão absoluta Coeficiente de Variação : Considere-se uma variável aleatória com suporte contido no cpnjunto dos números reais positivos. O coeficiente de variação de é igual, se existir, ao quociente entre o desvio padrão e a média, →
•
• •
•
→ •
•
medida de dispersão relativa
Coeficiente de Assimetria : O quociente , se exisir, é designado por coeficiente de assimetria da variável aleatória . sse a distribuição é simetrica − sse os desvios positivos dominam − sse os desvios negativos dominam − Variância de Variáveis Aleatórias Independentes : Se e são duas variáveis aleatórias discretas independentes, então
Resumo – Elementos de Probabilidades e Estatística
13/30
João Marques
4.4 •
•
Funções Geradoras Sucessões Importantes : Sucessão das probabilidades : Sucessão dos momentos em relação à origem : Sucessão dos momentos em relação à média : Função Geradora das Probabilidades : Seja uma variável aleatória discreta assumindo, com probabilidade positiva, os valores do conjunto . Seja com a verificar A função geradora das probabilidades de é a função real de variável real, , definida por → → →
•
,,,… = ,,…,,… = 0, ,…, ,… = 0,1,2,… = ( = ) = 0,1,2,… ∑ = 1 Π )=∑ ()= Π ( =)=( =(1)=∑ )= ()!() (( )=Π Π(1)+Π(1)−Π (1) > 0 () )=∑ ( ∈ − < < ()= ( ) (0)=∑∈ () = ( ) 0 ()= () − < <
Função Geradora dos Momentos : Seja uma variável aleatória discreta com função probabilidade . Se existir um número real , tal que existe para
, então
define a função geradora dos momentos de , → •
•
•
4.5 •
Teorema : A função geradora dos momentos, se existir numa vizinhança de , determina univocamente a função de distribuição ; inversamente, se existir, a função geradora dos momentos é única. Formalizando: Se para cada uma das variáveis aleatórias e , existe função geradora dos momentos, e se para algum intervalo , então e possuem a mesma função de distribuição (e a mesma probabilidade, no caso de as variáveis aleatórias serem discretas). Relação entre a Função Geradora dos Momentos com a Função Geradora das Probabilidades : Teorema : Se e são variáveis aleatórias discretas independentes, com funções geradoras dos momentos e , então a função geradora dos momentos existe, e é dada pela expressão:
)= Π( )< = > Π()= ln() ()= ( () () + ()= ()()
Distribuição Uniforme Distribuição Uniforme : Seja uma variável aleatória discreta com Diz-se que segue uma distribuição uniforme nos pontos , com se a função probabilidade é dada por
∈ ()= 0 ∉
= , ,…, = 1,2,…,
. , se e só
a função probabilidade é constante para um número finito de pontos → a distribuição é simetrica Principais características da Distribuição Uniforme : Valor Esperado : →
•
.
( )= = ∑ = ∑ ( )= ∑ − ()= ∑
Momento de Ordem
em relação à Origem :
Variância :
Função Geradora dos Momentos :
Resumo – Elementos de Probabilidades e Estatística
14/30
João Marques
•
4.6 •
Casos Particulares Importantes : 1) Ex: Lançamento de um dado perfeito : 2) Ex: Obtenção de um dos 10 dígitos :
= 1, 2 , … , =0,1,2,…,
Distribuição de Bernoulli / Distribuição Binomial Prova de Bernoulli : Experiência aleatória em que se observa a realização (sucesso; ou a não realização (insucesso; ) de determinado acontecimento probabilidade .
=0
( )=
•
•
1− =1 (|=0 =0 | = 1− = 0, 1 0<<1 ~1; 2== = = =1− 1− = ==1−+ =1 =0 = 1− =0,1,2,… , 0<<1 |= 0 ~; 2== =−1 + = =1− 1− = ==1−+ ~ ; ~; ⇒ = +~; = +
= 1
) com
Distribuição de Bernoulli : Se a variável aleatória tem função probabilidade dada por com para , diz-se que tem distribuição de Bernoulli. Simbolicamente, Principais características da Distribuição de Bernoulli : Valor Esperado : Momento de Ordem em relação à Origem : Variância : Desvio Padrão : Coeficiente de Assimetria : Função Geradora dos Momentos : Sucessão de Provas de Bernoulli Independentes : Sucessão de experiências aleatórias independentes em cada uma das quais se observa a realização (sucesso; ) ou a não realização (insucesso; ) de determinado acontecimento com probabilidade , constante de prova para prova. Distribuição Binomial : Se a variável aleatória tem função probabilidade dada por
•
•
, para
•
,
diz-se que tem distribuição binomial. Simbolicamente, Principais características da Distribuição Binomial : Valor Esperado : Momento de Ordem em relação à Origem : Variância : Desvio Padrão :
Coeficiente de Assimetria : Função Geradora dos Momentos : Teorema : Sejam e duas variáveis aleatórias independentes. Então , onde .
•
4.7 •
•
Distribuição Geométrica / Distribuição Binomial Negativa Nova perspectiva : Realizar provas de Bernoulli até que se dê um sucesso. O número de provas é que passa a ser aleatório. Distribuição Geométrica : Quando a variável aleatória tem função probabilidade dada por
=1, 2 ,… = 1− 0
diz-se que tem distribuição geométrica ou distribuição de Pascal. → A sucessão das probabilidades forma uma progressão geométrica de razão
Resumo – Elementos de Probabilidades e Estatística
15/30
1−
.
João Marques
•
•
||< ) ()=∑ 1 = b) ()=∑ = () c) ()=∑ ( −1) = () Principais características da Distribuição Geométrica : ∑Valor Esperado (|) = 1 : ( )= = Variância : ( )= = √ Desvio Padrão : = > 0 (enviesamento positivo) Coeficiente de Assimetria : = √ , com (1−) < 1 Função Geradora dos Momentos : ()= ( )= () Algumas Propriedades : −(1−) ( ≤ ≤ )=(1−) Se → +∞, ( ≥ )=(1−) Se = 1, ( ≤ )= 1−(1−) Propriedades da Série Geométrica de razão : a) (série absolutamente convergente para
•
→ → → •
• • •
Função de Distribuição de uma Variável Aleatória com Distribuição Geométrica :
()=01−(1−) <≤ 1 ≤ +1 = 1,2,… ( > | > )= ( > −) −1 = , +1, +2,… 0 < < 1 (|)=0 −1(1−) ~(;) ( )= =() ( )=() = = = √ > 0 (1−) < 1 ()= ()= () ~( ;) ~( ;) ⇒ = + ~(;) = + ~(1;) = 1,2,…, ⇒∑ ~(;)
para Propriedade da “Falta de Memória” : Nova perspectiva : Realizar provas de Bernoulli independentes até obter sucessos. Distribuição Binomial Negativa : Uma variável aleatória com função probabilidade dada por , para
•
•
•
diz-se que tem distribuição binomial negativa. Simbolicamente, Principais características da Distribuição Binomial Negativa : Valor Esperado :
Variância :
Desvio Padrão :
Coeficiente de Assimetria :
Função Geradora dos Momentos :
Teorema : Sejam
e
.
, com
duas variáveis aleatórias independentes. Então ,
onde . Corolário : se , independentes sucessos é o mesmo que → Interpretação do Corolário : Realizar provas até aparecerem realizar provas até aparecer o primeiro sucesso, continuar até aparecer o segundo, e assim sucessivamente, até aparecer o -ésimo sucesso.
Resumo – Elementos de Probabilidades e Estatística
16/30
João Marques
4.8 •
Distribuição Hipergeométrica Distribuição Hipergeométrica : Se a variável aleatória por
(|,,= 0
tem função probabilidade dada
∈ ∉ , , =∶0, −−≤≤ ,~, = ∑ |,, =1= = =∙ ∙ ∙ =1−
com diz-se que tem distribuição hipergeométrica. Simbolicamente •
Principais características da Distribuição Hipergeométrica :
4.9 •
Valor Esperado : Variância :
Distribuição de Poisson Processo de Poisson : Suponha-se que se procede à contagem do número de acontecimentos (chegada de doentes, “chegada” de avarias, chegada de navios, etc) ocorridos ao longo do tempo. Tem-se um processo de Poisson com parâmetro quando se verificam as seguintes condições: → O número de acontecimentos que ocorrem em dois intervalos disjuntos são independentes; → A probabilidade de ocorrer exactamente um acontecimento em qualquer intervalo de amplitude arbirtariamente pequena é aproximadamente ; → A probabilidade de ocorrerem dois ou mais acontecimentos em qualquer intervalo de amplitude arbirtariamente pequena é aproximadamente igual a zero. Distribuição de Poisson : Uma variável aleatória com função probabilidade dada por
>0
•
•
Δ Δ
=0,1,2, … >0 |= 0! ~
, com
,
diz-se que tem distribuição de Poisson. Simbolicamente, Principais características da Distribuição de Poisson :
∑ ! =1 = −1 = = =√ = =⁄ ! =0,1,2, … >0 =|= | = ~ ⇒ = +~ ~ = + = →0 = lim→ 1− = !
Função Geradora dos Momentos : Valor Esperado : Variância : Desvio Padrão : Coeficiente de Assimetria : Distribuição de Poisson e Intervalos de Tempo :
•
Δ
e
, , para duas variáveis aleatórias independentes. Então ,
•
Teorema : Sejam
•
onde . Lei dos Acontecimentos Raros : A génese da distribuição de Poisson, a partir do processo de Poisson, mostra que, quando
mantendo-se fixo
, a binomial tende
para Poisson,
Resumo – Elementos de Probabilidades e Estatística
17/30
João Marques
, ,
4.10 Valor Esperado e Momentos de Variáveis Aleatórias Bidimensionais Discretas Valor Esperado de Função de Variável Aleatória Bidimensional : Se é uma variável • aleatória bidimensional discreta com função probabilidade , e se é uma função de , a expressão
,
é o valor esperado de •
•
•
=∑ , (,)∈ ,) , (,) (,)
. Tal como no caso unidimensional, tem de se verificar
∑ (,)∈|(,)| , (,) < +∞ ( , ,) ) ( () )+() ( +)= ( , ) ( () )() ( )= ( ( ,) + = ( )=∑ +(,)∈ ,(,) ( ,) == 1,0, == 01 ⟹⟹ == (()= )= == 2,1, == 01 ⟹⟹ == (( )) = 0, = 2 ⟹+ = () ( ,) = ( −)( −) =∑(,+)∈( −)(−) ,(,) ( ,) == 1,0, == 01 ⟹⟹ == 00 == 2,1, == 01 ⟹⟹ == (( −)( −) =−)( )= = 0, = 2 ⟹ = ( −)= ()= ( ,)= , = ( −)(−) )= )() ( , ( )−( (,)= ()−( )= 0 ( ) , (( −−)()( − )> 0 −)< 0 (,) = , , = ()()
Teorema : Se probabilidade
for uma variável aleatória bidimensional discreta com função , e se existirem e , então
Teorema : Se e forem variáveis aleatórias discretas e independentes, com função probabilidade conjunta , e se existirem e , então Momentos de Ordem em Relação à Origem : Seja bidimensional discreta. O valor esperado, define, se existir, um momento de ordem aleatória . → Momentos de primeira ordem :
uma variável aleatória
em relação à origem (ordinário) de variável
− − →
Momentos de segunda ordem : − − −
•
Momentos de Ordem em Relação à Média : Seja bidimensional discreta. O valor esperado, define, se existir, um momento de ordem aleatória . → Momentos de primeira ordem (são nulos) :
uma variável aleatória
em relação à média (central) de variável
− − →
Momentos de segunda ordem : − − −
•
Covariância : A covariância das variáveis aleatórias
e
é
,
se este valor esperado existir. → → •
•
Interpretação do Sinal e da Grandeza da Covariância : → Centro de gravidade da distribuição conjunta : → 1º e 3º quadrantes → 2º e 4º quadrantes Coeficiente de Correlação : O coeficiente de correlação entre as variáveis aleatórias é dado por
Resumo – Elementos de Probabilidades e Estatística
18/30
e
João Marques
•
•
±= ± ,+ ±= + = , = , = | = = ,| = =∑∈ , | | | = = , = =∑ , ∈ | ,= | ==∑ ∈ | ,= | = =∑ ∈ | = , | = = = | = | | = = −| = | = =∑∈−| = = | | ==== −| =−| | = | == =∑∈ − | = | | = = | = − | = = |+| ,= ,| | == | = = + +⋯+ − − … − =,== ≠ ⋯⋯ = ⋮ ⋮ ⋯ ⋮ = =
Teorema : Se duas variáveis aleatórias, e , são independentes, então a respectiva covariância é igual a zero. → A independência implica não correlação, mas a recíproca não é verdadeira. Teorema : Se existem segundos momentos para as variáveis aleatórias e , então Em particular, se as variáveis são independentes,
•
Valor Esperado Condicionado : Seja a variável aleatória aleatórias discretas e . O valor esperado de definido por
, função das variáveis condicionado por ,é
se se verificar a condição habitual de existência do valor esperado. De modo análogo se define Se , , → Se Teorema : O valor esperado de valor esperado condicionado por , →
•
, se existir, é igual ao valor esperado do seu
Se , regra do valor esperado iterado (→ v.e. marginal) Variância Condicionada : A variância de condicionada por é definida por →
•
Do mesmo modo se define a variância de
condicionada por
,
→ → •
•
•
Teorema : Se existe
, então
Teorema : A covariância entre condicionado por ,
(Variância Marginal) é igual à covariância entre e o valor esperado de
e
Independência em Média : A variável aleatória é independente em média da variável aleatória se e só se , qualquer que seja A variável aleatória é independente em média da variável aleatória se e só se , qualquer que seja
4.11 Valor Esperado de Momentos de Variáveis Aleatórias -Dimensionais Discretas Momento de Ordem em Relação à Média : • •
Momentos Centrais de 2ª Ordem : Variância : Covariância :
•
Matriz das Covariâncias :
•
Coeficiente de Correlação entre
Resumo – Elementos de Probabilidades e Estatística
e
:
19/30
João Marques
⋯ 1 ⋯ 1 = ⋮ ⋮ ⋯ 1⋮ = = = = , , … , = !,!,…,!! ⋯ ! ⋯ × … 1− − −⋯− = = 1− = 1− ,= =−= − ≠
•
Matriz das Correlações do Vector Aleatório
•
Relação entre a Variância e a Matriz das Covariâncias :
•
Relação entre a Matriz das Covariâncias e a Matriz das Correlações :
Nota:
e
:
são matrizes de coeficientes
4.12 Distribuição Multinomial Distribuição Multinomial : Se uma variável aleatória • probabilidade dada por
•
-dimensional tem função
, para as probabilidades positivas, diz-se que tem distribuição multinomial. Principais características da Distribuição Multinomial : Valor Esperado : Variância : Desvio Padrão : Covariância :
Coeficiente Correlação :
Capítulo 5 – Distribuições Contínuas 5.2 •
Valor Esperado Valor Esperado de uma Variável Aleatória Discreta : Se com função densidade , a expressão quando
= || < +∞
é variável aleatória contínua
(5.2) define o valor esperado, média ou esperança matemática de . → centro de gravidade da distribuição → parâmetro de localização •
•
=
Valor Esperado de uma Função de uma Variável Aleatória Discreta : Se é uma variável aleatória contínua com função densidade , e é uma função real de variável real. A expressão é o valor esperado de , impondo-lhe uma condição semelhante a (5.2) Propriedades do Valor Esperado : As propriedades do valor esperado para variáveis aleatórias contínuas são as mesmas do que as propriedades para variáveis aleatórias discretas. Apenas é necessário substituir as somas por integrais.
Resumo – Elementos de Probabilidades e Estatística
20/30
João Marques
5.3 •
Momentos Momento de Ordem
= =
em Relação à Origem : O valor esperado,
= = < = − = − = = − = − − = = + = = + + = = = = −3 0<<1 = <= > ℰ = ℰℰ ℰ, = 0,5 ==0,0,525 ℰ,ℰ=, = ℰ, = 0,25 = 0,75 ℰ, ℰ, =∗ 0,75 ≤∗ ∀ ∈ ℝ = ℰ, − ℰ, × ×∗ × / ×× × ×
•
se existir, define o momento de ordem em relação à origem, ou momento ordinário de ordem da variável aleatória . Nota : valor esperado Teorema : Se existe o momento ordinário de ordem de uma variável aleatória, então também existe o momento ordinário de ordem , com , da mesma variável aleatória. Momento de Ordem em Relação à Média : O valor esperado,
•
se existir, é o momento de ordem em relação à média, ou momento central de ordem da variável aleatória . Variância : A variância de uma variável aleatória contínua é dada por
•
parâmetro de dispersão da distribuição de Propriedades da Variância : →
•
em torno da média
→
→ → • •
• •
5.4 •
Desvio Padrão : Coeficiente de Variação :
fórmula mais operacional para o cálculo da variância , se e são independentes medida de dispersão absoluta medida de dispersão relativa
Coeficiente de Assimetria : Coeficiente de Kurtosis : O coeficiente de kurtosis de uma variável aleatória , se existir, é definido por → excesso de kurtosis : Parâmetros da Ordem Quantil : Seja uma variável aleatória contínua, e , um número real a verificar . Quantil de ordem , , é um valor de que satisfaz a condição
medida de localização
→
Mediana :
→
1º Quartil :
→
→
3º Quartil : → Moda : Seja uma variável aleatória contínua. Moda, , é um valor de que verifica a condição , Nota: A moda não é um parâmetro da ordem, contudo trata-se de uma importante medida de localização. Amplitude Interquartis : (medida de dispersão absoluta) Uma medida de dispersão relativa : →
•
• • •
Principais medidas de localização e de dispersão : Medidas Localização Dispersão absoluta Dispersão relativa
Resumo – Elementos de Probabilidades e Estatística
21/30
João Marques
5.5. •
>0
Função Geradora dos Momentos Função Geradora dos Momentos : Seja densidade . Se existir um número real
existe e é finito para
uma variável aleatória contínua com função , tal que
= − < <
=
, então
define a função geradora dos momentos de . a) Existe uma correspondência biunívoca entre função geradora dos momentos (quando existe) e função densidade b) 5.6 •
•
Distribuição Uniforme Distribuição Uniforme : Diz-se que uma variável aleatória contínua, , tem distribuição uniforme no intervaalo , com , quando a função densidade é dada por
Simbolicamente, . Principais características da Distribuição Uniforme :
Função de Distribuição :
Função Geradora dos Momentos :
Expressão Geral dos Momentos em Relação à Origem :
Média :
Variância : Coeficiente de Assímetria é nulo : Transformação Uniformizante : a) Seja uma variável aleatória contínua com função de distribuição estritamente crescente no intervalo aberto onde tem densidade positiva (este intervalo pode ser ilimitado, isto é, pode acontecer ou ; tem-se e ). Então a variável aleatória tem distribuição . b) Seja uma variável aleatória contínua com distribuição , e a função de distribuição de uma variável aleatória contínua. Supõe-se que é estritamente crescente no intervalo aberto onde esta variável aleatória tem densidade positiva (o intervalo pode ser ilimitado, isto é, pode acontecer ou ; tem-se e ). Então a variável aleatória é contínua com função de distribuição .
•
= , < << |, = 0 ~, 0 < << |, = 1 ≥ ≠0 = = =1 = 0 = = = = = = 0 , = −∞ = +∞ = 0 = 0,10,1 = 1 , = −∞ = +∞ = = 0 = 1
Resumo – Elementos de Probabilidades e Estatística
22/30
João Marques
5.7 •
| ,= √ − − −∞<< +∞ ∈ ℝ >0 ~, ~,|,= − − √ = 0 = 1 = √ ⁄ ⁄ Φ= √ 0, 1 ~, = , = 0,1 = − Φ=~1−Φ, − ⁄ = ~ , = + = = = !! = = 3 <3>3 = 3
Distribuição Normal Distribuição Normal : Diz-se que a variável aleatória tem distribuição normal com parâmetros e quando a função densidade é da forma com
onde • •
e
. Simbolicamente
Função de Distribuição de
Caso Particular Importante : Função Densidade :
.
:
e
Função de Distribuição :
•
Distribuição Normal Estardadizada : A distribuição estandardizada se e . Simetria : é simetrica em relação à recta → ; → Função Geradora dos Momentos de :
•
Função Geradora dos Momentos de
•
Valor Esperado e Variância :
•
Expressão Geral dos Momentos Centrais de Ordem Par :
•
Coeficiente de Kurtosis :
•
•
•
•
•
•
:
;
Interpretação do excesso de kurtosis : a) Distribuição leptokurtica : caudas mais “espessas” b) Distribuição platilurtica : caudas mais “finas” c) Distribuição mesokurtica : distribuição normal Intervalos e Probabilidades da Distribuição Normal : Intervalos Probabilidades 0,6826 0,9544 0,9973 0,5000 0,9000 0,9500 0,9900 Teorema : Se as variáveis aleatórias são independentes, então onde
•
é uma distribuição normal
±±2 ± 0,±63745 ±± 11,,69450 6 00 ± 2,5758 = 1,2, … , ~, ⟹ =∑ ~, =∑ =∑ = 1,2, … , ~, ⟹ = 1=∑,2, …, ~, ∑ ⟹ ~, = ~,
e → Qualquer combinação linear de variáveis aleatórias independentes com distribuição normal tem ainda distribuição normal. Corolário : Se as variáveis aleatórias são independentes e identicamente distribuídas, então Corolário : Se as variáveis aleatórias distribuídas, então
Resumo – Elementos de Probabilidades e Estatística
são independentes e identicamente
23/30
João Marques
•
onde e
5.8
2 = 1, , … , = = = ,= ≠ =∑ ~, =∑ = +2+ +2+2 +⋯+2 +⋯+2 … + ≤0 |= 0 >0 ~ 0 ≤0 |= 1− >0 = < = 1− =
Teorema : Se as variáveis aleatórias , então
são normais tais que
,
•
Distribuição Exponencial Distribuição Exponencial : A variável aleatória
•
diz-se que tem distribuição exponencial (ou exp. negativa). Simbolicamente, Principais Características da Distribuição Exponencial :
Função de Distribuição :
Função Geradora dos Momentos :
Valor Esperado :
Variância : Coeficiente de Variação : Coeficiente de Assimetria : Coeficiente de Kurtosis : Não tem Moda porque
Mediana :
Teorema : Se
são variáveis aleatórias independentes, então
Distribuição Gama ; Distribuição do Qui-Quadrado Função Gama (factorial generalizado) : Função real de variável real que faz corresponder a cada número real positivo, , o número real definido por
Γ>=0 > 0 = Γ = = > 1 Γ −1∙ Γ −1 Γ = −1 ! = 1 1= Γ Γ = √ ≤0 0 |, = >0 >0 >0, ~ =1
Propriedades da Função Gama : a) Substituindo por , obtém-se b) Com , integrando por partes, obtém-se c) Se (inteiro positivo), tem-se mas d)
•
e o domínio é aberto.
enviesamento positivo →
•
•
,
é decrescente com
Propriedade da “Falta de Memória” :
•
.
= = 1 = =9 2 | < = = ⟹ > +ℎ| > > ~ , , … , ~ ⟹ min ~
•
5.9
com função densidade definida por
Distribuição Gama : Uma variável aleatória
com função densidade dada por , com
e
diz-se ter distribuição gama de parâmetros e . Simbolicamente, . cai-se no caso particular da distribuição exponencial. → Nota : Quando
Resumo – Elementos de Probabilidades e Estatística
24/30
João Marques
•
• •
Função Geradora dos Momentos :
,
Momentos em Relação à Origem : Valor Esperado : Variância :
Coeficiente de Variação :
Coeficiente de Assimetria : Coeficiente de Kurtosis :
Se , não tem Moda ; Se , Moda : , verifica-se sempre Se Teorema : Sejam e duas variáveis aleatórias independentes. Então , , Generalizando para variáveis aleatórias independentes, tem-se , , , tem-se → Quando, em particular, , ou seja, a soma de variáveis aleatórias indepenentes com distribuição exponencial, com o mesmo , tem distribuição gama com parâmetros e .
•
= =1−… = < = = = = = √ = =3+√ ≤> 11 > 1 = = ∗ < < ∗ ~; ~; ⟹ = +~; = + ~; =1, 2=, …1, =⟹1,2 ,…=∑, ~; =∑ ~ = 1,2, … , ⟹ =∑ ~; | , = ! ~ 0 ≤0 | = >0 = 1,2, … = = ~ < = >~ ; ~~ ; ⟹ √ 2− 2− √ 2−12~0,1 ⟺ = = 2 = = = 3+ < =1−2 ~ ~ ⟹ = +~ = + ~ = 1,2, … , ⟹ =∑ ~ =∑
Principais Características da Distribuição Exponencial :
Tempo de Espera pelo -ésimo acontecimento (Poisson) :
Distribuição do Qui-Quadrado : Diz-se que a variável aleatória tem distribuição do quiquadrado com graus de liberdade ( inteiro positivo), simbolicamente , quando a respectiva função densidade é dada por , para
Nota : A distribuição do qui-quadrado é uma distribuição gama com
•
→
Principais Características da Distribuição do Qui-Quadrado : Valor Esperado : Variância :
Coeficiente de Variação :
Coeficiente de Assimetria : Coeficiente de Kurtosis :
Função Geradora dos Momentos : com Teorema : Sejam e duas variáveis aleatórias independentes. Então , , Generalizando para variáveis aleatórias independentes, tem-se , ,
•
,
Métodos de Cálculo : →
•
e
Resumo – Elementos de Probabilidades e Estatística
25/30
João Marques
•
~0,1 ⟹ = ~ 1 ~,⟹ ∑ ~ , , = 1− > 0 > 0 = , , 1,1 = 1 = , , = 1− 0<<1 , |, = 0 >0 >0 ~,
Teorema : Seja ou
uma variável aleatória. Então
5.10 Distribuição Beta Função Beta : Função real de duas variáveis reais, fazendo corresponder a cada par de • números reais positivos , um número real definido por com e Propriedades da Função Beta • a) b) c) As funções gama e beta estão relacionadas do seguinte modo : d) •
Distribuição Beta : A variável aleatória
com função densidade dada por , para
•
•
diz-se que tem distribuição beta. Simbolicamente Principais Características da Distribuição Beta :
Momentos em Relação à Origem :
Valor Esperado :
Variância :
Coeficiente de Variação :
Coeficiente de Assimetria :
Coeficiente de Kurtosis :
e
,
.
= … …
= = = = =
=< >> 0 > 0 =1 =1
Forma/Simetria : distribuição simétrica → → distribuição assimétrica positiva → cauda longa à direita → distribuição assimétrica negativa → cauda longa à esquerda e → distribuição unimodal → → →
e distribuição uniforme outros valores de e não tem moda
= =
5.11 Teorema do Limite Central Interpretação do Teorema do Limite Central : O Teorema do Limite Central garante que a • soma de variáveis aleatórias independentes, todas com a mesma média e a mesma variância, tem, depois de estandardizada e para valores de suficientemente grandes, distribuição aproximada, . Teorema da Continuidade : Considere-se a sucessão de variáveis aleatórias, • , ou com Sejam e , com , as respectivas sucessões de funções de distribuição e de funções geradoras dos momentos [supõe-se que existem para ]. Então, se e , a sucessão tende para a função de distribuição que tem como função geradora dos momentos.
0,1 = 1,2,… ∑ , + , … , + +⋯+ , … = 1,2, … | |< > 0 0→ 1 → > 0
Resumo – Elementos de Probabilidades e Estatística
26/30
João Marques
•
, , … , , … → +∞ = ∑0,√ 1 0,1 ~0,1 ∑ lim→≤ = ≤∑=lim→≤ ≈Φ√ ≤ = Φ √ , , … , ,… ∑ = = 1− ~0,1 ≤ ≤ = Φ >20 − Φ ≤ ≤ ≈ Φ − Φ = = = = − ≤≤ + = Φ − Φ
Teorema do Limite Central : Dada a sucessão de variáveis aleatórias independentes e identicamente distribuídas ( iid ), , com média e variância , então, quando , a função de distribuição da variável aleatória, tende para uma função de distribuição aproximada de
é
, ou seja, a distribuição assintótica ou
. Simbolicamente,
.
Outras formulações : →
( grande)
→ •
Corolário : Dada uma sucessão de variáveis aleatórias iid , distribuição de Bernoulli de média e , vem
→ •
Correcção de Continuidade : para
Caso particular
•
Regras práticas orientadoras do cálculo de probabilidades que envolvem a distribuição binomial : → Sempre que possível, deve utilizar-se directamente a distribuição binomial, o que permite o cálculo exacto das probabilidades recorrendo a meios computacionais. ), o cálculo aproximado das probabilidades → Quando necessário (sempre para deve atender aos seguintes casos: Se , deve utilizar-se a aproximação da binomial pela Poisson; − Se , deve usar-se a Poisson considerando o acontecimento complementar − Se , deve recorrer-se à fórmula da correcção da continuidade − se afasta de , são necessárias amostras com Nota importante : À medida que dimensão cada vez maior, uma vez que a distribuição binomial se torna mais assimétrica. Corolário : Se é uma variável com distribuição de Poisson, , então
•
,
:
≤0 1 , ≥0 , 9 0,1 <<0,9
•
, com
>20
0,5 ~ l i m ≤ = Φ → √ 0,1 → +∞ √ ~ > 20 ≤ ≤ ≈ Φ √ − Φ √
Outra formulação : …
Correcção de Continuidade : para
Resumo – Elementos de Probabilidades e Estatística
quando ,
27/30
João Marques
, ,
5.12 Valor Esperado e Momentos de Variáveis Aleatórias Contínuas Valor Esperado de Função de Variável Aleatória Bidimensional : Se • variável aleatória bidimensional contínua, com função densidade , e se de , a expressão
,
• • •
for uma é uma função
,=, , ,, + += = + , = += , ,, == 0,1, == 10 ⟹⟹ == = = == 2,1, == 10 ⟹⟹ == = = 0, = 2 ⟹+ , ,, = − − + = −− , == 0,1, == 10 ⟹⟹ == 00 == 2,1, == 10 ⟹⟹ == − −=− = = 0, = 2 ⟹ = − = = ,= , = −− = , − ,= − = 0 , = , , = ±= ± ,+ ±= +
define o valor esperado de , desde que se verifique a já referida condição de existência do valor esperado. Teorema : … Teorema : … Momentos de Ordem em Relação à Origem : Seja uma variável aleatória bidimensional contínua. O valor esperado, define um momento de ordem em relação à origem de → Momentos de primeira ordem :
.
− − →
Momentos de segunda ordem : − − −
•
Momentos de Ordem em Relação à Média : Seja bidimensional contínua. O valor esperado,
define um momento de ordem em relação à média de → Momentos de primeira ordem (são nulos) :
uma variável aleatória
.
− − →
Momentos de segunda ordem : − − −
•
Covariância : A covariância das variáveis aleatórias
e
é
,
se este valor esperado existir. → → •
•
•
Coeficiente de Correlação : O coeficiente de correlação entre as variáveis aleatórias é dado por
e
Teorema : Se duas variáveis aleatórias, e , são independentes, então a respectiva covariância é igual a zero. → A independência implica não correlação, mas a recíproca não é verdadeira. Teorema : Se existem segundos momentos para as variáveis aleatórias e , então Em particular, se as variáveis são independentes,
Resumo – Elementos de Probabilidades e Estatística
28/30
João Marques
•
= , = , = | = = ,| = = , | , | | | = = , = = | ,= | ,= = = | = = = ,| = | = = | = |= =−| = −| = | = | = = =|= =− |− | = | = = | | = −| = | = = | = = | = − | =
Valor Esperado Condicionado : Seja a variável aleatória aleatórias contínuas e . O valor esperado de definido por
, função das variáveis condicionado por ,é
se se verificar a condição habitual de existência do valor esperado. De modo análogo se define →
Do mesmo modo se define a variância de
→ →
, se existir, é igual ao valor esperado do seu
Se , regra do valor esperado iterado (→ v.e. marginal) Variância Condicionada : A variância de condicionada por é definida por →
•
,
Se , Teorema : O valor esperado de valor esperado condicionado por , →
•
Se
condicionada por
,
Os resultados da secção 4.11 ainda são válidos para variáveis aleatórias -dimensionais contínuas (matrizes das covariâncias e das correlações, etc).
5.13 Distribuição Normal Bidimensional Distribuição Normal Bidimensional : Se a variável aleatória bidimensional • função densidade é da forma
•
,,|,,, ,,= , − × , − 2, + , ∈ ℝ ∈ ℝ ∈ ℝ > 0 > 0 −1≤ , ≤ 1 ,, =1 = = = = ,= ,, = = 1 = = 0 ,,= − , −2 + = − − = − − , = 0
com , , , , e distribuição normal bidimensional. Principais Características da Distribuição Normal Bidimensional :
•
Valor Esperado (marginal) : ; ; Variância (marginal) : Coeficiente de Correlação : Covariância : Distribuição Normal Bidimensional Estandardizada : Se
•
Função Densidade Marginal :
,
tem
, diz-se que tem
e
,
;
•
Teorema : Se é uma variável aleatória normal bidimensional, então independentes se e so se e forem não correlacionados .
Resumo – Elementos de Probabilidades e Estatística
29/30
e
são
João Marques