INTRODUCTION Dalam bab ini kita akan membahas tentang distribusi normal multivaria t dan beberapa sifat-sifatnya. Dalam Bagian 2.2 akan dibahas hal mendasar dari distribusi multivariat : definisi fungsi kepadatan multivariat, distribusi marginal, distribusi bersyarat, nilai harapan, dan moment. Dalam Bagian 2.3 distribusi normal multivariat didefinisikan : parameter yang menunjukkan mean, variansi, dan kovarian atau mean, variasi, dan korelasi dari komponen vektor acak. Dalam Bagian 2.4 menunjukkan kombinasi linear dari variabel normal dengan distribusi normal dan distribusi marjinal normal. Dalam Bagian 2.5 kita melihat bahwa distribusi bersyarat juga normal dengan mean fungsi linear dari vari abel kondisional : koefisien - koefisien regresi. Varians, kovarian, dan korelasi disebut korelasi parsial adalah konstanta. Koefisien korelasi berganda adalah korelasi maksimum antara variabel acak skalar dan kombinasi linear variabel acak lainnya, itu adalah ukuran dari hubungan hubungan antara satu variabel dan satu himpunan lainnya. Dalam Bagian 2.6 karakteristik fungsi, moment, dan kumulan.
2.2. Pengertian Distribusi Multivariat 2.2.1. Distribusi bersama bersama Dalam bagian ini kita akan membahas pengertian distribusi gabungan dari beberapa variabel, yang berasal dari distribusi distribusi marjinal subset subset dari variabel, variabel, dan distribusi bersyarat. bersyarat. Probabilitas Probabilitas didefinisikan dengan variabel yang diperoleh dengan operasi yang melibatkan fungsi distribusi kumulatif (cdf),
* + ∫ ∫ + **+ ∫ ∫ * + ∫ ∫ (1)
didefinisikan untuk setiap pasangan bilangan real ( x, x, y). y). Kasus dimana F(x, dimana F(x, y) kontinu y) kontinu mutlak, ini
berarti turunan parsialnya parsialnya ada di mana-mana: mana-mana: (2)
,
dan (3)
Fungsi non-negatif f(x, non-negatif f(x, y) disebut y) disebut kepadatan X kepadatan X dan dan Y . Pasangan variabel acak (X,Y) mendefinisikan (X,Y) mendefinisikan
titik acak. Probabilitas (X,Y) persegi (X,Y) persegi panjang adalah (4)
. Probabilitas titik acak (X,Y) untuk (X,Y) untuk semua himpunan E himpunan E dimana dimana integral
didefinisikan (setiap himpunan terukur E terukur E ) adalah
(5)
Diikuti definisi integral [seperti penjumlahan limit (4)]. Jika f (x,y) adalah kontinu di kedua variabel,
*+ ∫ ∫ |*+ | ( )* + ∫ ∫ ( ) elemen probabilitas
y dan
adalah aproksimasi probabilitas X antara x dan
dan Y antara
karena
(6)
untuk beberapa Karena
dari teorema nilai mean di kalkulus.
kontinu, persamaan (6) adalah aproksimasi
Faktanya, (7)
Sekarang kita pertimbangkan kasus p variabel acak
. cdfnya adalah
(8)
didefinisikan untuk setiap himpunan bilangan r eal
. Fungsi kepadatan, jika
kontinu mutlak, adalah
(9)
)
(hampir di mana-mana), dan (10)
.
Kemungkinan jatuh semua himpunan R di p-dimensi Ruang Euclid adalah
( ) { } ( ) Elemen probabilitas
adalah aproksimasi probabilitas jika
kontinu.
Moment bersama didefinisikan sebagai (12)
DISTRIBUSI NORMAL MULTIVARIAT Fungsi kepadatan normal univariat dapat ditulis (1)
dimana positif dan k dipilih sehingga integral dari (1) masuk di sumbu-x adalah unit. Fungsi densitas distribusi normal multivariat X 1 , .., X p memiliki bentuk analog. Variabel skalar x diganti dengan vektor (2)
konstanta skalar digantikan oleh vektor (3)
dan konstanta positif digantikan oleh definit positif (simetris) matriks (4)
Persegi (5)
digantikan oleh bentuk kuadrat
Dengan demikian fungsi kepadatan dari distribusi normal p-variat adalah (6)
( ) () ()
dimana dipilih (K > 0) sehingga integral di seluruh p-dimensi Ruang Euclides dari Kita amati bahwa (7)
adalah kesatuan. adalah nonnegatif. Karena A adalah definit positif,
dan karena kepadatan dibatasi, yaitu, (8)
Sekarang kita tenentukan K sehingga intergal dari (6) p-dimensi satu ruang. Kita harus mengevaluasi (9)
∫ ∫
Kita gunakan fakta bahwa jika A adalah positif , pasti terdapat matriks nonsingular C sehingga (10) di mana I menunjukkan identitas dan C' transpos dari C . Misal (11) dimana (12)
kemudian (13) Jacobian dari transformasi tersebut adalah
(14) dimana modi CI menunjukkan nilai absolut dari determinan C. Jadi (9) menjadi (15)
|| ∫ ∫
Kita punya (16)
|| ∫ ∫ ||∏ *∫ + ||∏*√ + ||
dimana exp(z) = (17)
. Kita dapat menulis (15) sebagai
berdasarkan (18)
Sesuai dengan (10) adalah persamaan determinan
karena
(20) Dan karena (21) Jadi (22)
| | |||| | | || || ⁄ | | ⁄ | | ||
(19)
kita menyimpulkan dari (19) bahwa mod
Fungsi kepadatan normal adalah (23)
Sekarang kita akan menunjukkan b dan A dengan mencari momen pertama dan kedua
(24)
Ini akan mudah untuk menentukan variabel acak sebagai pembentuk vektor acak
Kita akan mendefinisikan secara umum matriks acak dan nilai yang diharapkan dari sebuah matriks acak; vektor acak dianggap sebagai kasus khusus dari matriks acak dengan satu kolom.
Definisi 2.3.1.
(25)
Suatu Matriks acak Z adalah matriks
()
dari variabel acak
Jika variabel-variabel acak
hanya dapat mengambil bilangan hingga, matriks
acak Z merupakan salah satu dari matriks hingga, katakanlah probabilitas
adalah
Jika variabel-variabel acak
Jika
maka kita definisikan sebagai
Kemudian
memiliki identitas bersama, maka dengan operasi
jumlah Rieman dapat didefinisikan sebagai limit (jika limitnya ada) dari jumlah aproksimasi yang terjadi dalam kasus diskrit
Definisi 2.3.2. Nilai yang diharapkan dari matriks acak Z adalah
(26) Khususnya jika Z adalah X didefinisikan oleh (24), nilai yang diharapkan
(27)
adalah mean atau rerata vektor X. Kami biasanya akan menunjukkan ini vektor oleh
. Jika Z adalah
nilai yang diharapkan adalah
(28) kovarians atau matriks kovarians dari elemen X. diagonal ke i dari matriks ,
adalah varian dari
dan i, j dari diagonal elemen,
dari
. Kami biasanya menunjukkan matriks kovarians oleh
dan
adalah kovarians
bahwa
, Perhatikan
(29) Operasi mengambil nilai yang diharapkan dari matriks acak (atau vektor) memenuhi aturanaturan tertentu yang kita dapat meringkas dalam le mma berikut:
Lemma 2.3.1. Jika Z adalah matriks acak
matriks riil (30)
, dan F adalah matriks riil
, D adalah matriks riil
, maka
, E adalah
Buktinya elemen dalam baris ke-i dan kolom ke-j dari
adalah
(31)
yang merupakan elemen dalam baris ke-i dan kolom ke-j dari
Lemma 2.3.2. Jika
(32)
, di mana X adalah vektor acak, maka
(33) Bukti Penegasan pertama berikut langsung dari Lemma 2 .3.1, dan kedua dari (34)
yang menghasilkan sisi kanan (33) oleh Lemma 2.3.1. Ketika transformasi sesuai dengan (11), yaitu X = CY + b, maka Jika (35)
. Dengan teori transformasi yang diberikan dalam Bagian 2.2, densitas
∏*√ +
Nilai harapan dari komponen i dari Y adalah (36)
Persamaan terakhir tersebut
adalah fungsi ganjil
Oleh karena itu, mean X dinotasikan dengan adalah (37)
Dari (33) kita melihat bahwa (38)
. Jadi
. i, j anggota dari
adalah
karena kepadatan Y adalah (35). Jika i = j, kita punya (39)
Persamaan terakhir tersebut karena setelah ekspresi terakhir adalah nilai harapan kuadrat variabel terdistribusi normal dengan mean 0 dan varians 1. Jika i (40)
j, (38) menjadi
Karena integrasi pertama memberikan 0. Kita dapat meringkas (39) dan (40) sebagai (41) Jadi (42) -1
-1
-1
Dari (10) kita peroleh A = (C ') C dengan perkalian (C ') di sebelah kiri -1
dan C di sebelah kanan. Mengambil invers di kedua sisi persamaa yang diberikan (43)
CC'= A-1
Dengan matriks kovarians dari X adalah (44)
Dari (43) kita tahu bahwa adalah definit positif.
Teorema 2.3.1.
Jika kepadatan p-dimensi acak vektor X adalah (23), maka nilai harapan dari X adalah b dan matrik
kovarians adalah A-1. Sebaliknya, diberikan a vektor dan a matriks definit positif , ada kepadatan normal multivariat
|| | (45)
sehingga nilai harapan dari vektor dengan kepadatan dan matrik kovarians adalah . Notasi kepadatan (45) sebagai
dan distribusi sebagai
. Diagonal i elemen matriks kovarians
, adalah varian dari komponen i dari X , kadang-kadang dapat ditunjukkan dengan
korelasi antara X i dan X j didefinisikan sebagai (46)
Koefisien
Hubungan assosiatif simetris di X i dan X j: (47)
. Karena
adalah definit positif (Corollary A.l.3 dari Lampiran), determinan (48)
positif. Oleh karena itu, -1 <
, i = 1, ..., p, varians
< 1. Kepadatan normal multivariat mendapat parameter dengan mean
, i = 1, ..., p, dan korelasi
, i < j ; i, j = 1, ..., p.
Kasus khusus dari teori sebelumnya, kita pertimbangkan distribusi normal bivariat. Vektor mean (49)
matriks kovarians dapat ditulis (50)
di mana
adalah varian dari X1,
(50) adalah (51)
varians dari X2, dan korelasi antara X1 dan X2. Invers dari
Fungsi kepadatan X1 dan X2 adalah (52)
Teorema 2.3.2.
Koefisien korelasi dari sebarang distribusi bivariat adalah invarian terhadap transformasi
, i = 1,2. setiap fungsi dari parameter distribusi normal bivariat yang invarian
dengan transformasi adalah fungsi dari . Bukti.
Varians dari
adalah
, i = 1,2, dan kovarians dari
dan
2.3.2. Penyisipan nilai-nilai ke dalam definisi korelasi antara
adalah
dan
oleh Lemma
menunjukkan bahwa itu
adalah . Jika
adalah invarian transformasi tersebut, harus menjadi
oleh pilihan
, i = 1,2.
(53)
⁄ ( ) * + * + ⁄ ⁄ Semakin kecil (53) adalah (yaitu, lebih besar), yaitu
. Jika > 0,
dan
cenderung positif, dan jika <0, mereka cenderung berhubungan negatif.
(54)
untuk setiap nilai positif dari c dalam Euclidean ruang p-dimensi. pusat setiap ellipsoid adalah pada titik
Bentuk dan orientasi ellipsoid ditentukan oleh
, dan ukuran (diberikan
) ditentukan oleh c.
Mari kita pertimbangkan secara rinci kasus bivariat kepadatan (52). Kami mengubah koordinat oleh
i = 1,2, sehingga pusat dari lokus kepadatan konstan pada titik
asal. Lokus ini didefinisikan oleh (55)
intercep pada sumbu-
dan sumbu
garis 45 ° dengan panjang Jika
sama. Jika
> 0, sumbu utama elips adalah sepanjang
, dan sumbu minor memiliki panjang
< 0, sumbu utama adalah sepanjang garis 135 ° dengan panjang
sumbu minor memiliki panjang Nilai
.
, dan
.
menentukan rasio panjang ini. Dalam kasus bivariat ini kita bisa memikirkan fungsi
kepadatan sebagai permukaan atas pesawat. kontur dari persamaan identitas adalah kontur ketinggian yang sama pada peta topografi; mereka menunjukkan bentuk bukit (atau
permukaan probabilitas). Jika > 0, bukit akan cenderung untuk menjalankan sepanjang
garis dengan kemiringan positif; sebagian besar bukit akan di pertama dan ketiga kuadran. Ketika kita mengubah kembali ke dari
, memperluas setiap kontur dengan faktor
dalam arah sumbu-i dan menggeser pusat ke
Nilai-nilai numerik dari cdf variabel normal univariat diperoleh dari tabel yang ditemukan dalam teks-teks statistik. Nilai-nilai numerik dari (56)
dimana
(57)
dan
.
yang mana disebut fungsi tetrakorik
ditabulasikan di Pearson (1930) sampai dengan
. Harris dan Soms (1980) telah mempelajari generalisasi dari (57).