makalah multivariat

INTRODUCTION Dalam bab ini kita akan membahas tentang distribusi normal multivaria t dan beberapa sifat-sifatnya. Dalam Bagian 2.2 akan dibahas hal mendasar dari distribusi multivariat : definisi fungsi kepadatan multivariat, distribusi marginal, distribusi bersyarat, nilai harapan, dan moment. Dalam Bagian 2.3 distribusi normal multivariat didefinisikan : parameter yang menunjukkan mean, variansi, dan kovarian atau mean, variasi, dan korelasi dari komponen vektor acak. Dalam Bagian 2.4 menunjukkan kombinasi linear dari variabel normal dengan distribusi normal dan distribusi marjinal normal. Dalam Bagian 2.5 kita melihat bahwa distribusi bersyarat juga normal dengan mean fungsi linear dari vari abel kondisional : koefisien - koefisien regresi. Varians, kovarian, dan korelasi disebut korelasi parsial adalah konstanta. Koefisien korelasi berganda adalah korelasi maksimum antara variabel acak skalar dan kombinasi linear variabel acak lainnya, itu adalah ukuran dari hubungan hubungan antara satu variabel dan satu himpunan lainnya. Dalam Bagian 2.6 karakteristik fungsi, moment, dan kumulan.

2.2. Pengertian Distribusi Multivariat 2.2.1. Distribusi bersama bersama Dalam bagian ini kita akan membahas pengertian distribusi gabungan dari beberapa variabel, yang berasal dari distribusi distribusi marjinal subset subset dari variabel, variabel, dan distribusi bersyarat. bersyarat. Probabilitas Probabilitas didefinisikan dengan variabel yang diperoleh dengan operasi yang melibatkan fungsi distribusi kumulatif (cdf),

  *     +      ∫ ∫    + **+                ∫ ∫       *    +  ∫ ∫   (1)

didefinisikan untuk setiap pasangan bilangan real ( x, x, y). y). Kasus dimana F(x, dimana F(x, y) kontinu y) kontinu mutlak, ini

berarti turunan parsialnya parsialnya ada di mana-mana: mana-mana: (2)

,

dan (3)

Fungsi non-negatif f(x, non-negatif f(x, y) disebut y) disebut kepadatan X kepadatan X dan dan Y . Pasangan variabel acak (X,Y) mendefinisikan (X,Y) mendefinisikan

titik acak. Probabilitas (X,Y) persegi (X,Y) persegi panjang adalah (4)

. Probabilitas titik acak (X,Y) untuk (X,Y) untuk semua himpunan E himpunan E dimana dimana integral

didefinisikan (setiap himpunan terukur E terukur E ) adalah

(5)

Diikuti definisi integral [seperti penjumlahan limit (4)]. Jika f (x,y) adalah kontinu di kedua variabel,

    *+  ∫ ∫                  |*+ |       (   )*     +                      ∫   ∫ (   )   elemen probabilitas

y dan

adalah aproksimasi probabilitas X antara x dan

dan Y antara

karena

(6)

untuk beberapa Karena

dari teorema nilai mean di kalkulus.

kontinu, persamaan (6) adalah aproksimasi

Faktanya, (7)

Sekarang kita pertimbangkan kasus p variabel acak

. cdfnya adalah

(8)

didefinisikan untuk setiap himpunan bilangan r eal

. Fungsi kepadatan, jika

kontinu mutlak, adalah

(9)

)

(hampir di mana-mana), dan (10)

.

Kemungkinan jatuh semua himpunan R di p-dimensi Ruang Euclid adalah

(    )  {        } (    ) Elemen probabilitas

adalah aproksimasi probabilitas jika

kontinu.

Moment bersama didefinisikan sebagai (12)

DISTRIBUSI NORMAL MULTIVARIAT Fungsi kepadatan normal univariat dapat ditulis (1)



         

dimana positif dan k dipilih sehingga integral dari (1) masuk di sumbu-x adalah unit. Fungsi densitas distribusi normal multivariat X 1 , .., X p memiliki bentuk analog. Variabel skalar x diganti dengan vektor (2)



konstanta skalar digantikan oleh vektor (3)



dan konstanta positif digantikan oleh definit positif (simetris) matriks (4)

Persegi (5)

   

digantikan oleh bentuk kuadrat

Dengan demikian fungsi kepadatan dari distribusi normal p-variat adalah (6)

(   )  () ()

dimana dipilih (K > 0) sehingga integral di seluruh p-dimensi Ruang Euclides dari Kita amati bahwa (7)

adalah kesatuan. adalah nonnegatif. Karena A adalah definit positif,

dan karena kepadatan dibatasi, yaitu, (8)

Sekarang kita tenentukan K sehingga intergal dari (6) p-dimensi satu ruang. Kita harus mengevaluasi (9)

  ∫ ∫   

Kita gunakan fakta bahwa jika A adalah positif , pasti terdapat matriks nonsingular C sehingga (10) di mana I menunjukkan identitas dan C' transpos dari C . Misal (11) dimana (12)

kemudian (13) Jacobian dari transformasi tersebut adalah

(14) dimana modi CI menunjukkan nilai absolut dari determinan C. Jadi (9) menjadi (15)

 || ∫  ∫   

Kita punya (16)

      || ∫  ∫         ||∏ *∫  +  ||∏*√ + ||

dimana exp(z) = (17)

. Kita dapat menulis (15) sebagai

berdasarkan (18)

Sesuai dengan (10) adalah persamaan determinan

karena



(20) Dan karena (21) Jadi (22)

   | |  |||| | |      || || ⁄ | |   ⁄   | |    ||    

(19)

kita menyimpulkan dari (19) bahwa mod

Fungsi kepadatan normal adalah (23)



Sekarang kita akan menunjukkan b dan A dengan mencari momen pertama dan kedua

    (24)

Ini akan mudah untuk menentukan variabel acak sebagai pembentuk vektor acak

 

  

Kita akan mendefinisikan secara umum matriks acak dan nilai yang diharapkan dari sebuah matriks acak; vektor acak dianggap sebagai kasus khusus dari matriks acak dengan satu kolom.

Definisi 2.3.1.

(25)

Suatu Matriks acak Z adalah matriks

()                       

dari variabel acak

Jika variabel-variabel acak

hanya dapat mengambil bilangan hingga, matriks

acak Z merupakan salah satu dari matriks hingga, katakanlah probabilitas

adalah

Jika variabel-variabel acak

   

Jika

maka kita definisikan sebagai

   

Kemudian

memiliki identitas bersama, maka dengan operasi

jumlah Rieman dapat didefinisikan sebagai limit (jika limitnya ada) dari jumlah aproksimasi yang terjadi dalam kasus diskrit

Definisi 2.3.2. Nilai yang diharapkan dari matriks acak Z adalah

(26) Khususnya jika Z adalah X didefinisikan oleh (24), nilai yang diharapkan

(27)

adalah mean atau rerata vektor X. Kami biasanya akan menunjukkan ini vektor oleh



. Jika Z adalah

      

nilai yang diharapkan adalah

(28) kovarians atau matriks kovarians dari elemen X. diagonal ke i dari matriks ,

      

adalah varian dari

dan i, j dari diagonal elemen,

dari

. Kami biasanya menunjukkan matriks kovarians oleh

dan

adalah kovarians

bahwa



, Perhatikan

(29) Operasi mengambil nilai yang diharapkan dari matriks acak (atau vektor) memenuhi aturanaturan tertentu yang kita dapat meringkas dalam le mma berikut:

Lemma 2.3.1. Jika Z adalah matriks acak

matriks riil (30)





, dan F adalah matriks riil

, D adalah matriks riil

, maka



, E adalah

Buktinya elemen dalam baris ke-i dan kolom ke-j dari

adalah

(31)

yang merupakan elemen dalam baris ke-i dan kolom ke-j dari

Lemma 2.3.2. Jika

(32)



, di mana X adalah vektor acak, maka

(33) Bukti Penegasan pertama berikut langsung dari Lemma 2 .3.1, dan kedua dari (34)

yang menghasilkan sisi kanan (33) oleh Lemma 2.3.1. Ketika transformasi sesuai dengan (11), yaitu X = CY + b, maka Jika (35)

. Dengan teori transformasi yang diberikan dalam Bagian 2.2, densitas

    ∏*√  + 

Nilai harapan dari komponen i dari Y adalah (36)

Persamaan terakhir tersebut

 

adalah fungsi ganjil

Oleh karena itu, mean X dinotasikan dengan adalah (37)

Dari (33) kita melihat bahwa (38)



. Jadi

. i, j anggota dari

adalah

karena kepadatan Y adalah (35). Jika i = j, kita punya (39)

  

Persamaan terakhir tersebut karena setelah ekspresi terakhir adalah nilai harapan kuadrat variabel terdistribusi normal dengan mean 0 dan varians 1. Jika i (40)



j, (38) menjadi

Karena integrasi pertama memberikan 0. Kita dapat meringkas (39) dan (40) sebagai (41) Jadi (42) -1

-1

-1

Dari (10) kita peroleh A = (C ') C dengan perkalian (C ') di sebelah kiri -1

dan C di sebelah kanan. Mengambil invers di kedua sisi persamaa yang diberikan (43)

CC'= A-1

Dengan matriks kovarians dari X adalah (44)



Dari (43) kita tahu bahwa adalah definit positif.

Teorema 2.3.1.

Jika kepadatan p-dimensi acak vektor X adalah (23), maka nilai harapan dari X adalah b dan matrik





   

 

kovarians adalah A-1. Sebaliknya, diberikan a vektor dan a matriks definit positif , ada kepadatan normal multivariat

|| |             (45)

sehingga nilai harapan dari vektor dengan kepadatan dan matrik kovarians adalah . Notasi kepadatan (45) sebagai

dan distribusi sebagai

. Diagonal i elemen matriks kovarians

, adalah varian dari komponen i dari X , kadang-kadang dapat ditunjukkan dengan

korelasi antara X i dan X j didefinisikan sebagai (46)

Koefisien

                    

Hubungan assosiatif simetris di X i dan X j: (47)

. Karena

adalah definit positif (Corollary A.l.3 dari Lampiran), determinan (48)

positif. Oleh karena itu, -1 <



, i = 1, ..., p, varians

< 1. Kepadatan normal multivariat mendapat parameter dengan mean

, i = 1, ..., p, dan korelasi

, i < j ; i, j = 1, ..., p.

Kasus khusus dari teori sebelumnya, kita pertimbangkan distribusi normal bivariat. Vektor mean (49)

matriks kovarians dapat ditulis (50)

di mana



          

adalah varian dari X1,

(50) adalah (51)



varians dari X2, dan korelasi antara X1 dan X2. Invers dari

Fungsi kepadatan X1 dan X2 adalah (52)

Teorema 2.3.2.

                      

 

Koefisien korelasi dari sebarang distribusi bivariat adalah invarian terhadap transformasi

, i = 1,2. setiap fungsi dari parameter distribusi normal bivariat yang invarian

dengan transformasi adalah fungsi dari . Bukti.

Varians dari

adalah

, i = 1,2, dan kovarians dari

        dan

2.3.2. Penyisipan nilai-nilai ke dalam definisi korelasi antara

adalah

dan

oleh Lemma

menunjukkan bahwa itu

adalah . Jika

adalah invarian transformasi tersebut, harus menjadi

oleh pilihan

, i = 1,2.

(53)

                  ⁄  (   )                            *   +   *      +   ⁄   ⁄ Semakin kecil (53) adalah (yaitu, lebih besar), yaitu

. Jika > 0,

dan

cenderung positif, dan jika <0, mereka cenderung berhubungan negatif. 

(54)

untuk setiap nilai positif dari c dalam Euclidean ruang p-dimensi. pusat setiap ellipsoid adalah pada titik

Bentuk dan orientasi ellipsoid ditentukan oleh

, dan ukuran (diberikan

) ditentukan oleh c.

Mari kita pertimbangkan secara rinci kasus bivariat kepadatan (52). Kami mengubah koordinat oleh

i = 1,2, sehingga pusat dari lokus kepadatan konstan pada titik

asal. Lokus ini didefinisikan oleh (55)

intercep pada sumbu-

dan sumbu

garis 45 ° dengan panjang Jika

sama. Jika

> 0, sumbu utama elips adalah sepanjang

, dan sumbu minor memiliki panjang

< 0, sumbu utama adalah sepanjang garis 135 ° dengan panjang

sumbu minor memiliki panjang Nilai

.

, dan

.

menentukan rasio panjang ini. Dalam kasus bivariat ini kita bisa memikirkan fungsi

kepadatan sebagai permukaan atas pesawat. kontur dari persamaan identitas adalah kontur ketinggian yang sama pada peta topografi; mereka menunjukkan bentuk bukit (atau

permukaan probabilitas). Jika > 0, bukit akan cenderung untuk menjalankan sepanjang

garis dengan kemiringan positif; sebagian besar bukit akan di pertama dan ketiga kuadran. Ketika kita mengubah kembali ke dari

, memperluas setiap kontur dengan faktor

dalam arah sumbu-i dan menggeser pusat ke

Nilai-nilai numerik dari cdf variabel normal univariat diperoleh dari tabel yang ditemukan dalam teks-teks statistik. Nilai-nilai numerik dari (56)

dimana

(57)

dan

.

yang mana disebut fungsi tetrakorik





ditabulasikan di Pearson (1930) sampai dengan

. Harris dan Soms (1980) telah mempelajari generalisasi dari (57).

makalah multivariat

Recommend Documents