STATISTIKA DAN ANALISA DATA DALAM DUNIA PERTAMBANGAN
STATISTIK DAN ANALISA DATA BAB I
PENDAHULUAN
Untuk mempelajari alam dapat didekati dgn dua sifat, pertama sifat alam yang sistematik, deterministic dan yang kedua adalah sifat alam yang berpola acak atau random. Pola sifat sistematik dapat dirumuskan dg formula matematik yang memperlihatkan keterkaitan antar parameter atau kejadian. Tetapi sifat random hanya dapat dirumuskan dengan pendekatan konsep statistik dimana sifat parameter parameter alam tersebut dinyatakan dalam besaran prediksi pada suatu tingkat kepercayaan. Sifat fisis dari batuan adalah deterministic karena sifat tersebut mengikuti hukumhukum fisika, kimia, biologi dan umumnya dapat dinyatakan dengan formula matematik. Dalam kasus pendekatan matematik sifat alam dapat didekati dengan besaran parameter yg sederhana misalnya densitas batuan yg homogen, resivitas batuan yg homogen, kecepatan gelombang homogen pada satu lapisan batuan sehingga model parameternya dapat dirumuskan. Tetapi berlainan dengan sifat fisis, keberadaan dari materi batuan atau mineral dalam bumi dapat besifat random, ataupun ata upun berpola fractal karena banyaknya ban yaknya parameter par ameter lingkungan yang mempengaruhi keberadaan batuan tersebut. Hanya beberapa saja parameter yang dapat diperkirakan bagaimana dan berapa besar peranannya terhadap pembentuk batuan.sebagai contoh parameter tekanan, temperatur, reaksi kimia, unsur mineral dan sebagainya. Namun dapat dikemukakan masih banyak lagi parameter lingkungan yg belum atau tidak diketahui mempengaruhi proses terbentuknya suatu batuan. Pada suatu formasi batuan sering ditemukan keberadaan materi dan berbagai berbagai macam mineral ditemukan dalam keadaan yang tidak teratur atau acak. Dalam hal ini pendekatan analisa yang dilakukan adalah dengan metode statistik. Penggabungan kedua sifat alam deterministic dan acak ini dapat dilakukan dengan optimal berdasarkan pada pendekatan statistik. Ilmu statistik dalam dala m ilmu dan teknologi kebumian sisebut juga geostatistik. Statistik dalam geologi akan dapat dilihat peranannya dengan lebih mudah, terutama dalam menganalisa data dalam data dalam beberapa contoh kasus seperti pengolahan data kekar, uratan stratigrafi, estimasi mineral, klasifikasi data fosil, dan sebagainya :
●
Optimasi model 1
●
filter noise
●
regresi data geofisika
●
anomali regional
●
atribut seismic
●
analisa data logging, autokorelasi, cross-correlasi
●
analisa peta, perbandingan peta, kontur
●
analisa sequence untuk gempa dan letusan gunung api
●
analisa diskriminan untuk menentukan jenis litologi
BAB II 2.1. Karakteristik Populasi Data
Universe
Universe (semesta) adalah ruang total materi yang dianalisa. Dengan demikian
semua data yang dapat diambil disebut sebagai ruang sampel atau “universe”. Karakter suatu universe adalah dapat dianalisa dari satu macam atau lebih parameter (unit atau multi demiensi) tergantung pada jumlah parameter yang diukur pada masing-masing sampel. Sebagai contoh pada teknologi pertambangan dalam proses evaluasi cadangan, universe adalah deposit mineral yang terdapat pada daerah yang sedang dipelajari. Dengan demikian dalam kasus ini universe adalah deposit mineral misalnya untuk tambang tembaga, nikel, emas, timah atau mineral lainnya. Pada servey geofisika semua data yang mungkin diperoleh dalam daerah penelitian disebut
universe.
Sebagai
contoh
pengukuran
gaya
berat,
magnetic,
geolistrik,
elektromagnetik akan merupakan ruang sampel atau universe pada daerah yang diselidiki. Universe harus terdifinisi dengan limit (batas) area. Batas universe dapat terbentuk struktur geologi atau didefinisikan dalam batas posisi koordinat dan atau kedalaman misalnya ditentukan sampai Lintang dan Bujur serta dengan interval kedalaman tertentu ( 50 m – 100 100 m, permukaan sampai 250 m dsb).
2
Un it sampel
Bagian dari universe dimana pengukuran dilakukan disebut unit sampel atau titik sampel. Dengan unit sampel tersebut, karakter suatu universe nantinya diharapkan dapat dianalisa dan dijelaskan. Pemilihan unit sampel dapat ditentukan berdasarkan pada tiga hal pokok yaitu : 1.
Ketersediaan data
2.
Metode statistik yang digunakan
3.
Hasil target yang diharapkan
Ketiga hal tersebut saling tergantung misalnya hasil target yang diharapkan sangat tergantung pada ketersediaan data dan metode yang dipunyai. Demikian juga metode yang dipilih tersebut dapat tergantung pada data dan target yang dicapai. Ukuran unit sampel sangat penting karena populasi sampel jarak 10 feet dapat berbeda dengan populasi sampel jarak 50 ft. karena itu ukuran unit sampel perlu ditentukan agar karakterisasi daerah penelitian nantinya dapat mememenuhi tujuan dengan efektif. Pada kasus lapangan ukuran unit sampel ini tergantung pada ukuran target geologi, keadaan lingkungan, teknologi yang digunakan, dana dan sebagainya. Penampilan populasi data yang sangat sederhana adalah dengan menggunakan histrogram. Caranya adalah dengan mem-plot distribusi frekuensi pada sumbu ordinat dan nilai data pada sumbu absisi dan hasilnya disebut grafik histogram, dapat dilihat pada gambar berikut ;
Buat grafik histogram seperti model tersebut : Data lapangan dari mining nickel eksploitation dengan data produksi Sbb : 1.
Tahun 2005 produksi 1 juta ton bijih nikel dengan komposisi Nikel (Ni) 20 %; Cobalt
(Co) 15 %; Molibdat (Mo) 10 % dan Besi sebagai besi oksida (FeO) 55 % 2.
Tahun 2006 Produksi 1,5 juta ton dengan komposisi seperti pada tahun pertama.
3.
Tahun 2007 produksi 2 juta ton dengan komposisi seperti pada tahun pertama
4.
Tahun 2008 produksi 1,5 juta ton dengan komposisi Ni 25 %; Co 20 %; Mo 15 % dan
sisanya adalah besi.
3
Var i abel Random (V.R)
Variabel random adalah variabel dimana dapat diambil suatu kejadian dari beberapa kemungkinan. Misalnya kemungkinan untuk mendapatkan V.R. x adalah jumlah kemunculan x dibagi jumlah total semua sampel.
Di stri busi Kemungkin an (Pr obabil itas)
Kemungkinan muncul satu sampel dari seleksi acak digambarkan dengan distribusi probabilitas V.R. Misalnya kemungkinan untuk mendapatkan satu grade dalam interval 2 – 4 % pada suatu endapan mineral atau berapa kemungkinan kita mendapat batu pasir dalam reservoir dengan analisa seismic. Dalam kenyataan distribusi probabilitas tidak pernah diketahui, tapi dapat dihitung dari ekperimen dan kemudian dicoba untuk menentukan distribusi teoritik yang dihasilkannya. Pada data diskrit (ciri-ciri tersendiri) dengan nilai integer, distribusi kemungkinan akan berhubungan dengan setiap kemungkinan harga x yang dinyatakan dengan probabilitas p(x). Probabilitas p(x) selalu positif sehingga p(x) >0 dan jumlah total semua p(x) = 1 untuk harga x dalam universe. Pada distribusi kontiniu, berlaku untuk setiap x, distribusi probability dinyatakan dengan suatu fungsi densitas probabilitas f(x). Probabilitas p(x) selalu positif sehingga p(x) >0 dan jumlah total semua p(x) = 1 untuk semua harga x dalam universe. Pada distribusi kontiniu, berlaku untuk setiap x, distribusi probability dinyatakan dengan suatu fungsi densitas probabilitas f(x). Sehingga probabilitas satu harga yang terletak antara x dan (x + dx) menjadi f(x)dx dimana dx =0. Untuk probabilitas pada x kecil dari x0 p(x
(1)
Untuk probabilitas x yang berada antara a dan b adalah : Prop = Sebagai syarat
(2) adalah bahwa total probabilitas
1
sama dengan satu sehingga, = (3)
Istilah probabilitas adalah probabilitas X0 dan komulatifnya ditulis F(x 0), sehingga dapat ditulis dimana F(- ) = 0 dan F (+ ) =1
(4) 4
Pada grafik distribusi frekuensi karakter populasi mempunyai beberapa ciri dalam statistik yaitu : harga rata-rata, median, dan modus. Nilai x rata-rata Harga x rata-rata dari semua data didefinisikan sebagai berikut : Rata-rata
X =
(5)
Harga rata-rata merupakan harga prediksi x dalam populasi atau ditulis ekspektasi E (x) = x
M edian
Median adalah nilai yang terletak ditengah pada ruang distribusi dimana kumpulan harga tersebut diurut dari yang kecil menuju ke yang besar. Jadi untuk jumlah data yang ganjil dan genap masing-masing median M-nya adalah : M=;
n = ganjil
M = [ Xn/2 + ]
2 ; n = genap
(6)
Modus
Mode (modus) merupakan harga x dengan frekuensi kemunculannya paling besar dari semua harga data x
Modus = L + ( ) c Dimana L = tepi bawah frekuensi kelas modus d1 = selisih frekuensi kelas modus dengan kelas sebelumnya d2 = selisih frekuensi kelas modus dengan kelas sesudahnya c = panjang kelas modus
Mid- range
Harga mid-range adalah perkiraan harga pertengahan antar harga maximum dengan harga minimum. Midrange = ½(Max + Min)
(7)
5
Nilai midrange ini dapat digunakan juga untuk mendekati harga rata-rata x atau untuk melihat apakah distribusi harga x semetris dengan x rata-rata sebagai sumbu tengahnya. Bagi data yang semetris dengan x rata-rata sama dengan midrange. Bahan Latihan :
Tabel 1. Kandungan Ni untuk masing masing blok A,B,C,D,E dan F BLOK
% Ni
A
2,0
2,0
2,1
2,1
B
2,2
2,3
2,2
2,3
C
2,3
1,9
2,1
2,3
D
2,2
2,3
2,3
2,3
E
2,7
2,7
2,6
2,5
F
2,0
1,9
2,2
2,0
G
2,3
2,4
2,4
2,4
Tentukan : Mean, Median, Modus dan Midrange data dalam tabel.
Distribusi data Distribusi data dalam grafik distribusi frekuensi dapat dibagi menjadi beberapa bagian dengan tiap bagian mengandung jumlah data yang sama yaitu sebagai berikut : a.
Quartile (kwartil) Jajaran datadibagi menjadi 4 kelompok yang sama banyaknya dengan demikian disebut kwartil dengan harga batas terletak pada jumlah komulatif relative q1 = 0,25; q2 = 0,5 dan q3 = 0,75
b.
Deciles (desil) Jajaran data dibagi sepuluh dengan harga batas terletak pada jumlah komulatif relative
d1, d2, ……………. D9 = 0,1,0,2 ………, 0,9 c.
Persentil Jajaran data dibagi seratus bagian yang sama jumlahnya sehingga batasnya terletak
pada haerga p1,p1 …………….p99 = (0,01,0,02, ……. 0,99)
6
2.2 Besaran Dispersi
Untuk penyebaran, variabilitas atau disperse suatu distribusi kemungkinan digunakan antara lain : a.
Jangkauan yang berarti beda antara nilai maximum dengan minimum
b.
Simpangan rata-rata yaitu ekspektasi harga mutlak selisih x dengan meannya yaitu E( X1 – X )
c.
Variansi δ2
d.
Standar deviasi δ Untuk mengetahui penyebaran harga sekitar mean digunakan deviasi standar s yang dihitung dari sampel
S =
(8)
Pada keadaan populasi bersifat acak maka rata-rata dari (xi – x) sama dengan 0. Kalau sifat penyebarannya data diperlihatkan dengan menggunakan nilai mutlak I x i – xrt I maka analisa akan mengalami kesulitan diantaranya adalah karena turunannya tidak kontiniu di x = xrt. Dengan demikian maka sering dipilih parameter standar deviasi s atau variansi s2. Dari populasi dengan distribusi probabilitas kontiniu f(x) maka dapat dihitung standar deviasi sebagai berikut ;
δ=
(9)
Dimana m adalah harga rata-rata populasi. Satuan standar deviasi s dan δ
sama dengan
satuan dari variabel x. sebagai contoh bila asli dinyatakan dalam satuan (%) maka satuan vareansi adalah (%)2. Bila harga x hampir sama atau tidak mempunyai variansi harga yang besar maka harga s
akan kecil. Pada keadaan jumlah data terbatas maka s digunakan sebagai estimator untuk δ dan harga x rt sebagai estimator untuk m.
Kar akter isasi distri busi
Distribusi frekuensi n sampel seperti pada gambar 1, dapat ditransformasi menjadi distribusi probabilitas dengan membagi frekuensi kemunculan dengan n. Beberapa contoh histogram sampel dengan beberapa bentuk (pola) diperlihatkan pada gambar 2 berikut :
Parameter kecenderungan sentral dapat dilihat dari harga rata-rata x pada persamaan 5. Xrt = 1/n 7
Dari teori probabilitas harga rata-rta dapat dirumuskan dengan : m=
(10)
Harga m merupakan harga ekspektasi dari x dan ditulis m = E(x)
(11)
seperti yang telah dinyatakan diatas bahwa harga rata-rata x adalah estimator dari m kecuali untuk kasus dimana terjadi harga sangat (ekstrem) besar (kasus emas) maka perlu menggunakan t-estimator.
Bila “expected value” X, E(x) = m maka estimator tersebut disebut “unbiased” tidak ada kesalahan sistematik.
Persamaan 9 dapat ditulis menjadi variansi
δ2 = ∫(x-m)(x-m)f(x)dx
(12)
untuk mendapatkan estimator yang “unbiased” persamaan 8 dibagi dengan (n -1) s2 =
(13)
Dan persamaan 12 dapat ditulis dengan notasi
δ2 = E (x-m)(x-m)
(14)
Variansi dapat ditulis S 2 = =
n - ( /n ( n-1 )
(15)
Tabel 2 Data Kandungan Cromium (Cr) dalam ppm No
Cr( ppm)
1
205
2
255
3
195
4
220
5
235 = 1110
X =
Xi
=248700
= 222 8
( )2 =1232100 S2 = = 5 x 248700-1232100 : 20 S = 2 =
√570 -à S = 23.88
Arti s terhadap nilai (ppm) Cr adalah sebagai berikut dimana pada range harga x : X S=
Arti s terhadap nilai (ppm) Chromium (Cr) adalah sebagai berikut dimana pada range harga x : X s= 222 + 23.88 = 245.88 222 – 23.88 =198.12 Maka 40 % pengukuran atau data akan jatuh dalam harga range tersebut. Sedangkan untuk range harga x: X 2s = Maka 60 % harga data akan berada dalam range tersebut, namun ketepatan harga x menjadi menurun karena range harganya makin besar. Kesimpulan : sebagai kesimpulan dari pengertian daerah penerimaan adalah dengan range besar akan memberikan ketepatan prediksi akan rendah. Tetapi sebaliknya dapat dikatakan bahwa dengan range besar confidence level (tingkat kepercayaan) menjadi tinggi.
2.3. HUBUNGAN DUA VARIABEL
Hubungan dua variabel yang dapat disebut variabel dua dimensi (2D) diperlihatkan oleh variansi gabungan yang disebut sebagai kovariansi (covariance). Kovariansi dihitung dari kedua harga variabel tersebut terhadap meannya masing-masing Cov = n-1
=n n(n-1)
Selanjutnya koefisien korelasi r adalah r = cov
xy ,
→ -1 ≤ r ≤1
SxSy 9
Atau
r xy
= Z xiyi - ( Z xi Z yi)/n [ Z xi2 – (Z xi)2/n]2[Z yi2-(Zyi)2/n]2
Besarnya korelasi antara variable x dan y dinyatakan dengan koefisien korelasi r yang mempunyai harga dari -1 sampai dengan 1 Contoh :
Tabel 2.3 Hubungan x dengan y X (ppm)
Xi
Y (ppm)
205
130
255
165
195
100
220
135
235
145 2
Yi
XiYi
2
Harga rata-rata X dan Y Cov (xy) = = n n(n-1) Hubungan X dan Y dapat dinyatakan dengan koefisien korelasi (r) r =
-à -1 ≤ r ≤ 1
Latihan Hitunglah koefisien korelasi r antara panjang dan lebar dari brachiopoda, dari tabel berikut
Tabel 2.4 Panjang dan lebar dari 6 sampel Brachiopoda
Panjang (mm)
Lebar (mm)
18,4
15,4
16,9
15,1
13,6
10,9
10
11,4
9,7
7,8
7,4
6,3
5,3
Sebagai petunjuk buatlah tabel X i
Xi2
Yi2
Yi
XiYi, kemudian hitung koefisien
korelasi Panjang (xi)
Xi
Lebar (yi)
18,4
15,4
16,9
15,1
13,6
10,9
11,4
9,7
7,8
7,4
6,3
5,3
Yi
xiyi
2.4 TEST Z (NORMAL)
Standar normal z dihitung dengan rumus : Z= Didapat distribusi frekuensi dengan unit standar s dan mean pada z sama dengan nol. Misalnya pada suatu distribusi frekuensi komposisi kandungan Ni mempunyai harga mean dan standar deviasi :
μ = 14,2 δ
= 4,7
Maka berapa probabilitas ditemukan Ni lebih kecil dari 3 %
Z = = -2,4 Dari tabel probabilitas komulatif untuk distribusi normal diperoleh
F(-2,4) = 0,0082 Dengan demikian dapat dikatakan bahwa probabilitas ditemukan kandungan Ni < 3% adalah cukup kecil yaitu mendekati nol Kalau dicari beberapa probabilitas ditemukan kandungan Ni > 20%, maka dihitung lebih dulu : Z = = 1.2. Dengan menggunakan tabel probabilitas komulatif z diperoleh : P(Z > 1,2) = 1,0 – P(1,2) 11
= 1,0 – 0,8849 = 0,1151 Dengan demikian kemungkinan ditemukannya kandungan Ni > 20% adalah 1 dalam 10
Latihan : Tentukan probabilitas ditemukan 10 % < % Ni < 20%
Z = = -0,89 P(1.2)
= 0,89
P(-0,89) = 0,19 0,70 Teorema limit sentral Xx =
μ
Bila distribusi rata-rata cenderung normal variansinya adalah :
S 2x
=
δ2/n standar error dari x adalah :
S e =
=δ
Sebagai contoh Brachiopoda X untuk 6 sampel adalah 30 mm dan diketahui suatu kelompok populasi braciopoda mempunyai
μ = 14,2 δ = 4,7 untuk mengetahui apakah 6 sampel tersebut sama dengan kelompok Brachiopoda maka dilakukan perbandingan mean dan S H 1 : μ1
e
≠ μ0
Tes hypotesa nol (H o) tidak ada perbedaan. Ho : μ 1 =
μ0
Alternatif hasilnya adalah bisa termasuk tipe Brachiopoda atau bertipe lain. Untuk memutuskan apakah H 1 atau H2 yang diterima, maka dilakukan tes Z Z= =
Tabel 2. Kesalahan I α dan kesalahan tipe II β
Hipotesa diterima
Hipotesa benar
Hipotesa salah
Keputusan benar
Type II error β
12
Type I error α
Hipotesa ditolak
Keputusan benar
δ2 = 22,1 δ = 4,7 Hipotesa H0 : μ1 = μ0 H 1 : μ1
1
μ0
Dengan level of significance α = 0,05 Tes Z =
= 8,2 dengan menggunakan tabel komulatif Z untuk α = 0,05 maka Z = 1,9
Karena harga Z jatuh pada daerah penolakan dimana 8,2 > 1,9 maka dapat dinyatakan bahwa kedua populasi tersebut tidak sama dengan demikian hipotesa ditolak.
2.5. Tes t
Pada distribusi student t dibutuhkan derajat kebebasan υ = n adalah jumlah parameter Pada distribusi t harga t dihitung dengan rumus :
t= = X = mean sampel
μ0 = Mean populasi (18%) n = jumlah populasi S = standar deviasi observasi Se = standar error observasi Contoh : tabel 6 No
(%) X
1
13
2
17
3
15
4
23
5
27
6
29
7
18 13
8
27
9
20
10
24
Sehingga diperoleh : X = 21,3 S2 = 30,46 S
= 5,52 Se = 0,57
Test ini mempunyai satu ekor maka disebut one line test
α = 5 % dilihat dalam tabel, nilai kritis harha t untuk derajad kebebasan 10 & α = 0,05. Harga t = 1,83 H0 : μ1
≤ 18% H1 : μ1 > 18%
Harga t hitung t =
= 1.89
Dengan derajat kebebasan υ = 9 maka t = 1.83, dengan demikian data t jatuh dalam daerah kristis sehingga H0 ditolak. Dengan demikian kandungan persentasi Cu lebih besar dari 18 %
2.6. Tes F Untuk membandingkan distribusi dua popilasi yang berbeda dapat dilihat dari kesamaan atau perbedaan variansi kedua populasi tersebut. Perbandingan tersebut akan dilihat berdasarkan tingkat kesamaan variansi distribusi populasi dengan tes – F adalah sebagai berikut. F = S12/S22 Dengan dua macam derajat kebebasan dari masing-masing populasi yaitu
υ1
= n1-1
υ2
= n2 -1
tes statistik dilakukan dengan menguji hipotesa
Hipotesa H0 : δ12 = δ22 H1 : δ12
δ22
14
Misal nilai kritis F untuk υ 1 = 9 dan υ2 = 9 dan level significance α = 0.05 maka dalam tabel F diperoleh harga : F = 3.18 Contoh : Kandungan (%) x pada tabel 6 sebelumnya dibandingkan dengan populasi kandungan (%) X pada tabel 7 berikut ini : Tabel 7 Sampel Namber
X(%)
11
15
12
10
13
15
14
23
15
18
16
26
17
24
18
18
19
19
20
21 Tatal = 189 Mean = 18,9 S2 = 23.21 S = 4.82
X = 18.9 S2 = 23.21 S = 4.82 F = S12/S22 = 30.46/23.21 = 1.3 Dengan demikian harga F data lebih kecil dari harga F yang diperoleh dari tabel yaitu 1.3 < 3.18 sehingga hipotesa H0 diterima
ANALISIS REGRESI DAN KORELASI LINIER
Persamaan regresi linier sederhana memiliki dua variabel, misalnya x dan y Y=a + bX
2.34 15
a=
b = dengan : b = koefisien arah garis regresi a = intersep n = banyaknya pasangan data semua jumlahan dihitung nilai b dan a untuk data populasi dan produk
Contoh Tabel 2.9 Blok
Jumlah pekerja
Jumlah produk Batu bara
X
XY
X2
(ton) y
1 2 3 4 5 6 7 8 9 10
KESALAHAN STANDAR SAMPEL ESTIMASI
Diperlukan nilai kesalahan standar populasi s untuk memproleh kesimpulan regresi. Nilai kesalahan standar populasi ini merupakan nilai simpangan baku (standard deviation) yang mengukur variasi titik-titik diatas dan dibawah garis regresi populasi. Jika kita tidak 16
mengetahui nilai S , kita mengestimasi dengan S e yaitu kesalahan standard estimasi sampel. Nilai S merupakan suatu simpangan baku secara matematis sbb: S e =
2.35
SOAL. Dalam penelitian mengenai banyaknya curah hujan dan jumlah kotoran udara yang terbawa hujan, terkumpul data berikut :
a.
Curah hujan, x
Zarah terbawa, y
(0,01 cm)
(microgram per m3)
4,3
126
4,5
121
5,9
116
5,6
118
6,1
114
5,2
118
3,8
132
2,1
141
7,5
108
Cari persamaan garis regresi untuk memprediksikan zarah yang terbawa hujan dari
banyaknya curah hujan harian b.
Taksir banyaknya sarah yang terbawa hujan bila curah hujan harian x = 4,8 satuan.
c.
Hitung kesalahan standar deviasi dari sampel tersebut dengan rumus sbb S e =
B. REGRESI GANDA
Analisis regresi ganda digunakan oleh peneliti, bila peneliti bermaksud meramalkan bagaimana keadaan (naik turunya) variabel depeneden (kriterium), bila dua atau lebih variabel independen sebagai factor predictor dimanipulasi (dinaik turunkan nilainya). Analisis regresi ganda akan dilakukan bila jumlah variabel independennya minimal 2. Persamaan regresi untuk dua predictor adalah ; Y = a + b 1X1 + b2X2 17
Regresi ganda dua predictor
No
X1
X2
Y
1
10
7
23
2
2
3
7
3
4
2
15
4
6
4
17
5
8
6
23
6
7
5
22
7
4
3
10
8
6
3
14
9
7
4
20
10
6
3
19
X1Y
X2Y
X1X2
X1
X2
jumla h
Y = produktivitas;
X1 = kemampuan kerja pegawai
X2 = kepemimpinan direktif Untuk menghitung harga-harga a, b 1; b2 dapat menggunakan persamaan berikut ;
= an + b1 + b2 = a + b1 + = a + b2
RUMUS KORELASI GANDA
R y (1,2) = Koefisien determinasi (R 2) = R y(1,2) Uji signifikasi korelasi ganda
F = Harga ini selanjutnya dikonsultasikan dengan F tabel, dengan didasarkan pada dk pembilang = 2 dan dk penyebut (10-2-1) = 7 untuk kesalahan 5 % dan 1 %
18
Kesimpulan jika F hitung lebih besar F tabel koefisien korelasi yang diuji adalah signifikan sehingga dapat diberlakukan untuk populasi yang diteliti dengan taraf kesalahan 5 % dan 1 %
BAB III. ANALISA SEQUENCE
Pada bab ini dibahas data dari fenomena alam yg berdimensi satu. Oleh karena itu metode untuk membahasnya disebut analisa sekuensi (sequence Analysis). Datanya berupa deret atau seri dalam waktu, jarak atau berupa satu variabel tertentu. Variabel Tersebut dapat berupa temperatur, besar butir, berat, lintasan survey dan sebagainya. Dalam geofisika banyak ditemukan data profil, data bor , data pengamatan dalam waktu. Misalnya data letusan gunung api dicatat dalam skala waktu dengan demikian variabel bebasnya adalah waktu. Data anomaly gaya berat pada profil yang menjadi variabel adarah jarak sepanjang profil. Perubahan densitas terhadap temperatur berarti variabel adalah temperatur. Data pengamatan dapat diperoleh dengan jarak yang sama. Pada proses tertentu misalnya untuk filter, korelasi, konvulsi dibutuhkan data dengan interval sama, oleh karena itu dibawah ini dibahas terlebih dahulu bagaimana merobah data menjadi berinterval sama. 1.1.
Membuat Interval data sama
Interpolasi Linier
Posisi dan harga jarak yang sama dihitung dengan cara interpolasi linier dari dua titik
terdekat. Harga Y” pada X” yang dihitung dengan rumus sbb : ”
Y =
X
Y
420
5
424
? (Y”) = 7
430
10
”
Y =
Y” = (5)(4) /10 + 5 = 2 + 5 = 7
19
1.2.
Runs Test
Runs test adalah metoda yang digunakan untuk data dikotomi yaitu mempunyai dua pilihan misalnya muncul tidak muncul. Urutan kemunculan data tersebut dapat diselidiki apakah pergantian kemunculan kedua bentuk tersebut bersifat acak atau tidak. Untuk melihat acak atau tidak digunakan Runs Test dimana satu run adalah urutan yang datanya sama. Sebagai contoh deret data berikut 13 runs (selang tanpa terjadi pergantian kemunculan), Jumlah data H(n1) = 11 dan jumlah data T(n2) = 9 H T HH T H TTT H T H T HH TT HHH 13 runs n1 = 11 n2= 9 Jumlah rata-rata runs estimasi bersifat acak adalah :
υ = Variansi harapannya (expected variance-nya) adalah ,
δ2u = Z test → Z =
dimana u = jumlah runs
HIPOTESA H0 : υ ≤ u H1 : υ > u Banyak runs H0 di tolak
atau H0 : υ ≥ u atau H1 : υ < u sedikit runs H0 di tolak
Tes seperti ini disebut one-tailed karena daerah penolakannya hanya terdapat pada satu ujung
H0 : υ = u H1 : υ
≠ u
ANALISA VARIANSI SATU ARAH MENGGUNAKAN TES F Model anova satu arah (one-way analysis of variance) digunakan untuk pengujian
perbedaan antara k rata-rata sampel apabila subyek-subyek observasi atau penelitian ditentukan secara random pada setiap grup atau kelompok perlakuan yang ditentukan. 20
Persamaan linier yang menggambarkan model uji satu arah : Xik = μ + αk + eik Dengan :
μ = rata-rta keseluruhan dari semua k populasi klasifikasi. αk = efek klasifikasi dalam k kelompok tertentu darimana nilai data dijadikan sampel. eik = kesalahan random yang tergabung dengan proses sampling Ringkasan anova satu arah dapat dilihat pada tabel 2.8 berikut ini. TABEL 2.8 PROGRAM ANALYSIS OF VARIANCE (ANOVA) Sumber
Jumlah kuadrat
Variansi
(d.f)
Kuadrat
(SS)
Di antara
SSA= -
F test
rata-rata K-1
MSA =
criteria
F=
kelompokkelompok A Diantara
SSE= SST-SSA
N-K
MSE =
dalam samples Total
SST=
N-1
variation
Hipotesis nol dan hipotesis alternative untuk anova satu arah : H0:αk = 0 Ha : αk 10 Jika hipotesis nol benar, berarti : μ1 = μ2 =μ3 = ---= μk CONTOH 2.8 Ada tiga sampel random dari 3 group tenaga kerja berhubungan dengan penurunan produktivitas sbb ; Kelompok A
Kelompok B
Kelompok C
7
11
4
8
9
6
7
9
5
9
8
8
9
12
5
21
8 6 Total Besar sampel
T1= 40
T2=60
T3 = 42
n1 = 5
n2 =6
N3 = 7
Jawab Banyak sampel k =3 Jumlah data ketiga sampel N = n 1 + n2 + n3 = 5 + 6 +7 = 18 Perhitungan 1.
Jumlah nilai masing-masing sampel : T1 = 40; T 2 = 60; T 3 = 42
2.
= 40 + 60 + 42 = 142
3.
( )2 = 20164
4.
Jumlah kuadrat masing-masing kelompok : = +
+ +
= 72 + 82 + 72
5. 6.
- = 1172 – 20164/18 = 51,778
Jumlah kuadrat di dalam kelompok-kelompok : = 1202 – 1172 = 30
SSW = 8.
+ …..+ 52 + 82 + 62 = 1202
Jumlah kuadrat di antara kelompok-kelompok : SSB =
7.
+ = 1172
Kuadrat rata-rata di antara kelompok-kelompok ; MSB =
=
= 25,889
Dengan d.f = K-1 = 3-1 = 2 9.
Kuadrat rata-rata di dalam kelompok-kelompok : MSW = = = 2 Dengan ; d.f = N- K = 15
10. Nilai rasio F didapat dengan : F= =
= 12,94
Analisis: 1.
Hipotesis H0 = penurunan rata-rata pada setiap populasi sama Ha = penurunan rata-rata pada setiap populasi ada yang tidak sama
22
2.
Nilai kritis d.f diantara kriteria kelompok-kelompok (numerator ) = K -1 = 3-1 =2 d.f kesalahan sampling (denumerator ) = N- K = 18- 3 = 15; α = 0,01 F(2;15;0,01)
= 6,36
3.
Nilai hitung ;
4.
Simpulan
F = 12,94
Karena nilai Fhitung = 12,94 lebih besar dari nilai F(2;15;0,01) = 6,36 berarti nilai F hitung berada di daerah penolakan H0. Dengan demikian kita H 0 kita tolak dan menerima Ha. ini berarti bahwa ada penurunan pada setiap populasi terhadap tiga kelompok yang tidak sama Contoh :
Kandungan Karbonat dalam Batuan (%)
Replikat
SAMPEL 1
2
3
4
5
1
19,2
18,7
12,5
20,3
19,9
2
18,7
14,3
14,3
22,5
24,3
3
21,3
20,2
8,7
17,6
17,6
4
16,5
17,6
11,4
18,4
20,2
5
17,3
19,3
9,5
15,9
18,4
6
22,4
16,1
16,5
19,0
19,1
Tt1 =115,4
Tt2 =106,2
Tt3 =72,9
Tt4 =113,7
Tt5 =119,5
n1 = 6
n2 = 6
n3 = 6
n4 = 6
n5 = 6
Jawab : Banyak sampel k = 5 Jumlah data ke lima sampel : N = n 1 + n2 + n3 + n4 + n5 = 30 Perhitungan : 1.
Jumlah nilai masing-masing sampel Tt1 = 114,4 , Tt 2 = 106,2 , Tt3 = 72,9, Tt 4 = 113,7 Tt 5 = 119,5
2.
ST = 526,7
3.
(ST)2 = 277412,89
4.
Jumlah kuadrat rata-rata masing-masing kelompok : 23
13087,36/6 + 11278,44/6 + 5314,41/6 + 12927,69/6 + 14280,25/6 = 2181,227+ 1879,74 + 885,74 + 2154,62 + 2380,04 = 9481,37 = 9481,31 S(X)2 =
5.
(19,2)2 +
(18,7)2 +(21,3)2 +
(16,5)2 +
(17,3)2 +
(22,4)2 +(18,7)2 +(14,3)2 +(20,2)2 +(17,6)2 +(19,3)2 +(16,1)2 +(12,5)2 +(14,3)2 + (8,7)2 +(11,4)2 +(9,5)2 +(16,5)2 +
(20,3)2 +(22,5)2 +(17,6)2 +(18,4)2 +(15,9)2 +
(19,0)2 + (19,9)2 +(24,3)2 +(17,6)2 + (20,2)2 + (18,4)2 +(19,1)2 = 368,6 + 349,69 + 453,69 + 272,25 + 299,29 + 501,76 + 349,69 + 204,49 + 408,04 + 309,76 + 372,49 + 259,21 + 156,25 + 204,49 + 75,69 + 129,96 + 90,25 + 272,25 + 412,09 + 506,25 + 309.76 + 338.56 + 252,81 + 361 + 396,01 + 590,49 + 309.76 + 408,04 + 338,56 + 364,81 = 9975,75 6.
Jumlah kuadrat diantara kelompok-kelompok SSB =
- (ST)2/N =
9481,31 - 277412,89/30
= 9481,31 – 9247,09 = 234,21 7.
Jumlah kuadrat di dalam kelompok-kelompok : SSW = S(X)2 - = 9975 - 9481,31 = 493,69
8.
Kuadrat rata-rata diantara kelompok-kelompok : MSB = = = = 58,55 Dengan d.f. = K -1 = 5-1 =4
9.
Kuadrat rata-rata di dalam kelompok-kelompok : MSW = = = = = 19,75 Dengan : d.f. = N-K = 30 -5 = 25
10. Nilai rasio F didapat dengan : F =
= = 2,96
Analisis : Hipotesis 1.
H0 = pengurangan berat rata-rta pada setiap populasi sama Ha = pengurangan berat rata-rata pada setiap populasi ada yang tidak sama
2.
Nilai kritis d.f. di antara kriteria kelompok-kelompok (numerator) = K-1 = 5-1 =4 d.f. kesalahan sampling (denumerator) = N- K = 30 -5 = 25
α = 0,05 F(4;25;0,05) = 2,76 3.
Nilai hitung . F hitung = 2,96 24
4.
Kesimpulan Karena nilai hitung Fhitung = 2,96 lebih besar dari nilai F (4;25;0,05) = 2,76 maka nilai
Fhitung berada didaerah penolakan H0. Dengan demikian kita menolak H 0 dan menerima Ha
25