LAPORAN PRAKTIKUM KOMPUTASI STATISTIKA
Kelas C
MODUL : 1 MANAJEMEN DATA DI R DENGAN COMMAND LINE
Nama Praktikan
Cut Rifatmi Fadhilaini
Nama Penilai
Nomor Mahasiswa
Tanggal Kumpul
11611075
23-10-2014
Tanda tangan Praktikan
Laboran
Tanda tangan
Tanggal Koreksi
Nilai Asisten
Dosen
1. Farida Apriani 2. Wahyu Listyawan Muhammad Muhajir, S.Si., M.Sc.
JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM INDONESIA YOGYAKARTA 2014
1
BAB I PENDAHULUAN
R adalah suatu software untuk menganalisis data statistik seperti halnya SPSS, Minitab, S-Plus, SAS dan lain-lain. Namun R berbeda, karena R termasuk kelompok software yang open source yang tidak memerlukan lisensi atau dengan kata lain gratis ( freeware). Paket R memiliki fasilitas yang sangat banyak untuk analisis data statistik. Mulai dari metode yang klasik sampai dengan yang modern. [www.tulisaninspirasiku.wordpress.com/2012/11/24/r-software-analisis-data/] 1. Sejarah R
R merupakan salah satu bahasa dalam pemrograman statistika. R berbasis pada bahasa pemrograman S yang dikembangkan oleh Bell laboraties (sebelumnya AT&T ,sekarang Lucent Technologies) oleh John Chambers dan kawan-kawan. R merupakan versi open source dari bahasa S (yang digunakan dalam software berbayar S-PLUS) yang banyak digunakan oleh para peneliti untuk mengerjakan metode statistika mereka. R pertama kali diperkenalkan pada tahun 1996 oleh 2 orang Profesor statistika Ross Ihaka dan Robert Gentlemen dari University of Auckland di Selandia Baru, mereka merilis kode tersebut sebagai free software package. 2. Kelebihan R
a. R merupakan open source software sehingga orang tidak perlu membeli lisensi ataupun curi-curi peluang dengan membajak untuk menggunakannya. Selain itu karena R merupakan open source sehingga bagi orang yang tertarik mempelajari lebih dalam, maka terbuka kemungkinan bukan saja dapat “menggunakan” program aplikasi tersebut,tetapi dapat “mengembangkan”, atau “membuat” program aplikasi sejenis dengan melihat pada source code yang menyertainya. b. R dikembangkan oleh sebuah tim inti (core team) yang terdiri dari para ahli statistika, komputer dan pemrograman, geografi, ekonomi dari institusi yang berbeda di seluruh dunia, jadi jelas bahwa R benar-benar powerfull untuk mengerjakan analisis statistika yang rumit sekalipun.
2
c. R dapat berinteraksi dengan program statistika lainnya seperti SPSS, Microsoft Excel, Minitab, SAS, Systat, EPinfo disamping “kerabat dekat” nya yaitu SPLUS dengan menyediakan fasilitas export dan import data. d. R bersifat multiplatform yakni dapat diinstall dan digunakan baik dalam sistem operasi Windows, UNIX/LINUX maupun pada Macintosh. e. Untuk keperluan komputasi yang intensif, code C, C++, dan Fortran dapat dilink dan dipanggil secara bersamaan pada R, Advance users dapat menulis code C untuk memanipulasi objek R secara langsung. Selain kelebihan-kelebihan diatas R juga memiliki kelebihan dalam hal fitur serta kelengkapan yang dimilikinya yaitu: a. R efektif dalam hal pengelolaan dan penyimpanan data karena ukuran file yang disimpan lebih kecil dibandingkan software lainnya. b. R memiliki tampilan grafik yang menarik dan dapat dimodifikasi sesuai keinginan user. c. R dilengkapi deretan operator untuk perhitungan dalam array khususnya matrix. d. Interaksi user dengan R dapat dilakukan dengan menggunakan R console maupun dengan menggunakan menu GUI ( R-commander ), akan tetapi di versi GUI-nya analisis statistika yang disediakan masih terbatas. [www.clustr.wordpress.com/2009/07/13/mengenal-r/]
3
BAB II DESKRIPSI KERJA
Pada laporan praktikum kali ini akan dijelaskan bagaimana langkah dan Syntax dalam mengentri data secara manual pada lembar kerja Program R beserta perhitungan-perhitungan sederhananya. Berikut langkah-langkahnya : 1. Membuka Program R Sepertihalnya cara membuka aplikasi lainnya yaitu dengan double klik pada icon program R. Lihat gambar 2.1
Gambar 2.2 Tampilan Icon Program R Atau dapat dengan klik start kemudian klik program R. Maka akan muncul tampilan seperti gambar 2.3.
Gambar 2.3 Cara membuka Program R
4
Gambar 2.4 tampilan awal software R 2. Data Array Ketiklah Syntax berikut (yang berwarna merah) pada lembar kerja Program R :
Gambar 2.1 Syntax data array 3. Data Matriks Ketiklah Syntax berikut (yang berwarna merah) pada lembar kerja Program R :
5
Gambar 2.2 Syntax data matriks
Gambar 2.3 Syntax operasi penghitungan data vektor dan data matriks
6
Gambar 2.4 Syntax menambahkan elemen pada data matriks 4. Data Frame Ketiklah Syntax berikut (yang berwarna merah) pada lembar kerja Program R :
Gambar 2.5 Syntax untuk data frame
Gambar 2.6 Syntax untuk ekstraksi sebagian data matriks dan data frame(1)
7
Gambar 2.7 Syntax untuk ekstraksi sebagian data matriks dan data frame(2) 5. Data List Ketiklah Syntax berikut (yang diawali tanda >) pada lembar kerja Program R :
Gambar 2.8 Syntax data list
8
BAB III PEMBAHASAN
Dalam lembar kerja Program R data yang akan dientrikan tentunya memiliki nama variabel tertentu, dimana variabel tersebut bersifat case sensitive. Case sensitive merupakan sifat penulisan variabel yang membedakan antara kapital dan kecil, dan tidak dapat diawali dengan karakter atau angka serta tidak boleh terdapat spasi. Berikut ini akan dijelaskan Syntax-Syntax dasar pada program R menurut jenis-jenis data objeknya : A. Data Array Satu Dimensi atau Data Vektor
Vektor merupakan suatu array atau himpunan bilangan, character, atau string, logical value, dan merupakan objek paling dasar yang dikenal dalam R. Berikut ini merupakan contoh perintah untuk menampilkan data numerik dalam command line. Huruf c pada awal Syntax menunjukkan contained atau terkandung apa saja yaitu yang berada di dalam kurung. Jika data yang dimaksud dituliskan dengan 1:5 berarti data itu merupakan data diskret yang dimulai dari 1 sampai 5, yaitu 1, 2, 3, 4, dan 5. Namun ada yang membedakan dari kedua Syntax, dimana pada Syntax kedua terdapat huruf T. Perintah ini mengakibatkan data yang muncul berisi 6 data dengan data pertama dan kedua adalah sama yaitu 1, kemudian dilanjutkan data urutnya yaitu 2, 3, 4, dan 5. (lihat gambar 3.1)
Gambar 3.1 Menampilkan himpunan data numerik Untuk gambar 3.2, merupakan Syntax yang digunakan untuk mendeklarasikan data character. Dalam penulisannya setiap karakter diapit oleh dua anda apostrof (“...”). Pada Syntax kedua dimana hanya kata cut yang diapit (“...”) namun semua elemen data yang ada diubah juga menjadi modus karakter, sehingga akan muncul data dalam apostrof semua. Dalam program R, T diartikan sebagai TRUE dan F diartikan FALSE.
9
Gambar 3.2 Menampilkan himpunan data character Sedangkan Syntax pada gambar 3.3 digunakan untuk mendeklarasikan dan menampilkan semua elemen objek vektor dengan nama variabel data_vektor . Sebagaimana yang telah dideklarasikan pada baris pertama yaitu nama variabel data_vektor dengan elemen datanya adalah bilangan mulai dari 1 sampai dengan 10,
maka apabila variabel dipanggil seperti pada Syntax baris kedua akan muncul suatu vektor yang terdiri dari 10 elemen data, yaitu 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10.
Gambar 3.3 Menampilkan himpunan data vektor Untuk menampilkan mode atau tipe data yang telah dideklarasikan pada Syntax sebelumnya (gambar 3.3) maka dapat menggunakan Syntax seperti pada gambar 3.4.
Gambar 3.4 Menampilkan mode data Sedangkan pada gambar 3.5, digunakan untuk mengetahui banyaknya data atau elemen pada variabel data_vektor. Kemudian pada gambar 3.6 digunakan untuk menampilkan elemen data tertentu, dalam Syntax tersebut dideklarasikan [5] maka akan muncul data ke-5 yaitu 5.
Gambar 3.5 Menampilkan panjang data Kemudian pada gambar 3.6 baris pertama digunakan untuk menampilkan elemen data tertentu, dalam Syntax tersebut dideklarasikan [5] maka akan muncul data ke-5 yaitu 5. Untuk baris kedua digunakan untuk menempilkan elemen data ke 2, 4, 6, 8, dan 10. Maka akan muncul datanya yaitu 2, 4, 6, 8, dan 10. Sedangkan untuk baris ketiga digunakan untuk menampilkan data komplemennya atau data kecuali yang telah disebutkan. Jika pada Syntax dideklarasikan [-c(2,4,6,8,10] maka akan dimunculkan data ke 1,3,5,7, dan 9. Selain itu dapat juga digunakan untuk menapilkan data dengan interval tertentu, yaitu seperti yang telah dideklarasikan pada baris keempat. Karena dalam Syntax dideklarasikan data yang dimunculkan adalah data di 10
bawah 7 maka akan dimunculkan data ke 1 sampai dengan data ke 6 yaitu 1,2,3,4,5, dan 6.
Gambar 3.6 Menampilkan elemen data tertentu
B. Data Matriks
Matriks atau data array dua dimensi adalah salah satu tipe data yang banyak digunakan dalam pemrograman statistik. Proses entri data matriks dilakukan dengan menggunakan fungsi matriks, dan argumen optional yaitu banyaknya baris nrow dan banyaknya kolom ncolom. Untuk pengisian matriks menurut baris perbaris dapat dilakukan dengan menggunakan argumen optional byrow=T pada command matrix.
Gambar 3.7 Argumen untuk menampilkan data matriks Kelima perintah pada gambar 3.7 akan menghaslkan perintah yang sama yaitu untuk menampilkan data dalam bentuk matriks. Untuk mengetahui matriks yang telah dideklarasikan dengan Syntax tersebut maka dapat dengan memanggil nama variabelnya. Untuk matriks_A telah dideklarasikan pada Syntax bahwa byrow=F. Hal ini menunjukkan arti bahwa dalam pengisian elemennya tidak berdasarkan baris. Sehingga dalam pengisian elemennya akan mengutamakan untuk mengisi dalam satu kolom terlebih dahulu kemudian dilanjutkan ke kolom berikutnya, dan begitu seterusnya. Lain halnya dengan matriks_B dengan byrow=T. Dalam pengisian elemen berurut berdasarkan baris. Apabila dalam baris pertama telah terisi maka akan dilanjutkan ke baris selanjutnya, dan begitu seterusnya.
11
Gambar 3.8 Matriks A, B, C, D, dan E Untuk matriks_C, matriks_D, dan matriks_E terdiri dari elemen yang sama persis walaupun Syntax atau perintah yang telah dideklarasikan pada gambar 3.7 berbeda. Pada dasarnya ketiga perintah pada ketiga matriks tersebut adalah sama. Hanya saja Syntax yang diketik berbeda, sesungguhnya maksud dari ketiga Syntax tersebut adalah sama. Untuk selanjutnya dalam pemakaian kembali lagi kepada pengguna, mana yang lebih disukai.
Gambar 3.9 perintah mengetahui dimensi matriks Untuk mengetahui dimensi dari suatu matriks dapat dengan menggunakan perintah seperti pada gambar 3.9, tentunya dengan memanggil nama variabel atau nama matriks yang ingin diketahui. Dalam program R juga terdapat beberapa operator yang biasa digunakan untuk operasi matriks dan vektor (lihat gambar 3.10). Pada perintah pertama digunakan untuk mendeklarasikan suatu variabel yang berupa data vektor. Untuk menghitung perkalian vektor dapat dengan menggunakan perintah ke 2, yaitu dengan memberi tanda * diantara nama variabel yang ingin dikalikan.
12
Gambar 3.10 Operasi Matriks dan Vektor Perintah ke 3 dan ke 4 digunakan untuk mendeklarasikan suatu matriks dengan nama matriks_F dan memanggilnya sehingga muncullah matriks_F. Lain halnya dengan perkalian vektor yang cukup menggunakan tanda *, dalam perkalian matriks juga menggunakan tanda *, hanya saja tanda tersebut diapit dengan tanda % atau %*% seperti pada perintah keenam. Perintah solve digunakan untuk menghitung nilai invers matriks. Sedangkan crosspod digunakan untuk menghitung niali cross product dari suatu matriks.
Gambar 3.11 Menambah elemen pada suatu matriks Pada program R dapat juga dilakukan penggabungan satu kolom a tau satu baris ke dalam matriks lain. Hal ini dapat dilakukan dengan menggunakan perintah rbind untuk menambah ke baris dan cbind untuk menambah ke kolom. C. Data Frame
Data frame merupakan objek yang mempunyai bentuk yang sama dengan matriks, yaitu terdiri dari baris dan kolom. Perbedaannya adalah data frame dapat terdiri dari mode data yang berbeda-beda untuk setiap kolomnya, sedangkan matriks
13
tidak. Seperti apa yang telah dilakukan pada bab sebelumnya maka akan dijelaskan maksud dari Syntax tersebut.
Gambar 3.12 perintah untuk data frame Perintah pertama pada gambar 3.12 digunakan untuk mendeklarasikan suatu data frame dimana terdiri dari dua kolom yaitu kolom yang berisi data numeric dan kolom yang berisi data string/character . Kemudian pada perintah kedua digunakan untuk menyimpan data tersebut dalam variabel latihan.frame. Untuk memanggil atau menampilkan data yang telah tersimpan maka dapat dengan memanggil latihan.frame seperti pada perintah ke 3. Sedangkan pada gambar 3.13 digunakan untuk memberi nama kolom pada data frame yang telah tersimpan dalam variabel latihan.frame.
Gambar 3.13 memberi nama kolom Sepertihalnya pada data vektor, ekstraksi sebagian data pada matriks dan data frame dapa dilakukan dengan berbagai cara. Perintah pertama digunakan untuk mendeklarasikan matriks_nilai yang terdiri dari data numerik bilangan 1 sampai 9 dan banyaknya kolom 3.
Gambar 3.14 ekstraksi matriks dan data frame (1) 14
Perintah kedua digunakan untuk mendeklarasikan data frame dengan nama dataframe_nilai yang terdiri dari 3 kolom. Kolom pertama terdiri dari data numerik yaitu bilangan 1 sampai 5 dengan nama nomer. Kolom kedua terdiri dari data string yaitu nama dan kolom ketiga terdiri nilai yang terdiri oleh bilangan mulai dari angka 6 sampai dengan 10.
Gambar 3. 15 ekstraksi matriks dan data frame (2) Perintah pertama pada gambar 3.15 digunakan untuk menampilkan data frame yang telah dideklarasikan pada gambar 3.14. Sedangkan perintah kedua digunakan untuk menampilkan elemen 2,3 atau baris kedua kolom ketiga yaitu 7. Begitu juga perintah ketiga, untuk menampilkan elemen pada baris kedua kolom kedua yaitu Rifatmi. Sama halnya dengan perintah keempat yang digunakan untuk menampilkan elemen dalam satu kolom, yaitu kolom nama. D. Data List
Data list merupakan objek yang paling umum atau general dan paling fleksibel dalam R. List adalah suatu vektor terurut dari sekumpulan komponen. Setiap komponen dapat berupa sembarang data objek, yaitu vektor, matriks, daa frame, atau data list sendiri. Tiap komponen pada data list dapat mempunyai mode yang berbeda. Data list menggunakan perintah list. Pada gambar 3.16 merupakan perintah yang digunakan untuk mendeklarasikan data list, yaitu terdiri dari data vektor pada kolom nomer dan TRUE FALSE, serta data frame yang terdiri dari 2 kolom yaitu kolom nama dan kolom nilai.
15
Gambar 3.16 Perintah deklarasi data list cara pertama Begitu juga syntax kedua yang ada pada gambar 3.17. Keduanya sama-sama digunakan untuk mendeklarasikan data list, yang membedakan adalah pada syntax pertama data hanya dideklarasikan tanpa menyimpan dan syntax kedua disimpan dalam datalist_nilai, sehingga data suatu saat dapat dipanggil kembali.
Gambar 3.17 Perintah deklarasi data list cara kedua
16
BAB IV PENUTUP
Dari apa yang telah dijelaskan pada bab-bab sebelumnya maka dapat diambil beberapa kesimpulan. Berikut kesimpulan yang dapat diambil : 1. Keempat jenis data yang ada di program R, yaiu data array, data matrik, data frame dan data list membentuk suatu tingkatan. Dimana data list dapat tersusun dari data list, data frame, data matriks, dan data array atau data vektor. Untuk data frame dapat terdiri dari data data frame sendiri, data matrik dan data vektor. Begitu juga untuk data matrik terdiri dari beberapa data vektor. Maka data vektorlah yang menyusun data matrik, data frame dan data list. 2. Dalam mendeklarasikan suatu perintah dalam R dapat dengan banyak cara. DAFTAR PUSTAKA
Muhajir, Muhammad dan Fauzy, Ahmad. 2014. Modul Praktikum Komputasi Statistika. Jurusan Statistika FMIPA Universitas Islam Yogyakarta : Yogyakarta. www.tulisaninspirasiku.wordpress.com/2012/11/24/r-software-analisis-data/ (diakses pada tanggal 17 April 2012 pukul 16.33 WIB) www.clustr.wordpress.com/2009/07/13/mengenal-r/ (diakses pada tanggal 17 April 2012 pukul 16.59 WIB)
17