REVIEW JURNAL
BI G DATA DATA Muhammad Khoirul Umam
1)
1)
Mahasiswa; Program Studi Teknik Informatika; Sekolah Tinggi Teknologi Pelita Bangsa
[email protected]
ABSTRAK
Dalam era digital yang sangat canggih seperti sekarang ini, segala data (informasi) mudah diakses, disimpan, ditelusuri, bahkan dianalisa. Big dianalisa. Big Data bukan Data bukan sekadar tren yang dipopulerkan oleh kalangan eksklusif, melainkan sebuah penanda perubahan paradigma untuk memahami proses-proses sosial. Mengacu pada manfaat besar yang dapat ditawarkan oleh teknologi Big Data, Data, menarik untuk melihat sejauh mana teknologi teknologi Big Big Data sudah Data sudah dimanfaatkan di Indonesia, contohnya di lembaga pemerintahan, dan tantangan apa saja yang muncul dalam penerapannya. Bagi kalangan akademisi, Big Data telah Data telah memberikan tantangan bagi peneliti sosial dengan adanya perubahan unit analisi s dari manusia menjadi algoritma. Ketersediaan data skala besar dan murah dewasa ini seharusnya mendorong berbagai pihak untuk memanfaatkannnya melalui implementasi Big implementasi Big Data analitik. Data analitik. Peluang dan manfaat penerapan Big Data Data sangat potensial termasuk di pemerintahan. Dengan menggunakan data, kebijakan publik bisa didesain dan diimplentasikan lebih efektif dan tepat untuk mencapai sasaran. Kata Kunci : Big Data, Implementasi Implementasi Big Big Data, Penyimpanan Penyimpanan Data, Analysis Analysis Data
PENDAHULUAN
Arus data dan informasi tumbuh signifikan
keterbukaan atau transparansi merupakan suatu
dalam
hal
ukuran
jumlah
dan
media
yang
yang
sangat
penting
dalam
rangka
bervariasi, yang yang kemudian disebut disebut sebagai Big sebagai Big
melaksanakan fungsi pengontrolan (Djuniardi,
Data
2015). Seperti kita ketahui bahwa kehadiran
(Aprianti,
2013).
Sumber
mengungkapkan, dari segi pengguna Big pengguna Big Data, Data,
pemerintah pemerintah
misalnya, jaringan sosial media Facebook media Facebook pada pada
memiliki peran yang sangat besar dalam
tahun
meningkatkan
2012
memiliki
jumlah
pengguna
mencapai 1 miliar pengguna, dan menangani
sebagai
pelayan
kesejahteraan
masyarakat masyarakat
masyarakat
(Lunando & Purwarianti, 2013)
350 juta unggahan foto, 4,5 miliar like dan like dan 10 miliar pesan setiap hari (Sugiarsono, 2015).
Interaksi antar manusia yang didominasi pada
Dalam era perkembangan teknologi informasi
interaksi manusia dan komputer (computer ( computer
yang semakin pesat di Indonesia saat ini,
mediated communication) communication) telah mengubah tata
1
cara
perilaku
(interaksi)
sosial
serta
pemaknaannya (Narendra, 2013). Memasuki
pihak, baik perusahaan besar, usaha kecil dan menengah, maupun pemerintah (Sirait, 2016).
transisi era informasi menuju era “Internet of things”, segala perilaku manusia direkam,
TINJAUAN PUSTAKA
disimpan, bahkan dianalisa dalam bentuk data
Pengertian Bi g D ata
(Lupton, 2015). Melalui teknologi informasi,
Big Data adalah data berukuran besar yang
triliunan byte data diciptakan setiap hari dari
volumenya akan terus bertambah, terdiri dari
berbagai sumber, seperti dari media sosial,
berbagai jenis atau varietas data, terbentuk
sensor, video surveillance, dan smart grids
secara terus menerus dengan kecepatan tertentu
(Rumata, 2016). Data memiliki peran penting
dan harus diproses dengan kecepatan tertentu
dalam pengambilan keputusan strategis, oleh
pula (Albertus, 2015).
karenanya, pihak yang mampu mengolah dan memanfaatkan data-data yang tersedia dalam
Big Data dapat juga didefinisikan data yang
volume
sudah sangat sulit untuk dikoleksi, disimpan
besar,
kompleksitas penambahan
keragaman
tinggi data
variatif,
dan
yang
kecepatan
tinggi,
dan
dikelola
maupun
dianalisa
dengan
dapat
menggunakan sistem database yang biasa
mengambil keuntungan yang besar (Halper &
karena volumenya yang terus berlipat (King,
Krishnan, 2013). Mengacu pada definisi yang
Lyu, & Yang, 2013). Dari segi teknologi, akan
ada, maka big data akan berkaitan dengan
bermunculan akan pentingnya kemampuan
volume, velositas (kecepatan data mengalir)
untuk memproses big data. Semenjak itu,
dan varietas (keberagaman) data (Aprianti,
teknik akses dan penyimpanan data KVS ( Key-
2013).
Value Store) dan teknik komputasi parallel yang disebut Map Reduce (Aprianti, 2013).
Big
Data merupakan
sebuah
kombinasi
teknologi yang dapat mengelola data yang
Big Data
beragam
dengan
Salah satu definisi Big Data dikemukakan oleh
kecepatan yang tepat, dan pada saat yang tepat
Gartner yang mengatakan bahwa Big Data
untuk keperluan analisis dan reaksi (Alamsyah,
adalah aset informasi yang bervolume sangat
2015). Secara khusus Big Data memiliki tiga
besar
karakteristik,
yaitu volume, velocity, dan
bervariasi yang membutuhkan cara baru
variety (Putranti & Winarko, 2013). Teknologi
pemrosesan untuk memperbaiki pembuatan
Big Data dapat dimanfaatkan oleh banyak
keputusan,
dalam
jumlah
besar,
bergerak sangat cepat, dan
menemukan
mengoptimalkan
proses
pemahaman (Aprianti,
amat
dan 2013).
2
Karakteristik Big Data terletak pada 3V yaitu
Morgan, 2013). Istilah Big Data mulai muncul
volume, velositas dan varietas dan dalam
setelah
perjalanannya tumbuh satu V lagi yaitu value
O’Reilly
yang terkait dengan nilai dan kegunaan data
penggunaan
yang
memahami data tersebut sebenarnya sudah ada
tersedia
(Rumata,
2016).
Besarnya
informasi yang tersedia hingga dalam jumlah yang
tidak
kita
bayangkan
dewasa
Tahun
2005
Media, data
diperkenalkan namun
dan
oleh
sebenarnya
kebutuhan
untuk
sejak jaman dulu (Aryasa, 2015).
ini
merupakan sesuatu keuntungan bagi kita yang
Big Data mengacu pada 3V: volume, variety,
hidup di era informasi, namun demikian juga
velocity, dan ada yang menambahkan unsur V
memiliki sisi perlu kita cermati mengingat
lainnya seperti veracity dan value (Djuniardi,
jumlah yang sangat besar sehingga diperlukan
2015). Volume (kapasitas data) berkaitan
proses seleksi terhadap data yang sungguh
dengan ukuran media penyimpanan data yang
sungguh berguna (Khafid, 2015).
sangat besar atau mungkin tak terbatas hingga satuan petabytes atau zettabytes;
variety
Konsep Big Data
(keragaman data) terkait tipe atau jenis data
Secara garis besar, Big Data tersebar di ruang
yang dapat diolah mulai dari data terstruktur
elektronik (salah satunya internet) yang berasal
hingga
dari beragam sumber yang kompleks di mana
velocity (kecepatan) terkait dengan kecepatan
proses
secara
memroses data yang dihasilkan dari berbagai
pengorganisasian,
sumber, mulai dari data batch hingga real time,
bertahap
pengerjaannya (pengumpulan,
penyimpanan
dilakukan
terstruktur;
sedangkan
sementara karakteristik veracity (kebenaran)
membutuhkan sumber daya yang tidak murah
dan value (nilai) terkait dengan ketidakpastian
(Neri, Aliprandi, & Capeci, 2012). Karena
data dan nilai manfaat dari informasi yang
begitu besar skala dan kompleks prosedurnya,
dihasilkan (Aprianti, 2013).
Data dikelompokkan
analisa)
tidak
serta
Big
hingga
data
menjadi
lima
kategori, yaitu: 1) data sources; 2) content
Pada Big Data, data terlalu besar dan terlalu
format ; 3) data stores; 4) data staging ; 5) data
cepat atau tidak sesuai dengan struktur
processing (Saraswati, 2013). Media sosial
arsitektur database konvensional (Halper &
dikategorikan big data karena merupakan
Krishnan, 2013). Sehingga untuk mendapatkan
sumber data atau informasi yang dapat
nilai dari data, harus digunakan teknologi
dibagikan ( share) atau ditukarkan (exchange)
untuk mengekstrak dan memperoleh informasi
antar individu atau kelompok (communities)
yang lebih spesifik (Sirait, 2016). Terminologi
melalui URL (Conejero, Burnap, Rana, &
Big Data sering dikaitkan dengan data science,
3
data mining , maupun data processing, namun
yang berarti dalam hal teknologi karena
Big Data melibatkan infrastruktur dan teknik
teknologi bisa didapatkan dengan membeli
data mining atau data processing yang lebih
atau
canggih dari sebelumnya (Putranti & Winarko,
(Chandarana & Vijayalakshmi, 2014).
2013). Dalam mengimplementasikan teknologi
kerjasama
dengan
pihak
ketiga
3. Proses
Big Data di suatu organisasi, ada 4 elemen
Dalam proses mengadopsi teknologi Big
penting yang menjadi tantangan, yaitu data,
Data
teknologi, proses, dan SDM (Aryasa, 2015).
organisasi (Lunando & Purwarianti, 2013). Big
dibutuhkan
perubahan
dapat
Data
budaya
membantu
untuk
melakukan analisis dan prediksi terhadap
1. Data
Deskripsi dasar dari data menunjuk pada
pelanggan
benda, event , aktivitas, dan transaksi yang
layanannya atau churn, sehingga dapat
terdokumentasi,
ditindaklanjuti
terklasifikasi,
dan
yang
akan
dengan
menghentikan
mendengarkan
tersimpan tetapi tidak terorganisasi untuk
kebutuhan pelanggan serta melakukan
dapat memberikan suatu arti yang spesifik
pencegahan di awal (Boyd & Crawford,
(Sun & Reddy, 2013). Data yang telah
2012).
terorganisir sehingga dapat memberikan
4. Sumber Daya Manusia (SDM)
arti dan nilai kepada penerima, disebut
Dalam mengaplikasikan teknologi Big
informasi (Berman, 2013). Ketersediaan
Data dibutuhkan SDM dengan keahlian
data menjadi kunci awal bagi teknologi Big
analitik dan kreativitas yaitu kemampuan
Data. Ada beberapa organisasi yang
atau
memiliki banyak data dari proses bisnisnya
metode baru yang dapat dilakukan untuk
yang dilakukan, baik data terstruktur
mengumpulkan,
maupun tidak terstruktur, seperti industri
menganalisis data, keahlian pemrograman
telekomunikasi
komputer, dan ketrampilan bisnis yaitu
maupun
perbankan
(Charles & Tatiana, 2013).
keterampilan
untuk
menentukan
menginterpretasi
dan
pemahaman tentang tujuan bisnis (Hurwits, Nugent, Helper, & Kaufman, 2013).
2. Teknologi
Hal ini terkait dengan infrastruktur dan tools dalam pengoperasian Big Data,
Sumber data dalam teknologi Big Data dapat
seperti teknik komputasi dan analitik, serta
berupa data terstruktur dan tidak terstruktur,
media penyimpanan ( storage) (Hesse,
data terstruktur memiliki tipe data, format, dan
Moser,
Biasanya,
struktur yang telah terdefinisi (Bail, 2014).
organisasi tidak akan mengalami kendala
Data dapat berupa data transaksional, OLAP
&
Riley,
2015).
4
data, tradisional RDBMS, file CSV, spread-
3. Analytic, berhubungan dengan informasi
sheets sederhana (Charles & Tatiana, 2013).
yang
Sementara data tidak terstruktur merupakan
pengelolaan data yang telah diproses.
data tekstual dengan format tidak menentu atau
Analitik yang dilakukan dapat berupa
tidak memiliki struktur melekat, sehingga
descriptive
untuk
terstruktur
diagnostic (mencari sebab akibat berdasar
membutuhkan usaha, tools, dan waktu yang
data), predictive (memprediksi kejadian
lebih. Data ini dihasilkan oleh aplikasi-aplikasi
dimasa
internet, seperti data URL log , media sosial, e-
analytics (merekomendasikan pilihan dan
mail , blog , video, audio serta data semantic
implikasi dari setiap opsi).
menjadikannya
data
akan
didapatkan,
atau
hasil
(penggambaran
depan)
maupun
data),
prescriptive
(Hesse, Moser, & Riley, 2015). Beberapa analytics tools yang digunakan
Tools Big D ata
seperti: MLPACK, Mahout, R. Perangkat
Beberapa tools yang tersedia untuk penerapan
lunak
Big Data dapat dikategorikan menjadi 2,
digunakan karena berbasis open source dan
berbayar ( personalized software) dan tidak
memiliki keunggulan pada pendekatan
berbayar (berbasis open source software), tools
analisis data menggunakan visualisasi
tersebut berkaitan dengan 4 (empat) tahapan
untuk
aktivitas dan dukungan teknologi pada Big
penting dari suatu dataset .
Data yang mencakup (Alamsyah, 2015):
dan cara mendapatkan data.
yang
sudah
banyak
karakteristik
terkait
reporting hasil
paling
dari
yang
visualisasi analitik.
dan
Contoh
application tool yang digunakan pada
2. Accessed , berhubungan dengan daya akses Data
R
menemukan
4. Application
1. Acquired , berhubungan dengan sumber
data.
( software)
tahap ini yaitu RStudio.
dikumpulkan
memerlukan tata kelola, integrasi, storage
METODOLOGI PENELITIAN
dan computing agar dapat dikelola untuk
Implementasi Dalam Memanfaatkan Big
tahap
Data Untuk Mendeteksi Emosi (Aprianti
berikutnya.
processing/computing
Beberapa tools
yang
Putri Sujana, 2013)
digunakan seperti: Hadoop, Nvidia CUDA,
Dengan menggunakan 131 hastags emosi
twitter
sementara
sebagai kata kunci dan mengumpulkan 5 juta
beberapa tools terkait storage antara lain:
tweet untuk 7 kategori emosi (sukacita,
neo4J, Titan, HDFS.
kesedihan, kemarahan, cinta, rasa takut, rasa
storm,
GraphLab,
syukur, kejutan) antara 10 November 2011 dan
5
22
Desember,
2011
Klasifikasi
data
Rasa cinta
affection,
menggunakan LIBLINEAR dan Multinomial
lovin, loving ,
Naïve Bayes (MNB), karena mereka sangat
fondness (7)
efisien bahkan untuk menangani jutaan tweet.
Ketakutan
fear , panic,
Penulis pertama kali mengumpulkan 7 set kata-
fright ,
kata emosi yang berbeda (misalnya, kata
worry, scare
"mengganggu"
(22)
untuk
emosi
marah)
dari
psikologi literatur yang ada, dan kemudian
Rasa syukur
135.154
thankfulness,
dimanfaatkan Twitter API streaming untuk mengumpulkan tweet yang memiliki salah satu
301.759
131.340
thankful (2) Terkejut
surprised ,
dari kata-kata emosi ini dalam bentuk dari
astonished ,
hashtag (misalnya, #menjengkelkan).
unexpected
23.906
(5) Setelah menerapkan penyaringan pada semua
TOTAL
131
2.488.982
tweet akhirnya memperoleh koleksi 2.488.982 tweet . Distribusi tweets per emosi diringkas
Tabel 1. Klasifikasi Emosi Hasil Penyaringan
dalam Tabel I. Implementasi
Teknologi
Big
Data Di
Emosi
Hashtag
Tweet
Lembaga Pemerintahan Indonesia (Emyana
Kegembiraan
excited ,
706.182
Ruth Eritha Sirait, 2016)
happy,
Penelitian
elated ,
kualitatif, dengan teknik pengumpulan data melalui
proud (36) Kesedihan
Sadness,
616.471
fury (23)
mendalam
kepada
beberapa penanggungjawab atau pengelola
yaitu
Lembaga
Kebijakan
Pemerintah Kota Bandung, Direktorat Jenderal
(36)
frustrate,
pendekatan
Pengadaan Barang/Jasa Pemerintah (LKPP),
depressing
annoyed ,
wawancara
penelitian,
unhappy,
irritating ,
menggunakan
teknologi informasi di 4 (empat) objek
sorrow,
Kemarahan
ini
574.170
Pajak, dan Badan Informasi Geospasial (BIG), guna
mendapatkan
gambaran
tentang
pemanfaatan teknologi Big Data di instansi masing-masing, serta tantangan yang dihadapi dalam
penerapannya.
Namun
demikian,
6
implementasi
Big
Data
di
lembaga
pemerintahan Indonesia tidak terbatas pada 4
terhadap
teknologi
Big
Data
dan
nilai
pada
tahap
manfaatnya bagi organisasi.
(empat) lembaga yang disebutkan. Beberapa lembaga pemerintahan diluar objek penelitian,
Tahap
2: pre-adoption,
juga sudah menerapkan Big Data pada
organisasi
berbagai peruntukkan, seperti Pemerintah
terkait
Provinsi DKI Jakarta dan Badan Pusat Statistik
mengimplementasikannya dalam waktu dekat.
(BPS).
Beberapa SDM sudah mulai mempelajari tentang
Selanjutnya,
data
Big
Big
mempersiapkan
Data
Data
analitik
dan
dan
organisasi
langkah akan
sudah
dengan
menginvestasikan tools pendukung Big Data,
menggunakan TDWI (The Data Warehousing
seperti Hadoop, namun ruang lingkupnya
Institute) Big Data Maturity Model , untuk
masih parsial.
mengevaluasi
dianalisis
mulai
ini
kematangan
penerapan
teknologi Big Data pada keempat instansi
Tahap 3: early-adoption, tahap ini ditandai
tersebut. Model kematangan TDWI dipilih
dengan adanya beberapa konsep-konsep (Proof
dibandingkan dengan skala kematangan Big
of
Data lainnya, seperti model Gartner atau
mulai/sudah diujicoba. Organisasi biasanya
Predictive Analytics Maturity Framework
menghabiskan waktu yang lebih lama pada
Assessment (PAMFA) dari Capgemini, dengan
tahap ini, karena terdapat gap yang cukup jauh
pertimbangan lebih mudah dipahami dan
untuk mencapai level selanjutnya, corporate
mengakomodir implementasi Big Data dari
adoption.
Concept/POC)
implementasi
yang
tahap persiapan hingga tahap matang/visioner. Tahap 4: corporate adoption, pada tahap ini Model kematangan Big Data versi TDWI
end
terdiri dari 5 tahapan: nascent, pre-adoption,
wawasan dan mentransformasi proses kerjanya.
early adoption, corporate adoption, dan mature/
Keputusan
visionary (Gambar 3), dan melihat pada 5
menggunakan Big Data analitik.
dimensi,
yaitu:
Organisasi,
users telah
dilibatkan,
dalam
mendapatkan
organisasi
diambil
Infrastruktur,
Manajemen Data, Analitik, dan Governance.
Tahap 5: mature/visionary, pada tahap ini
Penjelasan untuk tiap tahapan yaitu sebagai
organisasi melaksanakan program Big Data
berikut:
sebagai suatu mesin yang ditunjang dengan
Tahap 1: nascent, pada tahap ini, umumnya
infrastruktur yang memadai, perencanaan dan
organisasi memiliki awareness yang rendah
7
strategi yang matang dan pembiayaan yang
Di level internasional, beberapa penelitian
cukup.
pernah dilakukan untuk mengukur status implementasi Big Data di beberapa organisasi. Salah satunya penelitian ‘ Big Data Survey’, yang dilakukan oleh Capgemini Consulting pada tahun 2014 kepada 226 pimpinan
Gambar 1. Tahapan kematangan pada TDWI
Big Data Maturity Model
perusahaan/organisasi global di kawasan Eropa, Amerika
Utara
dan
Asia-Pasifik.
Hasil
penelitian menemukan bahwa paling banyak TDWI
telah
instrument
(35%) dari organisasi yang diteliti berada pada
pengukuran berdasarkan faktor-faktor seperti
tahap partial production, dimana teknologi
ditunjukkan pada Gambar 2, yang terdiri dari
predictive analytics sudah diintegrasikan pada
50
sebagian proses bisnis. Sementara lainnya
pertanyaan
dimensi
mengembangkan
indikator,
dijelaskan
oleh
masing-masing 10
pertanyaan
berada pada tahap perencanaan konsep (29%),
indikator. Namun, karena pengumpulan data
belum diimplementasikan (24%), dan hanya
yang dilakukan dalam penelitian ini berupa
13% yang sudah mencapai tahap pemanfaatan
data kualitatif dan bukan kuantitatif melalui
secara matang (Colas, 2014).
survei, maka penilaian kematangan Big Data versi TDWI tidak dapat diaplikasikan secara rigid,
hanya
mengacu
pada
tahapan
kematangannya saja.
Gambar 3. Status implementasi teknologi Big
Data di beberapa organisasi dunia
Pada level nasional, potensi penggunaan Big Data untuk layanan pemerintah di Indonesia pernah dikaji sebelumnya (Taufan, 2015). Gambar 2. TDWI Big Data Maturity
Assessment Criteria
Dalam
tulisan
tersebut
dikatakan
bahwa
pemerintah sebagai penyelenggara layanan publik memiliki peluang untuk menggunakan Big Data dalam beberapa proses layanan e-
8
Government . Pengintegrasian data dan layanan
tanda baca yang diulang lebih dari dua kali
adalah salah satu cara untuk memanfaatkan Big
dengan dua huruf yang sama/tanda baca
Data. Banyak sektor yang bisa disinergikan
(misalnya: cooool
antara lain transportasi, pertanian, ketenagakerjaan, perkebunan, kelautan dan masih banyak lagi. Kajian tersebut juga memberikan benchmarking
pemerintahan
yang
menggunakan Big Data dalam
sudah
beberapa
→
keren); dinormalisasi
beberapa contoh yang sering digunakan untuk ekspresi formal (misalnya: ‘ll → will , don’t
→
do not), dan menanggalkan simbol hash (#besok → besok).
layanan publik, seperti Jepang, Inggris, Taiwan, Thailand, dan Korea, namun sayangnya belum menggambarkan penggunaan Big Data pada pemerintahan di Indonesia.
Kinerja keseluruhan classifier dapat dihitung dengan :
HASIL DAN PEMBAHASAN
=
# #
Implementasi Dalam Memanfaatkan Big
Data Untuk Mendeteksi Emosi
Untuk dataset dilambangkan dengan E adalah
Dari 2.488.982 tweet pada Tabel II, secara acak
tweet dengan
sampel 250.000 tweet sebagai dataset uji Te,
klasifikasi
selain itu secara acak sampel 247.798 tweet
penyaringan.
sebagai dataset pengembangan untuk tuning
precision dari emosi :
emosi,
dari
E’
emosi
tweet dengan
setelah
Kemudian
dapat
dilakukan dihitung
algoritma, dan menggunakan 1.991.184 tweet tersisa
(dilambangkan
sebagai
Tr)
untuk
=
| E ∩ E′ | | ′ |
training data. Analisa dilakukan dengan data dibagi
menjadi
delapan
Tr
subset
(dilambangkan sebagai Tr1, Tr2, …, TR8), masing-masing terdiri 248.898 tweet. Tr1
Precision adalah klasifikasi
tingkat
terhadap
ketepatan
hasil
kejadian.
Dan
suatu
menghitung recall dari emosi :
digunakan untuk menjelajahi fitur yang efektif, dan semua delapan subset yang digunakan untuk pengujian.
=
|E ∩ E′ | ||
Data preprocessing : lower-cased , mengganti
Recall adalah tingkat keberhasilan suatu
user yang ditautkan (misalnya, @ladygaga )
kejadian dari seluruh kejadian yang harusnya
dengan @user menjadi anonim mengganti
dikenali. Penulis meneliti efek meningkatkan
9
ukuran dataset pelatihan pada keakuratan
Penurunan kinerja dapat dilihat pada tiga emosi
LIBLINEAR
kurang
dan
MNB
pengklasifikasi.
popular
yaitu
love, fear ,
dan
Karena kebanyakan identifikasi emosi yang
thankfulness yang terdiri dari 23,0% dari
masih ada dilakukan pada dataset ribu kalimat,
semua tweet dalam dataset. Precision dari tiga
kami berharap untuk mendapatkan wawasan
kategori emosi yang relatif tinggi (dengan
baru dan manfaat menggunakan data pelatihan
precision terendah
yang besar.
dengan recall , tetapi karena sangat rendah
58,1%)
dibandingkan
untuk masing-masing emosi. Untuk minoritas Emosi
Precision
Recall (%)
emosi yang tersisa yaitu surprise, dengan hanya 1,0%
(%)
dari
seluruh
tweet ,
classifier
Joy 28.5%
67.6
72.1
mendapatkan precison terendah begitu pula
Sadness
62.6
64.7
dengan recall dari data pelatihan.
Anger 23.0%
69.8
71.5
Implementasi
Love 12.1%
58.1
51.5
Lembaga Pemerintahan Indonesia
Fear 5.6%
59.7
43.9
Berdasarkan
Thankfulness
66.6
57.1
lapangan, akan dipaparkan dan dianalisis
24.6%
hasil
Big
Data Di
pengumpulan
data
di
implementasi teknologi Big Data di 4 (empat)
5.3% Surprise
Teknologi
44.7
13.9
1.0%
instansi/kementerian/lembaga
yang
telah
menginisiasi dan memanfaatkan Big Data pada proses bisnisnya. Namun demikian, tidak
Tabel 2. Liblinear dengan Data Training
berarti implementasi Big Data di Indonesia baru sebatas pada empat lembaga yang
Tabel 2 menunjukkan kinerja LIBLINEAR
disebutkan. Penulis yakin banyak lembaga
classifier (dengan semua tweet di Tr) pada
pemerintahan
masing-masing kategori emosi. Terdapat tiga
menerapkan
emosi yang paling popular yaitu joy, sadness
peruntukkan, seperti Pemerintah Provinsi DKI
dan anger , yang merupakan 76,1% dari seluruh
Jakarta dan Badan Pusat Statistik (BPS).
tweet , classifier mencapai precision lebih dari
Namun karena keterbatasan pengumpulan data
62% dan recall lebih dari 66% untuk masing-
yang dilakukan, hanya empat lembaga yang
masing dari tiga emosi.
termasuk dalam objek penelitian ini. 1. Lembaga
lainnya Big
yang
juga
Data dalam
Kebijakan
sudah berbagai
Pengadaan
Barang/Jasa Pemerintah (LKPP)
10
Sebagai
lembaga
yang
bertugas
kota
Bandung
untuk
mengatasi
dan
lapangan semisal kemacetan/kebakaran.
Barang/Jasa
kebijakan
Pemerintah,
melakukan
inovasi
Pengadaan LKPP
berbasis
telah
teknologi
cepat
kejadian
dan
melaksanakan pengembangan, perumusan, penetapan
dengan
memantau
di
Selanjutnya Integrated Operation Center yaitu sistem notifikasi otomatis sesuai
informasi untuk dapat memfasilitasi sistem
Standard
Layanan Pengadaan Secara Elektronik
misalnya SOP penanganan kebakaran atau
(LPSE) di semua Kementerian / Lembaga /
SOP pengamanan demonstrasil; serta GPS
Daerah. Dari 630 LPSE yang ada di seluruh
tracking terhadap kendaraan dinas seperti
Indonesia, 90% sudah terintegrasi dengan
mobil pemadam kebakaran dan ambulans.
teknologi cloud LKPP sehingga seluruh
Adapula
database, file, dan aplikasi di LPSE dapat
merupakan pertolongan kondisi darurat
di-backup.
(emergency) bagi penduduk Bandung.
Bandung,
(SOP)
aplikasi panic button yang
dibawah
ini beroperasi 24 jam, dengan dukungan 5
Ridwan
Kamil,
orang pegawai dan 8 orang tenaga honorer.
baru
berbasis
Diantara aplikasi-aplikasi tersebut, yang
teknologi informasi dengan membangun
berbasis teknologi Big Data yaitu social
Digital Command Center di tahun 2015.
media analytics. Social media analytic
Fasilitas ini terletak dikawasan Balai Kota
menyajikan data trending topic dan analisis
Bandung
tentang Kota Bandung yang diperoleh dari
pimpinan
Kota
System
Command center milik Pemkot Bandung
2. Pemerintah Kota Bandung
Pemerintah
Operating
Walikota
melakukan
terobosan
dan
wewenang
Dinas
beroperasi
dibawah
Komunikasi
dan
sosial media (facebook dan twitter).
Informatika. Layanan ini akan mendukung Pemkot Beragam aplikasi tersedia di command
Bandung untuk mengetahui topik terhangat
center
akses
yang dibahas oleh masyarakat Bandung
data/informasi kunci dari 34 Satuan Kerja
saat ini dan membantu memetakan masalah
Perangkat
30
di setiap kecamatan. Dengan demikian,
kecamatan untuk menampilkan laporan
pemerintah dapat melakukan evaluasi
kinerja
terhadap
tersebut,
Daerah
seperti
(SKPD)
masing-masing
dan
instansi
atau
program
transparansi proses pengadaan barang/jasa
berdasarkan
yang dilakukan. Selain itu, monitoring
memudahkan
pengambilan
CCTV yang tersebar di beberapa titik di
Aplikasi
merupakan
ini
respon
dan
kebijakannya
masyarakat
dan
keputusan. hibah
dari
11
Norwegia, yang dikembangkan lebih lanjut
Transformasi TIK Ditjen Pajak, Ir. Iwan
oleh vendor lokal.
Djuniardi,
MM.
menjelaskan
bahwa
terobosan dimulai dengan menyediakan 10 PC, menjalin kerjasama dengan komunitas, menggunakan aplikasi open source, serta pengadaan satu cluster enterprise data warehouse, satu cluster Hadoop untuk integrasi data, dan satu cluster Hadoop Gambar 4. Tweet map untuk memonitor
isu publik terkini di kota Bandung
untuk
platform
data.
Contoh
hasil
sementara use case yang didapat yaitu:
Analisa
Central
Tax
Analysis:
ditemukan 3.563 kasus senilai 32, 7 Trilyun.
Penerbitan faktur tidak berdasarkan transaksi
sebenarnya:
ditemukan
21.123 kasus senilai 6,2 Trilyun. Gambar 5. Tweet map berdasarkan
kategori isu di kota Bandung
3. Direktorat Jenderal Pajak
Ditjen Pajak mencoba mengoptimalkan pemanfaatan teknologi informasi untuk meningkatkan penerimaan negara dan memerangi kecurangan terkait pajak. Salah satunya rencana menggali data lewat media sosial untuk dicocokkan dengan laporan pajak dan data rekening tabungan. Hal tersebut sangat membutuhkan dukungan teknologi Big Data.
Penerbitan faktur pajak ganda: dengan menggunakan Hadoop cluster 10 pc, dapat selesai dalam 9 jam, lebih cepat dibanding
menggunakan
RDBMS
yang memakan waktu 3 hari lebih, terhadap 1,77 milyar data faktur.
Ditjen Pajak akan terus mengeksplorasi penggunaan teknologi Big Data karena sudah
menjadi
kebutuhan.
Di
saat
bersamaan diperlukan perbaikan aturan dan pengadopsian proses bisnis “out-ofbox”
untuk
membuatnya
berhasil
(Djuniardi, 2015).
Berdasarkan pengalaman Ditjen Pajak menuju implementasi Big Data, Direktur
12
dan informasi geospasial bagi kepentingan semua sektor. Sembilan puluh persen aktifitas kepemerintahan memiliki elemen spasial, sehingga diperlukan kesamaan Gambar 6. Tampilan Mesin Pencari Data
Ditjen Pajak untuk mencari informasi mengenai wajib pajak di Indonesia
gerak
antar
instansi.
diharapkan
adalah
informasi
dapat
Implikasi
seluruh
yang
data
dengan
dan
mudah
diintegrasikan untuk memecahkan masalah secara komprehensif, lebih cepat dan lebih
4. Badan Informasi Geospasial (BIG)
No.
baik, serta menghasilkan berbagai macam
4/2011 tentang Informasi Geospasial dan
analisis yang lebih tajam dan komprehensif.
Perpres No. 27/2014 tentang Jaringan
Peran Data dan Informasi Geospasial
Informasi Geospasial Nasional (JIGN)
sangat signifikan (Khafid, 2015) yaitu:
Dengan
adanya
Undang-Undang
yang mengamanatkan kebijakan satu peta
Pengambilan keputusan yang efisien
Informasi
dan efektif memerlukan informasi
Geospasial diharapkan menjadi referensi
spasial maupun non-spasial yang up-
tunggal
to-date dan akurat, yang menjelaskan
(one
map
policy),
untuk
Badan
informasi
geospasial.
situasi terkini yg terjadi.
Dengan demikian, lembaga ini menjadi basis dan pengelola data ruang kebumian
Tidak satupun institusi yang memiliki
yang berukuran sangat besar. Data ruang
data dan informasi lengkap untuk
kebumian mengacu pada lokasi, letak, dan
keperluan pengambilan keputusan di
posisi suatu objek atau kejadian yang
berbagai sektor, sehingga data sharing
berada
merupakan sebuah keharusan.
dibawah,
pada,
atau
diatas
permukaan bumi dalam sistem koordinat
Diperlukan penggunaan
tertentu.
pengaturan teknologi
yang
dan tepat
untuk mengatasi permasalahan akses Elemen geospasial (lokasi) dari sebuah
terhadap informasi geospasial untuk
informasi digunakan sebagai identifier
mendukung
utama
untuk
keputusan yang efisien dan efektif,
mengintegrasikan berbagai jenis informasi,
maka dibangunlah GeoSpatial Data
sehingga data tersebut akan dibuat terbuka
Infrastructure (SDI).
(core
identifier )
proses
pengambilan
untuk memungkinkan berbagi pakai data
13
Adapun manfaat dari ‘ sharing ’ Informasi GeoSpasial, yaitu:
Menghindari penyediaan
duplikasi data
dan
dalam informasi
geospasial.
Meningkatkan kualitas dan meredusir harga data dan informasi spasial.
Menjadikan
data
dan
Gambar 6. Pengelolaan Informasi
informasi
Geospasial untuk pembangunan
geospasial mudah diakses oleh pihak
berkelanjutan
yang memerlukan.
Membangun kemitraan antar berbagai institusi
untuk
meningkatkan
ketersediaan data dan informasi.
Selanjutnya, deskripsi kualitatif diatas akan dianalisis dengan kerangka analisis TDWI Big Data Maturity Model untuk mengetahui level kematangan penerapan teknologi Big Data di
Badan
Informasi
mengantisipasi
Geospasial
penggunaan Big
telah Data
dalam mengelola data melalui penyediaan kapasitas storage hingga 2 petabytes, menggunakan
high
performance
computing (HPC) dan geoprocessing , serta memanfaatkan cloud computing. Data yang harus diolah mencakup data citra, GPS, foto udara, peta tematik, pasut, yang
keempat instansi tersebut. Status kematangan dapat dicirikan dari indikator-indikator pada lima dimensi yang mencakup: organisasi, infrastruktur, manajemen data, analitik, dan tata
kelola,
sehingga
nantinya
dapat
disimpulkan apakah penerapan teknologi Big Data di keempat instansi tersebut berada pada tahap nascent , pre-adoption, early adoption, corporate adoption, atau mature/visionary.
sebagian diterima secara real time melalui sistem TEWS (Tsunami Early Warning System), aplikasi pemetaan partisipatif, maupun Geoportal, yaitu jaringan data spasial digital berbasis web.
14
Pajak, dapat dikategorikan berada pada tahap pre-adoption. Ciri yang terlihat adalah sudah ada kesadaran dari lembaga dan pimpinan untuk melakukan perbaikan proses bisnis dengan
melibatkan
teknologi Big
Data.
Lembaga juga sudah mulai bereksperimen dengan beberapa tools pendukung Big Data, namun sistem analitik belum berjalan dan dipakai untuk memecahkan masalah.
Hal yang tidak jauh berbeda terjadi di Badan Informasi Geospasial (BIG), implementasi Big Tabel III. Identifikasi indikator pendukung
implementasi big data di empat objek
Data pada lembaga tersebut berada pada tahap pre-adoption. Lembaga telah mengantisipasi
penelitian
penggunaan Big Data dalam proses bisnisnya, dan
Dari proses identifikasi yang dilakukan pada Tabel 3, dapat dikatakan bahwa penerapan Big Data di LKPP berada pada tahap pre-adoption. Hal ini dicirikan dari lembaga telah mulai mempersiapkan infrastruktur aplikasi
dan
dan
menginvestasikan
mengujicoba
untuk Big
beberapa
Data analitik,
telah
telah
menginvestasikan
infrastruktur
pendukung, namun mekanisme kerja dan budaya analitik belum terlaksana. Kekuatan BIG
menuju Big
Data terletak
pada
ketersediaan beragam data yang update, real time,
terintegrasi
memungkinkan
dan
terbuka,
pemanfaatannya
sehingga untuk
kepentingan berbagai sektor.
mempunyai kebijakan, perencanaan proses bisnis dan cakupan yang akan dilakukan dengan Big Data.
Sementara penerapan teknologi Big Data di Pemkot Bandung sudah jauh lebih matang, sehingga dapat dikategorikan berada pada
Namun, strategi dan budaya implementasi, serta mekanisme kerja belum terbangun dan dilaksanakan. infrastruktur
Selain yang
itu,
arsitektur
dibangun
serta
dari tata
kelolanya belum dapat ditunjukkan. Demikian pula dengan penerapan Big Data di Ditjen
tahap corporate adoption. Hal ini dicirikan dari infrastruktur penunjang Big Data yang telah terintegrasi, dimana end users (masyarakat, SKPD, kecamatan) telah dilibatkan dalam sistem dan mendapatkan manfaat. Dengan sistem Big Data analitik yang ada, dapat
15
diketahui kondisi real dilapangan sehingga
dari momen emosional dalam hidup kita
membantu pimpinan mengambil keputusan dan
sehari-hari.
meningkatkan kualitas layanan serta fasilitas pemerintah kepada masyarakat. Untuk dapat
Ketersediaan data skala besar dan murah
mencapai kategori mature/visionary, beberapa
dewasa ini seharusnya mendorong berbagai
hal yang perlu ditingkatkan dalam sistem Big
pihak
Data
yaitu
implementasi Big Data analitik. Peluang dan
menambah infrastruktur cloud, meningkatkan
manfaat penerapan Big Data sangat potensial
aspek keamanan data, serta meningkatkan
termasuk
budaya kerja dan awareness dari pegawai dan
menggunakan data, kebijakan publik bisa
masyarakat setempat untuk memanfaatkan
didesain dan diimplentasikan lebih efektif dan
teknologi Big Data yang telah dibangun.
tepat untuk mencapai sasaran.
KESIMPULAN
Dari hasil penelitian yang telah dilakukan
Berdasarkan pembahasan diatas dapat ditarik
secara kualitatif, dapat disimpulkan bahwa dari
kesimpulan bahwa implementasi teknologi Big
empat lembaga yang diteliti, tiga diantaranya
Data dalam berbagai lingkup akan sangat
yaitu
membantu
dalam
Barang/Jasa Pemerintah (LKPP), Direktorat
pengolahan data dalam skala besar, khususnya
Jenderal Pajak Kementerian Keuangan, dan
pada lingkup pemerintahan. Dalam lingkup
Badan Informasi Geospasial (BIG) berada pada
kehidupan
tahap pre-adoption, mengacu pada TDWI Big
analitik
dan
sosial
Pemkot
Bandung
mempermudah
contohnya,
dapat
kita
simpulkan bahwa:
untuk
memanfaatkannnya
di
Lembaga
melalui
pemerintahan.
Kebijakan
Dengan
Pengadaan
Data Maturity Model . Sementara Pemerintah
Hastag dapat diidentifikasi menjadi sebuah
Kota Bandung dapat dikategorikan berada pada
emosi yang secara otomatis ditulis oleh
tahap corporate adoption. Terkait tantangan
penulis ini lebih akurat dibandingkan
dalam
metode pendeteksian emosi dengan text.
pemerintahan Indonesia dapat disimpulkan 5
Cara ini sangat cepat mengingat data yang
hal, mencakup ketersediaan data, standarisasi
dikumpulkan lebih banyak.
data pemerintah, privasi data, kompetensi
Data training yang lebih besar akan
SDM, serta infrastruktur penunjang.
adopsi
teknologi
Big
Data
di
menyebabkan akurasi yang lebih tinggi untuk identifikasi emosi karena dapat
Untuk itu, instansi-instansi pemerintah perlu
memberikan cakupan yang komprehensif
secara
cermat
merencanakan
dan
mengimplementasikan teknologi Big Data,
16
dimulai
dari
koordinasi
antar
lembaga
Management: Approach.
pemerintah serta berbagi data dan integrasi data untuk lebih meningkatkan pelayanan publik. Untuk penelitian selanjutnya, dapat dilakukan survei/pengukuran kuantitatif terhadap tingkat
A
Social
Network
Aprianti, P. S. (2013). Memanfaatkan Big Data Untuk Mendeteksi Emosi. Aprilius, W. (2015). Big Data Dan Perawatan Kesehatan.
kematangan implementasi teknologi Big Data menggunakan instrumen penilaian yang telah dikembangkan oleh TDWI, pada lebih banyak instansi
pemerintah.
Dengan
demikian,
didapatkan gambaran yang lebih komprehensif tentang implementasi teknologi Big Data di lembaga pemerintahan Indonesia.
ACKNOWLEDGEMENT
Penulis mengucapkan puji syukur kehadirat Tuhan Yang Maha Esa, Allat SWT atas terselesaikannya review jurnal yang berjudul Big
Data ini.
Penulis
juga
tak
lupa
mengucapkan terima kasih kepada Ibu Putri Anggun Sari selaku dosen pembimbing yang telah
memberikan
saran,
masukan,
dan
ilmunya dalam penyusunan review jurnal ini. Dan dalam penyusunan review jurnal ini, penulis sadar bahwa masih banyak kekurangan baik dalam hal penulisan, format, dan referensi penyusunannya. Penulis berharap semoga review jurnal ini dapat bermanfaat bagi pembaca maupun bagi penulis.
DAFTAR PUSTAKA
Alamsyah, A. (2015). (Big) Data Analytics for Economics, Business and
Bail, C. A. (2014). The Cultural Environment: Measuring Culture with Big Data. Batrinca, B., & Treleaven, P. C. (2015). Social Media Analytic: A Survey of Techniques, Tools and Platforms. Berman, J. J. (2013). Principles of Big Data: Preparing, Sharing, and Analyzing Complex Information. Boyd, D., & Crawford, K. (2012). Critical Questions for Big Data: Information, Communication & Society. Chandarana, P., & Vijayalakshmi, M. (2014). Big Data analytics frameworks: Circuits, Systems, Communication and Information Technology Applications (CSCITA). Charles, V., & Tatiana, G. (2013). Achieving Competitive Advantage through Big Data: Strategic Implications. MiddleEast Journal of Scientific Research. Colas,
M. (2014). Cracking the Data Conundrum: How Successful Companies Make Big Data Operational. Capgemini Consulting.
Conejero, J., Burnap, P., Rana, O., & Morgan, J. (2013). Scaling Archived Social Media Data Analysis using a Hadoop Cloud. Crawford, K., & Schultz, J. (2014). Big Data and Due Process: Toward a Framework to Redress Predictive Privacy Harms.
17
Djuniardi, I. (2015). Perjalanan Menuju Implementasi Big Data: Pengalaman Direktorat Jenderal Pajak.
Saraswati, N. W. (2013). Naive Bayes Classifier dan Support Vector Machines Untuk Sentiment Analysis.
Halper, F., & Krishnan, K. (2013). TDWI Big Data Maturity Model Guide: Interpreting Your Assessment Score.
Sirait, E. R. (2016). Implementasi Teknologi Big Data Di Lembaga Pemerintahan Indonesia.
Hashem, T., I. A., Yaqoob, I., Anuar, N. B., Mokhtar, S., Gani, A., & Khan, S. U. (2015). The Rise of “Big Data” on Cloud Computing: Review and Open Research Issues. Information Systems.
Sun, J., & Reddy, C. K. (2013). Big Data Analytics for Healthcare.
Hesse, B. W., Moser, R. P., & Riley, W. T. ( 2015). From Big Data to Knowledge in the Social Science. Hurwits, J., Nugent, A., Helper, D. F., & Kaufman, M. (2013). Big Data For Dummies A Wiley Brand. Khafid.
(2015). Pengelolaan Informasi Geospasial.
Data
dan
King, I., Lyu, M. R., & Yang, H. (2013). Online Learning for Big Data Analytics. Lunando, E., & Purwarianti, A. (2013). Indonesian Social Media Sentiment Analysis with Sarcasm Detection. Narendra, A. P. (2013). Data Besar, Data Analisis, dan Pengembangan Kompetensi Pustakawan. Neri, F., Aliprandi, C., & Capeci, F. (2012). Sentiment Analysis on Social Media. Putranti, N. D., & Winarko, E. (2013). Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine. Rumata, V. M. (2016). Peluang Dan Tantangan Big Data Dalam Peneltian Ilmu Sosial.
18