Latihan UAS: Big Data and Data Analytics CLUSTERING ANALYSIS SOAL 1: Clustering a. Apa Apa itu itu Clu Clust ster er Ana Analy lysi siss b. Berikan Berikan beberapa beberapa contoh contoh penerapan penerapan metode metode Cluster Cluster Analysis Analysis dalam dalam bisnis bisnis atau kajian ilmiah ilmiah c. Gunakan Gunakan metode metode hierarch hierarchical ical clusteri clustering ng Min untuk untuk ilustr ilustrasi asi Gambar Gambar 1 dan buat buat pula pula dendogrammnya, dendogrammnya, jika k = 3, tentukan cluster apa saja yang terbentuk (berikut anggotanya) Gambar 1 Jarak Euclidian* 3–6:3 2–5:8 3–4:6 2–4:7 6–4:8 5–4:2 1–2:1 1–3:4 2–3:2 1–6:4
*: pendekatan untuk kemudahan analisa
d. Apa yang yang mem membed bedaka akan n anal analisi isiss clustering dengan classification, berikan contoh e. Berikan Berikan contoh satu satu buah algoritma/m algoritma/metode etode yang yang dipakai dalam dalam pemodelan pemodelan analisis analisis clusterin clustering, g, jelaskan secara singkat, singkat, padat, dan jelas f. Bayangkan Bayangkan data data transaksi transaksi di suatu suatu supermar supermarket. ket. Coba Coba perkirakan, perkirakan, kluster kluster apa apa saja yang mungki mungkin n muncul berdasarkan 2 atau lebih atribut dari suatu tabel transaksi. Anda bebas memilih atribut yang dipakai. Jelaskan, mengapa muncul klaster-klaster tersebut. Jumlah klaster minimal 3. Anda perlu menggunakan pengalaman dan pengetahuan anda di bidang ilmu lainnya untuk menjawab pertanyaan ini. Jangan terjebak dengan pengelompokan klasifikasi. g. Bagaimana Bagaimana anda mengukur mengukur validitas validitas model model cluste cluster? r?
ASSOCIATION RULES ANALYSIS SOAL 1: Association Rules Analysis a. Jelaskan Jelaskan apa apa itu Assoc Associatio iation n Rules Rules Analysi Analysiss (minimal (minimal 5 kalimat) kalimat)
b. Berikan 3 contoh rules yang muncul berdasarkan Tabel 2 di bawah lengkap dengan nilai s (support) dan c (confidence) untuk masing-masing rules tadi c. Berdasarkan jawaban poin b di atas, mana yang kira-kira paling menarik bagi seorang Manager Sales, jelaskan. d. Selain nilai support dan confidence, apakah ada metrik lain untuk mengukur suatu model Association Rules? Tabel 2
e. Berikan kasus penerapan Association Rules analisis selain dari kasus market basket analysis di supermarket
SOCIAL NETWORK ANALYSIS Soal 1: SNA a. b. c. d. e. f. g.
Jelaskan apa itu Social Network Analysis Berikan 3 contoh penerapan SNA untuk bisnis atau kajian ilmiah Jelaskan 3 buah metrik SNA untuk mencari Key Players Jelaskan 3 buah metrik SNA untuk analisis Cohesion Apa yang dimaksud dengan Small World? Jelaskan pula menggunakan konsep metrik SNA. Hubungkan fenomena Small World dengan Preferential Attachment. Berdasarkan model network di bawah, siapa saja yang menjadi key players dan perannya dalam kelompok? Jelaskan dengan menggunakan konsep dan perhitungan metrik key players di SNA. (Pilihlah beberapa kandidat terlebih dahulu berdasarkan pengamatan visual. Lalu hitung metrik terkait untuk kandidat-kandidat tersebut). h. Siapa yang paling mungkin mengontrol informasi di kelompok di bawah? Jelaskan.
TEXT MINING SOAL 1: Text Mining a. b. c. d. e.
Apa itu Text Mining Analysis (minimal 5 kalimat) Berikan 3 contoh penerapan metode Text Mining (Sentiment Analysis) Jelaskan beberapa proses (tugas) penting dalam melakukan Text Mining Jelaskan apa itu metode klasifikasi Naïve Bayes Diketahui data review film seperti pada tabel 4 di bawah dan hasil perhitungan Possible Outcome “Good Review” dan “Bad Review” pada Tabel 5. Setelah beberapa saat, muncul sebuah review baru dengan nomor 6, “Great Acting, Good Movie”. Berdasarkan metode klasifikasi Naïve Bayes, review nomor 6 tersebut akan dianggap sebagai Good Review atau Bad Review? Jelaskan dengan perhitungan Possible Outcome. Tabel 4 Do c
Text
Class
1
I loved the movie
+
2
I hated the movie
-
3
A great movie, good movie
+
4
Poor acting
-
5
Great acting, a good movie
+
Tabel 5 P (+)
=
3 5
= 0, 6
=
2 5
= 0, 4
= P (+) = P (+) =
0, 0833 0, 0833 0, 0833
2+1 = 14+10 = 0, 125 2+1 P (+) = 14+10 = 0, 125 0+1 P (+) = 14+10 = 0, 0417
P (+)
0, 2083
P (+)
P (+)
P (+)
1+1 = 14+10 1+1 = 14+10 1+1 = 14+10 (4+1) = 14+10 = 0+1 = 14+10 =
P (−)
0, 0417
1+1 = 0, 125 6+10 0+1 P (−) = 6+10 = 0, 0625 1+1 P (−) = 6+10 = 0, 125 1+1 P (−) = 6+10 = 0, 125 1+1 P (−) = 6+10 = 0, 125
P (−)
=
P (+)
P (+)
(1+1) = 0, 0833 14+10 2+1 = 14+10 = 0, 125
=
0+1 = 0, 0625 6+10 0+1 P (−) = 6+10 = 0, 0625 1+1 P (−) = 14+10 = 0, 125 1+1 P (−) = 6+10 = 0, 125 0+1 P (−) = 6+10 = 0, 0625
P (−)
=
Catatan: Untuk kemudahan perhitungan, silahkan normalisasi dan bulatkan angka di dalam tabel 5. Misalkan 0,0833 dikalikan 100 menjadi 8,33. Lalu dibulatkan ke atas menjadi 8. Sama dengan cara di atas, nilai 0,2083 dinormalkan dan dibulatkan menjadi 20.