PENGGUNAAN DUA TAHAP METODE DAN DUA TAHAP PENGGEROMBOLAN PADA PEUBAH CAMPURAN (Studi Kasus : Tanaman Obat)
REVI ROSDIANA
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Penggunaan Dua Tahap Metode dan Dua Tahap Penggerombolan pada Peubah Campuran (Studi Kasus : Tanaman Obat) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2014
Revi Rosdiana NIM G14100108
ABSTRAK REVI ROSDIANA. Penggunaan Dua Tahap Metode dan Dua Tahap Penggerombolan pada Peubah Campuran (Studi Kasus : Tanaman Obat). Dibimbing oleh MUHAMMAD NUR AIDI dan INDAHWATI. Dua Tahap metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) merupakan alat analisis gerombol untuk data dengan tipe peubah campuran yakni data yang mengandung tipe peubah kategorik dan tipe peubah numerik. Pada penelitian ini Dua Tahap Metode akan diaplikasikan pada data tanaman obat yang juga dibandingkan efektifitas pemakaiannya dengan Dua Tahap Penggerombolan (TwoStep Cluster). Data tanaman obat tersebut didapatkan dari website resmi Fakultas Farmasi Universitas Airlangga mengenai Sistem Informasi Tanaman Obat. Tanaman obat yang digunakan pada penelitian ini berjumlah 149 tanaman obat. Hasil penggerombolan dengan Dua Tahap Metode menghasilkan 50 gerombol pada analisis HAC dan 3 gerombol dengan analisis K-Means sebagai hasil akhir. Gerombol 1 memiliki 5 tanaman obat, gerombol 2 memiliki 134 tanaman obat sedangkan gerombol 3 memiliki 10 tanaman obat. Hasil penggerombolan dengan Dua Tahap Penggerombolan didapatkan 3 gerombol dengan 47 tanaman obat pada gerombol 1, 55 tanaman obat pada gerombol 2, dan sebanyak 47 tanaman obat pada gerombol 3. Hasil pengukuran kebaikan penggerombolan dengan menggunakan CTM didapatkan bahwa penggerombolan menggunakan Dua Tahap Metode lebih baik dalam membentuk gerombol dibandingkan dengan Dua Tahap Penggerombolan. Kata kunci: Dua Tahap Metode, Dua Tahap Penggerombolan, CTM, HAC, KMeans
ABSTRACT REVI ROSDIANA. Use of Two-Stage Method and Two-Stage Clustering In Mixed Variables (Case Study: Medicinal Plants). Guided by MUHAMMAD NUR AIDI and INDAHWATI. Two-Stage Method or TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) is a tool for clusters data analysis with variable types of data that contain a mixture of the type of categorical variables and the type of numeric variables. In this study, a Two-Stage Methods will be applied for data medicinal plants are also compared the effectiveness of its use with TwoStage Clustering (TwoStep Cluster). The medicinal plant data obtained from the official website of the Faculty of Pharmacy, Airlangga University Medicinal about Plants Information System. Medicinal plants used in this study amounted to 149 medicinal plants. Results of the Two-Stage Method produce 50 clusters on the HAC analysis and 3 clusters of K-Means analysis as the final result. Clusters 1 has 5 medicinal plants, clusters 2 has 134 medicinal plants while clusters 3 has 10 medicinal plants. Results of Two-Stage Clustering obtained 3 clusters with 47 medicinal plants in clusters 1, 55 medicinal plants in clusters 2, and as many as 47
medicinal plants in clusters 3. Results goodness measurement clustering using CTM was found that using the Two-Stage Method better than Two-Stage Clustering in form clusters. Keywords: Two-Stage Method, Two-Stage Clustering, CTM, HAC, K-Means
PENGGUNAAN DUA TAHAP METODE DAN DUA TAHAP PENGGEROMBOLAN PADA PEUBAH CAMPURAN (Studi Kasus : Tanaman Obat)
REVI ROSDIANA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika di Fakultas Matematika dan Ilmu Pengetahuan Alam IPB
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Judul Skripsi : Penggunaan Dua Tahap Metode dan Dua Tahap Penggerombolan Pada Peubah Campuran (Studi Kasus : Tanaman Obat). Nama : Revi Rosdiana NIM : G14100108
Disetujui oleh
Dr Ir Muhammad Nur Aidi, MS Pembimbing I
Dr Ir Indahwati, MSi Pembimbing II
Diketahui oleh
Dr Anang Kurnia, MSi Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala karena atas berkah dan hidayah-Nya lah, penulis bisa menyelesaikan tugas akhir ini. Tak lupa solawat serta salam mudah-mudah selalu tercurah limpah kepada Nabi besar semesta alam, Nabi Muhammad SAW. Pada penelitian ini penulis mengangkat tema analisis gerombol dan terspesifikasi menjadi perbandingan metode pada analisis gerombol. Terima kasih penulis ucapkan kepada Bapak Dr Ir Muhammad Nur Aidi, MS dan Ibu Dr Ir Indahwati, MSi selaku pembimbing. Di samping itu, penghargaan penulis sampaikan kepada pengelola web dan jurusan Farmasi Universitas Airlangga yang telah memberikan informasi data sehingga penulis dapat melakukan penelitian ini. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas dukungan moril dan materil. Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2014 Revi Rosdiana
DAFTAR ISI DAFTAR TABEL
x
DAFTAR GAMBAR
x
DAFTAR LAMPIRAN
x
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
2
Tujuan Penelitian
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
METODE
7
Bahan
7
Prosedur Analisis Data
8
HASIL DAN PEMBAHASAN SIMPULAN DAN SARAN
9 15
Simpulan
15
Saran
16
DAFTAR PUSTAKA
16
LAMPIRAN
18
RIWAYAT HIDUP
28
DAFTAR TABEL 1 2 3 4 5
Data contoh Hasil mengubah peubah kategorik dasar menjadi peubah numerik Hasil pengubahan semua kategori dalam data menjadi angka Sebaran keanggotaan gerombol Karakteristik gerombol hasil penggerombolan dengan kedua metode berdasarkan peubah kategorik dilihat dengan modus 6 Karakteristik gerombol hasil penggerombolan dengan kedua metode berdasarkan peubah numerik dilihat dengan rataan 7 Simpangan baku masing-masing peubah untuk setiap gerombol
4 5 6 12 13 14 15
DAFTAR GAMBAR 1 Persentase per-kategori (a) peubah ujung daun (Apex folii) dan (b) peubah pangkal daun (Basis folii) 2 Persentase per-kategori pada peubah (a) susunan tulang daun (Nervatio), (b) warna daun atas, (c) tepi daun, dan (d) warna daun bawah 3 Persentase per-kategori pada peubah (a) permukaan daun, (b) daging daun, dan (c) helaian daun
9 10 11
DAFTAR LAMPIRAN 1 2 3 4 5 6 7
Rincian peubah yang digunakan
Angka-angka untuk setiap kategori Nilai BIC (Bayesian Information Criterion) Anggota gerombol pada Dua Tahap Metode Anggota gerombol pada Dua Tahap Penggerombolan Selang kepercayaan setiap peubah pada gerombol Dua Tahap Metode Selang kepercayaan setiap peubah pada gerombol Dua Tahap Penggerombolan
17 18 21 21 22 23 25
PENDAHULUAN Latar Belakang Tanaman obat atau biofarmaka didefinisikan sebagai jenis tanaman yang sebagian, seluruh tanaman dan atau eksudat tanaman tersebut digunakan sebagai obat, bahan atau ramuan obat-obatan (www.bbpp-lembang.info). Mengenal tanaman obat merupakan salah satu hal yang penting sehingga pemakaian obat kimia serta efek sampingnya bisa dikurangi. Tanaman obat sangat beragam jenisnya, sehingga untuk mempermudah mengenali tanaman-tanaman ini diperlukan penggerombolan untuk mengetahui tanaman-tanaman obat yang memiliki karakteristik yang sama. Metode penggerombolan yang populer saat ini adalah metode penggerombolan yang menggunakan peubah numerik saja atau kategorik saja. Data yang digunakan pada umumnya memiliki tipe peubah campuran yaitu numerik maupun kategorik. Apabila peubah yang digunakan adalah peubah campuran, maka memerlukan strategi tersendiri. Ketika alat analisis gerombol bagi salah satu tipe peubah digunakan pada peubah campuran, maka akan terkendala pada penggunaan jarak yang mengukur kedekatan antar observasi. Mengingat selama ini yang banyak berkembang adalah metode yang hanya berfokus pada salah satu tipe peubah saja, maka diperlukan solusi baru analisis gerombol untuk tipe peubah campuran yang akan dikaji pada penelitian ini. Salah satu solusi untuk masalah-masalah tersebut adalah penggerombolan Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data). Pada tahun 2010, Shih et al. menggunakan algoritma ini pada penggerombolan data yang didapatkan dari National Indonesia Contraceptive Prevalence Survey tahun 1987. Penelitian tersebut tergolong penelitian yang menemukan metode baru pada penggerombolan data dengan peubah campuran mengingat sebelumnya telah dihasilkan metode penggerombolan untuk data dengan peubah campuran yaitu dengan Dua Tahap Penggerombolan (TwoStep Cluster). Metode baru, dalam aplikasinya diharapkan dapat mengurangi kesalahan pembentukan anggota gerombolnya dari metode lama atau minimal harus sama dengan metode lama. Perlu adanya evaluasi terhadap kedua metode tersebut untuk melihat keefektifan keduanya dalam membentuk gerombol. Kudsiati (2006) dalam penelitiannya, melakukan perbandingan keefektifan Dua Tahap Penggerombolan dengan metode penggerombolan K-Rataan dengan data berupa data hasil simulasi dan menyimpulkan bahwa Dua Tahap Penggerombolan tidak berbeda nyata dengan metode K-Rataan dalam hal akurasi sebaran ukuran gerombol asal serta salah klasifikasi. Pembandingan metode penggerombolan untuk data dengan tipe peubah campuran juga dilakukan oleh Yunianto (2011) membuktikan bahwa Dua Tahap Penggerombolan lebih baik daripada penggerombolan Komponen Utama Nonlinier. Pada penelitian ini akan dibandingkan penggerombolan dengan menggunakan Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) dan Dua Tahap Penggerombolan (TwoStep Cluster).
2 Perumusan Masalah Berdasarkan latar belakang di atas, maka perlunya melakukan penggerombolan tanaman obat yang mempunyai peubah kategorik dan numerik dengan menggunakan Dua Tahap Metode dan Dua Tahap Penggerombolan agar didapatkan gerombol yang baik.
Tujuan Penelitian Tujuan penelitian ini adalah: 1. Mengaplikasikan Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) dan Dua Tahap Penggerombolan (TwoStep Cluster) untuk menggerombolkan tanaman obat berdasarkan karakteristik daun dan syarat tumbuh agar bisa diketahui tanaman obat yang memiliki karakteristik yang sama. 2. Mengukur kebaikan pembentukan gerombol dengan Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) dan Dua Tahap Penggerombolan (TwoStep Cluster) dalam menggerombolkan data dengan tipe peubah campuran berdasarkan nilai CTM (Clustering Tightness Measure).
Manfaat Penelitian Hasil dari penelitian ini dapat dimanfaatkan pada bidang obat-obatan, sehingga dapat dijadikan acuan dalam mengenal gerombol-gerombol tanaman obat berdasarkan karakteristik daun dan syarat tumbuh. Selain itu, penelitian ini juga memiliki manfaat untuk mengetahui metode penggerombolan yang efektif digunakan pada data dengan peubah campuran.
Ruang Lingkup Penelitian Penelitian ini hanya ingin mengetahui hasil penggerombolan tanaman obat berdasarkan karakteristik daun dan syarat tumbuh dengan dua metode yakni Dua Tahap Metode dan Dua Tahap Penggerombolan.
TINJAUAN PUSTAKA Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) Dua Tahap Metode merupakan salah satu metode yang digunakan untuk menggerombolkan objek yang memiliki peubah campuran, yaitu peubah kategorik dan numerik. Metode ini menggunakan prinsip co-occurence. Co-occurence
3 adalah sebuah prinsip yang melihat dua peubah yang memiliki kategori yang sering muncul secara bersamaan dalam objek yang sama (Shih et al. 2010). Metode ini melihat keterkaitan hubungan antar objek untuk mendefinisikan kesamaan antar pasangan objek (Shih et al. 2010). Langkah awal metode ini adalah menentukan peubah dasar dari peubah kategorik. Peubah dasar adalah peubah yang memiliki kategori paling banyak (Shih et al. 2010). Matriks M atau matriks yang menyimpan sifat co-occurence akan dibentuk setelah peubah dasar terpilih. Informasi pada matriks M akan berguna untuk pembentukan matriks D. Selanjutnya adalah mencari peubah numerik dasar. Peubah numerik dasar adalah peubah yang mampu meminimalkan ragam di dalam peubah. Menurut Shih et al. (2010), ketika objek memiliki kategori yang sama pada peubah kategoriknya, maka objek tersebut juga akan memiliki nilai numerik yang hampir mirip. Peubah numerik dasar dapat dicari dengan menggunakan formula : ∑∑ -̅ (1) = Masing-masing nilai dari peubah tersebut, dengan i = 1,2,...,n dan j =1,2,...,n ̅ * = Rataan dari peubah numerik dasar yang terpilih Langkah tersebut akan menjadi acuan pada pengubahan peubah kategorik dasar menjadi numerik. Konversi dilakukan dengan melihat pasangan peubah kategorik pada peubah numerik, kategori yang hanya muncul satu kali akan memiliki nilai yang sama dengan pasangannya pada peubah numerik, sedangkan kategori yang terdiri dari banyak pasangan dapat menggunakan nilai rata-ratanya (Shih et al. 2010). Peubah kategorik selain kategorik dasar dapat diubah kedalam bentuk numerik dengan : ( ) ∑ (2) dengan d adalah banyaknya kategori pada peubah kategorik dasar, merupakan nilai kemiripan antara kategori ke dengan kategori pada peubah dasar yang dihitung berdasarkan , merupakan nilai pada peubah numerik dasar. Selanjutnya, metode penggerombolan Agglomerative dan K-Means dapat digunakan, sehingga Jarak Euclidean dapat digunakan untuk mengukur kedekatan antar objek (Fielding 2007). Matriks M Matriks M adalah matriks dengan ukuran nxn dengan n adalah banyaknya kategori dalam semua peubah kategorik. Pembentukan matriks M akan tergantung pada kemunculan setiap kategori. Adapun bentuk matriks M dapat didefinisikan sebagai berikut : [
]
dengan : ketika adalah banyaknya kemunculan kategori ke- . ketika adalah banyaknya kemunculan kategori ke- dengan kategori kedalam observasi yang sama. Penjelasan lain dari cara kerja matriks M adalah dengan melihat sifat cooccurence. Kategori dalam satu peubah yang selalu muncul bersama-sama dengan kategori dalam peubah lain akan dihitung banyaknya, kemudian akan disimpan kedalam matriks M sesuai dengan indeks matriks. Misalnya, untuk nilai
4 dinyatakan dengan banyak kemunculan kategori 1 dalam data, dinyatakan dengan banyak kemunculan bersama-sama kategori 1 dan kategori 2 dalam satu objek di dalam data, jika diketahui kategori-kategori tersebut muncul bersamaan maka diberi nilai 1, jika tidak maka diberi nilai 0 (Kaufman dan Rousseeuw 1990). Matriks D Matriks D dalah matriks yang berisi informasi kemiripan antar objek berdasarkan karakteristik peubah kategorik dan peubah dasar. Menurut Shih et al. (2010) formula yang digunakan yaitu : )| | ( (3) )| | ( )| | ( )|-| ( menyatakan kategori dalam peubah dasar, menyatakan kategori dalam peubah lain. Matriks D dapat didefinisikan sebagai berikut : [
]
Setiap nilai pada matriks D didapatkan dengan memasukkan nilai-nilai pada ) sama saja dengan nilai matriks M pada rumus (3). Nilai ( ketika dan atau ketika menyatakan kategori 1 dan untuk kategori 1, demikian dengan indeks lainya. Jumlah dan akan sama dengan banyaknya kategori yang ada dalam data atau ada sebanyak .
Konversi Kategori ke Angka Misalkan ada 5 objek dengan peubah sebagai berikut : Tabel 1. Data contoh Objek 1 2 3 4 5
Peubah W Tinggi Sedang Sedang Sedang Tinggi
Peubah X Cair Padat Padat Gas Cair
Peubah Y 30 20 25 10 15
Peubah Z 16 23 20 15 25
Untuk membentuk Matriks M yang dibutuhkan adalah menghitung kemunculan masing-masing kategori setelah sebelumnya dipilih peubah kategorik dasar. Peubah X terpilih sebagai peubah kategorik dasar karena memiliki 3 kategori dibandingkan dengan peubah kategorik W yang hanya memiliki 2 kategori. Misal berarti kemunculan kategori ke-1 yang dalam hal ini adalah kategori tinggi dan bernilai 2 karena muncul 2 kali pada set data di atas. Indeks pada matriks M berarti kemuculan kategori ke-1 dengan kategori ke-2 yang dalam hal ini kategori ke-2 adalah sedang, akan diberikan nilai 0 karena kategori ke-1 dan kategori ke-2 tidak pernah muncul bersamaan dalam satu objek. Demikian selanjutnya hingga didapatkan matriks M sebagai berikut :
5
[ ] Setelah terbentuk matriks M, maka matriks D bias dibentuk. Dengan rumus yang telah disebutkan sebelumnya maka untuk mengisi indeks-indeks pada matriks D dilakukan penghitungan sebagai berikut :
dengan angka 2 pada pembilang adalah indeks pada matriks M, sedangkan untuk penyebut didapatkan dari indeks , dan . Begitupula selanjutnya hingga didapatkan matriks D sebagai berikut :
[ ] Setelah didapatkan matriks D, dilakukan pemilihan peubah numerik yang akan dijadikan peubah numerik dasar dengan syarat seperti yang telah disebutkan sebelumnya dengan rumus (1), dalam kasus di atas peubah yang terpilih adalah peubah Z karena ragamnya terkecil. Selanjutnya adalah mengubah kategorikategori pada peubah kategorik dasar. Angka yang diberikan untuk setiap kategori adalah angka-angka yang bersesuaian dengan kategori-kategori tersebut pada peubah Z dengan diambil rata-ratanya, misal untuk kategori cair, angka yang bersesuaian adalah 16 dan 25 sehingga rata-ratanya 20.5 sehingga kategori cair dikonversi menjadi angka 20.5, begitupula selanjutnya, dapat dilihat pada tabel dibawah. Tabel 2. Hasil mengubah peubah kategorik dasar ke angka Objek 1 2 3 4 5
Peubah W Tinggi Sedang Sedang Sedang Tinggi
Peubah X 20.5 21.5 21.5 15 20.5
Peubah Y 30 20 25 10 15
Peubah Z 16 23 20 15 25
Langkah selanjutnya adalah mengubah kategori-kategori pada peubah yang bukan merupakan peubah kategorik dasar dengan menggunakan rumus (2), maka :
sehingga,
6 Tabel 3. Hasil pengubahan semua kategori dalam data Objek 1 2 3 4 5
Peubah W 20.5 17.4 17.4 17.4 20.5
Peubah X 20.5 21.5 21.5 15 20.5
Peubah Y 30 20 25 10 15
Peubah Z 16 23 20 15 25
Setelah langkah tersebut, maka metode gerombol berhirarkhi dapat diterapkan sampai diperoleh gerombol sebanyak 1/3 dari banyaknya data. Masingmasing gerombol dihasilkan dari metode gerombol berhirarki akan dianggap sebagai objek dan digerombolkan kembali dengan metode penggerombolan KMeans. Dua Tahap Penggerombolan (TwoStep Cluster) Dua Tahap Penggerombolan merupakan salah satu metode penggerombolan objek dalam data yang memiliki peubah campuran, yaitu peubah numerik dan kategorik. Jarak yang digunakan pada Dua Tahap Penggerombolan adalah jarak Log-likelihood. Jarak antara gerombol i dan j didefinisikan sebagai berikut Şch opu : ( )= + (4) - (∑ o (̂ ̂ ) ∑ ̂ ) (5) Setiap simbol s dalam rumus (5) dapat diganti dengan simbol i dan j disesuaikan dengan rumus (4). Indeks merepresentasikan penggabungan gerombol i dan j, adalah banyaknya peubah numerik, adalah banyaknya peubah kategorik, ̂ adalah penduga ragam dari peubah numerik ke-k untuk seluruh set data, ̂ adalah penduga ragam bagi peubah numerik ke-k dalam gerombol ke-s, dan N merupakan banyaknya objek. urut Şch opu : ̂ =-∑ o (6) adalah banyaknya kategori untuk peubah kategorik ke-m, adalah jumlah observasi dalam gerombol ke-s yang memiliki peubah kategorik m dan l kategori. Metode dua tahap terdiri dari penggerombolan awal dan penggerombolan optimal. Penggerombolan awal dilakukan dengan pembentukan Cluster Feature Tree (CF Tree) atau disebut juga dengan Pohon Ciri Gerombol (Kudsiati 2006). Hasil pembentukan CF Tree akan dipakai pada penentuan gerombol optimal. Gerombol optimal yaitu gerombol yang memiliki jarak antar gerombol paling jauh dan jarak antar objek paling dekat. Penentuan gerombol optimal dengan AIC (Akaike’s Information Criterion) dan BIC (Bayesian Information Criterion) untuk menduga jumlah gerombol awal. Selanjutnya mencari peningkatan jarak terbesar antara dua gerombol terdekat pada masing-masing tahapan penggerombolan dengan menggunakan Rasio Perubahan Jarak Gerombol, yaitu : ( ) ( ) dengan :
(7)
7 = rasio perubahan jarak terbesar pertama = rasio perubahan jarak terbesar kedua dan rumus R(k) sebagai berikut - / -
-
(8) (9)
dengan : = rasio perubahan jarak = o – = = jarak jika k gerombol digabungkan dengan - gerombol Jika rasio perubahan lebih besar dari batas c , jumlah gerombol optimum ditetapkan sama dengan , selainnya jumlah gerombol optimal sama dengan maksimum . Nilai c , berdasarkan studi simulasi (Bacher et al. 2004). Dua Tahap Penggerombolan menggunakan kriteria BIC (Bayesian Information Criterion) untuk memilih banyaknya kelompok yang akan dibentuk. BIC yang dipilih adalah BIC dengan nilai terkecil. Formula yang digunakan adalah: ( ) - ∑ (- ∑ o (̂ ̂ ) ∑ ̂ ) { o (10) dengan adalah jumlah kategori untuk peubah kategorik, peubah kontinu dan adalah jumlah peubah kategorik.
adalah jumlah
METODE Penelitian ini berupa pengolahan data yang didapatkan dari website resmi Fakultas Farmasi Universitas Airlangga mengenai Sistem Informasi Tanaman Obat (www.ff.unair.ac.id) yang diakses pada tanggal 14 Februari 2014. Penelitian ini menggunakan statistika deskriptif untuk memperlihatkan kondisi data yang dilanjutkan dengan analisis gerombol. Analisis gerombol dilakukan terhadap tanaman obat. Penggerombolan yang dilakukan pada penelitian ini adalah penggerombolan tanaman obat berdasarkan karakteristik daun dan kecocokan tumbuh dengan Dua Tahap Metode dan Dua Tahap Penggerombolan.
Bahan Data tanaman obat yang digunakan adalah karakteristik daun dan kecocokan tumbuh. Data diperoleh dari website resmi Fakultas Farmasi Universitas Airlangga di Sistem Informasi Tanaman Obat (www.ff.unair.ac.id). Tanaman obat yang digunakan berjumlah 149 tanaman obat dengan 17 peubah, 9 peubah kategorik dan 8 peubah numerik yang selengkapnya disajikan pada Lampiran 1.
8 Prosedur Analisis Data Dua Tahap Metode berfilosofi bahwa ketika dua item selalu muncul bersamaan maka terdapat derajat kesamaan yang tinggi antar item tersebut. Dua Tahap Penggerombolan menggunakan ukuran jarak Euclidean dan Log-likelihood. Analisis data pada penelitian ini akan menggunakan SPSS 16.0, Minitab 16, dan Microsoft Excel 2010. Adapun langkah-langkah analisis gerombol Dua Tahap Metode dan Dua Tahap Penggerombolan serta pengukuran kebaikan pembentukan gerombol adalah sebagai berikut: 1. Melakukan penggerombolan dengan Dua Tahap Metode yang terdiri dari langkah-langkah sebagai berikut : 1.1 Menstandarisasi peubah numerik. 1.2 Memilih peubah kategorik yang akan dijadikan sebagai peubah dasar. 1.3 Membentuk matriks M. 1.4 Membentuk matriks D. 1.5 Mencari peubah numerik dasar. 1.6 Konversi peubah kategorik dasar ke peubah numerik. 1.7 Mengkonversi peubah kategorik lain yang bukan merupakan peubah kategorik dasar. 1.8 Melakukan penggerombolan dengan menggunakan metode Hierarchical Agglomerative Clustering (HAC). 1.9 Melakukan penggerombolan dengan menggunakan metode penggerombolan K-Means. 2. Melakukan penggerombolan menggunakan Dua Tahap Penggerombolan dengan langkah-langkah sebagai berikut : 1.1 Pre-clustering, yang ditandai dengan pembentukan Pohon Ciri Gerombol. 1.2 Penggerombolan, yang terdiri dari : 1.2.1 Anggap sub-gerombol yang dihasilkan dari Pre-clustering sebagai objek, kemudian menghitung jarak antar kumpulan sub-gerombol yang telah terbentuk pada langkah 1.1 menggunakan jarak Log-likelihood. 1.2.2 Menggabungkan kumpulan sub-gerombol yang memiliki jarak terkecil, kumpulan sub-gerombol yang telah bergabung menjadi sebuah gerombol akan mengikuti proses selanjutnya untuk dicari jarak yang terkecil kembali. 1.2.3 Langkah terus berlanjut hingga diperoleh satu gerombol akhir (metode Agglomerative). 1.2.4 Melihat gerombol optimal dari rasio perubahan jarak BIC. 3. Hasil penggerombolan menggunakan kedua metode akan dievaluasi dengan CTM (Cluster Tightness Measure) untuk mengetahui kebaikan kualitas penggerombolan. Alat ukur ini melibatkan simpangan baku setiap peubah pada masing-masing gerombol, yaitu dengan rumus sebagai berikut: ∑
(p ∑
p
)
(11)
9 dengan adalah banyaknya gerombol; p adalah banyaknya peubah; adalah simpangan baku pada gerombol ke- untuk peubak ke- ; adalah simpangan baku seluruh data untuk peubah ke- . Hasil penggerombolan dengan nilai CTM terkecil dinyatakan memakai metode dengan kualitas yang baik (Epps dan Ambikairajah 2008).
HASIL DAN PEMBAHASAN Deskripsi Data Tanaman obat berujung daun runcing mempunyai persentase terbesar (50.33%) dan berujung daun rompang merupakan persentase terkecil (0.67%). Persentase tanaman obat dengan Pangkal daun (Basis folii) runcing sebesar 34.91% merupakan kategori dengan persentase terbesar dan berpangkal daun bergigi, daun memeluk batang, menyempit masing-masing merupakan persentase terkecil (0.67%). Ujung daun (Apex folii) Runcing Tumpul Terbelah Rompang Berlekuk
Meruncing Membulat Sungut Berduri
50,33%
Pangkal daun (Basis folii)
Runcing Rompang Tumpul Bergigi Menyempit Berpelepah
Membulat Berlekuk Meruncing Daun memeluk batang Jantung
34,91% 26,17%
28,19%
18,12% 12,08% 0,67% 0,67% 2,01%1,34% 3,36% 1,34%
5,37% 6,71% 3,36%
0,67% 2,01% 0,67% 0,67% 1,34%
(a) (b) Gambar 1. Persentase per-kategori (a) peubah Ujung daun (Apex folii) dan (b) peubah Pangkal daun (Basis folii) Tanaman obat bertulang daun sirip mempunyai persentase terbesar (80.54%) sedangkan yang terkecil bertulang daun tidak jelas (1.34%). Tanaman obat bertepi daun rata berpresentase tinggi (64.43%) namun bertepi daun bergigi, bercangap, menyirip, berlekuk menjari, dan berbagi, memiliki persentase terendah (0.67%).
10 Tanaman obat yang berwarna daun bawah hijau muda merupakan persentase terbesar (61.07%) sedangkan presentase terkecil adalah hijau keperakan, hijau buram, merah gelap, dan cokelat (0.67%). Tanaman obat yang berwarna daun atas hijau tua merupakan persentase terbesar (44.31%), sedangkan persentase terkecil adalah ungu, hijau kekuningan, dan hijau keputihan sebesar 0.67%. Tepi daun
Susunan tulang daun (Nervatio) Menyirip Melengkung Tidak jelas
Sejajar Menjari
80,54%
Bertepi rata Berombak Bergigi Berbagi menyirip Berlekuk menjari
Bergerigi Beringgit Bercangap Berlekuk Berbagi
64,43%
19,46% 8,05%
4,71%
5,37%
7,38% 1,34% 4,03% 0,67% 0,67%0,67% 0,67% 0,67%
1,34%
(a) Warna daun atas Hijau Ungu Merah Hijau kekuningan
Hijau tua Hijau Muda Hijau keunguan Hijau keputihan
43,62% 44,31%
(c)
Warna daun bawah Hijau Hijau tua Merah Hijau pucat Merah gelap
Hijau muda Ungu Hijau keperakan Hijau buram Cokelat
61,07%
26,17% 7,38% 1,34% 0,67% 1,34% 0,67% 0,67%
(b) Gambar 2.
2,01% 0,67% 0,67% 0,67% 4,71% 1,34% 2,01% 0,67%
(d)
Persentase per-kategori pada peubah (a) Susunan tulang daun (Nervatio), (b) Warna daun atas, (c) Tepi daun, dan (d) Warna daun bawah
Tanaman obat yang memiliki permukaan daun halus merupakan persentase terbesar (29.53%), sedangkan persentase terkecil memiliki permukaan daun berkerut, kasar bersisik, licin berbulu, dan licin mengkilat merupakan persentase terkecil (0.67%). Tanaman obat berdaging daun kertas memiliki persentase paling besar (38.26%), sementara tanaman obat berdaging daun berbentuk daging memiliki persentase paling kecil (0.67%).
11 Permukaan daun Licin Kasap Gundul Berbulu kasar Licin berbulu
Daging daun
Halus Kasar Berbulu halus Kasar bersisik Licin mengkilat
Kulit/Belulang Kertas Tipis lunak
Perkamen Selaput Berdaging
29,53% 27,52% 38,26% 26,84% 18,79%
8,72% 10,74% 6,71% 7,38% 4,03%
10,74%
0,67% 2,68% 0,67% 0,67% 0,67%
4,71%
(a)
0,67%
(b) Helaian daun
Lanset Bangun bulat telur sungsang Jorong Bangun ginjal atau kerinjal
Memanjang Bulat telur terbalik Bulat telur Anak panah
Jantung Bangun pita Bulat Bangun paku/dabus
30,87% 23,49%
20,80%
5,37%
3,36%
4,03%
2,68%
4,03% 1,34%
1,34%
0,67%
0,67%
0,67% 0,67%
(c) Gambar 3. Persentase per-kategori pada peubah (a) Permukaan daun, (b) Daging daun, dan (c) Helaian daun Tanaman obat berhelaian daun jorong merupakan persentase terbesar (30.87%). Tanaman obat berhelaian daun anak panah, bangun belah ketupat, bangun garis, dan bangun paku/dabus masing-masing memiliki persentase terkecil (0.67%). Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data) Tahap pertama adalah penentuan peubah kategorik dasar. Adapun peubah kategorik dasar yang terpilih adalah peubah helaian daun yang memiliki sebanyak 14 kategori, yaitu peubah kategorik yang memiliki kategori terbanyak dalam penelitian ini peubah kategorik dasar yang terpilih adalah peubah helaian daun. Setelah melakukan pemilihan peubah kategorik dasar maka dilakukan pembentukan matriks M, berupa matriks berukuran 85 x 85 yaitu sebanyak kategori yang ada di dalam data.
12 Informasi pada matriks M akan digunakan untuk membentuk matriks D. Setelah matriks D terbentuk, dilakukan pemilihan peubah numerik dasar dan yang terpilih menjadi peubah numerik dasar adalah peubah lebar daun minimum (cm). Pengubahan kategori-kategori pada peubah helaian daun dapat dilakukan dengan terpilihnya peubah lebar daun minimum (cm) sebagai peubah numerik dasar. Setelah peubah kategorik dasar menjadi peubah numerik, maka peubah kategorik lain dapat diubah menjadi peubah numerik, dapat dilihat pada lampiran 2. Ketika semua peubah kategorik sudah diubah menjadi peubah numerik, langkah selanjutnya adalah dilakukan analisis gerombol HAC dan dihasilkan 50 gerombol yaitu sebanyak 1/3 dari banyaknya objek dalam data. Hasil dari analisis gerombol HAC yang berupa 50 gerombol, masingmasing gerombol akan dianggap sebagai objek baru dan akan dijadikan input pada analisis gerombol K-Means dengan dicari rata-rata masing-masing gerombol. Analisis K-Means menghasilkan 3 gerombol sebagai gerombol akhir. Gerombol 1 memiliki 5 gerombol dari analisis HAC yang berarti ada 5 tanaman obat, gerombol 2 memiliki 38 gerombol dari analisis HAC yang artinya ada 134 tanaman obat, dan gerombol 3 memiliki 7 gerombol dari hasil analisis HAC yang kemudian dapat dikatakan memiliki 10 tanaman obat. Anggota masing-masing gerombol dapat dilihat pada Lampiran 4.
Dua Tahap Penggerombolan (TwoStep Cluster) Banyaknya gerombol diambil berdasarkan rasio ukuran jarak tertinggi yaitu 1.458 dengan nilai BIC yang rendah yaitu 5376.479, sehingga didapatlah 3 gerombol, dapat dilihat pada lampiran 3. Adapun distribusi observasi dalam masing-masing gerombol adalah sebagai berikut : Tabel 4. Sebaran keanggotaan gerombol
Gerombol
Total
N
Persentase
1
47
31.5%
2 3
55 47 149
36.9% 31.5% 100%
Tabel di atas memperlihatkan bahwa sebanyak 47 tanaman obat masuk ke gerombol 1, sebanyak 55 tanaman obat terdapat pada gerombol 2 dan sebanyak 47 tanaman obat menjadi anggota gerombol 3. Anggota masing-masing gerombol yang dihasilkan dengan Dua Tahap Penggerombolan dapat dilihat pada Lampiran 5.
Karakteristik Gerombol Jika dilihat pada Tabel 5, maka dapat dilihat beberapa penciri gerombol yang hampir mirip. Gerombol 2 pada Dua Tahap Metode memiliki penciri yang
13 sebagian besar mirip dengan gerombol 3 pada Dua Tahap Penggerombolan, yang membedakannya hanya pada peubah permukaan daun. Gerombol 3 pada Dua Tahap Metode memiliki penciri yang sebagian besar mirip dengan gerombol 2 pada Dua Tahap Penggerombolan namun beda pada peubah tepi daun dan warna daun atas. Gerombol 1 pada Dua Tahap Metode memiliki penciri yang sebagian besar mirip dengan gerombol 1 pada Dua Tahap Penggerombolan namun beda pada peubah pangkal daun, warna daun bawah, permukaan daun, dan daging daun. Sebesar 60% anggota dari gerombol 1 pada Dua Tahap Metode merupakan anggota dari gerombol 1 pada Dua Tahap Penggerombolan. Sebesar 83% anggota dari gerombol 3 pada Dua Tahap Penggerombolan juga merupakan anggota dari gerombol 2 pada Dua Tahap Metode, sedangkan sebesar 50% anggota dari gerombol 3 pada Dua Tahap Metode merupakan anggota dari gerombol 2 pada Dua Tahap Penggerombolan (Lampiran 4 dan Lampiran 5). Sebanyak empat penciri gerombol pada gerombol 1 berbeda dengan gerombol 2 pada Dua Tahap Metode yaitu pada peubah X2, X5, X7, dan X9 atau dapat dikatakan bahwa yang membedakan gerombol 1 dengan gerombol 2 adalah peubah X2, X5, X7, dan X9, sedangkan hanya tiga penciri gerombol sebagai pembeda gerombol 1 dan gerombol 3 yaitu pada peubah X4, X7, dan X9. Sebanyak empat penciri gerombol membedakan gerombol 2 dengan gerombol 3 yaitu pada peubah X2, X4, X7, dan X9. Penciri gerombol 1 pada Dua Tahap Penggerombolan berbeda sebanyak empat penciri dengan gerombol 2 yaitu pada peubah X2, X5, X6, dan X9 sehingga peubah-peubah tersebut dapat dikatakan sebagai peubah yang membedakan gerombol 1 dan gerombol 2 pada Dua Tahap Penggerombolan ini. Sebanyak empat penciri gerombol juga membedakan gerombol 1 dengan gerombol 3 pada Dua Tahap Penggerombolan yaitu pada peubah X5, X6, X7, dan X9. Gerombol 2 dibedakan oleh tiga penciri gerombol dengan gerombol 3 pada Dua Tahap Penggerombolan yaitu pada peubah X2, X7, dan X9. Tabel 5. Karakteristik gerombol hasil penggerombolan dengan kedua metode berdasarkan peubah kategorik dilihat dengan modus Peubah X1 X2 X3 X4 X5 X6 X7 X8 X9
Dua Tahap Metode 1 2 3 Runcing Runcing Runcing Tumpul Runcing Tumpul Menyirip Menyirip Menyirip Bertepi Bertepi Berlekuk rata rata Hijau Hijau tua Hijau Hijau Hijau Hijau muda muda muda Licin Halus Halus Kertas Kertas Kertas Bulat Jantung Jorong telur
Dua Tahap Penggerombolan 1 2 3 Runcing Runcing Runcing Runcing Tumpul Runcing Menyirip Menyirip Menyirip Bertepi Bertepi Bertepi rata rata rata Hijau Hijau tua Hijau tua Hijau Hijau Hijau muda muda Halus Halus Licin Kertas Kertas Kertas Bulat Lanset Jorong telur
14 Jika dilihat dari urutan rataan dari yang terkecil hingga yang terbesar untuk masing-masing peubah yang disajikan pada Tabel 6, gerombol 2 pada Dua Tahap Metode juga memiliki kemiripan dengan gerombol 3 pada Dua Tahap Penggerombolan. Adapun urutannya adalah peubah X16, X17, X14, X15, X10, X11, X12, dan X13. Gerombol 3 pada Dua Tahap Metode juga memiliki kemiripan dengan gerombol 2 pada Dua Tahap Penggerombolan dalam hal urutan rataan setiap peubah. Berikut urutan rataan dari yang terkecil hingga terbesar, X16, X14, X17, X15, X10, X11, X12, X13. Gerombol 1 pada Dua Tahap Metode memiliki kemiripan dengan gerombol 1 pada Dua Tahap Penggerombolan dalam hal urutan rataan peubah hanya untuk peubah X12 dan X13. h t p rc y u α % pr yang dapat dijadikan penciri antara gerombol 1 dengan gerombol 2 pada Dua Tahap Metode adalah peubah X16 dan X17 karena selang kepercayaannya tidak saling tumpang tindih, sedangkan untuk penciri antara gerombol 1 dengan gerombol 3 adalah peubah X12 dan X16. Penciri antara gerombol 2 dengan gerombol 3 adalah peubah X11, X12, dan X13 dilihat dari selang kepercayaannya yang tidak saling tumpang tindih. Pada Dua Tahap Penggerombolan, hanya terdapat satu penciri untuk gerombol 2 dan gerombol 3 yaitu X16 (Lampiran 7). Tabel 6. Karakteristik gerombol hasil penggerombolan dengan kedua metode berdasarkan peubah numerik dilihat dengan rataan Peubah X10 X11 X12 X13 X14 X15 X16 X17
Dua Tahap Metode Dua Tahap Penggerombolan 1 2 3 1 2 3 15.60 21.45 18.90 21.31 19.80 22.36 24.20 30.89 24.80 29.57 30.04 31.18 272.10 92.06 1090.00 159.37 207.31 121.36 930.00 1234.96 2045.00 1280.85 1364.36 1177.53 13.10 9.08 7.10 12.29 6.61 8.76 18.50 19.68 18.85 24.31 16.44 18.54 19.00 3.32 4.60 5.04 3.14 3.77 47.40 7.33 11.00 10.81 8.25 7.82
Evaluasi Kebaikan Pembentukan Gerombol Seperti yang telah dijelaskan pada metode, pengukur kebaikan pembentukan gerombol pada penelitian ini akan digunakan CTM (Cluster Tightness Measure). Hasil analisis memperlihatkan bahwa pembentukan gerombol dengan Dua Tahap Metode lebih baik daripada Dua Tahap Penggerombolan. Hal ini dibuktikan dengan nilai CTM dari gerombol yang dibentuk dengan Dua Tahap Metode lebih kecil dari pada nilai CTM dari gerombol yang dibentuk dengan Dua Tahap Penggerombolan yaitu sebesar 0.8983 sedangkan nilai CTM dari Dua Tahap Penggerombolan sebesar 0.9734, dengan simpangan baku masing-masing gerombol sebagai berikut :
15 Tabel 6. Simpangan baku masing-masing peubah untuk setiap gerombol Simpangan baku Dua Tahap Metode Peubah X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 X17
Simpangan baku Dua Tahap Penggerombolan
G1
G2
G3
G1
0.13 0.74 0.00 0.00 0.04 0.34 0.75 0.82 4.75 7.67 4.76 251.00 545.00 10.74 10.79 7.42 28.50
0.62 0.81 0.92 1.07 0.73 0.95 0.80 0.81 1.07 6.13 5.76 189.70 612.70 9.72 20.24 3.50 6.43
0.59 0.63 0.45 1.30 0.62 0.31 0.56 0.92 2.79 3.51 2.97 438.00 703.00 4.18 11.97 4.22 5.96
0.68 0.80 1.02 1.11 0.44 0.71 0.62 0.94 1.63 5.37 6.03 270.20 615.50 12.00 22.96 6.39 12.39
G2 0.51 0.81 0.78 1.25 1.00 1.07 0.82 0.74 0.92 5.83 5.03 424.30 743.00 4.69 14.26 3.48 12.27
G3 0.64 0.80 0.84 1.14 0.37 0.88 0.83 0.67 2.22 6.96 6.62 247.60 555.60 10.07 20.53 3.54 5.55
Simpangan baku data keseluruhan 0.61 0.80 0.88 1.16 0.71 0.91 0.79 0.81 1.64 6.13 5.88 329.70 648.80 9.48 19.50 4.65 10.67
SIMPULAN DAN SARAN Simpulan Hasil penggerombolan dengan menggunakan Dua Tahap Metode dan Dua Tahap Penggerombolan pada penelitian ini, keduanya menghasilkan 3 gerombol sebagai gerombol akhir. Namun, gerombol-gerombol yang dibentuk dengan Dua Tahap Metode memiliki anggota yang berbeda dengan gerombol-gerombol yang dibentuk melalui Dua Tahap Penggerombolan. Penggerombolan dengan menggunakan Dua Tahap Metode menghasilkan 3 gerombol dengan sebanyak 5 tanaman obat pada gerombol 1, 134 tanaman obat pada gerombol 2, dan 10 tanaman obat pada gerombol 3. Sebanyak 47 tanaman obat pada gerombol 1, 55 tanaman obat pada gerombol 2 dan sebanyak 47 tanaman obat pada gerombol 3 merupakan anggota-anggota gerombol dengan Dua Tahap Penggerombolan. Gerombol 2 pada Dua Tahap Metode memiliki penciri yang sebagian besar mirip dengan gerombol 3 pada Dua Tahap Penggerombolan, yang membedakannya hanya pada peubah X7 yaitu permukaan daun. Gerombol 3 pada Dua Tahap Metode memiliki penciri yang sebagian besar mirip dengan gerombol 2 pada Dua Tahap Penggerombolan namun beda pada peubah X4 (tepi daun) dan X5 (warna
16 daun atas). Gerombol 1 pada Dua Tahap Metode memiliki penciri yang sebagian besar mirip dengan gerombol 1 pada Dua Tahap Penggerombolan namun beda pada peubah X2 (pangkal daun), X6 (warna daun bawah), X7 (permukaan daun), dan X9 (helaian daun). Gerombol 1 dengan gerombol 2 pada Dua Tahap Metode dibedakan oleh peubah X16 (lebar daun minimum) dan X17 (lebar daun maksimum), sedangkan gerombol 1 dengan gerombol 3 dibedakan oleh peubah X12 (tinggi tanam dari permukaan laut minimum) dan X16 (lebar daun minimum). Penciri antara gerombol 2 dengan gerombol 3 adalah peubah X11 (suhu tanam maksimum), X12 (tinggi tanam dari permukaan laut minimum), dan X13 (tinggi tanam dari permukaan laut maksimum). Pada Dua Tahap Penggerombolan, hanya terdapat satu penciri untuk gerombol 2 dan gerombol 3 yaitu X16 (lebar daun minimum). Perbedaan ini menyebabkan hasil penggerombolan kedua metode tersebut memiliki nilai CTM yang berbeda, yang juga digunakan sebagai nilai pengevaluasi kebaikan pembentukan gerombol. Pada penelitian ini, pembentukan gerombol dengan Dua Tahap Metode dinyatakan lebih baik dibandingkan dengan pembentukan gerombol melalui Dua Tahap Penggerombolan ditunjukan oleh nilai CTM Dua Tahap Metode yang lebih kecil dibandingkan dengan nilai CTM pada Dua Tahap Penggerombolan.
Saran Peneliti selanjutnya supaya bisa membandingkan Dua Tahap Metode dengan lebih banyak metode penggerombolan untuk data dengan peubah campuran lainnya. Peneliti selanjutnya bisa menggunakan data yang lebih banyak jumlah observasinya supaya hasil penggerombolan bisa lebih dilihat perbedaannya dan bisa menggunakan alat evaluasi yang lain untuk melihat kebaikan pembentukan gerombol.
DAFTAR PUSTAKA [BBPP Lembang] Balai Besar Pelatihan Pertanian Lembang. 2014. Potensi Tanaman Obat Indonesia. [Internet]. [diunduh 2014 Juli 07]. Tersedia pada: www.bbpp-lembang.info. [FFUNAIR] Fakultas Farmasi Universitas Airlangga. 2014. Sistem Informasi Tanaman Obat. [Internet]. [diunduh 2014 Februari 14]. Tersedia pada: http://www.ff.unair.ac.id/. Bacher J, Wenzig K, Vogler M. 2004. SPSS TwoStep Cluster – A First Evaluation. [internet]. [diunduh 2014 Maret 25]. Tersedia pada: http://www.statisticalinnovations.com/products/TwoStep.pdf. Epps J, Ambikairajah E. 2008. Visualisation of Reduced Dimension Microarry Data Using Gaussian Mixture Model. [internet]. [diunduh 2014 Mei 30]. Tersedia pada: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.59.1619.
17 Fielding AH. 2007. Cluster and Classification Techniques for the Biosciences. New York (US): Cambridge Univ Pr. Kaufman L, Rousseeuw PJ. 1990. Finding Groups in Data: An Introduction to Cluster Analysis. New York (US): J Wiley. Kudsiati. 2006. Pengkajian Keakuratan TwoStep Cluster dalam Menentukan Banyaknya Gerombol Populasi [skripsi]. Bogor (ID): Institut Pertanian Bogor. Şch opu pp y o t p ut r y for t fy u to r ’ Prof Seria Ştiinţe Economice, Buletinul Universităţii PetrolGaze din Ploieşti. 52(3):66-75. Shih MY, Jheng JW, Lai LF. 2010. A Two-Step Method for Clustering Mixed Categorical and Numeric Data. Tamkang Journal of Science and Engineering. 13(1):11-19. Yunianto Y. 2011. Perbandingan Metode Penggerombolan dengan Komponen Utama Nonlinier dan Gerombol Dua Langkah pada Data Campuran [skripsi]. Bogor (ID): Institut Pertanian Bogor.
18 Lampiran 1 Rincian peubah yang digunakan Peubah X1
Keterangan Peubah Ujung daun (Apex folii)
X2
Pangkal daun (Basis folii)
X3 X4
Susunan tulang daun (Nervatio) Tepi daun
X5
Warna daun atas
X6
Warna daun bawah
X7
Permukaan daun
X8
Daging daun
X9
Helaian daun
X10
Suhu tanam minimum (oc) Suhu tanam maksimum ( oc) Tinggi tanam dari permukaan laut minimum (m) Tinggi tanam dari permukaan laut maksimum (m) Panjang daun minimum (cm) Panjang daun maksimum (cm)
X11 X12
X13
X14 X15
X16 X17
Lebar daun minimum (cm) Lebar daun maksimum (cm)
Kategori Runcing (a1); Meruncing (a2); Tumpul (a3); Membulat (a4); Terbelah (a5); Sungut (a6); Rompang (a7); Berduri (a8); Berlekuk (a9) Runcing (b1); Membulat (b2); Rompang (b3); Berlekuk (b4); Tumpul (b5); Meruncing (b6); Bergigi (b7); Daun Memeluk Batang (b8); Menyempit (b9); Jantung (b10); Berpelepah (b11) Menyirip (c1); Sejajar (c2); Melengkung (c3); Menjari (c4); Tidak jelas (c5) Bertepi rata (d1); Bergerigi (d2); Berombak (d3); Beringgit (d4); Bergigi (d5); Bercangap (d6); Berbagi menyirip (d7); Berlekuk (d8); Berlekuk menjari (d9); Berbagi (d10) Hijau (e1); Hijau tua (e2); Ungu (e3); Hijau muda (e4); Merah (e5); Hijau keunguan (e6); Hijau kekuningan (e7); Hijau keputihan (e8) Hijau (f1); Hijau muda (f2); Hijau tua (f3); Ungu (f4); Merah (f5); Hijau pucat (f6); Hijau keperakan (f7); Hijau buram (f8); Merah gelap (f9); Cokelat (f10) Licin (g1); Halus (g2); Kasap (g3); Kasar (g4); Berbulu halus (g5); Berbulu kasar (g6); Gundul (g7); Berbulu (g8); Kasar bersisik (g9); Licin berbulu (g10); Licin mengkilat (g11); Berkerut (g12) Kulit/Belulang (h1); Perkamen (h2); Kertas (h3); Selaput (h4); Tipis lunak (h5); Berdaging (h6) Lanset (i1); Memanjang (i2); Jantung (i3); Bulat telur sungsang (i4); Bulat telur terbalik (i5); Bangun pita (i6); Jorong (i7); Bulat telur (i8); Bulat (i9); Bangun ginjal (i10); Anak panah (i11); Bangun jarum (i12); Bangun paku (i13); Bangun pedang (i14); Bangun belah ketupat (i15); Bangun garis (i16) Kontinu Kontinu Kontinu
Kontinu Kontinu Kontinu Kontinu Kontinu
19 Lampiran 2. Angka-angka untuk setiap kategori Helaian daun Kategori Lanset (Lancealatus) Memanjang (Oblongus) Jantung (Cordatus) Bangun bulat telur sungsang (Obovatus) Bulat telur terbalik (Sudip) Bangun pita (Ligulatus) Jorong (Ovalis) Bulat telur (Ovatus) Bulat (Orbicularis) Bangun ginjal atau kerinjal (Reniformis) Anak panah (Sagitatus) Bangun paku/dabus (Subulatus) Bangun belah ketupat (Rhomboideus) Bangun garis (Linearis)
Ujung daun (Apex folii) Kategori Angka 3.24 Runcing (Acutus) 2.95 Meruncing (Acuminatus) 1.98 Tumpul (Obtusus) 0.92 Membulat (Rotundatus) 3.50 Terbelah (Retusus) 1.75 Sungut (Aristatus) 2.25 Rompang (Truncatus) 0.88 Berduri (Mucranutus) 1.57 Berlekuk (Emarginatus)
Pangkal daun (Basis folii) Kategori Angka 2.53 Runcing (Acutus) 3.47 Membulat (Rotundatus) 1.30 Rompang (Truncatus) 4.17 Berlekuk (Emarginatus) 2.95 Tumpul (Obtusus) 2.18 Meruncing (Acuminatus) 0.12 Bergigi (Dentatus) 0.12 Daun memeluk batang
Angka 3.64 2.09 9.10 3.92 4.22 6.83 3.46 3.72 7.00 4.50 0.50 0.10 15.00 2.00
20 Menyempit Jantung (Cordatus) Berpelepah
0.12 0.28 0.22
Susunan tulang daun (Nervatio) Kategori Angka 3.75 Menyirip (Penninervis) 2.21 Sejajar (Rectinervis) 0.58 Melengkung (Cervinervis) 2.33 Menjari (Palminervis) 0.34 Tidak jelas
Tepi daun Kategori Bertepi rata (Integer) Bergerigi (Serratus) Berombak (Repandus) Beringgit (Crenatus) Bergigi (Dentatus) Bercangap (Fissus) Berbagi menyirip (Pinnatipartitus) Berlekuk (Lobatus) Berlekuk menjari (Palmatilobus) Berbagi (Partitus)
Warna daun atas Kategori Angka 3.18 Hijau 3.26 Hijau tua 0.11 Ungu 1.42 Hijau muda 3.85 Merah 0.22 Hijau keunguan 0.08 Hijau kekuningan 0.26 Hijau keputihan
Angka 3.72 2.19 0.86 0.57 0.07 0.50 0.08 1.08 0.11 1.14
21 Warna daun bawah Kategori Angka 2.99 Hijau 3.60 Hijau muda 0.95 Hijau tua 0.25 Ungu 2.45 Merah 1.16 Hijau pucat 0.65 Hijau keperakan 0.26 Hijau buram 0.12 Merah gelap 0.26 Cokelat
Permukaan daun Kategori Licin (Laevis) Halus Kasap (Scaber) Kasar Berbulu halus (Villosus) Berbulu kasar (Hispidus) Gundul (Glaber) Berbulu Kasar bersisik Licin berbulu Licin mengkilat Berkerut
Angka 3.13 2.64 1.79 1.81 1.85 1.15 1.41 0.46 0.12 0.08 0.08 0.08
Daging daun Kategori Kulit/Belulang (Curiaceus) Perkamen (Perkamenteus) Kertas (Papyraceus) Selaput (Membarnaceus) Tipis lunak (Herbaceus) Berdaging (Carnosus)
Angka 1.59 2.94 3.40 0.61 2.08 0.26
22 Lampiran 3. Nilai BIC (Bayesian Information Criterion)
Jumlah Gerombol 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
BIC 4999.38 5155.65 5376.48 5670.26 5983.99 6307.38 6634.79 6983.85 7341.45 7703.03 8067.69 8439.33 8817.51 9203.29 9590.56
Rasio Ratio Perubahan perubahan perubahan BIC BIC jarak
156.28 220.83 293.78 313.74 323.38 327.41 349.06 357.60 361.58 364.66 371.64 378.18 385.78 387.27
1.00 1.41 1.88 2.01 2.07 2.09 2.23 2.29 2.31 2.33 2.38 2.42 2.47 2.48
1.27 1.46 1.14 1.07 1.03 1.19 1.08 1.04 1.03 1.08 1.08 1.10 1.02 1.05
Lampiran 4. Anggota gerombol dari Dua Tahap Metode
Gerombol Anggota Gerombol 1 Kuping gajah/Kimpul, Pakis haji, Dadap serep, Temu ireng, Bengle Gerombol 2 Oleander, Sirsak, Sambiloto, Murbai, Sawo kecik, Ketapang, Jagung, Landep, Daun ungu, Ki Tajam, Keji Besi, Gandarusa, Manukan, Pletesan, Keji Beling No.4, Chong Nang, Kisambang, Bayam Merah, Sangkuang, Semplek, Kenanga, Kaki Kuda, Adas Manis, Lame areuy, Tapak dara, Kopsia, Kayu rapet, Pule pandak, Kamboja putih, Mondokaki, Ginje, Dlingo, Gaceng, Palem nicobarik, Sahathavari, Daun seribu, Bandotan, Sembung, Urang aring, Tapak liman, Prasman, Sambung nyawa, Kamilan/scented mayweed, Daun Beluntas, Tempuyung, Stevia, Taraksakum/dandelion, Buyung, Kapuk randu, Kendal, Kompre/Kompri, Daun kupu-kupu, Secang, Awa kudang-kudang, Nyamplung, Manggis, Jelawe, Udani, Jambu bol/Simpur, Kokain, Croton, Patikan kebo, Sambang darah, Jarak pagar, Meniran, Katuk, Lobi-lobi, Daun jinten, Lenglengan, Po o/ menta, Janggelan/Cincau hitam, Selasih/kemangi, Nilam, Timi, Manis jangan, Adem ati/Kapu ketek, Bawang daun/bawang oncang, Lidah buaya ,Cakar ayam, Paku hata, Rambut gatal/Barbadaos cherry, Pacar cina/pacar culam, Mimba, Kayu lanang/songgo langit, Renceh/Mindi , Kecapi, Mahoni daun besar, Brotowali, Wangkal, Nangka, Awar-awar, Kayu putih, Cengkeh, Saga, Orok-orok , Cabe jawa, Sirih, Daun sendok, Daun encok, Sereh, Larasetu, Alang-alang, Jakang, Kelembak, Rumek, Som/Ginseng putih, Olig,
23 Kopi robusta, Mengkudu/Pace, Jeruk nipis, Kemuning , Godong minggu, Cendana , Sawo ijo/Apel ijo, Gigil, Tembakau , Kola , Jati belanda/ Jati londo , Coklat, Senggugu , Jarong lalaki/pecut kuda , Legundi, Lengkuas merah, Kapulaga, Resah/hanggana, Pacing, Kunyit/kunir, Temu giring, Temulawak, Temu putih, Kencur, Kecombrang , Lempuyang wangi, Jahe Gerombol 3 Wortel, Keladi Tikus, Tanganan, Anuma, Seruni, Kecubung gunung, Ambre, Kembang sepatu, Kina, Digitalis Lampiran 5. Anggota gerombol dari Dua Tahap Penggerombolan
Gerombol Gerombol 1
Gerombol 2
Gerombol 3
Anggota Oleander, Sirsak, Sambiloto, Semplek, Wortel, Kayu rapet, Dlingo, Kuping gajah/Kimpul, Sahathavari, Anuma, Sembung, Kamilan/scented mayweed, Tempuyung, Stevia, Kapuk randu, Kendal, Kompre/Kompri, Daun kupu-kupu, Jelawe, Pakis haji, Jambu bol/Simpur, Timi, Bawang daun/bawang oncang , Lidah buaya, Cakar ayam, Kecapi, Cengkeh, Saga, Sereh, Larasetu, Alangalang, Jakang, Som/Ginseng putih, Kina, Mengkudu/Pace, Godong minggu/inggu, Coklat, Senggugu, Lengkuas merah, Kapulaga, Pacing, Temulawak, Kencur, Kecombrang, Lempuyang wangi, Jahe, Bengle Jagung, Daun ungu, Gandarusa, Kisambang, Sangkuang, Kenanga, Kaki Kuda, Mondokaki, Tanganan, Palem nicobarik, Daun seribu, Bandotan, Seruni, Tapak liman, Daun Beluntas, Taraksakum/dandelion, Secang , Nyamplung, Udani, Patikan kebo, Sambang darah, Jarak pagar, Meniran, Katuk, Lobi-lobi, Ambre, Daun jinten, Janggelan/Cincau hitam, Selasih/kemangi, Nilam, Adem ati/Kapu ketek, Paku hata, Kembang sepatu, Pacar cina/pacar culam, Kayu lanang/songgo langit, Renceh/Mindi, Mahoni daun besar, Wangkal, Kayu putih, Orok-orok, Cabe jawa, Sirih, Daun sendok, Daun encok, Kelembak, Rumek, Olig, Jeruk nipis, Sawo ijo/Apel ijo, Digitalis, Kecubung gunung, Tembakau, Kola, Temu ireng, Prasman Murbai, Sawo kecik, Ketapang, Landep, Ki Tajam, Keji Besi, Manukan, Pletesan, Keji Beling No.4, Chong Nang, Bayam Merah, Adas Manis, Lame areuy, Tapak dara, Kopsia, Pule pandak, Kamboja putih, Ginje, Gaceng, Keladi Tikus, Urang aring, Sambung nyawa, Buyung, Awa kudang-kudang, Manggis, Kokain, Croton, Lenglengan, Po o/ menta, Manis jangan , Rambut gatal/Barbadaos cherry, Mimba, Brotowali, Nangka, Awar-awar, Gigil, Jati belanda/ Jati londo, Jarong lalaki/pecut kuda, Legundi, Resah/hanggana, Kunyit/kunir, Temu giring, Temu putih, Dadap serep, Kopi robusta, Kemuning, Cendana
Lampiran 6. Selang kepercayaan setiap peubah pada gerombol Dua Tahap Metode X10 (Suhu tanam minimum (oc))
24
X11 (Suhu tanam maksimum (oc))
X12 (Tinggi tanam dari permukaan laut minimum (m))
X13 (Tinggi tanam dari permukaan laut maksimum (m))
X14 (Panjang daun minimum (cm))
25 X15 (Panjang daun maksimum (cm))
X16 (Lebar daun minimum (cm))
X17 (Lebar daun maksimum (cm))
Lampiran 6.
Selang kepercayaan setiap peubah pada gerombol Dua Tahap Penggerombolan
X10 (Suhu tanam minimum (oc))
26 X11 (Suhu tanam maksimum (oc))
X12 (Tinggi tanam dari permukaan laut minimum (m))
X13 (Tinggi tanam dari permukaan laut maksimum (m))
X14 (Panjang daun minimum (cm))
27 X15 (Panjang daun maksimum (cm))
X16 (Lebar daun minumum (cm))
X17 (Lebar daun maksimum (cm))
28
RIWAYAT HIDUP Penulis dilahirkan di Garut pada tanggal 6 Januari 1993 dari ayah Mahpub dan ibu Ela. Penulis adalah putri kedua dari lima bersaudara. Pada tahun 2010 penulis lulus dari SMA Negeri 15 Garut dan pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) dan diterima di Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama masa perkuliahan, penulis aktif menjadi pengurus Himpunan Keprofesian Gamma Sigma Beta pada departemen Database Centre (DBC) tahun kepengurusan 2012-2013, pada departemen Kestari tahun kepengurusan 20132014. Penulis juga aktif menjadi anggota beberapa kepanitiaan acara yang diadakan oleh IPB seperti menjadi tim Konsumsi pada acara Pekan Olahraga Statistika (PORSTAT) 2011, tim Dana Usaha dan Konsumsi pada acara Welcome Ceremony of Statistics (WCS) 2012, tim Medis pada acara Welcome Ceremony of Statistics (WCS) 2013, tim Hubungan Masyarakat pada acara Statistika Ria ke-8, tim Lead Officer pada acara Lomba Jajak Pendapat Statistika (LJPS), Pesta Sains Nasional (PSN) 2013, tim Kesekretariatan pada acara Seminar dan Rapat Tahunan (Semirata) FMIPA 2014. Pada bulan Juli hingga Agustus 2013 penulis melaksanakan Praktik Lapang di Balai Penelitian Tanaman Jeruk dan Buah Subtropika, Batu, Jawa Timur. Penulis juga aktif sebagai pengajar mata kuliah Metode Statistika di salah satu bimbingan belajar di Dramaga, Bogor, pada tahun 2013.