PERBANDINGAN METODE FUZZY C-MEANS (FCM) DAN FUZZY

Download Jurnal Matematika 00 (2013) 01–05 ... The grouping used Fuzzy Clustering, Fuzzy C-Means method (FCM) and Fuzzy Gustafson-Kessel. (FGK) by f...

0 downloads 625 Views 588KB Size
Tersedia di www.fmipa.unsyiah.ac.id

Jurnal Matematika 00 (2013) 01–05

PERBANDINGAN METODE FUZZY C-MEANS (FCM) DAN FUZZY GUSTAFSON-KESSEL (FGK) MENGGUNAKAN DATA CITRA SATELIT QUICKBIRD (Studi Kasus Desa Lubuk Batee, Aceh Besar) Ahmad Mauliyadi M, Hizir Sofyan, dan Muhammad Subianto Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Syiah Kuala [email protected], [email protected], [email protected]

ABSTRAK Clustering merupakan salah satu teknik pengelompokan yang telah banyak digunakan di berbagai disiplin ilmu, yang bertujuan untuk mengelompokkan objek yang didasarkan pada kesamaan. Sebuah metode pengelompokan yang baik akan menghasilkan kualitas kelompok yang baik dilihat dari keakuratan hasil pengelompokan dengan data sebenarnya. Pada penelitian ini dilakukan pengelompokan piksel pada data citra satelit Quickbird tahun 2010 dengan objek penelitian daerah Desa Lubuk Batee, Aceh Besar. Pengelompokan tersebut menggunakan Fuzzy Clustering, yaitu metode Fuzzy C-Means (FCM) dan Fuzzy Gustafson-Kessel (FGK) dengan membentuk empat kriteria pengelompokan. Metode pengelompokan yang baik dilihat berdasarkan perbandingan hasil visualisasi dan pengambilan data secara acak yang kemudian divalidasi dengan data sebenarnya. Kata kunci : Fuzzy Clustering, Fuzzy C-Means (FCM), Fuzzy Gustafson-Kessel (FGK), Pengelompokan, Penginderaan Jarak Jauh.

ABSTRACT Clustering is a grouping technique widely used in various disciplines, which the aim is to classify objects based on their similarity. A good clustering method will produce clusters with a good accuracy when compared to the actual data. In this research, the pixel data of Quickbird satellite image 2010 are grouping with the object of the study area Lubuk Batee village, Aceh Besar. The grouping used Fuzzy Clustering, Fuzzy C-Means method (FCM) and Fuzzy Gustafson-Kessel (FGK) by forming four grouping criteria. A good method of grouping can be seen by comparing the results of visualization and taking randomly some data which will then be validation to the actual data. Keywords: Fuzzy Clustering, Fuzzy C-Means (FCM), Fuzzy Gustafson-Kessel (FGK), Clustering, Remote Sensing

1.

PENDAHULUAN

Perkembangan teknologi saat ini telah memberikan kemudahan kepada manusia untuk melakukan berbagai pekerjaan. Salah satu hasil dari perkembangan teknologi adalah pengindaraan jarak jauh (remote sensing), dengan adanya teknologi tersebut banyak manfaat yang bisa didapatkan seperti pemetaan pada bidang sumber daya alam, pertanian dan pengelolaan tata ruang. Salah satu data citra satelit yang sering digunakan adalah Quickbird. Data citra Satelit Quickbird memiliki resolusi 2,4 meter (mulitspektral) dan 60 sentimeter (pankromatik) dan dianggap sudah sangat baik untuk mengelompokkan dan menghasilkan peta tematik dengan teknik pengelompokan berdasarkan intensitas warna. Teknik pengelompokan dapat digunakan untuk mendapatkan informasi awal dari data citra satelit. Dengan metode pengelompokan konvensional, sebuah

data yang berbentuk kabur atau tidak terdefinisi dapat didefinisikan dalam sebuah kelompok menggunakan fuzzy clustering. Penggolongan data ke dalam kelompok (cluster) ditentukan berdasarkan derajat keanggotaan (membership degree) yang bernilai antara 0 hingga 1 [7]. Ada banyak metode pengelompokan dalam fuzzy clustering, pada penelitian ini metode pengelompokan yang digunakan adalah Fuzzy C-Means (FCM) dan Fuzzy Gustafson-Kessel (FGK). Metode ini akan digunakan untuk mengelompokkan data sesuai kelompoknya dan diharapkan mendapatkan hasil yang akurat, serta mendapatkan metode yang terbaik antara Fuzzy C-Means (FCM) dan Fuzzy GustafsonKessel (FGK) dengan cara melihat perbandingan hasil visualisasi dan pengambilan data secara acak yang kemudian divalidasi dengan data sebenarnya.

2. METODE PENELITIAN Data yang digunakan pada penelitian ini adalah citra Satelit Quickbird daerah Desa Lubuk Batee Kecamatan Ingin Jaya, Aceh Besar sebagai objek penelitian. Penelitian ini menggunakan metode Fuzzy C-Means (FCM) dan Fuzzy Gustafson-Kessel (FGK) untuk melakukan pengelompokan objek. Proses pengelompokan dengan metode FCM dan FGK menggunakan perangkat lunak Matlab R2010a. Kemudian untuk melihat hasil perbandingan metode dilakukan visualisasi dan pengambilan data secara acak yang kemudian divalidasi dengan data sebenarnya dengan menggunakan perangkat lunak Grass 6.4.2. 2.1 Fuzzy C-Means (FCM) Fuzzy C-Means (FCM) adalah suatu teknik pengelompokan data yang keberadaan tiap-tiap data dalam suatu kelompok ditentukan oleh nilai atau derajat keanggotaan tertentu dan teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981 [3]. Berikut algoritma pengelompokan Fuzzy C-Means (FCM) [1].

dengan

dimana X adalah data yang akan dikelompokan U adalah matriks partisi awal dengan membangkitkan nilai acak V adalah matriks pusat kelompok Adapun langkah langkah dalam metode FCM adalah 1. Menentukan data yang akan dikelompokan dengan bentuk matriks X berukuran dengan n x m, dimana n = jumlah data yang akan dikelompokan, m = atribute setiap data. 2. Menentukan: a. Jumlah kelompok yang akan dibentuk = c (≥ 2). b. Pangkat atau pembobot w = 2. c. Maksimum iterasi. d. Kriteria penghentian terkecil = e. Iterasi awal t = 1. 3. Membentuk matriks partisi awal U dengan membangkitkan nilai acak µik, i=1,2,…,n; k=1,2,…,c; sebagai elemen-elemen matriks partisi awal U sebagai berikut :

4. Menghitung pusat kelompok dan j=1,2,…,m

, dengan k=1,2,…c;

5. Menghitung fungsi obyektif

6. Memperbaiki derajat keanggotaan setiap data pada setiap kelompok (perbaiki matriks partisi), sebagai berikut :

7. Menentukan kriteria pemberhentian, Jika (|Ut – Ut-1|≤ ξ atau t > MaxIter) maka dihentikan, namun apabila tidak. Maka elemen dinaikkan iterasi dan kembali ke langkah 4. 2.2 Fuzzy Gustafson-Kessel (FGK) Fuzzy Gustafsson-Kessel (FGK) adalah suatu cara pengelompokan data yang mana keberadaan tiap-tiap data dalam suatu kelompok ditentukan oleh nilai keanggotaan dan teknik ini merupakan salah satu varians dari fuzzy clustering yang dikembangkan oleh Gustafson dan Kessel pada tahun 1979 [2]. Berikut algoritma pengelompokan Fuzzy Gustafson-Kessel (FGK) [1].

dengan = dimana : X adalah data yang akan dikelompokan U adalah matriks partisi awal dengan membangkitkan nilai acak V adalah matriks pusat kelompok Ai adalah mengindikasikan jarak kelompok

Adapun langkah-langkah dalam metode FGK adalah 1. Menentukan data yang akan dikelompokan dengan bentuk matriks X berukuran dengan n x m, dimana n = jumlah data yang akan dikelompokan, m = atribute setiap data. 2. Menentukan: a. Jumlah kelompok yang akan dibentuk = c (≥ 2). b. Pangkat atau pembobot w = 2. c. Maksimum iterasi. d. Kriteria penghentian terkecil = e. Iterasi awal t = 1.

3. Membentuk matriks partisi awal U dengan membangkitkan nilai acak µik, i=1,2,…,n; k=1,2,…,c; sebagai elemen-elemen matriks partisi awal U sebagai berikut :

Jumlah kelompok optimal ditunjukkan oleh nilai validitas kelompok saat mencapai kondisi nilai minimum pertama di lembah pertama yang didapatkan [5].

3. HASIL DAN PEMBAHASAN 4. Menghitung pusat kelompok kelompok sebagai berikut

, untuk v setiap

5. Menghitung kovarian matriks pengelompokan ( ) dengan rumus

6. Menghitung jarak

7. Memperbaiki derajat keanggotaan setiap data pada setiap kelompok

8. Menentukan kriteria pemberhentian Jika (|Ut – Ut-1|≤ ξ atau t > MaxIter) maka dihentikan, namun apabila tidak. Maka elemen dinaikkan iterasi dan kembali ke langkah 4. 2.3 Validasi Pengelompokan Validasi pengelompokan adalah sebuah konsep untuk mengevaluasi bagaimana hasil pengelompokan yang baik [4]. Hal ini diperlukan karena jumlah kelompok yang ditentukan atau bentuk kelompok mungkin tidak sesuai dengan data sebenarnya. Untuk menentukan jumlah kelompok yang paling optimal sesuai dengan data, maka digunakanlah indeks pengukuran validitas kelompok salah satunya separation index[6].

Dimana min adalah jarak minimum antara pusat kelompok N adalah jumlah titik data pada X c adalah jumlah kelompok Vi adalah pusat kelompok ke-i µik adalah keanggotaan fuzzy dari titik data

1. Penentuan Kelompok Optimal Data Satelit Quickbird memiliki tiga saluran, ketiga saluran tersebut diubah menjadi data piksel kemudian setalah menjadi piksel-piksel ketiga data tersebut digabungkan menjadi sebuah matriks berukuran 810.252 baris dan 3 kolom. Sebelum melakukan proses pengelompokan dengan menggunakan metode FCM dan FGK terlebih dahulu menentukan jumlah kelompok yang akan dibentuk, dengan menggunakan validasi separation index. Tabel 1. Hasil Validasi Separation Index Separation index Separation index Kelompok FCM FGK 2 0.0000000051834 0.0000000040883 3 0.0000000078713 0.0000000067338 4 0.0000000040852 0.0000000035328 5 0.0000000041162 0.0000000037221 6 0.0000000036461 0.0000000037602 7 0.0000000036784 0.0000000033985 8 0.0000000033672 0.0000000037142

Dari hasil tabel diatas, maka diperoleh nilai validasi minimum pada lembah pertama terdapat pada kelompok 4. Dengan menghasilkan nilai validasi untuk FCM sebesar 0.0000000040852 dan validasi FGK sebesar 0.0000000035328. Sehingga untuk melakukan pengelompokan yang terbaik menggunakan metode FCM dan metode FGK pada data penelitian ini dapat menggunakan 4 kelompok yaitu rumah, air, sawah dan tumbuhan

Gambar 1. Satelit Quickbird

2. Pengelompokan data dengan FCM dan FGK Matriks berukuran 810.252 baris dan 3 kolom dilakukan proses pengelompokan dengan menggunakan metode Fuzzy C-Means (FCM) dan Fuzzy Gustafson-Kessel (FGK). Pada proses FCM dan FGK diperoleh nilai

matriks partisi U pada pengelompokan ini maka dapat dilihat nilai kecenderungannya.

3. Hasil gambar perbandingan pengelompokan FCM dan FGK

Gambar 2. Nilai kecendurungan matriks partisi FCM Gambar 5. Hasil Pengelompokan FCM

Gambar 3. Nilai kecendurungan matriks partisi FGK

Sehingga dari nilai matriks U dapat dibentuk kembali hard cluster menjadi matriks dengan melihat nilai U terbesar setiap barisnya.

Gambar 6. Hasil Pengelompokan FGK

Gambar 3. Nilai Matriks U FCM menjadi hard cluster

Gambar 7. Citra Penelitian

Keterangan: 1. Rumah dan Jalan 3. Sawah

2. Air 4. Tumbuhan

Gambar 4. Nilai Matriks U FGK menjadi hard cluster

Nilai hard cluster inilah kemudian diubah kembali menjadi matriks berukuran 639 baris dan 1268 kolom. Matriks ini yang akan diubah ke dalam citra dan menghasilkan gambar untuk FCM dan FGK.

Secara visualisasi dari dua hasil pengelompokan fuzzy di atas, Fuzzy Gustafson-Kessel (FGK) menghasilkan data pengelompokan yang memiliki keakurasian yang lebih baik dibandingkan Fuzzy C-Means (FCM) untuk memvisualisasikannya gambaran data sebenarnya.

4. Perbandingan berdasarkan pengambilan sampel acak Salah satu cara untuk melihat hasil perbandingan metode manakah yang paling akurat, dapat dilakukan dengan pengambilan sampel secara acak berdasarkan piksel untuk diindentifikasi dan dievaluasi berdasarkan data sebenarnya. Pada penelitian ini, sampel yang diambil secara acak berjumlah 500 data untuk setiap hasil pada Fuzzy CMeans (FCM), Fuzzy Gustafson-Kessel (FGK) dan data koordinat. Dimana hasil yang diperoleh nantinya akan diindentifikasi dengan data sebenarnya pada peta.

4. SIMPULAN Dalam penelitian ini, proses fuzzy clustering pada metode Fuzzy C-Means (FCM) dan Fuzzy Gustafson-Kessel (FGK) dengan parameter yang sama didapati bahwa metode FGK lebih akurat dibandingkan dengan metode FCM. Simpulan ini didasari yang pertama dari perhitungan validasi pengelompokan, pada metode FCM didapati hasil akurasi pengelompokan sebesar 62%, sedangkan pada metode FGK hasil akurasi pengelompokan sebesar 88% dari data sebenarnya. Sehingga disimpulkan berdasarkan hasil validasi pengelompokan bahwa metode FGK lebih akurat dari pada metode FCM.

Tabel 2. Hasil akurasi FCM

Serta yang kedua didasari dari perbandingan hasil visualisasi dari dua pengelompokan fuzzy, yaitu FGK menghasilkan data pengelompokan yang memiliki keakurasian yang lebih baik dibandingkan FCM dalam memvisualisasikan gambaran data sebenarnya pada kasus kawasan Desa Lubuk Batee Kecamatan Ingin Jaya, Aceh Besar.

5. DAFTAR PUSTAKA

Tabel 3. Hasil akurasi FGK

Dari hasil verifikasi diperoleh data pengelompokan Fuzzy Gustafson-Kessel (FGK) lebih akurat dibandingkan hasil pengelompokan Fuzzy C-Means (FCM), ini dapat dilihat dari hasil akurasi pengelompokan FCM sebesar 62% dan hasil Pengelompokan FGK sebesar 88%. Sehingga diperoleh metode pengelompokan FGK sangat akurat untuk penelitian ini. Keterangan: 1. Rumah dan jalan 3. Sawah 2. Air 4. Tumbuhan

[1] Babuska, Robert. 2009. Fuzzy and Neural Control. Delft University of Technology, Delft. [2] Dwijayani, Monicha. 2010. Pengelompokan Entitas Audit Pemerintah Daerah di BPK RI Perwakilan Jawa Barat dengan Metode Clustering. Jurnal Program Study Magister Manajemen Teknologi. Institut Teknologi Sepuluh Nopember Surabaya, Surabaya. [3] Kusumadewi, Sri. 2002. Analisis Desain Sistem Fuzzy Mengunakan Tool Box Matlab. Graha Ilmu, Yogyakarta. [4] Wang, Xiao-Ying., Garibaldi, Jonathan M., Bird, Benjamin., and George, Mike W. 2007. Novel Developments In Fuzzy Clustering for the Classification of Cancerous Cells using FTIR Spectroscopy. Proc. Of advances in Fuzzy Clustering and its Applications. England: page 412-414. [5] Widodo, Agus., Purhadi. 2012. Perbandingan Metode Fuzzy C-Means dan Fuzzy C-Shell Clustering (Studi Kasus Kabupaten/Kota di Pulau Jawa Berdasarkan Variabel Pembentuk Indeks Pembangunan Manusia). Institut Teknologi Sepuluh Nopember, Surabaya. [6] Wu, Kuo-Lung., Yang, Miin-Shen. 2005. A Cluster Validity Index For Fuzzy Clustering. Pattern Recognition Letters, 1275–1291. [7] Zadeh, L.A. 1965. Fuzzy Sets. Information and Control, Vol 8 : 338-353.