Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
ISSN: 2085-725X
PENERAPAN METODE DATA MINING MARKET BASKET ANALYSIS TERHADAP DATA PENJUALAN PRODUK BUKU DENGAN MENGGUNAKAN ALGORITMA APRIORI DAN FREQUENT PATTERN GROWTH (FP-GROWTH) : STUDI KASUS PERCETAKAN PT. GRAMEDIA 1 1
Goldie Gunadi, 2Dana Indra Sensuse
Magister Ilmu Komputer Universitas Budi Luhur
[email protected] 2
Ilmu Komputer Universitas Indonesia
[email protected]
ABSTRAK Data mining merupakan proses analisa data untuk menemukan suatu pola dari kumpulan data tersebut. Data mining mampu menganalisa data yang besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung keputusan. Salah satu teknik data mining yang dapat digunakan adalah association data mining atau yang biasa disebut dengan istilah market basket analysis. Market basket didefinisikan sebagai suatu itemset yang dibeli secara bersamaan oleh pelanggan dalam suatu transaksi. Market basket analysis adalah suatu alat yang ampuh untuk pelaksanaan strategi cross-selling. Metode ini dimulai dengan mencari sejumlah frequent itemset dan dilanjutkan dengan pembentukan aturan-aturan asosiasi (association rules). Algoritma Apriori dan frequent pattern growth (FP-growth) adalah dua algoritma yang sangat populer untuk menemukan sejumlah frequent itemset dari data-data transaksi yang tersimpan dalam basis data. Dalam penelitian ini algoritma Apriori dan frequent pattern growth (FP-growth) digunakan untuk membantu menemukan sejumlah aturan asosiasi dari basis data transaksi penjualan produk buku di Percetakan PT. Gramedia, sehingga untuk selanjutnya dapat digunakan sebagai pertimbangan dalam membuat strategi pemasaran dan penjualan yang efektif. Kata kunci :
data mining, association rules, market basket analysis, Apriori, frequent pattern growth, FP-growth
bisnis. Suatu teknologi yang dapat digunakan untuk mewujudkannya adalah data mining. Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Salah satu metode yang seringkali digunakan dalam teknologi data mining adalah metode asosiasi atau association rule mining. Di dalam bidang usaha retail metode association rule mining ini lebih dikenal dengan istilah analisa
1. Pendahuluan Perkembangan teknologi informasi telah memberikan kontribusi pada cepatnya pertumbuhan jumlah data yang dikumpulkan dan disimpan dalam basis data berukuran besar (gunung data). Dibutuhkan sebuah metode atau teknik yang dapat merubah gunungan data tersebut menjadi sebuah informasi berharga atau pengetahuan (knowledge) yang bermanfaat untuk mendukung pengambilan keputusan 118
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
keranjang belanja (market basket analysis). Market basket analysis adalah suatu metode analisa atas perilaku konsumen secara spesifik dari suatu golongan / kelompok tertentu. Sumber data dari market basket analysis antara lain dapat bersumber dari transaksi kartu kredit, kartu lotere, kupon diskon, panggilan keluhan pelanggan. Market basket analysis umumnya dimanfaatkan sebagai titik awal pencarian pengetahuan dari suatu transaksi data ketika kita tidak mengetahui pola spesifik apa yang kita cari. Kebutuhan market basket analysis berawal dari keakuratan dan manfaat yang dihasilkannya dalam wujud aturan assosiasi (association rules). Yang dimaksud dengan association rules adalah pola-pola keterkaitan data dalam basis data. Percetakan PT. Gramedia adalah sebuah perusahaan yang bergerak di bidang industri percetakan dan telah beroperasi sejak tahun 1972. Hingga kini Percetakan PT. Gramedia telah melayani sekian banyak transaksi pesanan cetakan. Setiap data transaksi tersebut disimpan di dalam suatu sistem basis data melalui aplikasi sistem informasi manajemen. Dalam penelitian ini penulis akan mencoba untuk melakukan suatu eksperimen terhadap data transaksi penjualan produk buku di Percetakan PT. Gramedia dengan menggunakan sebuah metode market basket analysis untuk melihat hubungan asosiasi (korelasi) antara sejumlah atribut penjualan. Algoritma yang akan digunakan adalah algoritma Apriori dan algoritma frequent pattern growth (FPgrowth). Kedua algoritma ini digunakan untuk membentuk frequent itemsets yang nantinya akan dijadikan sebagai acuan untuk merumuskan aturan-aturan asosiasi yang dihasilkan oleh model market basket analysis dengan menggunakan alat bantu perangkat lunak aplikasi Weka versi 3.6. Aturan-aturan asosiasi yang dihasilkan oleh masing-masing algoritma Apriori dan FPgrowth akan dievaluasi dan dianalisa untuk menemukan algoritma yang paling baik dan sesuai (best-fit algorithm) untuk permasalahan yang dikaji dalam penelitian ini.
ISSN: 2085-725X
Komponen-komponen penjualan utama yang akan digunakan sebagai acuan didalam penentuan hubungan asosiasi dengan menggunakan market basket analysis adalah : a. Jenis cover buku b. Teknik penjilidan c. Penggunaan plastik buku d. Penggunaan jenis kertas khusus untuk cover buku e. Penggunaan jenis kertas khusus untuk isi buku f. Pekerjaan-pekerjaan dalam pembuatan cover seperti : UV, laminating, embossed, dan hot print. Dengan dilakukannya penelitian ini, diharapkan dapat memberikan hasil berupa informasi yang bermanfaat bagi pihakpihak terkait dalam melakukan proses pengambilan keputusan manajerial, terutama yang berkaitan dengan perumusan atau pembuatan strategi pemasaran dan penjualan, khususnya untuk produk-produk buku di Percetakan PT. Gramedia. 2. Landasan Pemikiran 2.1. Tinjauan Pustaka 2.1.1. Data Mining Menurut Turban dalam bukunya yang berjudul ”Decision Support Systems and Intelligent Systems”, data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam basis data. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai basis data besar [1].
Gambar 1. Data mining merupakan irisan dari berbagai disiplin [2]. 119
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
ISSN: 2085-725X
ketidakmiripan record dalam klaster yang lain. Berbeda dengan klasifikasi, pada pengklasteran tidak ada variabel target. Pengklasteran tidak melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target, akan tetapi, algoritma pengklasteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. f. Asosiasi Tugas asosiasi dalam data mining adalah untuk menemukan atribut yang muncul dalam satu waktu. Salah satu implementasi dari asosiasi adalah market basket analysis atau analisis keranjang belanja, sebagaimana yang akan dibahas dalam tesis ini.
2.1.2. Pengelompokan Data Mining Menurut Larose dalam bukunya yang berjudul ”Discovering Knowledge in Data: An Introduction to Data Mining”, data mining dibagi menjadi beberapa kelompok berdasarkan tugas/pekerjaan yang dapat dilakukan, yaitu [1]: a. Deskripsi Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Deskripsi dari pola kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan. b. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan baris data (record) lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. c. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi. d. Klasifikasi Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. e. Pengklasteran (Clusterring) Pengklasteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas obyek-obyek yang memiliki kemiripan. Klaster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki
2.1.3. Knowledge Discovery in Databases KDD terdiri dari tiga proses utama yaitu: a. Preprocessing Preprocessing dilakukan terhadap data sebelum algoritma data mining diaplikasikan. Proses ini meliputi data cleaning, integrasi, seleksi dan transformasi. b. Data mining Proses utama dalam KDD adalah proses data mining, dalam proses ini algoritmaalgoritma data mining diaplikasikan untuk mendapatkan pengetahuan dari sumber data. c. Post processing Hasil yang diperoleh dari proses data mining selanjutnya akan dievaluasi pada post processing. 2.1.4. Market Basket Analysis Market basket analysis adalah suatu metodologi untuk melakukan analisis buying habit konsumen dengan menemukan asosiasi antar beberapa item yang berbeda, yang diletakkan konsumen dalam shopping basket (keranjang belanja) yang dibeli pada 120
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
suatu transaksi tertentu. Tujuan dari market basket analysis adalah untuk mengetahui produk-produk mana yang mungkin akan dibeli secara bersamaan [3].
ISSN: 2085-725X
Dimana : L : himpunan frequent itemset minsup : minimum support C : himpunan kandidat itemset c : kandidat itemset t : transaksi
2.1.5. Analisis Asosiasi Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan asosiasi antara suatu kombinasi item [1]. Interestingness measure yang dapat digunakan dalam data mining adalah : a. Support, adalah suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item atau itemset dari keseluruhan transaksi. b. Confidence, adalah suatu ukuran yang menunjukkan hubungan antar dua item secara conditional (berdasarkan suatu kondisi tertentu).
2.1.7. Analisis Pola Frekuensi Tinggi dengan Algoritma Apriori Mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam basis data. Nilai support sebuah item diperoleh dengan menggunakan rumus berikut:
Nilai support dari 2 item diperoleh dengan menggunakan rumus :
Metodologi dasar analisis asosiasi terbagi menjadi 2 tahap, yakni melakukan analisa pola frekuensi tinggi (frequent pattern) dan berikutnya adalah proses pembentukan aturan asosiasi.
Frequent itemset menunjukkan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang ditentukan (). Misalkan = 2, maka semua itemsets yang frekuensi kemunculannya lebih dari atau sama dengan 2 kali disebut frequent. Himpunan dari frequent k-itemset dilambangkan dengan Fk.
2.1.6. Algoritma Apriori Algoritma Apriori adalah suatu algoritma dasar yang diusulkan oleh Agrawal & Srikant pada tahun 1994 untuk penentuan frequent itemsets untuk aturan asosiasi boolean [3]. Bentuk algoritma dari metode Apriori dapat dituliskan sebagai berikut [3]:
2.1.8. Algoritma FP-Growth FP-growth adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data. FP-growth menggunakan pendekatan yang berbeda dari paradigma yang digunakan pada algoritma Apriori.
L1 = {frequent itemset with one element} for (k=2; Lk-1; k++) { Ck = apriori-gen(Lk-1); //pembuatan kandidat //baru for all transactions t { C't = subset(Ck, t); //kandidat yang //tampil pada t for all candidates c C't do c.count ++; } Lk = { c C't | c.count minsup} } return kLk;
2.1.9. Analisis Pola Frekuensi Tinggi dengan Algoritma FP-growth Pada penentuan frequent itemset terdapat 2 tahap proses yang dilakukan yaitu: pembuatan FP-tree dan penerapan algoritma FP-growth untuk menemukan frequent itemset. Struktur data yang digunakan untuk mencari frequent itemset 121
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
dengan algoritma FP-growth adalah perluasan dari penggunaan sebuah pohon prefix, yang biasa disebut adalah FP-tree. Dengan menggunakan FP-tree, algoritma FP-growth dapat langsung mengekstrak frequent itemset dari FP-tree yang telah terbentuk dengan menggunakan prinsip divide and conquer.
ISSN: 2085-725X
2.1.9.2. Penerapan Algoritma FP-Growth Setelah tahap pembangunan FP-tree dari sekumpulan data transaksi, akan diterapkan algoritma FP-growth untuk mencari frequent itemset yang signifikan. Algoritma FP-growth dibagi menjadi tiga langkah utama, yaitu : a. Tahap Pembangkitan Conditional Pattern Base Conditional Pattern Base merupakan subdatabase yang berisi prefix path (lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional pattern base didapatkan melalui FP-tree yang telah dibangun sebelumnya. b. Tahap Pembangkitan Conditional FPtree Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar sama dengan minimum support count ξ akan dibangkitkan dengan conditional FPtree. c. Tahap Pencarian frequent itemset Apabila Conditional FP-tree merupa-kan lintasan tunggal (single path), maka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap conditional FP-tree. Jika bukan lintasan tunggal, maka dilakukan pembangkitan FP-growth secara rekursif.
2.1.9.1.Pembuatan FP-Tree FP-tree merupakan struktur penyimpanan data yang dimampatkan. FP-tree dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan tertentu dalam FP-tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-tree semakin efektif. Adapun FP- tree adalah sebuah pohon dengan definisi sebagai berikut: a. FP-tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan sub-tree yang beranggotakan item-item tertentu, dan sebuah tabel frequent header. b. Setiap simpul dalam FP-tree mengandung tiga informasi penting, yaitu label item, menginformasikan jenis item yang direpresentasikan simpul tersebut, support count, merepresentasikan jumlah lintasan transaksi yang melalui simpul tesebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antar-lintasan, ditandai dengan garis panah putus-putus.
2.1.10. Pembentukan Aturan Asosiasi Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A B. Nilai confidence dari aturan A B diperoleh dengan rumus berikut.
Untuk menentukan aturan asosiasi yang akan dipilih maka harus diurutkan berdasarkan Support × Confidence. Aturan diambil sebanyak n aturan yang memiliki hasil terbesar [1].
Gambar 2. Contoh FP-tree dan Tabel Header 122
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
ISSN: 2085-725X
inovasi produk dan layanan yang memuaskan pelanggan. b. Menyediakan layanan disain, percetakan, pengemasan dan layanan distribusi yang paling disukai pelanggan untuk mencerahkan dan mencerdaskan masyarakat.
2.2. Tinjauan Studi Dalam [4] diukur nilai confidence dari setiap aturan asosiasi yang dihasilkan. Aturan asosiasi yang diambil adalah aturanaturan asosiasi yang memiliki nilai confidence lebih besar atau sama dengan nilai minimum confidence yang telah ditentukan . Dalam tulisannya, [5] menggunakan hasil dari nilai Support dikalikan dengan Confidence terhadap masing-masing aturan asosiasi yang dihasilkan untuk mengukur kekuatan dari aturan asosiasi yang bersangkutan. Dalam penelitiannya yang berjudul ”A Scalable Algorithm for the Market Basket Analysis”, Luís Cavique melakukan perbandingan performa terhadap akurasi dari dua algoritma asosiasi yaitu algoritma similis dan FP-growth, dengan menghitung tingkat akurasinya. Fungsi yang digunakan untuk menghitung persentase akurasi dari algoritma similis terhadap FP-growth adalah :
2.4. Kerangka Pemikiran Kerangka pemikiran penelitian market basket analysis, meliputi : a. Business Understanding b. Data Understanding c. Pemilihan Model Data Mining d. Pemilihan Algoritma Asosiasi e. Data Preparation f. Data Mining g. Evaluasi dan Analisa
2.3. Tinjauan Obyek Penelitian 2.3.1. Percetakan PT. Gramedia Percetakan PT. Gramedia berdiri sejak tahun 1972, bergerak di bidang layanan jasa cetak koran, tabloid, buku, majalah dan material promosi. Disamping melayani pelanggan dalam kelompok Kompas Gramedia, juga telah dipercaya oleh pelanggan dari luar kelompok Kompas Gramedia untuk mencetak produkproduknya.
Gambar 3. Kerangka pemikiran penelitian market basket analysis
2.3.2. Visi dan Misi Perusahaan Visi yang ingin dicapai oleh Percetakan PT. Gramedia adalah: “Menjadi percetakan kelas dunia terbaik di Asia Tenggara.” Misi dari Percetakan PT. Gramedia adalah : a. Mendukung pencapaian sasaran bisnis pelanggan dengan memahami bisnis, menjamin keamanan produk, memberi kualitas yang dipilih, memberikan
2.4.1. Evaluasi Ada 2 faktor yang akan dievaluasi dalam penelitian ini, yaitu ukuran generalitas (generality) dan ukuran reliabilitas (reliability) dari association rules yang dihasilkan. Ukuran generalitas digunakan untuk mengetahui seberapa tingkat kemunculan setiap item yang dirumuskan dalam aturan 123
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
asosiasi terhadap keseluruhan transaksi. Ukuran-ukuran yang digunakan adalah : a. Support Support adalah ukuran dari seberapa sering koleksi item dalam asosiasi terjadi bersama sebagai persentase dari seluruh transaksi. Rumus : s(A B) = P(A∩B) dimana :
ISSN: 2085-725X
dengan yang lainnya memiliki suatu ketergantungan atau tidak. Correlation (A B) bernilai 0 jika A dan B adalah bersifat independen (tidak memiliki ketergantungan), dan 1 (nilai positif, >0) atau -1 (nilai negatif, <0) jika mereka tergantung. 1 menunjukkan daya tarik, dan -1 menunjukkan tolakan. Rumus : Correlation (A B)=P(A∩B)/[P(A)P(B)] dimana : P(A) = Transaksi mengandung A P(B) = Transaksi mengandung B
b. Coverage Coverage adalah ukuran seberapa sering koleksi setiap item yang dirumuskan pada sisi sebelah kiri (faktor penyebab) terjadi sebagai persentase dari seluruh transaksi. Rumus :
2.4.2. Analisa Analisa dilakukan terhadap sejumlah aturan asosiasi dengan nilai confidence terbesar yang dihasilkan oleh masingmasing algoritma Apriori dan FP-growth. Analisa dilakukan dengan menghitung tingkat kekuatan dan akurasi dari masingmasing aturan yang diimplementasikan terhadap evaluation dataset data transaksi penjualan terkini. Untuk menghitung tingkat kekuatan dilakukan dengan rumus :
Ukuran reliabilitas digunakan untuk mengetahui tingkat kehandalan dari aturan asosiasi yang dihasilkan dalam association rules mining. Ukuran-ukuran yang digunakan adalah : a. Confidence Confidence adalah ukuran ketidakpastian atau kepercayaan kelayakan yang terkait dengan setiap pola yang ditemukan. Rumus : α(A B) = P(B|A) dimana :
dimana: n = jumlah aturan asosiasi Si = nilai support untuk aturan asosiasi ke-i Ci = nilai confidence untuk aturan asosiasi ke-i Untuk menghitung besar persentase akurasi algoritma A terhadap algoritma B dilakukan dengan menggunakan rumus :
b. Added Value Added Value digunakan untuk mengukur berapa besar selisih antara nilai confidence dengan peluang terjadinya kombinasi setiap item pada sisi akibat pada aturan asosiasi terhadap seluruh transaksi. Added Value (A B)=P(B|A)-P(B) c. Correlation Correlation digunakan untuk menentukan apakah antara itemset yang satu
3. Rancangan Penelitian 3.1. Data Penelitian Data yang akan digunakan di dalam penelitian ini adalah data transaksi pesanan cetakan di Percetakan PT. Gramedia yang terkumpul mulai dari tanggal 1 Januari 2005 hingga 1 Agustus 2010. Tabel-tabel yang digunakan sebagai obyek penelitian ini adalah : 124
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
Tabel 1. Tabel obyek penelitian No 1 2 3 4 5 6 7 8 9 10 11 12 13
Nama Tabel Tbl_Master_Order Tbl_Master_Pelanggan Tbl_Rincian_Order Tbl_Order_Sortir_Pak Tbl_Jenis_Permintaan Tbl_Jenis_Produk Tbl_Nama_Kertas Tbl_Teknik_Jilid Tbl_Jenis_Cover Tbl_Jenis_Laminating Tbl_Jenis_UV Tbl_Master_Site Tbl_Nama_Komponen
ISSN: 2085-725X
3.3. Perangkat Lunak Aplikasi-aplikasi yang digunakan untuk membantu proses penelitian market basket analysis terdiri dari :
Tuples 147498 2038 258278 143620 6 18 182 14 7 6 4 4 5
a. SQL Server 2005 Express Edition Dalam penelitian ini SQL Server 2005 Express Edition digunakan untuk menyimpan basis data yang akan digunakan dalam penelitian sebagai hasil dari proses pemilihan data penelitian. Setelah itu dilakukan proses pembersihan dan penyiapan data serta pembuatan dataset penelitian dengan menggunakan perangkat SQL Server Management Studio Express.
3.2. Kerangka Kerja Kerangka kerja penelitian dapat dilihat dalam bentuk diagram aktivitas berikut:
b. Weka 3.6 Aplikasi Weka digunakan dalam penelitian untuk mengimplementa-sikan model data mining terhadap basis data penelitian. Weka juga digunakan untuk menampilkan presentasi knowledge yang dapat disimpulkan dari hasil penerapan model data mining terhadap sejumlah atribut penjualan produk buku di Percetakan PT. Gramedia. 4. Analisis Dan Interpretasi 4.1. Entity Relationship Diagram (ERD) Hubungan antar tabel yang digunakan dapat digambarkan dengan menggunakan sebuah diagram relasi antar entitas (Entity Relationship Diagram).
Gambar 4. Diagram aktivitas penelitian 125
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
ISSN: 2085-725X
persentase kemunculan melebihi atau sama dengan 0,2 % akan terpilih menjadi atribut. Data-data persentase dari masingmasing komponen dapat dilihat pada sejumlah tabel berikut : Tabel 2. Data frekuensi kandidat atribut cover buku Item Soft Cover Semi Hard Cover Hard Cover Total
Frek 34678 57 1185 35920
Persen 96,54 0,16 3.3 100
Tabel 3. Data frekuensi kandidat atribut teknik penjilidan Item Benang Kawat Spiral Punch Kawat Lem Lem + Benang Lipat Sisip Potong Jadi Total
Gambar 5. Entity Relationship Diagram 4.2. Pemilihan Data Pemilihan data mengacu pada permasalahan yang telah diidentifikasi sebelumnya. Hasil dari proses pemilihan data terhadap masing-masing tabel adalah :
3 230 8 5127 29075 1962 10 1 77 36493
Persen 0,008 0,63 0,02 14,05 79,67 5,38 0,03 0,002 0,21 100
Tabel 4. Data frekuensi kandidat atribut teknik UV Item UV Doft UV Spot Lainnya Total
Tabel 1. Tabel hasil pemilihan data Nama Tabel Tbl_Master_Order_Ex Tbl_Rincian_Order_Ex Tbl_Order_Sortir_Pak_Ex Tbl_Master_Pelanggan_Ex Tbl_Jenis_Permintaan_Ex Tbl_Jenis_Produk_Ex Tbl_Nama_Kertas_Ex Tbl_Teknik_Jilid_Ex Tbl_Jenis_Cover_Ex Tbl_Jenis_Laminating_Ex Tbl_Jenis_UV_Ex Tbl_Master_Site_Ex Tbl_Nama_Komponen_Ex
Frek
Tuples 36558 69673 35875 690 2 4 54 9 5 4 3 4 3
Frek 16798 4765 13608 35171
Persen 47,76 13,55 38,69 100
Tabel 5. Data frekuensi kandidat atribut teknik laminating Item Laminating Gloss Laminating Doft Lainnya Total
Frek 2865 7344 24962 35171
Persen 8,15 20,88 70,97 100
Tabel 6. Data frekuensi kandidat atribut teknik embossed dan hot print Item Embossed Hot Print
4.3. Pemilihan Atribut Dari setiap item data akan dihitung besar persentase jumlah frekuensi kemunculan item tersebut terhadap jumlah transaksi keseluruhan. Penentuan nilai batas minimum (Treshold) sebesar 0,2 %, sehingga setiap item data yang memiliki
Frek 2877 295
Persen 8,18 0,8
Tabel 7. Data frekuensi kandidat atribut penggunaan plastik shrink Item Shrink
126
Frek 26992
Persen 75,24
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
ISSN: 2085-725X
Tabel 8. Data frekuensi kandidat atribut jenis kertas cover buku Item Art Paper Karton Board Art Karton Newsprint Lainnya Total
Frek 2601 1109 30489 9 963 35171
Persen 7,4 3,15 86,69 0,02 2,74 100
Tabel 9. Data frekuensi kandidat atribut jenis kertas halaman isi buku Item Art Paper Newsprint HVS/ Woodsfree HVS Sheet Koran Sheet Lainnya Total
Frek 4228 13307 1713 10048 4346 510 34152
Persen 12,38 39 5 29,42 12,72 0,01 100
Gambar 6. Kombinasi atribut penelitian 4.3.2. Penentuan Atribut Penelitian Dari sekian banyak kombinasi atribut yang ada, kombinasi atribut yang nantinya akan digunakan dalam penelitian ini adalah kombinasi dari atribut-atribut yang memiliki persentase kemunculan paling besar dari masing-masing komponen.
Dari hasil proses pemilihan atribut, dapat diperoleh sejumlah atribut yang memenuhi syarat treshold minimum dan dapat digunakan dalam market basket analysis. Seluruh atribut penelitian yang merupakan hasil seleksi dari setiap komponen penjualan produk buku dapat dilihat pada tabel berikut :
Tabel 11. Atribut yang digunakan dari masing-masing komponen Komponen Jenis cover Teknik jilid
Teknik jilid
Shrink Jenis kertas cover Jenis kertas isi
UV Laminating Embossed Hot Print
Atribut Terpilih {Soft Cover}, {Hard Cover} {Kawat}, {Lem}, {Lem + Benang}, {Kawat Spiral}, {Potong Jadi} {Shrink} {Art Paper}, {Karton Board}, {Art Karton} {Art Paper}, {Newsprint}, {HVS/Woodfree}, {HVS Sheet}, {Koran Sheet} {UV Doft }, {UV Spot} {Laminating Gloss}, {Laminating Doft} {Embossed} {Hot Print}
Atribut Penelitian 6,54%}, {SoftCover}
{SoftCover = {HardCover = 3,3%} {Kawat = 14,05%}, {Lem = 79,67%}, {LemBenang = 5,38%}, {KawatSpiral = 0,63%}, {PotongJadi = 0,21%} UV {UVDoft = 47,76%}, {UVSpot = 13,55%} Lamina- {LaminatingGloss = 8,15%}, ting {LaminatingDoft = 20,88%} Emboss- {Embossed = 8,18%} ed Hot {HotPrint = 0,8 %} Print Shrink {Shrink = 75,24%} Jenis {ArtPaperCover = 7,4 %}, kertas {KartonBoardCover = 3,15%}, cover {ArtKartonCover = 86,69%} Jenis {ArtPaperIsi = 12,38%}, = 39%}, kertas isi {NewsprintIsi {HVSWoodfreeIsi = 5%}, {HVSSheetIsi = 29,42%}, {KoranSheetIsi = 12,72%}
Tabel 10. Data frekuensi atribut terpilih Komponen Jenis cover
Atribut Terpilih
Jumlah 2 5
1 3 5
2 2 1 1
4.3.1. Kombinasi Atribut Kombinasi atribut yang dapat digunakan untuk pencarian aturan asosiasi tampak seperti pada gambar dibawah ini :
{Lem}
{UVDoft} {Laminating Doft} {Embossed} {HotPrint} {Shrink} {ArtKarton Cover}
{Newsprint Isi}
Berdasarkan nilai persentase terbesar dari masing-masing atribut, dengan 127
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
demikian atribut-atribut yang akan digunakan dalam penelitian adalah : jenis cover hard cover, teknik penjilidan dengan menggunakan lem, proses : UV doft, laminating doft, embossed dan hot print, penggunaan plastik shrink, jenis kertas Art Karton untuk cover buku serta jenis kertas Newsprint untuk halaman isi buku.
Dataset dengan struktur tersebut diatas, dibuat sebanyak 3 buah dalam bentuk tabel dengan nama Tbl_Dataset_Training, Tbl_Dataset_Evaluation1, dan Tbl_Dataset_Evaluation2. Masing-masing dataset tersebut kemudian diisi dengan data-data sebagai berikut : a. Tabel Tbl_Dataset_Training diisi dengan seluruh data transaksi penjualan yang terdapat pada basis data penelitian. b. Tabel Tbl_Dataset_Evaluation1 diisi dengan 5000 data transaksi penjualan terakhir yang terdapat pada basis data penelitian. c. Tabel Tbl_Dataset_Evaluation2 diisi dengan 10000 data transaksi penjualan yang diambil secara acak dari basis data penelitian. Data acak yang diambil adalah data-data transaksi penjualan mulai tanggal 1 Januari 2008.
4.4. Pembersihan dan Penyiapan Data Perintah SQL yang digunakan untuk melakukan pembersihan data adalah perintah DML SQL. Berikut adalah jumlah tuples terakhir dari masing-masing tabel transaksi setelah dilakukannya pembersihan data : a. Tbl_Master_Order : 32821 Tuples b. Tbl_Rincian_Order : 69996 Tuples c. Tbl_Order_Sortir : 32821 Tuples 4.5. Pembuatan Dataset Dataset dibuat berdasarkan atributatribut yang telah dipilih pada data transaksi penjualan produk buku. Berikut adalah struktur dataset yang dibuat :
4.6. Data Mining Proses data mining dilakukan terhadap tabel Tbl_Dataset_Training dengan menggunakan aplikasi Weka versi 3.6. Sepuluh aturan asosiasi dengan nilai confidence terbesar diambil untuk dievaluasi dan dianalisa dalam penelitian ini.
Tabel 12. Struktur dataset penelitian Tipe Data ID INTE-GER SoftCover CHAR(1) HardCover CHAR(1) Kawat CHAR(1) KawatSpiral CHAR(1) Lem CHAR(1) LemBenang CHAR(1) PotongJadi CHAR(1) UVDoft CHAR(1) UVSpot CHAR(1) LaminatingGloss CHAR(1) LaminatingDoft CHAR(1) Embossed CHAR(1) HotPrint CHAR(1) Shrink CHAR(1) ArtPaperCover CHAR(1) ArtKartonCover CHAR(1) KartonBoardCover CHAR(1) ArtPaperIsi CHAR(1) NewsprintIsi CHAR(1) HVSWoodfreeIsi CHAR(1) HVSSheetIsi CHAR(1) KoranSheetIsi CHAR(1) Nama Kolom
Atribut Kolom PrimaryKey NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull NotNull
ISSN: 2085-725X
Keterangan
4.6.1. Aturan Asosiasi Algoritma Apriori Aturan-aturan asosiasi yang diperoleh dari penerapan market basket analysis dengan algoritma apriori adalah seperti pada tabel berikut :
IDtransaksipenjualan Atributjeniscover AtributJeniscover Atributteknikpenjilidan Atributteknikpenjilidan Atributteknikpenjilidan Atributteknikpenjilidan Atributteknikpenjilidan AtributjenisUV AtributjenisUV Atributjenislaminating Atributjenislaminating Atributembossed Atributhotprint Atributshrink Atributkertascover Atributkertascover Atributkertascover Atributkertashalamanisi Atributkertashalamanisi Atributkertashalamanisi Atributkertashalamanisi Atributkertashalamanisi
Tabel 13. Aturan asosiasi hasil algoritma Apriori Urt A 1 {Lem=y}, {Shrink=y}, {ArtKarton Cover=y} 2 {Lem=y}, {ArtKarton Cover=y} 3 {Lem=y}, {Shrink=y} 4 {Lem=y} 5 {Shrink=y}, {ArtKarton Cover=y}
128
B {SoftCover =y}
FA 23849
FA,B Cnf 23846 1
{SoftCover =y}
26042
26035
1
{SoftCover =y}
24078
24068
1
{SoftCover =y} {SoftCover =y}
26705 24864
26684 24814
1 1
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
Tabel 13. Aturan asosiasi hasil algoritma Apriori (Lanjutan) Urt A B FA 6 {ArtKartonCover=y} {SoftCover =y} 29947 7 {SoftCover=y}, {ArtKarton 24068 {Lem=y}, Cover=y} {Shrink=y} 8 {Lem=y}, {ArtKartonCover 24078 {Shrink=y} =y} 9 {Lem=y}, {SoftCover=y}, 24078 {Shrink=y} {ArtKartonCover =y} 10 {SoftCover=y}, {ArtKartonCover 25086 {Shrink=y} =y}
Tabel 15. Aturan asosiasi hasil algoritma FP-growth (Lanjutan) 3 {Lem=y}, {UVDoft=y}, {NewsprintIsi=y} 4 {Lem=y}, {NewsprintIsi=y} 5 {Shrink=y}, {UVDoft=y} 6 {UVDoft=y}, {NewsprintIsi=y} 7 {UVDoft=y}, {NewsprintIsi=y} 8 {NewsprintIsi=y} 9 {UVDoft=y}, {NewsprintIsi=y} 10 {NewsprintIsi=y}
FA,B Cnf 29878 1 23846 0,99
23849 0,97 23846 0,94
24814 0,94
Aturan-aturan asosiasi yang dihasilkan oleh algoritma Apriori ditentukan oleh sejumlah kombinasi items sebagai berikut :
{Lem=y}
12306
12228
0,99
{Shrink=y}
12465
12228
0,98
{Lem=y}
13529
13247
0,98
{Lem=y}
8540
8336
0,98
{Shrink=y}
8540
8199
0,96
{Lem=y} {Lem=y}, {Shrink=y} {Shrink=y}
12998 8540
12465 8189
0,96 0,96
12998
12306
0,95
4.7. Evaluasi Aturan Asosiasi Evaluasi aturan asosiasi dilakukan dengan menggunakan 2 buah evaluation dataset, yang telah disiapkan sebelumnya. Evaluasi dilakukan dengan mengukur generalitas dan reliabilitas dari masingmasing aturan yang dihasilkan.
Tabel 15. Aturan asosiasi hasil algoritma FP-growth Cnf 1
0,98
Dari tabel di atas dapat dilihat bahwa algoritma FP-growth menemukan adanya hubungan antara penggunaan plastik shrink, proses UV Doft pada cover, jenis kertas Newsprint untuk isi halaman buku, dan teknik jilid lem, yang digambarkan oleh aturan-aturan asosiasi yang dihasilkannya.
4.6.2. Aturan Asosiasi Algoritma FPgrowth Aturan-aturan asosiasi yang diperoleh dari penerapan market basket analysis dengan algoritma FP-growth adalah seperti pada tabel berikut :
FA,B 8189
8189
Ukuran Items itemset 2 {NewsprintIsi,Lem},{NewsprintIsi,Shrink} 3 {Shrink,NewsprintIsi,Lem},{Shrink,UVDoft,Lem}, {UVDoft, NewsprintIsi, Lem}, {UVDoft, NewsprintIsi, Shrink} 4 {Shrink,UVDoft,NewsprintIsi,Lem}
Dari tabel di atas dapat dilihat bahwa algoritma apriori menemukan adanya hubungan antara teknik penjilidan lem, penggunaan plastik shrink, jenis kertas Art Karton untuk cover buku, dan jenis cover soft cover, yang digambarkan oleh aturan-aturan asosiasi yang dihasilkannya.
FA 8199
8336
Tabel 16. Kombinasi items pada aturan asosiasi FP-growth
Ukuran Items Itemset 2 {Lem,SoftCover},{ArtKartonCover,SoftCover} 3 {Lem, ArtKartonCover, SoftCover}, {Lem, Shrink, SoftCover}, {Shrink, ArtKartonCover, SoftCover}, {Lem, Shrink, ArtKartonCover} 4 {Lem,Shrink,ArtKartonCover,SoftCover}
B {Lem=y}
{Shrink=y}
Aturan-aturan asosiasi yang dihasilkan oleh algoritma FP-growth ditentukan oleh sejumlah kombinasi items sebagai berikut :
Tabel 14. Kombinasi items pada aturan asosiasi Apriori
Urt A 1 {Shrink=y}, {UVDoft=y}, {NewsprintIsi=y} 2 {Shrink=y}, {NewsprintIsi=y}
ISSN: 2085-725X
4.7.1. Evaluasi Aturan Asosiasi Apriori Hasil evaluasi terhadap evaluation dataset yang tersimpan pada tabel Tbl_Dataset_Evaluation1 dapat dilihat pada tabel berikut : 129
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
Tabel 17. Evaluasi aturan asosiasi Apriori terhadap Tbl_Dataset_Evaluation1
ISSN: 2085-725X
Tabel 19. Evaluasi aturan asosiasi FPgrowth terhadap Tbl_Dataset_Evaluation1 (Lanjutan)
Aturan Urut
Generalitas Reliabilitas Support Cover-age Confidence Added Correlation Value 1 0,6806 0,6806 1 0,0434 0,4157 2 0,7658 0,7664 0,9992 0,0426 0,4444 3 0,6896 0,6896 1 0,0434 0,4189 4 0,7868 0,7876 0,9989 0,0423 0,451 5 0,711 0,7124 0,998 0,0414 0,426 6 0,9112 0,9138 0,9971 0,0405 0,4871 7 0,6806 0,6896 0,9869 0,0731 0,4244 8 0,6806 0,6896 0,9869 0,0731 0,4244 9 0,6806 0,6896 0,9869 0,0757 0,4251 10 0,711 0,7212 0,9858 0,072 0,4348 Rata-rata 0,72978 0,73404 0,99397 0,05475 0,43518
Aturan Generalitas Reliabilitas Urut Support Coverage Confidence Added Correlation Value 4 0,338 0,346 0,9768 0,224 0,3076 5 0,2992 0,304 0,9842 0,1966 0,274 6 0,24 0,2506 0,9577 0,1701 0,2311 7 0,2338 0,2506 0,9329 0,1801 0,233 8 0,346 0,3594 0,9627 0,1751 0,3016 9 0,2326 0,2506 0,9281 0,2385 0,2473 10 0,3418 0,3594 0,951 0,1982 0,3073 Rata-rata 0,28346 0,29362 0,96461 0,20073 0,2663
Hasil evaluasi terhadap evaluation dataset yang disimpan pada tabel Tbl_Dataset_Evaluation2 dapat dilihat pada tabel berikut :
Hasil evaluasi terhadap evaluation dataset yang disimpan pada tabel Tbl_Dataset_Evaluation2 dapat dilihat pada tabel berikut :
Tabel 20 Evaluasi aturan asosiasi FPgrowth terhadap Tbl_Dataset_Evaluation2
Tabel 18. Evaluasi aturan asosiasi Apriori terhadap Tbl_Dataset_Evaluation2
Aturan Urut
Aturan Generalitas Reliabilitas Urut Support Coverage Confidence Added Correlation Value 1 0,7107 0,711 0,9995 0,0464 0,427 2 0,7851 0,7857 0,9992 0,0461 0,4515 3 0,7189 0,7195 0,9991 0,046 0,4298 4 0,8106 0,8121 0,9981 0,045 0,4592 5 0,7361 0,7382 0,9971 0,044 0,4352 6 0,9014 0,9048 0,9962 0,0431 0,4851 7 0,7107 0,7189 0,9885 0,0837 0,4377 8 0,711 0,7195 0,9881 0,0833 0,4377 9 0,7107 0,7195 0,9877 0,0863 0,4384 10 0,7361 0,7459 0,9868 0,082 0,4459 Rata-rata 0,75313 0,75751 0,99403 0,06059 0,44475
1 2 3 4 5 6 7 8 9 10 Rata-rata
Generalitas Reliabilitas Support Coverage Confidence Added Correlation Value 0,2462 0,2468 0,9975 0,1854 0,2325 0,3606 0,3635 0,992 0,1799 0,3067 0,2462 0,2486 0,9903 0,2094 0,2391 0,3606 0,3634 0,9922 0,2113 0,3151 0,3524 0,3599 0,9791 0,167 0,3006 0,2486 0,2562 0,9703 0,1582 0,2327 0,2468 0,2562 0,9633 0,1824 0,2379 0,3634 0,3735 0,9729 0,1608 0,3065 0,2462 0,2562 0,9609 0,2414 0,2523 0,3635 0,3735 0,9732 0,1923 0,3148 0,30345 0,30978 0,97917 0,18881 0,27382
4.8. Analisa Hasil Evaluasi
4.7.2. Evaluasi Aturan Asosiasi FPgrowth Hasil evaluasi terhadap evaluation dataset yang disimpan pada tabel Tbl_Dataset_Evaluation1 dapat dilihat pada tabel berikut :
Analisa hasil evaluasi dilakukan dengan menghitung tingkat kekuatan dari aturanaturan asosiasi yang dihasilkan oleh masingmasing algoritma. Tingkat kekuatan dari aturan asosiasi ditentukan oleh nilai support yang mewakili aspek generalitas dan nilai confidence yang mewakili aspek reliabilitas. Berikut adalah pengukuran tingkat kekuatan terhadap aturan-aturan asosiasi yang dihasilkan oleh algoritma Apriori :
Tabel 19. Evaluasi aturan asosiasi FPgrowth terhadap Tbl_Dataset_Evaluation1 Generalitas Reliabilitas Aturan Urut Support Coverage Confidence Added Correlation Value 1 0,2326 0,2338 0,9948 0,2072 0,2277 2 0,338 0,3418 0,9888 0,2012 0,2992 3 0,2326 0,24 0,9691 0,2163 0,2342
130
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
Tabel 21. Tingkat kekuatan aturan asosiasi algoritma Apriori AturanAsosiasi
Support
{Lem, Shrink, ArtKartonCover} {SoftCover } {Lem, ArtKartonCover} {SoftCover} {Lem,Shrink}{SoftCover} {Lem}{SoftCover} {Shrink, ArtKartonCover} {SoftCover } {ArtKartonCover}{SoftCover} {SoftCover, Lem, Shrink} {ArtKartonCover} {Lem, Shrink} {ArtKartonCover} {Lem,Shrink} {SoftCover,ArtKartonCover} {SoftCover,Shrink} {ArtKartonCover} Tingkatkekuatanaturanasosiasi
Confidence
kombinasi items dalam aturan terhadap keseluruhan data transaksi terkini penjualan produk buku. Tingkat akurasi dari algoritma Apriori terhadap FP-growth adalah sebesar:
Supp×Conf
0,6806
1
0,6806
0,7658
0,9992
0,765187
0,6896 0,7868 0,711
1 0,9989 0,998
0,6896 0,785935 0,709578
0,9112 0,6806
0,9971 0,9869
0,908558 0,671684
0,6806
0,9869
0,671684
0,6806
0,9869
0,671684
0,711
0,9858
0,700904
5. Kesimpulan Dan Saran Beberapa kesimpulan yang dapat diambil dari hasil penelitian ini adalah : a. Dari hasil observasi terhadap data-data sejumlah komponen transaksi penjualan produk buku yang terjadi percetakan PT. Gramedia hingga tanggal 1 Agustus 2010, telah ditemukan sebanyak 22 atributatribut yang dapat dimanfaatkan untuk melakukan penelitian market basket analysis. b. Penelitian market basket analysis dengan menggunakan algoritma Apriori dan FP-growth terhadap atribut- atribut penjualan produk buku telah menghasilkan sejumlah aturan asosiasi yang berbeda antara algoritma yang satu dengan yang lainnya. c. Analisa yang dilakukan terhadap tingkat kekuatan aturan-aturan asosiasi menunjukkan bahwa aturan-aturan asosiasi yang dihasilkan oleh algoritma Apriori memiliki tingkat kekuatan yang lebih tinggi dibandingkan dengan yang dihasilkan oleh algoritma FP-growth.
0,725541
Sedangkan hasil pengukuran tingkat kekuatan terhadap aturan-aturan asosiasi yang dihasilkan oleh algoritma FP-growth adalah : Tabel 22. Tingkat kekuatan aturan asosiasi algoritma FP-growth Sup-port Confi- Supp× dence Conf NewsprintIsi 0,2326 0,9948 0,23139
AturanAsosiasi
{Shrink, UVDoft, }{Lem} {Shrink,NewsprintIsi}{Lem} {Lem, UVDoft, NewsprintIsi}{Shrink} {Lem,NewsprintIsi}{Shrink} {Shrink,UVDoft}{Lem} {UVDoft,NewsprintIsi}{Lem} {UVDoft,NewsprintIsi}{Shrink} {NewsprintIsi}{Lem} {UVDoft, NewsprintIsi}{Lem, Shrink} {NewsprintIsi}{Shrink} Tingkatkekuatanaturanasosiasi
0,338 0,2326
0,9888 0,9691
0,334214 0,225413
0,338 0,2992 0,24 0,2338 0,346 0,2326
0,9768 0,9842 0,9577 0,9329 0,9627 0,9281
0,330158 0,294473 0,229848 0,218112 0,333094 0,215876
0,3418
0,951
0,325052 0,273763
ISSN: 2085-725X
Beberapa saran yang dapat diberikan antara lain : a. Perbaikan prosedur kerja yang berhubungan dengan proses pemasukan data-data transaksi ke dalam sistem basis data perlu mendapat perhatian yang khusus sehingga ketersediaan data pada saat diperlukan dapat lebih terjamin. b. Dapat dilakukan penelitian lebih lanjut dengan memanfaatkan algoritmaalgoritma association data mining lainnya, seperti: Generalized Rule Induction, Algoritma Hash Based, Predictive Apriori, dan Tertius untuk
Dari hasil analisa diketahui bahwa tingkat kekuatan aturan-aturan asosiasi yang dihasilkan oleh algoritma Apriori lebih besar dibandingkan dengan yang dihasilkan oleh algoritma FP-growth, penyebabnya adalah rendahnya nilai support yang menggambarkan terjadinya 131
Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012
pencarian aturan-aturan asosiasi berdasarkan atribut-atribut penjualan produk buku di Percetakan PT. Gramedia. c. Perlu dilakukan penelitian untuk mengkaji kelemahan pada algoritma FPgrowth yang mengakibatkan lemahnya aturan-aturan asosiasi yang dihasilkan melalui penerapan market basket analysis terhadap atribut penjualan produk buku di Percetakan PT. Gramedia. d. Pemanfaatan teknologi data warehouse pada basis data SQL Server sehingga proses penyiapan data yang merupakan syarat awal untuk melakukan data mining dapat dilakukan dengan lebih cepat dan efisien. Disamping itu, kualitas dan integritas data yang tersimpan dalam data warehouse lebih terjamin.
ISSN: 2085-725X
www.crisp-dm.org/Process/index.htm, (Diakses 20 Agustus 2010). [7] Fayyad, U., Shapiro, G. Piatetsky, dan Smyth, N Padhraic, ”From Data Mining to Knowledge Discovery in Databases”, Al Magazine, Hal. 37-54, 1996.
Daftar Pustaka [1] Kusrini dan Emha Taufiq Luthfi, ”ALGORITMA DATA MINING”, PENERBIT ANDI, 2009. [2] Budi Santosa, ”Data Mining : Teknik Pemanfaatan Data untuk Keperluan Bisnis”, GRAHA ILMU, 2007 [3] Jiawei Han dan Micheline Kamber, ”Data Mining: Concepts and Techniques : Chapter 6. Mining Association Rules in Large Databases”, Simon Fraser University, 2000. [4] Gregorius Satia Budhi, Andreas Handojo dan Christine Oktavina Wirawan, 2009, ”Algoritma Generalized Sequential Pattern Untuk Menggali Data Sekuensial Sirkulasi Buku Pada Perpustakaan Uk Petra”, Seminar Nasional Aplikasi Teknologi Informasi, 2009. [5] Kusrini, ”Penerapan Algortima Apriori Pada Data Mining Untuk Mengelompokkan Barang Berdasarkan Kecenderungan Kemunculan Bersama Dalam Satu Transaksi”, E-learning Center STMIK AMIKOM Yogyakarta, 2007 [6] CRISP-DM, ”Cross Industry Standard Process for Data Mining”, http:// 132