APLIKASI DATA MINING MENGGUNAKAN METODE DECISION TREE

Download Jurnal Ilmiah NERO Vol. 1 No. 3 2015. 198 | N E R O. APLIKASI DATA MINING MENGGUNAKAN. METODE DECISION TREE UNTUK MENAMPILKAN LAPORAN. HA...

3 downloads 705 Views 1MB Size
Jurnal Ilmiah NERO Vol. 1 No. 3

2015

APLIKASI DATA MINING MENGGUNAKAN METODE DECISION TREE UNTUK MENAMPILKAN LAPORAN HASIL NILAI AKHIR MAHASISWA (STUDI KASUS DI FAKULTAS TEKNIK UMSURABAYA) Triuli Novianti 1) Abdul Aziz2) Program Studi D3 Teknik Komputer UMSurabaya, Surabaya 60113 email: [email protected]), [email protected]) Abstrak

Salah satu faktor penyebab ketidaklulusan mahasiswa karena kurangnya kebijakan dan tindakan dari instansi pendidikan untuk menjaga mahasiswanya tidak lulus pada mata kuliah yang telah ditempuh. Dengan memanfaatkan data induk mahasiswa dan data nilai akhir mahasiswa diharapkan dapat menghasilkan informasi tentang laporan hasil nilai akhir dengan data induk mahasiswa melalui teknik data mining. Studi kasus penelitian ini dilaksanakan pada Fakultas Teknik UMSurabaya untuk interval waktu tahun akademik 2012/2013. Metode penelitian yang dipakai adalah metode Decision Tree dengan algoritma C4.5. Pada tahap akhir, penelitian dievaluasi dan validasi dengan cross validation. Dari penelitian dihasilkan, aplikasi laporan hasil nilai akhir dengan metode decision tree algoritma C4.5 sebagai acuan dalam membuat kebijakan dan tindakan untuk mengurangi jumlah mahasiswa yang tidak lulus dengan akurasi 100% menggunakan evaluasi Cross Validation. Kata Kunci: Decision Tree, Algoritma C4.5, Nilai Akhir, Cross Validation

Abstract

One of the causes of student failure due to the lack of policies and actions of educational institutions to keep students do not pass on the courses you have taken. By utilizing the student master data and data value end students are expected to generate information on the results of the final report by the student master data through data mining techniques. The case study research was conducted at the Faculty of Engineering UMSurabaya for the 2012/2013 academic year intervals. The research method used is a method C4.5 Decision Tree algorithm. In the final stage, evaluation and validation studies with cross validation. From the resulting research, application of the results of the final report by the method of decision tree algorithm C4.5 as a reference in making policies and measures to reduce the number of students who did not pass with 100% accuracy using the evaluation Cross Validation Keyword : Decision Tree, Algoritma C4.5, Nilai Akhir, Cross Validation 1.

PENDAHULUAN

Di dalam peraturan akademik Universitas Muhammadiyah Surabaya bidang pendidikan tahun 2013 pada BAB XI pasal 35 ayat 3 butir a di sebutkan bahwa “Sistem penilaian yang digunakan Universitas Muhammadiyah Surabaya adalah sistem penilaian komprehensif yang terdiri dari aktifitas (A), tugas (T), ujian tengah semester (UTS) dan ujian akhir semester (UAS)” (Peraturan Akademik, 2013). Berdasarkan buku wisuda tahun 2013 menunjukkan nilai IPK mahasiswa pada Fakultas Teknik umumnya rendah. Hal ini menunjukkan bahwa masih ada mahasiswa Program Sarjana (S1) dan Program Diploma (D3) reguler di Fakultas Teknik yang tidak lulus untuk beberapa mata kuliah. Oleh karena itu, dengan memanfaatkan data induk mahasiswa dan data nilai mahasiswa, dapat diketahui informasi hasil nilai akhir mahasiswa melalui teknik data mining. Nilai akhir mahasiswa dapat dilihat dari komponen nilai aktifitas (A), tugas (T), ujian tengah semester (UTS) dan ujian akhir semester (UAS). Data mining diharapkan dapat membantu menyajikan informasi tentang nilai akhir mahasiswa dengan menggunakan data nilai akhir mahasiswa dan data induk mahasiswa. Permasalahan yang dibahas dalam penelitian ini adalah bagaimana membuat aplikasi 198 | N E R O

Jurnal Ilmiah NERO Vol. 1 No. 3

2015

untuk menghasilkan informasi yang berguna tentang hubungan nilai akhir dengan skala penilaian dengan teknik data mining metode decision tree algoritma C4.5. Informasi yang ditampilkan berupa nilai support dan confidence hubungan antara nilai akhir mahasiswa dengan nilai aktifitas (A), tugas (T), ujian tengah semester (UTS) dan ujian akhir semester (UAS). Hasil klasifikasi dari algoritma C4.5 dievaluasi dan divalidasi dengan cross validation untuk mengetahui tingkat akurasi Algoritma C4.5.

2. METODE PENELITIAN

Metode dan tahapan penelitian yaitu meliputi; 1. Pembersihan data (data cleaning). Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten. Data yang digunakan dalam penulisan penelitian ini terdiri dari dua sumber data, yaitu data induk mahasiswa (Nama, NIM dan Program Studi) dan data nilai akhir yang didapatkan dari skala penilaian (aktifitas (A), tugas (T), ujian tengah semester (UTS) dan ujian akhir semester (UAS)). 2. Integrasi data (data integration). Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. 3. Seleksi Data (Data Selection) Data yang ada pada database sering kali tidak semua dipakai, hanya data yang sesuai untuk dianalisis yang diambil dari database. Karena tidak semua tabel digunakan maka perlu dilakukan pembersihan data agar data yang akan diolah benar-benar relevan dengan yang dibutuhkan. 4. Transformasi data (Data Transformation). Data digabung ke dalam format yang sesuai untuk diproses dalam data mining. Transformasi data merupakan proses pengubahan atau penggabungan data ke dalam format yang sesuai. 5. Proses mining Merupakan proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dari data. Pohon keputusan (decision tree) merupakan teknik yang digunakan pada proses mining. 6. Pengujian dan Evaluasi Sistem Pengujian dilakukan dengan training dan testing menggunakan metode Cross validation.

Gambar 1 Diagram Alir Penelitian

199 | N E R O

Jurnal Ilmiah NERO Vol. 1 No. 3 3.

2015

HASIL DAN PEMBAHASAN

3.1 Pohon Keputusan (Decision Tree)

Data training yang digunakan yakni nilai aktifitas (A), tugas (T), ujian tengah semester (UTS) dan ujian akhir semester (UAS). Nilai akhir yang digunakan yakni A, AB, B, C, D dan E. Tabel 1 Data Nilai Akhir NO.

UTS

Tugas

Aktifitas

UAS

Nilai Akhir

2

50

80

78

90

AB

53

BC

1 3 4 5 6 7 8 9

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

40 75 45 40 65 50 40 40 50 40 50 50 40 60 50 50 85 50 70 70 50 50 30 50 50 70 50 95 75 50

80 80 79 77 80 65 77 80 80 80 80 80 77 80 60 80 80 80 80 80 65 77 80 80 79 80 80 80 77 80

85 53 66 49 77 59 65 67 72 65 65 77 51 66 65 61 77 65 70 78 40 77 62

80 90 90 90

AB

90

AB

62 26

BC

BC

80

BB

90

AB

90

AB

62

BC

90 90 62

AB

BC BC

80

AA

90

AB

26

DD

90

BB

53 90 90

96

90

80.9

66

80.9

65

90

64

BC

DD

71.8

88

AB

26

70 75

AB

BC

AB AB BB

AB

AA

BB

90

AA

80.9

BB

AB

200 | N E R O

Jurnal Ilmiah NERO Vol. 1 No. 3

Tabel 2 Nilai Entropy dan Gain untuk Menentukan Simpul Akar Total UTS

Tugas

Aktifitas

Data 31

A 3

AB 13

B 5

BC 8

C 0

D 2

E 0

Entropy 2.035801

<=25 >25

0 31

0 3

0 13

0 5

0 8

0 0

0 2

0 0

0 2.035801

<=50 >50

22 9

0 3

7 6

5 0

8 0

0 0

2 0

0 0

1.856653 0.918296

<=75 >75

29 2

1 2

13 0

5 0

8 0

0 0

2 0

0 0

1.902279 0

<=25 >25

0 31

0 3

0 13

0 5

0 8

0 0

0 2

0 0

0 2.035801

<=50

0

0

0

0

0

0

0

0

0

>50

31

3

13

<=75 >75

3 28

0 3

0 13

<=25 >25

0 31

A 0 3

<=50 >50

2 29

0 3

<=75 >75 UAS

<=25 >25

<=50 >50 <=75 >75

memiliki

5

2015

Gain 0 0.451574

0.25625 0 0

8

0

2

0

2.035801

0 5

1 7

0 0

2 0

0 0

0.918296 1.803007

AB 0 13

B 0 5

BC 0 8

C 0 0

D 0 2

E 0 0

0 2.035801

0

0 13

1 4

0 8

0 0

1 1

0 0

1 1.931753

0.164161

0.407278

Gam bar 2 Poho n Kepu tusan Hasil Peng olaha n Gam bar 3. Hasil Kelu aran Prog ram

aksud dari gamb ar 3 adala 0 0 0 0 0 0 0 0 0 0 h 31 3 13 5 8 0 2 0 2.035801 data yang 3 0 0 0 1 0 2 0 0.918296 0.318411 diuji 28 3 13 5 7 0 0 0 1.803007 misal nya 9 0 0 1 6 0 2 0 1.224394 0.543335 maha 22 3 13 4 2 0 0 0 1.602131 siswa nilai UTS 75, Tugas 80, UAS 53 dan Aktivitas 90, maka akar pertama akan menanyakan 22 9

0 3

7 6

5 0

8 0

0 0

2 0

0 0

1.856653 0.918296

0.451574

201 | N E R O

M

Jurnal Ilmiah NERO Vol. 1 No. 3

2015

apakah nilai aktivitasnya kurang dari 66.9? Karena nilai aktivitas 90 lebih dari nilai tersebut, maka masuk ke ranting kedua yang ditanya apakah nilai UAS kurang dari 52? Karena nilai UAS 80 maka masuk ke ranting ketiga yang ditanya apakah UTS kurang dari 80? Karena UTS 75 maka masuk ke rating selanjutnya yakni nilai akhir mahasiswa tersebut ‘AB’. Tabel 3. Hasil Training dan Testing Training 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 0 1 1 0 0 1 1 1 0

Testing 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 0 1 1 0 0 1 1 1 0

Dari hasil di atas diperoleh, hasil training dan testing menghasilkan hasil yang tepat sama, jadi akurasi pada percobaan di atas 100%. 4.

KESIMPULAN

Kesimpulan yang dapat diambil dalam penelitian ini adalah Aplikasi Data Mining ini dapat digunakan untuk menampilkan informasi yang berguna tentang nilai akhir mahasiswa dengan teknik data mining. Informasi yang ditampilkan berupa hubungan antara nilai akhir mahasiswa dengan nilai aktifitas (A), tugas (T), ujian tengah semester (UTS) dan ujian akhir semester (UAS). Hal ini terlihat pada pohon keputusan (decision tree) dan rancangan aplikasi berbasis pohon keputusan. Hasil evaluasi dan validasi dengan Cross Validation menunjukkan tingkat akurasi pada algoritma C4.5 sebesar 100%. Data induk mahasiswa yang diproses mining meliputi data proses masuk, data asal sekolah, data kota mahasiswa, dan data program studi. Hasil dari proses data mining ini dapat digunakan sebagai pertimbangan dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi tingkat kelulusan khususnya faktor dalam data induk mahasiswa. 202 | N E R O

Jurnal Ilmiah NERO Vol. 1 No. 3

2015

5. Daftar Pustaka

[1]. [2]. [3]. [4]. [5]. [6]. [7]. [8]. [9]. [10]. [11]. [12]. [13]. [14]. [15]. [16].

Andriani Anik. 2011. Penerapan Algoritma C4.5 Pada Program Klasifikasi Mahasiswa Dropout . AMIK BSI Jakarta Anonim, 2013 “Peraturan Akademik Universitas Muhammadiyah Surabaya”, Surabaya. Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu, Yogyakarta. Bramer, Max, 2007, “Principles of Data Mining”, Springer, London. Chintakayala, Padmini. 2005. “Beginners Guide for Software Testing : Symbiosys Technologies”. Guidici, P. & Figini, S. 2009. Applied Data Mining for Business and Industry (2nd ed). Italy. John Wiley & Sons, Ltd. ISBN: 978-0-470-05886-2 Han, J. and Kamber, M, 2006, “Data Mining Concepts and Techniques Second Edition”. Morgan Kauffman, San Francisco. Hermawati AF, 2013. Data Mining. Penerbit Andi. Yogjakarta Huda MN. 2010. Aplikasi Data Mining Untuk Menampilkan Informasi Tingkat Kelulusan Mahasiswa (Studi Kasus Di Fakultas Mipa Universitas Diponegoro). FMIPA UNDIP Larose, D. T. 2005. Discovering Knowledge in Data. New Jersey: John Willey & Sons, Inc. ISBN 0-471-66657-2. Kusrini, dan Emha Taufik Luthfi, 2009, “Algoritma Data Mining”, Penerbit Andi, Yogyakarta. Pramudiono, I. 2007. Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data. Rainardi, Vincent, 2008, “Building a Data Warehouse with Examples in SQL Server”, Springer, New York. Pressman, Roger S, 1997, “Software Engineering:A Practitioner’s Approch.” The McGrawHill Companies, Inc., New York Santosa, Sommerville, Ian, 2003, “Software Engineering (Rekayasa Perangkat Lunak)/ Edisi 6/Jilid 1” Erlangga, Jakarta. Widodo Pudjo P, Handayanto T P. dan Herlawati, 2013. “Penerapan Data Mining dengan Matlab”. Rekayasa Sains. Bandung

203 | N E R O