BAB 2
LANDASAN TEORI
2.1 Distribusi Normal
Salah satu distribusi frekuensi yang paling penting dalam statistika adalah distribusi normal. Distribusi normal berupa kurva berbentuk lonceng setangkup yang melebar tak berhingga pada kedua arah positif dan negatifnya. Penggunaanya sama dengan penggunaan kurva distribusi lainnya. Frekuensi relatif suatu variabel yang mengambil nilai antara dua titik pada sumbu datar. Tidak semua distribusi berbentuk lonceng setangkup merupakan distribusi normal.
Pada tahun 1733 DeMoivre menemukan persamaan matematika kurva normal yang menjadi dasar banyak teori statistika induktif. Distribusi normal sering pula disebut Distribusi Gauss untuk menghormati Gauss (1777 – 1855), yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang berulangulang mengenai bahan yang sama.
Sifat dari variabel kontinu berbeda dengan variabel diskrit. Variabel kontinu mencakup semua bilangan, baik utuh maupun pecahan. Oleh karenanya tidak bisa
Universitas Sumatera Utara
dipisahkan satu nilai dengan nilai yang lain. Itulah sebabnya fungsi variabel random kontinu sering disebut fungsi kepadatan, karena tidak ada ruang kosong diantara dua nilai tertentu. Dengan kata lain sesungguhnya keberadaan satu buah angka dalam variabel kontinu jika ditinjau dari seluruh nilai adalah sangat kecil, bahkan mendekati nol. Karena itu tidak bisa dicari probabilitas satu buah nilai dalam variabel kontinu, tetapi yang dapat dilakukan adalah mencari probabilitas diantara dua buah nilai.
Distribusi kontinu mempunyai fungsi matematis tertentu. Jika fungsi matematis tersebut digambar, maka akan terbentuk kurva kepadatan dengan sifat sebagai berikut: 1. Probabilitas nilai x dalam variabel tersebut terletak dalam rentang antara 0 dan 1 2. Probabilitas total dari semua nilai x adalah sama dengan satu (sama dengan luas daerah di bawah kurva)
Fungsi kepadatan merupakan dasar untuk mencari nilai probabilitas di antara dua nilai variabel. Probabilitas di antara dua nilai adalah luas daerah di bawah kurva di antara dua nilai dibandingkan dengan luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dengan menggunakan integral tertentu (definit integral).
Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter μ dan σ yaitu rataan dan simpangan baku. Jadi fungsi padat x akan dinyatakan dengan n (x; μ, σ). Begitu μ d an σ dik etahui mak a selu ruh k u va r normal dik etahui. Sebagai contoh, bila μ = 50 dan σ = 5, maka ordinat n(x ; 50, 5) dapat dengan mudah dihitung untuk berbagai harga x dan kurvanya dapat digambarkan. Kedua kurva bentuknya
Universitas Sumatera Utara
persis sama tapi titik tengahnya terletak di tempat yang berbeda di sepanjang sumbu datar. Dengan memeriksa turunan pertama dan kedua dari n(x ; μ, σ) dapat diperoleh lima sifat kurva normal berikut : 1. Modus, titik pada sumbu datar yang memberikan maksimum kurva, terdapat pada x = μ 2. Kurva setangkup terhadap garis tegak yang melalui rataan μ 3. Kurva mempunyai titik belok pada x = μ
σ, cekung dari bawah bila μ – σ
< x < μ + σ, dan cekung dari atas untuk harga x lainnya 4. Kedua ujung kurva normal mendekati asimtot sumbu datar bila harga x bergerak menjauhi μ baik ke kiri maupun ke kanan 5. Seluruh luas di bawah kurva diatas sumbu datar sama dengan 1
Bila x menyatakan peubah acak distribusi maka P(x1 < x < x2) diberikan oleh daerah yang diarsir dengan garis yang turun dari kiri ke kanan. Jelas bahwa kedua daerah yang diarsir berlainan luasnya. Jadi, peluang yang berpadanan dengan masingmasing distribusi akan berlainan pula.
2.2 Transformasi Normal Standar
Distribusi normal adalah distribusi variabel kontinu dengan fungsi matematis adalah sebagai berikut:
Universitas Sumatera Utara
dengan π = 3,14159… dan e = 2,71828 Selain beberapa konstanta yang tidak akan berubah nilainya (e, π), bentuk distribusi kurva normal ditentukan oleh tiga variabel, yaitu: x = nilai dari distribusi variabel μ = mean dari nilai-nilai distribusi variabel σ = standar deviasi dari nilai-nilai distribusi variabel Para ahli statistik telah menyelidiki bentuk distribusi normal dengan mempelajari fungsi tersebut dan didapatkan sifat-sifat sebagai berikut: a. Simetris, yaitu mean distribusi terletak di tengah dengan luas bagian sebelah kiri sama dengan bagian sebelah kanan (berbentuk lonceng) sehingga total daerah di bawah kurva sebelah kiri = total daerah di bawah kurva sebelah kanan = 0,5 b. 68% dari nilai variabel terletak dalam jarak
1σ (antara -1σ dan +1σ)
c. 95% dari nilai variabel terletak dalam jarak
1,96σ
d. 99% dari nilai variabel terletak dalam jarak
3σ
Selain menggunakan metode integral, perhitungan probababilitas distribusi normal juga bisa menggunakan tabel distribusi normal, yaitu tabel yang memuat probabilitas dari berbagai nilai variabel dalam distribusi normal. Metode ini lebih praktis untuk keperluan penelitian. Yang menjadi masalah dalam penyusunan tabel tersebut adalah kenyataan bahwa terdapat banyak sekali macam distribusi normal, dipengaruhi oleh besarnya nilai mean (μ) dan standar deviasinya (σ).
Universitas Sumatera Utara
Untuk mengatasi hal tersebut, maka para ahli hanya membuat satu buah tabel yaitu tabel untuk menghitung nilai-nilai probabilitas distribusi normal standar, sedangkan jika akan menghitung probabilitas nilai-nilai variabel distribusi normal yang tidak standar, tetap bisa menggunakan tabel distribusi normal standar tersebut dengan memakai metode konversi. Yang dimaksud distribusi normal standar adalah distribusi normal dengan sifat khusus, yaitu distribusi dengan normal yang mean = 0 dan standar deviasi = 1.
Untuk mengatasi kesulitan dalam menghitung fungsi padat normal maka dibuat tabel luas kurva normal sehingga memudahkan penggunaanya. Akan tetapi, tidak akan mungkin membuat tabel yang berlainan untuk setiap harga μ dan σ. Untunglah, seluruh pengamatan dengan setiap peubah acak normal x dapat ditransformasikan menjadi himpunan pengamatan baru suatu peubah acak normal z dengan rataan nol dan variansi 1. Hal ini dapat dikerjakan dengan transformasi.
z= Bilamana x mendapat suatu harga x, harga z padanannya diberikan oleh z = (x – μ)/σ. Jadi, bila z berharga antara x = x1 dan x = x2, maka peubah acak z akan berharga z1 = (x1 – μ)/σ d an z2 = (x2 – μ)/σ. Distribusi peubah acak normal dengan rataan nol dan variansi 1 disebut distribusi normal baku.
Dengan demikian sepanjang diketahui rata-rata dan deviasi standar, maka dapat ditransformasi setiap distribusi nilai ke dalam nilai-nilai z. Bagaimanapun hanya nilai-nilai z dari variabel-variabel yang berdistribusi normal yang akan dengan
Universitas Sumatera Utara
sendirinya berdistribusi normal. Dengan kata lain, transformasi ke dalam nilai-nilai z tidak mengubah bentuk awal dari distribusi itu.
2.3 Tabel Distribusi Normal Standar
Berikut ini beberapa hal tentang distribusi normal standar : 1. Tabel distribusi normal standar disusun untuk menghitung probabilitas nilainilai variabel normal standar, yaitu distribusi normal dengan mean nol (μ = 0) d na standar d ve asi i satu (σ = 1 .) Variabel distribu is normal stand ra menggunakan lambang z. 2. Karena distribusi normal standar bersifat simetris (kiri-kanan sama), maka tabel distribusi normal standar dibuat hanya untuk menghitung bagian sebelah kanan mean dari distribusi tersebut. Untuk menghitung nilai di sebelah kiri, maka nilai z yang negatif dianggap sama dengan z positif, sehingga tabel tersebut tetap bisa digunakan. 3. Nilai-nilai probabilitas yang terdapat dalam tabel tersebut adalah nilai probabilitas antara μ = 0 dan satu nilai z tertentu, bukan antara dua buah nilai z sembarang.
Nilai z begitu penting karena semua distribusi normal ukuran nilai apapun dapat ditransformasi kedalam satu distribusi nilai, yaitu distribusi nilai z yang disebut dengan distribusi normal standar.
Distribusi mempunyai dua sifat penting, yaitu : 1. Rata-rata distribusi z, μ adalah 0 2. Deviasi standar distribusi z, σ adalah 1.
Universitas Sumatera Utara
Distribusi asli dan sesudah ditransformasi dikarenakan semua harga x antara x1 dan x2 mempunyai harga z padanan antara z1 dan z2, luas di bawah kurva x antara ordinat x = x1 dan x = x2 sama dengan luas di bawah kurva z antara ordinat yang telah ditransformasikan z = z1 dan z = z2. Sekarang banyaknya tabel kurva normal yang diperlukan telah diperkecil menjadi satu, yaitu distribusi normal baku.
2.4 Uji Hipotesis
Dua unsur utama dalam statistik inferensi adalah estimasi dan pengujian hipotesis. Pengujian hipotesis merupakan hal sangat penting dalam statistik inferensi. Dua tipe pengujian hipotesis, yaitu uji t untuk menguji hipotesis pada parameter tunggal (individual) dan uji F menguji hipotesis pada parameter-parameter secara simultan.
Pengujian hipotesis dilakukan setelah menghitung estimasi terhadap parameter populasi yang benar dengan serangkaian pertanyaan-pertanyaan yang jauh lebih rumit. Pengujian hipotesis menentukan apa yang dapat dipelajari tentang alam nyata dari sampel. Apabila hipotesis ditolak dengan menggunakan hasil yang muncul oleh sampel yang digunakan maka hipotesis dinyatakan benar, keanehan-keanehan yang terjadi bahwa sampel tertentu akan teramati.
Pengujian hipotesis digunakan di berbagai bidang. Sebuah perusahaan memiliki bagian penelitian dan pengembangan yang salah satu tugasnya adalah menguji produk sebelum dipasarkan. Seorang ahli ekonomi Milton Friedman melakukan uji statistik tentang hubungan antara konsumsi dan pemakai.
Universitas Sumatera Utara
Walaupun para peneliti selalu tertarik untuk mempelajari apakah teori yang dipertanyakan (hipotesis) didukung oleh estimasi-estimasi yang dihasilkan dari sebuah sampel yang berasal dari pengamatan-pengamatan alam nyata, nampaknya hampir tidak mungkin untuk membuktikan bahwa suatu hipotesis tertentu adalah benar. Semua yang dapat dilakukan menyatakan bahwa suatu sampel tertentu cocok atau sesuai dengan hipotesis tertentu. Walaupun hal tersebut tidak dapat membuktikan bahwa suatu teori tertentu adalah “benar” dengan menggunakan uji hipotesis dengan suatu tingkat keyakinan tertentu. Dalam kasus seperti ini, peneliti menyimpulkan bahwa sangatlah tidak mungkin hasil sampel akan teramati, jika teori yang dihipotesiskan adalah benar. Jika terdapat bukti yang tidak sesuai dengan validitas teori, pertanyaan itu sering disimpan sampai data tambahan atau suatu pendekatan baru memberikan jalan terang bagi persoalan itu.
Ada tiga topik yang sangat penting untuk dibicarakan dalam aplikasi pengujian hipotesis pada analisis regresi : 1. Spesifikasi hipotesis yang harus diujikan 2. Keputusan yang digunakan untuk menentukan apakah menolak hipotesis yang dipertanyakan 3. Macam kesalahan yang mungkin dihadapi jika aplikasi keputusan menghasilkan kesimpulan yang tidak benar.
2.5 Spesifikasi Hipotesis : Hipotesis Nol dan Hipotesis Alternatif
Tahap pertama dalam pengujian hipotesis adalah menyatakan secara eksplisit hipotesis yang akan diuji. Untuk menjaga rasa kejujuran, peneliti seharusnya menyatakan spesifikasi hipotesis tersebut sebelum parameter dalam hipotesis itu diestimasi. Maksud mempelajari teori lebih dahulu adalah untuk memudahkan
Universitas Sumatera Utara
hipotesis dengan dasar teori selengkap mungkin. Hipotesis yang disusun setelah estimasi adalah pembenaran hasil-hasil tertentu daripada menguji validatasinya. Akibatnya, sebagian besar ahli statistik inferensi harus hati-hati dalam menyusun hipotesis sebelum estimasi.
Dalam menyusun sebuah hipotesis, peneliti harus menyatakan secara hati-hati tentang apa yang dipikir tidak benar dan apa yang dipikir benar. Ini mencerminkan harapan-harapan peneliti tentang suatu parameter atau parameter-parameter tertentu diringkas dalam bentuk hipotesis nol dan hipotesis alternatif.
Hipotesis nol adalah suatu pernyataan tertentu tentang nilai-nilai dalam suatu range dari parameter yang akan diharapkan terjadi apabila teori yang dimiliki peneliti tidak benar. Sedangkan Hipotesis alternatif digunakan untuk menspesifikasi nilai-nilai dalam suatu range dari parameter yang diharapkan terjadi apabila pernyataan teori oleh peneliti adalah benar.
Kata nol berarti “kosong” dan hipotesis nol dapat dipertimbangkan sebagai hipotesis yang mana peneliti tidak dipercaya. Dalam membangun hipotesis nol dan hipotesis alternatif dengan cara seperti ini supaya dapat menyusun pernyataan yang kuat apabila menolak hipotesis nol. Ini hanya terjadi apabila didefinisikan hipotesis nol dengan beranggapan bahwa hal tersebut tidak mengharapkan dapat membatasi probabilitas menolak secara kebetulan hipotesis nol apabila faktanya memang benar.
Pernyataan sebaliknya tidak berlaku, yaitu bahwa sesungguhnya hal tersebut tidak pernah mengetahui probabilitas menerima secara kebetulan hipotesis nol apabila faktanya salah. Konsekuensinya, hal tersebut tidak pernah dikatakan bahwa menerima
Universitas Sumatera Utara
hipotesis nol. Dapat dikatakan bahwa tidak dapat menolak hipotesis nol atau meletakkan kata menerima dalam permasalahan.
Dalam statistik inferensi, hipotesis biasanya tidak menspesifikasi nilai-nilai tertentu, namun menyatakan suatu arah atau tanda tertentu yang
mana peneliti
mengharapkan statistik hasil estimasi itu akan diperoleh. Dapat dinyatakan hipotesis suatu parameter tertentu akan positif atau negatif. Dalam kasus-kasus semacam itu hipotesis nol menunjukkan bahwa apa yang diharapkan tidak terjadi, namun harapan itu merupakan suatu range nilai hipotesis yang sama (dalam suatu range) untuk hipotesis alternatif.
Notasi yang digunakan untuk menunjukkan suatu hipotesis nol adalah “H0” dan notasi ini diikuti oleh suatu pernyataan nilai atau range nilai-nilai yang tidak diharapkan sebagai parameter yang akan diperoleh. Apabila kita mengharapkan suatu parameter yang negatif maka hipotesis nol yang benar adalah H0 : μ < 0 (nilai yang tidak diharapkan) Hipotesis alternatif dinyatakan oleh “H1” diikuti oleh parameter nilai atau nilai-nilai yang diharapkan teramati : H1 : μ
0 (nilai yang diharapkan benar)
Cara lain untuk menyatakan hipotesis nol dan hipotesis alternatif adalah menguji hipotesis bahwa μ adalah tidak berbeda secara signifikan dari nol untuk masing-masing arah. Untuk pendekatan seperti ini hipotesis nol ditulis :
Universitas Sumatera Utara
H0 : μ = 0 H1 : μ
0
Oleh karena H1 memiliki nilai-nilai pada kedua arah dari hipotesis nol, maka pendekatan ini disebut uji dua-arah untuk membedakan dengan contoh yang pertama, yaitu uji satu-arah
2.6. Tipe Kesalahan I dan Kesalahan II
Pengujian dalam statistik inferensi adalah menghipotesiskan suatu arah yang diharapkan dari parameter atau masing-masing parameter dan kemudian menentukan apakah menolak atau tidak menolak hipotesis nol. Oleh karena statistik hanyalah estimasi dari parameter (parameter-parameter) populasi yang benar, maka tidaklah realistis untuk menduga bahwa kesimpulan yang ditarik dari analisis sampel akan selalu benar. Ada dua macam kesalahan yang dapat dibuat dalam pengujian hipotesis semacam itu :
Tipe Kesalahan I : Tidak menolak sebuah hipotesis nol yang benar Tipe Kesalahan II : Tidak menolak sebuah hipotesis nol yang salah
Dapat diperhatikan kesalahan-kesalahan ini sebagai kesalahan-kesalahan Tipe I dan Tipe II. Anggaplah memiliki hipotesis nol dan hipotesis alternatif sebagai berikut : H0 :μ
0
H1 : μ
0
Universitas Sumatera Utara
Universitas Sumatera Utara
Universitas Sumatera Utara
Universitas Sumatera Utara
membuat kesalahan Tipe I, namun hanya satu-satunya kesempatan dapat dinolak kebenaran adalah ketika
jatuh di daerah penolakan.
Memperkecil tipe kesalahan I berarti memperbesar tipe kesalahan II. Dapat dipilih di antara kedua tipe kesalahan tersebut dengan memperhatikan biaya (cost) membuat satu jenis kesalahan yang secara dramatis lebih besar daripada biaya membuat kesalahan jenis lain.
2.8 Distribusi Normal Standar, z untuk uji Hipotesis
Uji hipotesis sering menggunakan distribusi normal standar. Untuk kasus-kasus di mana ukuran jumlah sampel cukup besar dan deviasi standar populasi diketahui digunakan distribusi normal standar z, sementara untuk ukuran jumlah sampel kecil dan deviasi standar populasi tidak diketahui digunakan distribusi normal standar.
a.
Untuk Sampel Berukuran Besar dan σ Diketahui
z= dengan : σx = σ = deviasi standar populasi = rata-rata sampel μ = rata-rata populasi
Universitas Sumatera Utara
b.
Untuk Sampel Berukuran Besar dan σ Tidak Diketahui
z=
dengan : Sx
=
S = deviasi standar data sampel = rata-rata sampel μ = rata-rata populasi 2.9 Uji Tanda
Di dalam menggunakan uji t, populasi dari mana sampel diambil harus berdistribusi normal. Untuk pengujian perbedaan mean dari dua populasi didasarkan pada anggapan bahwa varians populasinya harus identik/sama. Dalam banyak hal bila salah satu atau kedua anggapan tersebut tidak diketahui, maka uji t tidak dapat dipergunakan. Dalam hal demikian dapatlah dipergunakan uji nonparametrik yang umum dikenal sebagai uji tanda (sign test).
Uji tanda didasarkan atas tanda-tanda, positif atau negatif, dari perbedaan antara pasangan pengamatan. Bukan didasarkan atas besarnya perbedaan. Uji tanda dapat dipergunakan untuk mengevaluasi efek dari suatu treatment tertentu. Efek dari variabel eksperimen atau treatment tidak dapat diukur melainkan hanya dapat diberi tanda positif atau negatif saja.
Universitas Sumatera Utara
2.10 Uji Wilcoxon
Uji nonparametrik akhir-akhir ini mendapat perhatian yang lebih besar karena beberapa sebab. Pertama, perhitungannya biasanya singkat dan mudah dikerjakan. Kedua, datanya tak perlu berupa pengukuran kuantitatif tapi dapat saja berupa respon kualitatif seperti ‘cacat’ atau ‘tidak cacat’, ‘ya ‘ atau ‘tidak’ atau sering pula nilai skala ordinal yang dapat diberi rank. Pada skala ordinal datanya di rank menurut aturan tertentu, dan dengan uji nonparametrik berbagai rank itu dianalisis.
Pada tahun 1945 Frank Wilcoxon mengusulkan suatu cara nonparametrik yang amat sederhana untuk membandingkan dua populasi kontinu bila hanya tersedia sampel bebas yang sedikit dan kedua populasi asalnya tidak normal. Cara ini sekarang dinamakan uji Wilcoxon atau Uji Jumlah Rank Wilcoxon. Hipotesis nol H0 bahwa μ1 = μ2 akan diuji lawan suatu tandingan yang sesuai. Pertama-tama ambilah sampel acak dari tiap populasi. Misalkan n1 banyaknya pengamatan dalam sampel yang lebih kecil, dan n2 banyaknya pengamatan dalam sampel yang lebih besar. Bila sampelnya berukuran sama, maka n1 dan n2 dapat dipertukarkan. Urutlah semua n1 + n2 pengamatan dengan urutan membesar dan berikan rank 1, 2, … , n1 + n2 pada tiap pengamatan. Bila terdapat seri (pengamatan yang besarnya sama), maka pengamatan tersebut diganti dengan rataan ranknya jika seandainya keduanya dapat dibedakan (tidak seri).
Universitas Sumatera Utara
2.11 Uji Wilcoxon untuk pengamatan berpasangan
Uji tanda ditunjukkan dengan pemberian tanda tambah atau kurang, anggota yang mana dari pengamatan yang berpasangan yang lebih besar, tapi tidak menunjukkan besarnya selisih tersebut. Suatu uji memperhitungkan tanda dan besarnya selisih telah dikemukakan oleh Wilcoxon dan sekarang biasa disebut sebagai Uji Wilcoxon untuk pengamatan berpasangan. Uji wilcoxon lebih peka daripada uji tanda dalam menentukan perbedaan antara rataan populasi dan karena itu akan dibahas secara mendalam. Untuk menguji hipotesis bahwa μ1 = μ2 dengan uji Wilcoxon, mula-mula kesampingkan semua selisih yang besarnya nol dan kemudian rank bi, yaitu sisanya, tanpa memperhatikan tandanya. Rank 1 diberikan pada nilai mutlak bi yang terkecil, rank 2 pada terkecil berikutnya, dan seterusnya. Bila nilai mutlak dari dua atau lebih selisih sama, berilah pada tiap selisih rata-rata dari yang seharusnya akan diberikan seandainya selisih tersebut dapat diberikan. Bila tidak ada perbedaaan antara kedua rataan populasi, maka jumlah ruang dari selisih yang positif seharusnyalah hampir sama dengan jumlah rank dari selisih yang negatif.
Uji ini digunakan untuk menguji kondisi (variabel) pada sampel yang berpasangan atau dapat juga untuk penelitian sebelum dan sesudah. Dalam uji ini ingin diketahui manakah yang lebih besar dari antara pasangan. Misalkan di = selisih tiap pasangan yang harus dibuat ranking, untuk di tanpa memperhatikan tandanya, rank 1 diberikan untuk harga mutlak di terkecil dan rank terbesar untuk harga mutlak di terbesar. Kemudian untuk masing-masing ranking berikan tandanya sesuai dengan tanda selisih yaitu tanda + dan -.
Universitas Sumatera Utara
Bila perlakuan pertama sama pengaruhnya dengan perlakuan kedua, yaitu apabila Ho benar, diharapkan akan dijumpai beberapa di yang bertanda + dan beberapa yang bertanda – dalam jumlah yang sama. Jika jumlah tersebut berbeda, maka berarti perlakuan pertama berbeda dengan perlakuan kedua.
Tujuan Penggunaan Uji Peringkat Bertanda Wilcoxon ialah menggunakan arah dan besar perbedaan untuk mengetahui apakah benar-benar terdapat perbedaan pada data ordinal pasangan tersebut.
\
Universitas Sumatera Utara