BAB 2 LANDASAN TEORI 2.1 Distribusi Normal

BAB 2

LANDASAN TEORI

2.1 Distribusi Normal

Salah satu distribusi frekuensi yang paling penting dalam statistika adalah distribusi normal. Distribusi normal berupa kurva berbentuk lonceng setangkup yang melebar tak berhingga pada kedua arah positif dan negatifnya. Penggunaanya sama dengan penggunaan kurva distribusi lainnya. Frekuensi relatif suatu variabel yang mengambil nilai antara dua titik pada sumbu datar. Tidak semua distribusi berbentuk lonceng setangkup merupakan distribusi normal.

Pada tahun 1733 DeMoivre menemukan persamaan matematika kurva normal yang menjadi dasar banyak teori statistika induktif. Distribusi normal sering pula disebut Distribusi Gauss untuk menghormati Gauss (1777 – 1855), yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang berulangulang mengenai bahan yang sama.

Sifat dari variabel kontinu berbeda dengan variabel diskrit. Variabel kontinu mencakup semua bilangan, baik utuh maupun pecahan. Oleh karenanya tidak bisa

Universitas Sumatera Utara

dipisahkan satu nilai dengan nilai yang lain. Itulah sebabnya fungsi variabel random kontinu sering disebut fungsi kepadatan, karena tidak ada ruang kosong diantara dua nilai tertentu. Dengan kata lain sesungguhnya keberadaan satu buah angka dalam variabel kontinu jika ditinjau dari seluruh nilai adalah sangat kecil, bahkan mendekati nol. Karena itu tidak bisa dicari probabilitas satu buah nilai dalam variabel kontinu, tetapi yang dapat dilakukan adalah mencari probabilitas diantara dua buah nilai.

Distribusi kontinu mempunyai fungsi matematis tertentu. Jika fungsi matematis tersebut digambar, maka akan terbentuk kurva kepadatan dengan sifat sebagai berikut: 1. Probabilitas nilai x dalam variabel tersebut terletak dalam rentang antara 0 dan 1 2. Probabilitas total dari semua nilai x adalah sama dengan satu (sama dengan luas daerah di bawah kurva)

Fungsi kepadatan merupakan dasar untuk mencari nilai probabilitas di antara dua nilai variabel. Probabilitas di antara dua nilai adalah luas daerah di bawah kurva di antara dua nilai dibandingkan dengan luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dengan menggunakan integral tertentu (definit integral).

Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter μ dan σ yaitu rataan dan simpangan baku. Jadi fungsi padat x akan dinyatakan dengan n (x; μ, σ). Begitu μ d an σ dik etahui mak a selu ruh k u va r normal dik etahui. Sebagai contoh, bila μ = 50 dan σ = 5, maka ordinat n(x ; 50, 5) dapat dengan mudah dihitung untuk berbagai harga x dan kurvanya dapat digambarkan. Kedua kurva bentuknya


persis sama tapi titik tengahnya terletak di tempat yang berbeda di sepanjang sumbu datar. Dengan memeriksa turunan pertama dan kedua dari n(x ; μ, σ) dapat diperoleh lima sifat kurva normal berikut : 1. Modus, titik pada sumbu datar yang memberikan maksimum kurva, terdapat pada x = μ 2. Kurva setangkup terhadap garis tegak yang melalui rataan μ 3. Kurva mempunyai titik belok pada x = μ

σ, cekung dari bawah bila μ – σ

< x < μ + σ, dan cekung dari atas untuk harga x lainnya 4. Kedua ujung kurva normal mendekati asimtot sumbu datar bila harga x bergerak menjauhi μ baik ke kiri maupun ke kanan 5. Seluruh luas di bawah kurva diatas sumbu datar sama dengan 1

Bila x menyatakan peubah acak distribusi maka P(x1 < x < x2) diberikan oleh daerah yang diarsir dengan garis yang turun dari kiri ke kanan. Jelas bahwa kedua daerah yang diarsir berlainan luasnya. Jadi, peluang yang berpadanan dengan masingmasing distribusi akan berlainan pula.

2.2 Transformasi Normal Standar

Distribusi normal adalah distribusi variabel kontinu dengan fungsi matematis adalah sebagai berikut:


dengan π = 3,14159… dan e = 2,71828 Selain beberapa konstanta yang tidak akan berubah nilainya (e, π), bentuk distribusi kurva normal ditentukan oleh tiga variabel, yaitu: x = nilai dari distribusi variabel μ = mean dari nilai-nilai distribusi variabel σ = standar deviasi dari nilai-nilai distribusi variabel Para ahli statistik telah menyelidiki bentuk distribusi normal dengan mempelajari fungsi tersebut dan didapatkan sifat-sifat sebagai berikut: a. Simetris, yaitu mean distribusi terletak di tengah dengan luas bagian sebelah kiri sama dengan bagian sebelah kanan (berbentuk lonceng) sehingga total daerah di bawah kurva sebelah kiri = total daerah di bawah kurva sebelah kanan = 0,5 b. 68% dari nilai variabel terletak dalam jarak

1σ (antara -1σ dan +1σ)

c. 95% dari nilai variabel terletak dalam jarak

1,96σ

d. 99% dari nilai variabel terletak dalam jarak

3σ

Selain menggunakan metode integral, perhitungan probababilitas distribusi normal juga bisa menggunakan tabel distribusi normal, yaitu tabel yang memuat probabilitas dari berbagai nilai variabel dalam distribusi normal. Metode ini lebih praktis untuk keperluan penelitian. Yang menjadi masalah dalam penyusunan tabel tersebut adalah kenyataan bahwa terdapat banyak sekali macam distribusi normal, dipengaruhi oleh besarnya nilai mean (μ) dan standar deviasinya (σ).


Untuk mengatasi hal tersebut, maka para ahli hanya membuat satu buah tabel yaitu tabel untuk menghitung nilai-nilai probabilitas distribusi normal standar, sedangkan jika akan menghitung probabilitas nilai-nilai variabel distribusi normal yang tidak standar, tetap bisa menggunakan tabel distribusi normal standar tersebut dengan memakai metode konversi. Yang dimaksud distribusi normal standar adalah distribusi normal dengan sifat khusus, yaitu distribusi dengan normal yang mean = 0 dan standar deviasi = 1.

Untuk mengatasi kesulitan dalam menghitung fungsi padat normal maka dibuat tabel luas kurva normal sehingga memudahkan penggunaanya. Akan tetapi, tidak akan mungkin membuat tabel yang berlainan untuk setiap harga μ dan σ. Untunglah, seluruh pengamatan dengan setiap peubah acak normal x dapat ditransformasikan menjadi himpunan pengamatan baru suatu peubah acak normal z dengan rataan nol dan variansi 1. Hal ini dapat dikerjakan dengan transformasi.

z= Bilamana x mendapat suatu harga x, harga z padanannya diberikan oleh z = (x – μ)/σ. Jadi, bila z berharga antara x = x1 dan x = x2, maka peubah acak z akan berharga z1 = (x1 – μ)/σ d an z2 = (x2 – μ)/σ. Distribusi peubah acak normal dengan rataan nol dan variansi 1 disebut distribusi normal baku.

Dengan demikian sepanjang diketahui rata-rata dan deviasi standar, maka dapat ditransformasi setiap distribusi nilai ke dalam nilai-nilai z. Bagaimanapun hanya nilai-nilai z dari variabel-variabel yang berdistribusi normal yang akan dengan


sendirinya berdistribusi normal. Dengan kata lain, transformasi ke dalam nilai-nilai z tidak mengubah bentuk awal dari distribusi itu.

2.3 Tabel Distribusi Normal Standar

Berikut ini beberapa hal tentang distribusi normal standar : 1. Tabel distribusi normal standar disusun untuk menghitung probabilitas nilainilai variabel normal standar, yaitu distribusi normal dengan mean nol (μ = 0) d na standar d ve asi i satu (σ = 1 .) Variabel distribu is normal stand ra menggunakan lambang z. 2. Karena distribusi normal standar bersifat simetris (kiri-kanan sama), maka tabel distribusi normal standar dibuat hanya untuk menghitung bagian sebelah kanan mean dari distribusi tersebut. Untuk menghitung nilai di sebelah kiri, maka nilai z yang negatif dianggap sama dengan z positif, sehingga tabel tersebut tetap bisa digunakan. 3. Nilai-nilai probabilitas yang terdapat dalam tabel tersebut adalah nilai probabilitas antara μ = 0 dan satu nilai z tertentu, bukan antara dua buah nilai z sembarang.

Nilai z begitu penting karena semua distribusi normal ukuran nilai apapun dapat ditransformasi kedalam satu distribusi nilai, yaitu distribusi nilai z yang disebut dengan distribusi normal standar.

Distribusi mempunyai dua sifat penting, yaitu : 1. Rata-rata distribusi z, μ adalah 0 2. Deviasi standar distribusi z, σ adalah 1.


Distribusi asli dan sesudah ditransformasi dikarenakan semua harga x antara x1 dan x2 mempunyai harga z padanan antara z1 dan z2, luas di bawah kurva x antara ordinat x = x1 dan x = x2 sama dengan luas di bawah kurva z antara ordinat yang telah ditransformasikan z = z1 dan z = z2. Sekarang banyaknya tabel kurva normal yang diperlukan telah diperkecil menjadi satu, yaitu distribusi normal baku.

2.4 Uji Hipotesis

Dua unsur utama dalam statistik inferensi adalah estimasi dan pengujian hipotesis. Pengujian hipotesis merupakan hal sangat penting dalam statistik inferensi. Dua tipe pengujian hipotesis, yaitu uji t untuk menguji hipotesis pada parameter tunggal (individual) dan uji F menguji hipotesis pada parameter-parameter secara simultan.

Pengujian hipotesis dilakukan setelah menghitung estimasi terhadap parameter populasi yang benar dengan serangkaian pertanyaan-pertanyaan yang jauh lebih rumit. Pengujian hipotesis menentukan apa yang dapat dipelajari tentang alam nyata dari sampel. Apabila hipotesis ditolak dengan menggunakan hasil yang muncul oleh sampel yang digunakan maka hipotesis dinyatakan benar, keanehan-keanehan yang terjadi bahwa sampel tertentu akan teramati.

Pengujian hipotesis digunakan di berbagai bidang. Sebuah perusahaan memiliki bagian penelitian dan pengembangan yang salah satu tugasnya adalah menguji produk sebelum dipasarkan. Seorang ahli ekonomi Milton Friedman melakukan uji statistik tentang hubungan antara konsumsi dan pemakai.


Walaupun para peneliti selalu tertarik untuk mempelajari apakah teori yang dipertanyakan (hipotesis) didukung oleh estimasi-estimasi yang dihasilkan dari sebuah sampel yang berasal dari pengamatan-pengamatan alam nyata, nampaknya hampir tidak mungkin untuk membuktikan bahwa suatu hipotesis tertentu adalah benar. Semua yang dapat dilakukan menyatakan bahwa suatu sampel tertentu cocok atau sesuai dengan hipotesis tertentu. Walaupun hal tersebut tidak dapat membuktikan bahwa suatu teori tertentu adalah “benar” dengan menggunakan uji hipotesis dengan suatu tingkat keyakinan tertentu. Dalam kasus seperti ini, peneliti menyimpulkan bahwa sangatlah tidak mungkin hasil sampel akan teramati, jika teori yang dihipotesiskan adalah benar. Jika terdapat bukti yang tidak sesuai dengan validitas teori, pertanyaan itu sering disimpan sampai data tambahan atau suatu pendekatan baru memberikan jalan terang bagi persoalan itu.

Ada tiga topik yang sangat penting untuk dibicarakan dalam aplikasi pengujian hipotesis pada analisis regresi : 1. Spesifikasi hipotesis yang harus diujikan 2. Keputusan yang digunakan untuk menentukan apakah menolak hipotesis yang dipertanyakan 3. Macam kesalahan yang mungkin dihadapi jika aplikasi keputusan menghasilkan kesimpulan yang tidak benar.

2.5 Spesifikasi Hipotesis : Hipotesis Nol dan Hipotesis Alternatif

Tahap pertama dalam pengujian hipotesis adalah menyatakan secara eksplisit hipotesis yang akan diuji. Untuk menjaga rasa kejujuran, peneliti seharusnya menyatakan spesifikasi hipotesis tersebut sebelum parameter dalam hipotesis itu diestimasi. Maksud mempelajari teori lebih dahulu adalah untuk memudahkan


hipotesis dengan dasar teori selengkap mungkin. Hipotesis yang disusun setelah estimasi adalah pembenaran hasil-hasil tertentu daripada menguji validatasinya. Akibatnya, sebagian besar ahli statistik inferensi harus hati-hati dalam menyusun hipotesis sebelum estimasi.

Dalam menyusun sebuah hipotesis, peneliti harus menyatakan secara hati-hati tentang apa yang dipikir tidak benar dan apa yang dipikir benar. Ini mencerminkan harapan-harapan peneliti tentang suatu parameter atau parameter-parameter tertentu diringkas dalam bentuk hipotesis nol dan hipotesis alternatif.

Hipotesis nol adalah suatu pernyataan tertentu tentang nilai-nilai dalam suatu range dari parameter yang akan diharapkan terjadi apabila teori yang dimiliki peneliti tidak benar. Sedangkan Hipotesis alternatif digunakan untuk menspesifikasi nilai-nilai dalam suatu range dari parameter yang diharapkan terjadi apabila pernyataan teori oleh peneliti adalah benar.

Kata nol berarti “kosong” dan hipotesis nol dapat dipertimbangkan sebagai hipotesis yang mana peneliti tidak dipercaya. Dalam membangun hipotesis nol dan hipotesis alternatif dengan cara seperti ini supaya dapat menyusun pernyataan yang kuat apabila menolak hipotesis nol. Ini hanya terjadi apabila didefinisikan hipotesis nol dengan beranggapan bahwa hal tersebut tidak mengharapkan dapat membatasi probabilitas menolak secara kebetulan hipotesis nol apabila faktanya memang benar.

Pernyataan sebaliknya tidak berlaku, yaitu bahwa sesungguhnya hal tersebut tidak pernah mengetahui probabilitas menerima secara kebetulan hipotesis nol apabila faktanya salah. Konsekuensinya, hal tersebut tidak pernah dikatakan bahwa menerima


hipotesis nol. Dapat dikatakan bahwa tidak dapat menolak hipotesis nol atau meletakkan kata menerima dalam permasalahan.

Dalam statistik inferensi, hipotesis biasanya tidak menspesifikasi nilai-nilai tertentu, namun menyatakan suatu arah atau tanda tertentu yang

mana peneliti

mengharapkan statistik hasil estimasi itu akan diperoleh. Dapat dinyatakan hipotesis suatu parameter tertentu akan positif atau negatif. Dalam kasus-kasus semacam itu hipotesis nol menunjukkan bahwa apa yang diharapkan tidak terjadi, namun harapan itu merupakan suatu range nilai hipotesis yang sama (dalam suatu range) untuk hipotesis alternatif.

Notasi yang digunakan untuk menunjukkan suatu hipotesis nol adalah “H0” dan notasi ini diikuti oleh suatu pernyataan nilai atau range nilai-nilai yang tidak diharapkan sebagai parameter yang akan diperoleh. Apabila kita mengharapkan suatu parameter yang negatif maka hipotesis nol yang benar adalah H0 : μ < 0 (nilai yang tidak diharapkan) Hipotesis alternatif dinyatakan oleh “H1” diikuti oleh parameter nilai atau nilai-nilai yang diharapkan teramati : H1 : μ

0 (nilai yang diharapkan benar)

Cara lain untuk menyatakan hipotesis nol dan hipotesis alternatif adalah menguji hipotesis bahwa μ adalah tidak berbeda secara signifikan dari nol untuk masing-masing arah. Untuk pendekatan seperti ini hipotesis nol ditulis :


H0 : μ = 0 H1 : μ

0

Oleh karena H1 memiliki nilai-nilai pada kedua arah dari hipotesis nol, maka pendekatan ini disebut uji dua-arah untuk membedakan dengan contoh yang pertama, yaitu uji satu-arah

2.6. Tipe Kesalahan I dan Kesalahan II

Pengujian dalam statistik inferensi adalah menghipotesiskan suatu arah yang diharapkan dari parameter atau masing-masing parameter dan kemudian menentukan apakah menolak atau tidak menolak hipotesis nol. Oleh karena statistik hanyalah estimasi dari parameter (parameter-parameter) populasi yang benar, maka tidaklah realistis untuk menduga bahwa kesimpulan yang ditarik dari analisis sampel akan selalu benar. Ada dua macam kesalahan yang dapat dibuat dalam pengujian hipotesis semacam itu :

Tipe Kesalahan I : Tidak menolak sebuah hipotesis nol yang benar Tipe Kesalahan II : Tidak menolak sebuah hipotesis nol yang salah

Dapat diperhatikan kesalahan-kesalahan ini sebagai kesalahan-kesalahan Tipe I dan Tipe II. Anggaplah memiliki hipotesis nol dan hipotesis alternatif sebagai berikut : H0 :μ

0

H1 : μ

0





membuat kesalahan Tipe I, namun hanya satu-satunya kesempatan dapat dinolak kebenaran adalah ketika

jatuh di daerah penolakan.

Memperkecil tipe kesalahan I berarti memperbesar tipe kesalahan II. Dapat dipilih di antara kedua tipe kesalahan tersebut dengan memperhatikan biaya (cost) membuat satu jenis kesalahan yang secara dramatis lebih besar daripada biaya membuat kesalahan jenis lain.

2.8 Distribusi Normal Standar, z untuk uji Hipotesis

Uji hipotesis sering menggunakan distribusi normal standar. Untuk kasus-kasus di mana ukuran jumlah sampel cukup besar dan deviasi standar populasi diketahui digunakan distribusi normal standar z, sementara untuk ukuran jumlah sampel kecil dan deviasi standar populasi tidak diketahui digunakan distribusi normal standar.

a.

Untuk Sampel Berukuran Besar dan σ Diketahui

z= dengan : σx = σ = deviasi standar populasi = rata-rata sampel μ = rata-rata populasi


b.

Untuk Sampel Berukuran Besar dan σ Tidak Diketahui

z=

dengan : Sx

=

S = deviasi standar data sampel = rata-rata sampel μ = rata-rata populasi 2.9 Uji Tanda

Di dalam menggunakan uji t, populasi dari mana sampel diambil harus berdistribusi normal. Untuk pengujian perbedaan mean dari dua populasi didasarkan pada anggapan bahwa varians populasinya harus identik/sama. Dalam banyak hal bila salah satu atau kedua anggapan tersebut tidak diketahui, maka uji t tidak dapat dipergunakan. Dalam hal demikian dapatlah dipergunakan uji nonparametrik yang umum dikenal sebagai uji tanda (sign test).

Uji tanda didasarkan atas tanda-tanda, positif atau negatif, dari perbedaan antara pasangan pengamatan. Bukan didasarkan atas besarnya perbedaan. Uji tanda dapat dipergunakan untuk mengevaluasi efek dari suatu treatment tertentu. Efek dari variabel eksperimen atau treatment tidak dapat diukur melainkan hanya dapat diberi tanda positif atau negatif saja.


2.10 Uji Wilcoxon

Uji nonparametrik akhir-akhir ini mendapat perhatian yang lebih besar karena beberapa sebab. Pertama, perhitungannya biasanya singkat dan mudah dikerjakan. Kedua, datanya tak perlu berupa pengukuran kuantitatif tapi dapat saja berupa respon kualitatif seperti ‘cacat’ atau ‘tidak cacat’, ‘ya ‘ atau ‘tidak’ atau sering pula nilai skala ordinal yang dapat diberi rank. Pada skala ordinal datanya di rank menurut aturan tertentu, dan dengan uji nonparametrik berbagai rank itu dianalisis.

Pada tahun 1945 Frank Wilcoxon mengusulkan suatu cara nonparametrik yang amat sederhana untuk membandingkan dua populasi kontinu bila hanya tersedia sampel bebas yang sedikit dan kedua populasi asalnya tidak normal. Cara ini sekarang dinamakan uji Wilcoxon atau Uji Jumlah Rank Wilcoxon. Hipotesis nol H0 bahwa μ1 = μ2 akan diuji lawan suatu tandingan yang sesuai. Pertama-tama ambilah sampel acak dari tiap populasi. Misalkan n1 banyaknya pengamatan dalam sampel yang lebih kecil, dan n2 banyaknya pengamatan dalam sampel yang lebih besar. Bila sampelnya berukuran sama, maka n1 dan n2 dapat dipertukarkan. Urutlah semua n1 + n2 pengamatan dengan urutan membesar dan berikan rank 1, 2, … , n1 + n2 pada tiap pengamatan. Bila terdapat seri (pengamatan yang besarnya sama), maka pengamatan tersebut diganti dengan rataan ranknya jika seandainya keduanya dapat dibedakan (tidak seri).


2.11 Uji Wilcoxon untuk pengamatan berpasangan

Uji tanda ditunjukkan dengan pemberian tanda tambah atau kurang, anggota yang mana dari pengamatan yang berpasangan yang lebih besar, tapi tidak menunjukkan besarnya selisih tersebut. Suatu uji memperhitungkan tanda dan besarnya selisih telah dikemukakan oleh Wilcoxon dan sekarang biasa disebut sebagai Uji Wilcoxon untuk pengamatan berpasangan. Uji wilcoxon lebih peka daripada uji tanda dalam menentukan perbedaan antara rataan populasi dan karena itu akan dibahas secara mendalam. Untuk menguji hipotesis bahwa μ1 = μ2 dengan uji Wilcoxon, mula-mula kesampingkan semua selisih yang besarnya nol dan kemudian rank bi, yaitu sisanya, tanpa memperhatikan tandanya. Rank 1 diberikan pada nilai mutlak bi yang terkecil, rank 2 pada terkecil berikutnya, dan seterusnya. Bila nilai mutlak dari dua atau lebih selisih sama, berilah pada tiap selisih rata-rata dari yang seharusnya akan diberikan seandainya selisih tersebut dapat diberikan. Bila tidak ada perbedaaan antara kedua rataan populasi, maka jumlah ruang dari selisih yang positif seharusnyalah hampir sama dengan jumlah rank dari selisih yang negatif.

Uji ini digunakan untuk menguji kondisi (variabel) pada sampel yang berpasangan atau dapat juga untuk penelitian sebelum dan sesudah. Dalam uji ini ingin diketahui manakah yang lebih besar dari antara pasangan. Misalkan di = selisih tiap pasangan yang harus dibuat ranking, untuk di tanpa memperhatikan tandanya, rank 1 diberikan untuk harga mutlak di terkecil dan rank terbesar untuk harga mutlak di terbesar. Kemudian untuk masing-masing ranking berikan tandanya sesuai dengan tanda selisih yaitu tanda + dan -.


Bila perlakuan pertama sama pengaruhnya dengan perlakuan kedua, yaitu apabila Ho benar, diharapkan akan dijumpai beberapa di yang bertanda + dan beberapa yang bertanda – dalam jumlah yang sama. Jika jumlah tersebut berbeda, maka berarti perlakuan pertama berbeda dengan perlakuan kedua.

Tujuan Penggunaan Uji Peringkat Bertanda Wilcoxon ialah menggunakan arah dan besar perbedaan untuk mengetahui apakah benar-benar terdapat perbedaan pada data ordinal pasangan tersebut.

\


BAB 2 LANDASAN TEORI 2.1 Distribusi Normal

Recommend Documents