ALGORITMA PENENTUAN UKURAN SAMPEL EKSAK UNTUK DISTRIBUSI NORMAL

Download Jurnal Konvergensi. Vol. 4, No. 1, April, 2014. Algoritma ... keluarga eksponensial yaitu distribusi Normal, distribusi Poisson dan dua dis...

0 downloads 493 Views 170KB Size
Jurnal Konvergensi Vol. 4, No. 1, April, 2014

ALGORITMA PENENTUAN UKURAN SAMPEL EKSAK UNTUK DISTRIBUSI NORMAL, DISTRIBUSI POISSON DAN DUA DISTRIBUSI BINOMIAL DALAM MODEL KELUARGA EKSPONENSIAL Dian Eka Wijayanti1) Program Studi Matematika Universitas Ahmad Dahlan [email protected]

Abstrak Ketika akan melakukan suatu eksperimen dengan menggunakan pendekatan klasik ataupun pendekatan Bayesian, informasi tentang ukuran sampel yang tepat sangatlah penting. Penentuan ukuran sampel ini selain tergantung pada parameter yang diselidiki juga berkaitan dengan biaya yang dibutuhkan untuk survey data. Penentuan ukuran sampel yang tepat akan memberikan kesimpulan dan keputusan yang baik dengan biaya minimal. Tujuan dari penulisan ini adalah membahas masalah penentuan besarnya ukuran sampel untuk distribusi-distribusi dalam model keluarga eksponensial yaitu distribusi Normal, distribusi Poisson dan dua distribusi Binomial dengan menggunakan negatif log normed likelihood . Kata kunci : distribusi Normal, distribusi Poisson dan dua distribusi Binomial, fungsi likelihood, generalized likelihood ratio, ukuran sampel eksak

1. Pendahuluan 1.1 Teori Inferensi Statistik Teori inferensi statistik merupakan teori yang berkaitan dengan penarikan inferensi mengenai populasi yang didasarkan pada data sampel. Inferensi dapat dilakukan dengan dua pendekatan yaitu pendekatan klasik (frekuentif) dan pendekatan Bayesian. Dalam pendekatan klasik, inferensi didasarkan sepenuhnya pada informasi yang diperoleh melalui data sampel yang diambil dari populasi , sedangkan dalam pendekatan Bayesian, selain didasarkan seperti pada pendekatan klasik, inferensi juga dilakukan berdasarkan pada parameter populasi yang timbul dari sumber investigasi statistik yang lain. Informasi dari investigasi awal ini dikenal sebagai informasi prior. Inferensi statistik dapat dibagi kedalam dua bagian yang besar yaitu estimasi (penaksiran) dan pengujian hipotesa. Teori estimasi ini cukup menarik karena biasanya parameter populasi tidak diketahui, sehingga inferensi yang dilakukan terhadap parameter populasi tersebut dilakukan dengan menggunakan informasi sampel. Penaksiran parameter populasi yang tidak diketahui dibedakan menjadi dua pendekatan, yaitu pendekatan klasik dan pendekatan teori keputusan. Dalam pendekatan klasik, metode-metode yang sering digunakan untuk menaksir parameter

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

27

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

populasi diantaranya adalah metode moment dan metode maksimum likelihood. Persoalan dalam penaksiran parameter populasi adalah menentukan estimator terbaik, dimana dalam statistik klasik kriteria kebaikan suatu estimator diketahui dengan menyelidiki sifat ketakbiasan, asas kecukupan, variansi minimum dan sebagainya. Dalam pendekatan teori keputusan, inferensi didasarkan pada kombinasi informasi sampel dan aspek lain yang relevan untuk mendapatkan keputusan yang terbaik. Salah satu aspek yang dianggap relevan tersebut adalah pengetahuan tentang konsekuensi yang mungkin timbul dari keputusan yang diambil. Pengetahuan ini sering diukur dalam bentuk fungsi kerugian yang mungkin untuk setiap keputusan. Fungsi resiko didefinisikan sebagai harga harapan dari fungsi kerugian. Kriteria kebaikan dari suatu estimator, salah satunya dilihat dari besarnya resiko estimator tersebut. Salah satu konsep yang ditawarkan dalam pendekatan teori keputusan ini adalah memperoleh keputusan dengan resiko minimal. Penggunaan konsep ukuran sampel tetap tidak mungkin digunakan karena adanya parameter-parameter pengganggu. Karenanya untuk memperoleh keputusan yang ditawarkan adalah prosedur keputusan sekuensial. Prosedur keputusan ini mempunyai dua komponen, yang pertama adalah rencana sampling dan kedua aturan keputusan. Karena itulah maka ukuran sampel yang akan diambil merupakan variabel random. Sebelum melakukan eksperimen dengan menggunakan pendekatan klasik atau pendekatan Bayesian, dibutuhkan ukuran sampel yang tepat dan penentuan ukuran sampel tersebut biasanya berhubungan dengan kondisi tertentu dalam menentukan sebuah parameter. Penentuan ukuran sampel secara langsung berhubungan dengan biaya survey serta memiliki pengaruh yang sangat besar pada kesimpulan dan keputusan tentang parameter yang akan diperoleh. Dalam tulisan ini dibahas masalah penentuan ukuran sampel yang diambil untuk distribusi Normal, distribusi Poisson dan dua distribusi Binomial yang merupakan keluarga eksponensial dengan menggunakan negatif log normed likelihood masingmasing model karena statistik cukup untuk model-model dalam keluarga eksponensial adalah Maksimum Likelihood Estimation.

1.2 Maksimum Likelihood Estimation (MLE) Maksimum likelihood estimation (MLE) merupakan suatu metode pengestimasian yang sangat populer dan merupakan statistik cukup untuk keluarga eksponensial. Definisi. 1.[Soejoeti, 1990] Misalkan y , y , … . , y likelihood dari y adalah:

sampel random dari f(y; θ) maka diperoleh fungsi

= ( )=

28

( ; )

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

Dan fungsi log likelihoodnya : ( ) = log( ( )) Misalkan w = h(y , y , … y , )dimanasetiapnilai w memaksimumkan L(θ) yakni L(w) ≥ L(θ) untuk semua θ ≠ w dinamakan maksimum likelihood estimation (MLE) untuk θditulis w = θ

2. Negative Log Normed Likelihood dan Deviance Definisi. 2.[Lindsey, 1995] Misalkan Y, variabel random dengan distribusi probabilitas bergantung pada parameter tunggal θdan θ suatu estimasi maksimum likelihood dari θ dan f(y; θ) adalah fungsi densitas dari Y. Misalkan L(θ) sebagai fungsi likelihood untuk variabel θ dan L(θ) sebagai fungsi likelihood untuk estimasi maksimum likelihood parameter θ. Negative log normed likelihood dinotasikan l didefinisikan sebagai : ( )

= − log

( )

Deviance dinotasikan dengan ( ) didefinisikan sebagai : ( ) = 2 log

( )

= −2

Teorema 1.[Lindsey, 1997] Misalkan Y variabel random dengan distribusi probabilitas bergantung pada parameter tunggal , dan ( ; ) merupakan anggota keluarga eksponensial linier sehingga dapat dinyatakan sebagai berikut : ( ; ) = exp[ ( ) ( ) + ( ) + ( )] Bentuk umum fungsi negative log normed likelihood untuk satu observasi adalah : ( ; )= −

+



( )

dengan sebagai parameter kanonik, estimasi maksimum likelihood dari , ( )sama dengan − ( ) dan ( )sama dengan − ( )

3. Penentuan ukuran sampel eksak untuk model keluarga eksponensial Negatif normed log likelihood pada masing-masing model digunakan untuk membandingkan harga-harga parameter dugaan dengan estimasi maksimum likelihood. Nilai besar dari negatif normed log likelihood mengindikasikan bahwa

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

29

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

model dugaan tidak masuk akal. Misalkan N, ukuran sampel yang akan dihitung dan sebagai contoh misalkan µ dan µ dua harga parameter yang diselidiki. Jika diambil suatu harga parameter dari suatu model, maka menurut J.K. Lindsey (1995) ada beberapa situasi yang mungkin terjadi ketika model-model tersebut dibandingkan : i. Negative log normed likelihood salah satu model lebih kecil dari ii. Negative log normed likelihood kedua model lebih besar dari dari pada karenanya kedua model tersebut tidak dapat diterima iii. Negative log normed likelihood kedua model lebih kecil dari karenanya kedua model tersebut dapat diterima Dalam kasus pertama, kesimpulannya jelas. Dengan memilih ukuran sampel secara tepat, diharapkan kasus kedua yang disebabkan ukuran sampel lebih besar dari yang diperlukan dan kasus ketiga, karena ukuran sampel tidak cukup besar untuk membandingkan kedua model dari interest dapat dihindari. Keadaan ditengah kasus kedua dan kasus ketiga tersebut akan terjadi jika kita hanya mempunyai observasi cukup, dalam kasus terburuk, ketika kedua model sama jeleknya, keduanya akan mempunyai Negative log normed likelihood yang sama yaitu . Jika hal ini terjadi, hubungan maksimum likelihood estimation (MLE) akan berada diantara kedua model dari yang diselidiki, keadaan dimana kedua model tersebut sama-sama tidak masuk akal. Karenanya pada keadaan terburuk, diharapkan masingmasing model berada pada batas menjadi tidak serupa dan diperlukan observasi yang cukup untuk membandingkan kedua model dalam situasi ini. Pemilihan ukuran sampel ini menjamin untuk dapat membandingkan kedua model. Dalam kasus terburuk, parameter kedua model akan dinyatakan tidak masuk akal dengan nilai Negative log normed likelihood kedua model sama dengan . Dengan pemilihan ukuran sampel yang tepat, akan diperoleh Negative log normed likelihood untuk salah satu model yang lebih besar daripada untuk model lainnya. Jika ukuran sampel lebih besar, fungsi likelihood akan menjadi terbatas dan terjadilah kasus kedua. Pada saat menghitung ukuran sampel eksak tanda topi (^) pada parameter sebagai indikasi maksimum likelihood estimation (MLE) dalam situasi kasus yang terburuk, bukan pada observasi sesungguhnya. Bagaimanapun, sebagaimana dimaksudkan diatas, nilai bisa saja dipilih berdasarkan kriteria klasik, yaitu menggunakan deviance . Berdasarkan definisinya deviance juga merupakan rasio likelihood sehingga mempunyai distribusi asimtotis (p) dengan p merupakan jumlah parameter dan adalah setengah dari nilai deviance. Sebagai contoh variabel acak berdistribusi asimtotis , dengan p-value , 0.05 akan diperoleh nilai = = 1,92

4. Penentuan Ukuran Sampel Eksak untuk Keluarga Eksponensial Definisi 3. [Dobson, 1996] Untuk variabel random Y dengan distribusi probabilitas bergantung pada parameter tunggal , berlaku : a. Distribusi Y termasuk dalam keluarga eksponensial jika dapat ditulis sebagai : ( ; )= ( ) ( ) ( ) ( )

30

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

b. Bentuk diatas dapat juga dituliskan sebagai : ( ; ) = exp[ ( ) ( ) + ( ) + ( )] dengan ( ) = exp[ ( )] dan ( ) = exp[ ( )] c. Jika ( ) = maka dikatakan distribusi tersebut berbentuk kanonik dan ( ) disebut parameter natural Jika terdapat parameter lain selain , maka parameter tersebut dianggap sebagai parameter pengganggu (nuissance parameter) dan nilainya dianggap telah diketahui. Dalam keluarga eksponensial, proporsinal secara langsung ke N dan terdapat hubungan satu-satu antara parameter dengan statistik cukup, sehingga penghitungan ukuran sampel eksak tersebut mudah untuk keluarga ini. Berdasarkan teorema 1, bentuk umum fungsi Negative log normed likelihood untuk satu observasi adalah : ( ; )= − + − ( ) Dimana adalah parameter kanonik, circumflex mengindikasikan maksimum likelihood estimation (MLE). Bagaimanapun, lebih sederhana untuk bekerja dengan parameter nilai mean , yang mempunyai y sebagai estimasi maksimum likelihoodnya. Parameter kanonik adalah fungsi dari mean, katakan ( ). Selanjutnya, untuk N observasi, Negative log normed likelihood adalah : ( ) + ( ̂) ̂ − = − ( ) ̂+ ( ( ̂ )) Dengan : ̂=

=

Pada keadaan dimana kedua model sama buruknya (kasus kedua dengan Negative log normed likelihood lebih besar daripada untuk kedua model sehingga kedua model tersebut tidak dapat diterima), maka dapat ditetapkan sama dengan dan . Lebih lanjut dengan menyamakan persamaan untuk model dan untuk model diperoleh nilai :

̂=

( ( (

)) )

( ( )) ( )

sehingga dapat dihitung nilai :

=

{ ( )

(

)}

( (

))

( ( ))

4.1. Penentuan Ukuran Sampel Eksak pada Distribusi Normal Definisi 4. [Lungan, 2006] Jika Y merupakan variabel random normal dengan mean dan variansi fungsi densitas probabilitas Y adalah : ( ) 1 ( ; )= −∞< <∞ √2 bentuk diatas dapat ditulis dalam bentuk kanonik : 1 ( ; ) = exp − ] + − − log[2 2 2 2 dengan parameter natural .

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

maka

31

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

Lebih lanjut, Misalkan kasus klasik distribusi normal dengan variansi σ tak diketahui. Penentuan ukuran sampel eksak pada distribusi ini digunakan untuk dapat membandingkan dua model dengan mean yang berbeda. Misalkan model dengan mean µ dan µ . Karena fungsi likelihood untuk mean dari distribusi normal simetris maka : ( ) = ̂= sehingga diperoleh =

(

)

4.2. Penentuan Ukuran Sampel Eksak pada Distribusi Poisson Definisi 5. [Montgomery, 2003] Variabel random Y dikatakan berdistribusi Poisson jika fungsi probabilitas massa variabel random tersebut adalah : ( ; )=

= 0, 1, 2, … ..

!

bentuk ini dapat ditulis dalam bentuk kanonik sebagai berikut : ( ; ) = exp[ log − − log !] dengan log sebagai parameter natural. Tujuan menentukan ukuran sampel eksak pada distribusi poisson adalah agar diperoleh ukuran sampel yang menjadikan interval konfidensi sekitar mean dari distribusi poisson mempunyai panjang ∆. Karena interval tersebut tidak akan simetrik, maka definisikan interval tersebut sebagai ( ̂ − , ̂ − + ∆), dimana ̂ akan tergantung pada sampel, ∆ adalah lebar interval yang diinginkan dan c adalah konstanta yang tidak diketahui untuk ketidaksimetrisan dan tergantung pada nilai ̂ . Telah diketahui rumus umum Negatif log normed likelihood adalah : ( ) + ( ̂) ̂ − = − ( ) ̂+ ( ( ̂ )) dan distribusi Poisson bentuk kanonik : ( ; ) = exp[ log − − log !] diperoleh ukuran sampel = ̂ log ̂ − log

∆ ∆

−1 +

∆ ∆

Persamaan ini dapat diplot untuk beragam nilai-nilai yang mungkin dari ̂ . 4.3. Penentuan Ukuran Sampel Eksak pada Dua Distribusi Binomial Definisi 6. [Montgomery, 2003] Suatu eksperimen random dengan n percobaan Bernoulli dimana a. Percobaan tersebut independen b. Hasil percobaan hanya dua yaitu sukses atau gagal

32

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

c. Probabilitas sukses dinotasikan , sama untuk semua percobaan Variabel random Y yaitu jumlah sukses dalam n percobaan mempunyai distribusi binomial dengan fungsi probabilitas massa adalah ( ; dengan y = 0,1,2,...,n dan 0 < sebagai berikut : ( ;

) = exp

)=

(1 −

)

< 1 bentuk ini dapat ditulis dalam bentuk kanonik − log(1 −

log

dengan parameter natural log

) + log(1 −

) + log

.

Penentuan ukuran sampel eksak pada dua distribusi binomial ini dilakukan untuk dapat menguji perbedaan antara dua distribusi binomial dan ingin dideteksi sehubungan dengan log odds ratio kedua model. Misalkan perbedaan antara dua distribusi binomial, sebagaimana digambarkan dengan suatu tabel kontingensi 2 x 2. Anggap sampel tersebut akan dipilih sedemikian hingga variabel penjelasnya berjumlah sama yaitu N/2 dalam masing-masing kategori. Misalkan fungsi distribusi binomial bentuk kanonik sebagai berikut : ( ;

) = exp

log

1−

+

log(1 −

) + log

i = 1, 2 diperoleh ( ) = log

1−

maka

( ) = log

1−

sehingga { ( )} = − log(1 −

) dan

{ ( )} = − log(1 −

)

dengan tabel kontingensi 2 x 2 sebagai berikut : Tabel 1. Tabel Kontingensi 2 x 2 untuk sel frekuensi B A

A1

A2

Total

B1

Y1

(N/2)-Y1

N/2

B2

Y2

(N/2)-Y2

N/2

Tabel 2. Tabel Kontingensi 2 x 2 untuk sel probabilitas B A

A1

A2

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Total

33

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

B1

1-

1

B2

1-

1

dengan ~ ( , ) ; = 1, 2. Jika dapat ditemukan perbedaan dalam distribusi responsi yang sesuai dengan nilai log odds ratio misalkan sebesar 2 , yang kemudian dibandingkan dengan model tanpa perbedaan dengan nilai log dds ratio 0. Karenanya, model yang akan digunakan adalah model logistik biner yang merupakan model yang multiplikatif dalam rasio atau odds probabilitas tetapi linear dalam log odds. Modelnya adalah sebagai berikut : log

= + 1− dengan = 2 / dimana adalah jumlah sukses dalam kategori i, sebagai nilai yang ditentukan sama (untuk kedua kategori) dan adalah nilai yang ditentukan khusus untuk masing-masing kategori. Persamaan diatas dapat diselesaikan untuk memperoleh probabilitas sebagai berikut : exp( + ) = ; = 1, 2 1 + exp( + ) Diasumsikan adalah mean diperoleh : log + log = 2 + + + = 2 diperoleh : = − , dari yang diketahui, log odds rasio sama dengan2 , karenanya diperoleh : /(1 − ) log =2 /(1 − ) log

− log =2 1− 1− + − + =2 diperoleh = , sehingga dapat dinyatakan = dan = − . Negatif log normed likelihood untuk suatu model dengan selisih 2 adalah : =−

2

(

)−

+ + + +

2

2

(

)

+

log[{1 + exp( + )}{1 + exp( − )}] 2

log

2 2

+ +

2 2

(1 −

(1 −

) log ) log

2 2

(1 −

(1 −

) ) −

log

2 (Persamaan(i)) dari sisi lain, karena yang ingin diselidiki adalah perbedaan dalam dua distribusi binomial, maka untuk kasus dimana tidak terdapat perbedaan model-modelnya dapat dinyatakan bahwa

34

2

log

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

log

=

dan log

=

+

hal ini sama dengan menyatakan bahwa = 0 dan = , sehingga dengan asumsi-asumsi sebelumnya untuk model yang tidak mempunyai perbedaan diperoleh = = 0 sehingga =−

2

(

+

)+

+

2

+

2

2

log[{1 + exp( + )}{1 + exp( )}]

log

2

log

+

2

(

2

(1 −

(1 −

) log ) log

2

)}{

(

2

(1 −

(1 −

) ) −

log

2 (Persamaan(ii)) karena Negatif log normed likelihood untuk model dengan perbedaan dan untuk model tanpa perbedaan diasumsikan sama, persamaan (i) dan (ii) dapat disamakan sehingga diperoleh : {1 + exp( + )}{1 + exp( − )} ( − )= − = log {1 + exp( )} 2 2 (Persamaan (iii)) lebih lanjut, dari penguraian persamaan (ii) diperoleh: (1 + exp( )) ] = log + [ + {1 + exp( + )}{1 + exp( + )} 2 2 = ( ( )) ] log + [ + {

2

+

)}

Suatu aproksimasi sederhana yang baik diperoleh dengan pengasumsian pada kasus terburuk yaitu α ditentukan sebagai setengah dari nilai α, sehingga diperoleh ukuran sampel sebagai berikut : 2 = ( ( )) log + [ + ] 2

= log

(

( ))

+

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti



35

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

5. Algoritma Penentuan Ukuran Sampel Eksak untuk Pemilihan Model Terbaik Secara umum, penentuan model terbaik sangat berkaitan dengan penentuan ukuran sampel yang tepat dengan langkah - langkah sebagai berikut : 1. Identifikasi model ∶ = ∶ = 2. Ditentukan nilai berdasarkan nilai p-value untuk deviance dengan distribusi ( ) dimana p adalah jumlah parameter yang diselidiki. 3. Ditentukan rumus negative log normed likelihood untuk distribusi anggota keluarga eksponensial sebagai berikut : ( ) + ( ̂) ̂ − = − ( ) ̂+ ( ( ̂ )) dengan ̂ = = ∑ 4. Hitung nilai ̂ (estimasi maksimum likelihood pada saat nilai hitung kedua model sama) dengan rumus sebagai berikut : { ( )} − { ( )} ̂= ( )− ( ) 5. Tentukan ukuran sampel dengan rumus sebagai berikut : =

̂ { ( ̂ ) − ( )} + { ( )} − { ( )} 6. Ambil sampel berukuran N dari populasi dan hitunglah estimasi maksimum likelihood sampel tersebut. 7. Hitung Negatif log normed likelihood untuk kedua model dengan rumus umum sebagai berikut : i. Negatif log normed likelihood untuk model dibawah (dinotasikan dengan ) adalah ( ) + ( ̂ ) ̂ − = − ( ) ̂ + ( ( ̂ )) ii. Negatif log normed likelihood untuk model dibawah (dinotasikan dengan ) adalah ( ) + ( ̂ ) ̂ − = − ( ) ̂ + ( ( ̂ )) 8. Bandingkan nilai dan dengan nilai Model dengan nilai Negatif log normed likelihood yang lebih besar dari diindikasikan sebagai model dengan parameter yang tidak masuk akal.

36

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

Langkah tersebut dapat dirumuskan dalam algoritma sebagai berikut : Start

Masukkan nilai

dan

Identifikasi Model ∶ = ∶ =

Tentukan nilai berdasarkan nilai p-value untuk deviance dengan distribusi ( ), p adalah jumlah parameter

Tentukan nilai ̂

Tentukan ukuran sampel (N)

Hitung , dan dengan menggunakan rumus

>

Terima Tolak

∶ ∶

Tolak Terima

∶ ∶

= =

= =

End

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

37

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

6. Contoh Penentuan Ukuran Sampel Eksak Misalkan suatu studi untuk mengetahui apakah terdapat perbedaan antara dua jenis kelamin dalam memberi respon terhadap pertanyaan dengan jawaban ya atau tidak. Model yang mewakili untuk menyelidiki perbedaan antara dua distribusi binomial ini digambarkan dalam tabel kontingensi 2 x 2 sebagai berikut : Tabel 2. Tabel Kontingensi 2 x 2 untuk sel probabilitasrespon dari laki-laki dan perempuan JK Respon

Ya

Tidak

Total

Laki-laki

1-

1

Perempuan

1-

1

Sehingga harus digunakan model logistic sebagai berikut : log

= + ; = 1, 2 1− Misalkan N adalah ukuran sampel sehingga masing-masing kategori dalam studi ini laki-laki dan perempuan mempunyai ukuran yang sama yaitu N/2 dan misalkan juga odds ratio adalah 5, dari yang diketahui dapat dilakukan analisa sebagai berikut : 1− = . =5 1− 1− log = log . = 1,6 1− Sehingga diperoleh = 0,8 dan = −0,8, situasi terburuk dimana perbedaan sulit untuk diketahui adalah jika = 0,4. Lebih lanjut, misalkan probabilitas rata-rata dari respon laki-laki dan perempuan yang menjawab “ya” sama dengan 0,5 maka = log

1− 0,5 = log 1 − 0,5 = log 1 = 0

karenanya pada kasus terburuk dengan “ya” adalah : =

38

2

.

= 0,4 jumlah laki-laki yang menjawab

exp( + ) 2 1 + exp( + ) exp(0,4 ) = . 2 1 + exp(0,4 )

=

.

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

=

2

. 0,599

jumlah perempuan yang menjawab “ya” adalah : exp( + ) = . = . 2 2 1 + exp( + ) exp(−0,4 ) = . 2 1 + exp(−0,4 ) =

2

. 0,401

jumlah sampel adalah : 2

= (

log

=

( {

+



= 1,92 diperoleh ukuran sampel sebagai berikut : 2 . 1,92

dengan pengambilan log

( ))

(

( )) , )}{

(

, )}

(

+ 0,4

, ) (

, )



(

, ) (

, )

= 97,86 jadi dibutuhkan ukuran sampel minimal berukuran 98 untuk dapat membandingkan kedua model, bahkan pada kasus terburuk sekalipun karena semua kemungkinan dari sampel berukuran tersebut mempunyai Negatif log normed likelihood yang lebih kecil dari untuk model yang satu dan lebih besar dari untuk model yang lainnya.

7. Kesimpulan Ukuran sampel eksak adalah suatu ukuran sampel yang digunakan dalam membandingkan dua model dengan parameter yang berbeda. Pemilihan ukuran sampel eksak ini menjadikan nilai Negatif log normed likelihood dari kedua model yang ingin dibandingkan berbeda, dengan salah satunya lebih kecil dari . Penentuan ukuran sampel eksak untuk distribusi Normal, Poisson dan Binomial dalam model keluarga eksponensial dengan menggunakan hubungan antara Negatif log normed likelihood dengan ukuran sampel, yaitu dengan persamaan sebagai berikut : ( ) + ( ̂) ̂ − = − ( ) ̂+ ( ( ̂ )) sehingga :

=

{ ( )

(

)}

( (

))

( ( ))

dengan

̂=

( ( (

)) )

( ( )) ( )

Secara umum, penghitungan ukuran sampel agak sulit dilakukan karena nilai parameter yang diharapkan tidak diketahui dengan baik. Pada kondisi ini,

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti

39

Jurnal Konvergensi Vol. 4, No. 1, April, 2014

approksimasi normal standar secara umum memenuhi dan karenanya pendekatan likelihood untuk penghitungan ukuran sampel ini mempunyai banyak keuntungan antara lain : a. Metode umum yang sama dapat diaplikasikan untuk model keluarga eksponensial sebarang, termasuk model linear tergeneralisir. b. Perhitungannya relatif jelas. Diluar keluarga eksponensial dimana estimasi maksimum likelihood bukanlah merupakan statistik cukup, fungsi log likelihoodnya menjadi lebih kompleks sehingga sampel kasus terburuk tidak dapat secara umum diringkaskan/disimpulkan sebagai nilai skalar yang tunggal tapi tergantung pada konfigurasi (tak bisa diprediksi) dari keseluruhan sampel yang diobservasi. Pada kasus lainnya, modelnya menjadi terlalu kompleks sehingga sulit untuk menghitung ukuran sampel eksaknya. 8. Daftar Pustaka [1] Dobson, A.J. 1996. An Introduction to Generalized Linear Models. Chapman and Hall, London. [2] Lindsey, J.K. 1995. Introductory Statistics : The Modelling Approach. Oxford University Press, Oxford. [3] Lindsey, J.K. 1997. Exact Sample Size Calculation for Exponential Family Models. The Statistician, 46, 231-237. [4] Lungan, Richard. 2006. Aplikasi Statistika dan Hitung Peluang. Graha Ilmu, Yogyakarta. [5] Montgomery, Douglas C. 2003. Applied Statistics and Probability for Engineers. John Wiley and Sons, Inc., New York. [6] Soejoeti, Z. 1990. Peluang dan Statistika, Fakultas MIPA UGM, Yogyakarta.

40

Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti