INTERVAL KREDIBEL BAYESIAN OBYEKTIF DARI PARAMETER

PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW

INTERVAL KREDIBEL BAYESIAN OBYEKTIF DARI PARAMETER POPULASI BERDISTRIBUSI POISSON DAN EKSPONENSIAL Adi Setiawan Program Studi Matematika Industri dan Statistika, Fakultas Sains dan Matematika Universitas Kristen Satya Wacana Jl Diponegoro 52-60 Salatiga 50711, Indonesia Email korespondensi : [email protected] ABSTRAK Metode statistik Bayesian obyektif mendasarkan pada pemilihan prior dan fungsi kerugian tertentu sehingga menghasilkan estimasi interval (kredibel) yang hanya tergantung pada data dan populasi anggapan. Dalam makalah ini akan dijelaskan penentuan interval kredibel bayesian obyektif dari parameter bila sampel dianggap berasal dari populasi yang berdistribusi Poisson atau yang berdistribusi eksponensial. Keywords: prior Jeffry, loss function, distribusi posterior, intrinsic discrepancy loss function, credible interval Bayesian obyektif.

PENDAHULUAN Interval kredibel (credible interval) telah dijelaskan dalam makalah Setiawan (2009) pada kasus distribusi Bernoulli. Dalam makalah ini akan dijelaskan untuk kasus distribusi Poisson dan distribusi eksponensial. DASAR TEORI Dalam pandangan Bayesian, distribusi posterior merupakan gabungan dari informasi yang disediakan oleh data dan informasi prior relevan yang tersedia. Akan tetapi apabila tidak tersedia informasi prior maka dipilih fungsi uninformative prior artinya fungsi prior yang berpengaruh minimum pada fungsi posterior. Reference prior dapat digunakan sebagai prior yang berpengaruh minimal pada distribusi posterior. Dalam kasus dimensi satu, reference prior merupakan prior Jeffry. Dengan menggunakan prior ini maka penyelesaian masalah estimasi hanya tergantung pada model anggapan dan data pengamatan sehingga estimasi titik yang menggunakan metode ini dinamakan sebagai estimasi titik Bayesian obyektif. Misalkan sampel x = ( x1, x2, ....., xn ) terdiri dari pengamatan dari

M  { p( x | ,  ), x  X , ,   }

dan misalkan x{0,(,)} adalah fungsi kerugian diskrepansi intrinsik (intrinsic discrepancy loss) yang diderita jika 0 digunakan sebagai proxy untuk . Dalam hal ini parameter  merupakan parameter nuisance. Estimasi (titik) intrinsik untuk parameter  adalah

 * ( x)  arg min d ( i | x) i  

yaitu adalah nilai parameter yang meminimalkan harapan fungsi kerugian diskrepansi intrinsik dari reference posterior yaitu d( i | x) dengan

d (i | x) 

  



 x { i , (  ,  ) }  ( ,  | x) d d ,

(1)

 ( ,  | x)  p( x |  ,  )  (  | )  ( ), dan (|) () adalah reference prior bersama dari (,) dengan  merupakan kuantitas yang menjadi perhatian (Bernardo dan Juarez, 2003). 703


Interval kredibel intrinsik (intrinsic credible region) didefinisikan sebagai interval kredibel yang mempunyai lowest posterior loss yang berkaitan dengan penggunaan fungsi kerugian posterior terkecil deskrepansi intrinsik dan reference prior yang bersesuaian. Interval kredibel intrinsik 100q% (q-credible region intrinsic) adalah R*q = R*q( x, )   dari ruang parameter  sehingga memenuhi (i)

himpunan bagian

  ( | x) d  q ,

R*q

(ii) untuk setiap i  R*q dan untuk setiap j  R*q intrinsik statistiknya mempunyai sifat d(i | x)  d(j | x), dengan d(i | x) adalah harapan fungsi kerugian reference posterior sebagai proxy untuk nilai dari parameter yang diberikan pada persamaan (1) (Bernardo, 2005). Persamaan (1) mempunyai bentuk yang perhitungannya secara analitik tidaklah mudah namun dengan menggunakan integrasi numerik, hal itu dengan mudah dapat dilakukan. Populasi Poisson Misalkan dimiliki sampel x1, x2, ...., xn dari populasi berdistribusi Poisson dengan fungsi probabilitas (probability function)

f ( x | ) 

e   x x!

untuk x = 0, 1, 2, ..... dan  > 0. Deskrepansi intrinsik dari distribusi eksponensial adalah

 x ( 0 , )  n min [  ( | 0 ) ,  ( 0 | ) ]

dengan

 f (x | 2 )   ) ln x0  f ( x | 1 )    2 x e 2    x   2 e 2  x !    ln x  x  x!  e 1 x0  1  x !   x x   2 e  2    2  (2 1 )    ln   e   1   x! x0   x  2 x        e  e  2  x 2 ln 2   ( 2  1 )  2   2 ln 2   ( 2  1 ) x! x! x0 x0  1   1 

 (1 | 2 ) 



 f ( x |

2

=  1   2   2 ln   2  .    1  Karena fungsi kepadatan probabilitas x adalah

f ( x | )  maka sehingga

e   x x!

u  ln f ( x |  )     x ln   ln(x!) u x  1   704


dan

2 u x  2 . 2   Akibatnya informasi Fisher yang diperoleh adalah

I ( )   E[

2 u X E[ X ]  1 ]   E[  2 ]  2  2  2     

dan di samping itu reference prior dari parameter  adalah () = -1/2 . Fungsi likelihood dari sampel x1, x2, ...., xn adalah x   xi e    i i e  n  xi ! i 1

n

n

L   f ( xi | )   i 1

1



i

xi !

.

Hal itu berarti bahwa

 ( | x1 , ...., xn )   ( ) L   t (1 / 2 )1e  n sehingga reference posterior yang terkait adalah

 ( | x1 , ...., xn )  Gamma(  | t  (1 / 2), n)

dengan t 

n

x . i 1

i

Akibatnya diperoleh statistik intrinsik 

d ( 0 | x1 , ...., xn )  d ( 0 | t , n)  n   x ( 0 ,  ) Gamma( | t  (1 / 2), n) d . 0

Populasi Eksponensial Misalkan dimiliki sampel x1, x2, ...., xn dari populasi berdistribusi eksponensial dengan fungsi kepadatan probabilitas (probability density function)

f ( x | )  e   x untuk x > 0 dan  > 0. Dalam hal ini, deskrepansi intrinsik dari distribusi eksponensial adalah

 x ( 0 , )  n min [  ( | 0 ) ,  ( 0 | ) ]

dengan

 (1 | 2 ) 



 0

 f ( x | 2 )     f ( x | 2 ) ln   dx =  1  1   ln  1  f ( x | 1 )  2  2

.  

Dapat dibuktikan bahwa reference prior dari parameter yang menjadi perhatian  adalah () = -1 dan reference posterior yang terkait adalah  ( | x1 , ...., xn )  Gamma (  | n, t )   n1e  nt . Akibatnya, diperoleh statistik intrinsik 

d ( 0 | x1 , ...., xn )  d ( 0 | t , n)  n   x ( 0 , ) Gamma( | n, t ) d 0

dengan t 

n

 x (Bernardo, 2009). i 1

i

HASIL DAN DISKUSI Kasus Distribusi Poisson Apabila diberikan ukuran sampel n dan statistik cukup t dengan sampel dianggap berasal dari populasi Poisson maka dapat ditentukan interval kredibel untuk parameter , yaitu interval himpunan bagian dari ruang parameter  yang memenuhi (1). Pada Gambar 1 diberikan gambar yang merupakan hasil perhitungan intrinsik statistik jika diberikan beberapa nilai n dan t yang 705


menghasilkan MLE yang sama untuk parameter  yaitu 0,4 beserta dengan interval kredibel 95 % untuk parameter . Hal itu berarti lebar interval kredibel 95 % untuk masing-masing kasus berurut-turut adalah 0,749, 0,351, 0,249, dan 0,111. Demikian juga, pada Gambar 2 diberikan gambar yang merupakan hasil perhitungan intrinsik statistik yang menghasilkan MLE untuk parameter  yaitu 5. Lebar interval kredibel 95 % untuk masing-masing kasus berurutturut adalah 1,727, 0,782, 0,554 dan 0,248. Akibatnya seperti yang diharapkan, makin besar ukuran sampel n akan makin sempit interval kredibel yang diperoleh.

(b) n=50, t=20, interval kredibel : ( 0,246, 0,597) 150 100 0

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0

0.5

1.0

1.5

2.0

2.5

3.0

(c) n=100, t=40, interval kredibel : ( 0,286 , 0,535 )

(d) n=500, t=200, interval kredibel : ( 0,346 , 0,457)

0

500

intrinsic statistics

200 100

1000 1500

theta

300

theta

0


50


25 15 0 5


35

(a) n=10, t=4, interval kredibel : ( 0,091 , 0,840)

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0.0

0.5

1.0

theta

1.5

2.0

2.5

3.0

theta

Gambar 1. Statistik intrinsik untuk tiap-tiap kemungkinan dan interval kredibel yang diperoleh jika diberikan n dan t untuk masing-masing kemungkinan. Dalam hal ini semuanya mempunyai MLE = 0,4.

(b) n=50, t=100, interval kredibel : (1,621 , 2,403)

80 40 60 0

0

1

2

3

4

0

1

2

3

4

theta

(c) n=100, t=200, interval kredibel : (1,728 , 2,282)

(d) n=500, t=1000, interval kredibel : (1,876 , 2,124)

1

2

3

4

600


50

0

0 200

100 150 200

1000

theta

0


20


15 10 5 0


20

(a) n=10, t=20, interval kredibel : (1,172 , 2,899)

0

theta

1

2

3

4

theta

Gambar 2. Statistik intrinsik untuk tiap-tiap kemungkinan dan interval kredibel yang diperoleh jika diberikan n dan t untuk masing-masing kemungkinan. Dalam hal ini semuanya mempunyai MLE = 2. 706


Kasus Distribusi Eksponensial Untuk ukuran sampel n dan statistik cukup t yang diberikan, dengan sampel dianggap berasal dari populasi eksponensial maka dapat ditentukan interval kredibel untuk parameter . Pada Gambar 3 menyatakan hasil perhitungan intrinsik statistik jika diberikan beberapa nilai n dan t yang menghasilkan MLE yang sama untuk parameter  yaitu 2. Hal itu berarti lebar interval kredibel 95 % untuk masing-masing kasus berurut-turut adalah 2,57, 1,25, 0,88, dan 0,62 Demikian juga, pada Gambar 4 diberikan gambar yang merupakan hasil perhitungan intrinsik statistik yang menghasilkan MLE untuk parameter  yaitu 5. Lebar interval kredibel 95 % untuk masing-masing kasus berurut-turut adalah 6,41, 3,12, 2,2 dan 1,55. Dalam kasus ini juga berlaku sifat bahwa makin besar ukuran sampel n akan makin sempit interval kredibel yang diperoleh. (b) n=40, t=20 sehingga interval kredibel : (1,44, 2.69) 4 3 2 0

1

Intrinsik Statistik

3 2 1 0

Intrinsik Statistik

4

(a) n=10, t=5 sehingga interval kredibel : (1,01, 3.58)

0

2

4

6

8

10

0

2

4

Theta

8

10

3 2 1 0

0

1

2

3

Intrinsik Statistik

4

(d) n=160, t=80 sehingga interval kredibel : (1,70, 2.32)

4

(c) n=80, t=40 sehingga interval kredibel : (1,59, 2.47)

Intrinsik Statistik

6 Theta

0

2

4

6

8

10

0

2

4

Theta

6

8

10

Theta

Gambar 3. Statistik intrinsik untuk tiap-tiap kemungkinan dan interval kredibel yang diperoleh jika diberikan n dan t untuk masing-masing kemungkinan. Dalam hal ini semuanya mempunyai MLE = 2. (b) n=40, t=8 sehingga interval kredibel : (3,61 , 6,73) 5 4 3 2 0

0

2

4

6

8

10

0

2

4

6

8

10

(c) n=80, t=16 sehingga interval kredibel : (3,98 , 6,18)

(d) n=160, t=32 sehingga interval kredibel : (4,26 , 5,81)

4 3 2 1 0

1

2

3

4

Intrinsik Statistik

5

Theta

5

Theta

0

Intrinsik Statistik

1

Intrinsik Statistik

4 3 2 1 0

Intrinsik Statistik

5

(a) n=10, t=2 sehingga interval kredibel : (2,51 , 8,92)

0

2

4

6

8

10

0

Theta

2

4

6 Theta

707

8

10


Gambar 4. Statistik intrinsik untuk tiap-tiap kemungkinan dan interval kredibel yang diperoleh jika diberikan n dan t untuk masing-masing kemungkinan. Dalam hal ini semuanya mempunyai MLE = 5.

KESIMPULAN Interval kredibel dengan metode Bayesian obyektif dapat ditentukan untuk parameter populasi bila sampel dianggap berasal dari populasu yang berdistribusi Poisson atau yang berdistribusi eksponensial. Penelitian ini dapat juga dikembangkan untuk kasus distribusi-distribusi populasi yang lain maupun sifat asimptotiknya. DAFTAR PUSTAKA [1] Bernardo, J. M. (2005) Intrinsic Credible Regions : An objective Bayesian Approach to Interval Estimation, Test 14 , 2:317-384. [2] Bernardo, J. M. dan M. A. Juarez ( 2003 ) Intrinsic Estimation, Bayesian Statistics 7, Oxford : University Press. [3] Setiawan, A. (2009) Credible Interval Bayesian Obyektif, Prosiding Seminar Nasional Matematika , Universitas Katolik Parahyangan, Bandung.

708

INTERVAL KREDIBEL BAYESIAN OBYEKTIF DARI PARAMETER

Recommend Documents