BAHAN AJAR SAMPLING

Download rangka penyelesaian studi mahasiswa maupun yang tertera dalam jurnal-jurnal ..... pada sampel-sampel yang mungkin disebut sebagai distribus...

0 downloads 1145 Views 709KB Size
TINJAUAN MATA KULIAH BAB I PENDAHULUAN I. 1 Beberapa Definisi Dalam berbagai media sering dijumpai hasil jejak pendapat dari masyarakat tentang isu tertentu, jejak pendapat itu dilakukan untuk mengetahui gambaran pendapat dari masyarakat di daerah dimana jejak pendapat ini dilakukan. Hal serupa juga dijumpai dalam publikasi-publikasi penelitian ilmiah baik yang ditulis dalam rangka penyelesaian studi mahasiswa maupun yang tertera dalam jurnal-jurnal penelititan. Pada dasarnya semuanya menghendaki gambaran menyeluruh yang didasarkan pada sebagian objek yang diteliti yang disebut sampel. Gambaran ini dihasilkan oleh proses generalisasi atau disebut juga dengan proses induksi .Oleh karena itu, agar diperoleh gambaran yang bisa mengungkapkan keadaan menyeluruh yang sebenarnya, diperlukan dua hal, yaitu proses induksi yang dilakukan dengan cara yang tepat, dan sampel yang tergolong “baik”. Dengan proses induksi yang tepat diartikan sebagai proses yang menggunakan teknik-teknik analisis yang cocok untuk permasalahan yang dikaji serta mengikuti kaidah-kaidah yang mendasarinya. Sampel dikatakan baik apabila dapat menggambarkan semua sifat atau karakteristik dari keseluruhan objek yang diteliti. Untuk dapat memperoleh sampel seperti ini, diperlukan teknik yang disebut teknik sampling. Terdapat beberapa definisi yang diperlukan untuk membahas teknik ini. I.1. 1 Populasi dan Sampel Populasi merupakan keseluruhan (totality) objek, baik itu dari hasil menghitung maupun mengukur, yang dibatasi oleh kriteria tertentu. Objek populasi tersebut terbagi menjadi dua bagian, yaitu objek yang bisa diraba/kongkret (tangiable) dan objek yang tidak bisa diraba/abstrak (untangiable). Banyaknya objek yang ada dalam populasi disebut ukuran populasi (population size) yang biasanya dilambangkan dengan N. Ukuran populasi ini besarnya ada yang bisa dihitung (countable) dan juga tidak terhitung (uncountable). Apabila ukuran populasi Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

Ͷ

berapapun besarnya, tapi masih bisa dihitung, maka populasi tersebut dinamakan populasi terhingga (finite population). Jika ukuran populasi sudah sedemikian besarnya sehingga sudah tidak bisa lagi dihitung, maka populasi itu dinamakan populasi takhingga (infinite population). Apabila suatu penelitian dilakukan terhadap semua anggota populasi, maka prosesnya dinamakan Sensus Dalam suatu penelitian, seringkali peneliti tidak bisa memeriksa seluruh anggota populasi (sensus). Oleh karena itu, hanya diambil sebagian saja dari anggota populasi sehingga diperolehlah sampel yang besarnya dilambangkan dengan n. Adapun proses pengambilan sebagian anggota populasi tersebut dinamakan sampling. Gambaran mengenai proses sampling bisa dilihat dari ilustrasi berikut ini : POPULASI ( N ) SAMPEL ( n ) Alasan -alasan Parameter

Statistik

x s p

μ σ π

Sensus

Proses Induksi

Sampling

Gambar I. 1 Proses Sampling Terdapat beberapa alasan sehingga peneliti cenderung lebih memilih proses sampling daripada sensus, yaitu : a. Mengurangi biaya, apabila kita melakukan penelitian terhadap sebagian dari anggota populasi, maka akan berakibat pada penghematan biaya. b. Masalah tenaga, jelas bahwa semakin banyak objek yang kita teliti, maka akan berakibat pada semakin banyaknya tenaga yang kita butuhkan baik itu tenaga pengumpul data / pencacah, pencatat / entri data maupun pengolah data. Apabila ada keterbatasan untuk ketiga hal tersebut, maka sampling merupakan alternative terbaik untuk dilakukan. c. Efisiensi waktu, apabila diinginkan kesimpulan yang segera, maka sampling akan lebih tepat untuk digunakan. Hal ini dikarenakan dengan memperkecil Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷ

banyaknya objek yang akan diteliti maka data akan lebih cepat diperoleh dan dianalisis. d. Tingkat ketelitian lebih besar, dalam suatu proses penelitian dari mulai pengumpulan data, pancatatan, dan penganalisisan data harus dilakukan dengan benar dan tepat. Apabila kita telah memakai tenaga-tenaga yang berkualitas baik dan diberi latihan intensif, serta pengawasan terhadap pekerjaan lapangan diperketat tetapi memberikan volume pekerjaan yang besar dan cenderung monoton, maka akan menimbulkan kebosanan baik itu dari pencacah maupun peneliti. Oleh karena itu, akan diperoleh data yang kurang dapat dipercaya kebenarannya. e. Penelitian bersifat destruktif (penelitian yang sifatnya merusak), sensus tidak mungkin dilakukan untuk objek yang sifatnya merusak. Misalnya dalam menguji golongan darah seseorang, maka tidak mungkin semua darah dikeluarkan untuk diperiksa. Jadi dalam hal ini, sensus tidak mungkin lagi untuk dilakukan. f. Faktor ekonomis, yang dimaksud dengan ‘faktor ekonomis’ adalah kesepadanan antara biaya, tenaga dan waktu yang dikeluarkan dengan informasi yang akan diperoleh. Apabila nilai dari infomasi tersebut tidak sepadan dengan biaya, tenaga dan waktu, maka sensus menjadi tidak baik lagi untuk dilakukan. I. 1. 2 Unit Observasi Suatu objek dimana perlakuan dilakukan disebut unit observasi. Ini merupakan unit dasar dari observasi yang terkadang disebut elemen. Dalam penelitian tentang perilaku masyarakat, maka individu masyarakat adalah unit observasi. I. 1. 3 Populasi Target Populasi Target merupakan keseluruhan kumpulan pengamatan/observasi secara lengkap yang akan dipelajari. Menentukan populasi target merupakan langkah awal yang penting pada saat seseorang akan melakukan penelitian. Dalam beberapa keadaan sulit untuk menentukan populasi target. Sebagai contohnya, dalam pemungutan suara dalam bidang politik, apakah target populasinya harus semua orang Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸

dewasa yang layak memilih? Semua pemilih yang terdaftar? Semua orang yang dipilih pada pemilihan terakhir? Pillihan dari target populasi akan memberikan efek statistik yang sangat besar terhadap hasilnya. Jadi, dalam setiap penelitian seorang peneliti pada langkah pertama strateginya harus menentukan secara jelas populasi targetnya yaitu yang nantinya akan menjadi cakupan kesimpulan penelitian. Oleh karena itu, apabila dalam sebuah hasil penelitian dikeluarkan kesimpulan, maka menurut etika penelitian, kesimpulan itu hanya berlaku untuk populasi target yang telah ditentukan. I. 1. 4 Populasi yang disampel Populasi yang disampel adalah populasi dimana sampel akan diambil. Pada suatu saat tertentu setelah peneliti menentukan secara tegas populasi targetnya, peneliti tidak bisa memperoleh keterangan mengenai populasi targetnya, sehingga populasi yang ditelitinya berbeda (lebih kecil) dari populasi sasarannya. Jadi dalam suatu penelitian survey, idealnya populasi yang disampel adalah juga populasi target, namun keadaan ideal ini jarang terjadi. Contoh, dalam survey masyarakat, populasi yang disampel biasanya lebih kecil dari populasi target, seperti tampak dalam gambar berikut : Kerangka sampling

Populasi

Tidak termasuk dalam kerangka sampling

Tidak dapat dijangkau Menolak

merespon Tidak dapat dijangkau

Populasi yang disampel

Tidak layak untuk di survai

Gambar I. 2 Populasi target dan populasi yang disampel

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹

Populasi target dan populasi yang disampel dalam survey atau jajak pendapat terhadap suatu kebijakan dari para pemilih melalui suatu telephone, maka yang menjadi populasi target adalah semua pemilih yang terdaftar. Namun tidak semua pemilih mempunyai telephone, dengan demikian pemilih yang mempunyai telephone dan yang mau menelephone serta berhak merupakan populasi yang disampel. I. 1. 5 Unit sampling Unit sampling merupakan segala sesuatu yang oleh peneliti dijadikan kesatuan (unit) yang nantinya akan menjadi objek pemilihan. Jadi unit sampling itu adalah unit yang diambil sebagai sampel. Unit sampling ini bentuknya bisa individu yang berdiri sendiri yang disebut satuan elementer (Elementary Unit), dan bisa juga kumpulan individu yang disebut Cluster. Misalnya, apabila universitas dibagi ke dalam beberapa fakultas dan dalam penelitian fakultas ini yang akan dipilih, maka fakultas tersebut mejadi unit sampling. Tetapi apabila universitas dibagi menjadi beberapa jurusan dan jurusan ini yang akan dijadikan objek penelitian, maka sekarang yang menjadi unit samplingnya adalah jurusan. I. 1. 6 Kerangka sampling Kerangka sampling (sampling frame) adalah daftar unit sampling yang ada dalam sebuah populasi. Dalam survey tentang pendapat masyarakat akan suatu kebijakan, maka bila unit samplingnya adalah rumah tangga, daftar yang berisikan rumah tangga, nomor rumah serta alamatnya dan karakteristik lain yang berkaitan, disebut kerangka sampling. Dalam teori sampling, apabila kita harus menyusun sampel, kemudian terhadap data yang dikumpulkan dari sampel ini kita ingin melakukan analisis secara statistis, maka sampel yang kita susun tadi harus merupakan sampel random. Sampel random hanya bisa disusun apabila ada kerangka sampling. Oleh karena itu untuk bisa memperoleh sampel random, kerangka sampling mutlak harus ada.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺ

I. 1. 7 Bias Parameter-parameter populasi hanya bisa diketahui nilainya jika penelitiannya sensus. Dalam penelititan yang bukan sensus, untuk mengetahui nilai parameter tertentu, dilakukan penaksiran melalui sampel. Definisi : Apabila dari sebuah populasi kita akan menaksir sebuah parameter θ dengan penaksir

θˆ , maka θˆ disebut estimator untuk θ. Contoh : -

Kita ingin menaksir parameter μ dengan X , maka X adalah estimator untuk

μ -

Kita ingin menaksir parameter σ2 dengan s2, maka s2 adalah estimator untuk σ2

-

Kita ingin menaksir parameter π dengan p, maka π adalah estimator untuk p.

Apabila harga ekspektasi untuk sesuatu penaksir tidak sama dengan parameter yang ditaksir maka penaksir itu dikatakan bias. Definisi : Apabila θˆ merupakan penaksir untuk θ yang memenuhi persyaratan bahwa rata-rata untuk semua θˆ nilainya sama dengan θ, maka dikatakan θˆ adalah penaksir tak bias untuk θ. Definisi: Apabila parameter yang akan ditaksir adalah θ dan penaksirnya adalah θˆ maka bias didefinisikan sebagai B =| θ − E (θˆ) |

Bias adalah selisih mutlak antara parameter yang ditaksir dengan ekspektasi penaksirnya. a. Bias dalam pemilihan unit sampel Sampel yang baik adalah sampel yang bebas dari bias (bias dalam pemilihan unit sampel) terjadi bila beberapa bagian dari populasi target tidak ada dalam populasi yang disampel. Bila suatu survey dirancangkan untuk mempelajari pendapatan rumah Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻ

tangga yang tinggal menetap (tidak termasuk komuter), maka taksiran rata-rata pendapatan rumah tangga akan mungkin terlalu besar, sehingga memberikan taksiran yang bias. b. Bias dalam pengukuran Sampel yang baik adalah juga sampel yang mempunyai sifat bahwa responden merespon pertanyaan dengan akurat. Bias dalam pengkuran terjadi bila instrument yang digunakan untuk mengukur cenderung akan memberikan hasil yang berbeda dari yang sesungguhnya. Jadi instrument tersebut gagal untuk dapat mengukur apa yang sebenarnya harus diukur.Mengukur apa yang seharusnya merupakan hal yang memang sulit dalam penelitian sosial karena penelitian biasanya berkaitan dengan pengukuran karakteristik manusia, yang kadang-kadang tidak bersedia untuk mengatakan hal yang sebenarnya. Dla survey penelitian yang dilakukan terhadap petani dalam rangka pemberian bantuan makanan maka mereka akan cenderung merendahkan hasil pertaniannya dengan harapan memperoleh bantuan pangan. I. 1. 8 Error sampling dan nonsampling Dalam poling pendapat sering dijumpai pernyataan bahwa sampel yang diambil menggunakan margin error sebesar 5%. Margin error menggambarkan besarnya sampling error yang ingin diambil oleh peneliti, yaitu error yang dihasilkan akibat penelitian menggunakan sampel (bukan populasi), Idealnya error harus sekecil mungkin, namun bila memperkecil error berakibat bertambah besar sampel. Jika peneliti mengambil sampel lain yang berbeda, maka jelas akan didapat nilai taksiran yang juga berlainan. Error sampling biasanya dinyatakan dengan terminology probabilitas. Jadi error sampling merupakan selisih antara nilai parameter dengan nilai statistik penaksirnya. Definisi: Apabila θ merupakan sebuah parameter dan θˆ merupakan penaksir bagi θ maka error sampling didefinisikan sebagai:

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲ

δ =| θ − θˆ |

Error sampling bisa pula berarti semua bentuk error yang ditimbulkan karena proses sampling. Apabila kekeliruan yang terjadi bukan karena proses sampling maka kekeliruan itu disebut non-sampling error. Sebagai contoh adalah kekeliruan pengumpulan data sebagai akibat kekeliruan questioner, pemilihan unit sampel dan ketidakakuratan merespon. Jadi non-sampling error adalah error yang tidak dapat ditandai dari variabilitas satu sampel dengan sampel lainnya. I. 1. 9 Presisi dan Akurasi Presisi menunjukkan kekonsistenan atau keseragaman dari nilai penaksir. Makin seragam nilai dari suatu penaksir, maka makin baik presisinya. Dengan kata lain bahwa datanya semakin homogen. Dalam ukuran statistik, presisi dinyatakan dengan standard error

Jadi penaksir yang baik adalah penaksir yang memiliki

standard error paling kecil . Sedangkan Akurasi menunjukkan jarak terhadap target. Dalam statistik, yang menggambarkan akurasi adalah bias yaitu selisih antara penaksir dengan yang ditaksir. Gambaran mengenai presisi dan akurasi bisa dilihat dengan menggunakan pemisalan berikut : X X

X

X

X X X

XXX X

X

X

Pemanah A

XX XXX XX

Pemanah B

Pemanah C

Gambar I. 3 Ilustrasi presisi dan akurasi dari suatu taksiran Gambar di atas dimisalkan sebagai target panahan. Tiga orang pemanah menembakkan anak panahnya masing-masing pada tiap target tersebut. Dari hasilnya terlihat bahwa ternyata pemanah A memiliki tingkat presisi dan akurasi yang rendah,

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳ

dalam arti bahwa hasil dari tembakannya tidak tepat sasaran dengan variasi yang tidak konsisten. Sedangkan untuk pemanah B menghasilkan suatu tembakan yang konsisten sehingga bisa dikatakan bahwa dia memiliki presisi yang tinggi, tetapi masih tidak tepat sasaran atau akurasinya rendah. Untuk pemanah C memberikan kondisi yang terbaik, yaitu memiliki presisi dan akurasi yang tinggi, artinya selain tepat sasaran, juga hasil tembakannya konsisten. Dalam masalah sampling, kondisi seperti pemanah C-lah yang diinginkan. I. 1. 10 Rencana Sampling (Sampling Plan) dan Rancangan Sampling (Sampling Design) Ketika kita melakkukan proses sampling, maka secara tegas kita membedakan apa yang dimaksud dengan Rencana Sampling dan Rancangan Sampling. Rencana Sampling merupakan sebuah gambaran garis besar yg menyangkut : 1. Penentuan populasi sasaran 2. Penentuan bentuk dan ukuran satuan sampling 3. Penentuan ukuran sampel ( n ) 4. Penentuan cara memilih satuan sampling Apabila pada rencana sampling di atas kita menambahkan metode penaksiran/metode analisis, maka rencana sampling meningkat menjadi Rancangan Sampling. Rancangan Sampling

Rencana Sampling

Gambar I. 4 Rencana Sampling dan Rancangan Sampling I. 1. 11 Finite Population Correction (FPC) Apabila kita berhadapan dengan penelitian yang memiliki ukuran populasi terhingga, maka FPC harus dicantumkan pada rumus Standard Error. Jika

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹ

populasinya tak hingga, maka FPC dianggap sama dengan 1 dan tidak usah dicantumkan dalam rumus Standard Error. Bentuk dari FPC itu adalah

N −n , tetapi bentuk ini tidak bisa memberikan N −1

keterangan mengenai beberapa hal yang penting. Oleh karena itu dalam pembicaraan ita mengenai sampling, bentuk FPC yang akan kita gunakan adalah :

N −n § n· = ¨1 − ¸ N N¹ © n· § Dengan menggunakan rumus FPC = ¨1 − ¸ , maka diperoleh dua buah keterangan N¹ © yaiotu : a.

n , disebut sampling fraction, menyatakan berapa persen sampel yang kita buat N (dari populasi). Misalnya jika ada keterangan

n = 0.15, maka berarti bahwa N

ukuran sampel adalah 15 % dari populasinya. b.

n menyatakan besarnya peluang setiap satuan sampling untuk termasuk ke dalam N sampel berukuran n.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵

TINJAUAN MATA KULIAH I. 3 Distribusi Sampling Sebagaimana yang telah diuraikan sebelumnya bahwa dengan berbagai alasan, peneliti cenderung melakukan sampling daripada sensus. Dalam kenyataannya, akan terdapat lebih dari sebuah sampel berukuran n yang mungkin yang bisa diambil dari populasi berukuran N. Adanya beberapa kemungkinan sampel yang bisa diambil menunjukkan adanya bermacam-macam kombinasi data populasi yang bisa terambil Akan tetapi dalam prakteknya hanya akan diambil sebuah sampel untuk digunakan dalam penelitiannya, dengan kata lain bahwa hanya akan diambil satu buah kombinasi data. Sampel yang diambil biasanya dipilih secara acak, disebut dengan sampel acak. Selanjutnya dari sampel tersebut dilakukan proses analisis sesuai dengan tujuan penelitiannya. Sebagai contohnya adalah pada sampel yang bersangkutan akan diperoleh taksiran parameter populasi

θˆ dari θ ( θ merupakan lambang parameter populasi [ μ ,π ,σ 2 ] , sedangkan θˆ

[

]

merupakan lambang penaksir parameter populasi x , p, s 2 ). Kumpulan nilai-nilai

θˆ pada sampel-sampel yang mungkin disebut sebagai

distribusi sampling dari

θˆ . Banyaknya kemungkinan sampel yang bisa diambil tergantung pada proses pengambilan unit-unit populasinya.

Berdasarkan proses memilihnya,

sampling terbagi ke dalam dua tipe, yaitu sampling dengan pengembalian dan sampling tanpa pengembalian. Sampling dengan pengembalian merupakan suatu proses pengambilan sampling dimana sampel yang telah terpilih dikembalikan lagi ke dalam populasi sebelum pemilihan selanjutnya dilakukan, sehingga ada kemungkinan suatu satuan sampling tertentu akan terpilih lebih dari sekali. Oleh karena itu, jika sampling dilakukan dengan pengembalian, maka akan terdapat Nn buah sampel yang berlainan. Adapun sampling tanpa pengembalian merupakan suatu proses pengambilan sampel dimana satuan sampling yang telah terpillih tidak dikembalikan lagi ke dalam populasi, sehingga setiap satuan sampling hanya memiliki kesempatan terpilih satu kali. Oleh karena itu, jika sampling dilakukan

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͸

§N· N! tanpa pengembalian, maka akan terdapat ¨¨ ¸¸ = buah sampel yang © n ¹ n !( N − n ) ! berlainan.

I. 3. 1 Distribusi sampling Rata-rata Dikatakan distribusi sampling rata-rata karena tujuan dari penelitian ini adalah untuk menaksir rata-rata dari populasi.

Oleh karena ada beberapa

kemungkinan sampel yang akan terbentuk, maka untuk tiap-tiap sampel yang bersangkutan juga akan terdapat beberapa rata-rata sampelnya. Anggap rata-rata ini sebagai data baru, maka akan terbentuk suatu kumpulan data yang terdiri dari rata-rata dari sampel-sampel. Dari kumpulan rata-rata tersebut dicari rata-rata dan simpangan bakunya, maka akan diperoleh rata-rata dari rata-rata, disimbolkan dengan μ x dan simpangan baku dari rata-rata, disimbolkan dengan σ x . Sebagai contoh, pada tabel berikut terdapat data mengenai nilai intelegensi calon legislatif yang menggunakan ijasah palsu. Terdapat 5 calon legislatif yang mengunakan ijasah palsu dengan nilai intelegensi masing-masing 50, 60, 70, 80, dan 90. Dari populasi 5 calon legislatif tersebut, diambil 2 sampel secara berulang-ulang sampai semua kemungkinan sampel terambil.

No. Caleg

Nilai Intelegensi

1

50

2

60

3

70

4

80

5

90

Dari data di atas diperoleh rata-rata populasi berikut : N

μ =

¦X

i

i =1

N 350 = 5 = 70

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͹

dan simpangan bakunya adalah : N

σ = =

¦ (X i =1

−μ)

2

i

N

(50 − 70)2 + (60 − 70)2 + (70 − 70)2 + (80 − 70)2 + (90 − 70 )2 5

1000 5 = 14,14214 =

a. Apabila sampling dilakukan dengan pengembalian, maka diperoleh 52 = 25 buah kemungkinan sampel, yaitu :

Rata-rata

Sampel

Caleg yang terpilih

Nilai Intelegensi

1

1;1

50 ; 50

50

2

1;2

50 ; 60

55

3

1;3

50 ; 70

60

4

1;4

50 ; 80

65

5

1;5

50 ; 90

70

6

2;1

60 ; 50

55

7

2;2

60 ; 60

60

8

2;3

60 ; 70

65

9

2;4

60 ; 80

70

10

2;5

60 ; 90

75

11

3;1

70 ; 50

60

12

3;2

70 ; 60

65

13

3;3

70 ; 70

70

14

3;4

70 ; 80

75

15

3;5

70 ; 90

80

16

4;1

80 ; 50

65

17

4;2

80 ; 60

70

18

4;3

80 ; 70

75

19

4;4

80 ; 80

80

20

4;5

80 ; 90

85

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

Nilai Intelegensi

ͳͺ

21

5;1

90 ; 50

70

22

5;2

90 ; 60

75

23

5;3

90 ; 70

80

24

5;4

90 ; 80

85

25

5;5

90 ; 90

90

Tabel di atas merupakan distribusi sampel untuk nilai intelegensi. Terlihat dari tabel di atas bahwa terdapat data baru sebanyak 25 rata-rata. Distribusi dari ratarata tersebut juga bisa disajikan ke dalam bentuk berikut :

Rata-rata

Frekuensi

P(X)

50

1

0,04

55

2

0,08

60

3

0,12

65

4

0,16

70

5

0,2

75

4

0,16

80

3

0,12

85

2

0,08

90

1

0,04

Nilai Intelegensi

Selanjutnya dapat ditampilkan dalam bentuk grafik berikut : Intelegensi 6

5

4

3

Frequency

2

1

Std. Dev = 10.21 Mean = 70.0 N = 25.00

0 50.0

55.0

60.0

65.0

70.0

75.0

80.0

85.0

90.0

Intelegensi

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͻ

Dalam kenyataannya, suatu penelitian tidak pernah mengambil sampel secara berulang-ulang seperti contoh di atas, namun contoh di atas memberi landasan dalam melakukan estimasi nilai yang diperoleh dari sampel. Dari kumpulan ratarata di atas, diperoleh jumlah rata-rata = 1750. Maka rata-rata untuk ke – 25 ratarata ini adalah : 25

μX =

¦X

i

i =1

25 1750 = 25 = 70

Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagai berikut : 25

¦ (X

σX = =

i

i = 25

− μX )2

25

(50 − 70) 2 + (55 − 70) 2 + (60 − 70) 2 + ...(90 − 70 ) 2 25

2500 25 = 10 =

Ternyata terlihat bahwa rata-rata populasi = 70 dengan rata-rata dari ke-25 rata tersebut sama, tetapi memiliki simpangan baku yang berbeda. Dari populasi diperoleh simpangan bakunya = 14,14214 sedangkan dari ke-25 rata-rata diperoleh simpangan baku = 10. Selanjutnya dapat dihitung :

σX =

σ

n 14,14214 = 2 = 10

Ternyata berlaku :

μX = μ σX =

σ n

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ʹͲ

Persamaan di atas juga dapat berlaku untuk kasus pengambilan sampel tanpa pengembalian jika N cukup besar dibandingkan dengan n, dalam hal ini jika

n ≤ 5% . N b. Apabila

sampling

dilakukan

tanpa

pengembalian,

maka

diperoleh

§5· 5! ¨¨ ¸¸ = = 10 buah kemungkinan sampel, yaitu : 2 ( 5 2 ) ! 2 ! − © ¹ Caleg yang

Nilai

Rata-rata Nilai

terpilih

Intelegensi

Intelegensi

1

1;2

50 ; 60

55

2

1;3

50 ; 70

60

3

1;4

50 ; 80

65

4

1;5

50 ; 90

70

5

2;3

60 ; 70

65

6

2;4

60 ; 80

70

7

2;5

60 ; 90

75

8

3;4

70 ; 80

75

9

3;5

70 ; 90

80

10

4;5

80 ; 90

85

Sampel

Tabel di atas merupakan distribusi sampel untuk nilai intelegensi jika data yang diambil tanpa pengembalian. Terlihat dari tabel di atas bahwa terdapat data baru sebanyak 10 rata-rata. Distribusi dari rata-rata tersebut juga bisa disajikan ke dalam bentuk berikut :

Rata-rata

Frekuensi

P(X)

55

1

0,1

60

1

0,1

65

2

0,2

70

2

0,2

75

2

0,2

Nilai Intelegensi

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ʹͳ

80

1

0,1

85

1

0,1

Selanjutnya akan ditampilkan ke dalam bentuk grafik sebagai berikut : Intelegensi 2.5

2.0

1.5

Frequency

1.0

.5

Std. Dev = 9.13 Mean = 70.0 N = 10.00

0.0 55.0

60.0

65.0

70.0

75.0

80.0

85.0

Intelegensi

Dari kumpulan rata-rata di atas, diperoleh jumlah rata-rata = 490. Maka rata-rata untuk ke – 25 rata-rata ini adalah : 10

μX =

¦X

i

i =1

10 700 = 10 = 70

Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagai berikut : 10

σX = =

¦ (X

i = 25

i

− μX )2

10

(55 − 70) 2 + (60 − 70) 2 + (65 − 70) 2 + ... + (85 − 70) 2 10

750 10 = 8,66

=

Ternyata rata-rata populasi = 70 sama dengan rata-rata dari ke-10 rata-rata tersebut, tetapi memiliki simpangan baku yang berbeda. Dari populasi diperoleh Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ʹʹ

simpangan bakunya = 14,14214 sedangkan dari ke-7 rata-rata diperoleh simpangan baku = 8,66. Selanjutnya dapat dihitung :

σX =

σ n

N −n N −1

14,14214 5 − 2 5 −1 2 = 8,66 =

Ternyata berlaku :

μX = μ σX =

σ n

N −n N −1

Selanjutnya simpangan baku dari rata-rata tersebut, baik itu yang diambil dengan pengembalian ataupun tanpa pengtembalian, dinamakan simpangan baku ratarata atau galat baku rata-rata. Ukuran ini menunjukkan variasi rata-rata sampel sekitar rata-rata populasi ȝ.

I. 3. 2 Distribusi samplng Proporsi Sebagaimana pada distribusi sampling rata-rata, pemberian nama disrtribusi sampling proporsi atau disingkat distribusi proporsi ini dikarenakan tujuan dari penelitiannya adalah untuk menaksir proporsi suatu peristiwa dari populasi. Perhatikan Gambar I. 1, dimisalkan bahwa ukuran dari populasi adalah N dan ukuran sampel yang diambil adalah n. Apabila dari populasi tersebut terdapat Y buah peristiwa khusus yang akan diteliti, maka proporsi terjadinya peristiwa tersebut adalah :

π=

Y N

Selanjutnya berdasarkan sampel yang diambil, ternyata peristiwa khusus yang diperoleh ada sebanyak x buah, maka diperoleh statistik proporsi peristiwa tesebut adalah : p=

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

x n

ʹ͵

Oleh karena ada beberapa kemungkinan sampel yang akan terbentuk, maka untuk tiap-tiap sampel yang bersangkutan juga akan terdapat beberapa proporsi sampelnya.

Apabila proporsi ini diperlakukan sebagai data baru, maka akan

terbentuk suatu kumpulan data yang terdiri dari proporsi dari sampel-sampel. Sebagaimana pada distribusi rata-rata, dari kumpulan proporsi tersebut dicari ratarata dan simpangan bakunya, maka akan diperoleh rata-rata dari proporsi, disimbolkan dengan μ p dan simpangan baku dari proporsi, disimbolkan dengan

σ p . Ternyata, jika proses pengambilan sampel dilakukan tanpa pengembalian atau jika kondisi populasi memiliki ukuran yang tidak terlalu besar dibandingkan dengan data sampelnya, yaitu (n/N) > 5 %, maka :

μp = π π (1 − π )

σp =

n

N −n N −1

selanjutnya jika proses pengambilan sampel dilakukan dengan pengembalian atau kuran populasinya besar dibandingkan dengan ukuran sampel, yaitu (n/N) ≥ 5 %, maka :

μp = π σp =

π (1 − π ) n

I. 3. 3 Distribusi samplng Simpangan Baku Seperti halnya pada pembahahasan sebelumnya, maka dari populasi yang berukuran N yang kemudian diambil sampel beruikuran n, akan menghasilkan beberapa kemungkinan sampel. Selanjutnya dari semua sampel yang mungkin tersebut dicari simpangan bakunya, yaitu s, maka akan terdapat kumpulan dari simpangan baku. Dari kumpulan tersebut, dihitung rata-ratanya, ȝs dan simpangan bakunya, σs. Jika populasi berdistriobusi normal, atau mendekati normal, maka distribusi simpangan baku untuk n besar, biasanya n ≥ 100, sangat mendekati distribusio normal dengan :

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ʹͶ

μs = σ σs =

σ 2n

dengan σ merupakan simpangan baku populasi. Setelah

mengetahui sifat dari distribusi sampel, bukan berarti harus

melakukan pengambilan sampel secara berulang-ulang sebagaimana yang telah dijelaskan sebelumnya. Distribusi sampel yang telah dibicarakan tersebut merupakan dasar penting bagi sebuah dalil yang disebut dalil limit pusat. Dalil limit pusat tersebut menyatakan bahwa jika ada satu populasi dengan rata-rata ȝ, atau proporsi p, dengan simpangan baku (standar deviasi) σ yang besarnya terhingga, maka distribusi sampel berdasarkan pengambilan sampel n secara acak dan berulang-ulang memiliki beberapa sifat : 1. Rata-rata distribusi sampel untuk statistik θˆ akan sama dengan parameter populasi, θ . 2. Simpangan baku untuk parameter θ sampel akan sama dengan σ/√n . Ukuran ini juga dikenal sebagai standard error (SE). SE memegang peranan penting pada estimasi parameter dan uji statistik. 3. Jika distribusi nilai pada populasi normal, maka disribusi sampel juga normal. Tetapi yang lebih penting adalah jika distribusi nilai pada populasi tidak normal, dengan jumlah sampel yang “cukup” besar, maka distribusi sampel akan mendekati normal, tanpa tergantung dari distribusi nilai parameter populasi. Maka dengan asumsi besar sampel yang ”cukup”, distribusi sampel x dapat digambarkan sebagai berikut :

α/2

α/2

θ - Z σθ

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

θ

θ + Z σθ

ʹͷ

Pada gambar di atas menunjukkan menunjukkan sekian standar error dari rata-rata distribusi sampel. Nilai α merupakan taraf signifikansi yang menunjukkan derajat kekeliruan yang diberikan.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ʹ͸

TINJAUAN MATA KULIAH BAB II SAMPLING ACAK SEDERHANA II. 1 Pendahuluan Sampling acak sederhana merupakan bentuk yang paling dasar dari jenis sampling peluang yang memberikan dasar teori untuk proses sampling peluang lainnya yang lebih komplek. Sampling Acak Sederhana ini merupakan suatu proses memilih satuan sampling dari

populasi sedemikian rupa sehingga setiap satuan

sampling dalam populasi mempunyai peluang yang sama besar untuk terpilih ke dalam sampel dan peluang itu diketahui sebelum pemilihan dilakukan.Terdapat dua cara dalam pengambilan sampling acak sederhana ini, yaitu dengan pengembalian (with replacement), yang mana dalam proses ini adanya kemungkinan bahwa suatu unit akan terpilih lebih dari satu kali dan tanpa pengembalian (without replacement) yang mana semua unit yang terpilih tidak akan ada yang sama. Sampling Acak Sederhana dengan pengembalian

yang berukuran n dari

populasi yang berukuran N unit dapat digambarkan sebagai n buah sampel independen yang berukuran 1. Satu unit dipilih secara acak dari populasi menjadi unit sampel yang pertama, dengan peluang 1/N. Prosedur ini diulang sampai diperoleh sampel yang berukuran n unit, yang mana bisa terjadi duplikasi unit sampling. Pada populasi yang terbatas (finite population), suatu sampling yang memiliki penggandaan unit tersebut tidak akan memberikan tambahan informasi. Oleh karena itu, biasanya sampling tanpa pengembalian lebih disukai karena unit yang terpilih tidak akan terjadi duplikasi. Sebuah sampel acak sederhana tanpa pengembalian yang berukuran n dipilih sedemikian rupa sehingga setiap kemungkinan bagian dari n unit dalam populasi memiliki peluang yang sama untuk terpilih menjadi anggota sampel.

§N· Terdapat ¨¨ ¸¸ kemungkinan sampel yang akan terbentuk. Oleh karena itu, peluang ©n ¹ terpilihnya beberapa individu dalam suatu sampel S dari n unit adalah : P (S ) =

n ! (N − n )! 1 = N! §N · ¨¨ ¸¸ ©n ¹

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵Ͳ

Sebagai konsekuensi dari definisi ini, apabila dilakukan pemilihan dengan Sampling Acak Sederhana ke dalam sampel yang berukuran n, maka peluang sesuatu unit akan terpilih ke dalam sampel itu adalah

n . N

Proses sampling dengan Sampling Acak Sederhana digunakan apabila memenuhi beberapa kondisi sebagai berikut : 1.

Variabel yang akan diteliti keadaannya relatif homogen dan tersebar merata di seluruh populasi.

2.

Apabila bisa disusun secara lengkap kerangka sampling yang menyangkut setiap satuan pengamatan yang ada dalam populasi.

II. 2 Keuntungan dan Kerugian Sampling Acak Sederhana Keuntungan dari digunakannya Simple Random Sampling adalah memiliki bentuk-bentuk rumus yang sederhana, tidak memerlukan pembobotan, dan semua rmus statistika bisa digunakan. Kerugiannya : 1.

Ada kemungkinan bahwa sekalipun menggunakan randomisasi, satuan sampling yang terpilih tidak tersebar merata atau randomisasi tidak menjamin 100% bahwa pemilihan keadaannya menyebar merata.

2.

Apabila ukuran populasi besar dan ukuran sampel besar maka pemilihan secara simple random sampling secara manual menyulitkan.

II. 3 Proses Memilih Melalui Sampling Acak Sederhana Dalam pemilihan unit sampling melalui sampling Acak Sederhana, diperlukan adanya kerangka sampling yang tersusun secara lengkap. Setiap satuan sampling dalam kerangka sampling tersebut diberi nomor urut dan banyaknya angka dalam nomor-nomor tersebut sama untuk setiap satuan sampling. Langkah: 1. Tentukan secara tegas Populasi sasaran misal : Masyarakat di daerah A 2. Buat Kerangka sampling

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵ͳ

No

Nama

Alamat

001

Awal

Jl. Merkuri Raya 23

002

Arya

Jl. Jakarta 24

Ending

Jl. Cikaso 23

. . . 262 3. Tentukan ukuran sampel n misal n=20 4. Lakukan proses pengambilan sampel Apabila suatu target populasi telah ditentukan secara tegas dan dari populasi ini akan disusun sebuah sampel melalui (SRS), maka selanjutnya harus dilakukan proses pemilihan dari anggota sampelnya. Adapun proses memilih dalam Samping Acak Sederhana banyak sekali caranya. Dalam buku ini hanya akan dibahas tiga cara yang sering dilakukan, yaitu : 1. Simple Randomization (SR) / Pengacakan Secara Sederhana 2. Randomization Based on Remainder 3. Randomization Based on Permutation

II. 3. 1 Simple Randomization (SR) / Pengacakan Secara Sederhana Langkah-langkah yang harus dilakukan dalam pengambilan sampel melalui Simple Randomization : 1. Tentukan populasi penelitian secara tegas study population (populassi sasaran dan populasi penelitian), yang sebaiknya sama dengna populasi sasaran 2. Tentukan secara tegas ukuran populasi 3. Tentukan bentuk satuan sampling dan susun kerangka sampling yang lengkap 4. Tentukan ukuran sampel berdasarkan perhitungan tertentu. Ukuran sampel tersebut bisa ditentukan atas dasar statistis (statistical aspects) maupun nonstatistis (nonstatistical aspects) Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵ʹ

5. Sediakan tabel angka random 6. Proses memilih : a. Secara sembarang jatuhkan suatu benda ke atas tabel bilangan random dan perhatikan angka berapa yang tertuju oleh benda tersebut b. Satuan sampling selanjutnya diperoleh dengan cara membaca tabel angka random ke bawah menurut kolom yang sesuai. Kalau masih belum cukup, baca ke atas. Catatan: 1. Simple Randomization adalah randomisasi yang palling sederhana, tetapi banyak menghamburkan bilangan random. 2. Dala praktik, survai yang populasi sasarannya besar, Simpel Randomization tidak dilakukan secara manual tetapi menggunakan komputer. 3. Semua angka random yang lebih besar dari N dilewat, angka randoom yang sudah dipilih tidak dipilih lagi 4. Bilangan-bilangan random yang sudah dipakai , baik terpilih maupun tidak, tidak boleh dipilih lagi dalam suatu proses pemilihan. Oleh karena itu sangat disarankan agar pada saat menggunakan tabel angka random peneliti benarbenar memperhatikan angka random mana yang sudah dipakai, dan sampai mana peneliti terakhir menggunakan angka random. 5. Proses pemilihan seperti ini disebut Simple Random Sampling dan secara matematis proses ini menjamin bahwa setiap satuan pengamatan dalam populasi mempunyai kesempatan yang sama (peluang yang sama) untuk terpilih yaitu peluang terpilih: n/N. Untuk tidak menghamburkan bilangan random kita bisa menggunakan Simple Random Sampling melalui pendekatan lain.

II. 3. 2 Randomization Based on Remainder (Pengacakan berdasarkan pada sisa hasil pembagian) Untuk menghemat bilangan random kita melakukan randomisasi atas dasar sisa hasil pmbagian Langkah kerja : 1. Tentukan populasi sassaran dan satuan samplingnya Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵͵

2. Susun kerangka sampling 3. Tentukan ukuran sampel 4. Sediakan tabel angka random, dari tabel ini kita mulai pada baris ke-1 kolom ke-1. Sebagai catatan bahwa langkah tersebut dilakukan apabila yakin betul bahwa tidak ada orang lain yang akan menggunakan kerangkan sampling yang sama dengan tabel angka random yang sama pula. 5. Sebelum proses pemilihan dimulai, harus ditentukan secara tegas bilangan random mana saja yang tidak boleh dipakai. Untuk keperluan ini kita susun interval-interval Catatan : 1. apabila diperoleh sisi pembagian bernilai nol, maka artinya adalah satuan sampling yang terpilih adalah nomor yang terbesar. 2. Perhatikan bahwa yang dimaksud dengan sisa pembagian adalah sisa pembagian dari bilangan random yang terpilih dengan penyebut N 3. Satuan sampling yang sudah terpilih (sisa pembagian yang sudah terpilih) tidak boleh dipakai lagi

II. 3. 3 Randomization Based on Permutations Dalam penelitian eksperimental seringkali peneliti harus membagi sekelompok satuan sampling ke dalam beberapa kelompok secara acak sesuai dengan perlakuan (treatment) yang akan dipakai. Pengacakan yang paling baik dalam hal ini adalah pengacakan dengan menggunakan bilangan yang dipermutasikan (diubah-ubah) secara acak, misalnya; 234, 243, 342, 324, 432, dan 423. Susun bilangan yang telah dipermutasikan tersebut ke dalam sebuah tabel. Pilih secara acak baris ke berapa yang akan dipakai dari tabel tersebut yang kemudian tabel ini harus dibacakan dari kiri ke kanan untuk menentukan bilangan acak yang terpilih sebagai nomor untuk satuan sampling.

II. 4 Bentuk-bentuk Estimasi Sebagaimana yang telah diuraikan sebelumnya bahwa dalam proses inferensial, terdapat dua kegiatan statistik, yaitu penaksiran parameter dan pengujian

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵Ͷ

hipotesis. Adapun pembahasan yang akan diuraikan selanjutnya adalah mengenai penaksiran parameter.

II. 4. 1 Estomator untuk rata-rata populasi ( μ x ) dan standar errornya ( σ (X ) ) Dalil : Apabila sebuah populasi berukuran N kita embentuk sebuah sampel berukuran n melalui Sampling Acak Sederhana dan dari sampel tersebut diukur variat X yang mempunyai tingkat pengukuran interval/rasio dengan hasil pengukuran x1, x2, …, xn, maka : 1. Estomatior tak bias untuk rata-rata populasi X=

μx

adalah :

1 ¦ xi n

2. Estimator untuk standar error σ (X ) adalah 2 §N −n·s σˆ (X ) = ¨ ¸ © N ¹ n

;

2

s =

n

¦ x − (¦ x ) 2 i

n (n − 1)

2

i

Apabila dari sebuah sampel berukuran n yang dipilih melalui Sampling Acak Sederhana, kita bisa menghitung σˆ (X ) , maka Bound of Error untuk rata-rata μ didefinisikan sebagai : BE = δ = t§

α · ¨ 1− ; n −1 ¸ © 2 ¹

σˆ (X )

secara teori, Bound of Error tersebut menyatakan kekeliruan terbesar yang mungkin terjadi dengan derajat kepercayaan ( 1 - α ) 100%. Secara fisik, Bound of Error adalah setengah lebar taksiran.

II. 4. 3 Estomator untuk proporsi (persentase) dan standar errornya Secara statistis kalo kita berbicara persentase, sebenarnya kita berbicara proporsi (belum dikalikan 100%). Oleh karena itu dalam statistika, analisis mengenai persentasse dilakukan atas dasar proporsi.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵ͷ

Dalil : Apabila dari sebuah populasi berukuran nN, kita membentuk sampel berukuran n melalui sampling Acak sederhana, kemudian dari sampel tersebut kita men variabel X yang sifatnya (tingkat pengukurannya) nominal dichotomus dengan harga pengukuran : xi = 1 jika satuan sampling bersifat A xi = 0 jika satuan sampling bukan bersifat A maka eestimator takbias untuk proporsi A dalam populasi didefinisikan sebagai : 1) estomator takbias untuk proporsi p=

1 ¦ xi ; x i = 1 jika A n x i = 0 jika B

2) estimator bias untuk standar error dari p adalah :

σˆ ( p ) =

§ N − n · p (1 − p ) ¨ ¸ © N ¹ n −1

Sebagai catatan bahwa dalam praktik survay yang menyangkut penaksiran parameter,ada sebuah perjanjian tak tertulis yang sifatnya optional, yaitu apabila sampling fraction < 0,05 maka finite population fraction (fpc) dianggap 1. Ini artinya dalam rumus standar Error tidak dimasukkan Fpc. Dalam hal inni diambil suatu ketentuan berapa pun sampling fraction, Fpc akan tetap digunakan, sebab sekalipuun n/N < o,o5apabila hasil pengukuran variabel X adalah bilangan-bilangan kecil, Fpc besar pengaruhnya.

II. 5 Menentukan Ukuran Sampel Setelah peneliti menentukan tujuan dari penelitiannya, maka selanjutnya perlu diambil keputusan apakah akan dilakukan sensus atau sampling. Apabila proses yang akan dilaksanakannya adalah sampling, maka diperlukan adanya suatu ketegasan berapa ukuran sampel minimal yang sebaiknya diambil. Ukuran sampel ini akan memberi isyarat mengenai managability of the research (kelayakan penenlitian). Ada dua dasar pemikiran dalam menentukan ukuran sampel, yaitu ditentukan atas dasar oemikiran statistis, dan atau ditentukan atas dasar pemikikran nonstatistis.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵͸

II. 5. 1 Menentukan Ukuran Sampel Atas Dasar Pemikiran Non Statistis Apabila dipandang dari sudut nonstatisti, ukran sampel ditentukan oleh beberapa faktor, yaitu : a. Ditentukan oleh waktu (time constraint / kendala waktu) b. Ditentukan oleh biaya c. Ditentukan oleh ketersediaan satuan sampling, akan lebih terasa di bidang kedokteran

II. 5. 2 Menentukan Ukuran Sampel Atas Dasar Pemikiran Statistis Ditinjau dari aspek statistis, ukuran sampel ditentukan oleh banyak faktor, yaitu : a. Ukuran sampel ditentukan oleh bentuk parameter yang menjadi tolok ukur analisis, dalam arti apakah kesimpulan yang akan kita ambil dasarnya rata-rata ( μ ), apakah persentase ( π ), atau yang lainnya. Masalah bentuk parameter uini erat kaitannya dengan tingkat pengukuran variabel yang kita hadapi, apakah tingkat penggukurannya nominal, ordinal, interval, atau rasio. b. Ukuran sampel ditentukan oleh tipe sampling yang digunakan, apakah sampling peluang (Sampling Acak Sederhana, Sampling Sistematis, Sampling Acak Stratifikasi, dan Sampling Klaster) atau sampling Nonpeluang. c. Ukuran sampel ditentukan pula oleh tujuan penelitian, apakah bertujuan untuk menaksir parameter atau menguji hipotesis. d. Ukuran

sampel

ditentukan

oleh

sifat

penelitian,

apakah

sifatnya

nonkomparatif atau komparatif. e. Ukuran sampel ditentukan oleh variabilitas variabel (keseragaman variabel) yang diteliti, makin tidak seragam variabel yang diteliti, makin besar ukuran sampel minimal yang harus diambil. f. Apabila tujuan penelitian semata-mata hanya membuat taksiran parameter, maka ukuran sampel ditentukan oleh bound of error penaksiran dan derajat

kepercayaan yang dikehendaki ( α ). Sedanghkan apabila tujuan penelitian menenguji hipotesis, maka ukuran sampel ditentukan oleh berapa selisih

terkecil yang harus dinyatakan secara signifikan, tergantung pula pada level of significant ( α ) dan kuasa uji (1-β)

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵͹

II. 5. 2. 1 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya Menaksir Rata - rata Langkah kerja yang harus dilakukannya adalah sebagai berikut : a. Tentukan dengan tegas bahwa tujuan penelitiannya adalah menaksir rata-rata populasi ( μ ) b. Tentukan dengan tegas berapa derajat kepercayaan yang akan dipakai (pada umumnya statistik klasik menggunakan derajat kepercayaan 95 % atau 90 %) c. Tentukan bound of error penaksiran d. Gunakan persamaan :

§z S· n0 = ¨ α / 2 ¸ © δ ¹

n=

2

n0 n 1+ 0 n

Keterangan : S : Simpangan baku untuk variabel yang diteliti dalam populasi δ : Bound of error yang bisa ditolelir / dikehendaki

Z (1−α ) : Konstanta bilangan yang diperoleh dari tabel normal baku 2 Rumus di atas mengandung parameter S yang dalam praktik jarang sekali diketahui, sebab S hanya diketahui apabila dilakukan sensus. Dalam kenyataannya, S bisa diperoleh melalui cara-cara sebagai berikut : a. Diperoleh dari hasil penelitian orang lain mengenai variabel yang sama atau serupa yang sudah diterima secara akademik b. Pendapat para pakar mengenai variabel yang sedang diteliti c. Lakukan penelitian penjajagan (pilot survey) d. Dengan menggunakan Deming’s Empirical Rule. Menurut Deming, ada hubungan antara besarnya simpangan baku dengan besarnya rentang (selisih data terbesar dengan data terkecilnya). Aturan Deming :

-

Jika variabel X adalah variabel dengan tingkat pengukuran interval atau rasio mnegikuti distribusi yang bentuk kurvanya miring, baik

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵ͺ

miring ke kiri maupun miring ke kanan, maka hubungan antara simpangan baku dengan rentang adalah : S ≈ 0,25 R

Kurva di atas menunjukkan kurva

Kurva menunjukkan kurva negatif, yang

positif yang menggambarkan bahwa

menggambarkan bahwa nilai-nilai yang

nilai-nilai

kecil cenderunng lebih sedikit daripada

yang

kecil

cenderung

banyak, kemudian nilai yang besar

nilai-nilai yang besar.

cenderung sedikit.

Sebagai contohnya adalah pengunjung

Sebagai contohnya adalah aktifitas di

pada café-café tenda. Pada pagi hari

pasar. Pada pukul 05.00 – 10.00 yang

nyaris tidak ada pengunjung. Tetapi di

belanja cenderung banyak, sedangkan

sore

semakin siang semakin sedikit, bahkan

berdatangan. Bahkan pada malam hari

yang belanja mulai sepi.

terjadi

penumpukkan

hingga

terjadi

hari,

menjelang

pengunjung

pukul

mulai

pengunjung

antrian. 24.00

Kemudian ke

atas

pengunjung menjadi sepi lagi

-

Apabila X mengikuti distribusi yang bentuk kurvanya normal, maka hubungan antara simpangan baku dengan rentang adalah: S ≈ 0,24 R

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͵ͻ

-

Jika X mengikuti distribusi yang kurvanya uniform, maka hubungan antara simpangan baku dengan rentangnya adalah: S ≈ 0,29 R

Nilai S yang diperoleh dari hasil penelitian orang lain bukanlah merupakan simpangan baku populasi, melainkan simpangna baku yang diperoleh dari sampel yaitu s. Tetapi karena penelitian tersebut sudah diterima orang, maka s dianggap menjadi S. Ada kemungkinan bahwa hasil penelitian mengenai vaiabel serupa memberikan s yang berbeda. Dalam keadaan yang seperti ini diambil n yang terbesar. Dalam praktik, ukuran sampel bisa pula dilakukan berdasarkan nilai-nilai yang diambil dari ukuran sampel sebesar n. Selanjutnya digunakan Freund’s Iterative Method, sebagai berikut : 1. Tentukan n0 dengan persamaan berikut :

§Z S· no = ¨ α / 2 ¸ © δ ¹

2

2. Substitusikan no ke dalam persamaan :

§ tα / 2 (no −1) S · ¸¸ n1 = ¨¨ δ © ¹

2

3. Substitusikan n1 ke dalam persamaan :

§ tα / 2 (n1 −1) S · ¸¸ n2 = ¨¨ δ © ¹

2

4. Substitusikan hasil dari langkah ketiga pada persamaan langkah ketiga itu sendiri. Langkah dihentikan apabila hasil yang diperoleh sama atau hampir sama dengan langkah yang telah dilakukan sebelumnya. Diperolehlah nilai minimum dari ukuran sampel berdasarkan nilai akhir dari iterasi.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͶͲ

Contoh Soal : Seorang peneliti ingin mengetahui sejauh mana tingkat sadar hukum masyarakat di daerah A. Untuk itu ia perlu mengambil sampel masyarakat. Apabila ia menginginkan derajat keyakinan 95% bahwa kalaupun ada perbedaan rata rata tingkat kesadaran hukum antara hasil sampel dengan rata rata keseluruhan, perbedaan tersebut jangan lebih dari 5. Maka, bila Jumlah penduduk dewasa masyarakat daerah A =500.000, ukuran sampel yang diperlukan adalah:

§z S· n0 = ¨ α / 2 ¸ © δ ¹

2

2

§ 1.96(3.84) · n0 = ¨ ¸ = 226.586 ≈ 227 5 © ¹

n=

n0 227 = 226.89 ≈ 227 = n0 227 1+ 1+ 500.000 n

catatan: Skor minimal :40 Skor maksimal : 200 R =160 Diketahui bahwa distribusi skor simetri. Maka S=(0.24)160= 38.4

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

Ͷͳ

II.5.2.2

Menentukan

Ukuran

Sample

Apabila

Tujuan

Penelitiannya

Menaksir Persentase (Proporsi) Secara statistis, persentase itu dinyatakan dalam proporsi. Oleh karena itu, menaksir persentase sama dengan menaksir proporsi. Untuk menentukan ukuran sampel dengan tujuan penaksiran persentase, dapat dihitung dengan persamaan berikut : a.

Jika sebelumnya ada keterangan sekunder mengenai dugaan harga proporsi , maka rumusnya :

§ zα / 2 π 0 (1 −π 0 ) · ¸ n0 = ¨ ¨ ¸ δ © ¹

n=

2

n0 n −1 1+ 0 N

Jika belum ada keterangan sekunder mengenai dugaan π0, maka

b.

disarankan dipakai π0 = 0,5 sehingga rumusnya menjadi : §z · n0 = ¨ α / 2 ¸ © 2δ ¹

n=

2

n0 n −1 1+ 0 N

Rumus ini adalah rumus ukuran sampel minimal yang terbesar , sebab perkalian π0 (1 - π0) akan merupakan perkalian terbesar nilainya jika dan hanya jika π0 = 0,5 Contoh: Seseorang ingin mendapat keterangan berapa persen di suatu daerah yang tergolong pengangguran, bila derajat keyakinan dipilih 99% dengan bound of error 5%. Diketahui bahwa banyaknya masyarakat di daerah tersebut adalah 12.000 2

2

§ z · § 2.575 · n0 = ¨ α / 2 ¸ = ¨ ¸ ≈ 664 © 2δ ¹ © 2 × 0.05 ¹ Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

Ͷʹ

n=

n0 664 = = 629.13 ≈ 630 n0 − 1 664 − 1 1+ 1+ 12.000 n

II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya

Adalah

Melakukan Pengujian Hipotesis A. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis mengenai perbedaan rata rata dengan sampel independen Gunakan rumus berikut

(Z n=

1−α

+ Z1− β ) 2 S 2 2

∂2

untuk α dan β yang ditentukan S adalah simpangan baku dari variabel yang diteliti, dimana diasumsikan bahwa simpangan baku ini sama untuk kedua populasi. δ menyatakan perbedaan rata rata yang menurut teori /tujuan penelitian dianggap bermakna Contoh: Andaikan dalam suatu penelitian ingin diuji suatu hipotesis yang mengatakan bahwa kinerja perusahaan BUMN lebih tinggi dibandingkan dengan non BUMN. Untuk itu penelitian dilakukan. Yang menjadi unit sampling dalam penelitian ini adalah perusahaan bak BUMN maupun non BUMN. Masalahnya berapa perusahaan yang harus dijadikan sampel bila pengujian ingin mengambil resiko α dan β sebesar masing masing 0.05. Bila menurut teori perbedaan skor rata rata kinerja antara perusahan BUMN dan Non BUMN sebesar 10 dianggap bermakna dan menurut pengalaman skor terendah dari kinerja adalah 30 serta tertingi 150, maka kran sampel yang diperlukan adalah:

(Z n=

1−α

+ Z1− β ) 2 S 2 2

∂2

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

=

(1.645 + 1.645)2 2S 2 10 2

Ͷ͵

dengan aturan Deming, maka S = 0.24 × R = 0.24 × (150 − 30) = 28.8 S Sehingga

(1.645 + 1.645)2 2(28.8)2 10 2

= 179.55 ≈ 180

Jadi dperlukan paling sedikit masing 180 perusahaan BUMN dan non BUMN. B. Menentukan ukuran sampel ila penelitian bertujuan untuk menguji hipotesis mengenai perbedaan rata rata dengan sampel berpasangan Gunakan rumus berikut

(Z n=

1−α

Sd

+ Z1− β ) S d 2

2

∂2

adalah simpangan baku dari perbedaaan skor populasi pertama dengan

populasi ke dua. δ menyatakan

perbedaan rata rata yang menurut teori /tujuan penelitian

dianggap bermakna C. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis tentang kebermaknaan korelasi Untuk menentukan ukuran sampel yang dperlukan digunakan pendekatan berikut: Ukuran sampel ditentukan secara iterasi dengan cara berikut. Tentukan ukuran sampel melalui rumusan : Pada iterasi pertama, u p ditentukan melalui persamaan berikut

§1+ ρ · ¸¸ u p = 1 log¨¨ 2 ©1− ρ ¹ di mana ρ menyatakan perkiraan korelasi yang terjadi antara variabel X dan Y. Untuk iterasi selanjutnya gunakan

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͶͶ

§1+ ρ · ρ ¸¸ + u p = 1 log¨¨ 2 © 1 − ρ ¹ 2(n − 1) demikian seterusnya sampai diperoleh nilai n yang stabil (konvergen). Untuk berbagai nilai α dan β serta nilai ρ, Machin and Campbel telah membuat tabel ukuran sampel sehingga memudahkan untuk digunakan. (lihat lampiran 1.) D. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis tentang kebermaknaan R 2 dalam analisis regresi Bila tujuannya untuk menguji kebermaknaan R 2 dalam analisis regresi,maka ukuran sampel ditentukan melalui rumus:

n= dimana f 2 =

L + k +1 f2

R2 1 − R2

k = banyaknya variabel bebas L diperoleh dari tabel (lampiran 2) untuk α dan β yang ditentukan

R 2 adalah koefisien determinasi terkecil yang besarnya

diperkirakan baik

berdasarkan teori maupun pra survai.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

Ͷͷ

TINJAUAN MATA KULIAH BAB III SAMPLING SISTEMATIS III. 1 Pendahuluan Sebuah sampel yang diperoleh dari penyeleksian satu unsur secara acak dari k unsur yang pertama dalam sebuah kerangka sampling dan setiap unsur ke-k kemudian disebut satu dalam k sampel sistematik. Jadi, suatu proses memilih dikatakan sampling sistematik apabila dalam pemilihan itu dilakukan pemilihan sistematik setelah terpilih bilangan acak, dengan syarat bahwa peluang terpilihnya 1 N . Sampling sistematik digunakan apabila : 1. Bisa disusun kerangka sampling yang lengkap 2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata di seluruh populasi Sampling Sistematik memberikan sebuat alternatif yang berguna dari Sampling Acak Sederhana untuk alasan sebagai berikut : 1. Sampling Sistematik lebih mudah untuk dilakukan dan oleh sebab itu lebih sedikit subjek yang melakukan kesalahan wawancara daripada Sampling Acak Sederhana. 2. Sampling Sistematik sering memberikan informasi yang lebih banyak mengenai biaya per unit/satuan daripada yang diberikan

Sampling Acak

Sederhana. Pada umunya Sampling Sistematik merupakan penyeleksian secara acak pada suatu unsur dari k unsur yang pertama dan kemudian penyeleksian pada setiap unsur k sesudahnya. Prosedur ini lebih mudah dibentuk dan biasanya akan meminimalisir kesalahan yang mungkin dilakukan oleh pewawancara daripada dalam proses Sampling Acak Sederhana. Sebagai contohnya, akan menjadi lebih sulit apabila menggunakan Sampling Acak Sederhana untuk menyeksi n = 50 orang pembeli pada sebuah sudut jalan kota. Pewawancara tidak menentukan pembeli-pembeli mana yang termasuk dalam sampelnya, karena ia tidak memiliki sampling framenya serta tidak

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

Ͷͻ

mengetahui ukuran populasi ,N . Sebagai solusinya, ia dapat mengambil sampel secara sistematik (katakanlah 1 dari 20 pembeli) hingga persyaratan sampelnya bisa didapatkan. Ini akan menjadi sebuah prosedur yang mudah bahkan untuk pewawancara yang tidak berpengalaman sekalipun dapat melakukannya. Selain itu, lebih mudah untuk dilakukan dan lebih sedikit terjadinya kesalahan dalam wawancara terhadap subjeknya. Sampling Sistematik sering memberikan informasi yang lebih banyak per unit biaya daripada Sampling Acak Sederhana. Sampling sistematik seringkali menyebar lebih seragam pada seluruh sendi populasi sehingga dapat menghasilkan informasi yang lebih banyak mengenai populasinya daripada

data-data

yang

diperoleh

dengan

Sampling

Acak

Sederhana.

Pertimbangkan contoh berikut : Kita akan memilih salah satu dari 5 sampel secara sistematik dari vouicher perjalanan sekumpulan data sebanyak N = 1000. (yaitu, n = 200 voucher) untuk menghitung proporsi dari voucher yang dicatat secara tidak benar. Satu voucher menggambarkan proses acak dari 5 voucher yang pertama (sebagai contohnya 3 ) dan setiap voucher sesudahnya menjadsi anggota sampel. voucher

Voucher yang menjadi sampel

1 2 3

3

4 5 6 7 8

8

9 10 …… 996 997 998

998

999 1000

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷͲ

Dimisalkan bahwa kebanyakan dari 500 voucher pertama telah diisi dengan benar, tapi berkaitan dengan perubahan yang dialami oleh juru tulis, 500 voucher kedua akan memiliki kesalahan yang banyak. Apabila proses sampling yang digunakan adalah dengan Sampling Acak Sederhana, maka secara kebetulan bisa terpilih kebanyakan (mungkin semua) dari 200 voucher adalah berasal dari salah satunya, baik itu pada bagian kelompok pertama maupun yang kedua dan sebab itu taksiran untuk p menjadi kurang sesuai Sebaliknya, Sampling Sistematik akan memilih jumlah yang sama dari voucher pada kedua kelompok tersebut dan akan memberikan taksiran yang akurat .

III. 2 Bagaimana Menggambarkan Sampling Sistematik Walaupun Sampel Acak Sederhana maupun Sampel Sistematik keduanya memberikan alternativ yang berguna satu sama lainnya, metode dari pemilihan data sampelnya berbeda. Suatu Sampel Acak Sederhana dari populasi dipilih dengan menggunakan tabel bilangan acak. Akan tetapi metode-metode yang bervariasi dapat digunakan dalam Sampling Sistematik. Peneliti dapat memilih 1 dari 3, 1 dari 5, atau secara umum, 1 dari k sampel sisitematis. Untuk mendapatkan suatu sampel sistematis berukuran n dari sebuah populasi yang berukuran N, harus ditentukan k sistematis yang kurang atau sama dengan n/N. k tidak bisa dipilih secara tepat apabila ukuran populasi tidak diketahui. Meskikpun dapat ditentukan ukuran sampel secara pendekatan, namun harus memperkirakan nilai k yang dibutuhkan untuk mencapai ukuran sampel (n). Jika nilai k yang dipilih terlalu besar, ukuran sampel (n) yang diharuskan tidak akan diperoleh dengan menggunakan 1-dalam-k sampel sistematis dari populasinya. Hal ini tidak akan menjadi masalah jika peneliti dapat menguanginya dan membuat 1-dalam-k sistematik sampling lainnya hingga ukuran sampel yang telah ditentukan terpenuhi. Namun demikian, dalam beberapa situasi tidak mungkin untuk memulai sampling sistematis yang kedua.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷͳ

III. 3 Keuntungan Sampling Sistematik Dibandingkan dengan sampling acak sederhana, sampling sisitematik mempunyai kelebihan, yaitu : 1. standard Error yang didasarkan pada sampling sisitematik paling sedikit sama presisinya dengan sampling acak sederhana 2. Mudah dilakukan 3. Pada keadaan tertentu, sampling sistematik bisa dilakukan sekalipun tidak ada kerangka sampling.

III. 4 Kerugian Sampling Sistematik Sampling sistematik bisa sangat merugikan apabila dalam kerangka sampling terdapat periodisitas, teruitama periodisitas yang berhimpit / overlap dengan interval pemilihan. Sebagai contohnya adalah suatu penelitian yang akan dilakukan mengenai tingkat kepuasan tamu hotel terhadap prosedur

pelayanan

di

hotel

tersebut.

Sampling frame yang digunakanya adalah daftar tamu yang hadir pada saat itu. Berdasarkan tujuan kedatangannya, tamu hotel dibagi menjadi convention, bisnis,

weekend, liburan, government dan pelatihan. Celakanya , ternyata berdasarkan sampling sistematik ternyata dalam kerangka sampling ada periodisitas yang overlap dengan interval pemilihan, misalnya terus menrus terpilih tamu bisnis. Sehingga pada akhirnya kurang bisa mencerminkan bagaiman tibgkat kepuasan keseluruhan tamu yang ada.

III. 5 Menaksir Rata-rata Populasi dan Total Sebagaimana yang telah berulangkali ditekankan bahwa maksud dari kebanyakan suatu survey adalah menaksir satu atau lebih parameter dari populasi.. Taksiran untuk rata-rata populasi , μ, dari sampel sistematik menggunakan rata-rata sampel, x sebagai berikut :

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷʹ

Penaksir Rata-rata Populasi, μ : n

μ = x sy =

¦x

i

i =1

( 3.1 )

n

Varians taksiran untuk x sy : 2

§ N −n · s Vˆ (x sy ) = ¨ ¸ © N ¹ n

(3.2)

Bound of Error taksiran tersebut :

δ = Zα

2

Vˆ (x sy ) = Z α

2

2 §N −n·s ¨ ¸ © N ¹ n

(3.3)

Jika N tidak diketahui maka fpc, ( N – n ) / N pada persamaan (3.2) dan (3.3) dibuang. Ternyata bahwa taksiran varians dari x sy yang ada pada persamaan (3.2) identik dengan taksiran varians untuk x yang dperoleh dengan menggunakan Sampling acak Sederhana. Hal ini tidak menyiratkan bahwa varians populasi yang bersangkutan sama. Varians dari x diperoleh dari persamaan :

§ N −n ·σ 2 ˆ ¸¸ V (x ) = ¨¨ © N −1 ¹ n Demikian juga varians dari x sy dapat dituliskan : V (x sy ) =

σ2 n

{1 + (n − 1) ρ }

dimana ρ adalah koefisien korelasi antara observasi dalam sampel sisitematik yang sama. Ketika N besar, kedua varians tersebut sama jika observasi dalam sebuah sampel yang ditetapkan tidak berkorelasi (ρ ≈ 0). Sebuah taksiran yang tak bias dari V (x sy ) tidak dapat diperoleh dengan menggunakan data hanya dari satu sampel sistematik. Hal ini tidak berarti bahwa suatu taksiran dari V (x sy ) tidak pernah bisa diperoleh. Untuk populasi tertentu, ampling sistematik ekivalen dengan sampling acak sederhana, dan kita dapat

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷ͵

mengambil V (x sy ) yang hampir sama dengan taksiran varians dari x berdasarkan pada samping acak sederhana. Untuk populasi yang mana hubungan ini terjadi? Untuk menjawab pertanyaan tersebut kita harus mempertimbangkan tiga tipe populasi sebagai berikut : 1. Populasi Acak (Random Population) 2. Populasi Terurut (Ordered Populastion) 3. Populasi Berkala (Periodic Population)

III. 5. 1 Populasi acak Definisi : Suatu populasi dikatakan acak apabila elemen-elemen dari populasi tersebut berada dalam urutan yang acak. Elemen-elemen dari sampel sistematik yang diambil dari populasi yang acak diaharapkan akan heterogen dengan ρ mendekati nol. Dengan demikian, ketika N besar, varians dari x sy kira-kira sama dengan varians dari x yang berdasarkan pada sampling acak sederhana, sampling sistematis

dalam kasus ini ekivalen dengan

sangling acak sederhana. Sebagai contohnya, seorang peneliti ingin menentukan ratarata jumlah dari yang ditulis oleh dokter tertentu selama tahun sebelumnya.. Jika frame (kerangka) mengandung daftar dokter-dokter, cukup beralasan untuk mengasumsikan bahwa nama-nama pada daftrar tersebut tidak berhubungan dengan banyaknya resep yang ditulis untuk obat tertentu. Oleh karena itu, kita pertimbangkan bahwa populasinya acak. Suatu sampel sistematik akan ekivelan dengan sampel acak sederhana untuk kasus tersebut.

III. 5. 2 Populasi Terurut Suatu populasi dikatakan terurut apabila elemen-elemen dalam populasi terurut dalam dalam jarak sesuai dengan pola tertentu Dalam sebuah survey untuk menaksir efektivitas dari instruksi dalam suatu kursus yang besar, pelajar diminta untuk mengevaluasi instrukutur mereka berdasarkan skala numerik.. sebuah sampel kemudian diambil dari daftar evaluasi yang disusun dalam urutan numerik yang menaik. Populasi dari pengukuran dimana data sampel diambil dianggap sebuah populasi yag terurut. Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷͶ

Suatu sampel sistematik yag diambil dari populasi yang terurut pada umumny abersifat heterogen dengan ρ ≤ 0, V (x sy ) ≤ V (x )

Dengan demikian, sebuah sampel sisitematik dari populasi terurut memberikan indformasi yang lebih banyak per unit biayanya daripada sampel acak sederhana, karena varians dari x sy yang diperoleh lebih kecil daripada varians dari x . Jika tidak diperoleh taksiran V (x sy ) dari data sampel, suatu taksiran konservatif untuk V (x sy ) dapat digunakan :

s2 § N − n · Vˆ (x sy ) = ¨ ¸ n © N ¹

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷͷ

TINJAUAN MATA KULIAH BAB IV SAMPLING ACAK BERSTRATA IV. 1 Pendahuluan Salah satu metoda pengambilan sampel lain disamping Sampling Acak Sederhana adalah Sampling Acak Bestrata. Sampling ini dilakukan apabila dalam keadaan tertentu Sampling Acak Sederhana kurang baik untuk digunakan karena akan memberikan presisi suatu taksiran yang rendah. Untuk itu kita perhatikan kasus yang berikut. Misalkan di suatu daerah, pendapatan masyarakat bersifat heterogen, yakni ada yang tergolong “tinggi, menengah, atau rendah”, dan melalui Sampling Acak Sederhana akan diambil sampel dalam usaha

menaksir rata-rata pendapatan

masyarakat tersebut, maka ada kemungkinan yang terambil ke dalam sampel walaupun dilakukan secara acak, kebanyakan atau hanyalah mereka yang tergolong berpenghasilan rendah. Bila rata-rata pendapatan dihitung dari sampel ini, maka ratarata tadi akan merupakan taksiran yang rendah (under estimate). Telah diketahui bahwa metoda pengambilan sampel yang dilakukan dalam rangka menaksir parameter populasi adalah metode yang dapat memberikan presisi suatu taksiran yang tinggi. Diketahui pula bahwa presisi suatu taksiran diukur oleh galat baku dari taksiran tersebut. Dari rumus galat baku-galat baku yang sudah kita kenal, dalam Sampling Acak Sederhana, Tampak bahwa besar kecilnya galat baku antara lain bergantung

pada ukuran sampel. Makin besar ukuran sampel

menyebabkan makin kecilnya galat baku suatu penaksir, yang juga berarti semakin tinggi presisi penaksir tersebut. Selain itu, variasi data, yang diukur oleh S2, juga bisa menentukan besarnya galat baku. Dari rumus galat baku rata-rata misalnya, tampak bahwa makin besar harga S2 (artinya karakteristik populasi heterogen) akan juga menyebabkan makin besarnya galat baku. Sebaliknya, semakin kecil (karakteristik populasi relative homogen) akan menghasilkan galat baku yang kecil. Dengan demikian Sampling Acak Sederhana akan memberikan presisi yang tinggi apabila karakteristk populasi bersifat homogen. Dalam kasus ini, tampak bahwa pendapatan bersifat heterogen yang berarti varians pendapatan, S2, juga akan besar. Oleh karena itu, apabila sampel diambil melalui Sampling Acak Sederhana, akan memberikan presisi yang rendah. Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͷͻ

Masuk akal kiranya, agar diperoleh presisi yang tinggi, sampel yang terambil haruslah sampel yang didalamnya berisi misalnya, masyarakat yang dari semua golongan pendapatan. Sampel seperti ini dapat diperoleh melalui Sampling Acak Bestrata. Dalam Sampling Acak Bestrata populasi N dibagi ke dalam beberapa

kelompok sedemikian sehingga setiap kelompok mempunyai karakteristik yang homogen. Kelompok-kelompok semacam ini disebut strata (tunggalnya disebut stratum) dan dalam masing-masing stratum sampel diambil secara acak, yakni dengan

Sampling Acak Sederhana. Proses pembagian populasi ke dalam beberapa strata disebut stratifikasi. Dalam kasus sebelumnya, populasi dibagi dalam tiga strata, stratum pertama adalah masyarakat yang tergolong berpenghasilan tinggi, stratum kedua yang berpenghasilan menengah, dan stratum ketiga masyarakat yang berpenghasilan rendah. Dalam bab ini, akan diuraikan Sampling Acak Berstrata untuk menaksir ratarata, proporsi serta total populasi. Namun sebelum lebih jauh membahasnya, perlu diperhatikan terlebh dahulu beberapa notasi yang digunakan.

IV. 2 Notasi Telah dikatakan bahwa populasi dibagi ke dalam kelompok-kelompok yang disebut strata. Andaikan populasi dibagi dalam L strata, maka banyaknya unit serta beberapa besaran karakteristik yang diperlukan dalam stratum dinyatakan dalam notasi-notasi berikut, Indeks k dalam notasi menyatakan stratum ke-k, jadi k bisa berharga 1, 2, …, L. Nh

banyaknya unit dalam stratum ke – h

nh

banyaknya unit dalam sampel yang diambil dari stratum ke – h

yhi

nilai pengamatan atau nilai karakteristik untuk unit ke-i dalam stratum ke-h

Wh =

Nh N

bobot stratum ke-h

fh Yh =

fraksi sampling dalam stratum ke-h

¦y Nh

hi

nilai rata-rata karakteristik dalam stratum ke-h

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸Ͳ

yh =

¦y

hi

nh

nilai rata-rata karakteristik sampel berukuran nh yang diambil dari stratum ke-h

S

s

2 h

2 h

¦ (y =

− Yh )

2

hi

Nh −1

¦ (y =

− Yh )

varians karakteristik dalam stratum ke-h

2

hi

nh − 1

varians karakteristik sampel berukuran nh dari stratum ke-h

IV. 3 Prosedur Pengambilan Sampel Seperti sudah dijelaskan, bahwa pembentukan strata atau stratifikasi dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya suatu presisi akan bergantung kepada derajat homogenitas yang dicapai dalam strata, atau dapat pula dikatakan bergantung pada seberapa besar variabilitas karakteristik yang akan diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya bergantung kepada efektifitas pembentukan strata. Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasi yang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompok populasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahli di lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yang lainnya. Apabila secara cermat strata sudah terbentuk, maka sampel untuk masingmasing stratum dipilih melalui metode Sampling Acak Sederhana. Karena dilakukan dengan metode Sampling Acak Sederhana, maka tentunya harus tersedia kerangka sampling dalam setiap stratum. Apabila sudah tersedia, maka dari N1, N2, …, NL unit diambil sampel secara acak, katakan berukuran n1, n2, …, nL sehingga ukuran sampel yang dibutuhkan, yakni, n = n1 + n2 + … + nL

(4.1)

merupakan golongan ukuran-ukuran sampel setiap stratum. Untuk lebih jelasnya, selanjutnya akan diuraikan langkah kerja dalam membentuk strata untuk sebuah populasi sebaagai berikut :

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸ͳ

1. Tentukan populasi sasaran dan tentukan populasi secara keseluruhan (N) 2. Berdasarkan variabel tertentu (kriteria tertentu) , populasi dibagi-bagi ke dalam L buah strata 3. Untuk setiap strata lakukan pendaftaran satuan sampling sehingga untuk setiap strata diperoleh kerangka sampling masing-masing dengan ukuran strata masing-masing 4. Dari populasi tersebut kemudian ditentukan ukuran sampel n yang disebut overall sample size. Menentukan ukuran sampel n tentu saja harus berdasarkan

kriteria tertentu. 5. Ukuran sampel sebesar n selanjutnya dialokasikan (disebarkan) ke seluruh strata, yang kemudian disebut alokasi sampel (sample allocation) Stratum I

: n1

Stratum I

: n2

Stratum I

: n3

L

sedemikian rupa sehingga : n = ¦ ni i =1

… Stratum I

: nL

6. Dari setiap stratum kemudian dipilih satuan sampling melalui teknik Sampel Acak Sederhana. Oleh karena dari setiap stratum dilakukan secara Sampling Acak Sederhana, maka keseluruhan proses disebut Sampling Acak Berstrata. Jika proses memilih dari setiap stratum dilakukan secara sistematik, maka proses keseluruhan disebut Sampling Acak Sistematis Berstrata.

Sebagai contoh, dibawah ini diberikan gambaran pembagian populasi menjadi tiga buah stratum yang kemudian dilakukan prose Sampling Acak Berstrata :

N1

N2 .

N3

N = N1 + N2 + N3

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

n1

n1

n1

n = n1 + n2 + n3

͸ʹ

IV. 4 Taksiran Rata-rata Populasi IV. 4. 1 Bentuk Taksiran Seperti halnya Sampling Acak Sederhana maka akan diuraikan tiga penaksir yang barangkali dilibatkan dalam penelitian. Penaksir ini adalah penaksir rata-rata, proporsi dan total populasi. Rata-rata nilai karakteristik populasi tiada lain adalah jumlah nilai karakteristik dibagi banyaknya unit dalam populasi. L

X=

Nh

¦¦ x

hi

h =i i =1

N

(4.2)

atau bisa juga ditulis dengan : L

X=

¦N

h

Xh

h =1

(4.3)

N

X disebut “rata-rata yang dibobot” dengan bobot yang digunakan adalah

ukuran-ukuran stratum, yaitu Nh. Kalau sampel dari setiap stratum diambil dengan menggunakan Sampling Acak Sederhana, maka rata-rata nilai karakteristik dari sampel dalam setiap stratum bisa ditentukan yaitu nh

xh =

¦x

hi

i =1

nh

(4.4)

x h ini tentu saja merupakan penaksir yang takbias untuk X h . Karena x h ini

merupakan penaksir yang takbias untuk X h , maka N h x h akan merupakan penaksir total nilai karakteristik dalam stratum ke-h, sehingga apabila taksiran-taksiran total ini kita jumlahkan, yakni

¦N

h

x h , maka akan merupakan taksiran total nilai populasi.

Oleh karena itu, taksiran rata-rata nilai karakteristik populasi akan sama dengan

¦N

h

x h dibagi oeh N. Taksiran rata-rata nilai karakteristik populasi dalam Sampling

Acak Berstrata diberi symbol x st . Oleh karenanya

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸͵

L

x st =

¦x

h

h =1

(4.5)

N

Taksiran ini juga merupakan taksiran yang takbias untuk X .

Contoh 4. 1 : Seorang peneliti mengadakan suatu survai untuk mengetahui berapa rata-rata hasil penjualan lading per bulan milik para petani di suatu daerah. Dikeahui bahwa di daerah tersebut terdapat 250 petani yang 60 diantaranya tergolong kelompok yang mempunyai lading luas, 100 tergolong kelompok yang mempunyai ladang lumayan luas, dan 40 petani tergolong mempunyai ladang kecil. Sampel yang diambil oleh peneliti adalah 50 petani yang masing-masing kelompok diwakili oleh 15, 25, dan 10 petani. Dalam tiap kelompok petani-petani ini diambil dengan sampling acak sederhana. Dari petani yang terpilih, rata-rata pendapatannya dihitung, lihat table (IV. 1) diperoleh : Tabel IV. 1 PENJUALAN HASIL LADANG PER BULAN MENURUT STRATA LUAS LADANG (DALAM RATUSAN RIBU RUPIAH)

NO

STRATA LUAS LADANG 1

2

3

1

123

65

34

2

120

60

30

3

125

63

25

4

160

60

28

5

130

70

27

6

110

64

25

7

140

63

30

8

110

60

35

9

130

59

20

10

100

63

46

11

110

62

12

120

58

13

125

64

14

120

65

15

152

65

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸Ͷ

x1 = Rp.125.000,−

16

60

17

50

18

55

19

62

20

60

21

60

22

64

23

62

24

40

25

46

Jumlah

1.875.000

1.500.000

300.000

xh

125.000

60.000

30.000

sh

16.053,48

6.416,13

7.149,20

x 2 = Rp. 60.000,−

x3 = Rp. 30.000,−

maka pukul rata hasil penjualan ladang per bulan di daerah tersebut adalah x st =

(60)(125.000) + (100)(60.000) + (40)(30.000) 200

= Rp. 73.500,−

IV. 4. 2 Galat Baku Rata-rata Seperti telah kita ketahui dalam uraian sebelumnya, selain taksiran untuk suatu parameter populasi, diperlukan juga varians atau galat baku dari taksiran tersebut agar presisi dari penaksir dapat diukur. Apabila sampel diambil melalui prosedur Sampling Acak Berstrata dan dari nilai karakteristik sampel ini akan ditaksir rata-rata populasi X , oleh x st , maka varians dari x st , ditulis V ( x st ) dapat ditentukan dengan

menggunakan persamaan berikut :

§ L N x · V ( x st ) = V ¨ ¦ h h ¸ © h =1 N ¹

(4.6)

yang apabila diuraikan menjadi V ( x st ) =

1 N2

L

¦ N h2 h =1

N h − n h S h2 N h nh

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(4.7)

͸ͷ

atau L § N − nh V ( x st ) = ¦ Wh2 ¨¨ h h =1 © Nh

· S h2 ¸¸ ¹ nh

(4.8)

dengan wh menyatakan bobot stratum ke-h. V( x st ) di atas besarnya besarnya bergantung antara lain pada S h2 yaitu varians nilai karakteristik dalam stratum ke-h. Kenyataan, sering varians ini jarang diketahui besarnya sehingga sulit bagi kita untuk menghitung V( x st ) melalui persamaan (4.8). Oleh karena itu, V( x st ) bisa ditaksir. Taksiran untuk V( x st ) akan didasarkan pada besarnya varians nilai karakteristik yang dihitung melalui sampel yang diambil dari setiap stratum. Penaksir tersebut adalah :

§ N − nh Vˆ ( x st ) = ¦ Wh2 ¨¨ h h =1 © Nh L

· s h2 ¸¸ ¹ nh

(4.9)

s h2 menyatakan varians nilai karakteristik stratum ke – h yang dihitung dengan

menggunakan persamaan (…). Dengan demikian galat baku dari rata-rata untuk sampling berstrata adalah s x st = V ( x st )

(4.10)

Dari contoh 4.1, melalui sampel yang diambil dari tiap stratum, besarnya varians atau simpangan baku pendapatan petani dihitung. Dari 15 petani yag mempunyai ladang luas, juga dari 25 petani serta 10 petani yang mempunyai ladang cukup dan kecil, simpangan baku pendapatan dihitung. Hasilnya tampak pada tabel III. 1 berturut-turut adalah : s1 = Rp. 16.053,48 , s2 = Rp. 6.416,13 , s3 = Rp. 7.149,20 , Maka dengan menggunakan persamaan (…) varians rata-rata petani di daerah tersebut besarnya ditaksir oleh : 2 2 2 2 °­§ 60 · § 60 − 15 · (16053,48) § 100 · § 100 − 25 · (6416,13) ˆ V ( x st ) = ®¨ +¨ + ¸ ¨ ¸ ¸ ¨ ¸ 15 25 °¯© 200 ¹ © 60 ¹ © 200 ¹ © 100 ¹

§ 40 · § 40 − 10 · (7149,20 ) ¨ ¸ ¨ ¸ 10 © 200 ¹ © 40 ¹ 2

2

½° ¾ °¿

=1621797,603 Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸͸

sehingga galat bakunya adalah s x st = Vˆ ( x st ) = Rp.1273,498 ,−

nilai tersebut untuk mengukur presisi dari x st . Apabila varians suatu taksiran bisa ditentukan, maka interval taksirannya juga bisa dicari. Sejalan dengan pembahasan Sampling Acak Sederhana, maka apabila sampel diambil melalui Sampling Acak Berstrata, interval taksiran rata-rata dengan derajat konfiden α, dapat diperoleh dari :

x st − Z 1 s x st < X < x st + Z 1 s x st 2

α

2

α

(4.11)

dimana Z 1 besarnya didapat dari tabel normal baku. 2

α

Contoh 4.2 : Dalam contoh yang lalu, apabila diinginkan interval taksiran untuk rata-rata pendapatan hasil ladang dengan α = 5 %, maka interval taksiran tersebut adalah : 73.500 – (1,96) (1273,498) < X < 73.500 + (1,96) (1273,498) 71003,94 < X < 75996,06 yang berarti bahwa dengan derajat keyakinan 95 % rata-rata penjualan hasil ladang para petani di daerah tersebut terletak antara Rp. 71.004 , - dan

Rp. 75.996,-.

IV. 5 Taksiran Persentase (Proporsi) IV. 5. 1 Bentuk Taksiran Seperti halnya pada taksiran untuk rata-rata, maka taksiran untuk proporsi juga melibatkan besaran proporsi untuk setiap strata. Oleh karena itu, melalui Sampling Acak Berstrata berukuran N, taksiran untuk proporsinya adalah : L §N Pst = ¦ ¨ i i =1 © N

dengan pi =

· ¸ pi ¹ 1 ni ¦ xij n j =1

xij = 1 jika satuan sampling mempunyai karakteristik yang dicari xij = 0 jika satuan sampling tidak mempunyai karakteristik yang dicari Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸͹

IV. 5. 2 Galat Baku Proporsi Apabila sampel diambil melalui prosedur Sampling Acak Berstrata dan dari nilai karakteristik sampel ini akan ditaksir proporsi populasi πst, oleh Pst, maka varians dari Pst, ditulis V(Pst) dapat ditentukan dengan menggunakan persamaan berikut :

§ N − ni V (Pst ) = ¦ ¨¨ i Ni i =1 © L

·§ N i · pi (1 − p i ) ¸¸¨ ¸ ni − 1 ¹© N ¹ 2

(4.12)

yang apabila diuraikan menjadi

V (Pst ) =

1 N2

L

¦ (N h =1

i

− ni )N i

pi (1 − pi ) ni − 1

(4.13)

IV. 6 Alokasi Sampel Uraian yang lalu memperlihatkan pada kita bagaimana menentukan taksiran rata-rata dan mengukur presisi taksiran rata-rata melalui galat baku taksiran tersebut jika sampel diambil dengan Sampling Acak Berstrata. Ini bisa dilakukan apabila kita sudah mengetahui besarnya ukuran sampel, n , dan besarnya ukuran-ukuran sampel yang diambil dari setiap stratum,nh. Dari contoh 4.1 dan 4.2 misalnya, taksiran ratarata hasil penjualan, x st , serta variansnya, V( x st ), dapat dihitung karena besarnya sampel yaitu 50 petani sudah ditentukan, demikian pula besarnya ukuran sampel untuk setiap stratum, yaitu; 15, 25, dan 10 petani. Masalah yang timbul tentunya adalah bagaimana menentukan bahwa sampel berukuran 50 petani , dan dalam berapa bagian dari 50 petani ini diberikan untuk setiap stratum. Dengan kata lain, bagaimana menentukan n dan bagaimana pula mengalokasikan n ini ke dalam masing-masing stratum. Dalam bagian ini akan diuraikan terlebih dahulu bagaimana mangalokasikan n ke dalam setiap stratum, sehingga untuk n yang

diketahui besarnya, nh bisa

ditentukan. Dalam Sampling Acak Berstrata, mengalokasikan n ke dalam setiap stratum bisa ditempuh dalam beberapa cara. Cara yang paling seerhana adalah yang disebut alokasi proporsional, yang akan diuraikan berikut ini. Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸ͺ

IV. 6. 1 Alokasi Proporsional Salah satu cara menentukan besarnya nh untuk n yang diketahui adalah alokasi proporsional. Alokasi ini adalah alokasi yang paling sederhana. Ukuran-ukuran sampel dari setiap stratum diambil proporsional terhadap ukuran stratumnya, Nh. Dengan alokasi ini, maka :

nh = sehingga berlaku bahwa

Nh ⋅n N

; h = 1, 2, ... , L

(4.14)

nh n = yang menyatakan berapa bagian sampel diambil Nh N

dari populasi.

Contoh 4. 3 : Dari contoh 4.1 nampak bahwa ukuran populasinya terdiri dari 200 petani, dan masing-masing stratum berukuran N1 = 60, N2 = 100, dan N3 = 40. Dari ukuran ini akan diambil sampel berukuran 50 petani. Maka dengan alokasi proporsional, banyaknya petani yang harus diambil dari setiap stratum adalah: 60 × 50 = 15 pe tan i 200 100 × 50 = 25 pe tan i n2 = 200 40 n3 = × 50 = 10 pe tan i 200

n1 =

dengan demikian, sampel-sampel yang diambil dari setiap stratum dari contoh di atas merupakan sampel yang proporsional terhadap ukuran stratum. Apabila alokasi sampel dilakukan dengan alokasi proporsional, maka x st dengan variansnya yang masing-masing ditulis dalam persamaan () dan () dapat disederhanakan menjadi : L

x st =

nh

¦¦ x

hi

h =1 i =1

n

(4.15)

yang merupakan rata-rata nilai karakteristik sampel, dan

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͸ͻ

N − n L N h S h2 ¦ N h =1 N n

(4.16)

N − n L N h s h2 Vˆ ( x st ) = ¦ N h =1 N n

(4.17)

V ( x st ) = yang taksirannya adalah

dengan s h2 menyatakan varians nilai karakteristik yang dihitung dari sampel yang diambil dari stratum ke-h, dihitung dengan menggunakan rumus (….) Apabila rumus ini kita gunakan untuk contoh yang lalu, maka 2 100 (6406,13) 2 40 (7149,20) 2 § 200 − 50 ·§ 60 (16053,48) ˆ V ( x st ) = ¨ + + ¸¨¨ 50 200 50 200 50 © 200 ¹© 200 = 1621797,603

· ¸¸ ¹

terlihat bahwa hasilnya sama dengan apabila digunakan persamaan ((())))

IV. 6. 2 Alokasi Optimal Dalam alokasi proporsional, ukuran-ukuran sampel dari setiap stratum ditentukan secara proporsional terhadap ukuran-ukuran stratum Nh. Dalam keadaan tertentu terdapat suatu kendala dalam menentukan ukuran sampel. Kendala tersebut biasanya adalah biaya. Dalam sampling, dikenala apa yang disebut biaya samplilng. Dengan biaya sampling diartikan sebagai biaya yang perlu disediakan apabila kita akan melakukan pengambilan sampel. Oleh karena itu, tercakup di dalamnya biayabiaya merencanakan sampling, membentuk kerangka sampling, melatih pewawancara, mengumpulkan data, menyusun dan mengolah data, keperluan secretariat, dan lain sebagainya. Biaya sampling ini terbagi dalam dua bagian, yaitu biaya tetap, B0, dan biaya-biaya tidak tetap, Bh. Yang termasuk biaya tetap adalah biaya yang tidak tergantung pada berapa besarnya ukuran sampel yang diambil dari setiap stratum, termasuk di dalamnya adalah biaya-biaya keperluan secretariat, biaya sewa ruangan, honor pegawai, dan sebagainya. Biaya tidak tetap adalah biaya untuk mendapatkan data (melalui wawancara, angket, dan sebagainya) dari satu unut yang ada dalam setiap stratum. Oleh karena itu, apabila biaya memperoleh data dari satu unit dalam stratum pertama adalah B1 rupiah, dan dari stratum ini akan diambil sampel berukuran n1 unit. Maka jumlah biaya yang diperlukan untuk mendapatkan data dari stratum pertama adalah n1B1. Demikian pula untuk stratum ke dua, dengan biaya untuk Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹Ͳ

mendapatkan data dari satu unit sebesar B2 rupiah, maka diperlukan sebanyak n2B2 rupiah. Secara umum, untuk stratum ke-h, diperlukan biaya nhBh rupiah. Oleh karena itu, biaya yang diperlukan untuk mendapatkan data dari n = ¦ nh unit adalah

¦n B h

h

rupiah. Karena keseluruhan biaya sampling yang diperlukan merupakan

jumlah biaya tetap dan tidak tetap, maka seluruh biaya dapat dituliskan sebagai berikut :

B = B0 + ¦ nh Bh

(4.18)

Untuk mempermudah perhitungan-perhitungan selanjutnya, hanya akan diperhatikan biaya tidak tetap saja, yaitu:

B ′ = B − B0 = ¦ nh Bh

(4.19)

Dengan menggunakan fungsi biaya, maka ukuran sampel dapat ditentukan melalui dua cara: Pertama, dengan biaya sampling tertentu, yakni sebesar B, tentukan ukuran sampel n, dan alokasikan n ini ke dalam setiap stratum sehingga dicapai presisi yang maksimal (galat baku taksiran minimal). Ke dua, dengan presisi taksiran yang dikehendaki, tentukan ukuran sampel n, lalu alokasikan n ini pada setiap stratum sehingga biaya yang harus dikeluarkansekecil mungkin. Metode alokasi ukuran sampel ini disebut Alokasi Optimal. Dengan terminologi lain, alokasi optimal dapat dinyatakan seperti berikut, tentukan n dan nh sedemikian rupa sehingga untuk B ′ tertentu s x st minimal, atau tentukan n sehingga untuk s x st tertentu B ′ seminimal mungkin. Kita perhatikan terlebih dahulu bagaimana menentukan nh untuk ukuran n tertentu. Apabila alokasi optimal digunakan, maka ukuran sampel setiap stratum dihitung melalui persamaan:

nh =

Nh Sh

¦ Nh Sh

Bh Bh

⋅n

(4.20)

IV. 6. 3 Alokasi Neyman Apabila biaya total per satuan sampling dalam setiap stratum (Bh) sama, maka penentuan alokasi sampling ke dalam setiap stratum dari persamaan 4.18 menjadi :

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹ͳ

nh =

Nh Sh ⋅n ¦ Nh Sh

(4.21)

Alokasi di atas merupakan bentuk daro alokasi Neyman

IV. 6. 4 Alokasi Sembarang Alokasi ini dilakukan dengan cara mengalokasikan sampling ke dalam strata seimbang dengan syarat minimal dari sebuah stratum harus ada dua buah satuan sampling yang diambil. Dalam praktik, alokasi seperti ini sama sekali tidak disarankan, sebab alokasi tersebut bisa mengakibatkan standard error menjadi membengkak yang harganya lebih besar daripada standard error Sampling Acak Sederhana.

IV. 6. 5 Alokasi Sama Besar Menurut kriterium ini, alokasi dilakukan atas dasar rumus

ni =

n L

(4.22)

Pada keadaan tertentu aloksai sma besar bisa menguntungkan, yaitu pada keadaan yang disebut paired allocation.

IV. 7 Menentukan Ukuran Sampel Sebagaimana telah diketahui, banyak sekali faktor yang ikut menentukan ukuran sampel, dua diantaranya adalah tergantung kepada parameter yang akan ditaksir dan tergantung kepada tipe samplingnya.

IV. 7. 1 Menentukan Ukuran Sampel Jika Akan Menaksir Rata-rata Apabila parameter yang akan ditaksir adalah rata-rata dan tipe sampling Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan berikut :

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹ʹ

N i2 S i2 ¦ wi i =1 L

n=

2

§ · L ¨ δ ¸ 2 2 ¨¨ Z ¸¸ N + ¦ N i S i i =1 © (1−α 2 ) ¹

(4.23)

wi = ni / n ; δ = bound of error

IV. 7. 2 Menentukan Ukuran Sampel Jika Akan Menaksir Proporsi Selanjutnya jika parameter yang akan ditaksir adalah rata-rata dan tipe sampling Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan berikut : N i2 π i (1 − π i ) ¦ wi i =1 L

n=

2

(4.24)

§ · L ¨ δ ¸ 2 N + N i π i (1 − π i ) ¦ ¨¨ Z ¸¸ i =1 ( 1−α ) 2 ¹ ©

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹͵

TINJAUAN MATA KULIAH BAB V SAMPLING KLASTER V. 1 Pendahuluan Salah satu jenis sampling yang juga sering digunakan dalam praktek penelitian adalah sampling klaster. Sampling ini dilakukan apabila peneliti ingin menekan biaya sampling atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak tersedia. Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan atau kelompok (cluster) elemen (unit observasi). Sebagai contoh, andaikan seorang peneliti ingin mengetahui rata-rata pendapatan kepala keluarga disebuah kota besar. Apabila Sampling acak sederhana atau sampling acak berstrata akan digunakan, maka peneliti harus mempunyai kerangka sampling yang berisikan daftar kepala keluarga dikota tersebut. Daftar keseluruhan nama kepala keluarga dikota yang besar seperti ini pasti akan sulit diperoleh. kalaupun ada, dan SRS dilakukan maka sampel masyarakat yang terambil bisa tersebar ke semua penjuru kota, dan ini akan melibatkan biaya pengambilan sampel yang tinggi. Daftar yang mungkin bisa diperoleh adalah daftar nama nama kelurahan dikota tersebut. Kelurahan adalah kumpulan kepala kepala keluarga. Oleh karena itu kelurahan dipandang sebagai klaster. Proses pegambilan sampling klaster dilakukan dengan memperhatikan kerangka sampling yang berisikan daftar klaster , dalam contoh di atas daftar nama kelurahan. Pengambilan sampel kemudian dilakukan dengan mengambil secara acak klaster-klaster. Unit sampling yang berisikan klaster-klaster dinamakan unit sampling utama (primary sampling unit) disingkat USU. Apabila semua unit observasi dalam USU menjadi anggota sampel maka dikatakan bahwa proses pengambilan sampel dilakukan dengan sampling klaster satu tahap. Namun apabila USU dibagi lagi ke dalam unit yang lebih kecil, misalnya kelurahan dibagi lagi ke dalam Rukun-rukun Warga maka rukun warga disebut unit sampling ke dua (secondary sampling unit) disingkat USD. Apabila semua unit obervasi (elemen) dari USD menjadi anggota sampel, maka dikatakan proses pengambilan sampel dilakukan dengan sampling

klaster dua tahap, demikian seterusnya.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹ͺ

Perhatikan persamaaan dan perbedaan sampling berstrata dan sampling klaster dalam gambar berikut.

Sampling Acak Stratifikasi

Sampling Klaster

Masing-masing elemen di dalam populasi Masing-masing elemen di dalam populasi tepat berada dalam satu stratum

tepat berada dalam satu klaster

Populasi dari H strata; stratum h memiliki Sampling klaster satu tahap; Populasi dari nh elemen

N klaster

.

Mengambil secara SRS elemen-elemen Mengambil klaster secara SRS kemudian untuk setiap stratum

mengamati semua elemen di dalam klaster yang terambil

.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

͹ͻ

Varians penaksirnya tergantung pada Klaster merupakan unit sampling, lebih keragaman nilai-nilai di dalam strata

banyak klaster yang dijadikan sampel maka lebih kecil variansnya. Varians dari penaksirnya tergantung pada keragaman antara rata-rata klaster

Untuk presisi yang terbaik, elemen- Untuk presisi yang terbaik, elemenelemen individu di dalam setiap stratum elemen individu di dalam masing-masing harus memiliki nilai-nilai yang serupa , klaster harus heterogen, dan rata-rata tetapi rata-rata sertiap statum satu sama klaster harus serupa satu sama lainnya. lain sedapat mungkin harus berbeda

V.2 Notasi notasi yang digunakan untuk Sampling Klaster Satu Tahap Dalam sampling acak sederhana, unit-unit yang diambil sebagai sampel adalah elemen-elemen yang diobservasi. Dalam sampling klaster, unit samplingnya adalah klaster-klaster, dan elemen-elemen yang diobservasi adalah USD di dalam klasterklaster. Himpunan semestanya, U¸ merupakan populasi dari N USU; S menandakan sampel dari USU yang dipilih dari populasi USU, dan Si merupakan sampel dari USD yang dipilih dari USU yang ke-i. Berikut ini adalah notasi notasi yang akan digunakan dalam sampling klaster khususnya bila ingin menaksir rata rata populasi:

N = banyaknya klaster dalam populasi n = banyaknya klaster yang dipilih sebagai sample mi = banyaknya unit observasi (elemen) dalam klaster ke I, I=1,2, … ,N m = M=

1 n ¦ mi rata rata ukuran klaster dalam sampel n i =1 N

¦m

i

Banyaknya unit observasi (elemen) dalam populasi

i =1

M =

M rata rata ukuran klaster dalam Populasi N

y i = total semua observasi dalam klaster ke i

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺͲ

V.3 Proses Memilih dalam Sampling Klaster Satu Tahap Dalam sampling klaster satu tahap, terjadi suatu kondisi dimana semua atau tidak satupun elemen-elemen yang terkandung di dalam klaster (= USU) dijadikan sebagai sampel. Sampling klaster satu tahap banyak digunakan pada kegiatan survai yang memiliki biaya sampling untuk USD dapat diabaikan bila dibandingkan dengan biaya sampling untuk USU. Misalnya untuk survai pendidikan, yang bertindak sebagai USU adalah ruangan kelas; semua siswa dalam kelas yang terpilih yang sebenarnya merupakan USD dijadikan sebagai objek analisis jika hanya sedikit biaya ekstra yang perlukan daripada meneliti beberapa siswa saja dalam kelas terpilih tersebut. i) Populasi dibagi-bagi ke dalam N buah klaster atau Unit Sampling Utama (USU). Keadaan variable Y dalam setiap klaster diusahakan se-heterogen mungkin (dalam praktik tidak pernah bisa tercapai, terutama apabila yang menjadi klaster adalah daerah atau kumpulan satuan-satuan sampling yang ukurannya besar). ii) Secara Simple Random Sampling dipilih n buah klaster. iii) Pemilihan hanya dilakukan sekali yaitu memilih klaster ( memilih Unit Sampling Utama / USU ). Oleh karena itu, semua unit sampling kedua (USD) yang ada dalam klaster yang terpilih diperiksa. Sebagai catatatan bahwa apabila kita akan menggunakan sampling klaster satu tahap maka disarankan ukuran klaster relatif kecil. Ukuran klaster yang terlalu kecil bisa merugikan, bisa pula menguntungkan.

Merugikan : Apabila yang sedang kita teliti adalah peristiwa-peristiwa yang jarang terjadi (Rare Cases) Contoh : Kematian ibu pada saat melahirkan (mortality)

Menguntungkan : Apabila peristiwa itu banyak terjadi (abundant cases). V.4 Taksiran Rata-rata Populasi Sampling klaster merupakan sampling acak sederhana dengan setiap unit samplingnya mengandung sejumlah elemen-elemen. Oleh karena itu, taksiran rataBahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺͳ

rata populasi, ȝ, dan total, τ, serupa dengan taksiran-taksiran pada sampling acak sederhana. Secara khusus, rata-rata sampel, y , merupakan taksiran yang baik dari rata-rata populasi, ȝ. Taksiran rata rata populasi μ adalah rata-rata sampel yang bentuknya adalah: n

y=

¦y

i

i =1 n

¦m

(5.1) i

i =1

dan varians dari y adalah n

(y − ymi ) N−n ·¦ i

2

i =1 ˆ ( y) = §¨ V 2¸ n −1 © NnM ¹

(5.2)

Dalam hal ini M dapat ditaksir dengan m jika M tidak diketahui. Taksiran varians pada persamaan (5.2) merupakan taksiran yang bias dan taksiran varians tersebut akan baik jika ukuran sampel yang diambil, n, besar, yaitu n • 20. Bias akan hilang jika masing-masing klaster, m1, m2, …, mN, memiliki ukuran yang sama. Contoh:

Suatu survai dirancangkan untuk menaksir rata rata pengeluaran untuk keperluan rumah tangga masyarakat disuatu kota. Karena daftar rumah tangga di daerah tersebut tidak ada, maka dilakukanlah pengambilan sampel dengan cara klaster. Yang menjadi klaster adalah Rukun rukun warga (RW) di daerah tersebut. Dari hasil sampel diperoleh data berikut. Tabel 5.1 Total Jumlah

RW

Banyaknya

Pengeluaran dari

Rumah

Rumah Tangga

Tangga

(dalam ribuan

Total Jumlah

RW

Banyaknya

Pengeluaran dari

Rumah

Rumah Tangga

Tangga

(dalam ribuan

rupiah)

rupiah

1

55

2210

11

73

2930

2

60

2390

12

64

2470

3

63

2430

13

69

2830

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺʹ

4

58

2380

14

58

2370

5

71

2760

15

63

2390

6

78

3110

16

75

2870

7

69

2780

17

78

3210

8

58

2370

18

51

2430

9

52

1990

19

67

2730

10

71

2810

20

70

2880

Dari tabel ini maka m1 = 55, m2 = 60, m3 = 63,  , m20 = 70 , sehingga

n

¦m

i

= 1303

i =1

Jadi rata rata pengeluaran dari sampel adalah 20

¦ yi

i =1 20

¦ mi

=

52340 = 40.169 1303

i =1

ˆ (y ) diperlukan beberapa perhitungan sebagai berikut: Untuk menghitung V 20

¦ y i2 = y 21 + y 22 + ... + y 252 i =1

= (2210 ) + (2390 ) + ... + (2880) = 138873600 2

2

2

20

¦ m i2 = m 21 + m 22 + ... + m 252 i =1

= (55 ) + (60 ) + ... + (70 ) = 86171 2

2

2

20

¦ y i m i = y1 m1 + y 2 m 2 + ... y 20 m 20 i =1

= (2210) (55) + (2390) (60 ) + ... + (2880 ) (70) = 3456230

Kemudian kita uraikan persamaan berikut:

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺ͵

20

¦ (y i − ym i )

2

i =1

20

=¦ i =1

y i2

20

− 2 y ¦ yi mi + y

2

i =1

20

¦ m i2 i =1

= 138873600 − 2 (40,17 ) (3456230 ) + (40,17 ) (86171) = 248085,668 2

Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M dapat ditaksir dengan m sebagai berikut : 20

¦ mi

m = i =1 n

=

1303 = 65,15 20

Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah sebanyak 100 (N = 100), maka varians dari pengeluarannya adalah: n

(yi − ymi )2 ¦ N−n ·

ˆ ( y) = §¨ V ¸ i =1 2 n −1 Nn M © ¹

§ · 248085,668 100 − 20 ¸ =¨ ¨ (100 )(20 )(65,15)2 ¸ 20 − 1 © ¹ = 0,123

Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk pengeluaran tersebut adalah :

ˆ (y ) = 40,167 ± 2 0,123 = 40,167 ± 0,702 y±2 V Jadi taksiran yang paling baik dari rata-rata pengeluaran untuk keperluan rumah tangga masyarakat di kota tersebut adalah 40,167, dan kekeliruan taksiran harus kurang dari 0,702 dengan peluang mendekati 0,95. V.5 Taksiran Total Populasi

Penaksir dari total populasi, τ, adalah sebagai berikut: n

My=M

¦ yi i =1 n

(5.3)

¦ mi i =1

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺͶ

penaksir varians dari M y adalah: n

¦ (y i ·

ˆ ( My ) = M 2 V (y ) = M 2 §¨ N − n ¸ i =1 V © NnM 2 ¹ n

¦ (y i ·

§ N − n i =1 = M2 N2 ¨ ¸ © NnM 2 ¹ n

¦ (y i

§ N − n · i =1 = N¨ ¸ © n ¹

− ym i )

2

n −1

− ym i )

2

(5.4)

n −1

− ym i )

2

n −1

Contoh :

Dari contoh sebelumnya mengenai tingkat

pengeluaran untuk keperluan rumah

tangga masyarakat di suatu kota, akan ditaksir total pengeluarannya. Dimisalkan bahwa terdapat 5500 penduduk dari kota tersebut, maka nilai taksiran total pengeluarannya adalah:

M y = 5500 (40,167 ) = 220918,5

ˆ (y ) , namun dari sekarang ini nilai M tidak Sebelumnya telah diketahui nilai dari V perlu lagi ditaksir dengan m . Dengan memanfaatkan nilai yang telah diperoleh tersebut, maka dengan menggunakan kepercayan 95%,

taksiran interval untuk τ

adalah sebagai berikut:

ˆ (M y ) = 220918,5 ± 2 M 2 V ˆ ( y) M y±2 V 220918,5 ± 2

(5500)2 (0,123)

220918,5 ± 3858,622 Seringkali banyaknya elemen dalam populasi tidak diketahui ketika akan digunakan n klaster sampling. Maka penaksir M y tidak dapat digunakan, tetapi dapat digunakan bentuk taksiran yang lain dari total populasi yang tidak bergantung pada M. Nilai y τ , diperoleh dengan persamaan: Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺͷ

yτ =

1 n ¦ yi n i =1

(5.5)

adalah rata-rata dari total klaster untuk sampel klaster yang berukuran n. Oleh kareba itu, y τ merupakan penaksir yang tak bias untuk rata dari total N klaster dalam populasi. Begitu juga N y τ merupakan penaksir yang tak bias untuk jumlah dari total klaster atau total populasi, τ. Adapun penaksir dari total populasi τ, yang tidak bergantung pada M adalah:

N yτ =

N n ¦ yi n i =1

(5.6)

Taksiran varians untuk Ny : n

¦ (y i §N −n·

− y)

2

ˆ ( Ny ) = N 2 V ( y ) = N 2 ¨ V ¸ i =1 n −1 © Nn ¹

(5.7)

Jika ternyata variasi di antara ukuran-ukuran klaster besar dan jika ukuran klaster sangat berkorelasi dengan total klaster, maka varians untuk N y τ (persamaan 5.7) pada umumnya lebih besar dari varians untuk My (persamaan 5.4). Penaksir N y τ tidak menggunakan informasi yang mengenai ukuran-ukuran klaster m1, m2, …, mn sehingga bisa mangakibatkan rendahnya presisi yang dimiliki. Contoh :

Dengan menggunakan contoh soal sebelumnya, dimisalkan bahwa untuk menaksir total pengeluaran ternyata banyaknya penduduk dari kota tersebut tidak diketahui. Yang diketahui adalah banyak klaster yaitu N=100. Sebagai solusinya, dapat digunakan persamaan (5.7) sebagai berikut:

N yτ =

100 N n (52340) = 261700 yi = ¦ n i =1 20

Selanjutnya untuk menentukan varians dari penaksirnya, maka terlebih dahulu dicari persamaan berikut:

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺ͸

n

¦ (y i i =1

n

− y) = ¦ 2

i =1

y i2

1§ n · − ¨ ¦ yi ¸ n © i =1 ¹

= 138873600 −

2

1 (52340)2 20

= 1899820 maka interval taksiran untuk total pengeluaran untuk pengeluaran rumah tangga masyarakat adalah :

ˆ (Ny ) Ny τ ± 2 V τ n

Ny τ ± 2

¦ (y i §N−n·

− y)

2

i =1 N2 ¨ ¸ Nn n −1 © ¹

261700 ± 2

(100)2 §¨¨ 100 − 20 ·¸¸ 1899820 © 100(20) ¹ 20 − 1

261700 ± 12648,511 V.6 Menentukan Ukuran Sampel untuk Menaksir Rata-rata dan Total Populasi

Banyaknya informasi dalam suatu sampel klaster dipengaruhi oleh dua faktor yaitu banyaknya klaster dan ukuran relatif dari klaster.

Sebagaimana telah kita

ketahui, ukuran dari batas-batas kekeliruan (bound of error) dari taksiran tergantung kepada variasi di antara klaster.

Dengan demikian harus disahakan untuk

memperoleh variasi yang kecil diantara totalnya.diasumsikan bahwa u8kuran klaster (unit sampling) telah dipilih dan dianggap hanya sebagai masalh dari pemililhan jumlah klaster, n. Dari persamaan (5.2), taksiran varians dari y adalah

( )

ˆ ( y) = §¨ N − n ·¸ s 2 V k © NnM 2 ¹ dimana n

s 2k =

¦ (y i i =1

− ym i )

n −1

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

2

(5.8)

ͺ͹

Varians sebenarnya dari y sekitar:

( )

ˆ ( y ) = §¨ N − n ·¸ σ 2 V k © NnM 2 ¹

(5.9)

2

2

dimana σ k merupakan varians populasi yang ditaksir dengan s k . 2

Karena tidak dketahui σ k atau rata-rata dari klaster M , pemilihan ukuran sampel, yaitu banyaknya klaster yang perlu untuk memperoleh informasi khusus mengenai parameter populasi menjadi sulit. Kesulitan ini dapat diatasi dengan menggunakan metode yang sama dengan penggunaan pada taksiran rasio. Yaitu, digunakansebuah 2

taksiran dari σ k dan sampel

yang

M , yang diperoleh dari survai pendahuluan, atau dipilih

berukuran

n’

elemen

yang

telah

diambil

dari

penelitian

sebelumnya.Dengan demikian, seperti halnya pada semua permasalahan mengenai penentuan ukuran sampel, pada standard deviasi penaksir dikalikan dengan dua untuk memperoleh batas-batas kekeliruan dari taksiran (bound of error), δ. Batasan ini menunjukkan nilai kekeliruan maksimum yang dirasa memiliki toleransi yang sesuai, yaitu:

δ = 2 V( y )

(5.10)

dengan menggunakan persamaan (5.9), diperoleh pemecahan untuk n. Kita memperoleh hasil yang sama ketika menggunakan My untuk menaksir total populasi τ, karena V( My ) = M2 V( y ). Pendekatan ukuran sampel dengan tujuan untuk menaksir μ dengan batas kekeliruan taksiran δ , adalah:

n= 2

N σ 2k N D + σ 2k

(5.11)

2

dimana σ k ditaksir dengan s k , dan

δ2 M 2 D= 4

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(5.12)

ͺͺ

Apabila kita mengambil nilai pengali dari simpangan baku taksirannya adalah z α , 2

yang merupakan pendekatan dari distribusi normal baku dengan melibatkan resiko kekeliruan sebesar α, maka diperoleh :

δ = zα

V (y )

2

(5.13)

sehingga nilai D berubah menjadi : D=

δ2 M 2

(z )

(5.14)

2

α

2

Contoh:

Misalkan data pada tabel 5.1 merupakan sampel pendahuluan dari pengeluaran untuk keperluan rumah tangga msyarakat di suatu kota. Berapa besar sampel yang harus diambil untuk keperluan survai yang akan datang yang bertujuan untuk menaksir ratarata pengeluaran μ dengan batas kekeliruan dari taksirannya adalah 25 ribu rupiah? Jawab: n

¦ (y i − ym i )

s 2k = i =1

n −1

2

=

248085,668 = 13057,14 20 − 1

nilai M dapat ditaksir dengan : 20

¦ mi

m = i =1 n

=

1303 = 65,15 20

Selanjutnya nilai D diperoleh adalah:

D=

δ 2 M 2 (25)2 (65,15)2 = = 663206,64 4 4

maka ukuran sampel yang sebaiknya diambil adalah

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͺͻ

n=

N σ 2k N D + σ 2k

=

100 (13057 ,14 ) = 34,3676 ≈ 35 100 (683722,2656 ) + 13057 ,14

jadi 35 klaster sebaiknya dijadikan sebagai sampel.

V.7 Menentukan ukuran sampel apabila tujuan penelitiannya adalah menaksir total populasi, τ, menggunakan M y , dengan batas kekeliruan dari taksiran δ :

Dengan pola pemikiran yang sama, maka diperoleh persamaan ukuran sampel yang harus diambil sebagai berikut:

n=

2

N σ 2k

(5.15)

N D + σ 2k

2

dimana σ k ditaksir dengan s k , dan

D=

δ2 4N

(5.16)

2

atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku taksirannya adalah z α , yang merupakan pendekatan dari distribusi normal baku 2

dengan melibatkan resiko kekeliruan sebesar α, maka nilai D berubah menjadi :

D=

(z

δ2 α

2

N

)

2

(5.17)

Contoh:

Dengan menggunakan data pada tabel 5.1 kembali, anggap sebagai data yang diperoleh merupakan data survai pendahuluan. Ingin diketahui berapa banyak sampel yang harus diambil untuk menaksir total pengeluaran masyarakat untuk keperluan rumah tangganya, τ, dengan batas kekeliruan 3000 ribu rupiah. Dimisalkan bahwa terdapat 2000 penduduk di kota tersebut.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻͲ

Jawab 2

Dengan menggunakan persamaan (5.15) dan menaksir σ k dengan n

¦ (y i − ym i )

s 2k = i =1

2

n −1

=

248085,668 = 13057,14 20 − 1

dan

( 3000 )2 D= = = 225 4 N 2 4 (100 )2 δ2

maka diperoleh

n=

N σ 2k N D + σ 2k

=

100 (13057 ,14 ) = 36 ,72 ≈ 37 100 (225 ) + 13057 ,14

V.8 Taksiran Proporsi Populasi

Dimisalkan bahwa seorang peneliti akan menaksir proporsi dari populasi, maka penaksir terbaik dari proporsi populasi, π, adalah proporsi sampel, πˆ atau p. Misal ai merupakan jumlah total dari elemen-elemen dalam klaster ke-i yang memilkiki karakteristik yang dimaksud. Maka proporsi karakteristik tersebut dari elemen-elemen dalam sampel yang berukuran n klaster adalah: n

p=

¦ ai i =1 m

¦

mi

(5.18)

i =1

dimana mi menunjukkan banyaknya elemen di dalam klaster ke-i, i = 1, 2, .., n. Catatan bahwa p memiliki bentuk yang sama dengan y (lihat persmaan ??), kecuali yi diganti dengan ai. Taksiran varians dari p serupa dengan y . Taksiran varians dari p :

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻͳ

n

(ai − p mi )2 ¦ ·

§ N −n ¸ Vˆ ( p ) = ¨¨ 2 ¸ © N nM ¹

i =1

(5.19)

n−1

Batas-batas Kekeliruan (Bound of The error) dari taksiran : n

δ = Zα

Vˆ ( p ) = Z α

2

(a − p mi )2 ·¦ i

2

§ N − n i =1 ¨ ¸ ¨ N nM2 ¸ n−1 © ¹

(5.20)

dimana Z α diperoleh dari tabel distribusi normal baku dengan taraf signifikansi α. 2

Apabila kita mengambil nilai α = 5%, maka diperoleh nilai Z α mendekati 2 , maka 2

persamaan di atas menjadi : n

δ=2

(a − p mi )2 ·¦ i

§ N −n ¨ ¸ ¨ N nM 2 ¸ © ¹

i =1

n −1

(5.21)

persamaan varians di atas merupakan penaksir yang baik hanya jika ukuran sampel, n,besar, katakanlah n • 20. Jika m1 = m2 = … = mN , maka p merupakan penaksir tak

bias untuk π, dan Vˆ ( p ) merupakan penaksir yang tak bias dari varians p yang sebenarnya untuk setiap ukuran sampel. Contoh :

Sebagai lanjutan dari contoh sebelumnya, kepada masyarakat ditanyakan pula apakah masyarakat di kota tersebut menempati rumah sewaan atau rumah milik sendiri. Hasilnya disajikan dalam tabel 5.2 . Gunakan data pada tabel tersebut untuk menaksir proprsi penduduk yang tinggal di rumah sewaan. Tabel 5.2 Banyaknya Klaster

Rumah Tangga ( mi )

Banyaknya

Banyaknya Penyewa

Klaster

( ai )

Rumah Tangga ( mi )

Banyaknya Penyewa ( ai )

1

55

25

11

73

32

2

60

36

12

64

22

3

63

26

13

69

19

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻʹ

4

58

21

14

58

15

5

71

39

15

63

26

6

78

30

16

75

40

7

69

20

17

78

35

8

58

25

18

51

17

9

52

24

19

67

22

10

71

30

20

70

20

Dari data di atas diperoleh beberapa besaran sebagai berikut: 20

¦

20

¦

mi = 1303

i =1

20

¦

mi2 = 86171

i =1

ai = 524

i =1

20

¦

ai2 = 14728

i =1

20

¦ ai mi = 34742 i =1

Penyelesaian:

Taksiran terbaik dari populasi penyewa adalah p, ditunjukkan dalam persmaan 5.18, yaitu : n

p=

¦ ai i =1 m

¦ mi

=

524 = 0 ,40 1303

i =1

untuk menaksir varians p. kita harus menghitung: n

¦ (ai − p mi ) i =1

2

=

n

¦

a i2

−2 p

i =1

n

¦ ai mi + p ¦ mi2 2

i =1

= 14728 − 2 (0 ,40 )(34742 ) + (0 ,40 )2 (86171) = 720 ,982 Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M dapat ditaksir dengan m sebagai berikut : 20

¦ mi

m = i =1 n

=

1303 = 65,15 20

Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah sebanyak 100 (N = 100), maka varians dari proporsi penyewa adalah:

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻ͵

n

(ai − p mi )2 ¦ N −n ·

§ Vˆ ( y ) = ¨¨ ¸ i =1 2 ¸ n−1 © NnM ¹ § · 720 ,982 100 − 20 ¸ =¨ ¨ (100 )(20 )(65 ,15 )2 ¸ 20 − 1 © ¹ = 0 ,000358

Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk proporsi penyewa adalah :

p ± 2 Vˆ ( p ) = 0 ,40 ± 2 0 ,000358 = 0 ,40 ± 0 ,0378 Jadi taksiran yang paling baik dari proporsi penyewa masyarakat di kota tersebut adalah 0,40 dan kekeliruan taksiran harus kurang dari 0,0378 dengan peluang mendekati 0,95. V.9 Menentukan ukuran sampel untuk menaksir proporsi

Taksiran dari proporsi populasi, π, dengan batas δ unit dari kekeliruan taksiran dinyatakan dengan 2 V ( p) = δ

Persamaan di atas dapat menjadi solusi untuk menentukan besarnya sampel yang harus diambil, n dan prosedur solusinya serupa dengan persamaan 5.15, yaitu:

n= 2

N σ 2k

(5.15)

N D + σ 2k

2

dimana σ k ditaksir dengan s k ; n

s k2 =

¦ (a i − p mi )2 i =1

n −1

dan D=

δ2 M 2 4

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(5.16)

ͻͶ

atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku taksirannya adalah z α , yang merupakan pendekatan dari distribusi normal baku 2

dengan melibatkan resiko kekeliruan sebesar α, maka nilai D berubah menjadi :

D=

δ2 M 2

(z ) α

2

(5.17)

2

Contoh:

Dimisalkan bahwa data pada tabel 5.2 dianggap sudah kadaluarsa. Selanjutnya diperlukan suatu penelitian baru yang bertujuan untuk menaksir proporsi penduduk yang menyewa rumah. Berapa banyak sampel yang harus diambil untuk memberikan taksiran tersebut dengan batas 0,03 dari kekeliruan penaksiran? Penyelesaian: 2

Taksiran terbaik dari σ k adalah yang dihitung dengan menggunakan tabel 5.2 sebagai berikut: n

¦ (ai − p mi )2 i =1

s k2 =

n −1

=

720,982 = 37 ,946 20 − 1

Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M dapat ditaksir dengan m sebagai berikut : 20

¦ mi

m = i =1 n

=

1303 = 65,15 20

selanjutnya dengan mengambil nilai α = 5%, diperoleh nilai z α = 1,96 , maka 2

diperoleh nilai D sebagai berikut:

D=

δ2 m 2

(z ) α

2

=

2

(0,03)2 (65,15)2 (1,96)2

= 0,994

sehingga diperoleh ukuran sampel minimal yang harus diambil adalah: n=

N σ 2k N

D + σ 2k

=

(100)(37,946) (100)(0,994) + (37,946)

= 27 ,62 ≈ 28

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻͷ

Dengan demikian, klaster yang harus diambil adalah sebanyak 28. Perhatikan bahwa nilai 28 menunjukkan banyaknya sampel minimal yang harus di ambil. Oleh karena itu, pengambilan sampel (klaster) yang lebih dari nilai tersebut tidak menjadi masalah selama tidak ada faktor lain yang menjadi pertimbangan ukuran sampel seperti masalah biaya, tenaga, waktu, dan lain sebagainya.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻ͸

BAB VI SAMPLING KLASTER DUA TAHAP VI.1 Pendahuluan

Sampling klaster dua tahap merupakan perluasan dari konsep klaster sampling. Sebagaimana yang telah dibahas pada bab sebelumnya mengenai sampling klaster secara umum, ternyata klaster pada umumnya merupakan suatu kumpulan dari elemen-elemen, seperti blok-blok rumah tangga. Sebuah klaster sering mengandung begitu banyak elemen. Oleh karena itu, diperlukan suatu pengelompokkan kembali dari elemen-elemen klaster yang telah terbentuk tersebut. Proses pengelompokkan kedua dari klaster-klater pertama yang terbentuk itu menghasilkan suatu prosedur sampling klaster dua tahap. Sebagai contohnya adalah apabila akan diteliti pendapat masyarakat di suatu daerah, dalam hal ini kecamatan merupakan bentuk klaster yang pertama. Akan tetapi dikarenakan adanya keterbatasan dana penelitian dan didukung pula poleh suatu kondisi dimana elemen-elemen dalam kecamatan sangat heterogen yang merupakan imbas dari heterogennya tiap desa, maka desa-desa dari tiap klaster dijadikan sebagai klaster-kalster dari klaster pertama (kecamatan). Prosedur pemilihan untuk klaster tahap dua dilakukan sama halnya seperti prosedur pemilihan pada sampling klaster satu tahap. Oleh karena itu, di sini hanya akan terpilih desa-desa dari klaster pertama yang terpilih saja. Sehingga hal akan berakibat pada penghematan biaya apabila dibandingkan dengan memilih desa langsung sebagai klaster tahap pertama. Hal ini dapat dipahami karena jika desa langsung dijadikan sebagai klaster pertama, maka muncul suatu kemungkinan bahwa desa-desa yang terpilih sangat berjauhan yang berakibat pada peningkatan biaya survai atau biaya pengambilan data. Definisi VI.1

Sampling klaster dua tahap merupakan suatu sampel yang diperoleh dengan diawali pemilihan sampel peluang dari klaster-klaster pertama yang kemudian memilih sampel peluang dari elemen-elemen masing-masing klaster yang telah dijadikan sampel pada tahap sebelumnya. Pembahasan dalam buku ini hanya akan terbatas pada pemilihan masing-masing tahap secara sampling acak sederhana. Sebagai contoh, suatu survai nasional terhadap Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻ͹

mahasiswa-mahasiswa di universitas yang ada di Indonesia mengenai opini mereka terhadap pemilihan presiden secara langsung. Klaster-klaster dalam hal ini universitas dapat dipilih secara sampling acak sederhana. Apabila prosedurnya sampling klaster satu tahap, maka seluruh mahasiswa dari universitas yang tepilih dijadikan sebagai objek yang diteliti. VI. 2 Cara Pembuatan Sampel Klaster Dua Tahap

Masalah pertama dalam pemilihan sampel klaster dua tahap adalah pemilihan klaster yang tepat. Terdapat dua kondisi yang diperlukan, yaitu: 1. Kedekatan geografis dari elemen-elemen dalam klaster 2. Ukuran klaster yang sesuai bagi administer/peneliti Pemilihan klaster yang sesuai juga tergantung pada apakah diinginkan untuk membuat sampel sedikit klaster dengan elemen-elemen dalam kalster yang banyak atau sampel banyak klaster dengan elemen-elemen dalam klasternya yang sedikit. Akhirnya, pemilihan tergantung pada biaya yang akan dikeluarkan. Klaster-klaster yang besar cenderung memiliki elemen-elemen yang heterogen, dan karenanya suatu sampel yang besar diharuskan untuk tiap-tiap klaster agar diperoleh taksiran yang akurat dari parameter populasi. Sebaliknya, kalster-klaster yang kecil

sering

mengandung elemen-elemen yang relatif homogen, dalam hal keakuratan informasi mengenai karakteristik dari sebuah klaster, dapat diperoleh dengan memilih suatu sampel yang kecil dari masing-masing klaster. VI. 3 Taksiran Tak Bias Rata-rata Populasi dan Total Populasi

Sebagaimana yang telah dibahas pada bab sebelumnya, diperlukan suatu taksiran untuiik rata-rata populasi, μ, atau total populasi, τ dan menempatkan batasbatas kekeliruan (bound of error) dari taksiran, δ. Berikut adalah notasi-notasi yang akan digunakan: N

= Banyaknya klaster dalam populasi

n

= Banyaknya klaster yang terpilih secara sampel acak sederhana

Mi = Banyaknya elemen dalam klaster ke-i mi

= Banyaknya elemen yang terpilih dalam secara sampel acak sederhana dari

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻͺ

kklaster ke-i M

N

¦Mi

=

= Banyaknya elemen dalam populasi

i =1

M N

= Rata-rata ukuran klaster populasi

M

=

y ij

=

Observasi ke-j dalam sampel dari klaster ke-i

yi

=

1 mi

mi

¦ yij

= rata-rata sampel untuk klaster ke-i

j =1

Dalam pembentukan suatu taksiran rata-rata populasi, μ, dapat dilakukan dengan cara yang serupa dengan bahasan dari bab V mengenai sampling klaster satu tahap. Persamaan (5.6) menunjukkan : N n

n

¦ yi i =1

merupakan suatu penaksir yang tak bias untuk τ. Dengan demikian jika persamaan di atas dibagi dengan M, diperoleh: N Mn

n

¦ yi i =1

menjadi suatu peaksir yang tak bias untuk μ. Tetapi penaksir tersebut tidak dapat dievaluasi karena tidak lagi diketahui total klaster, yi. Bagaimanapun juga, yi dapat ditaksir dengan M i y i , dan dalam penggantian M i y i untuk yi, dimiliki suatu taksiran tak bias untuk μ, yang dapat dihitung dari data sampel. Penaksir tak bias untuk rata-rata populasi, μ : n

¦ M i yi §N·

ˆ =¨ ¸ μ ©M ¹

i =1

n

(6.1)

pengambilannya secara sampling acak sederhana untuk setiap tahap. Taksiran varians dari μ : 1 § N −n ·§ 1 · 2 ˆ)= ¨ Vˆ (μ ¸ sb + ¸¨ 2 N nNM 2 © ¹ © nM ¹

§ M − mi M i2 ¨¨ i © Mi i =1 n

¦

· § s i2 ¸¨ ¸¨ m ¹© i

· ¸ ¸ ¹

(6.2)

dengan Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͻͻ

n

s b2 =

¦ (M i yi − Mμˆ )

2

i =1

(6.3)

n −1

dan n

s i2 =

¦ (y ij − yi )2 i =1

(6.4)

i = 1, 2, ..., n

mi − 1

Batas kekeliruan taksiran: ˆ) δ = 2 Vˆ (μ

(6.5)

sebagaimana yang telah dibahas pada bab sebelumnya bahwa nilai pengali 2 diperoleh dari pendekatan nilai tabel Z α untuk α = 5 %. 2

Taksiran μˆ yang ditunjukkan pada persamaan (6.1) tergantung pada M yaitu banyaknya elemen di dalam populasi. Sebuah metoda untuk menaksir μ ketika M tidak diketahui akan dibahas pada bagian selanjutnya. Sebagai catatan bahwa s i2 merupakan varians sampel untk sampel yang terpilih pada klaster ke-i. Penaksir tak bias dari total populasi dapat diperoleh dengan cara mengalikan nilai dari taksiran tak bias rata-rata populasi dengan banyaknya elemen dalam populasi seperti halnya penggunaan pada sampling acak sederhana. Dengan demikian, ˆ merupakan penaksir yang tak bias dari τ untuk sampling klaster dua tahap. Mμ

Taksiran Total Populasi, τ : n

ˆτ = Mμ ˆ = N

¦ M i yi i =1

n

dengan mengasumsikan sampling acak sederhana pada tiap tahap. Taksiran Varians dari ˆτ : ˆ) Vˆ (ˆτ) = M 2Vˆ (μ § N − n · §¨ N =¨ ¸ © N ¹ ¨© n

2

· 2 N ¸ sb + ¸ n ¹

§ M − mi M i2 ¨¨ i © Mi i =1 n

¦

· § s i2 ¸¨ ¸¨ m ¹© i

· ¸ ¸ ¹

dengan s b2 telah dibahas pada persamaan (6.3) dan s i2 pada persamaan (6.4)

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲͲ

Batas Kekeliruan Taksiran δ = 2 Vˆ (ˆτ) ˆ) = 2 M 2Vˆ (μ

VI. 4 Penaksir Rasio dari Rata-rata Populasi

Penaksir μˆ yang diberikan pada persamaan (6.1) bergantung pada jumlah total dari elemen-elemen dalam populasi, M. Seringkali M tidak diketahui. Jika kondisinya seperti itu, maka harus ditaksir dari data sampel. Penaksir untuk M diperoleh dengan mengalikan rata-rata ukuran klaster,

n

¦Mi

n , dengan jumlah klaster dalam populasi,

i =1

N. Proses seperti merupakan suatu penaksir rasio, dilambangkan dengan μˆ r , karena

baik itu pembilang maupun penyebut keduanya merupakan variabel acak. Taksiran Rasio Rata-rata Populasi μ: m

ˆr = μ

¦ M i yi i =1 n

¦Mi i =1

Taksiran Varians dari μˆ r : 1 § N −n ·§ 1 · 2 ˆr)= ¨ Vˆ (μ ¸ sτ + ¸¨ 2 N nNM 2 © ¹ © nM ¹

§ M −m ¦ M i2 ¨¨ iM i i © i =1 n

· § s i2 ¸¨ ¸¨ m ¹© i

· ¸ ¸ ¹

dengan n

s τ2 =

¦ M i2 ( y i − μˆ r )2 i =1

n −1

dan mi

s i2 =

¦ (y ij − yi )2 i =1

mi − 1

i = 1, 2 , ..., n

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲͳ

Batas Kekeliruan Taksiran: ˆr) δ = 2 Vˆ (μ

Taksiran μˆ r adalah bias, tapi bias tersebut dapat diabaikan jika n besar. Taksiran Proporsi Populasi

Suatu permasalaha dalam menaksir suatu proporsi populasi, π, seperti proporsi masyarakat yang menyukai produk tertentu. Suatu penaksir π dapat diperoleh dengan menggunakan μˆ (pada persamaan 6.1), atau μˆ r sebagaimana yang diberikan pada persamaan (6.9), dan dengan mengambil nilai yij = 1 atau 0 yang bergantung pada kondisi apakah elemen ke-j dalam klaster ke-i termasuk ke dalam kategori yang dimaksud atau tidak. Oleh karena M selalu tidak diketahui, maka dibuat formula untk menaksir π dengan menggunakan suatu taksiran rasio yang sejalan dengan μˆ r yang diberikan pada persamaan (6.9). Misalkan p merupakan proporsi dari elemen-elemen yang diambil sebagai sampel dari klaster i yang termasuk pada kategori yang dimaksud. Penaksir Proporsi Populasi π : n

p=

¦ M i ˆp i i =1 n

¦Mi i =1

Taksiran varians π : § N − n · §¨ 1 Vˆ ( p ) = ¨ ¸ © N ¹ ¨© n M 2

· 2 ¸ si + 1 ¸ nNM 2 ¹

n

§ M i − mi © Mi

¦ M i2 ¨¨ i =1

· § pi qi · ¸¨ ¸ ¸ ¨ m −1 ¸ ¹© i ¹

dengan n

s r2 =

¦ M i2 ( pi − p )2 i =1

n −1

dan q i = 1 − pi

Batas Kekeliruan Taksiran:

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲʹ

δ = 2 Vˆ ( p )

VI. 6 Sampling Klaster Berukuran Sama

Dimisalkan bahwa masing-masing klaster mengandung M elemen, yaitu: M1 = M2 = … = MN = M

Dalam kasus ini, merupakan hal yang wajar apabila sampel yang diambil pun memiliki ukuran yang sama untuk tiap klaster, yaitu : m1 = m2 = … = mN = m

Di bawah kondisi seperti ini, persamaan (6.1) menjadi: n

¦ M i yi §N·

ˆ =¨ ¸ μ ©M ¹

i =1

n n

§ N · =¨ ¸ © NM ¹

=

M ¦ yi i =1

n

1 n ¦ yi n i =1

yang ekivalen dengan rata-rata sampel secara keseluruhan ˆ = μ

1 nm

n

m

¦ ¦ y ij i =1 j =1

dimana yij merupakan ukuran ke – j dalam klaster ke-i. Kondisi seperti ini dapat terjadi dalam sampling produk-produk yang berbentuk paket (sebagai contohnya masing-masing klaster terdiri atas 1 lusin / 24 kaleng sayuran) atau dalam sampling barang-barang manufacture. Persamaan (6.2) menjadi: MSB § 1 · MSW ˆ ) = (1 − f 1 ) Vˆ (μ + (1 − f 2 )¨ ¸ nm ©N¹ m

dimana f 1 = n N , f 2 = m M MSB =

m n ( y i − μˆ )2 n − 1 i =1

¦

dan

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲ͵

MSW = =

n 1 n(m − 1) i =1

m

¦ ¦ (y ij − y i )2

1 n

j =1

n

¦ s i2 i =1

MSB (Between-Claster Mean Square) merupakan rata-rata kuadrat antar klaster dan MSW (Within-Claster Mean Square) rata-rata kuadrat dalam klaster.

Dari persamaan 6.19 di atas, dapat dibuat suatu rangkaian observasi yang penting pada karakteristikdari sampling klaster dua tahap sebgai beikut: MSW 1. Jika N besar, Vˆ (μˆ ) = dan hanya bergantung pada rata-rata klaster. Dengan nm

demikian, dapat dihasilkan suatu taksiran yang baik dari varians μˆ sekalipun bentuk s i2 merpakan taksiran yang kurang baik untuk varians dalam klaster. Hal ini bisa terjadi, sebagai contohnya, jika sampling sistematik digunakan dalam klaster-klaster. 2. Jika m = M (atau f2 = 1), maka samping klaster dua tahap dikurangi menjadi samping klaster satu tahap, sebagaimana yang telah dibahas pada bab 5. 3. Jika n = N, maka MSW ˆ ) = (1 − f 2 ) Vˆ (μ nm

yang merupakan taksiran varians yang diperoleh dalam suatu sampel acak stratifikasi dengan n = N strata dan m observasi dari masing-masing strata. Oleh karena itu, terlihat bahwa m mendekati M , sampling klaster dua tahap memiliki proses yang sama dengan sampling kalster satu tahap. Ketika n mendekati N, sampling klaster dua tahap berkelakuan seperti sampling acak stratifikasi. Jika elemen-elemen di dalam klaster bersifat heterogen, maka harus dijadikan sebagai sampel dalam penelitian. Ketika N besar, taksiran varians 1 ˆ)= Vˆ (μ MSB nm

akan menaksir varian yang sebenarnya; σ2 º 1ª ˆ ) = «σ b2 + w » Vˆ (μ n «¬ m »¼

dengan Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲͶ

σ b2 = varians di antara rata-rata klaster

dan σ 2w = varians di antara elemen-elemen dalam klaster-klaster.

Karena MSB/m menaksir σ b2 + σ 2w /m , dan MSW menaksir σ 2w , maka jika suatu pola: 1 [MSB − MSW ] m

akan menaksir σ b2 . Taksiran secara terpisah dari σ b2 dan σ 2w diperlukan untuk perhitungan ukuran sampel. Sebagaimana dalam kasus sampling acak stratifikasi, selanjutnya akan dicari ukuran sampel m dan n yang akan meminimalkan V (μˆ ) untuk biaya tertentu atau meminimalkan total biaya sampling untuk V (μˆ ) tertentu. Dimisalkan bahwa biaya dari masing-masing klaster adalah c1 dan biaya dari masing-masing elemen di dalam klaster adalah c2. Maka biaya total adalah: c = nc1 + nmc2

Nilai m yang akan meminimumkan V (μˆ ) untuk biaya tertentu, atau meminimalkan c untk varians tertentu, diberikan melalui persamaan berikut: m =

σ 2w c1 σ b2 c 2

Setelah m ditentukan, n diperoleh dari persamaan (6.21) jika V (μˆ ) tertentu nilainya atau dari persamaan (6.23) jika c tertentu. Sebagai catatan bahwa m meningkat nilainya jika σ 2w meningkat dan m akan menurun jika σ b2 meningkat. Dengan demikian, lebih banyak elemen-elemen dalam klaster yang dijadikan sebagai sampel (dan karenanya, akan sedikit klaster yang akan dijadikan sebagai sampel) sebagaimana σ 2w yang lebih besar bila dibandingkan dengan σ b2 . VI. 7 Sampling Klaster Dua Tahap dengan Peluang Sebanding Ukuran

Oleh karena banyaknya elemen di dalam sebuah klaster berbeda-beda, sebuah teknik yang seringkali menguntungkan untuk digunakan adalah mengambil kklaster-klaster dengan peluang yang sebanding dengan ukurannya. Biasanya, sampling psu digunakan pada tahap pertama dari prosedur sampling klaster dua

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲͷ

tahap karena elemen-elemen dalam klaster cenderung memiliki ukuran yang sama. Oleh karena itu, akan diberikan taksiran dari μ dan τ untuk sampling klaser dua tahap dimana tahap pertama dari samplingnya mempunyai peluang yang sebanding dengan ukurannya.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲ͸

TINJAUAN MATA KULIAH BAB VIII Klasifiklasi Sampling VIII.1 Sampling Peluang

Ditinjau dari sudut kesempatan semua unit sampling untuk terpilih menjadi anggota sampel, maka sampling terbagi dalam dua bagian yaitu sampling random dan sampling nonrandom, atau disebut juga sampling peluang dan sampling nonpeluang. Suatu proses pengambilan sampel dikatakan random bila semua unit sampling mempunyai peluang untuk bisa terpilih menjadi anggota sampel. Apabila dalam proses memilih satuan sampling dilibatkan unsur peluang sedemikian rupa sehingga besarnya peluang setiap satuan sampling untuk terpilih diketahui besarnya, maka sampling tersebut digolongkan ke dalam sampling peluang. Pada sampling peluang, peluang tiap elemen untuk terpilih sebegai sampel harus diketahui. Untuk tujuan ini, maka daftar elemen untuk memilih sampel (kerangka sampling) harus tersedia. Ke dalam sampling peluang dapat digolongkan beberapa teknik pengambilan sampel. Selain bagaimana teknik pengambilan sampel yang harus dikerjakan agar setiap unit mempunyai peluang terambil menjadi anggota sampel, dalam sampling peluang juga dibahas berapa banyak unit sampling yang harus diambil. a. Simpel Random Sampling (SRS)

Sampling Acak Sederhana ini merupakan suatu proses memilih satuan sampling dari

populasi sedemikian rupa sehingga setiap satuan sampling dalam populasi

mempunyai peluang yang sama besar untuk terpilih ke dalam sampel dan peluang itu diketahui sebelum pemilihan dilakukan.Terdapat dua cara dalam pengambilan sampling acak sederhana ini, yaitu dengan pengembalian (with replacement), yang mana dalam proses ini adanya kemungkinan bahwa suatu unit akan terpilih lebih dari satu kali dan tanpa pengembalian (without replacement) yang mana semua unit yang terpilih tidak akan ada yang sama.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͲͻ

Proses sampling dengan Sampling Acak Sederhana digunakan apabila memenuhi beberapa kondisi sebagai berikut : -

Variabel yang akan diteliti keadaannya relatif homogen dan tersebar merata di seluruh populasi.

-

Apabila bisa disusun secara lengkap kerangka sampling yang menyangkut setiap satuan pengamatan yang ada dalam populasi.

b. Systematic Sampling (SS)

Suatu proses memilih dikatakan sampling sistematik apabila dalam pemilihan itu dilakukan pemilihan sistematik setelah terpilih bilangan acak, dengan syarat bahwa peluang terpilihnya 1 N . Sampling sistematik digunakan apabila : 1. Bisa disusun kerangka sampling yang lengkap 2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata di seluruh populasi c. Stratified Random Sampling (StRS)

Sampling ini dilakukan apabila dalam keadaan tertentu Sampling Acak Sederhana kurang baik untuk digunakan karena akan memberikan presisi suatu taksiran yang rendah. Sampling Acak Sederhana akan memberikan presisi yang tinggi apabila karakteristk populasi bersifat homogen. Akan tetapi jika keadaan populasi relative heterogen, maka kita akan menggunakan StRS. pembentukan strata atau stratifikasi dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya suatu presisi akan bergantung kepada derajat homogenitas yang dicapai dalam strata, atau dapat pula dikatakan bergantung pada seberapa besar variabilitas karakteristik yang akan diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya bergantung kepada efektifitas pembentukan strata. Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasi yang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompok populasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahli di lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳͲ

digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yang lainnya. Apabila secara cermat strata sudah terbentuk, maka sampel untuk masingmasing stratum dipilih melalui metode Sampling Acak Sederhana. Karena dilakukan dengan metode Sampling Acak Sederhana, maka tentunya harus tersedia kerangka sampling dalam setiap stratum. d. Cluster Sampling (CS)

Cluster sampling dilakukan apabila peneliti ingin menekan biaya sampling atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak tersedia. Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan atau kelompok (cluster) elemen (unit observasi). Proses pegambilan sampling klaster dilakukan dengan memperhatikan kerangka sampling yang berisikan daftar klaster. Pengambilan sampel kemudian dilakukan dengan mengambil secara acak klaster-klaster. Unit sampling yang berisikan klaster-klaster dinamakan unit sampling utama (primary sampling unit) disingkat USU. Apabila semua unit observasi dalam USU menjadi anggota sampel maka dikatakan bahwa proses pengambilan sampel dilakukan dengan sampling klaster satu tahap. Namun apabila USU dibagi lagi ke dalam unit yang lebih kecil,

maka terdapat unit sampling ke dua (secondary sampling unit) disingkat USD. Apabila semua unit obervasi (elemen) dari USD menjadi anggota sampel, maka dikatakan proses pengambilan sampel dilakukan dengan sampling klaster dua tahap, demikian seterusnya.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳͳ

TINJAUAN MATA KULIAH BAB VII RASIO, REGRESI, DAN SELISIH PENAKSIRAN VII. 1 PENDAHULUAN

Penaksiran rata-rata dan total populasi dalam bab-bab sebelumnya didasari dari sebuah sampel respon pengukuran, y1, y2, y3,...yn , seperti dengan simple random sampling dan stratified random sampling. Kadang-kadang variabel-variabel lain

berkorelasi sangat dekat dengan respon y. Dengan mengukur y dan satu atau lebih variabel-variabel tambahan, kita bisa mendapatkan informasi tambahan untuk menaksir rata-rata populasi. Anda mungkin mengenal penggunaan variabel-variabel tambahan untuk menaksir rata-rata dari sebuah respon y. Ini merupakan dasar dari konsep korelasi dan rata-rata, untuk pengembangan dari prediksi persamaan relasi y dan x dengan metode kuadrat terkecil. Topik ini umumnya terdapat di buku pengenalan statistika ( Mendenhall, 1987, Bab 10 ). Pada bab-bab sebelumnya diperlihatkan penaksir-penaksir sederhana dari parameter-parameter dengan memanfaatkan respon pengukuran,

y1, y2, y3,...yn ;

bagaimana pun, penekanan utamanya didasarkan kepada desain sampel survey ( simple dan stratified sampling ). Sebaliknya, pada bab ini akan dijelaskan tiga cara

baru dari penaksiran berdasarkan penggunaan variabel tambahan x. Metode-metode tersebut yaitu, rasio, regresi, dan selisih estimasi. Ketiganya membutuhkan dua variabel pengukuran, x dan y , dalam setiap elemen sampel. Macam-macam desain sampling bisa menggunakan ketiga metode di atas, tapi kita akan membicarakan simple random sampling. Penaksiran rasio akan digunakan dalam stratified random sampling untuk menunjukkan ide dasar bagaimana ketiga metode ini digunakan. VII.2

SURVEY-SURVEY

YANG

MEMBUTUHKAN

PENGGUNAAN

PENAKSIR RASIO

Penaksiran yang efisien dari total populasi kadang-kadang membutuhkan penggunaan variabel tambahan. Kita ilustrasikan penggunaan dari rasio penaksir dalam suatu situasi berikut ini. Harga yang dibayarkan untuk jeruk dalam pengiriman Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳͷ

yang besar berdasarkan dari isi gula dari berat pengiriman. Isi gula yang tepat tidak bisa ditentukan sebelum pembelian dan penyaringan jus buah dari keseluruhan beban; namun, bagaimana pun hal tersebut bisa kita taksir. Satu metode untuk menaksir hal diatas yaitu pertama kali kita tentukan rata-rata isi gula dalam tiap jeruk, μ y , kemudian mengalikannya dengan jumlah jeruk N dalam muatan. Kemudian kita ambil sampel n jeruk secara acak dari muatan untuk menentukan isi gula y untuk masing-masing jeruk. Rata-rata dari pengukuran , y1, y2, y3,...yn , akan menaksir μ y ; N y akan menaksir total isi gula dalam muatan, IJy. Sayangnya, metode ini tidak mungkin dilakukan karena terlalu membutuhkan banyak waktu dan biaya dalam menentukan N (yaitu dalam menentukan jumlah jeruk dalam muatan). Kita dapat menghindari untuk menghitung N dengan mencatat beberapa fakta. Pertama, isi gula dalam tiap jeruk , y , berkorelasi cukup dekat dengan berat dari jeruk, x; kedua, rasio dari total gula IJy dengan total berat dari muatan IJx sama dengan rasio dari rata-rata isi gula dalam tiap jeruk μ y dengan rata – rata berat jeruk μ x. Maka:

μ y Nμ y τ y = = μ x Nμ x τ x untuk mengetahui total isi gula dari muatan, kita mendapatkan

τy =

μy (τ x ) μx

Kita dapat menaksir μ y dan μ x dengan menggunakan y dan x , rata-rata dari isi gula dan berat jeruk dari sampel n jeruk. Kita juga dapat mengukur IJx, yang merupakan total berat dari jeruk dalam muatan truk. Kemudian penaksiran rasio dari total isi gula

IJy yaitu: ∧

τy =

y (τ x ) x

atau, sama dengan ( mengalikan pembilang dan penyebut dengan n ). n

y τ y = (τ x ) = x ∧

¦y

i

¦x

i

i =1 n

(τ x )

i =1

Dalam kasus ini jumlah elemen populasi, N, tidak diketahui, dan karena itu kita tidak dapat menggunakan penaksir sederhana N y untuk menaksir total populasi

IJy . Jadi, penaksir rasio diperlukan untuk menyelesaikan objek penaksiran. Bagaimana Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳ͸

pun, jika N diketahui, kita punya pilihan apakah akan menggunakan penaksir N y atau penaksir rasio untuk menaksir IJy. Jika y dan x kerkorelasi cukup tinggi, berarti x memberikan kontribusi untuk memprediksi y, penaksir rasio harus lebih baik dari N y , yang semata-mata tergantung pada y .

Dalam penjumlahan untuk mendapatkan total populasi IJy, sering ada parameteparameter lain yang terlibat. Kita mungkin akan menaksir rata-rata populasi μ y, dengan menggunakan prosedur penaksiran rasio. Sebagai contoh, misalkan kita akan menaksir rata-rata isi gula dalam tiap jeruk dalam pengiriman yang berskala besar. Kita akan menggunakan rata-rata sampel y untuk menaksir μ y. Bagaimana pun, jika y dan x berkorelasi, penaksir rasio yang menggunakan informasi dari variabel pembantu x sering kali memberikan penaksir yang lebih tepat untuk μ y.

Rasio populasi merupakan parameter lain yang mungkin terlibat sebagai faktor koreksi. Sebagai contoh, asumsikan kita akan menaksir rasio dari penjualan mobil untuk tiga bulan pertama dalam tahun ini dengan total penjualan di periode yang sama di tahun yang lalu. Misalkan IJx merupakan total penjualan dalam tiga bulan pertama di tahun yang lalu, sedangkan IJy total penjualan dalam periode yang sama di tahun ini. Kita perhatikan dalam penaksiran rasio yaitu: R=

τy τx

Kosep dari penaksiran rasio di gunakan dalam analisis data untuk surveysurvey penting dan secara praktis digunakan oleh pemerintah, dunia bisnis, dan peneliti di akademik. Sebagai contoh, indeks harga konsumen (IHK) sebenarnya merupakan rasio dari harga-harga pembelian yang tetap dari barang-barang yang konstan kualitas dan kuantitasnya untuk dua waktu. Sekarang ini, IHK merupakan perbandingan harga hari ini dengan harga tahun 1967. IHK berdasarkan pada pengumpulan data tiap bulan atau setiap beberapa bulan dari 24000 penetapan ( tokotoko, rumah sakit-rumah sakit, dan lain-lain) yang dikumpulkan dari 85 kota di seluruh negara. IHK digunakan untuk mengukur tingkat inflasi. The Current Population Survey mendapatkan informasi pengangguran yang

menggambarkan tentang usia, jenis kelamin dan ras pengangguran, menggunakan teknik penaksiran rasio. Sebagai contoh, jumlah rasio pengangguran ras kulit hitam dengan yang sudah bekerja untuk area sampel tertentu bisa dikembangkan untuk menghitung jumlah pengangguran ras kulit hitam di area yang lebih besar dengan cara Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳ͹

mengalikan rasio sampel dengan jumlah orang ras kulit hitam yang bekerja di area yang lebih besar yang dimaksudkan sebelumnya. Index Retail Nielsen bisa menyediakan rasio dari rata-rata harga penjualan untuk dua merek produk yang bersaing atau satu produk dalam dua waktu yang berbeda. The SAMI bisa menyediakan rasio jumlah persediaan untuk dua merek yang bersaing. Peramalan sering menggunakan teknik penaksiran rasio. Sebagai contoh, rasio dari total periode pertama penjualan di tahun yang sedang berjalan dengan periode yang sama di tahun yang lalu, bisa dilakukan dengan cara mengalikan total penjualan tahun kemarin dengan rasio, untuk menaksir total penjualan tahun ini. Cara yang serupa juga bisa digunakan untuk pertumbuhan populasi manusia. Dalam penelitian di akademik, ahli sosiologi menghitung rasio total anggaran untuk makanan tiap bulannya dengan jumlah penghasilan per bulannya dari suatu keluarga, atau rasio dari jumlah anak dengan total orang yang bertempat tinggal di unit-unit rumah. Para peneliti medis dapat menghitung potensi relatif dari suatu obat baru dengan melihat rasio dari rata-rata jumlah permintaan obat baru dengan yang diperlukan untuk mendapatkan respon tertentu, dengan rata-rata jumlah dari obat yang standar yang diperlukan untuk mendapatkan respon yang sama. Seperti yang bisa anda lihat, kemunkinan untuk mengaplikasikan penaksiran rasio sangant banyak dan tidak akan berkesudahan. Bagaimana pun, kita akan menggeser penekanan kita ke cara mendapatkan penaksir μ y, IJy, dan R; dan kita akan mengaplikasikannya

dengan

angka

untuk

masing-masing

penaksir.

Dalam

melakukannya nanti, sewaktu-waktu kita akan membandingkan penaksir yang dijelaskan dengan hasil-hasil di bab-bab sebelumnya.

VII.3

PENAKSIRAN

RASIO

MENGGUNAKAN

SIMPLE

RANDOM

SAMPLING Kita asumsikan bahwa sampel acak sederhana dengan ukuran n didapatkan dari populasi terhingga dengan N anggota populasi. Kemudian, bagaimana kita menaksir rata-rata populasi μ y, total populasi IJy, dan rasio populasi R, dengan memanfaatkan informasi di sampel y dan variabel tambahan x? Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳͺ

Penaksir dari rasio populasi R : n

¦y

i

i =1 n

r=

¦x

(7.1)

i

i =1

Taksiran varian dari r :

§ n y ¨ ∧ ∧ ¦ i i =1 ¨ V (r ) = V n ¨ ¨ ¦ xi © i =1

· ¸ ¸ = § N − n ·§¨ 1 ¸ ¨© nN ¸¹¨ μ 2 © i ¸ ¹

n

( y i − rx i ) 2 ·¦ ¸ i =1 ¸ n −1 ¹

(7.2)

Rentang kekeliruan penaksiran : n

§ N − n ·§¨ 1 2 V (r ) = 2 ¨ ¸ 2 © nN ¹¨© μ i ∧

( y i − rxi ) 2 ·¦ ¸ i =1 ¸ n −1 ¹

(7.3) −

[Jika rata-rata dari populasi x, ȝx tidak diketahui, kita gunakan x untuk memperkirakan persamaan (6.2) dan (6.3).] Contoh 7.1

Dalam sebuah survei yang menyelidiki tentang trend pada real estate, seorang peneliti tertarik pada perubahan relatif selama lebih dari 2 tahun dalam nilai perkiraan rumah pada sebuah komunitas yang khusus. Sampel acak sederhana dengan n = 20 rumah dipilih dari N = 1000 rumah dalam komunitas tersebut. Dari pencatatan pajak, peneliti mendapatkan nilai perkiraan untuk tahun ini ( y ) dan nilai sebenarnya dari 2 tahun yang lalu ( x ) untuk tiap sampel dengan n = 20 rumah. Dia berharap untuk memperkirakan R, perubahan relatif pada nilai perkiraan untuk N = 1000 rumah, dengan menggunakan informasi pada sampel. Data dari survei real estate ditunjukkan pada tabel 7.1. Kita telah menambahkan kolom xi2, yi2 dan xiyi , yang sangat penting untuk ∧

menghitung V (r ) .

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͳͻ

Dengan menggunakan data pada tabel 7.1, taksirlah R, perubahan relatif pada penilaian real estate selama periode 2 tahun yang diberikan. Cari juga rentang kekeliruan penaksiran.

Pembahasan Taksiran R dengan menggunakan data sampel diperoleh dengan § 20 ¨ ¦ yi r = ¨ i20=1 ¨ ¨¦x © i =1

· ¸ nilai total sebenarnya dari 20 rumah ¸= ¸ nilai total dari 20 rumah 2 tahun yang lalu ¸ ¹

dengan menggunakan tabel 6.1 r=

164.7 = 1.07 154.5

Karena itu, kita menaksir bahwa nilai real estate telah naik kurang lebih 7 % selama 2 tahun periode pada daerah yang diteliti. Tabel 7.1 Data dan perhitungan survei nilai real estate ( dalam $ 10,000 ) Rumah

Nilai

perkiraan

2

tahun

Nilai sebenarnya

xi

2

yi

2

xiyi

yang lalu ( xi )

( yi )

1

6.7

7.1

44.88

50.41

47.57

2

8.2

8.4

67.24

70.56

83.88

3

7.9

8.2

62.41

67.24

74.78

4

6.4

6.9

40.96

47.01

44.16

5

8.3

8.4

68.89

70.56

69.72

6

7.2

7.9

51.84

62.41

56.88

7

6.0

6.5

36.00

42.25

39.00

8

7.4

7.6

54.76

57.76

56.24

9

8.1

8.9

65.61

79.21

72.09

10

9.3

9.9

86.49

98.01

92.07

11

8.2

9.1

67.24

82.81

74.62

12

6.8

7.3

46.24

53.29

49.64

13

7.4

7.8

54.76

60.84

57.72

14

7.5

8.3

56.25

68.89

62.25

15

8.3

8.9

68.89

79.21

73.87

16

9.1

9.6

82.21

92.16

87.36

17

8.6

8.7

73.96

75.69

74.82

18

7.9

8.8

62.41

77.44

69.52

19

6.3

7.0

39.69

49.00

44.10

20

8.9

9.4

79.21

88.36

83.66

Jumlah

154.5

164.7

1210.55

1373.71

1288.95

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹͲ

Rentang kesalahan penaksiran didapatkan dengan menggunakan persamaan (7.3). Jalan singkat untuk menghitung

20

¦(y

i

− rxi ) 2 adalah dengan

i =1

20

¦(y i =1

20

i

20

20

− rxi ) 2 = ¦ y i + r 2 ¦ xi − 2r ¦ xi y i 2

i =1

2

i =1

(7.4)

i =1

Nilai-nilainya didapatkan dari tabel 6.1 : 20

¦(y

i

− rxi ) 2 = 1373.71 + (1.07) 2 (1210.55) − 2(1.07)(1288.95)

i =1

= 1.3157 Dengan menggunakan persamaan (7.3) n

§ § N − n ·¨ 1 2 V (r ) = 2 ¨ ¸ 2 © nN ¹¨¨ − ©x ∧

2 · ¦ ( y i − rxi ) ¸ i =1 ¸¸ n −1 ¹

n

§ § 1000 − 20 ·¨ 1 ¸¸¨ = 2 ¨¨ © 20(1000) ¹¨ (7.725) 2 ©

· ¦ (1.3157) ¸ i =1 = 0.015 ¸¸ 19 ¹ 2

Jadi, kita menaksir rasio dari nilai real estate sekarang dengan yang dua tahun yang lalu menjadi r = 1.07 dan kita sungguh yakin bahwa kesalahan penaksiran kurang dari 0.02. Karena itulah, rasio sebenarnya R untuk polpulasi seharusnya berada diantara 1.05 dan 1.09. Dengan catatan bahwa rentang kesalahan dari penaksiran cukup kecil. Karena itu r seharusnya menjadi penaksir yang cocok untuk R. Interval konfidensi untuk sampel besar yang didasai oleh teori distribusi normal, seperti yang ditunjukkan dalam bagian 2, mengaplikasikan contoh rasi estimasi dengan baik. Dengan demikian sebagai contoh, penaksiran inteval konfidensi 90 % untuk rasio R dalam bentuk ∧

r ± 1.645 V (r ) Taksiran varians r dapat dituliskan dalam berbagai bentuk. Salah satu yang lebih khusus yang berguna untuk menunjukkan koefisien korelasi ȡ antara x dan y. Korelasi ini dapat ditaksir oleh

ρ=

S xy SxSy

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹͳ

dimana Sxy = Sx2 =

− − 1 n ( xi − x)( y i − y ) ¦ n − 1 i =1

− 1 n ( x − x ¦ i ) n − 1 i =1

2

dan Sy2

− 1 n = ( y − y ¦ i ) n − 1 i =1

2

Koefisien korelasi akan memegang peranan kunci pada diskusi selanjutnya. Sekarang kita menuliskan ∧

V (r ) =

1− f n

§ 1 · 2 ∧ ¨ ¸( S + r 2 S 2 − 2 r ρ S S ) x x y ¨μ 2 ¸ y © x ¹

dimana f = n/N, fraksi sampling. Bentuk ini sering digunakan dengan perhitungan yang ditampilkan dengan paket-paket perangkat lunak dari statistika stansar. Sebagai contoh, Minitab membaca data pada sampel 7.1 adalah N

Mean

Stdev

x

20

7.725

0.947

y

20

8.235

0.957

Korelasi antara x dan y adalah 0.966 Dari rangkuman ini, 2 ­°§ ½° 20 ·§ 1 ·§ 1 · 2 2 2 V (r ) = ®¨1 − ¸¨ ¸¨ ¸ . (0.957 ) + (1.07) (0.947) − 2(1.07)(0.966)(0.947)(0.957) ¾ °¯© 1000 ¹© 20 ¹© 7.725 ¹ °¿ = 0.0000567

[



]



dan 2 V (r ) = 0.015, dianggap sama dengan perhitungan yang di awal. Ada analogi antara penaksir rasio dan analisis regresi klasik. Kami akan memperkenalkan salah satu dari analogi dengan tujuan perhitungan, dan menggali bagian lain dari hubungan tersebut nantinya. Dalam regresi klasik dalam populasi yang tidak terbatas, seandainya kita membuat model E (yi) = ȕxi Selanjutnya, jika varian yi proporsional terhadap xi. Kemudian, analisis regresi yang diboboti seharusnya digunakan, dengan bobot proporsi pada kedua variannya, atau Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹʹ

1/xi dalam kasus ini. Kuadrat terkecil biasa dalam analisi regresi yang terbobot dengan bobot 1/xi akan menghasilkan r sebagai penaksir ȕ. Standar deviasi dari ∧

koefisien regresi akan hampir sama dengan perhitungan 2 V (r ) kita yang pertama, kecuali untuk koreksi populasi yang terbatas. Hasil dari MINITAB untuk analisis regresi yang terbobot untuk data pada contoh 7.1 adalah 7KHUHJUHVVLRQHTXDWLRQLV \ [ 3UHGLFWRU&RHI6WGHYWUDWLRS 1R&RQVWDQ [ 

Jika taksiran koefisien 1.066 § 1.07 = r, dan ∧

2 V (r ) = 2 0.98 (0.00745) = 0.15 adalah seperti hasil perhitungan kita yang diawal. Pendekatan ini tentunya membawa kebosanan pada perhitungannya, tapi pengguna teknik ini seharusnya memiliki pengetahuan tentang regresi klasik disamping yang ada di buku ini. ( t-rasio dan pvalue yang ditunjukkan diatas, jika dalam populasi normal yang tidak terbatas, koefisien regresi akan berbeda secara signifikan terhadap nol). Tehnik rasio untuk menaksir total populasi IJy diaplikasikan dalam penaksiran −

toal isi gula dalam muatan truk jeruk. Penaksir sederhana dari N y tidak dapat digunakan karena kita tidak mengetahui N, total banyaknya jeruk dalam truk. Prosedur penaksiran rasio berikut dapat diaplikasikan dalam menaksir IJy apakah N diketahui atau tidak. ∧

Penaksir rasio dari total populasi τ y : n



τ y=

¦y

i

¦x

i

i =1 n

(τ x ) = rτ x

(7.5)

i =1



Varian dari taksiran τ y : n

( y − rx ) ·¦

§ N − n ·§¨ 1 ¸ V (τ y ) = (τ x ) 2 V (r ) = τ x2 ¨ ¸ 2 © nN ¹¨© μi ¸¹ ∧





Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

i

i =1

n −1

2

i

(7.6)

ͳʹ͵

dimana ȝx dan IJx adalah rata-rata populasi dan total, yang berturut-turut, dari variabel acak x. Rentang kesalahan dari penaksiran : n

§ N − n ·§¨ 1 2 V (τ y ) = 2 τ x2 ¨ ¸ 2 © nN ¹¨© μ x ^



( y i − rxi ) 2 ·¦ ¸¸ i =1 n −1 ¹

(7.7)

Dengan catatan meskipun kita tidak perlu mengetahui N atau ȝx , kita harus mengetahui IJx untuk menaksir IJy dengan menggunakan prosedur penaksiran rasio. Contoh 7.2 Dalam sebuah penelitan untuk menaksir total banyaknya gula dalam muatan truk jeruk, sebuah sampel acak dengan n = 10 jeruk dibuat menjadi jus dan diukur beratnya. Total berat dari semua jeruk, didapatkan dengan penimbangan pertama pada truk yang berisi muatan dengan kemudian truk yang dikosongkan, didapatkan 1800 pon. Taksirlah IJy , total jumlah gula pada jeruk, dan rentang kekeliruan penaksirannya Tabel 7.2 Jeruk 1 2 3 4 5 6 7 8 9 10 Total

Data untuk contoh 7.2

Jumlah gula (dalam pon) 0.021 0.030 0.025 0.022 0.033 0.027 0.019 0.021 0.023 0.025 0.246

Berat jeruk (dalam pon) 0.40 0.48 0.43 0.42 0.50 0.46 0.39 0.41 0.42 0.44 4.35

6ROXVL Gula yang terkandung dalam jeruk biasanya dicatat dalam derajat brix, yang merupakan pengukur berapa pon gula padat per 100 pon jeruk. Untuk menghitungnya kita akan menggunakan berapa pon kandungan yang sebenarnya untuk setiap jeruk. Taksiran τˆ y dapat diperoleh dengan menggunakan persamaan (7.5):

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹͶ

10

τˆ y = r τˆ x =

¦y

i

¦x

i

(τ x ) =

i =1 10

0.246 (1800) = 101.79 pon 4.35

i =1

Besarnya kekeliruan taksiran dapat dihitung dengan menggunakan versi modifikasi dari persamaan (7.7). Karena N tidak diketahui dalam contoh ini, kita asumsikan faktor koreksi populasi, (N-n)/N, mendekati nilai yang sama. Asumsi ini cukup beralasan karena kita mengharapkan sedikitnya N = 4000 jeruk di dalam sebuah truk kecil sekalipun. Rata-rata sampel x digunakan untuk menggantikan μx pada persamaan (7.7), karena μx tidak diketahui. Dengan demikian persamaan (7.7) menjadi n

§ 1 ·§ 1 · 2 Vˆ (τˆ y ) = 2 τ x2 ¨ ¸¨ 2 ¸ © n ¹© x ¹

¦(y

i

− rxi ) 2

i =1

n −1

Gunakan persamaan (7.4), untuk menghitung : 10

¦(y

10

10

10

i =1

i =1

i =1

− rxi ) 2 = ¦ y i2 + r 2 ¦ xi2 − 2r ¦ xi y i

i

i =1

dimana 10

r=

¦y

i

¦x

i

i =1 10

=

0.246 = 0.0566 4.35

i =1

Dari data, 10

¦y

2 i

= (0.021) 2 + (0.030) 2 + ... + (0.025) 2 = 0.006224

i =1

10

¦x

2 i

= (0.40) 2 + (0.48) 2 + ... + (0.44) 2 = 1.9035

i =1 10

¦y x i

i

= (0.021)(0.40) + (0.030)(0.48) + ... + (0.025)(0.44) = 0.10839

i =1

x=

4.35 = 0.435 10

Substitusikan ke dalam persamaan (7.4) didapat

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹͷ

10

10

10

10

i =1

i =1

i =1

i =1

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi = 0.006224 + (0.0566)2 (1.9035) - 2 (0.0566) (0.10839) = 0.000052285 Maka kekeliruan penaksirannya adalah 10

§ 1 ·§ 1 · 2 Vˆ (τˆ y ) = 2 τ x2 ¨ ¸¨ 2 ¸ © n ¹© x ¹

¦(y

i

− rxi ) 2

i =1

n −1

º§ 0.000052285 · 1 § 1 ·ª = 2 (1800) 2 ¨ ¸ « ¸ = 6.3 2 »¨ 9 © 10 ¹ ¬ (0.435) ¼© ¹ Kesimpulannya, rasio penaksiran total gula dalam truk jeruk adalah τˆ y = 101.79 pon, dengan kekeliruan penaksiran 7.3. Kita yakin bahwa total kandungan gula τy berada pada interval 101.79 ± 6.3 sehingga, intervalnya berada pada 95.49 sampai 108.09 pon. Selain itu, deskriptif statistik, yang diperlihatkan di bawah ini dari output Minitab, dapat digunakan untuk menghitung Vˆ (r ) , bagian utama dari Vˆ (τ y ) .

N

Rata-rata

Stdev

x

10

0.4350

0.0354

y

10

0.02460

0.00438

Korelasi x dan y = 0.991

Analisis regresi yang diboboti dengan garis lurus melalui titik pangkalnya menghasilkan : Persamaan regresinya adalah

y = 0.0566 x

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹ͸

3UHGLNWRU Konstanta

.RHI  -

6WGHY -

UDVLRW -

 -

x

0.056552

0.001719

32.90

0.000

S

Maka didapat, 2 Vˆ (τ y ) = 2τ x Vˆ (r ) = 2 (1800) (0.001719) = 6.19 yang sangat dekat dengan hasil yang diberikan oleh metode perhitungan yang sebelumnya. Anda akan mengatakan bahwa populasi berukuran N seringkali diketahui. Oleh karena itu, peneliti harus memutuskan dalam kondisi bagaimana menggunakan penaksir rasio τˆ y = rτx lebih baik dibandingkan dengan menggunakan penaksir koresponding Ny , dimana kedua penaksir didasarkan pada SRS_Sampling Acak Sederhana (lihat bagian 7.5). Umumnya, rτx mempunyai varians yang lebih kecil daripada Ny apabila terdapat korelasi positif yang kuat antara x dan y, (dimana ρ , koefisien korelasi antara x dan y, lebih besar dari ½ ). Secara intuisi, pernyataan ini masuk akal karena dalam penaksiran rasio kita menggunakan informasi tambahan dari penambahan variabel x.



Jika peneliti lebih tertarik dengan rata-rata populasi daripada total populasi,

prosedur penaksiran rasio koresponding ditunjukkan dalam persamaan (7.8), (7.9), dan (7.10). Penaksir rasio rata-rata populasi μ y : n

μˆ y =

¦y

i

¦x

i

i =1 n

( μ x ) = rμ x

(7.8)

i =1

Varians taksiran dari μˆ y : n

( y i − rxi ) 2 ¦ § · − N n 1 § ·¨ i =1 Vˆ ( μˆ y ) = μ x2Vˆ (r ) = μ x2 ¨ ¸¨ 2 ¸¸ n −1 © nN ¹© μ x ¹

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(7.9)

ͳʹ͹

Taksiran kekeliruannya : n

§ N −n· 2 Vˆ ( μˆ y ) = 2 ¨ ¸ © nN ¹

¦(y

i

− rxi ) 2

i =1

(7.10)

n −1

Catatan bahwa kita tidak perlu mengetahui τ x atau N untuk menaksir μ y ketika menggunakan prosedur rasio; tetapi μ x harus kita ketahui.

‘–‘ŠͽǤ͹ Sebuah perusahaan ingin menaksir rata-rata jumlah uang μ y yang dibayarkan kepada karyawan untuk biaya pengobatan selama tiga bulan pertama pada kalender tahunan. Laporan rata-rata setiap tiga bulan ini didapat dari

laporan keuangan tahun

sebelumnya. Sampel acak sebanyak 100 karyawan diambil dari populasi sebanyak 1000 karyawan. Hasilnya dinyatakan sebagai berikut. Gunakan data tersebut untuk memprediksi μ y dan untuk menempatkan kekeliruan penaksiran.

n = 100,

N = 1000

Total tiga bulan terakhir : 100

¦y

i

= 1750

i =1

Total tiga bulan koresponding tahun sebelumnya : 100

¦x

i

= 1200

i =1

Total populasi τ x untuk tiga bulan koresponding tahun sebelumnya :

τ x = 12500 100

¦

2 i

y = 31,650,

i =1

100

¦x

2 i

= 15,620,

i =1

100

¦y x i

i

= 22,059.35

i =1

Solusi Taksiran untuk μ y adalah

μˆ y = rμ x

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹͺ

dimana

μx =

τx

=

N

12,500 = 12.5 1000

Maka 100

μˆ y =

¦y

i

¦x

i

i =1 100

1750 (12.5) = 18.23 1200

(μ x ) =

i =1

Taksiran kekeliruan didapat dengan menggunakan persamaan (7.10); tetapi kita harus menghitung terlebih dahulu 100

100

100

100

i =1

i =1

i =1

i =1

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi = 31.650 + (1.4583)2 (15,620) - (2.9166) (22,059.35) = 441.68 Substitusikan ke dalam persamaan (7.10) memberikan taksiran kekeliruan : n

§ N −n· 2 Vˆ ( μˆ y ) = 2 ¨ ¸ © nN ¹ = 2

¦(y

i

− rxi ) 2

i =1

n −1

1000 − 100 § 441.68 · ¨ ¸ = 0.42 100(1000) © 99 ¹

Maka taksiran rata-rata jumlah uang yang dibayar kepada karyawan untuk biaya pengobatan $18.23. Kita sangat yakin bahwa kekeliruan untuk taksiran μ y kurang dari $0.42. Untuk mengingat rumus taksiran rasio dari rata-rata populasi, total, atau rasio, kita membuat asosiasi berikut. Rasio sampel r dinyatakan dalam rumus berikut n

r=

¦y

i

i =1 n

¦x

i

i =1

(7.11) Penaksir R , τ y , dan μ y adalah

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳʹͻ

Rˆ = r (7.12)

τˆ y = rτ x (7.13)

μˆ y = rμ x (7.14) Jadi kita hanya perlu mengetahui rumus r dan hubungannya dengan μˆ y dan τˆ y . Taksiran varians bisa diperoleh dengan mengingat rumus dasar, n

( y i − rxi ) 2 ¦ § · 1 − N n § · i =1 Vˆ (r ) = ¨ ¸¨¨ 2 ¸¸ nN n −1 μ © ¹© x ¹

(7.15)

Maka Vˆ (τˆ y ) = τ x2Vˆ (r ) Vˆ ( μˆ y ) = μ x2Vˆ (r )

(7.16) (7.17)

VII.4 MENENTUKAN UKURAN SAMPEL Kita menyatakan sebelumnya bahwa jumlah informasi yang dimuat dalam sampel bergantung pada variasi dalam data (yang sering dikontrol dengan disain sampling survey) dan jumlah observasi n yang termasuk dalam sampel. Setelah disain sampling ditentukan, peneliti harus menentukan jumlah bagian-bagian yang akan digambar. Kita akan menentukan ukuran sampel yang dibutuhkan untuk menaksir parameter populasi R, μ y , atau τ y dalam B unit untuk sampling acak sederhana dengan menggunakan penaksir rasio. Catatan bahwa prosedur untuk memilih ukuran sampel n identik dengan yang ditunjukkan pada bagian sebelumnya. Jumlah observasi yang dibutuhkan untuk menaksir R, sebuah rasio populasi, dengan taksiran kekeliruan sebesar B diperoleh dengan menetapkan dua standar deviasi dari penaksir rasio r sama dengan B dan nyatakan untuk n. Sehingga kita harus menyelesaikan

2 V (r ) = B Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(6.18)

ͳ͵Ͳ

^

dengan B adalah bound of error dari penaksiran. Dan V (r ) sebagai penaksir varians dari r diperoleh melalui persamaan: n

§ N − n ·§¨ 1 V (r ) = ¨ ¸ 2 © nN ¹¨© μ x ^

( yi − rxi ) ·¦ i =1 ¸ ¸ n −1 ¹

2

(7.19)

^ § N − n ·§¨ 1 ·¸ 2 atau : V (r ) = ¨ ¸ 2 s © nN ¹¨© μ x ¸¹

(7.20)

dengan n

s2 =

¦(y

i

− rxi ) 2

i −1

n −1 ^

Varians populasi V(r) yang mendekati dapat diperoleh dari V (r ) dengan mengganti s 2 oleh σ 2 . Maka jumlah observasi n yang diperlukan untuk menaksir R dengan bound of error B dapat diperoleh dengan mencari solusi untuk n dari persamaan berikut ini : § N − n ·§¨ 1 ·¸ 2 2 V (r ) = 2 ¨ ¸ 2 σ =B © nN ¹¨© μ x ¸¹

(7.21)

Ukuran sampel yang diperlukan untuk menaksir R dengan bound of error B adalah :

n=

Nσ 2 ND + σ 2

D=

B 2 μ x2 4

(7.22)

dengan

Dalam kenyataan di lapangan kita seringkali dihadapkan pada permasalahan dalam menentukan ukuran sampel karena σ 2

tidak diketahui. Jika informasi yang

diperlukan untuk menghitung s 2 sebagai penaksir dari σ 2 tidak tersedia, maka kita mengambil sebuah sampel pendahuluan berukuran n ' .

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵ͳ

n'

^ 2

σ =

¦(y

i

− rxi ) 2

i −1

n' −1

kemudian kita substitusikan hasil dari persamaan ini untuk σ 2 pada persamaan (7.22), maka kita akan mendapatkan ukuran sampel yang mendekati. Jika μ x juga −

tidak diketahui, maka μ x dapat digantikan oleh rata-rata sampel x , yang dihitung dari n ' yang diperoleh pada penelitian pendahuluan.

Contoh7.4

: Sebuah perusahaan perakitan berkeinginan untuk menaksir rasio

perubahan hilangnya jam kerja karyawan dikarenakan sakit antara tahun lalu dengan tahun ini. Sebuah penelitian pendahuluan dengan n ' = 10 orang pekerja telah dilakukan, dan hasilnya disajikan pada tabel di bawah. Catatan perusahaan menunjukkan bahwa jumlah total jam kerja karyawan yang hilang karena sakit adalah sebesar

τ x = 16,300.

Dengan data yang telah tersedia kita akan

menentukan ukuran sampel yang diperlukan untuk menaksir R , dengan besarnya bound of error B = 0.01. Diasumsikan bahwa perusahaan memiliki 1000 orang karyawan (N = 1000). Pekerja 1 2 3 4 5 6 7 8 9 10

Jam kerja karyawan yang hilang untuk tahun yang lalu, x 12 24 15 30 32 26 10 15 0 14

Jam kerja karyawan yang hilang untuk tahun yang sedang dijalani, y. 13 25 15 32 36 24 12 16 2 12

178

187

3HPHFDKDQ Pertama kita menghitung penaksir dari σ 2 dengan menggunakan data yang diperoleh dari penelitian pendahuluan Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵ʹ

10

^ 2

σ =

¦(y

i

− rxi ) 2

i =1

9

Dengan : 10

10

10

10

i =1

i =1

i =1

i =1

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi Kemudian, dari data yang disajikan pada tabel kita akan menentukan : 10

¦y

2 i

= (13) 2 + (25) 2 + ... + (12) 2 = 4463

2 i

= (12) 2 + (24) 2 + ... + (14) 2 = 4066

i =1 10

¦x i =1

¦x y i

= (12)(13) + (25)(42) + ... + (14)(12) = 4066

i

10

¦y

i

¦x

i

i =1 10

r=

=

187 = 1.05 178

i =1

10

10

10

10

i =1

i =1

i =1

i =1

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi = 4463 + (1.05) 2 (4066) − 2(1.05)(4245) = 31.625 dan 10

^ 2

σ = D=

¦(y

i

− rxi ) 2

i =1

9

=

31.625 = 16.3 9

B 2 μ x2 (0.01) 2 (16.3) 2 = = 0.006642 4 4

6HNDUDQJ NLWD GDSDW PHQHQWXNDQ XNXUDQ VDPSHO \DQJ GLSHUOXNDQ GHQJDQ PHQJJXQDNDQ SHUVDPDDQ  6HEDJDLFDWDWDQEDKZD

μx =

τx N

=

16.300 = 16.3 1000

dan

B 2 μ x2 (0.01) 2 (16.3) 2 = = 0.006642 D= 4 4 dengan demikian Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵͵

^ 2

n=



^ 2

=

ND + σ

1000(3.474) = 343.416 1000(0.006642) + 3.474

Maka untuk menaksir R, tingkat perubahan jam kerja karyawan yang hilang karena sakit, dengan bound of error dari penaksiran sebesar B = 0.01 jam kita memerlukan sebanyak 344 orang karyawan untuk diteliti. Dengan cara yang sama, kita dapat menentukan jumlah observasi n yang diperlukan untuk menaksir rata-rata populasi μ y , dengan bound of error dari penaksiran sebesar B. Ukuran sampel yang diperlukan untuk menaksir μ y diperoleh dengan mencari solusi untuk n dari persamaan berikut : ^

2 V (μ y ) = B

(7.23)

Persamaan tersebut juga dapat dinyatakan sebagai berikut :

2μ x V (r ) = B Ukuran sampel yang diperlukan untuk menaksir μ y dengan bound of error penaksiran B adalah :

n=

Nσ 2 ND + σ 2

D=

B2 4

dengan

Sebagai catatan bahwa untuk menentukan n pada persamaan (7.24) kita tidak perlu mengetahui nilai μ x ; namun demikian kita tetap memerlukan taksiran dari σ 2 , yang bisa kita peroleh atau kita tentukan dari penelitian yang telah dilakukan sebelumnya. Contoh 7.5

: Seorang peneliti berkeinginan untuk menaksir rata-rata

jumlah pohon per hektar pada sebuah kebun yang berukuran N = 1000 hektar. Dia berencana mengambil sampel berukuran n dari 1-hektar bidang tanah, kemudian menghitung y, jumlah pohon untuk setiap bidang tanah. Dia juga memiliki pencitraan dari kebun tersebut yang bisa digunakan untuk menaksir x, jumlah pohon pada setiap bidang tanah untuk seluruh kebun,

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵Ͷ

sehingga dia juga mengetahui μ x . Tentukanlah ukuran sampel yang diperlukan untuk menaksir μ y dengan bound of error dari penaksiran sebesar B = 1.0. Pemecahan

: Diasumsikan bahwa informasi yang diperlukan untuk

kepentingan penelitian tidak tersedia, maka kita harus mengadakan sebuah penelitian pendahuluan untuk menaksir

σ 2 . Karena setiap harinya peneliti bisa memeriksa 10 bidang tanah untuk menentukan y, jumlah seluruh pohon per bidang tanah, maka tepat sekali jika kita menggunakan n ' = 10 bidang tanah pada penelitian pendahuluan. Hasil dari penelitian disajikan pada tabel di bawah ini : Bidang tanah

Nilai taksiran, x

1 2 3 4 5 6 7 8 9 10

23 14 20 25 12 18 30 27 8 31

Nilai sebenarnya, y. 25 15 22 24 13 18 35 30 10 29

208

221

Taksiran dari σ 2 dapat diperoleh melalui persamaan 10

¦(y

^ 2

σ =

i

− rxi ) 2

i =1

9

Kemudian gunakanlah persamaan (7.4) 10

¦(y i =1

i

10

10

10

i =1

i =1

i =1

− rxi ) 2 = ¦ y i2 + r 2 ¦ xi2 − 2r ¦ xi y i

Dari penelitian pendahuluan kita peroleh

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵ͷ

10

¦y

2 i

= (25) 2 + (15) 2 + ... + (29) 2 = 5469

2 i

= (23) 2 + (14) 2 + ... + (31) 2 = 4872

i =1 10

¦x i =1

¦x y i

i

= (22)(23) + (14)(15) + ... + (31)(29) = 5144 10

r=

¦y

i

¦x

i

i =1 10

=

221 = 1.06 208

i =1

10

10

10

10

i =1

i =1

i =1

i =1

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi = 5469 + (1.06) 2 (4872) − 2(1.06)(5144) = 37.8992 Dengan menggunakan persamaan (7.24), sekarang kita bisa menentukan n dengan

D = B2 / 4 =

n=

1 4

100(4.21) Nσ 2 = = 16.56 2 1000(0.25) + 4.21 ND + σ

Maka untuk menaksir μ y , rata-rata jumlah pohon per 1-hektar bidang tanah, dengan

bound of error sebesar B = 1.0. kita memerlukan sebanyak 17 bidang tanah untuk diteliti. Karena pada penelitian pendahuluan kita telah meneliti sebanyak 10 bidang tanah, maka kita tinggal meneliti sisanya yaitu sebanyak 7 bidang tanah. Ukuran sampel yang diperlukan untuk menaksir τ y dengan bound of error sebesar B bisa didapatkan dengan mencari solusi untuk n dari persamaan berikut : ^

2 V (τ y ) = B

(7.25)

persamaan di atas juga dapat ditulis sebagai berikut

2τ x V (r ) = B

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(7.26)

ͳ͵͸

Ukuran sampel yang diperlukan untuk menaksir τ y dengan bound of error B adalah :

n=

Nσ 2 ND + σ 2

D=

B2 4N 2

(7.27)

dengan

VII.5 TAKSIRAN REGRESI

Telah ditunjukan sebelumnya bahwa penaksir rasio lebih layak digunakan jika hubungan antara y dan x adalah linier. Jika kenyataan dari hubungan linier antara pengamatan y’s dan x’s, tetapi tidak harus salah satunya , lalu informasi tambahan disediakan dengan bantuan variabel x yang didapat dari perhitungan taksiran regresi dari rata-rata μ y . Harus diketahui μ y sebelum penaksir dapat dipakai, seperti yang ada dalam taksiran rasio dari μ y . Yang digarisbawahi memperlihatkan hubungan dasar antara y’s dan x’s yang kadang menunjuk pada garis regresi dari y atas x. Penaksir memberikan asumsi bahwa x’s adalah variabel tetap dan y’s adalah variabel acaknya. Dapat kita pikirkan nilai x sebagai suatu yang telah diteliti, seperti pendapatan seperempat bulan pertama tahun yang lalu, dan respon y sebagai variabel acak yang belum di teliti, seperti pendapatan empat bulan berikutnya dari suatu perusahaan untuk x yang telah diketahui. Peluang dari penaksir selanjutnya tergantung hanya dari y untuk pasangan x’s. Penaksir Regresi dari rata-rata populasi μ y μˆ yL = y + b( μ x − x )

(7.28)

dimana n

b=

¦ (y

i

− y )( x i − x )

i =1

n

¦ (x

i

− x) 2

i =1

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵͹

Penaksir varians dari μˆ yL n § N − n ·§ 1 · ª 2 2 Vˆ ( μˆ yL ) = ¨ ¸¨ ¸« ( yi − y) − b © Nn ¹© n − 2 ¹ «¬ i =1

¦

n

¦ (x i =1

i

º − x) 2 » »¼

(7.29)

Penaksir batasan kesalahan n § N − n ·§ 1 · ª 2 2 2 vˆ( μ yL ) = 2 ¨ ¸« ( yi − y) − b ¸¨ Nn n 2 − ¹ «¬ i =1 © ¹©

¦

n

¦ (x i =1

i

º − x) 2 » »¼

(7.30)

Ketika menghitung b dari pasangan penelitian (y1,x1),…,(yn,xn), kita dapat menggunakan fakta bahwa n

¦(y

n

i

− y )( x i − x )

i =1

¦ (x

i i

=

n

i

− x)

¦y x

2

i =1

i =1 n

¦x

2 i

− nx y

− nx 2

i =1

Contoh 7.9

Perolehan nilai test matematika telah diberikan kepada 486 siswa yang terlebih dahulu masuk perguruan tinggi tertentu. Dari semua siswa tersebut SRS dari n=10 siswa telah diseleksi dan kemajuan mereka dalam kalkulus diteliti. Hasil akhir nilai kalkulus telah dilaporkan, seperti telah diberikan pada tabel. Diketahui bahwa μ y =52 untuk 486 siswa yang mengambil test perolehan tsb. Taksir μ y untuk populasi ini, dan tempatkan taksiran batasan kesalahannya. Siswa

Perolehan nilai test

Kalkulus akhir

(x)

(Y)

1

39

65

2

43

78

3

21

52

4

64

82

5

57

92

6

47

89

7

28

73

8

75

98

9

34

56

10

52

75

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵ͺ

Penyelesaian

Hasil penghitungan x = 46

y = 76 n

¦y x

i i

b=

i =1 n

¦

x i2

− nx y =

− nx

36,854 − 10(46)(76) 23,634 − 10(46) 2

2

= 0.766

i =1

n

¦ (y

i

− y) 2 =

i =1

n

¦ i =1

n

¦y

2 i

− ny 2 = 2056

2 i

− nx 2 =2474

i =1

( xi − x ) 2 =

n

¦x i =1

nilai observasi dari μ yL : y + b( μ x − x ) = 76 + (0,766)(52 − 46) = 80

juga n § N − n ·§ 1 · ª 2 2 Vˆ ( μˆ yL ) = ¨ ¸« ( y i − y ) − b ¸¨ © Nn ¹© n − 2 ¹ «¬ i =1

¦

n

¦ (x i =1

[

i

º − x) 2 » »¼

]

§ 486 − 10 ·§ 1 · ¸¸¨ ¸ 2056 − (0,766) 2 (2474) = 7,397 = ¨¨ 486 ( 10 ) ¹© 8 ¹ ©

dan penaksir batasan kesalahannya adalah 2 vˆ( μ yL ) = 5.4

Agar diketahui bahwa penaksir regresi dari μ y penurunan nilai y dari x menjadi berkurang daripada μ y dan b nya positif.

Perhitungan untuk penaksir regresi dari rata-rata sejajar dengan analisis regresi klasik dalam kasus populasi yang tak berhingga.dengan model E ( y i ) = β 0 + β 1 xi

untuk (xi,yi) data. Lalu penaksir kuadrat terkecil dari β i adalah b, telah didapat dari persamaan (7.28). juga hasil dari (7.29) menjadi § N −n· v ( μˆ yL ) = ¨ ¸ MSE © Nn ¹

dimana MSE adalah kesalahan rata-rata kuadrat yang biasa dari analisis regresi. Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳ͵ͻ

Untuk ilustrasi, hasil analisis regresi minitab untuk data dalam contoh 7.9 sebagai berikut: Persamaan regresi y = 40.8 + 0.766 x

Predictor

Coef

Stdev

t-ratio

p

Constant

40.784

8.507

4.79

0.000

X

0.7656

0.1750

4.38

0.002

s=8.704, R-sq=70.5%, R-sq(adj)=66.8% Analisis varians Source

DF

SS

MS

F

p

Regresi

1

1450.0

1450.0

19.14

0.002

Error

8

606.0

75.8

Total

9

2056.0

Perhitungan b diperlihatkan sebagai koefisien dari x dalam persamaan regresi, atau dalam kolom “Coef” berlawanan dengan predictor x dalam tabel. MSE dimasukan dibawah “MS” berlawanan dengan “Error” dalam tabel analisis varians. Dengan demikian, § N −n· v ( μˆ yL ) = ¨ ¸ MSE © Nn ¹ =

476 (75.8) = 7.42 486(10)

dan 2 vˆ( μ yL ) = 5.45

dimana sangat dekat dengan nilai yang terkandung dalam perhitungan yang lalu. Pemeriksaaan yang lebih dekat dari data dalam kandungan gula dan berat jeruk diberikan dalam contoh 7.2 disarankan bahwa penaksir rata-ratanya lebih layak dari pada penaksir rasio.(Plot ari nilainya akan memperlihatkan bahwa garis regresi tidak tampak) walau demikian, penaksir regresi dari total adalah bentuk Nμ yL , khususnya n harus diketahui. Sejak penaksir rasio juga bekerja dengan baik dalam kasus ini, menetapkan nomor dari jeruk dalam truk tidak akan mendapatkan biaya dan waktu tambahan. Dalam kasus N yang lain akan diketahui atau mudah ditemukan. Dengan demikian, kita harus hati-hati dalam memilih antara penaksir rasio dan Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶͲ

penaksir regresi ketika menaksir rata-rata populasi atau total. Akan dibahas lebih lanjut dalam bagian 6.8. VII.6 TAKSIRAN PERBEDAAN

Metode penaksiran perbedaan

rata-rata populasi atau total sama dengan

metode regresi yang sesuai dengan nilai y atas dan bawah dengan jumlah yang tergantung perbedaan ( μ x − x ) . Akan tetapi, koefisien regresi b tidak dihitung. Hasilnya, b dibuat sama. Metode perbedaan lebih mudah untuk dipakai dibandingkan metode regresi dan kerap kali bekerja lebih baik. Metode ini biasa digunakan dalam prosedur pemeriksaan, dan akan kita pertimbangkan beberapa contoh dalam bagian ini. Rumus dibawah ini bahwa sampling acak sederhana telah digunakan. Perbedaan penaksir dari populasi μ y :

(7.31)

μˆ yD = y + ( μ x − x ) = μ x + d

dimana d = y−x

Penaksir Varians dari μ yD : n

§ N −n· Vˆ ( μ yD ) = ¨ ¸ © Nn ¹

¦ (d

i

− d )2

i =1

(7.32)

n −1

dimana d i = y i − xi

Penaksir batasan kesalahan: n

¦ (d § N −n·

2 Vˆ ( μˆ yD ) = 2 ¨ ¸ © Nn ¹

i

− d )2

i =1

n −1

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

(7.33)

ͳͶͳ

Contoh 7.10

Pemeriksa tertarik dalam membandingkan pemeriksaan nilai dari beberapa barang dengan harga buku. Biasanya, harga buku diketahui untuk setiap barang dalam populasi, dan pemeriksaan harga diperoleh untuk sebuah sampel dari barang tersebut. Harga buku dapat digunakan untuk memperoleh taksiran yang baik dari total atau rata-rata pemeriksaan nilai untuk populasi. Sebuah populasi berisi 180 daftar barang dengan harga buku $13,320. xi adalah harga buku dan yi pemeriksaan harga untuk barang yang ke-i. Sampel acak sederhana dari n=10 barang diperlihatkan dalam tabel. Plot dari data tersebut, Gambar 6.1, menunjukkan sepanjang garis lurus. Taksir nilai pemeriksaan rata-rata dari μ y dengan metode perbedaan dan taksir varians dari μ yD . Gambar 7.1

Plot y atas x untuk contoh 6.10.



200.00



y

150.00



100.00

 

50.00 



 

50.00

150.00

100.00

200.00

x

sample 1 2 3 4 5 6 7 8 9 10

nilai audit,y nilai buku,x 9 10 14 12 7 8 29 26 45 47 109 112 40 36 238 240 60 59 170 167

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

d -1 2 -1 3 -2 -3 4 -2 1 3

ͳͶʹ

6ROXVL Diketahui y = 72.1 , x = 71.7 , dan μ x = 74

μ yD = μ x + d = 74 + (72.1 − 71.7) = 74.4 dan juga,

§ 1 ·n § 1 ·ª n 2 2 2º ¨ ¸ ¦ ( d i − d ) =¨ ¸ « ¦ d i − nd » © n − 1 ¹ i =1 © n − 1 ¹ ¬ i =1 ¼ 58 − 10(0.4) 2 = = 6.27 9

jadi n

§ N −n· Vˆ ( μˆ yD ) = ¨ ¸ © Nn ¹

¦ (d

i

− d )2

i =1

n −1

ª180 − 10 º =« » (6.27) = 0.59 ¬ (180)10 ¼

VII.7 EFISIENSI RELATIF DARI PENAKSIR

Kita telah melihat bahwa rata-rata sample, penaksir rasio, penaksir regresi, dan penaksir selisih semuanya bisa digunakan sebagai penaksir rata-rata populasi μ y . Bagaimana kita mengetahui penaksir yang mana yang terbaik untuk situasi penarikan sample tertentu? sebenarnya, kita selalu tidak bisa menjawabnya secara pasti, tetapi ada beberapa pedoman yang membandingkan sifat-sifat dari penaksir-penaksir tersebut. Salah satu pedomannya bisa diungkapkan dalam hal efisiensi relatif dari penaksir. Andaikan kita mempunyai dua penaksir E1 dan E 2 untuk rata-rata μ . Jika kedua E1 dan E 2 adalah penaksir takbias, atau hampir takbias, dari μ , maka secara umum kita sebaiknya memilih penaksir dengan varians terkecil sebagai penaksir terbaik. Hal ini menghasilkan taksiran selang kepercayaan terpendek bagi μ . Varians biasanya mengecil ketika ukuran sample membesar, jadi kita harus membandingkan varians E1 dan E 2 dengan asumsi ukuran sample sama untuk kedua penaksir. Sesuatu hal yang mudah untuk menjelaskan ukuran relatif dari dua varians dengan melihat pada rasionya. Rasio ini disebut dengan efisiensi relatif (relative efficiency), dinotasikan RE, untuk dua penaksir. Kita membentuk rasio efisiensi relatif sehingga nilainya yang besar mengutungkan bagi penaksir yang disebutkan pertama kali. Jadi, efisiensi relatif dari E1 ke E 2 (atau E1 terhadap E 2 ) diberikan melalui Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶ͵

§ E · V (E2 ) RE ¨¨ 1 ¸¸ = © E 2 ¹ V ( E1 ) Jika RE (E1 E 2 ) besar (lebih besar dari 1), maka V ( E 2 ) akan menjadi lebih besar dari V ( E1 ) yang menguntungkan bagi E1 sebagai penaksir μ . Harus diingat bahwa ukuran sampel untuk E1 dan E 2 harus sama dalam kalkulasi ini. Andaikan RE (E1 E 2 ) = 2 . Hal ini menyatakan secara tidak langsung bahwa

V ( E 2 ) = 2V ( E1 ) , yang mana merupakan kasus yang menguntungkan bagi E1 . Cara yang lain untuk membuat perbandingan ini adalah dengan menetapkan bahwa ukuran sampel E 2 harus dua kali dari E1 agar membuat E1 dan E 2 ekuivalen dalam hal varians. Jadi, RE bisa digagas dalam hal ekuivalensi ukuran sampel (atau usaha penarikan sampel atau biaya penarikan sampel). RE = 1 menyatakan secara tidak langsung bahwa dua penaksir ekuivalen; tidak menjadi masalah penaksir yang mana yang kita gunakan. RE biasanya didefinisikan dalam hal varians teoritis (varians populasi). Akan tetapi, kita telah memberikan banyak varians taksiran dalam teks ini. Jadi, kita akan melanjutkannya dalam semangat ini dan mendefinisikan

∧ § E · Vˆ ( E ) 2 RE ¨¨ 1 ¸¸ = © E 2 ¹ Vˆ ( E1 )

∧ Sekarang kita harus hati-hati dalam menginterpetasi; bahwa RE (E1 E 2 ) > 1 tidak cukup mengartikan bahwa V ( E 2 ) > V ( E1 ) , karena kita hanya berurusan dengan penaksir varians, yang akan mengalami perubahan dari sampel ke sampel. Akan tetapi, jika kita mempunyai sampel besar (dan karenanya menjadi penaksir varians

∧ yang baik), nilai dari RE (E1 E 2 ) akan sangat lebih besar dari 1 yang tentunya akan betul-betul menunjukan bahwa E1 mungkin menjadi penaksir terbaik. Sekarang kita menghitung taksiran efisiensi relatif untuk pelbagai kombinasi dari empat penaksir μ y yang telah disebutkan diatas. Pertama, bagaimanapun, kita harus

mempertimbangkan

pertanyaan

kebiasan,

karena

tidak

tepat

untuk

membandingkan varians bagi penaksir-penaksir yang bias. Rata-rata y dari sampel acak sederhana selalu penaksir takbias dari μ y , jadi tidak ada masalah bias (setidaktidaknya secara teoritis) dalam berurusan dengan penaksir ini. Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶͶ

Pada sisi lain, penaksir rasio μ y secara umum bias, karena r = y x secara umum penaksir bias dari R = μ y μ x . Bias menjadi tidak berarti jika hubungan antara y dan x jatuh sepanjang garis lurus yang bergerak melalui titik asal. Hampiran untuk bias relatif dari r diberikan oleh:

sy s · E (r ) − R § N − n ·§ s x2 ≈¨ ¸¨¨ 2 − ρˆ ⋅ x ¸¸ R y x ¹ © Nn ¹© x dengan ρˆ adalah koefisien korelasi sampel antara x dan y. Mengenai bias dari dua penaksir lainnya, penaksir regresi takbias jika hubungan antara y dan x (regresi y pada x) jatuh sepanjang garis lurus, tidak perlu melalui titik asal. Penaksir selisih selalu takbias dalam penarikan sampel acak sederhana. Dalam membandingkan penaksir rasio dengan rata-rata sampel per elemen y , kita mempunyai

∧ § E · Vˆ ( y ) RE ¨¨ 1 ¸¸ = © E 2 ¹ Vˆ ( μˆ y ) =

s y2 s y2 + r 2 s x2 − 2rρˆs x s y

∧ sekarang, RE (μˆ y y ) > 1 jika

s y2 + r 2 s x2 − 2rρˆs x s y < s 2y atau

r 2 s x2 > 2rρˆs x s y atau

rs x2 > 2 ρˆs x s y

(dengan asumsi r > 0 )

atau

ρˆ >

1 rs x 1 s x x = 2 sy 2 sy y

Besaran s x x disebut koefisien variasi. Pada situasi dimana penaksir rasio biasa digunakan, y adalah nilai yang diperbaharui dari x (pendapatan kuartal pertama dalam satu tahun dibandingkan dengan pendapatan kuartal pertama tahun sebelumnya, nilai audit melawan nilai buku, dan lain-lain). Dalam kasus seperti ini, koefisien variasi Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶͷ

dari y seharusnya sangat dekat dengan koefisien variasi dari x. Jadi, dalam situasi seperti ini, penaksir rasio lebih efisien daripada rata-rata sampelper elemen penaksir jika ρˆ >

1 . 2

Secara keseluruhan, penaksir rasio akan lebih efisien daripada y jika variasi diantara x relatif lebih kecil terhadap variasi diantara y dan korelasi antara x dan y bernilai positif yang besar. Jika peneliti mempunyai pilihan seperti bagaimana memilih nilai-x, ia sebaiknya memilih mereka hampir terus-menerus. Perbandingan sederhana dari penaksir regresi dengan rata-rata per elemen

y dan penaksir rasio μˆ y membutuhkan beberapa modifikasi taksiran varians. Ingat bahwa

μˆ yL = y + b( μ x − x ) dengan b adalah penaksir kemiringan (slope) dari garis regresi. Varians taksiran dari

μˆ yL telah diberikan (lihat persamaan (7.29) yaitu n º § N − n ·§ 1 · ª n 2 2 Vˆ ( μˆ yL ) = ¨ ¸¨ ¸ «¦ ( y i − y ) − b ¦ ( xi − x )2» © Nn ¹© n − 2 ¹ ¬ i =1 i =1 ¼

Jika kita membuat sedikit perubahan dengan mengganti (n-2) oleh (n-1) pada penyebutnya, kita akan mempunyai

[

§ N −n· 2 2 2 Vˆ ( μˆ yL ) ≈ ¨ ¸ sy − b sx © Nn ¹

]

dan, karena

b = ρˆ

sy sx

Vˆ ( μˆ yL ) menjadi § N −n· 2 2 Vˆ ( μˆ yL ) ≈ ¨ ¸ s y 1 − ρˆ © Nn ¹

(

)

Hampiran Vˆ ( μˆ yL ) ini baik sepanjang n agak besar; (n-2) digunakan pada penyebut untuk mencegah menaksir varians terlalu rendah (underestimation) yang serius dalam situasi sampel kecil. Dengan menggunakan hampiran varinas yang telah disederhanakan diatas,

^ § μˆ yL RE ¨¨ © y

s2 · 1 ¸¸ = 2 y 2 = 1 − ρˆ 2 ¹ s y 1 − ρˆ

(

)

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶ͸

yang akan lebih besar dari satu jika ρˆ tidak samadengan nol. Pada faktanya, RE besarnya bisa menjadi takhingga ketika ρˆ mendekati satu. Jadi, μˆ yL selalu lebih efisien dari y sebagai penaksir dari μ y . (akan tetapi, ingat bahwa μˆ yL akan mempunyai masalah bias yang serius kecuali regresi y pada x benar-benar linear.) Ketika membandingkan taksiran regresi dengan taksiran rasio,

^ § μˆ yL RE ¨ ¨ μˆ y ©

· s y2 + r 2 s x2 − 2rρˆs x s y ¸= ¸ s 2y 1 − ρˆ 2 ¹

(

)

^ Pada kasus ini. RE >1 akan menunjukan r 2 s x2 − 2rρˆs x s y > − ρˆ 2 s 2y atau

(ρˆs

− rs x ) > 0 2

y

2 karena ρˆs y = bs x , maka (bs x − rs x ) > 0

yang menunjukan

(b − r )2 >0 Jadi, penaksir regresi lebih efisien dari penaksir rasio kecuali b=r, dimana kasus mereka ekuivalen.Kasus b=r akan terjadi ketika regresi y pada x linear melalui titik asal dan varians y sebanding dengan x.

GAMBAR 7.2

Plot dari penerimaan kas (y) dengan banyaknya pembeli (x)

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶ͹

Situasi yang seperti ditunjukan pada gambar 6.2, dengan kasus penerimaan kas untuk periode penjualan yang telah ditetapkan yang berhubungan dengan banyaknya pembeli. Catatan bahwa nilai penerimaan melebar ketika x meningkat. Penaksir selisih

μˆ yD = y + ( μ x − x ) selalu penaksir takbias dari μ pada penarikan sample acak sederhana, dan varians taksirannya adalah n

¦ (d § N −n·

Vˆ ( μˆ yD ) = ¨ ¸ © Nn ¹

i =1

−d)

2

i

n −1

bisa ditulis

§ N − n ·§ 1 · n 2 Vˆ ( μˆ yD ) = ¨ ¸¨ ¸¦ [( y i − y ) − ( xi − x )] © Nn ¹© n − 1 ¹ i =1

[

§ N −n· 2 2 =¨ ¸ s y + s x − 2 ρˆs x s y Nn © ¹

]

Dalam membandingkan penaksir selisih dengan rata-rata sample per elemen, kita mempunyai

^ § μˆ yD RE ¨ ¨ μˆ y ©

· s y2 ¸= ¸ s 2 + s 2 − 2 ρˆs s y x x y ¹

yang lebih besar dari satu ketika

2 ρˆs x s y > s x2 atau ^

ρ>

sx 2s y

Jika variasi dalam x’s dan y’s sama, Penaksir difference akan menjadi lebih efisien dibanding y ketika korelasi antara x dan y lebih besar dari

1 2

.

Ketika membandingkan penaksir regresi dengan penaksir difference kita punya model ^

§ μ^ yL · s2y + s2x − 2 ρ sx s y RE¨ ^ ¸ = ^ 2 ¨ μ yD ¸ 2§ · 1 − ρ © ¹ ¸ sy ¨ ¹ © ^

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶͺ

yang lebih baik lagi jika diuraikan ^ 2

^

2

2

sx − 2 ρ sx s y > − ρ s y atau 2

§¨ − ρ^ ·¸ > 0 sy © sx ¹ ^

Sejak bsx = ρ s y penaksir regresi akan menjadi sama dengan penaksir difference bila b=1. Di lain pihak, penaksir regresi akan menjadi lebih efisien daripada penaksir difference. Sekarng kita akan melihat beberapa nilai numeric dari efisiensi relative untuk data yang telah kita analisis terlebih dahulu pada bab ini. Data dari table 7.1 dalam real estate valuation diplotkan dalam gambar 7.3. Melihat point data tersebut yang jatuh sepanjang garis lurus dengan kemiringan dekat dengan persamaan (dalam kenyataan, b=0.977 untuk penaksir regresi) dan y mendekati 0. Untuk kasus ini E( r ) − R R

≈ 0.0053

Jadi nilai relative bias untuk penaksir ratio tidak terlalu berpengaruh. Untuk data ini,

§ μ^ · ¨ yL ¸ RE ¨ ^ ¸ = 1.13 © μy ¹ ^

dan

§ μ^ · ¨ yD ¸ RE ¨ ^ ¸ = 1.01 © μy ¹ ^

jadi ketiga penaksir, regresi, ratio, dan difference adalah tentang persamaan yang ada dalam penaksir varians. Salah satu dari ketiga penaksir tersebut bekerja dengan baik untuk masalah menaksir μ y atau τy dengan data tersebut. Tapi

§ μ^ · yL ¸ RE¨ = 14.96 ¨ y ¸ © ¹ ^

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͶͻ

jadi y bias menjadi penaksir yang buruk dari μ y , sebagai perbandingan salah satu dari 3 penaksir membuat taksiran dari x’s. Di lain pihak, itu membuat 15 kali atau lebih pengamatan untuk mencapai sukses dalam varians yang sama dengan y adalah ^

yang terbagus dengan μ yL . Data dari table 7.2 tentang kadar gula dengan berat jeruk, hal 159, yang telah diplot dalam table 7.4. Disini, point data terdapat sepanjang garis lurus tapi kemiringannya tidak cukup dekat dengan komunitas (kenyataannya, b=0.123) y intercept signifikan berbeda dari 0. Nilai relative bias dari r = -0.00077 tidak terlalu berpengaruh, tapi

§ μ^ · yL RE¨ ^ ¸ = 16.79 ¸ ¨ © μy ¹ ^

Hal ini mengimplikasikan akurasi yang lebih baik dalam mencapai sukses dalam penaksiran μ y atau τy yang dikerjakan oleh penaksir regresi lebih baik dari penaksir ratio. Penaksir difference tidak dapat digunakan dalam masalah ini. Dari contoh 7.9, kita mempunyai data nilai akhir kalkulus dengan nilai tes psikotes. Kemiringan dalam garis ini tidak cukup dekat dengan komunitas (b=0.766) dan y intercept jauh dari 0. Perhitungannya ditunjukan

§ μ^ · yL RE¨ ^ ¸ = 4.84 ¸ ¨ © μy ¹ ^

dan

§ μ^ · yL RE¨ ^ ¸ = 1.22 ¸ ¨ © μ yD ¹ ^

Disini penaksir regresi biasanya lebih baik dari penaksir ratio, tapi penaksir difference bias dipakai tetapi kurang efisien. Untuk data dalam contoh 7.10, ketiga metode, ratio, regresi dan difference sebenarnya sama; penaksir difference adalah yang paling mudah dihitung jadi itu adalah pilihan yang masuk akal.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͷͲ

Dalam kesimpulan, analisis dari data bivariate harus selalu dimulai dengan memplot titiknya. Jika titiknya jatuh sepanjang garis lurus permulaannya maka tepat sekali mengambil penaksir difference, ketiga metode yang melibatkan x’s dan y’s adalah mungkin. Agar penaksir difference bekerja dengan baik, kemiringan dari garis harus cukup dekat dengan salah satu titiknya. Jika titiknya jatuh sepanjang garis lurus tidak melalui garis normal, maka penaksir regresi adalah yang terbaik, dalam hubungan dengan varians. Jika titiknya tidak jatuh sepanjang garis lurus, mungkin y sebaiknya digunakan (atau untuk penanganan analisis regresi lebih detail).

VII.8 KESIMPULAN Dengan mengukur variable Y dan variable tambahan X pada masing2 elemen dalam sample, kita dapatkan informasi tambahan untuk menaksir parameter populasi yang bersangkutan. Ketika korelasi positif yang kuat ada antara variable X dan Y , prosedur penaksiran ratio biasanya menyediakan taksiran yang lebih tepat dari μ y dan

τy daripada melakukan prosedur normal yang dihadirkan dalam bab sebelumnya. Ukuran sample yang dibutuhkan dihadirkan untuk menaksir μ y , τy dan R dengan bound of error yang sama dengan B. pada masing masing kasus seseorang harus mendapatkan penaksirdari σ 2 dari informasi sebelumnya atau study persiapan untuk memperkirakan ukuran sample yang dibutuhkan. Penaksiran regresi adalah salah satu teknik untuk menggabungkan informasi pada variable tambahan. Metode ini biasanya lebih baik daripada metode penaksiran ratio jika hubungan antara Y dan X adalah berupa garis lurus yang tidak melalui asal. Walaupun metode ini bisa diterapkan dengan desain sampling apapun, kita menitikberatkan pada sampling acak sederhana., ketika

menyebutkan stratified

random sampling untuk kasus ratio. Metode penaksiran pembeda dalam prinsipnya sama dengan dengan penaksiran regresi .ini bekerja dengan baik ketika plot Y dengan X menampakkan titik yang uniform pada garis lurus dengan slope unit.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͷͳ

TINJAUAN MATA KULIAH VIII. 2 Sampling Peluang Sebuah proses sampling disebut sebagai sampling nonpeluang bila tidak semua unit mempunyai peluang untuk terpilih atau dalam proses memilih satuansatuan sampling tidak dilibatkan peluangnya. Proses pemilihan tanpa melibatkan peluang merupakan proses yang sederhana tetapi mempunyai kerugian yang sangat besar, yaitu dalam analisis datanya tidak boleh digunakan test of significance, artinya analsis inferensial secara statistis tidak diperkenankan (tidak valid). Ke dalam sampling nonpeluang termasuk diantaranya adalah a. Sampling Seadanya (Haphazard/Accidental Sampling) Yaitu proses pengambilan sampel sedemikian sehingga unit sampling diperoleh seadanya. Jadi siapa atau apa saja yang secara kebetulan ada bila dipandang cocok sebagai sumber data, maka dapat digunakan sebagai sampel. Contohnya, proses penelitian suatu fosil b. Sampling Sukarela (Voluntary Sampling) Yaitu sampling dimana unit sampling adalah mereka yang mau secara sukaela menjadi anggota sampel. Jenis sampling ini banyak digunakan dalam penelitian medis. Orang sebagai unit observasi diminta secara sukarela untuk menjadi objek percobaan. c. Purposive Sampling (Judgement Sampling) Yaitu proses pengambilan sampling dipilih atas dasar pertimbangan seseorang. Penelitian tentang pendapat masyarakat akan suatu kebijakan yang dillakukan terhadap tokoh-tokoh mayarakat yang ditunjuk merupakan penelitian dengan menggunakan purposive sampling. d. Snowball Sampling Dalam jenis sampling ini, unit sampling secara berangkai atas informasi yang diberikan oleh unit sampling yang terpilih sebelumnya. Contohnya seorang Dokter yang akan melakukan penelitian mengenai pasien yang

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͷͶ

e. Quota Sampling Merupakan suatu tipe sampling dengan menggunakan beberapa kuota sampai pada kuota yang diinginkan. Tipe sampling ini sangat banyak digunakan dalam penelitian pemasaran dan dalam penelitian pengumpulan pendapat (opinion poll) Contoh : Dalam suatu penelitian mengenai tingkat kepuasan konsumen terhadap suatu produk rokok akan diambil sampel dengna beberapa ketentuan berikut : -

Quota 1 : Akan diteliti sebanyak 300 konsumen yang telah menggunakan produk tersebut (angka 300 merupakan hasil pertimbangan sebagai akibat dari keterbatasan dana, tenaga, dan waktu)

-

Quota 2 : Konsumen yang diambil adalah pria yang berusia 25 - 35 tahun

-

Quota 3 : Tingkat pendidikan dari konsumen sekurang-kurangnya SMU.

f. Sampling Jenuh Apabila sutau populasi memiliki anggota yang sedikit (dalam hal ini kurang dari 30), maka semua elemennya bisa digunakan sebagai sampel. Proses penarikan sampel seperti ini dinamakan Sampling Jenuh. Jadi dengan kata lain bahwa sampling jenuh merupakan sensus. Keuntungan sampling non pleuang adalah dari aspek kemudahan memperoleh unit sampling. Namun, data yang dikumpulkan berdasarkan sampling jenis ini tidak dapat digeneralisir atau tidak dapat dianalisis lebih jauh melalui alat analisis statistika.

Bahan Ajar Sampling - Yudhie Andriyana Jurusan Statistika, FMIPA – Universitas Padjadjaran

ͳͷͷ