EVALUASI PEMBELAJARAN - REABILITAS


MAKALAH
EVALUASI PEMBELAJARAN
“Reliabilitas”
Diampu Oleh Izhar,M.Pd.







Disusun oleh,
                                                Kelompok       :  V
                                                Kelas               :  4 A

PENDIDIKAN BAHASA DAN SASTRA INDONESIA
SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN MUHAMMADIYAH PRINGSEWU
LAMPUNG
2017


DAFTAR NAMA
KELOMPOK VII


NO.
NAMA
NPM
PARAF
1
Teguh Setiawan
15040008



2
Nurul Rohmawati
15040011



3
Dian Famelia
15040027



4
Ria Destiana
15040030



5

Dewi Amelia
15040033











KATA PENGANTAR


Assallamuallaikum Wr. Wb
Puji dan syukur kehadirat Allah SWT, karena atas rahmat dan hidayah-Nya lah kami dapat menyelesaikan makalah ini. Tidak lupa kami mengucapakan terima kasih kepada Bapak Izhar, M.Pd. sebagai dosen pengampu mata kuliah Evaluasi Pembelajaran, dan Kedua Orang Tua yang selalu menjadi motivator setiap saat serta pihak-pihak lain yang telah mendukung dalam kelancaran pembuatan makalah ini.
Adapun maksud dan tujuan pembuatan makalah ini adalah untuk memenuhi tugas kelompok di Mata Kuliah Evaluasi Pembelajaran. Didalam penulisan makalah ini kami menyadari bahwa masih terdapat kekurangan dan kesalahan. Untuk itu kami mengharapkan kritik dan saran yang membangun dari pembaca untuk menyusun makalah lain dikesempatan yang akan datang. Semoga makalah ini bermanfaat tidak hanya bagi kami tetapi juga bagi pembaca.
Wassalllamuallaikum Wr. Wb

                                                                                    Pringsewu, 02 Maret 2017

                                                                                                Kelompok V






DAFTAR ISI


HALAMAN JUDUL
DAFTAR NAMA KELOMPOK...................................................................... ii
KATA PENGANTAR....................................................................................... iii
DAFTAR ISI....................................................................................................... iv
BAB I PENDAHULUAN
A.    Latar Belakang.......................................................................................... 1
B.     Rumusan Masalah..................................................................................... 1
C.     Tujuan........................................................................................................ 1
BAB II PEMBAHASAN
A.    Pengertian Realibilitas............................................................................... 2
B.     Jenis- Jenis Realibilitas.............................................................................. 2
C.     Faktor-Faktor Yang Mempengaruhi Koefisien Reliabilitas ..................... 3
D.    Pengujian Realibilitas................................................................................ 4
E.     Contoh Penghitungan Pengujian Reliabilitas............................................ 14
F.      Usaha Penyusunan Tes yang Reliabel....................................................... 19
BAB III PENUTUP
A.    Kesimpulan................................................................................................ 23
B.     Saran.......................................................................................................... 23
DAFTAR PUSTAKA



BAB I
PENDAHULUAN

A.    Latar Belakang
Reliabilitas merupakan sifat yang ada pada data atau skor yang dihasilkan oleh instrumen, namun untuk memudahkan reliabilitas dapat dikatakan sifat dari insrumen dan juga reliabilitas bukanlah bersifat dikotomis, tetapi merupakan rentangan yang biasnya dinyatakan dengan bentuk angka 0 (nol) sampai 1 (satu). Dengan demikian kurang tepat kiranya kalau dipertanyakan apakah suatu instumen itu memiliki reliabilitas atau tidak, akan tetapi tepatnya adalah suatu instrumen dapat menghasilkan data atau skor yang memiliki tingkat reliabilitas yang memadai atau tidak. Suatu instrumen memiliki tingakat reliabilitas yang tinggi, sedang, atau rendah. Hampir sama dengan pengertian tersebut, bahwa keberadaan reliabilitas tiada semata-mata berupa dua pilihan, reliabel ataukah tidak reliabel, akan tetapi merupakan rentang yang berjenjang dari tingkat yang paling tinggi sampai tingkat yang palinng rendah. Reliabilitas tingkat paling tinggi yang secara statistik ditulis sebagai 1,00 yang menandakan adanya mutlak tanpa perbedaan dan penyimpangan sedikitpun. Realiabilitas merupakan salah satu syarat penting bagi suatu isntrumen evaluasi. Oleh sebab itu kami akan membahas tentang reliabilitas agar dapat bermanfaat untuk semua.

B.     Rumusan Masalah
1.      Apakah Pengertian Realibilitas?
2.      Apa sajakah Jenis- Jenis Realibilitas dan Bagaimanana Cara Mengujinya?

C.    Tujuan
Untuk mengetahui lebih mendalam tentang Realibilitas dan Cara mengujinya



BAB II
PEMBAHASAN

A.    Pengertian Reliabilitas
Menurut Dr. Saifudin Azwar (2011:4) Reliabilitas merupakan penerjemah dari kata reliability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel. Konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya seperti pendapat dari Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai dua kali untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.

Dapat disimpulkan reliabilitas tes merupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keajegan (konsisten). Seorang dikatakan dapat di percaya apabila orang tersebut berbicara konsistensi, tidak berubah- ubah pembicaraannya dari waktu ke waktu. Dalam sebuah tes pentingnya diamati keajegan dan kepastian tes tersebut dilihat dari hasil tes yang didapat.

B.     Jenis- Jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu;
1.      Relibilitas stabilitas.
Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indikator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2.      Reliabilitas ekivalen.
Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indikator yang berbeda, batasan-batasan operasional, peralatan pengumpulan data, atau pengamat-pengamat. 

Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bisa menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah- tengah. Cara ini seringkali dipakai dalam survai. Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan- pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.

Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor- skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

C.    Faktor-Faktor Yang Mempengaruhi Koefisien Reliabilitas
Ada beberapa faktor yang mempengaruhi koefisien reliabilitas dari instrumen yang berupa tes, diantaranya:
1)      Panjang Tes. Pada umumnya semakin panjang tes semakin tinggi reliabilitasnya. Hal ini disebabkan tes yang cacah butirnya banyak akan memuat cukup banyak tingkah laku yang diukur.
2)      Penyebaran Skor. Koefisien reliabilitas dipengaruhi oleh penyebaran skor. Makin lebar penyebaran skor makin tinggi estimasi koefisien reliabilitasnya. Hal ini disebabkan koefisien reliabilitas akan semakin tinggi apabila individu- individu cenderung tetap pada kedudukan terhadap kelompoknya.
3)      Tingkat Kesukaran Tes. Tes yang terlalu sukar atau terlalu mudah cenderung menurunkan koefisien reliabilitas. Hal ini disebabkan tes yang terlalu sukar atau terlalu mudah menghasilkan sebaran yang terbatas dan terkumpul diujung bawah atau diujung atas.
4)      Objektivitas. Objektivitas suatu tes menunjukan seberapa jauh dua orang yang mempunyai kemampuan yang sama mendapatkan skor yang sama.

D.    Pengujian Realibilitas
Pendekatan dan Teknik pengujian realibilitas antara lain :
1)      Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi- kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diuji cobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).

2)      Teknik Ulang (Test Re-test)
Teknik ini disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. 
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besar derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda. 
Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori atau putus dan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.

3.      Teknik Belah Dua
Penentuan reabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula Spearman-Brown dikenal dengan istilah : teknik belah dua (split half technique). Disebut “belah dua” , sebab dalam penentuan reabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Salah satu skor merupakan bagian pertama atau belahan pertama dari tes, sedangkan skor yang satunya lagi merupakan bagian kedua atau belahan kedua dari tes hasil belajar bentuk obyektif tersebut.
Dengan demikian, penerapan formula Spearman-Brown akan menghasilkan dua buah distribusi skor belahan pertama drngan distribusi skor belahan keduan itu dipandang sebagai reabilitas bagian butir-vutir soal tes hasil belajar bentuk obyektif tersebut; sedangkan untuk mengetahui reabilitas tes secara keseluruhan Spearman-Brown menciptakan formula sebagai berikut dimana :
Rtt=2.rhh
      1+rhh
rtt    =          Koefisien reabilitas tes secara total (tt = total tes)
rhh  =          Koefisien korelasi product moment antara separoh (bagian
           
pertama)   tes, dengan separoh (bagian kedua) dari tes tersebut
           
(hh = half-half)
1&2=         Bilangan Konstantan

Rumus lain yang sejenis dengan rumus diatas adalah ;
Dimana :
r11                   =             Koefisien reabilitas tes secara keseluruhan
r                 =          Koefisien korelasi product moment antara separoh
                       
(1/2) tes (belahan) dengan separoh (1/2) tes (belahan)
                       
dari tes tersebut.
1&2           =          Bilangan Konstan

Untuk mengetahui besarnya  rhh atau r  dapat digunakan salah satu diantara rumus berikut :
Realibilitas Seluruh Tes=    1+ 2x reliabilitas separuh tes
                                                                      1+reliabilitas separuh tes
Atau  r = 2 xr
                      1+ r
Misalnya, berdasarkan penghitungan koefesien korelasi separuh soal didapatkan r sebesar 0,713 , maka tingkat kepercayaan seluruh tes adalah:
Realibilitas Seluruh Tes = 2x 0,713 = 0,832
                                           1 + 0.713
Koefesien reliabilitas seluruh tes yang diperoleh tersebut termasuk kategori tinggi, maka tes yang diuji itu dinyatakan memiliki tingkat reliabilitas yang tinggi pula. Artinya hasil pengukuran yang dilakukan dengan alat tes yang bersangkutan dinyatakan konsisten. Dalam penerapan formula Spearman-Brown tersebut iatas, Spearman-Brown mempersembahkan dua buah model, yaitu Model Gasal- Genap dan Model Kiri-Kanan
1)      Model Gasal-Genap
Pada model ini skor-skor yang dimiliki oleh testee untuk butir item yang bernomor gasal ( misalnya item nomor 1, 3, 5, 7, 9, 11 dan seterusnya ) dianggap sebagai separoh bagian pertama dari tes, sedangkan skor-skor yang dimiliki testee untuk butir-butir item yang bernomor genap ( misalnya item nomor 2, 4, 6, 8, 10, 12 dan seterusnya ) dianggap sebagai separoh bagian kedua dari tes yang bersangkutan.
Pendekatan Single Test-Single Trial dengan Mengunakan Formula Spearman-Brown Model Gasal Genap. Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan pendekatan single-test dimana digunakan formula Spearman-Brown Model Genap adalah sebagai berikut :
1)      Menjumlah skor-skor dari butir-butir item yang bernomor gasal yang dimiliki oleh masing-masing, individu testee.
2)      Menjumlahkan skor-skor dari butir-butir item yang bernomor genap yang dimiliki oleh masing-masing individu testee.
3)      Mencari ( menghitung ) koefisien korelasi “r” product moment ( rxy = rhh = r ).
Dalam hal ini jumlah skor-skor dari butir-butir item yang bernomor gasal kita anggap sebagai variable X, sedangkang jumlah skor-skor dari butir-butir item yang bernomor genap kita anggap sebagai variable Y, dengan menggunakan rumus Mencari ( menghitung ) koefisien reliabilitas tes ( r11 = rtt ) dengan menggunakan rumus Memberikan interprestasi terhadap r11
Contoh :
Tes hasil belajar bidang studi Ushul Fiqh yang diikuti oleh 25 orang siswa madrasah ‘ Aliyah’, menyajikan 24 butir item bentuk item obyektif, dengan ketentuan bahwa untuk setiap jawaban betul diberikan skor 1, sedangkan untuk setiap jawaban salah diberikan skor 0. Setalah tes berakhir, diperoleh penyebaran skor hasil tes sebagai berikut : 
Penyebaran skor hasil tes bidang studi Ushul Fiqh yang diikuti oleh 25 orang siswa.
Langkah 1 : Menjumlahkan skor yang bernomor gasal
Skor-skor yang dimiliki oleh butir-butir item tes hasil belajar bidang studi Ushul Fiqh, yang bernmor gasal.
Langkah 2 : Menjumlahkan skor-skor yang bernomor genap
Skor-skor yang dimiliki oleh butir-butir item tes hasil belajar bidang studi Ushul Fiqh yang bernomor genap .
Langkah 3 : Menghitung angka indeks korelasi “r” product moment, antara variable X ( separoh belahan tes I ) dengan variable Y ( separoh belahan tes II ) yaitu rxy atau rhh atau r .
Perhitungan-perhitungan untuk memperoleh rxy = rhh = r
Langkah 5 : Memberikan iterprestasi terhadap r11 : berdasar hasil perhitungan diatas diperoleh koefisien reabilitas tes (r11 ) sebesar 0,84 ternyata jauh lebih besar dari 0,70. Dengan demikian dinyatakan tes hasil belajar tersebut memiliki realibitas tinggi.

2)      Model Belahan Kiri- Kanan
Pada model belahan kiri-kanan, jumlah butir-butir item yang ada dalam tes, dibelah menjdai dua bagian yang sama besar. Misalnya jumlah butir soal tes adalah 60, maka butir soal nomor 1 samapai dengan butir soal nomor 30 ditetapkan sebagai belahan kiri ( belahan I) sedangkan butir item nomor 31 sampai dengan butir soal nomor 60 ditetapkan sebagai belahan kanan ( belahan II ).
Pendekatan Single Test – Single Thrial dengan menggunakan Formula Spearman-Brown Model Belahan Kiri dan Kanan. Langkah-langkah yang perlu ditempuh da;am penentuan reliabilitas tes dengan menngunakan pendekatan Single Test – Single Thrial di mana digunakan formula Sperman-Brown model belahan kiri dan kanan adalah sebagai berikut :
a)      Menjumlahkan skor-skor dari butir-butir item yang terletak di separoh bagian kiri tes, yang dimiliki oleh masing-masing individu siswa yaitu : butir-butir item dengan nomor 1,2,3, 4,5, 6, 7, 8, 9, 10, 11 dan 12.
b)      Menjumlahkan skor-skor dari butir-butir item yang terletak di separoh bagian kanan tes, yang dimiliki ooleh masing-masing individu siswa yaitu : butir-butir item dengan nomor 13,14,15,16,17,18,19,20,21,22,23 dan 24.
c)      Mencari (menghitung) angka indeks korelasi “r”product moment, antara variabel X (separoh belahan kiri) dengan variabel Y (separoh belahan kanan) yaitu rxy  atau rhh  atau r  .
d)     Mencari (menghitung) koefisien reliabilitas tes (r11 ataur11) dengan menggunakan rumus  Telah diketahui ; dengan demikian r11 .
e)      Memberikan interpretasi terhadap r11

Penentuan reabilitas tes dengan menggunakan formula Spearman-Brown memiliki beberapa kelemahan yaitu ;
1)           Formula Spearman-Brown menghendaki agar bekahan yang dicarikorelasinya yaitu belahan gasal-genap dan belahan kiri-kanan haruslah sebanding.
2)           Penerapan formula Spearman-Brown juga menuntut persyaratan, agar jumlah butir-butir item yang akan diuji reabilitasnya haruslah merupakan bilangan genap; jadi seandainya jumlah butir-butir item itu berupa bilangan gasal, maka formula ini tidak mungkin untuk diterapkan.
Dengan dua buah model perhitungan tersebut (model gasal-genap dan model kiri-kanan), dapat terjadi bahwa koefisien reabilitas tes menunjukkan bilangan yang tidak sama, sehingga dapat terjadi bahwa dengan menggunakan model gasal genap tes dinyatakan reliable ( karena r11 atau rtt menunjukkan angka 0,70 atau lebih), tetapi dengan menggunakan model kiri-kanan ternyata tes dinyatakan un-reliabel ( karena besarnya r11 dibawah 0,70).

4.      Pendekatan Single Test – Single Trial dengan Menggunakan Formula Flanagan.
Dalam ranngka mengatasi kelemahan-kelemahan yang disandang oleh formula Spearman-Brown, Flanagan mengemukakan suatu formula, dimana sebagian dari persyaratan-persyaratan seperti yang dituntut oleh formula Spearman-Brown tidak harus dipenuhi. Berbeda dengan formula Spearman-Brown maka pada formula Flanagan reliabilitas tes tidak didasarkan pada ada tidaknya korelasi antara belahan I dengan belahan II, melainakan berdasarkan diri pada jumlah kuadarat deviasi pada tes belahan I,jumlah kuadarat deviasi pada tes belahan II, dan jumlah kuadarat total ( belahan I dan Belahan II ). Adapun formula yang diajukan oleh Flanagan adalah r11 , dimana :
Rumus Flanagan:
r11 =  2 (1- S  + S )
                  S

r11                   =          Koefisien reliabilitas tes secara totalitas
2 dan 1      =          Bilangana konstan
S12             =          jumlah kuadrat deviasi ( = varian ) dari skor-skor hasil
                        tes yang termasuk pada belahan I
S22             =          jumlah kuadrat deviasi ( = vareian ) dari skor-skor
                        hasil tes yang termasuk belahan II
St2              =          jumlah kuadrat total deviasi ( = varian total ) dari skor
                        - skor hasil tes belahan I dan belahan II
Jadi, pada hakikatnya S12 adalah = mean dari jumlah kuadrat deviasi skor-skor item belahan I, S22 adalah mean = dari jumlah kuadrat deviasi skor-skor item belahan II, dan St2 adalah = mean dari jumlah kuadrat deviasi skor secara total.

Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang menghitung dengan kalkulator statistik varians ini diperoleh dengan mengkuadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistik maka varians dapat dicari dengan rumus sebagai berikut :
 = ∑  
                                N
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun huruf  S (B besar) juga dapat dikatakan sudah menyebut standar deviasi. Dalam kalkulator tertera dengan simbol . Bagi yang berminat mencari S dulu untuk mencari varians, dapat menggunakan rumus S, yaitu:
S  =
                              N
Berdasarkan data tabel belahan ganjil – genap perhitungannya adalah sebagai berikut :
 = 93 -
               8
     = 93 – 78,125  
                  8
     = 1,859
 = 76 -
                8
     = 76 – 60,5
                8
     = 1,937
  = 295 -                          (diambil dari tabel yang ada skor total)
              8
      = 295 – 276,13
                     8
      = 2,36
Dimasukkan ke dalam rumus diperoleh demikian :
r₁₁ = 2(1  - )
     = -2(1 – 1,609)
     = -1,218

5.      Reliabilitas  Rumus Kuder – Richardson 20 dan 21
Pengujian reliabilitas tes dengan mempergunakan rumus Kuder-Richardson (K – R) 20 dan 21, dilakukan dengan membandingkan skor butir-butir tes. Jika butir-butir tes itu menunjukkan tingginya tingkat kesesuaian (degree of agreement), kita dapat menyimpulkan bahwa hasil pengukuran tes itu konsisten. Rumus K-R 20 dan 21 menunjukkan seri karena kedua orang itu mengembangkan banyak rumus yang diberi nomor seri. Dari banyak rumus yang dikembangakn, kedua nomor seri itulah yang kemudian terkenal dan banyak dipergunakan orang.

Adapun rumus K-R 20 dan 21 yang dikemukakan orang, antara yang satu dengan yang tidak sama, walau akan menghasilkan koefisien korelasi yang kurang lebih sama. Rumus K-R 20 adalah sebagai berikut :
                        r = ( )
                        r  = Koefisien reliabilitas tes
                        n = Jumlah butir soal
                        p  = Proporsi jawaban betul
                        q = Proporsi jawaban salah (q=1-p)
                        s = Simpangan baku, ; varian
                        Rumus K – R 21 adalah sebagai berikut:
                        r = )
                         = rata- rata hitung (mean), sedang simbol-simbol yang lain
Contoh-contoh penerapan kedua rumus diatas:
Besarnya koefisien korelasi reliabilitas berkisar antara 0 sampai dengan 1,0. Koefisien 0, atau bahkan negatif, menunjukkan bahwa hasil pengukuran dengan tes yang bersangkutan sangat rendah tingkat reliabilitasnya. Sebaliknya, semakin besar koefisien yang diperoleh, hal itu menunjukkan bahwa hasil pengukuran tes semakin tinggi reliabilitasnya. Koefisien 1,00 berarti bahwa tes itu benar-benar sempurna. Tes buatan guru dikatakan terpercaya jika paling tidak mempunyai koefisien sebesar 0,60,  sedang untuk tes yang dipublikasikan (tes standar) minimal 0,85 (Tuckman, 1975:256-57).
Pengujian reliabilitas terhadap hasil pengukuran tes dengan mempergunakan K-R 20 dan 21, koefisien yang didapatkan akan lebih besar dengan K-R 20. Akan tetapi, prosedur penghitungan dengan K-R  20 lebih rumit daripada  dengan K-R 21, terutama dalam mendapatkan yang  menuntut dilakukannya analisis jawaban benar dan salah per butir soal per peserta didik. Sebaliknya, penghitungan koefisien K-R 21 dapat mengukur secara lebih akurat dalam memberikan penafsiran. Oleh karena itu, penggunaan rumus K-R 21 lebih direkomendasikan (Ebel, 1979:281). Namun, jika kita bermaksud menguji hasil pengukuran tes yang bersifat heterogen, misalnya tes yang terdiri dari berbagai pokok bahasan, penggunaan rumus K-R 20 lebih direkomendasikan.
6.      Reliabilitas Alpha Cronbach
Jika rumus reliabilitas Kuder-Richardson 20 dan 21 di atas diterapkan pada tes yang mempunyai skor dikhotomi, artinya hanya ada dua kemungkinan skor: benar dan salah, dengan skor: 1 dan 0 saja, koefisien realibilitas Alpha –lengkapnya koefisien realibilitas Alpha Cronbach- diterapkan pada tes yang mempunyai skor berskala dan dikhotomis sekaligus. Artinya, prosedur uji reliabilitas ini diterapkan pada hasil pengukuran yang berjenjang, misalnya: 1-4, 1-5, 1-6, atau yang lain tergantung maksud penyusunannya. Namun, jika dikehendaki, prosedur reliabilitas Alpha ini pun dapat diterapkan pada hasil pengukuran tes yang bersifat dikhotomis sebagaimana halnya rumus reliabilitas K-R di atas, karena pada dasarnya keduanya sama, yaitu merupakan koefisien reliabilitas komposit untuk semua butir pada uji tes (Naga, 1992:150).

Pertanyaan-pertanyaan (angket) mengenai sikap, minat, motivasi, nilai-nilai, dan lain-lain yang jawabannya berskala (skala bertingkat), penghitungan kadar reliabilitasnya adalah memakai koefisien reliabilitas Alpha ini. Berhubung tes bentuk uraian juga menghendaki jawaban yang berskala, perhitungan kadar reliabilitas untuk bentuk itu juga mempergunakan rumus ini. Rumus koefisien reliabilitas Alpha Cronbach itu adalah sebagai berikut (Fernandes, 1984:34).
                        r = )
                        k = Jumlah butir soal
                         = Jumlah varian butir-butir
                         = Varian total (untuk seluruh butir tes)
Teknik penghitungan koefisien reliabilitas Alpha Cronbach ini cukup luas dipergunakan untuk keperluan uji hasil pengukuran di dunia pendidikan. Dalam penghitungan indeks tingkat kesulitan (ITK) dan indeks daya beda (IDB) butir soal lewat program komputer Iteman, indeks reliabilitas yang dipergunakan juga koefisien reliabilitas Alpha Cronbach. Contoh penghitungan rumus koefisien Alpha di atas.

E.     Contoh Penghitungan Pengujian Reliabilitas
1)      Penghitungan Koefisien Korelasi Teknik Belah Dua
Hasil pengukuran yang akan diuji reliabilitasnya adalah bentuk tes objektif dengan jawaban dikhotomis. Jawaban benar mendapat skor 1, jawaban salah 0. Langkah pertama yang ditempuh adalah menganalisis lembar-lembar jawaban peserta didik terhadap hasil pengukuran tes yang akan diuji, menghitung jawaban benar atau salah per butir soal per peserta didik, skor jawaban betul untuk kelompok butir soal bernomor ganjil dan genap inilah yang dicari korelasinya. Berikut dicontohkan analisis jawaban peserta didik untuk menghitung skor kelompok ganjil dan genap, misalnya terhadap hasil pengukuran tes kompetensi membaca dan bersastra.
Tabel
Analisis Butir Soal untuk Persiapan Penghitungan
Korelarsi Teknik Reliabilitas Belah Dua
Nomor Urut Peserta Tes
Nomor Butir Soal
Skor total
Skor ganjil
Skor genap
1
2
3
4
5
6
7
8
9
10
1.       
1
1
0
1
0
1
1
1
1
1
8
3
5
2.       
1
0
1
1
1
1
0
0
0
1
6
3
3
3.       
0
1
1
1
0
1
1
0
1
1
7
3
4
4.       
0
1
1
1
1
0
1
1
1
1
8
4
4
5.       
1
1
0
0
1
1
0
1
0
0
5
2
3
6.       
1
1
1
1
0
1
1
1
1
1
8
4
5
7.       
1
0
1
0
0
1
1
1
0
1
6
3
3
8.       
0
0
1
1
1
0
0
1
0
0
4
2
2

Data hasil di atas dipergunakan untuk menghitung koefisien korelasi skor ganjil ( ) dan skor ( ) berikut.
Nomor Urut Peserta Tes
X1
X2
1.
3
5
2.
3
3
3.
3
4
4.
4
4
5.
2
3
6.
4
5
7.
3
3
8.
2
2
N=8








Data tersebut kemudian dimasukkan ke dalam rumus korelasi product moment angka kasar.
            (8 x 91 ) –( 24 x 29 )
 =

       =   718 – 686      =        32         =        32     = 0.713
                           44,9

Koefisien korelasi sebesar 0,713 yang diperoleh tersebut baru menunjukkan tingkat reliabilitas separuh tes. Untuk mendapatkan reliabilitas seluruh tes, ia harus dilanjutkan dengan penggunaan runus Spearman-Brown seperti dikemukakan di atas.
2)      Perhitungan Koefisien Reliabilitas dengan Rumus K-R 20 dan K-R 21
Sama halnya dengan penghitungan koefisien realibilitas belah dua, hasil pengukuran yang akan diuji realibilitasnya adalah bentuk tes objektif dengan jawaban dikhotomis, jawaban benar dengan skor 1, dan jawaban salah 0. Langkah persiapan untuk menghitung koefisien keterpercayaan dengan rumus K-R 20 adalah sebagai berikut.

Menganalisis jawaban benar atau salah per butir soal per peserta didik langsung diletakkan dalam sebuah tabel analisis butir soal. Selanjutnya, menghitung jawaban benar per  peserta didik (secara horisontal), dari data ini dapat ditemukan besarnya rata-rata hitung ( )  dan simpangan baku (s). Setelah itu, menghitung jawaban benar per butir soal (secara vertikal), dari data ini dapat dihitung proporsi jawaban benar (p) dan jawaban salah (q). Besarnya p = jumlah jawaban benar dibagi jumlah subjek, sedang q = 1- p. Selanjutnya, dihitung berapa jumlah p x q ( ). Di bawah ini dicontohkan analisis  dan penghitungan yang dimaksud.
Tabel
Analisis Butir Soal
Nomor
Urut
Peserta tes
Nomor butir soal
Jumlah
skor
1
2
3
4
5
6
7
8
9
10
1.
1
1
0
0
1
0
1
1
1
0
6
2.
1
0
0
1
1
0
0
0
1
1
5
3.
1
1
1
0
1
1
1
1
0
1
8
4.
0
1
0
0
0
1
1
1
0
0
4
5.
0
0
0
0
1
0
1
0
1
0
3
6.
1
1
1
1
1
1
1
0
1
1
9
7.
1
1
0
1
0
1
0
0
1
1
6
8.
1
1
1
0
0
1
1
0
1
1
7
Jumlah
6
6
3
3
5
5
6
3
6
5
48
P
0,75
0,75
0,375
0,375
0,625
0,625
0,75
0,375
0,75
0,625

Q
0,25
0,25
0,625
0,625
0,375
0,375
0,25
0,625
0,25
0,375
Pq
0,19
0,19
0,234
0,234
0,234
0,234
0,19
0,234
0,19
0,234
2,164
 N  =    10        S   =    1,87





Dari data  di atas  kota masukkan ke dalam rumus K-R 20 berikut:
r           =   ( 1 - )

                        =   (1-  )
   
                        =    )
            =  1,11 ( 1-0,619)
=  1,11 x 0,381
            =  0,423

Data-data di atas juga kita masukkan ke dalam rumus K-R 21. Akan tetapi, data yang dibutuhkan hanya: N= 10,    = 6, dan s = 1,87. Jadi, tidak memerlukan analisis butir soal untuk mendapatkan jumlah proporsi pq   seperti halnya pada K-R 20.
Perhitungan dengan rumus K-R 21 dicontohkan sebagai berikut.
r =  =  ( 1 –  )

            =
 
             = 1,11 (1-0,686)
             = 1,11 x 0,314
             =  0,348
Sebagai catatan perlu ditambahkan bahwa penggunaan rumus K-R 20 dan 21 mendasarkan diri pada asumsi disrtribusi normal. Jadi, ia menghendaki penyebaran angka ke kanan dan ke kiri secara merata dengan titik tengah letak kecenderungan sentral nilai. Semakin tinggi jarak sebaran skor (range), atau semakin besar nilai simpangan baku (s), akan semakin tinggi pula koefisien r yang diperoleh.

F.     Usaha Penyusunan Tes yang Reliabel
Untuk mengusahakan agar tes yang kita susun terpercaya, hal-hal yang disarankan berikut perlu diperhatikan. Adapun hal-hal yang dimaksud adalah sebagai berikut:
1)      Susun butir soal secukupnya
Jumlah butir tes yang relatif banyak akan lebih baik dari pada yang sedikit karena  keadaan itu akan lebih mencerminkan sampel penampilan (kompetensi dan keterampilan).  Penambahan jumlah butir soal akan meningkatkan kadar reliabilitas, semakin besar jumlah butir soal akan semakin besar pula kadar realibilitasnya. Akan tetapi,  penambahan butir soal sampai dengan jumlah tertentu tidak akan meningkatkan kadar reliabilitas secara seimbang. Tabel berikut (Ebel, 1979:289)
Table 4.7
Hubungan antara jumlah butir soal dan reliabilitas hasil pengukuran
Jumlah butir soal
Reliabilitas
5
0,20
10
0,33
20
0,50
40
0,67
80
0,80
160
0,89
320
0,94
640
0,97

1,00

Penambahan jumlah butir soal sampai dengan 80 buah masih menguntungkan karena peningkatan kadar reliabilitas cukup tinggi. Akan tetapi, penambahan selanjutnya tidak begitu menanmbah tingginya reliabilitas. Hal itu tidak seimbang dengan banyaknya jumlah butir tes yang sebanyak itu.
2)      Pilih butir soal yang bertaraf kesulitan cukupan
Butir soal yang baik adalah butir yang tidak terlalu sulit, dan sebaiknya tidak terlalu mudah. Butir tes yang terlalu sulit atau mudah tidak mencerminkan secara memadai kompetensi yang diukur, di samping juga tidak dapat membedakan antara peserta didik yang berprestasi dan yang tidak.indeks tingkat kesulitan sebuah butur soal dinyatakan dengan koefisien 0,00 sampai dengan 1,00. Butir soal yang indeks kesulitannya semakin mendekati nol berarti soal itu semakin sulit, sebaliknya, semakin besar indeks kesulitan berarti butir soal itu semakin mudah.
3)      Pilih butir soal yang berdaya beda cukup
Butir soal yang baik adalah butir yang mampu membedakan antara peserta didik yang berprestasi dengan yang tidak. Daya pembeda sebuah butir soal  dinyatakan dengan indeks -1,00 sampai dengan 1,00. Indeks suatu butir soal  yang semakin tinggi mendekati 1,00 akan semakin baik karena semakin mampu membedakan antara kedua kelompok tinggi dan rendah tersebut.
4)      Perjelas redaksi soal tes
Selain memengaruhi validitas hasil pengukuran, kejelasan unsur  bahasa juga memengaruhi reliabilitas. Oleh karena itu, bahasa yang dipergunakan dalam tes harus jelas, mudah dipahami,  dan tidak bersifat ambigu, serta tidak membingungkan.
5)      Bersikap Objektif Dalam Menilai
Sikap objektif dalam menilai pekerjaan peserta didik, khususnya untuk tes uraian, sangat diperlukan. Sikap objektivitas dalam penilaian akan meningkatkan kekonsistensi hasil pengukuran sebuah tes. Dalam tes objektif biasanya konsistensi dalam penyekoran lebih terjamin karena antara jawaban benar dan salah sudah pasti dan jelas terlihat.

6)      Control Terhadap Kondisi Pelaksanaan Tes
Control terhadap pelaksanaan tes tidak hanya memengaruhi valeditas hasil pengukuran, tetapi juga rebilitasnya. Maka, kondisi pelaksanaan tes harus diusahakan sedemikian rupa sehingga kondisi luar yang dapat memengaruhi penampilan peserta didik dalam tes dapat dicegah karena hal itu juga berate memengaruhi hasil tes.
7)      Kesalahan Baku Pengukuran
Skor prserta tes yang di peroleh lewat pengukuran adalah sekor yang memeliki” kesalahan” artinya sekorsebenarnya bukan merupakan skor mereka yang sesungguhnya (true score). Skor yang sesungguhnya,yaitu skor yang benar-benar mewakili keadaan atau kompetensi peserta didik yang sebenarnya dalam bidang yang diukur itu tidak pernah diketahui secara pasti, dan hanya dapat diperkirakan saja besarnya.cara untuk memperkirakan skor yang sesunguhnya adalah dengan menggunakan kesalahan  buku pengukuran ( standard Eror of measurement) terhadap hasil pengukuran yang dipetroleh. Untuk membantu kecermatan dalam pemberian pertimbangan terhadap hasil tes peserta didik.

Kesalahan baku pengukuran dihitung berdasarkan besarnya simpangan baku (s) dan indeks reliabilitas  alat tes yang bersangkutan. Adapun rumus yang dipergunakan untuk menghitung kesalahan baku pengukuran tersebut adalah sebagai berikut:
SEm = s
Keterangan:
SEm : standard error of measurement, kesalahan baku pengukuran yang dicari
s       : simpangan baku
r       : indeks reliabilitas.

Misalnya, dalam penghitungan reliabilitas dengan teknik K-R 20 yang berdasarkan table hasil pengukuran table 4.5. dari table itu diketahui bahwa s= s = 1,87, dan dalam penghitungan yang dilakukan kemudian diperoleh indeks reliabilitas r =  0,423. Kedua data yang diperlikan itu kemudian dimasukkan ke dalam rumus:
SEm           = s -r
                         = 1,87
                          = 1, 42046 ( dibulatkan : 1,42).
Besar kecilnya indeks simpangan baku pengukuran meenuhi kualitas hasil pengukuran. Semakin kecil indeks itu semakin baik. Hal itu dikarenakan dengan kecilnya indeks itu perkiraan besarnya skor sesungguhnya tidak terlalu jauh. Artinya, skor sesungguhnya seorang peserta didik tidak terlalu menyimpang dari skor yang diperoleh atau yang tampak. Besarnya indeks simpangan baku kesalahan ditentukan oleh besarnya indek reliabilitas dan simpangan baku. Semakin besar indeks reliabilitas akan semakin kecil indeks simpangan baku pengukuran, dan sebaliknya, semakin kecil indeks realibilitas akan semakin besar indeks kesalahan baku pengukuran.










BAB III
PENUTUP

A.    Kesimpulan
Realibilitas menunjuk pada pengertian konsistensi pengukuran yaitu seberapa konsisten skor tes atau hasil evaluasi dari suatu pengukuran ke pengukuran lain.
            Secara umum, ada 2 cara dalam mengukur sebuah realibilitas yaitu:
            1.  Realibilitas Stabilitas
            2.  Realibilitas Ekivalen
B.     Saran
Semoga makalah ini dapat membantu dan menjadi sebuah referensi bagi pembaca pada umumnya dan penulis pada khususnya. Kritik dan Saran sangat kami harapkan untuk membangun dan menjadikan lebih baik lagi di tugas- tugas selanjutnya.











DAFTAR PUSTAKA

Burhan Nurdiyantoro. 2010 “Penilaian Pembelajaran Bahasa” Yogyakarta

Komentar

Postingan populer dari blog ini

TEKS MC ACARA DRAMA

ANALISIS UNSUR SEBUAH PUISI

Makalah Presuposisi (Praanggapan) PRAGMATIK