EVALUASI PEMBELAJARAN - REABILITAS
MAKALAH
EVALUASI PEMBELAJARAN
“Reliabilitas”
Diampu Oleh Izhar,M.Pd.
Disusun
oleh,
Kelompok :
V
Kelas :
4 A
PENDIDIKAN BAHASA DAN SASTRA
INDONESIA
SEKOLAH TINGGI KEGURUAN DAN ILMU
PENDIDIKAN MUHAMMADIYAH PRINGSEWU
LAMPUNG
2017
DAFTAR NAMA
KELOMPOK VII
NO.
|
NAMA
|
NPM
|
PARAF
|
1
|
Teguh Setiawan
|
15040008
|
|
2
|
Nurul Rohmawati
|
15040011
|
|
3
|
Dian Famelia
|
15040027
|
|
4
|
Ria Destiana
|
15040030
|
|
5
|
Dewi Amelia
|
15040033
|
|
KATA PENGANTAR
Assallamuallaikum Wr.
Wb
Puji
dan syukur kehadirat Allah SWT, karena atas rahmat dan hidayah-Nya lah kami
dapat menyelesaikan makalah ini. Tidak lupa kami mengucapakan terima kasih
kepada Bapak Izhar, M.Pd. sebagai dosen pengampu mata kuliah Evaluasi
Pembelajaran, dan Kedua Orang Tua yang selalu menjadi motivator setiap saat
serta pihak-pihak lain yang telah mendukung dalam kelancaran pembuatan makalah
ini.
Adapun
maksud dan tujuan pembuatan makalah ini adalah untuk memenuhi tugas kelompok di
Mata Kuliah Evaluasi Pembelajaran. Didalam penulisan makalah ini kami menyadari
bahwa masih terdapat kekurangan dan kesalahan. Untuk itu kami mengharapkan
kritik dan saran yang membangun dari pembaca untuk menyusun makalah lain
dikesempatan yang akan datang. Semoga makalah ini bermanfaat tidak hanya bagi
kami tetapi juga bagi pembaca.
Wassalllamuallaikum
Wr. Wb
Pringsewu,
02 Maret 2017
Kelompok
V
DAFTAR ISI
HALAMAN JUDUL
DAFTAR NAMA KELOMPOK...................................................................... ii
KATA PENGANTAR....................................................................................... iii
DAFTAR ISI....................................................................................................... iv
BAB I PENDAHULUAN
A. Latar
Belakang.......................................................................................... 1
B. Rumusan
Masalah..................................................................................... 1
C. Tujuan........................................................................................................ 1
BAB II PEMBAHASAN
A. Pengertian
Realibilitas............................................................................... 2
B. Jenis-
Jenis Realibilitas.............................................................................. 2
C.
Faktor-Faktor Yang Mempengaruhi
Koefisien Reliabilitas ..................... 3
D.
Pengujian Realibilitas................................................................................ 4
E.
Contoh Penghitungan Pengujian
Reliabilitas............................................ 14
F.
Usaha Penyusunan Tes yang Reliabel....................................................... 19
BAB III PENUTUP
A.
Kesimpulan................................................................................................ 23
B.
Saran.......................................................................................................... 23
DAFTAR PUSTAKA
BAB
I
PENDAHULUAN
A.
Latar Belakang
Reliabilitas
merupakan sifat yang ada pada data atau skor yang dihasilkan oleh instrumen,
namun untuk memudahkan reliabilitas dapat dikatakan sifat dari insrumen dan juga
reliabilitas bukanlah bersifat dikotomis, tetapi merupakan rentangan yang
biasnya dinyatakan dengan bentuk angka 0 (nol) sampai 1 (satu). Dengan demikian
kurang tepat kiranya kalau dipertanyakan apakah suatu instumen itu memiliki
reliabilitas atau tidak, akan tetapi tepatnya adalah suatu instrumen dapat
menghasilkan data atau skor yang memiliki tingkat reliabilitas yang memadai
atau tidak. Suatu instrumen memiliki tingakat reliabilitas yang tinggi, sedang,
atau rendah. Hampir sama dengan pengertian tersebut, bahwa keberadaan
reliabilitas tiada semata-mata berupa dua pilihan, reliabel ataukah tidak
reliabel, akan tetapi merupakan rentang yang berjenjang dari tingkat yang
paling tinggi sampai tingkat yang palinng rendah. Reliabilitas tingkat paling
tinggi yang secara statistik ditulis sebagai 1,00 yang menandakan adanya mutlak
tanpa perbedaan dan penyimpangan sedikitpun. Realiabilitas merupakan salah satu
syarat penting bagi suatu isntrumen evaluasi. Oleh sebab itu kami akan membahas
tentang reliabilitas agar dapat bermanfaat untuk semua.
B. Rumusan
Masalah
1. Apakah Pengertian Realibilitas?
2. Apa sajakah Jenis- Jenis Realibilitas dan
Bagaimanana Cara Mengujinya?
C. Tujuan
Untuk
mengetahui lebih mendalam tentang Realibilitas dan Cara mengujinya
BAB II
PEMBAHASAN
A. Pengertian
Reliabilitas
Menurut Dr.
Saifudin Azwar (2011:4) Reliabilitas merupakan penerjemah dari kata reliability
yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki
reliabilitas tinggi disebut sebagai pengukuran yang reliabel. Konsep reliabilitas
adalah sejauh mana hasil suatu pengukuran dapat dipercaya seperti pendapat dari
Masri
Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat
ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai
dua kali untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh
relative konsisten, maka alat pengukur tersebut reliable. Dengan kata lain,
realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala
yang sama.
Dapat disimpulkan reliabilitas tes
merupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi
pengukuran tes yang hasilnya menunjukan keajegan (konsisten). Seorang dikatakan
dapat di percaya apabila orang tersebut berbicara konsistensi, tidak berubah- ubah
pembicaraannya dari waktu ke waktu. Dalam sebuah tes pentingnya diamati
keajegan dan kepastian tes tersebut dilihat dari hasil tes yang didapat.
B. Jenis-
Jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum
untuk mengukur reliabilitas, yaitu;
1. Relibilitas
stabilitas.
Menyangkut
usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap
unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut
penggunaan indikator yang sama, definisi operasional, dan prosedur pengumpulan
data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat
memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah
sama atau hampir sama.
2. Reliabilitas
ekivalen.
Menyangkut
usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada
waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau
lebih indikator yang berbeda, batasan-batasan operasional, peralatan
pengumpulan data, atau pengamat-pengamat.
Menguji
reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bisa
menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah- tengah.
Cara ini seringkali dipakai dalam survai. Apabila satu rangkaian pertanyaan
yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan- pertanyaan
tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau
pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing
bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian
tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian
tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah
reliabilitas belah tengah.
Reliabilitas
ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan
misalnya, telah diukur dengan laporan pulsa. Skor- skor relatif dari satu
indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang
subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan
tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.
C. Faktor-Faktor Yang Mempengaruhi Koefisien
Reliabilitas
Ada
beberapa faktor yang mempengaruhi koefisien reliabilitas dari instrumen yang
berupa tes, diantaranya:
1)
Panjang Tes. Pada umumnya semakin
panjang tes semakin tinggi reliabilitasnya. Hal ini disebabkan tes yang cacah
butirnya banyak akan memuat cukup banyak tingkah laku yang diukur.
2)
Penyebaran Skor. Koefisien reliabilitas
dipengaruhi oleh penyebaran skor. Makin lebar penyebaran skor makin tinggi
estimasi koefisien reliabilitasnya. Hal ini disebabkan koefisien reliabilitas
akan semakin tinggi apabila individu- individu cenderung tetap pada kedudukan
terhadap kelompoknya.
3)
Tingkat Kesukaran Tes. Tes yang terlalu
sukar atau terlalu mudah cenderung menurunkan koefisien reliabilitas. Hal ini
disebabkan tes yang terlalu sukar atau terlalu mudah menghasilkan sebaran yang
terbatas dan terkumpul diujung bawah atau diujung atas.
4)
Objektivitas. Objektivitas suatu tes
menunjukan seberapa jauh dua orang yang mempunyai kemampuan yang sama
mendapatkan skor yang sama.
D. Pengujian Realibilitas
Pendekatan dan Teknik pengujian
realibilitas antara lain :
1)
Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik ”double test double
trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang
parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu
buah kisi- kisi. Setiap butir soal dari instrument yang satu selalu harus dapat
dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diuji
cobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut
dihitung korelasinya dengan menggunakan rumus product moment (korelasi
Pearson).
2)
Teknik Ulang (Test Re-test)
Teknik ini disebut juga teknik ”single test double
trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor
pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks
reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada
teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest
adalah seberapa besar derajat skor tes konsisten dari waktu ke waktu. Realibilitas
diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama
kepada kelompok yang sama, pada waktu yang berbeda.
Metode pengujian reliabilitas stabilitas yang paling
umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode
test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu
pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain
untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah
memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau
wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI)
mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang
pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan reliabilitas
stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang
benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada
ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat
membuat asumsi-asumsi ini adalah pengalaman, teori atau putus dan terbaik.
Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya
mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.
3.
Teknik Belah Dua
Penentuan
reabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula
Spearman-Brown dikenal dengan istilah : teknik belah dua (split half technique). Disebut “belah dua” , sebab dalam penentuan
reabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua
butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing
testee memiliki dua macam skor. Salah satu skor merupakan bagian pertama atau
belahan pertama dari tes, sedangkan skor yang satunya lagi merupakan bagian
kedua atau belahan kedua dari tes hasil belajar bentuk obyektif tersebut.
Dengan
demikian, penerapan formula Spearman-Brown akan menghasilkan dua buah
distribusi skor belahan pertama drngan distribusi skor belahan keduan itu dipandang
sebagai reabilitas bagian butir-vutir soal tes hasil belajar bentuk obyektif
tersebut; sedangkan untuk mengetahui reabilitas tes secara keseluruhan
Spearman-Brown menciptakan formula sebagai berikut dimana :
Rtt=2.rhh
1+rhh
1+rhh
rtt = Koefisien
reabilitas tes secara total (tt = total tes)
rhh = Koefisien korelasi product moment
antara separoh (bagian
pertama) tes, dengan separoh (bagian kedua) dari tes tersebut
(hh = half-half)
pertama) tes, dengan separoh (bagian kedua) dari tes tersebut
(hh = half-half)
1&2= Bilangan
Konstantan
Rumus lain yang sejenis dengan rumus diatas adalah ;
Dimana :
r11 = Koefisien
reabilitas tes secara keseluruhan
r = Koefisien
korelasi product moment antara separoh
(1/2) tes (belahan) dengan separoh (1/2) tes (belahan)
dari tes tersebut.
(1/2) tes (belahan) dengan separoh (1/2) tes (belahan)
dari tes tersebut.
1&2 = Bilangan Konstan
Untuk
mengetahui besarnya rhh atau
r dapat digunakan salah satu
diantara rumus berikut :
Realibilitas Seluruh Tes= 1+ 2x reliabilitas separuh tes
1+reliabilitas separuh tes
Atau r = 2
xr
1+ r
1+ r
Misalnya, berdasarkan penghitungan
koefesien korelasi separuh soal didapatkan r sebesar 0,713 , maka tingkat
kepercayaan seluruh tes adalah:
Realibilitas Seluruh Tes = 2x
0,713 = 0,832
1 + 0.713
Koefesien reliabilitas seluruh tes
yang diperoleh tersebut termasuk kategori tinggi, maka tes yang diuji itu
dinyatakan memiliki tingkat reliabilitas yang tinggi pula. Artinya hasil
pengukuran yang dilakukan dengan alat tes yang bersangkutan dinyatakan
konsisten. Dalam penerapan
formula Spearman-Brown tersebut iatas, Spearman-Brown mempersembahkan dua buah
model, yaitu Model Gasal- Genap dan Model Kiri-Kanan
1) Model Gasal-Genap
Pada model ini skor-skor yang dimiliki oleh testee untuk butir item
yang bernomor gasal ( misalnya item nomor 1, 3, 5, 7, 9, 11 dan seterusnya )
dianggap sebagai separoh bagian pertama dari tes, sedangkan skor-skor yang
dimiliki testee untuk butir-butir item yang bernomor genap ( misalnya item
nomor 2, 4, 6, 8, 10, 12 dan seterusnya ) dianggap sebagai separoh bagian kedua
dari tes yang bersangkutan.
Pendekatan
Single Test-Single Trial dengan Mengunakan Formula Spearman-Brown Model Gasal
Genap.
Langkah-langkah yang perlu
ditempuh dalam penentuan reliabilitas tes dengan pendekatan single-test dimana
digunakan formula Spearman-Brown Model Genap adalah sebagai berikut :
1) Menjumlah skor-skor dari butir-butir item yang
bernomor gasal yang dimiliki oleh masing-masing, individu testee.
2) Menjumlahkan skor-skor dari butir-butir item yang
bernomor genap yang dimiliki oleh masing-masing individu testee.
3) Mencari ( menghitung ) koefisien korelasi “r” product
moment ( rxy = rhh = r ).
Dalam hal ini jumlah skor-skor dari butir-butir item
yang bernomor gasal kita anggap sebagai variable X, sedangkang jumlah skor-skor
dari butir-butir item yang bernomor genap kita anggap sebagai variable Y,
dengan menggunakan rumus Mencari ( menghitung ) koefisien reliabilitas tes ( r11
= rtt ) dengan menggunakan rumus
Memberikan interprestasi
terhadap r11
Contoh
:
Tes
hasil belajar bidang studi Ushul Fiqh yang diikuti oleh 25 orang siswa madrasah
‘ Aliyah’, menyajikan 24 butir item bentuk item obyektif, dengan ketentuan
bahwa untuk setiap jawaban betul diberikan skor 1, sedangkan untuk setiap
jawaban salah diberikan skor 0. Setalah tes berakhir, diperoleh penyebaran skor hasil tes sebagai berikut :
Penyebaran skor hasil tes bidang studi Ushul Fiqh yang
diikuti oleh 25 orang siswa.
Langkah
1 : Menjumlahkan skor yang bernomor gasal
Skor-skor yang dimiliki oleh butir-butir item tes
hasil belajar bidang studi Ushul Fiqh, yang bernmor gasal.
Langkah
2 : Menjumlahkan skor-skor yang bernomor genap
Skor-skor yang dimiliki oleh butir-butir item tes
hasil belajar bidang studi Ushul Fiqh yang bernomor genap .
Langkah
3 : Menghitung angka indeks korelasi “r” product moment, antara variable X (
separoh belahan tes I ) dengan variable Y ( separoh belahan tes II ) yaitu rxy
atau rhh atau r .
Perhitungan-perhitungan untuk memperoleh rxy
= rhh = r
Langkah
5 : Memberikan iterprestasi terhadap r11 : berdasar hasil
perhitungan diatas diperoleh koefisien reabilitas tes (r11 ) sebesar
0,84 ternyata jauh lebih besar dari 0,70. Dengan demikian dinyatakan tes hasil
belajar tersebut memiliki realibitas tinggi.
2) Model
Belahan Kiri- Kanan
Pada
model belahan kiri-kanan, jumlah butir-butir item yang ada dalam tes, dibelah
menjdai dua bagian yang sama besar. Misalnya jumlah butir soal tes adalah 60,
maka butir soal nomor 1 samapai dengan butir soal nomor 30 ditetapkan sebagai
belahan kiri ( belahan I) sedangkan butir item nomor 31 sampai dengan butir soal
nomor 60 ditetapkan sebagai belahan kanan ( belahan II ).
Pendekatan
Single Test – Single Thrial dengan menggunakan Formula Spearman-Brown
Model Belahan Kiri dan Kanan. Langkah-langkah yang perlu ditempuh da;am penentuan
reliabilitas tes dengan menngunakan pendekatan Single Test – Single Thrial di
mana digunakan formula Sperman-Brown model belahan kiri dan kanan adalah
sebagai berikut :
a) Menjumlahkan skor-skor dari butir-butir item yang
terletak di separoh bagian kiri tes, yang dimiliki oleh masing-masing individu
siswa yaitu : butir-butir item dengan nomor 1,2,3, 4,5, 6, 7, 8, 9, 10, 11
dan 12.
b) Menjumlahkan skor-skor dari butir-butir item yang
terletak di separoh bagian kanan tes, yang dimiliki ooleh masing-masing
individu siswa yaitu : butir-butir item dengan nomor
13,14,15,16,17,18,19,20,21,22,23 dan 24.
c) Mencari (menghitung) angka indeks korelasi “r”product
moment, antara variabel X (separoh belahan kiri) dengan variabel Y (separoh
belahan kanan) yaitu rxy atau rhh atau
r .
d) Mencari (menghitung) koefisien reliabilitas tes
(r11 ataur11) dengan menggunakan rumus Telah
diketahui ; dengan demikian r11 .
e) Memberikan interpretasi terhadap r11
Penentuan reabilitas tes dengan menggunakan formula
Spearman-Brown memiliki beberapa kelemahan yaitu ;
1)
Formula Spearman-Brown menghendaki agar
bekahan yang dicarikorelasinya yaitu belahan gasal-genap dan belahan kiri-kanan
haruslah sebanding.
2)
Penerapan formula Spearman-Brown juga
menuntut persyaratan, agar jumlah butir-butir item yang akan diuji
reabilitasnya haruslah merupakan bilangan genap; jadi seandainya jumlah
butir-butir item itu berupa bilangan gasal, maka formula ini tidak mungkin
untuk diterapkan.
Dengan
dua buah model perhitungan tersebut (model gasal-genap dan model kiri-kanan),
dapat terjadi bahwa koefisien reabilitas tes menunjukkan bilangan yang tidak
sama, sehingga dapat terjadi bahwa dengan menggunakan model gasal genap tes
dinyatakan reliable ( karena r11 atau rtt menunjukkan
angka 0,70 atau lebih), tetapi dengan menggunakan model kiri-kanan ternyata tes
dinyatakan un-reliabel ( karena besarnya r11 dibawah 0,70).
4. Pendekatan
Single Test – Single Trial dengan Menggunakan Formula Flanagan.
Dalam ranngka mengatasi
kelemahan-kelemahan yang disandang oleh formula Spearman-Brown, Flanagan
mengemukakan suatu formula, dimana sebagian dari persyaratan-persyaratan
seperti yang dituntut oleh formula Spearman-Brown tidak harus dipenuhi. Berbeda
dengan formula Spearman-Brown maka pada formula Flanagan reliabilitas tes tidak
didasarkan pada ada tidaknya korelasi antara belahan I dengan belahan II,
melainakan berdasarkan diri pada jumlah kuadarat deviasi pada tes belahan
I,jumlah kuadarat deviasi pada tes belahan II, dan jumlah kuadarat total (
belahan I dan Belahan II ). Adapun formula yang diajukan oleh Flanagan adalah r11
, dimana :
Rumus Flanagan:
r11 = 2 (1- S
+ S
)
r11 = Koefisien reliabilitas tes secara
totalitas
2 dan 1 = Bilangana
konstan
S12 = jumlah kuadrat deviasi ( = varian )
dari skor-skor hasil
tes yang termasuk pada belahan I
tes yang termasuk pada belahan I
S22 =
jumlah kuadrat deviasi ( =
vareian ) dari skor-skor
hasil tes yang termasuk belahan II
hasil tes yang termasuk belahan II
St2 =
jumlah kuadrat total deviasi ( =
varian total ) dari skor
- skor hasil tes belahan I dan belahan II
- skor hasil tes belahan I dan belahan II
Jadi, pada hakikatnya S12
adalah = mean dari jumlah kuadrat deviasi skor-skor item belahan I, S22
adalah mean = dari jumlah kuadrat deviasi skor-skor item belahan II, dan St2
adalah = mean dari jumlah kuadrat deviasi skor secara total.
Secara sederhana dapat dipahami
bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang
menghitung dengan kalkulator statistik varians ini diperoleh dengan
mengkuadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator
statistik maka varians dapat dicari dengan rumus sebagai berikut :
N
Standar
Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun
huruf S (B besar) juga dapat dikatakan
sudah menyebut standar deviasi. Dalam kalkulator tertera dengan simbol
. Bagi yang berminat mencari S dulu untuk
mencari varians, dapat menggunakan rumus S, yaitu:
N
Berdasarkan
data tabel belahan ganjil – genap perhitungannya adalah sebagai berikut :
8
8
= 1,859
8
8
= 1,937
8
8
= 2,36
Dimasukkan
ke dalam rumus diperoleh demikian :
r₁₁ = 2(1
-
)
= -2(1 – 1,609)
= -1,218
5. Reliabilitas Rumus Kuder – Richardson 20 dan 21
Pengujian reliabilitas
tes dengan mempergunakan rumus Kuder-Richardson (K – R) 20 dan 21, dilakukan
dengan membandingkan skor butir-butir tes. Jika butir-butir tes itu menunjukkan
tingginya tingkat kesesuaian (degree of agreement), kita dapat menyimpulkan bahwa
hasil pengukuran tes itu konsisten. Rumus K-R 20 dan 21 menunjukkan seri karena
kedua orang itu mengembangkan banyak rumus yang diberi nomor seri. Dari banyak
rumus yang dikembangakn, kedua nomor seri itulah yang kemudian terkenal dan
banyak dipergunakan orang.
Adapun rumus K-R 20 dan 21 yang
dikemukakan orang, antara yang satu dengan yang tidak sama, walau akan
menghasilkan koefisien korelasi yang kurang lebih sama. Rumus K-R 20 adalah
sebagai berikut :
r =
(
)
r = Koefisien reliabilitas tes
n
= Jumlah butir soal
p = Proporsi jawaban betul
q
= Proporsi jawaban salah (q=1-p)
s
= Simpangan baku,
; varian
Rumus K – R 21 adalah sebagai berikut:
r =
)
Contoh-contoh penerapan kedua rumus
diatas:
Besarnya
koefisien korelasi reliabilitas berkisar antara 0 sampai dengan 1,0. Koefisien
0, atau bahkan negatif, menunjukkan bahwa hasil pengukuran dengan tes yang
bersangkutan sangat rendah tingkat reliabilitasnya. Sebaliknya, semakin besar
koefisien yang diperoleh, hal itu menunjukkan bahwa hasil pengukuran tes
semakin tinggi reliabilitasnya. Koefisien 1,00 berarti bahwa tes itu
benar-benar sempurna. Tes buatan guru dikatakan terpercaya jika paling tidak
mempunyai koefisien sebesar 0,60, sedang
untuk tes yang dipublikasikan (tes standar) minimal 0,85 (Tuckman,
1975:256-57).
Pengujian
reliabilitas terhadap hasil pengukuran tes dengan mempergunakan K-R 20 dan 21,
koefisien yang didapatkan akan lebih besar dengan K-R 20. Akan tetapi, prosedur
penghitungan dengan K-R 20 lebih rumit
daripada dengan K-R 21, terutama dalam
mendapatkan yang
menuntut dilakukannya analisis jawaban benar
dan salah per butir soal per peserta didik. Sebaliknya, penghitungan koefisien
K-R 21 dapat mengukur secara lebih akurat dalam memberikan penafsiran. Oleh
karena itu, penggunaan rumus K-R 21 lebih direkomendasikan (Ebel, 1979:281).
Namun, jika kita bermaksud menguji hasil pengukuran tes yang bersifat
heterogen, misalnya tes yang terdiri dari berbagai pokok bahasan, penggunaan
rumus K-R 20 lebih direkomendasikan.
6. Reliabilitas
Alpha Cronbach
Jika rumus reliabilitas
Kuder-Richardson 20 dan 21 di atas diterapkan pada tes yang mempunyai skor
dikhotomi, artinya hanya ada dua kemungkinan skor: benar dan salah, dengan
skor: 1 dan 0 saja, koefisien realibilitas Alpha –lengkapnya koefisien
realibilitas Alpha Cronbach- diterapkan pada tes yang mempunyai skor berskala
dan dikhotomis sekaligus. Artinya, prosedur uji reliabilitas ini diterapkan
pada hasil pengukuran yang berjenjang, misalnya: 1-4, 1-5, 1-6, atau yang lain
tergantung maksud penyusunannya. Namun, jika dikehendaki, prosedur reliabilitas
Alpha ini pun dapat diterapkan pada hasil pengukuran tes yang bersifat
dikhotomis sebagaimana halnya rumus reliabilitas K-R di atas, karena pada
dasarnya keduanya sama, yaitu merupakan koefisien reliabilitas komposit untuk
semua butir pada uji tes (Naga, 1992:150).
Pertanyaan-pertanyaan (angket) mengenai
sikap, minat, motivasi, nilai-nilai, dan lain-lain yang jawabannya berskala
(skala bertingkat), penghitungan kadar reliabilitasnya adalah memakai koefisien
reliabilitas Alpha ini. Berhubung tes bentuk uraian juga menghendaki jawaban
yang berskala, perhitungan kadar reliabilitas untuk bentuk itu juga
mempergunakan rumus ini. Rumus koefisien reliabilitas Alpha Cronbach itu adalah
sebagai berikut (Fernandes, 1984:34).
r =
)
k = Jumlah butir soal
Teknik
penghitungan koefisien reliabilitas Alpha Cronbach ini cukup luas dipergunakan
untuk keperluan uji hasil pengukuran di dunia pendidikan. Dalam penghitungan
indeks tingkat kesulitan (ITK) dan indeks daya beda (IDB) butir soal lewat
program komputer Iteman, indeks reliabilitas yang dipergunakan juga koefisien
reliabilitas Alpha Cronbach. Contoh penghitungan rumus koefisien Alpha di atas.
E. Contoh Penghitungan Pengujian
Reliabilitas
1) Penghitungan
Koefisien Korelasi Teknik Belah Dua
Hasil
pengukuran yang akan diuji reliabilitasnya adalah bentuk tes objektif dengan
jawaban dikhotomis. Jawaban benar mendapat skor 1, jawaban salah 0. Langkah
pertama yang ditempuh adalah menganalisis lembar-lembar jawaban peserta didik
terhadap hasil pengukuran tes yang akan diuji, menghitung jawaban benar atau
salah per butir soal per peserta didik, skor jawaban betul untuk kelompok butir
soal bernomor ganjil dan genap inilah yang dicari korelasinya. Berikut
dicontohkan analisis jawaban peserta didik untuk menghitung skor kelompok
ganjil dan genap, misalnya terhadap hasil pengukuran tes kompetensi membaca dan
bersastra.
Tabel
Analisis
Butir Soal untuk Persiapan Penghitungan
Korelarsi Teknik Reliabilitas Belah Dua
Nomor Urut Peserta Tes
|
Nomor Butir Soal
|
Skor total
|
Skor ganjil
|
Skor genap
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||||
1.
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
8
|
3
|
5
|
2.
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
6
|
3
|
3
|
3.
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
7
|
3
|
4
|
4.
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
8
|
4
|
4
|
5.
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
0
|
0
|
5
|
2
|
3
|
6.
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
8
|
4
|
5
|
7.
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
6
|
3
|
3
|
8.
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
4
|
2
|
2
|
Data
hasil di atas dipergunakan untuk menghitung koefisien korelasi skor ganjil (
) dan skor (
) berikut.
Nomor
Urut Peserta Tes
|
X1
|
X2
|
1.
|
3
|
5
|
2.
|
3
|
3
|
3.
|
3
|
4
|
4.
|
4
|
4
|
5.
|
2
|
3
|
6.
|
4
|
5
|
7.
|
3
|
3
|
8.
|
2
|
2
|
N=8
|
|
|
Data
tersebut kemudian dimasukkan ke dalam rumus korelasi product moment angka
kasar.
(8 x 91 ) –( 24 x 29 )
=
718 – 686 = 32 =
32 = 0.713
Koefisien
korelasi sebesar 0,713 yang diperoleh tersebut baru menunjukkan tingkat
reliabilitas separuh tes. Untuk mendapatkan reliabilitas seluruh tes, ia harus
dilanjutkan dengan penggunaan runus Spearman-Brown seperti dikemukakan di atas.
2) Perhitungan
Koefisien Reliabilitas dengan Rumus K-R 20 dan K-R 21
Sama
halnya dengan penghitungan koefisien realibilitas belah dua, hasil pengukuran
yang akan diuji realibilitasnya adalah bentuk tes objektif dengan jawaban
dikhotomis, jawaban benar dengan skor 1, dan jawaban salah 0. Langkah persiapan
untuk menghitung koefisien keterpercayaan dengan rumus K-R 20 adalah sebagai
berikut.
Menganalisis
jawaban benar atau salah per butir soal per peserta didik langsung diletakkan
dalam sebuah tabel analisis butir soal. Selanjutnya, menghitung jawaban benar
per peserta didik (secara horisontal),
dari data ini dapat ditemukan besarnya rata-rata hitung (
)
dan simpangan baku (s). Setelah itu, menghitung jawaban benar per butir
soal (secara vertikal), dari data ini dapat dihitung proporsi jawaban benar (p)
dan jawaban salah (q). Besarnya p = jumlah jawaban benar dibagi jumlah subjek,
sedang q = 1- p. Selanjutnya, dihitung berapa jumlah p x q (
). Di bawah ini dicontohkan analisis dan penghitungan yang dimaksud.
Tabel
Analisis Butir Soal
Analisis Butir Soal
Nomor
Urut
Peserta
tes
|
Nomor
butir soal
|
Jumlah
skor
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
1.
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
6
|
2.
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
5
|
3.
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
8
|
4.
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
4
|
5.
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
3
|
6.
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
9
|
7.
|
1
|
1
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
6
|
8.
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
7
|
Jumlah
|
6
|
6
|
3
|
3
|
5
|
5
|
6
|
3
|
6
|
5
|
48
|
P
|
0,75
|
0,75
|
0,375
|
0,375
|
0,625
|
0,625
|
0,75
|
0,375
|
0,75
|
0,625
|
|
Q
|
0,25
|
0,25
|
0,625
|
0,625
|
0,375
|
0,375
|
0,25
|
0,625
|
0,25
|
0,375
|
|
Pq
|
0,19
|
0,19
|
0,234
|
0,234
|
0,234
|
0,234
|
0,19
|
0,234
|
0,19
|
0,234
|
2,164
|
N
= 10 S
= 1,87
|
Dari
data di atas kota masukkan ke dalam rumus K-R 20 berikut:
r
=
(
1 -
)
=
(1-
)
=
)
=
1,11 ( 1-0,619)
= 1,11 x 0,381
=
0,423
Data-data
di atas juga kita masukkan ke dalam rumus K-R 21. Akan tetapi, data yang
dibutuhkan hanya: N= 10, = 6, dan s =
1,87. Jadi, tidak memerlukan analisis butir soal untuk mendapatkan jumlah
proporsi pq seperti halnya pada K-R 20.
Perhitungan
dengan rumus K-R 21 dicontohkan sebagai berikut.
r =
=
(
1 –
)
=
= 1,11 (1-0,686)
= 1,11 x 0,314
= 0,348
Sebagai
catatan perlu ditambahkan bahwa penggunaan rumus K-R 20 dan 21 mendasarkan diri
pada asumsi disrtribusi normal. Jadi, ia menghendaki penyebaran angka ke kanan
dan ke kiri secara merata dengan titik tengah letak kecenderungan sentral
nilai. Semakin tinggi jarak sebaran skor (range), atau semakin besar nilai
simpangan baku (s), akan semakin tinggi pula koefisien r yang diperoleh.
F.
Usaha
Penyusunan Tes yang Reliabel
Untuk mengusahakan agar tes yang kita susun
terpercaya, hal-hal yang disarankan berikut perlu diperhatikan. Adapun hal-hal
yang dimaksud adalah sebagai berikut:
1)
Susun butir soal secukupnya
Jumlah butir tes
yang relatif banyak akan lebih baik dari pada yang sedikit karena keadaan itu akan lebih mencerminkan sampel
penampilan (kompetensi dan keterampilan).
Penambahan jumlah butir soal akan meningkatkan kadar reliabilitas,
semakin besar jumlah butir soal akan semakin besar pula kadar realibilitasnya.
Akan tetapi, penambahan butir soal
sampai dengan jumlah tertentu tidak akan meningkatkan kadar reliabilitas secara
seimbang. Tabel berikut (Ebel, 1979:289)
Table 4.7
Hubungan antara jumlah butir soal dan reliabilitas
hasil pengukuran
Jumlah butir soal
|
Reliabilitas
|
5
|
0,20
|
10
|
0,33
|
20
|
0,50
|
40
|
0,67
|
80
|
0,80
|
160
|
0,89
|
320
|
0,94
|
640
|
0,97
|
|
1,00
|
Penambahan jumlah butir soal
sampai dengan 80 buah masih menguntungkan karena peningkatan kadar reliabilitas
cukup tinggi. Akan tetapi, penambahan selanjutnya tidak begitu menanmbah
tingginya reliabilitas. Hal itu tidak seimbang dengan banyaknya jumlah butir
tes yang sebanyak itu.
2)
Pilih butir soal yang bertaraf kesulitan cukupan
Butir soal yang baik adalah butir yang tidak terlalu sulit, dan
sebaiknya tidak terlalu mudah. Butir tes yang terlalu sulit atau mudah tidak
mencerminkan secara memadai kompetensi yang diukur, di samping juga tidak dapat
membedakan antara peserta didik yang berprestasi dan yang tidak.indeks tingkat
kesulitan sebuah butur soal dinyatakan dengan koefisien 0,00 sampai dengan
1,00. Butir soal yang indeks kesulitannya semakin mendekati nol berarti soal
itu semakin sulit, sebaliknya, semakin besar indeks kesulitan berarti butir
soal itu semakin mudah.
3)
Pilih butir soal yang berdaya beda cukup
Butir soal yang baik adalah butir yang mampu membedakan antara peserta
didik yang berprestasi dengan yang tidak. Daya pembeda sebuah butir soal dinyatakan dengan indeks -1,00 sampai dengan
1,00. Indeks suatu butir soal yang
semakin tinggi mendekati 1,00 akan semakin baik karena semakin mampu membedakan
antara kedua kelompok tinggi dan rendah tersebut.
4)
Perjelas redaksi soal tes
Selain memengaruhi validitas hasil pengukuran, kejelasan unsur bahasa juga memengaruhi reliabilitas. Oleh
karena itu, bahasa yang dipergunakan dalam tes harus jelas, mudah
dipahami, dan tidak bersifat ambigu,
serta tidak membingungkan.
5)
Bersikap Objektif Dalam Menilai
Sikap objektif dalam menilai pekerjaan peserta didik, khususnya untuk
tes uraian, sangat diperlukan. Sikap objektivitas dalam penilaian akan
meningkatkan kekonsistensi hasil pengukuran sebuah tes. Dalam tes objektif
biasanya konsistensi dalam penyekoran lebih terjamin karena antara jawaban
benar dan salah sudah pasti dan jelas terlihat.
6)
Control Terhadap Kondisi Pelaksanaan Tes
Control terhadap pelaksanaan tes tidak hanya memengaruhi valeditas hasil
pengukuran, tetapi juga rebilitasnya. Maka, kondisi pelaksanaan tes harus
diusahakan sedemikian rupa sehingga kondisi luar yang dapat memengaruhi
penampilan peserta didik dalam tes dapat dicegah karena hal itu juga berate
memengaruhi hasil tes.
7)
Kesalahan Baku Pengukuran
Skor prserta tes yang di peroleh lewat pengukuran adalah sekor yang
memeliki” kesalahan” artinya sekorsebenarnya bukan merupakan skor mereka yang
sesungguhnya (true score). Skor yang sesungguhnya,yaitu skor yang
benar-benar mewakili keadaan atau kompetensi peserta didik yang sebenarnya
dalam bidang yang diukur itu tidak pernah diketahui secara pasti, dan hanya
dapat diperkirakan saja besarnya.cara untuk memperkirakan skor yang sesunguhnya
adalah dengan menggunakan kesalahan buku
pengukuran ( standard Eror of measurement) terhadap hasil pengukuran
yang dipetroleh. Untuk membantu kecermatan dalam pemberian pertimbangan
terhadap hasil tes peserta didik.
Kesalahan baku pengukuran dihitung berdasarkan besarnya simpangan baku
(s) dan indeks reliabilitas alat tes
yang bersangkutan. Adapun rumus yang dipergunakan untuk menghitung kesalahan
baku pengukuran tersebut adalah sebagai berikut:
SEm = s
Keterangan:
SEm : standard
error of measurement, kesalahan baku pengukuran yang dicari
s :
simpangan baku
r : indeks
reliabilitas.
Misalnya, dalam penghitungan reliabilitas dengan teknik K-R 20 yang
berdasarkan table hasil pengukuran table 4.5. dari table itu diketahui bahwa s=
s = 1,87, dan dalam penghitungan yang dilakukan kemudian diperoleh indeks
reliabilitas r = 0,423. Kedua data yang
diperlikan itu kemudian dimasukkan ke dalam rumus:
SEm =
s
-r
= 1,87
=
1, 42046 ( dibulatkan : 1,42).
Besar kecilnya indeks
simpangan baku pengukuran meenuhi kualitas hasil pengukuran. Semakin kecil
indeks itu semakin baik. Hal itu dikarenakan dengan kecilnya indeks itu
perkiraan besarnya skor sesungguhnya tidak terlalu jauh. Artinya, skor
sesungguhnya seorang peserta didik tidak terlalu menyimpang dari skor yang
diperoleh atau yang tampak. Besarnya indeks simpangan baku kesalahan ditentukan
oleh besarnya indek reliabilitas dan simpangan baku. Semakin besar indeks
reliabilitas akan semakin kecil indeks simpangan baku pengukuran, dan
sebaliknya, semakin kecil indeks realibilitas akan semakin besar indeks
kesalahan baku pengukuran.
BAB
III
PENUTUP
A.
Kesimpulan
Realibilitas menunjuk pada pengertian konsistensi
pengukuran yaitu seberapa konsisten skor tes atau hasil evaluasi dari suatu
pengukuran ke pengukuran lain.
Secara umum, ada 2 cara dalam
mengukur sebuah realibilitas yaitu:
1. Realibilitas Stabilitas
2. Realibilitas Ekivalen
1. Realibilitas Stabilitas
2. Realibilitas Ekivalen
B.
Saran
Semoga makalah ini dapat membantu dan menjadi sebuah
referensi bagi pembaca pada umumnya dan penulis pada khususnya. Kritik dan
Saran sangat kami harapkan untuk membangun dan menjadikan lebih baik lagi di
tugas- tugas selanjutnya.
DAFTAR
PUSTAKA
Burhan
Nurdiyantoro. 2010 “Penilaian Pembelajaran Bahasa” Yogyakarta
Komentar
Posting Komentar