BAB I
PENDAHULUAN
1.1 Latar Belakang
Perkembangan konsep penilaian
pendidikan yang ada pada saat ini menunjukkan arah yang lebih luas. Penilaian
program pendidikan atau penilaian kurikulum menyangkut penilaian terhadap
tujuan pendidikan, isi program, strategi pelaksanaan program dan sarana
pendidikan. Penilaian proses belajar-mengajar menyangkut penilaian terhadap
kegiatan guru, kegiatan siswa, pola interaksi guru-siswa dan keterlaksanaan
program belajar-mengajar. Sedangkan penilaian hasil hasil belajar menyangkut
hasil belajar jangka pendek dan hasil belajar jangka panjang.
Dengan demikian, inti
penilaian adalah proses memberikan atau menentukan nilai kepada objek tertentu
berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut
berlangsung, baik dalam bentuk validitas maupun reliabilitas. Hal ini
mengisyaratkan bahwa objek yang dinilainya adalah hasil belajar siswa.
Keberhasilan mengungkapkan
hasil dan proses belajar siswa sebagaimana adanya (objektivitas hasil
penilaian) sangat tergantung pada kualitas alat penilaiannya di samping pada
cara pelaksanaannya.
Berdasarkan beberapa data di
atas serta dikaitkan dengan permasalahan yang kami akan jelajahi, maka
penulisan ini akan difokuskan pada pembahasan tentang “Validitas dan Reliabilitas Tes Hasil Belajar Siswa” agar dapat
lebih memahami apa itu sebenarnya validitas dan reliabilitas serta lebih memahami
bagaimana mengetahui suatu alat penilaian dikatakan mempunyai kualitas yang
baik.
1.2 Rumusan Masalah
Adapun yang menjadi rumusan
masalah dalam makalah ini, yaitu:
1.
Bagaimanakah ketetapan atau validitas dalam tes hasil belajar?
2.
Bagaimanakah keajegan atau reliabilitas dalam tes hasil belajar?
1.3 Tujuan
Berdasarkan rumusan masalah di
atas, maka penulis dapat menguraikan tujuan dari masalah tersebut, yaitu:
1.
Untuk mengetahui ketetapan atau validitas dalam tes hasil belajar.
2.
Untuk mengetahui keajegan atau reliabilitas dalam tes hasil belajar.
BAB II
PEMBAHASAN
Keberhasilan mengungkapkan
hasil dan proses belajar siswa sebagaimana adanya (objektivitas hasil
penilaian) sangat bergantung pada kualitas alat penilaiannya di samping pada
cara pelaksanaannya.
Suatu alat penilaian dikatakan
mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua
hal, yakni ketepatan atau validitasnya dan ketetapan atau keajegannya atau
reliabilitasnya.
1. Validitas
Validitas berkenaan dengan
ketetapan alat penilaian terhadap konsep yang dinilai sehingga betul-betul
menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai kemampuan
siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan
berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat
menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai
kemampuan berbicara, tetapi ditanyakan mengenai tata bahasa atau kesusastraan
seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas
tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian.
Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan
valid untuk tujuan yang lain.
Contoh prestasi belajar dan
motivasi belajar dapat dinilai oleh tes ataupun oleh kuesioner. Caranya juga
bisa berbeda, bisa dilaksanakan secara tertulis atau bisa secara lisan.
Ketentuan penting dalam
evaluasi adalah bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi. Mengevaluasi
dapat diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto dikatakan
baik apabila sesuai dengan aslinya. Gambar pemotretan hasil evaluasi tersebut
di dalam kegiatan evaluasi dikenal dengan data
evaluasi. Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar dapat dieroleh data
yang valid, instrumen atau alat untuk mengevaluasinya harus valid. Jika
pernyataan tersebut dibalik, instrumen evaluasi dituntut untuk valid karena
diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen
evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan evaluasi
valid.
a.
Macam-Macam Validitas
Di dalam buku Encyclopedia of Educational Evaliation yang
ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan:
A test is valid if it measures what it purpose to measure. Atau jika diartikan lebih kurang demikian: sebuah tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia
“valid” disebut dengan istilah “sahih”.
Sebenarnya pembicaraan
validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil
pengetesan atau skornya.
Contoh:
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan
kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan
orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur
pengetahuan tentang mobil bukanlah tes yang sahih untuk mekanik.
Validitas sebuah tes dapat
diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertama akan
diperoleh validitas logis (logical
validity) dan hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang
dijadikan dasar pengelompokan validitas tes.
Secara garis besar ada dua
macam validitas, yaitu validitas logis dan validitas empiris.
1)
Validitas Logis
Istilah “validitas logis”
mengandung kata “logis” berasal dari kata “logika” atau validitas logis sering
juga disebut sebagai analisis kualitatif yaitu berupa penalaran atau
penelaahan. Dengan makna demikian maka validitas logis untuk sebuah instrumen
yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid
tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang
secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan
tugas lain misalnya membuat sebuah karangan, jika penulisan sudah mengikuti
aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan
penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid. Dari penjelasan tersebut dapat
dipahami bahwa validitas logis dapat dicapai apabila instrumen disusun
mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa
validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah
instrumen tersebut selesai disusun.
Ada dua macam validitas logis
yang dapat dicapai oleh sebuah instrumen, yaitu validitas isi dan validitas
konstrak (construct validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrumen
yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya
validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen
yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi.
Untuk menganalisis soal
ditinjau dari segi teknis, isi, dan editorial. Analisis secara teknis
dimaksudkan sebagai penelaahan soal berdasarkan prinsip-prinsip pengukuran dan
format penulisan soal. Analisis secara isi dimaksudkan sebagai penelaahan
khusus yang berkaitan dengan kelayakan pengetahuan yang ditanyakan. Analisis
secara editorial dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan
keseluruhan format dan keajegan editorial dari soal yang satu ke soal yang
lainnya.
Analisis kualitatif lainnya
dapat juga dikategorikan dari segi materi, konstruksi, dan bahasa. Analisis
materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi keilmuan
yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai dengan soal.
Analisis konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan
dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai penelaahan
soal yang berkaitan dengan penggunaan bahasa Indonesia yang baik dan benar
menurut EYD. Melalui analisis kualitatif dapat diketahui berfungsi tidaknya
sebuah soal.
2)
Validitas Empiris
Istilah “validitas empiris”
memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrumen dapat
dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Analisis soal secara kuantitatif menekankan pada analisis karakteristik
internal tes melalui data yang diperoleh secara empiris. Karakteristik internal
secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya
pembeda dan reliabilitas. Khusus soal-soal pilihan ganda, dua tambahan
parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal benar dan
berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternative jawaban
dari subyek-subyek yang dites. Salah satu tujuan dilakukannya analisis adalah
untuk meningkatkan kualitas soal, yaitu apakah suatu soal dapat diterima karena
telah didukung oleh data statistik yang memadai, diperbaiki karena terbukti
terdapat beberapa kelemahan atau bahkan tidak digunakan sama sekali karena
terbukti secara empiris tidak berfungsi sama sekali.
Sebagai contoh sehari-hari,
sesorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan
kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah banyak
menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari
penjelasan dan contoh-contoh tersebut diketahui bahwa validitas empiris tidak
dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti
halnya validitas logis, tetapi harus dibuktikan melalui pengalaman.
Ada dua macam validitas
empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah
instrumen memang valid. Pengujian tersebut dilakukan dengan membandingkan
kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran.
Kriterium yang digunakan sebagai pembanding kondisi instrumen dimaksud ada dua
cara, yaitu yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu
yang akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang
sudah ada tersedia, yang sudah ada disebut memiliki validitas “ada sekarang”,
yang ada dalam istilah bahasa inggris disebut memiliki concurrent validity. Selanjutnya instrumen yang kondisinya sesuai
dengan kriterium yang diramalkan akan terjadi, disebut memiliki validitas
ramalan atau validitas prediksi, yang dalam istilah bahasa inggris disebut
memiliki predictive validity.
Ada empat jenis validitas yang
sering digunakan, yakni:
a)
Validitas isi (content validity)
Sebuah tes dikatakan memilki
validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isis pelajaran yang diberikan. Oleh karena materi yang diajarkan
tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas
kurikuler.
Validitas isi berkenaan dengan
kesanggupan alat penilaian data mengukur isi yang seharusnya. Artinya, tes
tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur.
Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi bidang
studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang bersumber
dari kurikulum bidang studi yang hendak diukur. Disamping kurikulum dapat juga
diperkaya dengan melihat atau mengkaji buku sumber.
Tes hasil belajar tidak
mungkin dapat mengungkapkan semua materi yang ada dalam bidang studi tertentu
sekalipun hanya untuk satu semester. Oleh sebab itu, harus diambil sebagian
dari materi dalam bentuk sampel tes. Sampel harus dapat mencerminkan materi
yang terkandung dalam sseluruh materi bidang studi. Cara yang ditempuh dalam
menetapkan sampel tes adalah memilih konsep-konsep materi yang esensial.
Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan yang ada. Dari
setiap konsep dikembangkan beberapa pertanyaan tes. Disinilah pentingnya
peranan kisi-kisi sebagai alat untuk memenuhi validitas isi. Dalam hal tertentu
untuk tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya)
agar memenuhi validitas isi, dapat pula dimintakan bantuan ahli bidang studi
untuk menelaah apakah konsep materi yang diajukan telah memadai atau tidak
sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan
analisis statistic atau dinyatakan dalam bentuk angka-angka.
b)
Validitas konstruksi (construct validity)
Sebuah tes dikatakan memiliki
validitas konstruksi apabila butir-butir soal yang membangun tes tersebut
mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek
berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan
instruksional.
Sebagai contoh jika
rumusan Tujuan Instruksional Khusus
(TIK). “Siswa dapat membandingkan antara efek biologis dan efek psikologis”,
maka butir soal pada tes merupakan perintah agar siswa membedakan anatar dua
efek tersebut.
“Konstruksi” dalam pengertian
ini bukanlah “susunan” seperti yang sering dijumpai dalam teknik, tetapi
merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli ilmu
jiwa yang dengan suatu cara tertentu “memerinci” isi jiwa atas beberapa aspek
seperti ingatan (pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal
ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi sebenarnya
tidak demikian. Pembagian ini hanya merupakan tindakan sementara untuk
mempermudah mempelajari.
Seperti halnya validitas isi,
validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan
setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan
berdasarkan logika bukan pengalaman.
c)
Validitas “ada sekarang” (concurrent
validity)
Validitas ini lebih umum
dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas
empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu
ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil
sebuah tes maka diperlukan suatu kriterium atau alat banding. Maka hasil tes
merupakan sesuatu yang dibandingkan. Untuk jelasnya di bawah ini dikemukakan
sebuah contoh.
Misalnya seorang guru ingin
mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini
diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misalnya
nilai ulangan harian atau nilai ulangan sumatif yang lalu.
d)
Validitas prediksi (predictive validity)
Memprediksi artinya meramal,
dengan meramal selalu mengenai hal yang akan datang jadi sekarang belum
terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas
ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada
masa yang akan datang.
Misalnya tes masuk Perguruan
Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan
peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon yang
tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes
karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu
menikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas
prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti
pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes
lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan yang dahulu nilai
tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki validitas
prediksi.
b.
Cara Mengetahui Validitas Alat Ukur
Sekali lagi diulangi bahwa
sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium,
dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium.
Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh
Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
1)
Korelasi product moment dengan
simpangan
åxy
rxy =
Ö(åx2) (åy2)
Ket:
rxy = Koefisien korelasi
antara variabel X dan variabel Y, dua variable
yang dikorelasikan (x = X – X dan
y = Y – Y)
åxy = Jumlah perkalian x dan y
x2 = Kuadrat dari x
y2 = Kuadrat dari y
Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai
kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X
dan rata-rata nilai harian diberi kode Y. Kemudian dibuat table persiapan
sebagai berikut:
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI MATEMATIKA
|
No
|
Nama
|
X
|
Y
|
x
|
y
|
x2
|
y2
|
xy
|
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
|
Nadia
Susi
Cecep
Erna
Dian
Asmara
Siswoyo
Jihad
Yanna
Lina
|
6,5
7
7,5
7
6
6
5,5
6,5
7
6
|
6,3
6,8
7,2
6,8
7
6,2
5,1
6
6,5
5,9
|
0
+ 0,5
+ 1,0
+ 0,5
- 0,5
- 0,5
- 1,0
0
+ 0,5
- 0,5
|
- 0,1
+ 0,4
+ 0,8
+ 0,4
+ 0,6
- 0,2
- 1,3
- 0,4
+ 0,1
- 0,6
|
0,0
0,25
1,0
0,25
0,25
0,25
1,0
0,0
0,25
0,25
|
0,01
0,16
0,64
0,16
0,36
0,04
1,69
0,16
0,01
0,36
|
0,0
+ 0,2
+ 0,8
+ 0,2
- 0,3
+ 0,1
+ 1,3
0,0
+ 0,05
+ 0,3
|
|
Jumlah
|
65,0
|
63,8
|
3,5
|
3,59
|
2,65
|
|||
åX 65,0
X = = =
6,5
N 10
åY 63,8
Y = = =
6,38 dibulatkan 6,4
N 10
x = X
– X
y = Y
– Y
Dimasukkan ke rumus:
åxy
rxy =
Ö(åx2) (åy2)
2,65 2,65
=
=
Ö 3,5 x 3,59 Ö12,565
2,65
= = 0,748
3,545
Indeks korelasi antara X
dan Y inilah indeks validitas soal yang dicari.
2)
Korelasi product moment dengan angka
kasar
NåXY – (åX) (åY)
rxy =
Ö{(NåX2 - (åY2)} {NåY2 – (åY)2}
Ket:
rxy = Koefisien korelasi
antara variabel X dan variabel Y, dua variabel
yang dikorelasikan
Dengan menggunakan data hasil tes prestasi matematika di atas kini dihitung
dengan rumus korelasi product moment dengan
angka kasar yang table persiapannya sebagai berikut:
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI MATEMATIKA
|
No
|
Nama
|
X
|
Y
|
X2
|
Y2
|
XY
|
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
|
Nadia
Susi
Cecep
Erna
Dian
Asmara
Siswoyo
Jihad
Yanna
Lina
|
6,5
7
7,5
7
6
6
5,5
6,5
7
6
|
6,3
6,8
7,2
6,8
7
6,2
5,1
6
6,5
5,9
|
42,25
49
56,25
49
36
36
30,25
42,25
49
36
|
39,69
46,24
51,84
46,24
49
38,44
26,01
45,5
36
34,81
|
40,95
47,6
54.0
47,6
42
37,2
28,05
39
45,5
35,4
|
|
Jumlah
|
65,0
|
63,8
|
426,0
|
410,52
|
417,3
|
|
Dimasukkan ke rumus:
NåXY – (åX) (åY)
rxy =
Ö{(NåX2 - (åY2)} {NåY2 – (åY)2}
10 x 417,3 – (65 x 63,8)
rxy =
Ö(10 x 426 – 4225) (10 x 410,52 – 4070,44)
4173 - 4147
rxy =
Ö(4260 - 4225) (4105,2 – 4070,44)
26 26
rxy = =
Ö35 x 34,76 Ö1216,6
26
= =
0,745
34,8797
Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus
simpangan, ternyata terdapat perbedaan sebesar 0,003, lebih besar yang dihitung
dengan rumus simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau
penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan
ke atas. Perbedaan ini sangat kecil sehingga dapat diabaikan.
Untuk memperjelas pengertian
tersebut dapat disampaikan keterangan sebagai berikut:
·
Korelasi positif menunjukkan adanya hubungan
sejajar anatar dua hal. Misalnya hal pertama nilainya naik, hal kedua ikut
naik, sebaliknya jika hal pertama turun, yang kedua ikut turun.
Contoh korelasi positif antara
nilai IPA dan Matematika.
IPA : 2, 3, 5, 7, 4, 3, 2
Matematika : 4, 5, 6, 8, 5, 4, 3
Kondisi nilai Matematika sejajar dengan IPA karena naik dan turunnya nilai
matematika mengikutu naik dan turunnya nilai IPA.
·
Korelasi negative menunjukkan adanya hubungan
kebalikan antara dua hal. Misalnya hal pertama nilainya naik, justru yang kedua
turun, sebaliknya jika yang pertama turun, yang kedua naik.
Contoh korelasi negative antara nilai Bahasa Indonesia dan Matematika.
Bahasa Indonesia : 5, 6, 8, 4, 3, 2
Matematika : 8, 7, 5, 1, 2, 3
Keadaan antara dua hal yang
sering dijumpai dalam kehidupan sehari-hari tidak selalu hanya positif atau
negative saja, tetapi mungkin 0. Besarnya korelasi pun tidak menentu.
Contoh
korelasi tidak tertentu.
Nilai A : 5, 6, 4, 7, 3, 8, 7
Nilai B : 4, 4, 3, 7, 4, 9, 4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi mungkin
positif mungkin negative.
Koefisien korelasi selalu
terdapat - antara 1,00 sampai + 1,00. Namun kerena dalam menghitung sering
dilakukan pembulatan angka-angka, sangat mungkin diperoleh koefisien lebih dari
1,00. Koefisien negative menunjukkan hubungan kebalikan sedangkan koefisien
positif menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai
besarnya koefisien korelasi adalah sebagai berikut:
o Antara 0,800 sampai dengan 1,00 :
sangat tinggi
o Antara 0,600 sampai dengan 0,800 :
tinggi
o Antara 0,400 sampai dengan 0,600 :
cukup
o Antara 0,200 sampai dengan 0,400 :
rendah
o Antara 0,00 sampai dengan 0,200 :
sangat rendah
Penafsiran harga koefisen
korelasi ada dua cara yaitu:
1)
Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup
dan sebagainya.
2)
Dengan berkonsultasi ke table harga kritik r product moment sehingga dapat diketahui signifikan tidaknya
korelasi tersebut. Jika harga r lebih kecil dari harga kritik dalam table, maka
korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.
c.
Validitas Butir Soal atau Validitas Item
Apa yang sudah dibicarakan di
atas adalah validitas soal secara keseluruhan tes. Di samping mencari validitas
soal perlu juga dicari validitas item. Jika seorang peneliti atau seorang guru
mengetahui bahwa validitas soal tes misalnya terlalu rendah atau rendah saja,
maka selanjutnya ingin mengetahui buti-butir tes manakah yang menyebabkan soal
secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk
keperluan inilah dicari validitas butir soal.
Pengertian umum untuk
validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai
dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total
menjadi tinggi atau rendah. Dengan kata lain dapat dikemukakan di sini bahwa
sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai
kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi
sehingga untuk mengetahui validitas item digunakan rumus korelasi seperti sudah
diterangkan di atas.
Untuk soal-soal bentuk
objektif skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab
benar) dan 0 (item yang dijawab salah), sedangkan skor total selanjutnya
merupakan dari skor untuk semua item yang membangun soal tersebut.
Contoh perhitungan:
TABEL ANALISIS ITEM UNTUK PERHITUNGAN
VALIDITAS ITEM
|
No
|
Nama
|
Butir soal
/ item
|
Skor total
|
|||||||||
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
|
1.
2.
3.
4.
5.
6.
7.
8.
|
Hartati
Yoyok
Oktaf
Wendi
Diana
Paul
Susana
Helen
|
1
0
0
1
1
1
1
0
|
0
0
1
1
1
0
1
1
|
1
1
0
0
1
1
1
0
|
0
0
0
0
1
0
1
1
|
1
1
0
1
1
1
1
1
|
1
0
1
1
1
0
1
1
|
1
0
0
0
0
1
1
1
|
1
1
1
0
0
0
0
1
|
1
1
0
1
0
0
0
1
|
1
1
1
0
0
0
0
1
|
8
5
4
5
6
4
7
8
|
Misalnya akan dihitung validitas item nomor 6, maka skor item tersebut
disebut variabel X dan skor total disebut variabel Y. Selanjutnya perhitungan
dilakukan dengan menggunakan rumus korelasi product
moment, baik dengan rumus simpangan maupun rumus angka kasar.
Penggunaan kedua rumus
tersebut masing-masing ada keuntungannya. Menggunakan rumus simpangan angkanya
kecil-kecil, tetapi kadang-kadang pecahannya rumit. Jika skor rata-rata
(mean)-nya pecahan, simpangannya cenderung banyak pecahan. Mengalikan pecahan
persepuluhan ditambah dengan tanda-tanda + (plus) dan – (minus) kadang-kadang
bisa menyesatkan. Penggunaan rumus angka kasar bilangannya besar-besar tetapi
bulat. Jika ada kalkulator statistic disarankan menggunakan rumus angka kasar
saja. Yang dibutuhkan hanyalah: åX, åY, åX2, åY2 dan åXY, tidak perlu membuat tabel seutuhnya.
Contoh perhitungan mencari
validitas item:
Untuk menghitung validitas
item nomor 6, dibuat terlebih dahulu tabel persiapannya sebagai berikut:
TABEL PERSIAPAN
UNTUK MENGHITUNG
VALIDITAS ITEM NOMOR 6
|
No
|
Nama
|
X
|
Y
|
|
1.
2.
3.
4.
5.
6.
7.
8.
|
Hartati
Yoyok
Oktaf
Wendi
Diana
Paul
Susana
Helen
|
1
0
1
1
1
0
1
1
|
8
5
3
5
6
4
7
8
|
Ket:
X = Skor item nomor 6 Y =
Skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
åX = 6 åx2 = 6
åY = 46 åy2 = 288
åXY = 37
Xt = 5,57
XP = 6,17
6 2
p = =
0,75 q = =
0,25
8 8
Sesudah diketahui åX, åX2, åY, åY2 dan åXY tinggal memasukkan bilangan-bilangan tersebut ke dalam rumus korelasi product moment dengan rumus angka kasar.
Data di atas dimasukkan ke dalam rumus korelasi product moment dengan angka kasar
sebagai berikut:
NåXY – (åX) (åY)
rxy =
Ö{(NåX2 - (åY2)} {NåY2 – (åY)2}
8 x 37 – 6 x 46
rxy =
Ö(8 x 6 – 62) (8 x 288 – 462)
296 - 276
=
Ö(48 - 36) (2304 - 2116)
20 20
= =
Ö12 x 188 Ö2256
20
= =
0,421
47,497
Koefisien validitas item nomor
6 adalah 0,421. Dilihat secara sepintas bilangan ini memang sesuai dengan
kenyataannya. Hal ini dapat diketahui dari skor-skor yang tertera baik pada
item maupun skor total. Oktaf yang hanya memiliki skor total 3 dapat memperoleh
skor 1 pada item, sedangkan Yoyok dan Wendi yang mempunyai skor total sama
yaitu 5 skor pada item tidak sama. Validitas item tersebut kurang meyakinkan.
Tentu saja validitasnya tidak tinggi.
Masih ada cara-cara lain untuk
menghitung validitas item. Salah satu cara yang terkenal adalah menggunakan
rumus gpbi yang rumus lengkapnya adalah
sebagai berikut:
Mp – Mt
gpbi = Ö p/q
St
Ket:
gpbi = Koefisien korelasi biserial
Mp =
Rerata skor dari subjek yang menjawab betul bagi item yang
dicari validitasnya
Mt = Rerata skor total
St = Standar deviasi dari skor total
p = Proporsi siswa yang menjawab benar
Banyaknya siswa yang benar
( p = )
Jumlah seluruh siswa
q = Proporsi siswa yang menjawab salah
( q = 1 – p )
Apabila item 6 tersebut dicari
validitasnya dengan rumus ini maka perhitungannya melalui langkah sebagai
berikut:
1.
Mencari
8 + 3 + 5 + 6 + 7 + 8 37
Mp = = =
6,17
6 6
2.
Mencari
8 + 5 + 3 + 5 + 6 + 4 + 7 + 8
46
Mt = = =
5,75
8 8
3.
Dari kalkulator diperoleh harga standar deviasi, yaitu sn = 1,7139 atau sn-1 = 1,8323. Untuk n kecil, diambil standar deviasi yang sn = 1, 7139
6
4.
Menentukan harga p, yaitu = 0,17
8
2
5.
Menentukan harga q, yaitu = 0,25
8
atau 1 – 0,75 = 0,25
6.
Memasukkan ke rumus:
Mp – Mt
gpbi
= Ö p/q
St
6,17
– 5,75
= Ö 0.75/0,25
1,7139
0,42
= 1,7321
1,7139
= 0,4244
Dari perhitungan validitas
item 6 dengan dua cara ternyata hasilnya berbeda tetapi sangat kecil yaitu
0,0034. Mungkin hal ini disebabkan karena adanya pembulatan angka.
d.
Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang
telah dicobakan berkali-kali sehingga dapat dijamin kebaikannya. Di
Negara-negara berkembang biasa tersedia tes semacam ini, dan dikenal dengan
nama standardized test. Sebuah tes
terstandar biasanya memiliki identitas antara lain: sudah dicobakan berapa kali
dan di mana, berapa koefisien validitas, reliabilitas, taraf kesukaran, daya
pembeda dan lain-lain keterangan yang dianggap perlu.
Cara menentukan validitas soal
yang menggunakan tes terstandar sebagai kriterium dilakukan dengan mengalikan
koefisien validitas yang diperoleh dengan koefisien validitas tes terstandar
tersebut.
Contoh perhitungan:
TABEL PERSIAPAN PERHITUNGAN VALIDITAS
TES METEMATIKA DENGAN KRITERIUM
TES TERSTANDAR MATEMATIKA
|
No
|
Nama
|
X
|
Y
|
X2
|
Y2
|
XY
|
Keterangan
|
|
1.
2.
3.
4.
5.
6.
|
Nining
Maruti
Bambang
Seno
Hartini
Heru
|
5
6
5
6
7
6
|
7
6
6
7
7
5
|
25
36
25
36
49
36
|
49
36
36
49
49
25
|
35
36
30
42
49
30
|
X = Hasil
tes
Matematika
yang
dicari
validitasnya
Y = Hasil
tes
terstandar
|
|
Jumlah
|
35
|
38
|
207
|
244
|
222
|
||
Dimasukkan ke dalam rumus
korelasi product moment dengan angka
kasar sebagai berikut:
NåXY – (åX) (åY)
rxy =
Ö{(NåX2 - (åY2)} {NåY2 – (åY)2}
6 x 222 – 35 x 38
rxy =
Ö(6 x 207 – 352) (6 x 244 – 382)
1332 - 1330
rxy =
Ö(1240 - 1225) (1464 – 1444)
2 2
rxy = =
Ö17 x 20 Ö340
2
= =
0,108
18,439
Jika seandainya dari tes
terstandar diketahui bahwa validitasnya 0,89 maka bilangan 0,108 ini belum
merupakan validitas soal Matematika yang dicari. Validitas tersebut harus
dikalikan dengan 0,89 yang hasilnya 0,108 x 0,89 = 0,096.
e.
Validitas Faktor
Selain validitas soal secara
keseluruhan dan validitas butir atau item, masih ada lagi yang perlu diketahui
validitasnya, yaitu faktor-faktor atau bagian keseluruhan materi. Setiap
keseluruhan materi pelajaran terdiri dari pokok-pokok bahasan atau mungkin
sekelompok pokok bahasan yang merupakan satu kesatuan.
Contoh:
Guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahasan, yaitu:
Bunyi, Cahaya dan Listrik. Untuk keperluan ini guru tersebut membuat 30 butir
soal, untuk Bunyi 8 butir, untuk Cahaya 12 butir dan untuk Listrik 10 butir.
Apabila guru ingin mengetahui
validitas faktor, maka ada tiga faktor dalam soal ini. Seperti halnya
pengertian validitas butir, pengertian validitas faktor adalah butir-butir soal
dalam faktor dikatakan valid apabila mempunyai dukungan yang besar terhadap
soa-soal secara keseluruhan. Sebagai tanda bahwa butir-butir faktor tersebut mempunyai dukungan
yang besar terhadap seluruh soal, yakni apabila jumlah skor untuk butir-butir
faktor tersebut menunjukkan adanya kesejajaran dengan skor total.
Sudah dijelaskan bahwa
butir-butir soal faktor dikatakan valid apabila menunjukkan kesejajaran skor
dengan skor total. Cara mengetahui kesejajaran tersebut digunakan juga rumus
korelasi product moment. Misalnya
kita akan mengetahui validitas faktor 1, yakni soal-soal untuk materi bunyi,
kita membuat daftar untuk menyejajarkan kedua skor tersebut sebagai berikut:
TABEL UNTUK MENGHITUNG KESEJAJARAN
SKOR FAKTOR 1 DENGAN SKOR TOTAL
|
Nama
Subjek
|
Skor
faktor 1
( X )
|
Skor total
( Y )
|
X2
|
Y2
|
XY
|
|
Amir
Hasan
Ninda
Warih
Irzal
Gandi
Santo
Tini
Yanti
Hamid
Dedi
Desi
Wahyu
|
6
7
4
3
8
6
5
7
5
4
7
8
5
|
19
25
17
12
29
23
19
26
16
15
26
30
20
|
36
49
16
9
64
36
25
49
25
16
49
64
25
|
361
625
289
144
841
529
361
676
256
225
676
900
400
|
114
175
68
36
232
138
95
182
80
60
182
240
100
|
|
Jumlah
|
……
|
……
|
……
|
……
|
……
|
Data yang tertera didalam
table tersebut digunakan untuk menentukan besarnya validitas faktor 1. Langkah
selanjutnya adalah menjumlahkan setiap kolom, kemudian dimasukkan kedalam rumus
korelasi product moment. Harga r yang diperoleh
menunjukkan indeks validitas faktor 1. Untuk faktor 2 dan faktor 3 caranya
sama, hanya skor faktornya saja yang diganti.
2.
Reliabilitas
a.
Arti Reliabilitas Bagi Sebuah Tes
Sudah diterangkan dalam
persyaratan tes, bahwa reliabilitas berhubungan dengan masalah kepercayaan.
Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes
tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes,
berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya
berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang reliabilitas
ini tidak akan sulit dimengerti apabila pembaca telah memahami konsep
validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan
diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas
ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan
objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya
bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan
berkali-kali. Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan
data yang sesuai dengan kenyataan.
Yang sering ditangkap kurang
tepat bagi pembaca adalah adanya pendaat bahwa “ajeg” atau “tetap” diartikan
sebagai “sama”. Dalam pembicaraan evaluasi ini tidak demikian. Ajeg atau tetap
tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan
si A mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan
pengukuran ulang, si A juga berada lebih rendah dari B. Itulah yang dikatakan
ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok
yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah
menunjukkan tingginya reliabilitas instrumen.
Sehubungan dengan reliabilitas
ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes,
yaitu validitas dan reliabilitas ini penting. Dalam hal ini validitas lebih
penting, dan reliabilitas ini perlu, karena menyokong terbentuknya validitas.
Sebuah tes mungkin reliable tetapi tidak valid. Sebalinya, sebuah tes yang
valid biasanya reliable.
A reliable
measure in one that provides consistent and stable indication of the
characteristic being investigated.
Untuk dapat memperoleh
gambaran yang ajeg memang sulit karena unsur kejiwaan manusia itu sendiri tidak
ajeg. Misalnya kemampuan, kecakapan, sikap dan sebagainya berubah-ubah dari
waktu ke waktu.
Beberapa hal yang sedikit
banyak mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat
dikelompokkan menjadi 3 hal:
1)
Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas
butir-butir soalnya
Tes yang terdiri dari banyak
butir, tentu saja lebih valid dibandingkan dengan tes yang hanya terdiri dari
beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya
reliabilitas tes. Dengan demikian maka semakin panjang tes, maka
reliabilitasnya semakin tinggi. Dalam menghitung besarnya reliabilitas
berhubung dengan penambahan banyaknya butir soal dalam tes ini ada sebuah rumus
yang diberikan oleh Spearman dan Brown sehingga terkenal dengan rumus Spearman
– Brown.
Rumusnya adalah:
nr
rnn
=
1 + (n - 1) r
Ket:
rnn = Besarnya koefisien reliabilitas
sesudah tes tersebut ditambah
butir soal baru
n = Berapa kali butir-butir soal itu ditambah
r = Besarnya koefisien reliabilitas sebelum butir-butir
soalnya
ditambah
Contoh:
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas
0,70. Kemudian butir-butir soal itu ditambah menjadi 60 butir soal. Maka
koefisien reliabilitas baru adalah:
nr 1,5 x 0,70 1,05
rnn
= =
=
=
0,79
1 + (n - 1) r 1 + (1,5 – 1) x 0,70 1,35
Dengan demikian maka penambahan sebanyak 20 butir soal dari 40 butir,
memperbesar koefisien reliabilitas sebesar 0,09. Akan tetapi penambahan
butir-butir soal tes adakalanya tidak berarti bahkan adakalanya merugikan. Hal
ini disebabkan karena:
a)
Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak
menambah tinggi reliabilitas tes.
Remmers dan Gage menggambarkan hubungan antara penambahan butir soal
reliabilitas sebagai berikut:
Koefisien Reliabilitas
1,00
0,95
0,90
0,85
0,80
50 100 150 200 250 300
Penambahan
butir soal
b)
Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan waktu,
biaya dan tenaga yang dikeluarkan untuk itu. Misalnya seorang guru sudah cukup
membuat 100 soal bentuk objektif dan 10 soal bentuk esai sudah cukup mempunyai
validitas isi dan tingkah laku. Guru tersebut ingin menambah butir-butir soal
sehingga menjadi 200 dan 20 dengan menambahkan soal-soal yang parallel. Tentu
saja hal ini hanya akan menambah waktu, biaya dan tenaga saja tanpa ada
keuntungan apa-apa. Kualitas butir-butir soal ditentukan oleh:
ü Jelas tidaknya rumusan soal.
ü Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan
salah jawab.
ü Petunjuknya jelas sehingga mudah dan cepat dikerjakan.
2)
Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan
kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman
hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang dicobakan
kepada bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar
daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih.
3)
Hal yang berhubungan dengan penyelenggaraan tes
Sudah disebutkan bahwa faktor
penyelenggaraan tes yang bersifat administrative sangat menentukan hasil tes.
Contoh:
a)
Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada
para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak
terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil
tes.
b)
Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap
tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan
rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.
c)
Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya
ramai dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang
mempengaruhi hasil tes ini semua, secara
tidak langsung akan mempengaruhi reliabilitas soal tes.
b.
Cara-Cara Mencari Besarnya Reliabilitas
Sekali lagi reliabilitas
adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk
mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti
halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam
reliabilitas tes.
Kriterium yang digunakan untuk
mengetahui ketetapan ada yang berada di luar tes (consistency eternal) dan pada tes itu sendiri (consistency internal).
1)
Metode bentuk paralel (equivalent)
Tes paralel atau tes
equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa
Inggris disebut alternative-form method
(parallel forms).
Dengan metode bentuk parallel
ini, dua buah tes yang paralel misalnya tes Matematika seri A yang akan dicari
reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama,
kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah
yang menunjukkan koefisien reliabilitasnya tes seri A. jika koefisiennya tinggi
maka tes tersebut sudah reliable dan dapat digunakan sebagai alat pengetes yang
terandalkan.
Dalam menggunakan metode tes
paralel ini pengetes harus menyiapkan dua buah tes dan masing-masing dicobakan
pada kelompok siswa yang sma. Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial method.
Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes
sehingga tidak ada faktor “masih ingat soalnya” yang dlam evaluasi disebut
adanya practice-effect dan carry-over effect, artinya ada faktor
yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini
adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes.
Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
2)
Metode tes ulang (test-retest method)
Metode tes ulang dilakukan
orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau
metode ini pengetes hanya memiliki satu seri tetapi dicobakan dua kali. Oleh
karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double-trial method.
Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.
Untuk tes yang banyak
mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena karena
tercoba akan masih ingat akan butir-butir soalnya. Ooleh karena itu, tenggang
waktu antara pemberian tes pertama dengan kedua menjadi permasalahan
tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak ingat
materi. Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau
kondisi tes sudah akan berbeda dan siswa sendiri barangkali sudah mempelajari
sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap
reliabilitas.
Pada umumnya hasil tes yang
kedua cenderung lebih baik daripada hasil tes pertama. Hal ini tidak mengapa
karena pengetes harus sadar akan adanya practice
effect dan carry over effect.
Yang penting adalah adanya kesejahteraan hasil atau ketetapan hasil yang
diyunjukkan oleh koefisien korelasi yang tinggi.
Contoh:
|
Siswa
|
Tes
Pertama
|
Tes Kedua
|
||
|
Skor
|
Ranking
|
Skor
|
Ranking
|
|
|
A
B
C
D
E
|
15
20
9
18
12
|
3
1
5
2
4
|
20
25
15
23
18
|
3
1
5
2
4
|
Walaupun tampak skornya naik,
akan tetapi kenaikannya dialami oleh semua siswa.
Metode ini juga disebut
self-correlation method (korelasi diri sendiri) karena mengkorelasikan hasil
dari tes yang sama.
3)
Metode belah dua atau split-half
method
Kelemahan penggunaan metode
dua-tes dua kali percobaan dan satu-tes dua kali percobaan diatasi dengan
metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes
hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut
juga single-test-single-trial method.
Berbeda dengan metode pertama
dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan
itulah koefisiensi reliabilita, maka dengan ketiga metode ini tidak dapat
demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui
reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus
digunakan rumus Spearman-Brown sebagai berikut:
Contoh:
2 r1/2 1/2
r11
=
(1 + r1/2 1/2)
Ket:
r1/2 1/2 = Korelasi antara skor-skor setiap belahan
tes.
r11 = Koefisien reliabilitas yang sudah
disesuaikan.
Contoh:
Korelasi antar belahan tes
= 0,60
2 x 0,60
Maka reliabilitas tes =
1 + 0,60
Banyak pemakai metode ini
salah membela hasil tes pada waktu, menganalisis. Yang mereka lakukan adalah
mengelompokkan hasil separo subjek peserta tes dan separo yang lain kemudian
hasil kedua kelompok ini dikorelasikan. Yang benar adalah membelah item atau
butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa
banyaknya butir soal harus genap agar dapat dibelah.
Ada dua cara membelah butir
soal ini, yaitu:
BAB III
PENUTUP
3.1 Kesimpulan
Berdasarkan isi dari
pembahasan di atas maka dapat disimpulkan bahwa:
1.
Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat
tersebut memiliki atau memenuhi dua hal, yakni ketepatan atau validitasnya dan
ketetapan atau keajegannya atau reliabilitasnya.
2.
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang
dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai.
Penilaian tersebut tidak tepat (valid). Alat penilaian yang telah valid untuk
suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.
3.
Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan
mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan
hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah
ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang
terjadi dapat dikatakan tidak berarti.
4.
Validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka
konsep reliabilitas terkait dengan pemotretan berkali-kali.
3.2 Saran
Demikianlah makalah ini kami
buat, semoga apa yang telah disajikan akan memberikan ilmu dan informasi.
Selanjutnya demi kesempurnaan makalah ini kami memohon saran dan kritik guna
memperbaiki dikemudian hari.
Tidak ada komentar:
Posting Komentar