ANALISIS KUALITAS TES DAN BUTIR SOAL
Alita arifiana anisa ( 2 mei 2012)
BAB
I
PENDAHULUAN
A. Latar Belakang
Tes
merupakan salah satu cara untuk mengevaluasi proses pembelajaran yang dianggap
mampu memfasilitasi kebutuhan orang-orang di bidang pendidikan tentang
perangkat atau alat yang mampu memberi gambaran tentang proses pembelajaran
yang dilaksanakan. Untuk menghasilkan gambaran yang akurat, relevan dan sesuai
dengan data yang sesungguhnya terjadi dilapangan membutuhkan tes yang
berkualitas, oleh karena itu dibutuhkan analisis kualitas tes guna menciptakan
kualitas tes yang benar-benar mampu melaksanakan tugasnya sebagai alat
evaluasi. Analisis kualitas tes merupakan
suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu
tes, baik tes secara keseluruhan maupun butir
soal yang menjadi bagian dari tes tersebut. Analisis kualitas tes
digunakan untuk menjawab pertanyaan apakah tes sebagai alat ukur benar-benar
mampu mengukur apa yang sebenarnya hendak diukur dan apakah tes tersebut dapat
diandalkan dan berguna bagi dunia pendidikan.
B. Rumusan Masalah
Adapun
rumusan masalah yang diangkat dalam penulisan ini adalah:
a. Bagaimana
cara untuk melalukan analisis kualitas tes dan butir soal?
b. Bagaimana
aplikasi analisis kualitas tes dan butir soal pada dunia pendidikan?
C. Tujuan
Penulisan ini
bertujuan untuk mengetahui bagaimana cara melakukan analisis kualitas tes dan
butir soal serta implementasinya dalam proses pembelajaran.
BAB
II
PEMBAHASAN
A. Pengertian Analisis Tes dan Butir
Soal
Analisis
tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui
derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut.
B. Tujuan Analisis Tes dan Butir Soal
Analisis tes dan butir
soal bertujuan untuk:
a. Mengetahui
apakah tes atau soal yang digunakan untuk mengevaluasi sudah mampu mengukur apa
yang sebenarnya ingin diukur melalui tes atau soal tersebut.
b. Mengetahui
sejauh mana data atau informasi yang dihasilkan oleh tes maupun butir soal
dapat diandalkan.
c. Mengetahui
sejauh mana data yang dihasilkan oleh tes atau soal dapat bergunabagi proses
pembelajaran.
C. Validitas
Suatu
instrument dapat dikatakan valid apabila benar-benar mampu mengukur apa yang
hendak diukur dengan tepat. Dalam validitas terdapat dua unsur penting, yaitu
validitas menunjukan derajat atau hirarki dan validitas selalu dihubungkan
dengan suatu tujuan yang spesifik karena tidak ada validitas yang berlaku
secara umum. Ada 3 faktor yang dapat mempengaruhi validitas hasil tes yaitu:
a. Faktor
Instrument Evaluasi
Instrument
evaluasi yang kurang baik akan menghasilkan hasil evaluasi yang kurang baik
pula.
b. Faktor
Administrasi Evaluasi dan Penskoran
Banyak hal yang mempengaruhi hasil
evaluasi yang berkaitan dengan administrasi dan penskoran, antara lain, alokasi
waktu pengerjaan tes atau soal, kedisplinan guru pengawas, kedisplinan peserta
tes, kesalahan penskoran, serta kondisi fisik dan psikis peserta tes.
c. Faktor
Jawaban dari Pesera Didik
Factor ini meliputi kecenderungan
peserta didik untuk mengjawab dengan cepat namun kurang tepat, keinginan untuk
coba-coba dan menggunakan gaya bahasa tertentu.
Berikut
ini merupakan jenis-jenis validitas, yaitu :
a. Validitas
permukaan
Jika suatu tes secara sepintas
telah dianggap baik maka tes tersebut dapat dikatakan telah memenuhi syarat
validitas permukaan dan tidak membutuhkan judgement yang mendalam.
b. Validitas
isi
Validitas isi sering digunakan
dalam penilaian hasil belajar atau untuk mengetahui sejauh mana peserta didik
menguasai materi pelajaran yang telah disampaikan dan perubahan psikologis yang
terjadi setelah mengalami proses pembelajaran. Validitas isi disebut pula
validitas kurikuler berkenan dengan relevansi materi tes dengan kurikulum yang
ditentukan atau validitas perumusan berkenaan dengan apakah apek dalam soal
tercakup dalam apa yang hendak diukur.
c. Validitas
empiris
Validitas empiris dilakukan dengan pendekatan
korelasi untuk mencari hubungan skor tes dengan criteria tertentu. Validitas
empiris dibagi menjadi 3, yaitu:
1.) Validitas
prediktif (Predictive validity) yang digunakan untuk meramalkan prestasi
belajar peserta didik pada masa depan.
2.) Validitas
kongkuren (concurrent validity) digunakan untuk criteria standar yang
berlainan.
3.) Validitas
sejenis (congruent validity) untuk criteria yang sejenis.
8 kriteria bahan bandingan berdasarkan pendapat
Anastasi dalam Conny Semiawan Stamboel, yaitu:
1.) Diferensiasi
umur
2.) Kemajuan
akademis
3.) Kriteria
dalam Pelaksanaan Latihan Khusus
4.) Kriteria
dalam Pelaksanaan Kerja
5.) Penilaian
6.) Kelompok
yang Bertentangan
7.) Korelasi
dengan tes lain
8.) Konsistensi
Internal
Contoh
perhitungan korelasi:
1.) Korelasi
Product Moment dengan Angka Simpangan
keterangan:
r =
koefisien korelasi
∑xy = jumlah produk x dan y
Langkah-langkah penyelesaian:
-
Membuat table persiapan
No.
|
X
|
Y
|
x
|
Y
|
x2
|
y2
|
Xy
|
|
|
|
|
|
|
|
|
-
Memasukan nilai masing-masing mata
pelajaran X dan Y
-
Jumlahkan seluruh nilai dan hitung
rata-rata masing-masing variable
-
Isi kolom x dengan nilai tiap peserta
pada mata pelajaran X dikurangi dengan nilai rata-rata mata pelajaran X
-
Isi kolom x dengan nilai tiap peserta
pada mata pelajaran Y dikurangi dengan nilai rata-rata mata pelajaran Y
-
Cari x2 dengan mengkuadratkan
nilai pada kolom x
-
Cari y2 dengan mengkuadratkan
nilai pada kolom y
-
Hitung xy dengan mengalikan nilai pada
kolom x dan nilai pada kolom y
Korelasi
product-moment juga dapat dilakukan dengan menggunakan angka kasar, dengan
rumus:
2.) Korelasi
Perbedaan Peringkat (Rank Differences Correlation)
keterangan:
r =
koefisien korelasi
1 dan 6 =
bilangan tetap
D =
perbedaan antara dua peringkat atau rank
n =
jumlah sampel
Langkah-langkah:
-
Cari peringkat dari tiap-tiapmata
pelajaran dengan mengurutkan nilai-nilai dari yang terbesar sampai yang
terkecil.
-
Jika terdapat nilai yang sama, maka
jumlahkan nilai peringkat pertama dengan kedua lalu bagi dua, maka kedua orang
tersebut memiliki peringkat yang sama.
-
Cari perbedaan peringkat dengan
mengurangkan peringkat mata pelajaran X dengan Y
-
Perbedaan peringkat kemudian
dikuadratkan.
3.) Teknik Diagram Pencar (Scatter Diagram)
Dalam
statistika koefisien korelasi dinotasikan dengan “r” dimana -1,00 ≤ r ≥
1,00, r = +1,00 artinya korelasi
sempurna positif dan r = -1,00 artinya korelasi sempurna negative. Untuk
menafsirkan koefisien korelasi dapat menggunakan criteria berikut:
0,81
– 1,00 = sangat tinggi
0,61
– 0,80 = tinggi
0,41
– 0,60 = cukup
0,21
– 0,40 = rendah
0,00
– 0,20 = sangat rendah
d. Validitas
Konstruk
Valditas konstruk merupakan konsep yang
dapar diobservasi dan dapat diukur, validitas konstruk dikenal juga dengan
istilah validitas logis dan digunakan dalam tes-tes psikologi untuk mengukur
gejala perilaku yang abstrak. Validitas konstruk digunakan untuk mengetahui
sejauh mana tes dapat mengobservasi dan mengukur fungsi psikologis.
e. Validitas
Faktor
Penilaian hasil belajar kerap menggunakan
pengukuran atas suatu variable yang terdiri dar bebrapa factor yang diperoleh
dari indicator. Validitas factor dapat dihitung dengan menghitung homogenitas
skor setiap factor dengan total skor dan antara skor factor satu dengan
lainnya.
D. Reliabilitas
Reliabilitas
merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatan
reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok
yang sama pada kesempatan yang berbeda. Berikut ini merupakan empat factor yang
mempengaruhi reliabilitas, yaitu:
a. Panjang
tes (Length of Test)
b. Sebaran
skor (spread of scores)
c. Tingkat
kesukaran (Difficulties Index)
d. Obyektifitas
Menurut
perhitungan product Moment ada 3 macam reliabilitas, yaitu:
a. Koefisien
stabilitas
Koefisien stabilitas merupakan jenis
reliabilitas yang menggunakan teknik test and retest yaitu memberikan tes
kepada sekelompok individu kemudian mengulang tes yang sama pada kelompok yang
sama di waktuyangn berbeda.
b. Koefisien
Ekuivalen
Koefisien ekuivalen dilakukan dengan
mengkorelasikan tes yang paralel pada kelompok yang sama waktu yang sama dengan
syarat kedua tes tersebut memiliki criteria, jumlah, isi, corak, tingkat
kesukaran, petunjuk pengerjaan dan waktu pengerjaan yang sama.
c. Koefisien
Konsistensi Internal
Koefisien konsistensi internal merupakan
reliabilitas yang didapat dari mengkorelasikan dua buah tes dari kelompok yang
sama tetapi diambil dari butir-butir yang berbeda namun jumlahnya sama (genap
dengan ganjil atau acak)
Rumus
Spearman Brown
Rumus
Kuder Richardson
Keterangan
P =
proporsi peserta didik yang menjawab betul dari suatu butir soal
Q =
1-p
K =
jumlah butir soal
Teknik
Koefisien Alpha
E. Kepraktisan
Kepraktisan
berarti kemudahan baik dalam hal persiapan, penggunaan, mengolahan, penafsiran
maupun pengadminitrasian. Briikut ini merupakan faktir-faktor yang mempengaruhi
kepraktisan, yaitu:
a. Kemudahan
mengadministrasi
b. Waktu
yang disediakan untuk melancarkan evaluasi
c. Kemudahan
menskor
d. Kemudahan
intrepretasi danaplikasi
e. Tersedianya
bentuk instrument evaluasi yang ekuivalen.
F. Analisis Butir Soal
a. Tingkat
Kesukaran
1.) Soal
bentuk objektif
Menggunakan rumus tingkat kesukaran
Keterangan:
WL =
jumlah peserta didik yang menjawab salah dari kelompok bawah
WH =
jumlah peserta didik yang menjawab salah adri kelompok atas
nL =
jumlah kelompok bawah
nH =
jumlah kelompok atas
Langkah-langkah
-
Menyusun lembar jawaban dari skor
tertinggi sampai terendah
-
Menyisihkn 27% dari kelompok atas dan
bawah
-
Membuat tabel untuk mengetahui jawaban
benar (+) salah (-)
Kriteria
penafsiran tingkat kesukaran soal:
-
≤ 27% =
mudah
-
27% - 72%
= sedang
-
≥ 72% =
sukar
2.) Soal
bentuk uraian
Menghitung tingkat kesukaran soal bentuk
uraian adalah dengan menghitung persentase peserta didik yang gagal menjawab
benar atau dibawah batas lulus
b. Daya
Pembeda
Perhitungan daya pembeda adalah
peengukuran sejauh mana suatu butir soal mampu membedakan peserta didik
yang belum atau kurang mengasaui
kompetensi.
Keterangan:
DP = daya pembeda
n = 27% x N
Kriteria Daya pembeda
-
0,40 and up = very good items
-
0,30 – 0,39 = reasonably good
-
0,20 – 0,30 = marginal items
-
Below 0,19 = poor items
1.) Menghitung
Signifikansi Daya Pembeda Soal Objektif
-
Membuat table persiapan
-
Menghitung jumlah WL dan WH
-
Menguranngkan WL dengan WH
-
Menambahkan WL dengan WH
-
Membandingkan nilai WL-WH dengan nilai
table signifikansi DP
2.) Menghitung
Signifikansi Daya Pembeda Soal Uraian
G. Analisis Pengecoh
Indeks
pengecoh:
Keterangan:
IP
= Indeks pengecoh
P = jumlah peserta didik yang memilih
pengecoh
N
= jumlah peserta didik yang ikut
tes
B = jumlah peserta didik yang menjawab
benar
n = jumlah opsi
1 = bilangan tetap
Adapun kualitas
pengecoh berdasarkan indeksnya adalah:
76%
- 125% =
sangat baik
51%
-75% atau 126% - 150% = baik
26%-
50% atau 151% - 175% = kurang
baik
0%
- 25% atau 176% - 200% =
jelek
Lebih
dari 200% =
sangat jelek
H. Analisis Homogenitas Soal
Homogentias
diketahui dengan menghitung koefisien korelasi antara skor tiap butir dengan skor total. Salah satu teknik korelasi
yang dapat digunakan adalah korelasi product moment atau korelasi point
biserial.
I. Efektivitas Fungsi Opsi
Langkah-langkah:
a. Menentukan
jumlan peserta didik
b. Menentukan
jumlah sampel kelompok atas danbawah
c. Membuat
table pengujian efektivitas
d. Menghitung
jumlah alternative jawaban yang diipilih peserta didik
e. Menentukan
efektivitas fungsi opsi dengan criteria:
1.) Opsi
kunci
-
Jumlah pemilih kelompok atas dan bawah
antara 25% - 75%
Keterangan:
∑PKA =
jumlah pemilih kelompok atas
∑PKB =
jumlah pemilih kelompok bawah
N1 = jumlah sampel kelompok atas
N2 = jumlah sampel kelompok bawah
-
Jumlah pemilih kelompok atas harus lebih
banyak dari jumlah pemilih kelompok bawah
2.) Untuk
opsi pengecoh
-
Jumlah pemilih kelompok atas dan bawah
tidak kurang dari:
25%
Keterangan:
d =
jumlah opsi pengecoh
Ka =
kelompok atas
Kb =
kelompok bawah
-
Jumlah pemilih kelompok bawah harus lebih
besar daripada kelompok atas.
BAB III
KESIMPULAN
Analisis tes dan butir
soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat
kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Suatu
instrument dapat dikatakan valid apabila benar-benar mampu mengukur apa yang
hendak diukur dengan tepat. Validitas dapat dihitung dengan beberapa metode,
antara lain metode korelasi product moment angka simpangan,korelasi perbedaan
peringkat peringkat dan diagram pencar. Reliabilitas merupakan
derajat konsistensi suatu instrument. Suatu tes dapat dikatan reliable apabila
selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
kesempatan yang berbeda.Ada beberapa rumus yang dapat digunakan untuk
menghitung reliabilitas, yaitu rumus spearman brown, rumus kuder richarson dan
rumus koefisien alpha. Hal lain yang perlu diperhatikan dalam menganalisis tes
adalak kepraktisan tes terrsebut, dimana kepraktisan berarti kemudahan baik
dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun
pengadminitrasian.
Analisis butir soal
dilakukan dengan melakukan perhitungan tingkat kesukaran dan daya pembeda.
Analisis lain yang dibutuhkan untuk memastikan kualitas tes dan butir soal
adalah analisis pengecoh, analisis homogenitas dan analisis efektivitas fungsi
opsi.
DAFTAR PUSTAKA
Arifin,
Zainal. 2010. Evaluasi Pembelajaran. Bandung: PT.Remaja Rosdakarya.
Arikunto, Suharsimi. 2009.
Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
lit tak contoh makalahmu yoooooo... :)
BalasHapus