RE-A map of life :)

Jumat, 04 Mei 2012

ANALISIS KUALITAS TES DAN BUTIR SOAL


ANALISIS KUALITAS TES DAN BUTIR SOAL
Alita arifiana anisa ( 2 mei  2012)
 
BAB I
PENDAHULUAN

A.    Latar Belakang
Tes merupakan salah satu cara untuk mengevaluasi proses pembelajaran yang dianggap mampu memfasilitasi kebutuhan orang-orang di bidang pendidikan tentang perangkat atau alat yang mampu memberi gambaran tentang proses pembelajaran yang dilaksanakan. Untuk menghasilkan gambaran yang akurat, relevan dan sesuai dengan data yang sesungguhnya terjadi dilapangan membutuhkan tes yang berkualitas, oleh karena itu dibutuhkan analisis kualitas tes guna menciptakan kualitas tes yang benar-benar mampu melaksanakan tugasnya sebagai alat evaluasi. Analisis kualitas tes merupakan  suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir  soal yang menjadi bagian dari tes tersebut. Analisis kualitas tes digunakan untuk menjawab pertanyaan apakah tes sebagai alat ukur benar-benar mampu mengukur apa yang sebenarnya hendak diukur dan apakah tes tersebut dapat diandalkan dan berguna bagi dunia pendidikan.

B.     Rumusan Masalah
Adapun rumusan masalah yang diangkat dalam penulisan ini adalah:
a.       Bagaimana cara untuk melalukan analisis kualitas tes dan butir soal?
b.      Bagaimana aplikasi analisis kualitas tes dan butir soal pada dunia pendidikan?

C.    Tujuan
Penulisan ini bertujuan untuk mengetahui bagaimana cara melakukan analisis kualitas tes dan butir soal serta implementasinya dalam proses pembelajaran.


BAB II
PEMBAHASAN

A.    Pengertian Analisis Tes dan Butir Soal
Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir  soal yang menjadi bagian dari tes tersebut.

B.     Tujuan Analisis Tes dan Butir Soal
Analisis tes dan butir soal bertujuan untuk:
a.       Mengetahui apakah tes atau soal yang digunakan untuk mengevaluasi sudah mampu mengukur apa yang sebenarnya ingin diukur melalui tes atau soal tersebut.
b.      Mengetahui sejauh mana data atau informasi yang dihasilkan oleh tes maupun butir soal dapat diandalkan.
c.       Mengetahui sejauh mana data yang dihasilkan oleh tes atau soal dapat bergunabagi proses pembelajaran.

C.    Validitas
Suatu instrument dapat dikatakan valid apabila benar-benar mampu mengukur apa yang hendak diukur dengan tepat. Dalam validitas terdapat dua unsur penting, yaitu validitas menunjukan derajat atau hirarki dan validitas selalu dihubungkan dengan suatu tujuan yang spesifik karena tidak ada validitas yang berlaku secara umum. Ada 3 faktor yang dapat mempengaruhi validitas hasil tes yaitu:
a.       Faktor Instrument Evaluasi
Instrument evaluasi yang kurang baik akan menghasilkan hasil evaluasi yang kurang baik pula.
b.      Faktor Administrasi Evaluasi dan Penskoran
Banyak hal yang mempengaruhi hasil evaluasi yang berkaitan dengan administrasi dan penskoran, antara lain, alokasi waktu pengerjaan tes atau soal, kedisplinan guru pengawas, kedisplinan peserta tes, kesalahan penskoran, serta kondisi fisik dan psikis peserta tes.
c.       Faktor Jawaban dari Pesera Didik
Factor ini meliputi kecenderungan peserta didik untuk mengjawab dengan cepat namun kurang tepat, keinginan untuk coba-coba dan menggunakan gaya bahasa tertentu.
            Berikut ini merupakan jenis-jenis validitas, yaitu :
a.       Validitas permukaan
Jika suatu tes secara sepintas telah dianggap baik maka tes tersebut dapat dikatakan telah memenuhi syarat validitas permukaan dan tidak membutuhkan judgement yang mendalam.
b.      Validitas isi
Validitas isi sering digunakan dalam penilaian hasil belajar atau untuk mengetahui sejauh mana peserta didik menguasai materi pelajaran yang telah disampaikan dan perubahan psikologis yang terjadi setelah mengalami proses pembelajaran. Validitas isi disebut pula validitas kurikuler berkenan dengan relevansi materi tes dengan kurikulum yang ditentukan atau validitas perumusan berkenaan dengan apakah apek dalam soal tercakup dalam apa yang hendak diukur.
c.       Validitas empiris
Validitas empiris dilakukan dengan pendekatan korelasi untuk mencari hubungan skor tes dengan criteria tertentu. Validitas empiris dibagi menjadi 3, yaitu:
1.)    Validitas prediktif (Predictive validity) yang digunakan untuk meramalkan prestasi belajar peserta didik pada masa depan.
2.)    Validitas kongkuren (concurrent validity) digunakan untuk criteria standar yang berlainan.
3.)    Validitas sejenis (congruent validity) untuk criteria yang sejenis.
8 kriteria bahan bandingan berdasarkan pendapat Anastasi dalam Conny Semiawan Stamboel, yaitu:
1.)    Diferensiasi umur
2.)    Kemajuan akademis
3.)    Kriteria dalam Pelaksanaan Latihan Khusus
4.)    Kriteria dalam Pelaksanaan Kerja
5.)    Penilaian
6.)    Kelompok yang Bertentangan
7.)    Korelasi dengan tes lain
8.)    Konsistensi Internal
Contoh perhitungan korelasi:
1.)    Korelasi Product Moment dengan Angka Simpangan
keterangan:
r           = koefisien korelasi
∑xy     = jumlah produk x dan y
Langkah-langkah penyelesaian:
-          Membuat table persiapan
No.
X
Y
x
Y
x2
y2
Xy








-          Memasukan nilai masing-masing mata pelajaran X dan Y
-          Jumlahkan seluruh nilai dan hitung rata-rata masing-masing variable
-          Isi kolom x dengan nilai tiap peserta pada mata pelajaran X dikurangi dengan nilai rata-rata mata pelajaran X
-          Isi kolom x dengan nilai tiap peserta pada mata pelajaran Y dikurangi dengan nilai rata-rata mata pelajaran Y
-          Cari x2 dengan mengkuadratkan nilai pada kolom x
-          Cari y2 dengan mengkuadratkan nilai pada kolom y
-          Hitung xy dengan mengalikan nilai pada kolom x dan nilai pada kolom y
Korelasi product-moment juga dapat dilakukan dengan menggunakan angka kasar, dengan rumus:

2.)    Korelasi Perbedaan Peringkat (Rank Differences Correlation)
keterangan:
r           = koefisien korelasi
1 dan 6            = bilangan tetap
D         = perbedaan antara dua peringkat atau rank
n          = jumlah sampel
Langkah-langkah:
-          Cari peringkat dari tiap-tiapmata pelajaran dengan mengurutkan nilai-nilai dari yang terbesar sampai yang terkecil.
-          Jika terdapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan kedua lalu bagi dua, maka kedua orang tersebut memiliki peringkat yang sama.
-          Cari perbedaan peringkat dengan mengurangkan peringkat mata pelajaran X dengan Y
-          Perbedaan peringkat kemudian dikuadratkan.
3.)     Teknik Diagram Pencar (Scatter Diagram)
Dalam statistika koefisien korelasi dinotasikan dengan “r” dimana -1,00 ≤ r ≥ 1,00,  r = +1,00 artinya korelasi sempurna positif dan r = -1,00 artinya korelasi sempurna negative. Untuk menafsirkan koefisien korelasi dapat menggunakan criteria berikut:
0,81 – 1,00      = sangat tinggi
0,61 – 0,80      = tinggi
0,41 – 0,60      = cukup
0,21 – 0,40      = rendah
0,00 – 0,20      = sangat rendah

d.      Validitas Konstruk
Valditas konstruk merupakan konsep yang dapar diobservasi dan dapat diukur, validitas konstruk dikenal juga dengan istilah validitas logis dan digunakan dalam tes-tes psikologi untuk mengukur gejala perilaku yang abstrak. Validitas konstruk digunakan untuk mengetahui sejauh mana tes dapat mengobservasi dan mengukur fungsi psikologis.
e.       Validitas Faktor
Penilaian hasil belajar kerap menggunakan pengukuran atas suatu variable yang terdiri dar bebrapa factor yang diperoleh dari indicator. Validitas factor dapat dihitung dengan menghitung homogenitas skor setiap factor dengan total skor dan antara skor factor satu dengan lainnya.

D.    Reliabilitas
Reliabilitas merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatan reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada kesempatan yang berbeda. Berikut ini merupakan empat factor yang mempengaruhi reliabilitas, yaitu:
a.       Panjang tes (Length of Test)
b.      Sebaran skor (spread of scores)
c.       Tingkat kesukaran (Difficulties Index)
d.      Obyektifitas
Menurut perhitungan product Moment ada 3 macam reliabilitas, yaitu:
a.       Koefisien stabilitas
Koefisien stabilitas merupakan jenis reliabilitas yang menggunakan teknik test and retest yaitu memberikan tes kepada sekelompok individu kemudian mengulang tes yang sama pada kelompok yang sama di waktuyangn berbeda.
b.      Koefisien Ekuivalen
Koefisien ekuivalen dilakukan dengan mengkorelasikan tes yang paralel pada kelompok yang sama waktu yang sama dengan syarat kedua tes tersebut memiliki criteria, jumlah, isi, corak, tingkat kesukaran, petunjuk pengerjaan dan waktu pengerjaan yang sama.
c.       Koefisien Konsistensi Internal
Koefisien konsistensi internal merupakan reliabilitas yang didapat dari mengkorelasikan dua buah tes dari kelompok yang sama tetapi diambil dari butir-butir yang berbeda namun jumlahnya sama (genap dengan ganjil atau acak)
Rumus Spearman Brown
Rumus Kuder Richardson
Keterangan
P    = proporsi peserta didik yang menjawab betul dari suatu butir soal
Q   = 1-p
K   = jumlah butir soal

Teknik Koefisien Alpha

E.     Kepraktisan
Kepraktisan berarti kemudahan baik dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun pengadminitrasian. Briikut ini merupakan faktir-faktor yang mempengaruhi kepraktisan, yaitu:
a.       Kemudahan mengadministrasi
b.      Waktu yang disediakan untuk melancarkan evaluasi
c.       Kemudahan menskor
d.      Kemudahan intrepretasi danaplikasi
e.       Tersedianya bentuk instrument evaluasi yang ekuivalen.

F.     Analisis Butir Soal
a.       Tingkat Kesukaran
1.)    Soal bentuk objektif
Menggunakan rumus tingkat kesukaran
Keterangan:
WL      = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH     = jumlah peserta didik yang menjawab salah adri kelompok atas
nL        = jumlah kelompok bawah
nH       = jumlah kelompok atas
Langkah-langkah
-          Menyusun lembar jawaban dari skor tertinggi sampai terendah
-          Menyisihkn 27% dari kelompok atas dan bawah
-          Membuat tabel untuk mengetahui jawaban benar (+) salah (-)
Kriteria penafsiran tingkat kesukaran soal:
-          ≤ 27%                    = mudah
-          27% - 72%                       = sedang
-          ≥ 72%                    = sukar
2.)    Soal bentuk uraian
Menghitung tingkat kesukaran soal bentuk uraian adalah dengan menghitung persentase peserta didik yang gagal menjawab benar atau dibawah batas lulus
b.      Daya Pembeda
Perhitungan daya pembeda adalah peengukuran sejauh mana suatu butir soal mampu membedakan peserta didik yang  belum atau kurang mengasaui kompetensi.
Keterangan:
DP = daya pembeda
n = 27% x N
Kriteria Daya pembeda
-          0,40 and up           = very good items
-          0,30 – 0,39            = reasonably good
-          0,20 – 0,30            = marginal items
-          Below 0,19            = poor items
1.)      Menghitung Signifikansi Daya Pembeda  Soal Objektif
-          Membuat table persiapan
-          Menghitung jumlah WL dan WH
-          Menguranngkan WL dengan WH
-          Menambahkan WL dengan WH
-          Membandingkan nilai WL-WH dengan nilai table signifikansi DP
2.)      Menghitung Signifikansi Daya Pembeda Soal Uraian


G.    Analisis Pengecoh
Indeks pengecoh:

Keterangan:
IP        = Indeks pengecoh
P          = jumlah peserta didik yang memilih pengecoh
N         = jumlah peserta didik yang ikut tes
B         = jumlah peserta didik yang menjawab benar
n          = jumlah opsi
1          = bilangan tetap
Adapun kualitas pengecoh berdasarkan indeksnya adalah:
            76% - 125%                                        = sangat baik
            51% -75% atau 126% - 150%             = baik
            26%- 50% atau 151% - 175%             = kurang baik
            0% - 25% atau 176% - 200%              = jelek
            Lebih dari 200%                                 = sangat jelek

H.    Analisis Homogenitas Soal
Homogentias diketahui dengan menghitung koefisien korelasi antara skor tiap butir  dengan skor total. Salah satu teknik korelasi yang dapat digunakan adalah korelasi product moment atau korelasi point biserial.

I.       Efektivitas Fungsi Opsi
Langkah-langkah:
a.       Menentukan jumlan peserta didik
b.      Menentukan jumlah sampel kelompok atas danbawah
c.       Membuat table pengujian efektivitas
d.      Menghitung jumlah alternative jawaban yang diipilih peserta didik
e.       Menentukan efektivitas fungsi opsi dengan criteria:
1.)    Opsi kunci
-          Jumlah pemilih kelompok atas dan bawah antara 25% - 75%
Keterangan:
∑PKA       = jumlah pemilih kelompok atas
∑PKB       = jumlah pemilih kelompok bawah
N1              = jumlah sampel kelompok atas
N2              = jumlah sampel kelompok bawah
-          Jumlah pemilih kelompok atas harus lebih banyak dari jumlah pemilih kelompok bawah
2.)    Untuk opsi pengecoh
-          Jumlah pemilih kelompok atas dan bawah tidak kurang dari:
25%
Keterangan:
d                = jumlah opsi pengecoh
Ka             = kelompok atas
Kb             = kelompok bawah
-          Jumlah pemilih kelompok bawah harus lebih besar daripada kelompok atas.


BAB III
KESIMPULAN

Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir  soal yang menjadi bagian dari tes tersebut. Suatu instrument dapat dikatakan valid apabila benar-benar mampu mengukur apa yang hendak diukur dengan tepat. Validitas dapat dihitung dengan beberapa metode, antara lain metode korelasi product moment angka simpangan,korelasi perbedaan peringkat peringkat dan diagram pencar. Reliabilitas merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatan reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada kesempatan yang berbeda.Ada beberapa rumus yang dapat digunakan untuk menghitung reliabilitas, yaitu rumus spearman brown, rumus kuder richarson dan rumus koefisien alpha. Hal lain yang perlu diperhatikan dalam menganalisis tes adalak kepraktisan tes terrsebut, dimana kepraktisan berarti kemudahan baik dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun pengadminitrasian.
Analisis butir soal dilakukan dengan melakukan perhitungan tingkat kesukaran dan daya pembeda. Analisis lain yang dibutuhkan untuk memastikan kualitas tes dan butir soal adalah analisis pengecoh, analisis homogenitas dan analisis efektivitas fungsi opsi.


DAFTAR PUSTAKA
            Arifin, Zainal. 2010. Evaluasi Pembelajaran. Bandung: PT.Remaja Rosdakarya.
            Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.


1 komentar: