Interpretasi hasil analisis ITEMAN
Waktu kemarin kita sudah belajar bagaimana menggunakan software analisis butir soal dengan ITEMAN. Nah loch, sekarang kita akan menginterpretasikan hasil analisis tersebut. So, simak baik-baik yoh....
Statistik hasil
analisis ITEMAN dapat
dibedakan ke dalam 2
bagian yaitu:
(a) Statistik butir soal
dan
(b) statistik tes/skala.
Berikut menunjukkan
hasil analisis statistik butir soal dan
hasil analisis statistik
tes/skala:
MicroCAT (tm) Testing
System
Copyright
(c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN
(tm) Version 3.00
Item
analysis for data from file UJICO.TXT
Page 1
Item Statistics Alternative Statistics
----------------------- -----------------------------------
Seq. Scale
Prop. Point Prop. Point
No. -Item
Correct Biser. Biser.
Alt. Endorsing Biser.
Biser. Key
---- -----
------- ------ ------
----- --------- ------ ------ ---
1
0-1 0.512 0.417
0.332 A 0.268
-0.422 -0.314
B 0.122 0.036
0.023
C 0.512
0.417 0.332 *
D 0.098
-0.200 -0.116
Other 0.000 -9.000
-9.000
Dan seterusnya.................
There were 41 examinees in the data file.
Scale Statistics
----------------
Scale: 0
-------
N of Items 25
N of Examinees 41
Mean 12.951
Variance 17.900
Std. Dev. 4.231
Skew 0.318
Kurtosis -0.123
Minimum 4.000
Maximum 24.000
Median 13.000
Alpha 0.732
SEM 2.189
Mean P 0.518
Mean Item-Tot. 0.362
Mean Biserial 0.474
Keterangan:
a. Statistik butir soal.
Untuk tes
yang terdiri dari
butir-butir soal yang
bersifat dikotomi misalnya
pilihan ganda,
statistik berikut adalah output
dari setiap butir soal yang dianalisis.
1. Seq.
No. adalah nomor urut butir soal dalam file data.
2. Scala item adalah nomor urut butir soal dalam
tes.
3. Prop. Correct adalah Proporsi siswa
yang menjawab benar
butir tes. Nilai ekstrem
mendekati nol atau satu
menunjukkan bahwa butir
soal tersebut terlalu
sukar atau terlalu
mudah untuk pesserta tes. Indeks ini disebut juga indeks
tingkat kesukaran soal secara klasikal.
4. Biser
adalah indeks daya
pembeda soal dengan
menggunakan koefisien korelasi
biserial. Nilai positif menunjukkan
bahwa peserta tes
yang menjawab benar
butir soal mempunyai
skor relatif tinggi dalam tes
tersebut. Sebaliknya nilai negatif menunjukkan bahwa peserta tes yang menjawab benar
butir soal memperoleh
skor yang relatif
rendah dalam tes.
Untuk statistik pilihan
jawaban (alternatif),
korelasi biserial negatif
sangat tidak dikehendaki
untuk kunci jawaban
dan sangat dikehendaki untuk
pilihan jawaban yang lain.
5. Point
biserial adalah juga
indeks daya pembeda
soal dan pilihan
jawaban (alternatif) dengan menggunakan koefisien korelasi point
biserial, penafsirannya sama dengan statistik biserial.
Catatan:
- Nilai –9.000
menunjukkan bahwa statistik butir soal atas pilihan jawaban tidak dapat
dihitung. Hal ini seringkali
terjadi apabila tidak
ada peserta tes
yang menjawab butir
soal/pilihan jawaban tersebut. Statistik pilihan
jawaban/alternatif
memberikan informasi yang
sama dengan statistik
butir soal. Perbedaannya adalah
bahwa statistik pilihan jawaban dihitung
secara terpisah. Untuk setiap pilihan jawaban dan
didasarkan pada dipilih
tidaknya alternatif tersebut,
bukan pada benarnya
jawaban.
- Tanda bintang (*) yang muncul disebelah kanan hasil analisis
menunjukkan kunci jawaban.
b. Statistik tes.
Program ini memberikan hasil
analisis statistik untuk tes sebagai berkut:
1. N of Items: Jumlah
butir soal dalam tes yang dianalisis. Untuk tes yang terdiri atas butir-butir
soal dikotomi hal ini merupakan jumlah total butir soal dalam tes.
2. N of Examines:
Jumlah peserta tes yang digunakan dalam analisis.
3. Mean: skor/rata-rata
peserta tes.
4. Variance: Varian
dari distribusi skor
peserta tes yang
memberikan gambaran tentang
sebaran skor peserta tes .
5. Std. Deviasi:
Deviasi standar dari
distribusi skor peserta
tes. Deviasi standar merupakan
akar dari variance.
6. Skew. :
Kemiringan distribusi skor
peserta yang memberikan gambaran tentang bentuk
distribusi skor peserta tes.
Kemiringan negatif menunjukkan
bahwa sebagian besar
skor berada pada bagian
atas/skor tinggi dari
distribusi skor. Sebaliknya
kemiringan positif menunjukkan
bahwa sebagian besar skor
berada pada bagian
bawah/skor rendah dari
distribusi skor. Kemiringan
nol menunjukkan bahwa skor berdistribusi secara simetris di sekitar
rata-rata/mean.
7. Kurtosis: Puncak
distribusi skor yang
menggambarkan kelandaian distribusi
skor dibanding dengan distribusi
normal. Nilai positif
menunjukkan distribusi yang lebih
lancip/memuncak dan nilai negatif
menunjukkan distribusi yang
lebih landai/merata. Kurtosis
untuk distribusi normal adalah nol.
8. Minimum: Skor
terendah peserta dalam tes.
9. Maximum: Skor
tertinggi peserta dalam tes.
10. Median: Skor tengah
dimana 50% berada pada/lebih rendah dari skor tersebut.
11. Alpha: Koefisien
reliabilitas alpha untuk
tes yang merupakan
indeks homogenitas tes.
Koefisien alpha bergerak dari 0.0 sampai 1.0. Koefisien alpha hanya
cocok digunakan pada tes yang bukan mengukur
kecepatan dan hanya
mengukur satu dimensi (single trait).
Reliabilitas adalah kestabilan skor
yang diperoleh orang
yang sama ketika
diuji ulang dengan
tes yang sama
pada situasi yag berbeda.
Jadi reliabilitas dapat
dikatakan sebagai tingkat
konsistensi hasil dua pengukuran terhadap
hal yang sama.
Dengan perangkat soal
yang reliable apabila
tes diberikan dua kali
pada orang yang
sama tetapi dalam
selang waktu yang berbeda sepanjang
tidak ada perubahan kemampuan
maka skor yang diperoleh akan konstan.
Taraf
kesukaran(prof correct):
0,000
– 0,099 sangat sukar --- di buang/revisi total
0,100
– 0,299 sukar – perlu direvisi
0,300-0,700
sedang – baik
0,701
– 0,900 mudah – perlu di revisi
0,901
– 1, 000 sangat mudah – dibuang/revisi total
Realibilitas
0,000 – 0,400 :
Rendah artinya kurang baik
0,401 – 0,700 : Sedang artinya cukup
0701 – 1,000 : Tinggi artinya baik
Point bisareal (daya pembeda)
D
≤0,199
sangat rendah – dibuang/revisi total
0,200
– 0,299 rendah --- perlu direvisi
0,300
– 0,399 – tanpa revisi
D
≥ 0,400 Tinggi bagus sekali
Proporsi jawaban
0,000 – 0,010
kurang – dibuang/revisi total
0,011 – 0,050 cukup
– baik
0,051 – 1,000 baik
sekali
N of Items = 30, jumlah soal adalah 30
N or Examinees = 41, jumlah peserta ujian adalah 41 siswa
Mean = 14,500, jumlah rata-rata peserta ujian 14,5 dari 30 artinya dibawah nilai 50 dengan skala 100
Variance = 13,566, jumlah kuadrat dari standar deviasi
Standar Deviasi = 3,683, simpangan baku hasil ujian
Skew = 0,457, ukuran distribusi data apakah data normal atau tidak dengan cara dihitung rasio skewness dengan error of skewness dalam data ini tidak tercantum error of skewness dengan data lain dapat ditampilkan menggunakan analisis deskriptif apabila perbandingannya pada range -2 sampai 2 maka distribusi data normal.
Kurtosis = 1,883, kurtosis sama dengan Skewness, digunakan untuk mengukur distribusi data. Untuk mengetahui apakah data terdistribusi dengan normal atau tidak , maka dihitung rasio kurtosis dengan standard error of kurtosis (disini tidak tercantum datanya di analisis deskriptif dapat dicantumkan) bila rasio kurtosis diantara -2 sampai 2, maka distribusi data normal.
Minimum = 7, nilai minimum peserta ujian
Maksimum = 27, nilai maksimum peserta ujian
Median = 15, nilai tengah dari statistic
Alpha = 0,503, reliabilitas soal 50,3%, beberapa literature menyarankan alpha minimal diatas 70% dan baik jika 80% ke atas, jadi rekomendasi soal harus diperbaiki.
SEM (Standard Eror Minimum) = 2,503, Kesalahan Baku Minimal nilainya cukup besar itu sebabnya harus kecil kalau boleh dibawah 1
Mean P = 0,483, rata-rata tingkat kesukaran soal berkategori sedang karena diantara range 0,31-0,70
Mean Item total = 0,263
Mean Biserial = 0,344 korelasi Biserial daya pembeda masih kecil, sebaiknya diatas 0,40 – 1,00 itu sebabnya disarankan soal (butir jawaban) direvisi dan sudah dilakukan revisi tetapi belum diujikan.
N or Examinees = 41, jumlah peserta ujian adalah 41 siswa
Mean = 14,500, jumlah rata-rata peserta ujian 14,5 dari 30 artinya dibawah nilai 50 dengan skala 100
Variance = 13,566, jumlah kuadrat dari standar deviasi
Standar Deviasi = 3,683, simpangan baku hasil ujian
Skew = 0,457, ukuran distribusi data apakah data normal atau tidak dengan cara dihitung rasio skewness dengan error of skewness dalam data ini tidak tercantum error of skewness dengan data lain dapat ditampilkan menggunakan analisis deskriptif apabila perbandingannya pada range -2 sampai 2 maka distribusi data normal.
Kurtosis = 1,883, kurtosis sama dengan Skewness, digunakan untuk mengukur distribusi data. Untuk mengetahui apakah data terdistribusi dengan normal atau tidak , maka dihitung rasio kurtosis dengan standard error of kurtosis (disini tidak tercantum datanya di analisis deskriptif dapat dicantumkan) bila rasio kurtosis diantara -2 sampai 2, maka distribusi data normal.
Minimum = 7, nilai minimum peserta ujian
Maksimum = 27, nilai maksimum peserta ujian
Median = 15, nilai tengah dari statistic
Alpha = 0,503, reliabilitas soal 50,3%, beberapa literature menyarankan alpha minimal diatas 70% dan baik jika 80% ke atas, jadi rekomendasi soal harus diperbaiki.
SEM (Standard Eror Minimum) = 2,503, Kesalahan Baku Minimal nilainya cukup besar itu sebabnya harus kecil kalau boleh dibawah 1
Mean P = 0,483, rata-rata tingkat kesukaran soal berkategori sedang karena diantara range 0,31-0,70
Mean Item total = 0,263
Mean Biserial = 0,344 korelasi Biserial daya pembeda masih kecil, sebaiknya diatas 0,40 – 1,00 itu sebabnya disarankan soal (butir jawaban) direvisi dan sudah dilakukan revisi tetapi belum diujikan.
Untuk lebih lengkapnya bisa unduh file disini
Semoga Bermanfaat sahabat Bluestoking... ^_^
Mau tanya pak, kok hasil score saya tidak akurat ya? Dari 25 soal nilai maxnya 14 dan minnya 2. Padahal ketika saya coba pake manual maxnya 24 dan minnya 10. Kira-kira penyebabnya apa ya pak? Mohon bantuannya.
BalasHapus