Stay in touch
Subscribe to our RSS!
Oh c'mon
Bookmark us!
Have a question?
Get an answer!

Interpretasi hasil analisis ITEMAN

1 komentar


Waktu kemarin kita sudah belajar bagaimana menggunakan software analisis butir soal dengan ITEMAN. Nah loch, sekarang kita akan menginterpretasikan hasil analisis tersebut. So, simak baik-baik yoh....


Statistik  hasil  analisis  ITEMAN  dapat  dibedakan  ke dalam  2  bagian  yaitu: 
(a)  Statistik  butir soal  dan 
(b) statistik tes/skala.
Berikut menunjukkan hasil analisis statistik  butir  soal dan  hasil  analisis statistik tes/skala: 

                     MicroCAT (tm) Testing System              
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
       Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file UJICO.TXT                         Page  1
                 Item Statistics             Alternative Statistics
             -----------------------   -----------------------------------
Seq.  Scale   Prop.           Point            Prop.            Point
No.   -Item  Correct  Biser.  Biser.   Alt.  Endorsing  Biser.  Biser. Key
----  -----  -------  ------  ------   ----- ---------  ------  ------ ---

  1   0-1     0.512    0.417   0.332     A     0.268    -0.422  -0.314 
                                         B     0.122     0.036   0.023 
                                         C     0.512     0.417   0.332  *
                                         D     0.098    -0.200  -0.116 
                                       Other   0.000    -9.000  -9.000 

Dan seterusnya.................



There were 41 examinees in the data file.


Scale Statistics
----------------

  Scale:           0  
               -------
N of Items          25
N of Examinees      41
Mean            12.951
Variance        17.900
Std. Dev.        4.231
Skew             0.318
Kurtosis        -0.123
Minimum          4.000
Maximum         24.000
Median          13.000
Alpha            0.732
SEM              2.189
Mean P           0.518
Mean Item-Tot.   0.362
Mean Biserial    0.474

Keterangan:

a. Statistik butir soal.

Untuk  tes  yang  terdiri  dari  butir-butir  soal  yang  bersifat  dikotomi  misalnya  pilihan  ganda,

statistik berikut adalah output dari setiap butir soal yang dianalisis.

 1.  Seq. No. adalah nomor urut butir soal dalam file data.

2.  Scala item adalah nomor urut butir soal dalam tes.

3.  Prop. Correct  adalah Proporsi  siswa  yang  menjawab  benar  butir tes. Nilai  ekstrem mendekati  nol atau  satu  menunjukkan  bahwa  butir  soal  tersebut  terlalu  sukar  atau  terlalu  mudah  untuk  pesserta tes. Indeks ini disebut juga indeks tingkat kesukaran soal secara klasikal.

 4.  Biser  adalah  indeks  daya  pembeda  soal  dengan  menggunakan  koefisien  korelasi  biserial.  Nilai positif  menunjukkan  bahwa  peserta  tes  yang  menjawab  benar  butir  soal  mempunyai  skor  relatif tinggi dalam tes tersebut. Sebaliknya nilai negatif menunjukkan bahwa peserta tes yang menjawab  benar  butir  soal  memperoleh  skor  yang  relatif  rendah  dalam  tes.  Untuk  statistik  pilihan  jawaban (alternatif),  korelasi  biserial  negatif  sangat  tidak  dikehendaki  untuk  kunci  jawaban  dan  sangat dikehendaki untuk pilihan jawaban yang lain.

 5.  Point  biserial  adalah  juga  indeks  daya  pembeda  soal  dan  pilihan  jawaban  (alternatif)  dengan menggunakan koefisien korelasi point biserial, penafsirannya sama dengan statistik biserial.

Catatan:

-  Nilai –9.000 menunjukkan bahwa statistik butir soal atas pilihan jawaban tidak dapat dihitung. Hal ini seringkali  terjadi  apabila  tidak  ada  peserta  tes  yang  menjawab  butir  soal/pilihan  jawaban  tersebut. Statistik  pilihan  jawaban/alternatif  memberikan  informasi  yang  sama  dengan  statistik  butir  soal. Perbedaannya adalah bahwa statistik  pilihan jawaban dihitung secara terpisah. Untuk setiap  pilihan jawaban  dan  didasarkan  pada  dipilih  tidaknya  alternatif  tersebut,  bukan  pada  benarnya  jawaban.

- Tanda bintang (*) yang muncul disebelah kanan hasil analisis menunjukkan kunci jawaban.

b. Statistik tes.

Program ini memberikan hasil analisis statistik untuk tes sebagai berkut:

1.  N of Items: Jumlah butir soal dalam tes yang dianalisis. Untuk tes yang terdiri atas butir-butir soal dikotomi hal ini merupakan jumlah total butir soal dalam tes.

2.  N of Examines: Jumlah peserta tes yang digunakan dalam analisis.

3.  Mean: skor/rata-rata peserta tes.

4.  Variance:  Varian  dari  distribusi  skor  peserta  tes  yang  memberikan  gambaran  tentang  sebaran skor peserta tes .

5.  Std.  Deviasi:  Deviasi  standar  dari  distribusi  skor  peserta  tes. Deviasi  standar  merupakan  akar dari variance.

6.  Skew. : Kemiringan  distribusi  skor  peserta yang  memberikan  gambaran tentang  bentuk  distribusi skor  peserta  tes.  Kemiringan  negatif  menunjukkan  bahwa  sebagian  besar  skor  berada  pada bagian  atas/skor  tinggi  dari  distribusi  skor.  Sebaliknya  kemiringan  positif  menunjukkan  bahwa sebagian  besar  skor  berada  pada  bagian  bawah/skor  rendah  dari  distribusi  skor.  Kemiringan  nol menunjukkan bahwa skor berdistribusi secara simetris di sekitar rata-rata/mean.

7.  Kurtosis:  Puncak  distribusi  skor  yang  menggambarkan  kelandaian  distribusi  skor  dibanding dengan  distribusi  normal.  Nilai  positif  menunjukkan  distribusi  yang  lebih  lancip/memuncak  dan nilai  negatif  menunjukkan  distribusi  yang  lebih  landai/merata.  Kurtosis  untuk  distribusi  normal adalah nol.

8.  Minimum: Skor terendah peserta dalam tes.

9.  Maximum: Skor tertinggi peserta dalam tes.

10.  Median: Skor tengah dimana 50% berada pada/lebih rendah dari skor tersebut.



11.  Alpha:  Koefisien  reliabilitas  alpha  untuk  tes  yang  merupakan  indeks  homogenitas  tes.  Koefisien alpha bergerak dari 0.0 sampai 1.0. Koefisien alpha hanya cocok digunakan pada tes yang bukan mengukur  kecepatan  dan  hanya  mengukur  satu  dimensi (single  trait). 

Reliabilitas  adalah kestabilan  skor  yang  diperoleh  orang  yang  sama  ketika  diuji  ulang  dengan  tes  yang  sama  pada situasi  yag  berbeda.  Jadi  reliabilitas  dapat  dikatakan  sebagai  tingkat  konsistensi  hasil  dua pengukuran  terhadap  hal  yang  sama.  Dengan  perangkat  soal  yang  reliable  apabila  tes  diberikan dua  kali  pada  orang  yang  sama  tetapi  dalam  selang  waktu  yang  berbeda  sepanjang  tidak  ada perubahan kemampuan maka skor yang diperoleh akan konstan.

Taraf kesukaran(prof correct):
0,000 – 0,099 sangat sukar --- di buang/revisi total
0,100 – 0,299 sukar – perlu direvisi
0,300-0,700 sedang – baik
0,701 – 0,900 mudah – perlu di revisi
0,901 – 1, 000 sangat mudah – dibuang/revisi total

Realibilitas
0,000 – 0,400                : Rendah artinya kurang baik
0,401 – 0,700                : Sedang artinya cukup
0701 – 1,000                 : Tinggi artinya baik


Point bisareal (daya pembeda)
D 0,199 sangat rendah – dibuang/revisi total
0,200 – 0,299 rendah --- perlu direvisi
0,300 – 0,399 – tanpa revisi
D ≥ 0,400 Tinggi bagus sekali

Proporsi jawaban
0,000 – 0,010 kurang – dibuang/revisi total
0,011 – 0,050 cukup – baik
0,051 – 1,000 baik sekali

N of Items = 30, jumlah soal adalah 30
N or Examinees = 41, jumlah peserta ujian adalah 41 siswa
Mean = 14,500, jumlah rata-rata peserta ujian 14,5 dari 30 artinya dibawah nilai 50 dengan skala 100
Variance = 13,566, jumlah kuadrat dari standar deviasi
Standar Deviasi = 3,683, simpangan baku hasil ujian
Skew = 0,457, ukuran distribusi data apakah data normal atau tidak dengan cara dihitung rasio skewness dengan error of skewness dalam data ini tidak tercantum error of skewness dengan data lain dapat ditampilkan menggunakan analisis deskriptif apabila perbandingannya pada range -2 sampai 2 maka distribusi data normal.
Kurtosis = 1,883, kurtosis sama dengan Skewness, digunakan untuk mengukur distribusi data. Untuk mengetahui apakah data terdistribusi dengan normal atau tidak , maka dihitung rasio kurtosis dengan standard error of kurtosis (disini tidak tercantum datanya di analisis deskriptif dapat dicantumkan) bila rasio kurtosis diantara -2 sampai 2, maka distribusi data normal.
Minimum = 7, nilai minimum peserta ujian
Maksimum = 27, nilai maksimum peserta ujian
Median = 15, nilai tengah dari statistic
Alpha = 0,503, reliabilitas soal 50,3%, beberapa literature menyarankan alpha minimal diatas 70% dan baik jika 80% ke atas, jadi rekomendasi soal harus diperbaiki.
SEM (Standard Eror Minimum) = 2,503, Kesalahan Baku Minimal nilainya cukup besar itu sebabnya harus kecil kalau boleh dibawah 1
Mean P = 0,483, rata-rata tingkat kesukaran soal berkategori sedang karena diantara range 0,31-0,70
Mean Item total = 0,263
Mean Biserial = 0,344 korelasi Biserial daya pembeda masih kecil, sebaiknya diatas 0,40 – 1,00 itu sebabnya disarankan soal (butir jawaban) direvisi dan sudah dilakukan revisi tetapi belum diujikan.


Untuk lebih lengkapnya bisa unduh file disini



Semoga Bermanfaat sahabat Bluestoking... ^_^

Share/Bookmark

1 komentar:

  1. Mau tanya pak, kok hasil score saya tidak akurat ya? Dari 25 soal nilai maxnya 14 dan minnya 2. Padahal ketika saya coba pake manual maxnya 24 dan minnya 10. Kira-kira penyebabnya apa ya pak? Mohon bantuannya.

    BalasHapus

Lee Jong Seok

Lee Jong Seok
Saranghae Emesayap.....^_^

Total Tayangan Halaman