Selasa, 29 November 2011

Laporan Evaluasi Pembelajaran II

BAB I
PENDAHULUAN
A.    Latar Belakang
Komponen dalam pembelajaran yang meliputi tujuan pembelajaran, proses pembelajaran dan evaluasi pembelajaran merupakan kesatuan yang tidak dapat dipisahkan. Proses belajar mengajar termasuk penguasaan materi selalu akan berorientasi kepada tujuan pembelajaran. Apakah tujuan pembelajaran tercapai atau tidak, baru akan terjawab setelah diadakan evaluasi dengan persyaratan memperhatikan tujuan pembelajaran dan materi pelajaran.
Evaluasi merupakan suatu tindakan yang dilakukan oleh evaluator terhadap suatu peristiwa atau kejadian. Alat yang digunakan sebagai sarana untuk menentukan nilai adalah tes. Tes pada umumnya digunakan untuk menilai dan mengukur hasil belajar siswa, terutama hasil belajar kognitif berkenaan dengan penguasaan bahan pengajaran sesuai dengan pendidikan dan pengajaran. Keberhasilan suatu pendidikan dapat dilihat dari pola penilaian hasil belajar yang telah ditentukan sesuai standar kurikulum yang berlaku.
Soal dikatakan mempunyai kualitas yang baik apabila mempunyai validitas, reliabilitas, dan daya beda yang tinggi, serta tingkat kesukaran yang sedang, dan yang tidak kalah pentingnya, soal tersebut dapat mengukur kompetensi yang diharapkan tercapai.

B.     Rumusan Masalah
Berdasarkan uraian latar belakang di atas, maka permasalahan yang akan dibahas dalam penelitian ini adalah:
1.      Bagaimanakah kualitas butir soal bidang studi Pendidikan Agama Islam yang diujikan kepada siswa kelas VIII SMP Negeri 13 Bandung ditinjau dari segi analisis validitas, analisis reliabilitas,  daya pembeda dan tingkat kesukarannya?
2.      Apakah butir soal bidang studi Pendidikan Agama Islam yang diujikan kepada siswa kelas VIII SMP Negeri 13 Bandung  tersebut dapat mengukur ketercapaian setiap kompetensi yang diharapkan tercapai?
C.    Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah:
1.      Mengetahui kualitas butir soal uji coba bidang studi Pendidikan Agama Islam kelas VII SMP Negeri 13 Bandung  apabila ditinjau dari analisis validitas, analisis reliabilitas,  daya pembeda dan tingkat kesukarannya.
2.      Mengetahui tingkat ketercapaian kompetensi yang diharapkan tercapai melalui soal bidang studi Pendidikan Agama Islam yang diberikan kelas VII SMP Negeri 13 Bandung.  
D.    Metodologi  Penelitian
Cara  awal dalam melakukan penelitian ini adalah menyusun kisi-kisi tes atau soal. Kisi-kisi tes adalah format atau matrik yang memuat informasi tentang spesifikasi soal-soal yang akan dibuat. Dengan kisi-kisi ini akan dikembangkan soal-soal yang sesuai dengan tujuan tes serta memudahkan bagi perakit tes dalam menyusun perangkat tes. Kisi-kisi dijadikan dasar bagi penulis soal, sehingga dapat menghasilkan soal yang isi maupun tingkat kesulitannya sama. Langkah kedua, yaitu menyusun atau menulis soal-soal berdasarkan kisi-kisi yang telah dibuat.

BAB II
KAJIAN TEORITIK

A.    Pengertian Evaluasi dan Evaluasi Pendidikan
Secara harafiah kata evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Dengan demikian secara harfiah evaluasi pendidikan (educational evaluation) dapat diartikan sebagai penilaian dalam bidang pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan pendidikan (Sudijono, 2007: 1). Evaluasi merupakan suatu kegiatan membandingkan
objek yang dinilai dengan standar tertentu.
Arikunto (2007: 3) mendefinisikan evaluasi dengan terlebih dahulu menjelaskan tentang mengukur dan menilai. Mengukur adalah membandingkan sesuatu dengan satu ukuran dan bersifat kuantitatif. Menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk dan bersifat kualitatif. Sedangkan mengadakan evaluasi meliputi kedua langkah di atas, yaitu mengukur dan menilai. Dengan demikian evaluasi adalah menilai (tetapi dilakukan dengan mengukur terlebih dahulu).
Mengenai evaluasi pendidikan, Arikunto (2002: 3) mengutip pendapat dari Ralph Tyler (1950) mengatakan bahwa: “Evaluasi pendidikan merupakan sebuah proses pengumpulan data untuk menentukan sejauh mana, dalam hal apa dan bagian mana tujuan pendidikan sudah tercapai. Jika belum, bagaimana yang belum dan apa
sebabnya”. Definisi yang lebih luas dikemukakan oleh dua orang ahli lain, yakni Cronbach dan Stufflebeam. Tambahan definisi tersebut bukan hanya mengukur sejauh mana tujuan tercapai, tetapi juga digunakan untuk membuat keputusan.
Dari definisi-definisi tentang evaluasi pendidikan di atas dapat dipahami bahwa evaluasi pendidikan selain merupakan suatu proses untuk mengukur sejauh mana tujuan telah tercapai, juga berguna untuk membuat keputusan dalam dunia pendidikan.


B.     Prinsip-prinsip Dasar Tes Hasil Belajar
Ada beberapa prinsip dasar yang perlu diperhatikan di dalam menyusun tes hasil belajar agar tes tersebut benar-benar dapat mengukur tujuan pembelajaran yang telah diajarkan, atau mengukur kemampuan dan atau keterampilan siswa yang diharapkan setelah siswa menyelesaikan suatu unit pengajaran tertentu.
 Menurut Purwanto (2004:23), prinsip-prinsip dasar tersebut adalah:
1.      Tes tersebut hendaknya dapat mengukur secara jelas hasil belajar (learning outcomes) yang telah ditetapkan sesuai dengan tujuan instruksional. Jika tujuan tidak jelas, maka penilaian terhadap hasil belajar pun tidak akan terarah sehingga akhirnya hasil penilaian tidak mencerminkan isi pengetahuan atau keterampilan siswa yang sebenarnya. Dengan kata lain, hasil penilaian menjadi tidak valid, yaitu tidak mengukur apa yang sebenarnya harus diukur. Oleh karena itu, untuk dapat menyusun tes yang baik, setiap guru harus dapat merumuskan kompetensi dasar dengan jelas, terutama indikatornya sehingga memudahkan baginya dalam menyusun soal-soal tes yang relevan untuk mengukur tingkat pencapaian kompetensi dasar yang telah dirumuskannya.
2.      Mengukur sampel yang representatif dari hasil belajar dan bahan pelajaran yang telah diajarkan. Tes yang kita susun haruslah mencakup soal-soal yang dianggap dapat mewakili seluruh performance hasil belajar siswa, sesuai dengan kompetensi dasar yang telah dirumuskan. Untuk dapat menyusun soalsoal tes yang benar-benar merupakan sampel yang representatif dalam mengukur hasil belajar siswa, guru hendaknya terlebih dahulu menyusun table spesifikasi atau kisi-kisi yang memuat standar kompetensi atan kompetensi dasar dari bahan pelajaran yang telah diajarkan dan penentuan jumlah serta jenis soal yang disesuaikan dengan kompetensi dasar dari setiap standar kompetensi yang bersangkutan.
3.      Mencakup bermacam-macam bentuk soal yang benar-benar cocok untuk mengukur hasil belajar yang diinginkan sesuai dengan tujuan. Kita telah mempelajari bahwa tujuan pengajaran itu bermacam-macam menurut jenis dan tingkat kesukarannya. Hasil belajar dari tiap-tiap topik bahan pelajaran tidak selalu sama. Setiap jenis alat evaluasi dan setiap macam bentuk soal hanya cocok untuk mengukur suatu jenis kemampuan tertentu. Oleh karena itu, penyusunan suatu tes harus disesuaikan dengan jenis kemampuan hasil belajar yang hendak diukur dengan tes tersebut.
4.      Didesain sesuai dengan kegunaannya untuk memperoleh hasil yang diinginkan. Dalam evaluasi pendidikan yang menyangkut hasil belajar, kita mengenal ada empat macam kegunaan tes, yaitu: (1) tes untuk penentuan penempatan siswa dalam suatu jenjang atau jenis program pendidikan tertentu (placement test); (2) tes untuk mencari umpan balik guna memperbaiki proses belajar mengajar bagi guru maupun siswa (test formatif); tes untuk mengukur atau menilai sampai di mana pencapaian siswa terhadap bahan pelajaran yang telah diajarkan, dan selanjutnya untuk menentukan kenaikan tingkat atau kelulusan siswa yang bersangkutan (test sumatif); dan (4) tes untuk mencari sebab-sebab kesulitan belajar siswa (test diagnostik).
5.      Dibuat seandal (reliable) mungkin sehingga mudah diinterpretasikan dengan baik. Suatu alat evaluasi dikatakan andal (reliable) jika alat tersebut dapat menghasilkan suatu gambaran (hasil pengukuran) yang benar-benar dapat dipercaya. Suatu tes dapat dikatakan andal (memiliki keandalan yang tinggi) jika tes itu dilakukan berulang-ulang terhadap objek yang sama, hasilnya akan tetap sama atau relatif sama.
6.      Digunakan untuk mencari informasi yang berguna untuk memperbaiki cara belajar siswa dan cara mengajar guru itu sendiri (evaluasi formatif).
C.    Analisis Butir Soal
Sebuah tes dapat dikatakan baik sebagai alat pengukur bila memenuhi persyaratan tes. Adapun persyaratan tes yang baik adalah valid, reliabel, mempunyai daya pembeda dan tingkat kesukaran soal yang baik.
D.    Analisis Validitas
Persyaratan tes yang paling utama adalah valid. Sebuah tes disebut valid apabila tes itu dapat tepat mengukur apa yang hendak diukur. Validitas yaitu ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut (Sudijono, 2001: 182).
Suatu alat penilaian dikatakan mempunyai validitas yang tinggi apabila alat penilaian tersebut mampu mengukur apa yang seharusnya diukur. Arikunto (2002: 67) menjelaskan adanya empat bentuk validitas yaitu: validitas isi, validitas konstruksi, validitas yang ada sekarang, dan validitas prediksi.
 Sebuah tes disebut memiliki validitas isi apabila tes tersebut mengukur kompetensi dasar tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan, sehingga dapat mengukur kompetensi yang diharapkan tercapai setelah materi disampaikan kepada siswa. Alat tes yang dianggap layak dan dapat dipertanggungjawabkan validitas isinya apabila dalam penyusunannya berdasarkan pada tabel kisi-kisi pembuatan soal.
Validitas isi hendaknya merujuk pada kesesuaian antara butir-butir soal dengan kompetensi dasar dan standar kompetensinya. Karena kompetensi dasar maupun standar kompetensinya tersebut tercantum pada tabel kisi-kisi sehingga tidak salah apabila dikatakan bahwa penyusunan butir-butir soal yang berdasarkan pada tabel kisi-kisi dianggap layak dan dapat dipertanggungjawabkan validitas isinya.  Secara sederhana dapat dikatakan bahwa tes yang disusun tidak boleh keluar dari standar kompetensi mata pelajaran yang ada di dalam kurikulum.
Sedangkan tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir (ingatan, pemahaman dan aplikasi) seperti yang disebutkan pada indikator dalam tabel kisi-kisi.
Validitas isi dan validitas konstruksi ini digolongkan ke dalam validitas logis atau validitas rasional (Arikunto, 2002: 66). Untuk mengetahui tingkat validitas rasional dapat dilakukan dengan mengadakan analisis rasional, yaitu analisis berdasarkan pikiran-pikiran yang logis bahan-bahan apa yang perlu dikemukakan dalam suatu tes. Jika penganalisaan secara rasional itu menunjukkan hasil yang membenarkan tentang telah tercerminnya indikator yang ingin dicapai, maka tes hasil belajar tersebut dapat dinyatakan sebagai tes hasil belajar yang valid dari segi susunannya atau telah memiliki validitas isi maupun validitas konstruksi. Pengujian validitas isi maupun validitas konstruksi dari suatu tes dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan (Sudijono, 2006: 167).
Sebutir item dapat dikatakan telah memiliki validitas yang tinggi atau dapat dikatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya, atau dengan bahasa statistiknya, ada korelasi positif yang signifikan antara skor item dengan skor totalnya. Skor total di sini berkedudukan sebagai variabel terikat (dependent variable), sedangkan skor item berkedudukan sebagai variabel bebasnya (independent variable).
Untuk sampai pada kesimpulan bahwa item-item yang ingin diketahui validitasnya, yaitu valid atau tidak, kita dapat menggunakan teknik korelasi sebagai teknik analisisnya, yaitu teknik korelasi point biserial. Sebutir item dapat dinyatakan valid, apabila skor item yang bersangkutan terbukti mempunyai korelasi positif yang signifikan dengan skor totalnya.
Validitas yang dimaksud di sini adalah validitas butir. Validitas butir adalah butir tes dapat menjalankan fungsi pengukurannya dengan baik. Hal ini dapat diketahui dari seberapa besar peran yang diberikan oleh butir soal tes tersebut dalam mencapai skor seluruh tes. Validitas butir dapat dihitung dengan menggunakan rumus korelasi point biserial. Korelasi ini untuk menguji validitas butir tes dengan skor benar 1 dan skor salah 0, atau data dikotomi asli melawan data interval. Sementara jika data dikotominya tidak asli tetapi artificial melawan data interval, rumus yang digunakan adalah korelasi biserial. Rumus dari korelasi point biserial adalah:
Keterangan:
rpbi     : Koefisien Korelasi point biserial
M p      : Rerata skor siswa yang menjawab benar
M t       : Rerata skor siswa total
p          : Proporsi skor siswa yang menjawab benar
q          : Proporsi skor siswa yang menjawab salah
SD t    : Standar deviasi total
E.     Analisis Reliabilitas
Syarat tes yang kedua adalah reliabel. Reliabel artinya dapat dipercaya atau dapat diandalkan. Suatu alat ukur yang baik adalah alat pengukur yang mempunyai reliabilitas yang tinggi, artinya setiap kali alat pengukur digunakan untuk mengukur hal yang sama, maka hasil pengukurannya tetap (Nasoetion, 1993:103).
Reliabilitas suatu tes pada hakikatnya menguji keajegan pertanyaan tes yang didalamnya berupa seperangkat butir soal apabila diberikan berulangkali pada objek yang sama. Suatu tes dikatakan reliabel apabila beberapa kali pengujian menunjukkan hasil yang relative sama (Arikunto, 2001: 86 ). Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Di sini ajeg atau tetap tidak selalu sama, tetapi mengikuti perubahan secara ajeg. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah yang menunjukkan tingginya reliabilitas suatu tes. Sehubungan dengan reliabilitas ini, menyatakan bahwa persyaratan bagi suatu tes, yaitu validitas dan reliabilitas ini penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliabel.
Menurut Arikunto (2001: 90), untuk melakukan analisis reliabilitas suatu tes dapat digunakan beberapa metode yaitu: metode bentuk parallel (equivalent), metode tes ulang (test-retest-method), dan metode belah dua (split-half-method). Rumus yang
digunakan untuk mencari reliabilitas dan banyak digunakan orang ada dua rumus yaitu rumus KR-20 dan rumus KR-21. Reliabilitas suatu tes dapat tinggi dapat pula rendah karena ada faktor-faktor yang mempengaruhi besarnya reliabilitas.
Faktor-faktor yang mempengaruhi besarnya reliabilitas adalah : luas tidaknya sampling yang diambil, perbedaan bakat dan kemampuan murid yang dites serta suasana dan kondisi testing. Jika jumlah soal ganjil maka tidak mungkin dengan belah dua tetapi harus dengan rumus yang lain, yaitu yaitu rumus KR-20 dan rumus KR-21.
Rumus KR-20 digunakan untuk menghitung reliabilitas speedy test, yaitu tes kecepatan. Sedangkan rumus KR-21 lebih tepat digunakan untuk power test yang memberi kesempatan kepada siswa untuk dapat menampilkan kemampuannya secara maksimal. Prosedur menghitung reliabilitas dilakukan dengan menghubungkan setiap butir dalam satu tes dengan butir-butir lainnya dalam tes itu sendiri secara keseluruhan.

F.     Analisis Tingkat Kesukaran
Adapun syarat lain yang tidak kalah pentingnya adalah soal harus memiliki tingkat kesukaran dan daya pembeda yang baik. Tingkat kesukaran adalah angka yang menunjukkan proporsi siswa yang menjawab betul suatu soal (Slameto, 2001: 218). Makin besar tingkat kesukaran berarti soal itu makin mudah demikian juga sebaliknya yaitu makin rendah tingkat kesukaran berarti soal itu makin sukar.
Untuk menghitung besarnya tingkat kesukaran digunakan rumus sebagai berikut:
Keterangan:
TK       = Tingkat Kesukaran
SA       = Jumlah skor yang dicapai kelompok atas
SB       =  Jumlah skor yang dicapai kelompok bawah
n          = Jumlah kelompok atas dan kelompok bawah
maks    = skor maksimal soal yang bersangkutan bila dijawab sempurna

Adapun klasifikasi indeks tingkat kesukaran butir soal (Arikunto, 2001: 210) adalah sebagai berikut:
0,00 - 0,29     = soal sukar
0,30 - 0,69     = soal sedang
0,70 – keatas = soal mudah


G.    Analisis Daya Pembeda
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi dengan testee yang berkemampuan rendah sedemikian rupa sehingga sebagian besar testee yang memiliki kemampuan yang tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang kemampuannya rendah untuk menjawab butir item tersebut sebagian besar tidak dapat menjawab item dengan betul (Anas Sudijono, 2001: 386).
Rumus yang digunakan untuk mencari indeks daya pembeda adalah:
keterangan:
DP       = Daya Pembeda
SA       = Jumlah skor yang dicapai kelompok atas
SB       =  Jumlah skor yang dicapai kelompok bawah
n          = Jumlah kelompok atas dan kelompok bawah
maks    = skor maksimal soal yang bersangkutan bila dijawab sempurna
½         = angka konstan

Klasifikasi daya pembeda adalah:
0,40- keatas     = baik
0,21-0,39         = kurang
0,20- kebawah = jelek

H.    Analisis Ketuntasan Belajar
Ketuntasan Belajar adalah hasil yang diperoleh dari kegiatan pembelajaran di sekolah yang bersifat kognitif dan biasanya ditentukan melalui pengukuran dan penilaian. Ketuntasan belajar adalah penguasaan pengetahuan atau  keterampilan yang dikembangkan oleh mata pelajaran lazimnya ditunjukkan dengan nilai tes.
Ketuntasan belajar siswa dalam pembelajaran dipengaruhi oleh peran dan strategi guru dalam pembelajaran. Seorang peserta didik dipandang tuntas belajar jika ia mampu menyelesaikan dan menguasai kompetensi atau mencapai tujuan pembelajaran minimal 65% dari seluruh tujuan pembelajaran. Sedangkan pembelajaran dianggap berhasil bila sekurang-kurangnya 85% dari jumlah peserta didik yang ada di kelas tersebut mampu menguasai tujuan pembelajaran minimal 65%.(Mulyasa, 2004: 99).
            Analisis ketuntasan belajar tujuannya yaitu :
1)      Untuk mengetahui sejuh mana setiap siswa menyerap materi yang diberikan guru berdasarkan satuan pelajaran atau rencana pembelajaran.
2)      Untuk mengetahui materi yang diserap secara baik dan materi mana yang belum
3)      Untuk mengetahui keberhasilan suatu program yang dituangkan dalam rencana pembelajaran.

I.       Teknik Mengolah dan Mengubah Skor Menjadi Nilai
Sebelum sampai pada pembicaraan tentang teknik pengolahan dan pengubahan skor mentah hasil tes belajar menjadi nilai standar, perlu dijelaskan terlebih dahulu tentang perbedaan antara skor dan nilai. Hal ini didasarkan atas pertimbangan bahwa kadang – kadang orang menganggap bahwa skor dan nilai sama, padahal pengertian seperti itu belum tentu benar.
Skor adalah hasil memberikan angka yang diperoleh dengan jalan menjumlahkan angka – angka bagi setiap butiran persolan oleh testee (siswa) telah dijawab dengan betul, dengan memperhitungkan bobot jawaban betulnya. Sedangkan nilai adalah angka atau huruf yang melambangkan : seberapa jauh atau sberapa besar kemampuan yang telah ditunjukkan oleh guru terhadap materi atau bahan yang telah diteskan, sesuai dengan tujuan intruksional khusus yang telah ditentukan. Nilai juga melambangkan penghargaaan yang yang diberikan oleh pendidik kepada peseta didik atas jawaban betul yang diberikan oleh pendidik dalam tes hasil belajar.
Dari uraian di atas jelaslah bahwa untuk sampai kepada nilai, maka skor – skor hasil tes yang pada hakikatnya masih merupakan skor – skor mentah itu perlu diolah terlebih dahulu sehingga dapat diobservasi menjadi skor yang sifatnya baku atau standar.
Ada dua hal yang perlu dipahami dalam mengubah skor mentah menjadi nilai skor standar ini :
1.      Bahwa dalam mengolah dan mengubah skor mentah menjadi nilai standar ada dua pendekatan, yaitu :
A.    Penilaian Acuan Patokan (PAP), yaitu mengolah atau mengubah skor mentah menjadi nilai standar dengan mengacu pada taraf penguasaan siswa terhadap soal yang diteskan.
B.     Penilaian Acuan Norma (PAN), yaitu mengubah dan mengolah skor menjadi nilai standar, dengan mendasarkan pada skor-skor kelompoknya, yaitu mean dan standar deviasinya.
2.      Bahwa dalam mengubah dan mengolah skor menjadi nilai standar itu dapat menggunakan skala, yaitu skala lima yang dikenal dengan nilai huruf A, B, C, D, dan E, sekala sembilan yang rentang nilainya bergerak dari 1 sampai 9, skala sebelas, angkanya bergerak dari 0 sampai 10, z scor dan T scor.

Tidak ada komentar:

Posting Komentar