1. Syarat-syarat
Evaluasi Program
Sebuah instrumen evaluasi hasil belajar hendaknya memenuhi syarat sebelum
di gunakan untuk mengevaluasi atau mengadakan penilaian agar terhindar dari
kesalahan dan hasil yang tidak valid (tidak sesuai kenyataan sebenarnya). Alat
evaluasi yang kurang baik dapat mengakibatkan hasil penilaian menjadi bias atau
tidak sesuainya hasil penilaian dengan kenyataan yang sebenarnya, seperti
contoh anak yang pintar dinilai tidak mampu atau sebaliknya.
Jika terjadi demikian perlu ditanyakan
apakah persyaratan instrumen yang digunakan menilai sudah sesuai dengan
kaidah-kaidah penyusunan instrumen.
Instrumen Evaluasi yang baik memiliki ciri-ciri dan harus memenuhi beberapa
kaidah antara lain :
* Validitas
* Reliabilitas
* Objectivitas
* Pratikabilitas
* Ekomonis
* Taraf Kesukaran
* Daya Pembeda
Validitas
Menurut Kamus Besar Bahasa Indonesia
bahwa Validitas diartikan sebagai sifat benar, menurut bukti yang ada, logika
berfikir, atau kekuatan hokum. Menurut Diknas bahwa validitas adalah kemampuan
suatu alat ukur untuk mengukur sasaran ukurnya. Sedangkan menurut Wiki pedia
Indonesia diterjemahkan , kesahihan, kebenaran yang diperkuat oleh bukti atau
data. Validitas berasal dari kata validity yang mempunyai arti sejauh mana
ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
Sisi lain dari pengertian validitas
adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya
mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran
yang cermat mengenai data tersebut. Dengan demikian kata valid sering diartikan
dengan tepat, benar, sahih, absah, sehingga kata valid dapat diartikan
ketepatan, kebenaran, kesahihan, atau keabsahan. Menurut Anas Sujiono apabila
kata valid dikaitkan dengan fungsi tes sebagai alat pengukur maka tes dikatakan
valid adalah apabila tes tersebut dengan secara tepat, secara benar, secara
sahih, atau secara absah dapat mengukur apa yang seharusnya diukur, dengan kata
lain tes dapat dikatakan telah memiliki Validitas apabila tes tersebut dengan
secara tepat, benar, sahih atau absah telah dapat mengungkap atau mengukur apa
yang seharus diungkap atau diukur lewat tes tersebut. Suatu skala atau
instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang
memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran.
Dalam kaitannya dengan tes dan
penilaian, Retno mengemukakan tiga pokok pengertian yang bisa digunakan sebagai
berikut :
a. Validitas berkenaan dengan hasil dari sutu alat tes atau alat evaluasi, dan
tidak menyangkut alat itu sendiri. Tes intelegensi sebagai alat untuk melakukan
tes kecerdasan hasilnya valid , tapi kalau digunakan untuk melakukan tes hasil
belajar tidak valid.
b. Validitas adalah persoalan yang menyangkut tingkat (derajat), sehingga
istilah yang digunakan adalah derajat validitas suatu tes maka suatu tes ada
yangh disebut validitasnya tinggi, sedang dan rendah.
c. Validitas selalu dibatasi pada pengkususannya dalam penggunaan dan tidak
pernah dalam arti kualitas yang umum. Suatu tes berhitung mungkin tinggi
validitasnya untuk mengukur keterampilan menjumlah angka, tetapi rendah
validitasnya untuk mengukur berfikir matematis dan sedang validitasnya untuk
meramal keberhasilan siswa dalam pelajaran matematik yang akan datang.
Validitas adalah
kesahihan pengukuran atau penilaian dalam penelitian. Dalam analisis isi, validitas dilakukan dengan berbagai cara atau metode
sebagai berikut.
1. Pengukuran produktivitas (productivity), yaitu derajat di mana suatu studi
menunjukkan indikator yang tepat yang berhubungan dengan variabel.
2. Predictive validity, yaitu derajat kemampuan pengukuran dengan peristiwa
yang akan datang.
3. Construct validity, yaitu derajat kesesuaian teori dan konsep yang
dipakai dengan alat pengukuran yang dipakai dalam penelitian tersebut.
Macam-macam Validitas
Menurut Suharsimi ada dua jenis
validitas yaitu validitas logis dan validitas empiris. Sementara Retno
validitas itu terbagi menjadi lima tipe yaitu validitas tampang (face
validity), validitas logis (logical validity), validitas vaktor (factorikal
validity), Validitas isi (conten validity), dan validitas empiris (empirical
validity). Sedangkan menurut Anas ternik pengujian validitas hasil belajar
secara garis besar dapat dibagi dua, yaitu pengujian validitas tes secara
rasional dan pengujian validitas tes secara empirik.
Pada dasarnya
para ahli pendidikan melihat pengujian validitas tes itu dapat dilihat dari:
1. Pengujian validitas tes secara rasional.
Istilah lain dari istilah validitas rasional
adalah validitas logika, validitas ideal atau validitas dassollen. Istilah
validitas logika (logical validity) mengandung kata logis berasal dari kata
logika yang berarti penalaran. Dengan makna demikian bahwa validitas logis
untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran, kondisi valid tersebut dipandang terpenuhi karena instrumen
bersangkutan sudah dirancang secara baik mengikuti teori dan ketentuan yang
ada. Dengan demikian validitas logis ini dikatakan benar apabila tes yang
dilakukan sesuai denga ketentuan, peraturan dan teori yang ada, sehingga suatu
tes itu dapat dikatakan valid dapat dilihat setelah instrumen soal tes tersebut
telah selesai dibuat.
2. Pengujian Validitas Tes secara Empiris
Istilah “Validitas empiris” memuat kata “empiris” yang artinya “pengalaman”
sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji
dari pengalaman. Yang dimaksud dengan validitas empiris adalah ketepatan mengukur
yang didasarkan pada hasil analisis yang bersifat empirik. Sedangkan menurut
Ebel bahwa Empirical Validity adalah validitas yang berkenaan dengan hubungan
antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas
dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
Faktor-faktor yang mempengaruhi Validitas
Menurut Retno ada beberapa hal yang mempengaruhi validitas alat pengukur
sebagai berikut :
1. Faktor di dalam tes itu sendiri
2. Faktor dalam respon siswa, ini terjadi jika : Siswa mengalami gangguan
emosional dalam menjawab tes, Siswa hanya cendrung menerka-nerka dalam menjawab
tes,
3. Faktor dalam mengadministrasi tes dan pembijian.
Sebuah Instrumen Evaluasi dikatakan
baik manakala memiliki validitas yang tinggi. Yang dimaksud Validitas disini
adalah kemampuan instrumen tersebut mengukur apa yang seharusnya diukur. Ada
tiga Aspek yang hendak dievaluasi dalam evaluasi hasil belajar yaitu Aspek
Kognitif, Psikomotor dan Afektif.Tinggi Rendahnya validitas instrumen dapat di
hitung dengan uji validitas dan di nyatakan dengan koefisien validitas.
Reliabilitas
Instrumen dikatakan memiliki
reliabilitas yang tinggi manakala instrumen tersebut dapta menghasilkan hasil
pengukuran yang ajeg. Keajegan/ketetapn disini tidak
diartikan selalu sama tetapi mengikuti perubahan secara ajeg. Jika keadaan
seseorang si upik berada lebih rendah dibandingkan orang lain misalnya si Badu,
maka jika dilakukan pengukuran ulang hasilnya si upik juga berada lebih rendah
terhadap si badu. Tinggi rendahnya reliabilitas ini
dapat di hitung dengan uji reliabilitias dan dinyatakan dengan koefisien
reliabilitas.
Objectivitas
Instrumen evaluasi hendaknya terhindar
dari pengaruh-pengaruh subyektifitas pribadi dari si evaluator dalam menetapkan
hasilnya. Dalam menekan pengaruh subyektifitas yang tidak bisa dihindari
hendaknya evaluasi dilakukan mengacu kepada pedoman tertama menyangkut masalah
kontinuitas dan komprehensif.
Evaluasi harus
dilakukan secara kontinu (terus-menerus). Dengan evaluasi yang berkali-kali
dilakukan maka evaluator akan memperoleh gambaran yang lebih jelas
tentang keadaan Audience yang dinilai. Evaluasi yang diadakan secara on
the spot dan hanya satu atau dua kali, tidak akan dapat memberikan hasil yang
obyektif tentang keadaan audience yang di evaluasi. Faktor kebetulan akan
sangat mengganggu hasilnya.
Praktikabilitas
Sebuah intrumen evaluasi dikatakan
memiliki praktikabilitas yang tinggi apabila bersifat praktis mudah
pengadministrasiannya dan memiliki ciri : Mudah dilaksanakan, tidak menuntut
peralatan yang banyak dan memberi kebebasan kepada audience mengerjakan
yang dianggap mudah terlebih dahulu. Mudah pemeriksaannya artinya dilengkapi
pedoman skoring, kunci jawaban. Dilengkapi petunjuk yang jelas sehingga dapat
di laksanakan oleh orang lain.
Ekonomis
Pelaksanaan evaluasi menggunakan
instrumen tersebut tidak membutuhkan biaya yang mahal tenaga yang banyak dan
waktu yang lama.
Taraf Kesukaran
Instrumen yang baik terdiri dari
butir-butir instrumen yang tidak terlalu mudah dan tidak terlalu sukar. Butir
soal yang terlalu mudah tidak mampu merangsang audience mempertinggi usaha
memecahkannya sebaliknya kalau terlalu sukar membuat audiece putus asa dan
tidak memiliki semangat untuk mencoba lagi karena diluar jangkauannya. Di dalam
isitlah evaluasi index kesukaran ini diberi simbul p yang dinyatakan dengan
“Proporsi”.
Daya Pembeda
Daya pembeda sebuah instrumen adalah
kemampuan instrumen tersebut membedakan antara audience yang pandai
(berkemampuan tinggi) dengan audience yang tidak pandai (berkemampuan rendah).
Indek daya pembeda ini disingkat dengan D dan dinyatakan dengan Index Diskriminasi.
(Ulianta, Artikel Pendidikan).
Sependapat dengan syarat-syarat di
atas, maka Sukardi (2008 : 8) mengemukakan bahwa, suatu evaluasi memenuhi
syarat-syarat sebelum diterapkan kepada siswa yang kemudian direfleksikan dalam
bentuk tingkah laku. Evaluasi yang baik, harus mempunyai syarat seperti
berikut: 1) valid, 2) andal, 3) objektif , 4) seimbang, 5) membedakan, 6)
norma, 7) fair, dan 8) praktis.
Sedangkan Wina Sanjaya (2008:
352-354), mengatakan bahwa syarat-syarat alat evaluasi yang baik harus:
a. Memberikan motivasi
Memberikan penilaian evaluasi diarahkan untuk meninkatkan motivasi belajar
bagi siswa melalui upaya pemahaman akan kekuatan dan kelemahan yang dimiliki
baik oleh guru maupun siswa. Siswa perlu memahami makna dari hasil penilaian.
b. Validitas
Penilaian diarahkan bukan semata-mata untuk melengkapi syarat administrasi
saja, akan tetapi diarahkan untuk memperoleh informasi tentang ketercapaian
kompetensi seperti yang terumuskanan dalam kurikulum. Oleh sebab itu, penilaian
tidak menyimpang dari kompetensi yang ingin dicapai. Dengan kata lain penilaian
harus menjamin validitas.
c. Adil
Setiap siswa memiliki kesempatan yang sama dalam proses pembelajaran
tanpa memandang perbedaan sosial-ekonomi, latar belakang budaya dan kemampuan.
Dalam penilaian, siswa disejajarkan untuk mendapatkan perlakuan yang
sama.
d. Terbuka
Alat penilaian yang baik adalah alat penilaian yang dipahami baik oleh
penilai maupun yang dinilai. Siswa perlu memahami jenis atau prosedur penilaian
yang akan dilakukan beserta kriteria penilaian. Keterbukaan ini bukan hanya
akan mendorong siswa untuk memperoleh hasil yang baik sehingga motovasi
belajara mereka akan bertambah juga, akan tetapi sekaligus mereka akan memahami
posisi mereka sendiri dalam pencapaian kompetensi.
e. Berkesinambungan
Penilaian tidak pernah mengenal waktu kapan penilaian seharusnya dilakukan.
Penilaian dilakukan secara terus-menerus dan berkesinambungan.
f. Bermakna
Penilaian tersusun dan terarah akan memberikan makna kepada semua pihak
khususnya siswa untuk mengetahui posisi mereka dalam memperoleh
kompetensi dan memahami kesulitan yang dihadapi dalam mencapai kompetensi. Dengan
demikian, hasil penilaian itu juga bermakna bagi guru juga termasuk bagi orang
tua dalam memberika bimbingan kepada siswa dalam upaya memperoleh kompetensi
sesuai dengan target kurikulu.
g. Menyeluruh
Kurikulum diarahkan untuk perkembangan siswa secara utuh, baik perkembangan
afektif, kognitif maupun psikomotorik. Oleh sebab itu, guru dalam melaksanakan
penilaian harus menggunakan ragam penilaian, misalnya tes, penilaian produk,
skala sikap, penampilan, dan sebagainya. Hal ini sangat penting, sebab hasil
penilaian harus memberikan informasi secara utuk tentang perkembangan setiap
aspek.
h. Edukatif
Penilaian kelas tidak semata-mata diarahkan untuk memperoleh gambaran
kemampuan siswa dalam pencapaian kompetensi melalui angka yang diperoleh, akan
tetapi hasil penilaian harus memeberikan umpan balik untuk memperbaiki proses
pembelajaran, baik yang dilakukan oleh guru maupun siswa, sehingga hasil
belajar lebih optimal. Dengan demikian, proses penilaian tidak semata-mata
tanggung jawab guru akan tetapi juga merupakan tanggung jawab siswa. Artinya
siswa harus ikut terlibat dalam proses penilaian, sehingga mereka meyadari,
bahwa penilaian adalah bagian dari proses pembelajara.
Sedangkan Daryanto (1997: 19-28) membagi syarat-syarat evaluasi menjadi 5
(lima) bagian, diantaranya:
1. Keterpaduan
Evaluasi merupakan komponen integral dalam program pengajaran
disamping tujuan serta metode. Tujuan inttruksional, materi dan metode,
serta evaluasi merupakan tiga keterpaduan yang tidak boleh dipisahkan.
2. Koherensi
Dengan prinsip koherensi diharapkan evaluasi harus berkualitas dengan
materi pengajran yang sudah disajikan dan sesuai dengan ranah kemampuan yang
hendak diukur.
3. Pedagogis
Evaluasi perlu diterapkan sebagai upaya perbaikan sikap dan tingkah laku
ditinjau dari segi pedagogis. Evaluasi dan hasilnya hendaknya dapat dipakai
sebagai alat motivasi untuk siswa dalam kegiatan belajarnya.
4. Akuntabilitas
Sejau mana keberhasilan program pengajaran perlu disampaikan kepada
pihak-pihak yang berkepentingan dengan pendidikan sebagai laporan
pertanggungjawaban (accountability).
Prinsip-Prinsip Evaluasi Prgram
Untuk memperoleh hasil evaluasi yang lebih baik, maka
kegiatan evaluasi harus bertitik tolak dari prinsip-prinsip umum sebagai
berikut.
a. Kontinuitas
Evaluasi tidak boleh dilakukan
secara insidental karena pemberian sistem sendiriadalah suatu proses yang
kontiniu. Oleh sebab itu, evaluasi harus dilakukan secara kontiniu.Hasil
evaluasi yang diperoleh pada suatu waktu harus senantiasa dihubungkan dengan
hasil-hasil pada waktu sebelumnya, sehingga dapat diperoleh gambaran yang jelas
dan berartitentang perkembangan peserta didik. Perkembangan belajar peserta
didik tidak dapat dilihatdari dimensi produk saja, tetapi juga dimensi proses
bahkan dari dimensi input.
b. Komprehensif
Dalam melakukan evaluasi terhadap
suatu objek, guru harus mengambil seluruh objek itu sebagai bahan
evaluasi. Misalnya, jika objek evaluasi itu adalah peserta didik, makaseluruh
aspek kepribadian peserta didik itu harus dievaluasi, baik yang menyangkut
kognitif,afektif maupun psikomotor. Begitu juga dengan objek-objek evaluasi yang
lain.
c. Adil dan Objektif
Dalam melaksanakan evaluasi, guru
harus berlaku adil tanpa pilih kasih. Kata “adil”dan “objektif” memang mudah
diucapkan, tetapi sulit dilaksanakan. Meskipun demikian, kewajiban manusia
adalah harus berikhtiar. Semua peserta didik harus diberlakukan sama tanpa
“pandang bulu”. Guru juga hendaknya bertindak secara objektif, apa adanya
sesuaidengan kemampuan peserta didik. Oleh sebab itu, sikap like
dan dislike, perasaan, keinginandan prasangka yang bersifat negatif harus dijauhkan.
Evaluasi harus didasarkan ataskenyataan (data dan fakta) yang sebenarnya, bukan
hasil manipulasi atau rekayasa.
d. Kooperatif
Dalam kegiatan evaluasi guru
hendaknya bekerja sama dengan semua pihak, sepertiorang tua peserta didik,
sesama guru, kepala sekolah, termasuk dengan peserta didik itusendiri. Hal ini
dimaksudkan agar semua pihak merasa puas dengan hasil evaluasi, dan pihak-pihak
tersebut merasa dihargai.
e. Praktis
Praktis mengandung arti mudah
digunakan, baik oleh guru itu sendiri yang menyusunalat evaluasi maupun orang
lain yang akan menggunakan alat tersebut. Untuk itu harusdiperhatikan bahasa
dan petunjuk mengerjakan soal.
2. Aspek
dan dimensi evaluasi program
Empat aspek
Model Evaluasi CIPP (context, input, process and output) membantu pengambil keputusan
untuk menjawab empat pertanyaan dasar mengenai;
1. Apa
yang harus dilakukan (What should we do?); mengumpulkan dan
menganalisa needs assessment data untuk menentukan tujuan, prioritas
dan sasaran.
2. Bagaimana
kita melaksanakannya (How should we do it?); sumber daya dan langkah-langkah
yang diperlukan untuk mencapai sasaran dan tujuan dan mungkin meliputi
identifikasi program eksternal dan material dalam mengumpulkan informasi
3. Apakah
dikerjakan sesuai rencana (Are we doing it as planned?); Ini menyediakan
pengambil-keputusan informasi tentang seberapa baik program diterapkan.
Dengan secara terus-menerus monitoring program, pengambil-keputusan mempelajari
seberapa baik pelaksanaan telah sesuai petunjuk dan rencana, konflik yang
timbul, dukungan staff dan moral, kekuatan dan kelemahan material, dan
permasalahan penganggaran.
4. Apakah
berhasil (Did it work?); Dengan mengukur outcome dan membandingkannya pada
hasil yang diharapkan, pengambil-keputusan menjadi lebih mampu memutuskan jika
program harus dilanjutkan, dimodifikasi, atau dihentikan sama sekali.
Penjelasan
atas masing-masing aspek dalam model evaluasi CIPP adalah sebagai berikut:
1) Evaluasi
Konteks
Konteks
disini diartikan yaitu situasi atau latar belakang yang mempengaruhi
jenis-jenis tujuan dan strategi pendidikan yang akan dikembangkan dalam program
yang bersangkutan, seperti : kebijakan departemen atau unit kerja yang
bersangkutan, sasaran yang ingin dicapai oleh unit kerja dalam kurun waktu
tertentu, masalah ketenagaan yang dihadapi dalam unit kerja yang bersangkutan,
dan sebagainya.
Evaluasi
Konteks menilai kebutuhan, permasalahan, aset, dan peluang untuk membantu
pembuat keputusan menetapkan tujuan dan prioritas serta
membantu stakeholder menilai tujuan, prioritas, dan hasil.
Menurut
Sarah McCann dalam Arikunto (2004) evaluasi konteks meliputi penggambaran latar
belakang program yang dievaluasi, memberikan tujuan program dan analisis
kebutuhan dari suatu sistem, menentukan sasaran program, dan menentukan
sejauhmana tawaran ini cukup responsif terhadap kebutuhan yang sudah
diidentifikasi. Penilaian konteks dilakukan untuk menjawab pertanyaan “Apakah
tujuan yang ingin dicapai, yang telah dirumuskan dalam program benar-benar
dibutuhkan oleh masyarakat?”
Konteks
evaluasi ini membantu merencanakan keputusan, menentukan kebutuhan yang akan
dicapai oleh program, dan merumuskan tujuan program.
Evaluasi
konteks adalah upaya untuk menggambarkan dan merinci lingkungan, kebutuhan yang
tidak terpenuhi, populasi dan sampel yang dilayani, dan tujuan proyek.
2) Evaluasi
Masukan (Input)
Tahap kedua
dari model CIPP adalah evaluasi masukan. Tujuan utama evaluasi ini adalah untuk
mengaitkan tujuan, konteks, input, proses dengan hasil program. Evaluasi ini
juga untuk menentukan kesesuaian lingkungan dalam membantu pencapaian tujuan
dan objectif program. Disamping itu, evaluasi ini dibuat untuk memperbaiki
program bukan untuk membuktikan suatu kebenaran (The purpose of evaluation is
not to prove but to Improve, Stufflebeam, 1997 dalam Arikunto 2004).
Model
evaluasi CIPP digunakan untuk mengukur, menterjemahkan dan mengesahkan
perjalanan suatu program, dimana kekuatan dan kelemahan program dikenali.
Kekuatan dan kelemahan program ini meliputi institusi, program itu sendiri,
sasaran populasi/ individu.Model evaluasi ini meliputi kegiatan pendeskripsian
masukan dan sumberdaya program, perkiraan untung rugi, dan melihat alternatif
prosedur dan strategi apa yang perlu disarankan dan dipertimbangkan (Guba &
Stufflebeam, 1970). Singkatnya, input merupakan model yang digunakan
untuk menentukan bagaimana cara agar penggunaan sumberdaya yang ada bisa
mencapai tujuan serta secara esensial memberikan informasi tentang apakah perlu
mencari bantuan dari pihak lain atau tidak. Aspek input juga membantu
menentukan prosedur dan desain untuk mengimplementasikan program
Evaluasi ini
menolong mengatur keputusan, menentukan sumber-sumber yang ada, alternatif apa
yang diambil, apa rencana dan strategi untuk mencapai kebutuhan, bagaimana
prosedur kerja untuk mencapainya.
3) Evaluasi
Proses
Evaluasi
proses dalam model CIPP diarahkan pada seberapa jauh kegiatan yang dilaksanakan
sudah terlaksana sesuai dengan rencana. Evaluasi proses dalam model CIPP
menunjuk pada "apa" (what) kegiatan yang dilakukan dalam program,
"siapa" (who) orang yang ditunjuk sebagai penanggung jawab program,
"kapan" (when) kegiatan akan selesai. Dalam model CIPP, evaluasi
proses diarahkan pada seberapa jauh kegiatan yang dilaksanakan di dalam program
sudah terlaksana sesuai dengan rencana. Oleh Stufflebeam(dalam Arikunto, 2004),
mengusulkan pertanyaan untuk proses antara lain sebagai berikut:
a. Apakah
pelaksanaan program sesuai dengan jadwal.
b. Apakah
yang terlibat dalam pelaksanaan program akan sanggup menangani kegiatan selama
program berlangsung ?
c. Apakah
sarana dan prasarana yang disediakan dimanfaatkan secara maksimal?
d. Hambatan-hambatan apa
saja yang dijumpai selama pelaksanaan program?
4) Evaluasi
pada produk atau hasil
Evaluasi
produk diarahkan pada hal-hal yang menunjukkan perubahan yang terjadi pada
masukan mentah. Pertanyaan-pertanyaan yang bisa diajukan antara lain:
a. Apakah
tujuan-tujuan yang ditetapkan sudah tercapai?
b. Apakah
kebutuhan peserta didik sudah dapat dipenuhi selama proses belajar mengajar?
3. STANDAR
UNTUK MENILAI PROGRAM
Standar
merupakan aspek penting dari setiap praktek evaluasi. Standar membantu
memastikan bahwa evaluator dan klien mereka berkomunikasi secara efektif dan
mencapai pemahaman, yang jelas saling mengenal kriteria yang harus dipenuhi
oleh evaluasi. Standar tersebut diperlukan untuk meniadakan kemungkinan bahwa
salah satu stakeholder atau evaluator melakukan kecurangan, mungkin membelokkan
hasil evaluasi yang sesuai dengan diri mereka sendiri. Tanpa standar yang
mendefinisikan layanan evaluatif, kredibilitas prosedur evaluasi, hasil, atau
pelaporan yang tersisa akan diragukan. Untuk lebih berwibawa dan kredibel,
standar evaluasi harus mencerminkan konsensus umum oleh tokoh-tokoh terkemuka
di organisasi profesi yang bersangkutan
Evaluator
telah membentuk prinsip-prinsip standar yang digunakan untuk membimbing dan
menilai pekerjaan mereka, Selama dua dekade terakhir, profesionalisme evaluasi
telah cukup diperkuat oleh pengembangan dan penggunaan standar evaluasi. Selama
ini, standar profesional, diarahkan pada praktek melalui prinsip-prinsip yang
disepakati, telah menjadi bagian integral dari desakan masyarakat luas pada
kriteria dan langkah-langkah untuk menjamin kualitas dan akuntabilitas
evaluasi.
Ada
beberapa standar yang digunakan Standar Evaluasi Program yang
dikembangkan oleh Badan Komite Bersama. Standar Evaluasi pendidikan dan
diakreditasi oleh Institut Standar Nasional Amerika; Panduan Prinsip-prinsip
bagi Evaluator yang dikembangkan dan secara resmi disahkan oleh Asosiasi
Evaluasi Amerika dan Komite Etik, Standar Audit Pemerintah yang dikembangkan
oleh Kantor Akuntabilitas Pemerintah AS dan diperlukan dalam Audit
Program Pemerintah AS.
Komite
Bersama (1994) mendefenisikan standar evaluasi sebagai “Prinsip yang disepakati
bersama oleh orang yang terlibat dalam profesi evaluasi, dalam rangka
meningkatkan kualitas dan keadilan evaluasi”. Satuan Tugas AEA mencatat bahwa
prinsip evaluasi disediakan oleh evaluator dengan panduan yang bersifat umum,
konseptual bukan operasional. Kantor Akuntabilitas pemerintah menggambarkan
standar audit sebagai pernyataan pertanggung jawaban dari seorang auditor. Pada
dasarnya, ketiga dokumen membuat prinsip umum, yang merupakan hal yang penting.
Untuk membantu komunikasi, akan dibahas tentang standar evaluasi berdasarkan
Standar Evaluasi Program, Pengembangan Prinsip Evaluasi AEA, dan Standar Audit
Pemerintah. Ketiga otoritas dokumen memberikan arahan untuk membimbing
dan mengarahkan studi program evaluasi.
A. Kebutuhan
akan Standar Evaluasi
Setiap
evaluator profesional harus tahu, mengerti, dan setia menerapkan standar yang
sesuai praktek profesi evaluasi. Standar dan Kode ditetapkan dan diterapkan
untuk kepentingan menjamin dan meningkatkan kualitas dan melindungi masyarakat
dari tindakan buruk, berbahaya, penipuan jasa evaluasi, atau prilaku boros.
Standar evaluasi program memiliki fungsi yang spesifik:
1)
Memberikan
prinsip-prinsip umum untuk mengatasi berbagai masalah praktis dalam pekerjaan
evaluasi
2)
Membantu memastikan
bahwa evaluator akan menggunakan praktik terbaik bidang evaluasi yang tersedia
3)
Memberikan arah untuk
melakukan evaluasi perencanaan yang efisien dan termasuk pertanyaan evaluasi
yang bersangkutan.
4)
Menyediakan konten
utama untuk pelatihan dan pembimbingan evaluator dan peserta lain dalam proses
evaluasi.
5)
Kehadiran evaluator dan
konstituen mereka dilayani dengan bahasa yang sama untuk mempermudah komunikasi
dan kolaborasi
6)
Membantu arsip evaluator
dan memelihara kredibilitas di antara profesi lain
7)
Mendapatkan dan
mempertahankan kredibilitas terhadap badan pengawasan publik dan klien
8)
Mendapatkan dan
memelihara kepercayaan publik di bidang evaluasi
9)
Melindungi konsumen dan
masyarakat dari praktek-praktek berbahaya atau merusak
10)
Menyediakan kriteria
objektif untuk menilai dan memperkuat layanan evaluasi
11)
Memberikan dasar untuk
akuntabilitas oleh evaluator
12)
Memberikan dasar untuk
mengadili klaim malpraktek dan sengketa lainnya
13)
Menyediakan kerangka
kerja konseptual dan definisi bekerja untuk membantu panduan penelitian dan
pengembangan evaluasi.
Berdasarkan
fungsi ini, kepatuhan terhadap standar profesional untuk evaluasi adalah di
jantung dari profesionalisme dan keselarasan, guna layanan evaluasi. Kami percaya
bahwa pernyataan standar untuk evaluasi dapat melayani fungsi di bidang
evaluasi.
Beberapa
standar disajikan secara sistematis dikembangkan, memiliki kredibilitas yang
kuat, dan secara periodik ditinjau dan diperbarui. Tiga set standard yang
berbeda tetapi juga saling melengkapi. Belajar dan mengembangkan fasilitas
untuk menerapkan tiga set yang berbeda dari standar selektif akan meningkatkan
profesionalisme seseorang dan fleksibilitas dalam melakukan evaluasi. Evaluator
yang dilengkapi dengan set laporan alternatif standar dibantu dalam melakukan
evaluasi berbasis standar dalam berbagai disiplin ilmu dan wilayah layanan.
Bahkan kemudian sering menguntungkan untuk mengarahkan bimbingan dari dua atau
bahkan semua tiga set standar.
B. Latar
Belakang Standar Evaluasi Program
Secara
historis, evaluator program yang sudah diperlukan tentang standar profesional
yang eksplisit untuk evaluasi program, baru berkembang hanya selama l980 dan
1990-an. Agen federal telah didanai ribuan oleh Presiden Lyndon Jhonson untuk
mengevaluasi program sebagai bagian perang melawan kemiskinan dan umumnya
mereka menemukan pembiayaan mahal dalam kualitas buruk. Upaya untuk
mereformasi gerakan program evaluasi termasuk standar otoritatif dalam rangka
menetapkan prinsip-prinsip untuk menilai dan memperkuat rencana evaluasi dan
laporan.
Dengan
evolusi evaluasi sebagai profesi menjadi kenyataan hanya selama kuartal
terakhir abad kedua puluh, berkembang kode perilaku di antara praktisi yang
dapat diterima evaluator. Komite Bersama tentang Standar Evaluasi Pendidikan
didirikan pada tahun 1975. Selama bertahun-tahun, ini komite tetap terus
disponsori oleh 12 hingga 15 tokoh masyarakat profesional dengan keanggotaan
keseluruhan berjumlah hampir 3 juta. Pembiayaan Komite dilakukan untuk melakukan
pengembangan berkelanjutan, review, dan revisi Standar untuk evaluasi
pendidikan. Komite ini mengeluarkan Standar Evaluasi Pendidikan Program,
Proyek, dan Materi pada tahun 1981 dan versi terbaru pada tahun 1994, Standar
Program Evaluasi. Komite Bersama juga menerbitkan standar untuk mengevaluasi
tenaga kependidikan pada tahun 1988, dan pada tahun 2003 ini mengeluarkan
seperangkat standar untuk evaluasi siswa. Komite Bersama diakreditasi oleh
American National Standards Institute sebagai satu-satunya badan yang diakui
untuk menetapkan standar untuk evaluasi pendidikan di Amerika Serikat.
Pada
waktu yang hampir sama dengan standar Komite Bersama diterbitkan, Evaluasi
Penelitian Sosial (ERS) menghasilkan perangkat kedua. ERS, didirikan pada tahun
1976, berfokus pada profesi evaluasi program seperti yang dilakukan di berbagai
disiplin ilmu, program pemerintah, dan area layanan. Hal ini diterbitkan
serangkaian standar berlabel Standar Evaluasi Penelitian Sosial untuk Evaluasi
Program (Komite Standard ERS, 1982). Ada lima puluh lima hal secara singkat,
pernyataan yang memperingatkan dibagi dalam kategori berikut: Perumusan dan
Negosiasi, Struktur dan Desain, Pendataan dan Penyusunan, Analisis Data dan
interpretasi, Komunikasi dan Pengungkapan, dan penggunaan Hasil. Pada tahun
1986, ERS digabung dengan Jaringan Evaluasi (ENET) ke Badan Asosiasi Evaluasi
America (AEA), yang memiliki keanggotaan hampir tiga ribu. AEA kemudian
digabung dengan Standar ERS menghasilkan Prinsip-Prinsip Panduan bagi Evaluator
Program (Shadishi, Newman, Scheirer, & Wye, 1995). Pada bulan Juli 2004,
keanggotaan AEA meratifikasi revise edisi dari Prinsip-Prinsip Panduan bagi
evaluator program.
Kantor
Akuntansi Umum AS eksplisit termasuk evaluasi program tahun 1994 dan 2003 nya
revisi Standar Audit Pemerintah. Pemerintah Federal AS dalam melawan
Kemiskinan, yang dimulai pada 1965, menelurkan banyak program federal yang
mahal, yang membutuhkan dana besar untuk audit program keuangan. Pada tahun
1972, Kantor Akuntan Umum mulai mengeluarkan Standar Audit Pemerintahan. Edisi
awal dan revisi awal dari standar ditangani hampir secara eksklusif dengan
aspek keuangan program federal. Tahun 2003 edisi meliputi audit program dan
evaluasi sebagai salah satu fokus dari standar umum dan menyajikan bab-bab yang
berisi standar pekerjaan lapangan dan pelaporan untuk audit kinerja.
Terutama
yang patut dicatat dalam edisi 2003 adalah bagian baru pada kemandirian, yang
secara bersamaan menyediakan auditor dari kedua audit dan jasa konsultasi
kepada entitas yang sama. Pergaulan seperti jasa dipandang sebagai konflik
kepentingan tidak dapat diterima. Ini dapat menyebabkan auditor untuk
mengevaluasi pekerjaan mereka sendiri dan dengan demikian kehilangan
Kemandirian dan kredibilitas, mungkin mengalah pada tekanan terlarang laporan
distors. Ini telah dibuat secara nyata jelas di sektor swasta.
C. Komite
Bersama Standar Evaluasi Program
Tujuh
belas anggota tetap Komite Bersama Standar Evaluasi Pendidikan diangkat oleh
dua belas organisasi profesional. Organisasi dan anggota yang ditunjuk mereka
mewakili berbagai spesialisasi: akredatasi sekolah, konseling dan bimbingan,
kurikulum, administrasi pendidikan, pendidikan tinggi, pengukuran pendidikan,
penelitian pendidikan, tata kelola pendidikan, evaluasi program, psikologi,
statistik, dan pengajaran. Suatu persyaratan mendasar dari komite adalah bahwa
hal itu termasuk tentang jumlah yang sama anggota yang mewakili perspektif
klien dan evaluator. Selama bertahun-tahun, jumlah organisasi Komite Bersama
mensponsori telah sedikit meningkat.
Setiap
edisi Standar Evaluasi Program telah diperinci dari tiga puluh standar. Setiap
standar berisi pernyataan standar, penjelasan tentang kebutuhannya, alasan,
pedoman untuk melaksanakannya, kesalahan umum yang harus diantisipasi dan
dihindari, dan kasus ilustratif. Akhir 1994 versi Pendidikan dan pelatihan
dalam pengaturan seperti hukum, bisnis, pemerintah, kesehatan, militer,
keperawatan, pengembangan profesional, sekolah dasar dan menengah, lembaga
pelayanan sosial, dan perguruan tinggi dan universitas.
Tiga
puluh standar dikelompokkan sesuai dengan empat atribut penting dari evaluasi:
kegunaan, kelayakan, kepatutan dan akurasi. Komite Bersama menyarankan baik
evaluator dan klien untuk menerapkan tiga puluh standar sehingga evaluasi
mereka memuaskan semua atribut penting dari evaluasi empat suara. Empat konsep
mendasar dalam Standar Evaluasi Program adalah utilitas, kelayakan, kepatutan,
dan akurasi.
UTULITAS
Suatu
evaluasi harus berguna. Ini harus ditujukan kepada orang-orang dan kelompok
yang terlibat bertanggung jawab untuk melaksanakan program yang dievaluasi.
Para evaluator harus memastikan kebutuhan informasi para pengguna dan
melaporkan kepada mereka umpan balik evaluatif yang relevan secara jelas,
ringkas, dan tepat waktu. Ini akan membantu mereka mengidentifikasi dan
mengurus masalah program dan menyadari kekuatannya. Ini yang paling penting
harus menjawab pertanyaan pengguna juga mendapatkan berbagai informasi yang
dibutuhkan untuk menilai prestasi dan kelayakan program. Evaluasi seharusnya
tidak hanya melaporkan umpan balik tentang kekuatan dan kelemahan, tetapi juga
harus membantu pengguna dalam mempelajari dan menerapkan temuan. Standar
utilitas mencerminkan konsensus umum ditemukan dalam literatur evaluasi bahwa
evaluasi program secara efektif harus membahas kebutuhan informasi dari klien.
Untuk itu, harus menginformasikan proses perbaikan program. Jika tidak ada
prospek bahwa temuan dari evaluasi dimaksud akan digunakan, evaluasi tidak
boleh dilakukan.
KELAYAKAN
Suatu
evaluasi harus layak. Evaluasi menggunakan prosedur evaluasi tepat dan
beroperasi di lingkungan program. harus menghindari hal yang mengganggu atau
merusak dalam program ini. Kita harus mengontrol sebanyak mungkin kekuatan
politik yang mungkin menghambat atau merusak evaluasi. Dan itu harus dilakukan
secara efisien dan efektif mungkin. Standar menekankan bahwa prosedur evaluasi
harus bisa diterapkan di dunia nyata, tidak hanya di laboratorium
eksperimental. Secara keseluruhan, standar kelayakan memerlukan evaluasi harus
realistis, bijaksana, diplomatik, layak politik, hemat waktu, dan hemat biaya.
Eksperimen sering bertentangan dan tidak layak dalam pengaturan lapangan, dan
dalam kasus tersebut, evaluator harus lebih realistis, naturalistik, dan studi
multimetode.
KEPATUTAN
Suatu
evaluasi harus memenuhi kondisi kepatutan. Harus didasarkan pada kejelasan, dan
perjanjian tertulis dimana mendefinisikan kewajiban evaluator dan klien untuk
mendukung pelaksanakan evaluasi. Evaluasi harus melindungi hak semua pihak yang
terlibat dan martabat. Harus jujur dan tidak terdistorsi dengan cara apapun.
Laporan harus dibebaskan sesuai dengan perjanjian dan dengan kebebasan yang
berlaku undang-undang informasi. Selain itu, laporan harus menyampaikan secara
seimbang kelemahan dan kekuatannya. Standar merefleksikan fakta bahwa evaluasi
dapat mempengaruhi banyak orang, baik negatif maupun secara positif. Standar
kepatutan adalah desain untuk melindungi hak-hak semua pihak dalam evaluasi.
Secara umum, standar kepatutan mengharuskan evaluasi dilakukan secara sah,
etis, dan dengan memperhatikan kesejahteraan mereka yang terlibat dalam
evaluasi serta mereka yang terkena dampak hasil.
AKURASI
Suatu
evaluasi harus akurat. Ini jelas harus menjelaskan program seperti yang
direncanakan dan dengan benar-benar dieksekusi. Kita harus menjelaskan latar
belakang program dan pengaturan. Harus melaporkan temuan yang valid dan
reliabel. Ini harus mengidentifikasi dan membuktikan kelayakan sumber informasi
evaluasi, metode pengukuran dan perangkat, prosedur analitis, dan ketentuan
untuk pengendalian bias dan metaevaluation. Ini harus menyajikan kekuatan,
kelemahan, dan keterbatasan rencana evaluasi, prosedur, informasi, dan
kesimpulan. Ini harus menggambarkan dan menilai sejauh mana evaluasi memberikan
penilaian yang independen berisi sebagai kaitan untuk penilaian diri yang
mungkin bias. Secara umum, kelompok akhir dari standar memerlukan evaluator
untuk memperoleh informasi teknis suara, menganalisis dengan benar, melaporkan
kesimpulan dibenarkan, catat setiap peringatan yang bersangkutan, dan
mendapatkan atau melakukan metaevaluation. Nilai keseluruhan evaluasi terhadap
dua belas standard akurasi adalah suatu indeks validitas keseluruhan evaluasi
ini.
IKHTISAR
STANDAR EVALUASI PROGRAM.
KEGUNAAN
Standar utilitas dimaksudkan untuk memastikan bahwa evaluasi akan melayani kebutuhan pengguna informasi.
Standar utilitas dimaksudkan untuk memastikan bahwa evaluasi akan melayani kebutuhan pengguna informasi.
1.
U1 Identifikasi Stokeholder. Orang yang terlibat dalam atau dipengaruhi oleh
evaluasi, sehingga kebutuhan mereka dapat diatasi.
2.
U2 Kredibilitas Evaluator. Orang yang melaksanakan evaluasi harus baik, dapat
dipercaya dan kompeten untuk melakukan evaluasi, sehingga hasil evaluasi
mencapai maksimum pada tingkat kredibilitas dan penerimaannya.
3.
U3 Informasi Lingkup dan Seleksi. Informasi yang dikumpulkan harus dipilih
secara luas untuk menjawab pertanyaan yang bersangkutan mengenai program dan
responsif terhadap kebutuhan dan kepentingan klien dan pemangku kepentingan
tertentu lainnya.
4.
U4 Identifikasi Nilai. Perspektif, prosedur, dan pemikiran yang digunakan untuk
menafsirkan temuan harus hati-hati dijelaskan, sehingga menjadi dasar untuk
penilaian yang jelas.
5.
U5 Kejelasan Laporan. Laporan evaluasi harus secara jelas menggambarkan program
yang sedang dievaluasi, termasuk konteks dan tujuan, prosedur, dan temuan
evaluasi, sehingga informasi penting yang disediakan, dan mudah dipahami.
6.
U6 Ketepatan waktu dan Diseminasi Laporan, temuan sementara yang signifikan dan
laporan evaluasi harus disebarluaskan kepada pengguna yang dimaksudkan,
sehingga mereka dapat menggunakan secara tepat waktu.
7.
U7 Evaluasi Dampak. Evaluasi harus direncanakan, dilaksanakan, dan dilaporkan
dengan cara yang mendorong tindak lanjut oleh para pemangku kepentingan,
sehingga kemungkinan bahwa evaluasi akan digunakan meningkat.
KELAYAKAN
Standar
kelayakan dimaksudkan untuk memastikan bahwa evaluasi akan menjadi realistis,
bijaksana, diplomatik, dan hemat.
·
Fl Prosedur Praktis. Prosedur evaluasi harus praktis, untuk menjaga
gangguan seminimal mungkin untuk memperoleh informasi yang diperlukan,
·
F2 Viabilitas Politik. Evaluasi harus direncanakan dan dilakukan dengan
mengantisipasi posisi yang berbeda dari berbagai kepentingan kelompok, sehingga
kerjasama mereka dapat diperoleh dan agar ada upaya yang membatasi salah satu
kelompok untuk operasi evaluasi atau bias atau penyalahgunaan hasilnya dapat
dihindari atau menetralisir.
·
F3 Efektivitas Biaya. Evaluasi harus efisien dan menghasilkan informasi nilai
yang cukup, sehingga sumber daya yang dikeluarkan dapat dibenarkan.
KEPATUTAN
Standar
kepatutan dimaksudkan untuk memastikan bahwa evaluasi akan dilakukan secara
hukum, etis, dan dengan memperhatikan kesejahteraan mereka yang terlibat dalam
evaluasi, serta dipengaruhi oleh hasil-hasilnya.
·
P1 Orientasi Layanan. Evaluasi harus dirancang untuk membantu organisasi dan
efektif melayani kebutuhan berbagai peserta yang ditargetkan.
·
P2 Kewajiban formal. Kewajiban para pihak formal untuk evaluasi (apa yang harus
dilakukan, bagaimana, oleh siapa, kapan) harus disetujui secara tertulis,
sehingga pihak yang berwajib mematuhi semua kondisi dari perjanjian resmi atau
negosiasi ulang itu.
·
P3 Hak Asasi Manusia. Evaluasi harus dirancang dan dilaksanakan untuk
menghormati dan melindungi hak dan kesejahteraan manusia.
·
P4 Interaksi Manusia. Evaluator harus menghormati harkat dan martabat manusia
dalam interaksi mereka dengan orang lain yang terkait dengan evaluasi, sehingga
peserta tidak merasa terancam atau dirugikan.
·
P5 Penilaian Lengkap dan Adil. Evaluasi harus lengkap dan adil dalam
pemeriksaan dan pencatatan kekuatan dan kelemahan program yang dievaluasi,
sehingga kekuatan dapat dibangun dan masalah dapat ditangani.
·
P6 Pengungkapan Temuan. Para pihak formal untuk evaluasi harus memastikan bahwa
temuan evaluasi bersama dibuat agar dapat diakses oleh orang yang terkena
dampak evaluasi dan lain-lain dengan hak legal menyatakan menerima hasilnya.
·
P7 Benturan Kepentingan. Konflik kepentingan harus ditangani secara terbuka dan
jujur, sehingga tidak mengorbankan proses evaluasi dan hasil.
·
P8 Tanggung Jawab Fiskal. Alokasi evaluator dan pengeluaran sumber daya harus
mencerminkan prosedur yang akuntabilitas dan sebaliknya lebih bijaksana dan
etis bertanggung jawab, sehingga pengeluaran dicatat dan tepat.
KETEPATAN
Standar
akurasi dimaksudkan untuk memastikan bahwa evaluasi akan mengungkapkan dan
menyampaikan informasi teknis yang memadai tentang fitur yang menentukan nilai
atau manfaat dari program yang dievaluasi.
•
Al Dokumentasi Program. Program yang dievaluasi harus dijelaskan dan
didokumentasikan secara jelas dan akurat, sehingga program ini dengan jelas
diidentifikasi.
•
A2 Analisis Konteks. Konteks di mana program ada harus diperiksa secara rinci,
sehingga mungkin mempengaruhi program dan dapat diidentifikasi.
•
A3 Menjelaskan Tujuan dan Prosedur. Tujuan dan prosedur evaluasi harus
dimonitor dan dijelaskan secara cukup rinci, sehingga dapat diidentifikasi dan
dinilai.
•
A4 Sumber Informasi. Sumber informasi yang digunakan dalam evaluasi program
harus dijelaskan cukup detail, sehingga kecukupan informasi dapat dinilai.
•
A5 Pembentukan Informasi. Pengumpulan dan prosedur informasi harus dipilih atau
dikembangkan dan kemudian diimplementasikan, sehingga mereka akan memastikan
bahwa interpretasi berlaku untuk penggunaan yang dimaksudkan.
•
A6 Informasi Terpercaya. Pengumpulan dan prosedur Informasi harus dipilih atau
dikembangkan dan kemudian diimplementasikan, sehingga mereka akan memastikan
bahwa informasi yang diperoleh cukup dapat diandalkan untuk penggunaan yang
dimaksudkan.
•
A7 Informasi Sistematik. Informasi yang dikumpulkan, diproses, dan dilaporkan
dalam suatu evaluasi harus secara sistematis terakhir, dan setiap kesalahan
yang ditemukan harus diperbaiki.
•
A8 Analisis Kuantitatif Informasi. Informasi kuantitatif dalam suatu evaluasi
harus secara tepat dan sistematis dianalisis, sehingga pertanyaan evaluasi
secara efektif dijawab.
•
A9 Analisis Kualitatif Informasi. Informasi kualitatif dalam suatu evaluasi
harus secara tepat dan sistematis dianalisis, sehingga pertanyaan evaluasi
secara efektif dijawab.
•
A10 Kesimpulan. Kesimpulan yang dicapai dalam evaluasi harus secara eksplisit
dibenarkan, sehingga stakeholder dapat menilai.
•
A11 Pelaporan Imparsial. Prosedur pelaporan harus waspada terhadap gangguan
yang disebabkan oleh perasaan pribadi dan bias dari setiap hal yang menyangkut
evaluasi, sehingga laporan evaluasi cukup mencerminkan temuan evaluasi.
•
A12 Metaevaluation. Evaluasi itu sendiri harus secara formatif dan summatively
dievaluasi terhadap ini dan standar terkait lainnya, sehingga perilakunya
dengan tepat dipandu dan, pada saat penyelesaian, stakeholder erat dapat
memeriksa kekuatan dan kelemahan
Komite
bersama yang ditawarkan rekomendasi yang mana dari tiga puluh standar yang
paling berlaku untuk setiap sepuluh tugas dalam proses evaluasi: memutuskan
apakah akan mengevaluasi, mendefinisikan masalah evaluasi, merancang evaluasi,
mengumpulkan informasi, menganalisis informasi, pelaporan, evaluasi
penganggaran evaluasi, kontrak untuk evaluasi, pengelolaan evaluasi, dan
mengulur-ulur evaluasi. Meskipun Komite bersama menyimpulkan bahwa semua
standar yang berlaku di semua evaluasi program pendidikan, analisis fungsional
ini dimaksudkan untuk membantu evaluator cepat mengidentifikasi standar-standar
yang mungkin paling relevan dengan tugas-tugas evaluasi tertentu.
Komite
ini disajikan dan menggambarkan lima langkah umum untuk menerapkan standar: (1)
mengenal Standar Evaluasi Program, (2) memperjelas tujuan dari evaluasi
program, (3) memperjelas konteks evaluasi program, (4 ) menerapkan standar
masing-masing berdasarkan tujuan dan konteks, dan (5) memutuskan apa yang harus
dilakukan dengan hasilnya. Komite juga menyarankan cara-cara untuk menggunakan
standar dalam merancang program pelatihan evaluasi.
Standar
Evaluasi Program ini adalah terutama berlaku dalam evaluasi evaluasi, yaitu
metaevaluasi. Dalam studi tersebut, metaevaluator mengumpulkan informasi dan
penilaian tentang sejauh mana sebuah evaluasi program memenuhi persyaratan
untuk memenuhi setiap standar. Kemudian evaluator menilai apakah standar
masing-masing ditangani, sebagian ditangani, tidak diperhatikan, atau tidak
berlaku. Sebuah profil dari penilaian ini menyediakan dasar untuk menilai
evaluasi terhadap pertimbangan utilitas, kelayakan, dan akurasi dan dalam
kaitannya dengan standar masing-masing. Ketika metaevaluasi tersebut dilakukan
pada awal tahun evaluasi, mereka memberikan umpan balik diagnostik penggunaan
dalam memperkuat evaluasi. Ketika selesai setelah evaluasi program,
metaevaluation membantu pengguna menilai dan membuat penggunaan yang bijaksana
dari temuan-temuan evaluasi dan rekomendasi atau menolak mereka sebagian atau
bahkan sepenuhnya.
D. Panduan
Prinsip Evaluasi AEA
Pada
bulan November 1992, AEA menciptakan sebuah gugus tugas dan dibebankan dengan
mengembangkan prinsip-prinsip panduan umum untuk praktek evaluasi. Gugus tugas
yang dipimpin oleh William R. Shadish, kemudian merancang Panduan Prinsip
Evaluasi. AEA kemudian mempublikasikan prinsip-prinsip dalam edisi khusus dari
Arah baru untuk berkala Evaluasi Program (AEA Task Force on Guiding Principles
for Evaluators, 1995).
Pentingnya
Panduan Prinsip
Panduan
Prinsip AEA menyediakan kode perilaku profesi evaluator. Prinsip ini juga
berlaku untuk mengevaluasi desain evaluasi dan laporan di berbagai macam
disiplin ilmu. Mereka mendorong penilai untuk mengamati penyelidikan sistematis
dan menghormati masyarakat dengan bertindak jujur dan mengutamakan
kesejahteraan masyarakat melalui karir profesional mereka.
Pedoman
Prinsip Asosiasi Evaluasi Amerika (AEA)
A.
Pencarian Sistematis. Evaluator melakukannya dengan sistematis, berbasis data
pertanyaan, dan dengan demikian harus:
1.
Mematuhi standar teknis
tertinggi sesuai dengan metode yang mereka gunakan.
2.
Jelajahi kekurangan dan
kekuatan klien dari pertanyaan dan pendekatan evaluasi.
3.
Mengkomunikasikan
pendekatan, metode, dan keterbatasan evaluasi secara akurat dan cukup rinci untuk
memungkinkan orang lain untuk memahami, menafsirkan, dan mengkritik pekerjaan
mereka.
B.
Kompetensi. Evaluator memberikan kinerja yang kompeten untuk stakeholder, dan
dengan demikian harus:
1.
Pastikan bahwa tim
evaluasi bersama memiliki pendidikan, kemampuan, keterampilan, dan pengalaman
yang tepat untuk evaluasi.
2.
Pastikan bahwa tim
evaluasi kolektif menunjukkan kompetensi budaya dan menggunakan strategi
evaluasi yang tepat dan keterampilan untuk bekerja dengan kelompok-kelompok
budaya yang berbeda.
3.
Praktek dalam
keterbatasan kompetensi mereka, menolak untuk melakukan evaluasi secara
substansial di luar batas-batas tersebut, dan membuat keterbatasan yang jelas
pada evaluasi yang mungkin timbul jika tidak layak.
4.
Berusaha untuk
mempertahankan dan meningkatkan kompetensi mereka dalam rangka untuk mninggikan
tingkat kinerja dalam evaluasinya.
5.
C. Integritas /
Kejujuran. Evaluator menampilkan kejujuran dan integritas dalam perilaku mereka
sendiri, dan berusaha untuk menjamin kejujuran dan integritas proses evaluasi
keseluruhan, dan dengan demikian harus:
6.
Bernegosiasi jujur
dengan klien dan pihak terkait mengenai biaya, tugas, keterbatasan
metodologi, cakupan hasil, dan penggunaan data.
7.
Menyingkap peran atau
hubungan apapun yang dapat menimbulkan konflik kepentingan yang nyata sebelum
menerima sebuah tugas.
8.
Mencatat dan melaporkan
semua perubahan pada rencana awal proyek dinegosiasikan, dan alasan bagi
mereka, termasuk kemungkinan dampak yang akan terjadi
9.
Lebih menghormati diri
sendiri, klien mereka, dan pemangku kepentingan lainnya dan nilai-nilai terkait
dengan evaluasi.
10. Membuat
prosedur secara akurat, data, temuan, dan berusaha untuk mencegah atau
memperbaiki penyalahgunaan pekerjaan mereka oleh orang lain.
11. Bekerja
untuk menyelesaikan segala masalah yang berkaitan dengan prosedur atau kegiatan
akan menghasilkan informasi evaluatif menyesatkan, menolak untuk melakukan
evaluasi jika masalah tidak dapat diselesaikan, dan berkonsultasi rekan kerja
atau stakeholder yang relevan tentang cara lain untuk melanjutkan jika menurun
tidak layak.
12. Mengungkapkan
semua sumber dukungan keuangan untuk evaluasi, dan sumber permintaan untuk
evaluasi.
D.
Menghargai Orang. Evaluator menghormati keamanan, martabat, dan harga diri
responden, peserta program, klien, dan stakeholder evaluasi lainnya, dan dengan
demikian harus:
1.
Mencari pemahaman yang
komprehensif dari elemen kontekstual dari evaluasi.
2.
Mematuhi etika profesi
saat ini, standar, dan peraturan mengenai kerahasiaan, persetujuan, dan potensi
risiko atau merugikan kepada peserta.
3.
Berusaha untuk
memaksimalkan manfaat dan mengurangi kerugian yang tidak perlu ada, yang
mungkin terjadi dari evaluasi dan hati-hati menilai manfaat atau prosedur
karena potensi risikonya.
4.
Melakukan evaluasi dan
mengkomunikasikan hasil-hasil dengan cara menghormati martabat para pemangku
kepentingan dan harga diri.
5.
Ekuitas sosial dalam
evaluasi, jika layak, sehingga mereka yang memberikan informasi akan mendapat
imbalan.
6.
Memahami, menghargai,
dan mempertimbangkan perbedaan antara para pemangku kepentingan seperti budaya,
agama, ketidakmampuan, orientasi umur, seksual dan etnis.
1.
E. Tanggung Jawab
Publik. Evaluator mengartikulasikan dan memperhitungkan keragaman kepentingan
umum dan publik dan nilai-nilai, dan dengan demikian harus:
1. Sertakan
perspektif yang relevan dan kepentingan berbagai stakeholder.
2. Mempertimbangkan
tidak hanya operasi langsung dan hasil evaluasi, tetapi juga asumsi luas,
implikasi dan potensi efek samping.
3. Memungkinkan
akses para stakeholder, dan secara aktif menyebarkan informasi evaluatif, dan
hasil evaluasi hadir dalam bentuk dimengerti bahwa orang menghormati dan
kehormatan menjanjikan kerahasiaan.
4. Menjaga
keseimbangan antara kebutuhan stakeholder dan klien dan kepentingan lain.
5.
Mempertimbangkan
kepentingan umum dan baik, akan melampaui analisis kepentingan stakeholcier
khususnya mempertimbangkan kesejahteraan masyarakat secara keseluruhan.
E. Penggunaa Standar Evaluasi
Meskipun
tiga set standar diperiksa dalam bab ini bervariasi dalam detail dan orientasi
substantif, mereka saling melengkapi, tidak berkontradiksi. Pada dasarnya
mereka konsisten dalam prinsip-prinsip yang dianjurkan tetapi memberikan
penekanan yang berbeda, cross-cek, dan perawatan melengkapi persyaratan untuk
evaluasi. Semua tiga set standar secara substansial mendukung untuk apa yang
merupakan praktik evaluasi. Evaluasi harus tidak tercela, dengan evaluator
mengikuti semua hukum dan kode etik. Selain itu, evaluator harus menghasilkan
temuan yang valid dan harus berhati-hati untuk tidak menyajikan kesimpulan
unsupportable dan rekomendasi. Selain itu, evaluator harus hati-hati memilah
peran mereka sebagai inquirers independen dari peran sosial mereka advokasi dan
memastikan bahwa evaluasi mereka tidak rusak oleh konflik kepentingan. Semua
tiga set yang didasarkan pada dalil bahwa suara audit dan evaluasi sangat
penting untuk fungsi normal dari suatu Penyedia layanan masyarakat yang sehat
dan pemerintah harus secara teratur tunduk layanan mereka untuk evaluasi, dan
evaluator harus memberikan layanan yang legal, etis, efektif, akuntabel, dan
untuk kepentingan umum. Standar adalah suatu kekuatan yang besar untuk membawa
tentang layanan suara diperlukan evaluasi. Jelas, tiga set standar terdiri dari
sumber daya berharga dari prinsip-prinsip, konsep, dan prosedur untuk evaluator
dan klien mereka.
Tergantung
pada tugas evaluasi tertentu, tiga set dapat digunakan bergantian atau
digabungkan. Perbandingan substansi Komite Standar bersama dan dokumen
Panduan Prinsip AEA 1995 mengungkapkan perbedaan utama dan persamaan dalam
standar dan prinsip-prinsip (Covert, 1995; Sanders, 1995 ). Pada dasarnya
segala sesuatu yang tercakup dalam prinsip AEA juga diliput oleh standar Komite
Bersama. Namun, cakupan yang terakhir adalah lebih luas, jauh lebih rinci, dan
menggali lebih dalam masalah evaluasi. Tidak ada perbandingan yang sama dari
semua tiga set standar yang telah diterbitkan. Sebagai penutup, kami menyajikan
kembali pada setiap set standar, mendiskusikan prioritas untuk menggunakan
setiap set, dan garis besar proses yang umum untuk menerapkan standar.
Panduan
Prinsip AEA mengandaikan bahwa evaluasi program harus memenuhi persyaratan
untuk menghormati kompetensi penyelidikan sistematis, integritas dan kejujuran
bagi orang-orang, dan tanggung jawab untuk kesejahteraan umum dan publik. Dari
tiga set standar, Panduan Prinsip-Prinsip memiliki penerapan yang luas dan yang
paling umum, secara resmi didukung oleh Asosiasi Evaluasi Amerika dan berlaku
untuk evaluasi program di berbagai sektor pelayanan pemerintah dan sosial.
Berisi dua puluh tiga pernyataan penting untuk mendukung lima prinsip, tapi
juga ketiadaan kriteria rinci dan bimbingan. Diperdebatkan, standar ini harus
diterapkan di semua AS. Program evaluasi, namun karena kurangnya spesifisitas
mereka sering berfungsi terbaik sebagai seperangkat standar sekunder.
Penerapannya berkembang di Amerika Serikat untuk semua evaluator yang
memutuskan untuk melakukan evaluasi program mereka sesuai dengan Panduan
Prinsip AEA.
Standar
Evaluasi Program Komite Bersama ini difokuskan pada evaluasi program pendidikan
di Amerika Serikat dan Kanada; menetapkan bahwa evaluasi harus memenuhi
persyaratan utilitas, kelayakan, dan kepatutan, dan akurasi, dan memberikan
pedoman yang luas dan beragam kasus ilustratif. Pembangunan disponsori oleh
lebih dari selusin organisasi profesi yang bersangkutan dengan meningkatkan
pendidikan. Juga, American National Standards Institute mengakreditasi Standar
Evaluasi Program Komite Bersama untuk dipekerjakan dalam mengevaluasi program
pendidikan di Amerika Serikat.
Standar
Audit Pemerintahan yang difokuskan pada pemerintah AS yang disponsori program
di semua bidang pelayanan pemerintah. Mereka menyediakan standar umum tentang
kemandirian, penilaian profesional, kompetensi, dan kontrol kualitas dan
jaminan. Mereka juga memberikan standar khusus untuk kerja lapangan dan
pelaporan temuan untuk audit keuangan, keterlibatan atestasi, dan audit
kinerja. Standar umum dan standar khusus banyak dipakai pada audit kinerja yang
relevan dengan non pemerintah serta evaluasi pemerintah di berbagai bidang
program. Meskipun mereka dimaksudkan untuk digunakan dalam mengevaluasi
program-program pemerintah AS, standar tersebut telah digunakan di
negara-negara di seluruh dunia.
Evaluator
dapat menggunakan proses sembilan langkah umum dalam menerapkan semua tiga set
standar:
1.
Menjadi benar akrab
dengan setiap rangkaian standar melalui orientasi dan pelatihan yang
sistematis.
2.
Memperjelas tujuan
evaluasi itu.
3.
Memperjelas konteks
evaluasi.
4.
Mencapai kesepakatan
dengan klien yang sesuai dengan standar akan diterapkan dan, jika lebih dari
satu set, yang utama, sekunder, atau tersier. Sebagai aturan praktis, Standar
Audit Pemerintahan yang utama dalam evaluasi program pemerintah AS, Standar
Evaluasi Program Komite Bersama harus utama dalam evaluasi program pendidikan
non pemerintah di Amerika Utara, dan Panduan Prinsip AEA harus utama dalam
evaluasi program non pemerintah di luar bidang pendidikan dan sekunder dalam
semua evaluasi program lain di Amerika Serikat.
5.
Orientasi dan rujukan
stakeholder di isi dari standar yang dipilih dan penerapan untuk memastikan
kualitas dalam evaluasi dan akhirnya menilai evaluasi program.
6.
Menerapkan standar
secara proaktif melalui pemeriksaan berkala pada semua aspek evaluasi.
7.
Memberikan pertimbangan
untuk pihak independen yang terlibat untuk menggunakan standar dalam melakukan
metaevaluations formatif atau sumatif. Setiap aplikasi formatif dari standar
harus mencakup laporan tertulis berkala dan sesi umpan balik yang ditujukan
untuk memperkuat evaluasi yang sedang berlangsung.
8.
Menerapkan standar
untuk menilai keberhasilan evaluasi program. Seperti metaevaluation sumatif
akan memiliki kredibilitas yang lebih jika dilakukan oleh evaluator independen.
9.
Pastikan bahwa laporan
metaevaluation sumatif telah dibuat dan efektif dikomunikasikan ke seluruh
pihak yang berwenang.
Semua
tiga set standar menekankan bahwa standar adalah panduan umum dan bahwa
evaluator dan klien mereka harus berkonsultasi dan mempekerjakan banyak materi
yang lebih spesifik ketika berhadapan dengan rincian seperti desain, kasus
pengukuran penelitian, statistik, pelaporan dan kontraktor
4. Evaluasi
a. Jenis-Jenis
Evaluasi
Berdasarkan
tujuan, evaluasi dibedakan atas lima jenis :
1. Evaluasi diagnostik
Evaluasi
diagnostik adalah evaluasi yang di tujukan untuk menelaah kelemahan-kelemahan
siswa beserta faktor-faktor penyebabnya.
2. Evaluasi selektif
Evaluasi
selektif adalah evaluasi yang di gunakan untuk memilih siswa yang paling tepat
sesuai dengan kriteria program kegiatan tertentu.
3. Evaluasi penempatan
Evaluasi penempatan
adalah evaluasi yang digunakan untuk menempatkan siswa dalam program pendidikan
tertentu yang sesuai dengan karakteristik siswa.
4. Evaluasi formatif
Evaluasi
formatif adalah evaluasi yang dilaksanakan untuk memperbaiki dan meningkatan
proses belajar dan mengajar.
6. Evaluasi sumatif
Evaluasi
sumatif adalah evaluasi yang dilakukan untuk menentukan hasil dan kemajuan
bekajra siswa.
Berdasarkan sasaran, jenis evaluasi dibedakan atas :
1. Evaluasi konteks
Evaluasi yang
ditujukan untuk mengukur konteks program baik mengenai rasional tujuan, latar
belakang program, maupun kebutuhan-kebutuhan yang muncul dalam perencanaan
2. Evaluasi input
Evaluasi yang
diarahkan untuk mengetahui input baik sumber daya maupun strategi yang
digunakan untuk mencapai tujuan.
3. Evaluasi proses
Evaluasi yang
di tujukan untuk melihat proses pelaksanaan, baik mengenai kalancaran proses,
kesesuaian dengan rencana, faktor pendukung dan faktor hambatan yang muncul
dalam proses pelaksanaan, dan sejenisnya.
4. Evaluasi hasil atau produk
Evaluasi yang
diarahkan untuk melihat hasil program yang dicapai sebagai dasar untuk
menentukan keputusan akhir, diperbaiki, dimodifikasi, ditingkatkan atau
dihentikan.
5. Evaluasi outcom atau lulusan
Evaluasi yang
diarahkan untuk melihat hasil belajar siswa lebih lanjut, yankni evaluasi
lulusan setelah terjun ke masyarakat.
Berdasarkan lingkup kegiatan pembelajaran, jenis evaluasi
dibedakan atas :
1. Evaluasi program pembelajaran
Evaluais yang
mencakup terhadap tujuan pembelajaran, isi program pembelajaran, strategi
belajar mengajar, aspe-aspek program pembelajaran yang lain.
2. Evaluasi proses pembelajaran
Evaluasi yang
mencakup kesesuaian antara peoses pembelajaran dengan garis-garis besar program
pembelajaran yang di tetapkan, kemampuan guru dalam melaksanakan proses
pembelajaran, kemampuan siswa dalam mengikuti proses pembelajaran.
3. Evaluasi hasil pembelajaran
Evaluasi hasil
belajar mencakup tingkat penguasaan siswa terhadap tujuan pembelajaran yang
ditetapkan, baik umum maupun khusus, ditinjau dalam aspek kognitif, afektif,
psikomotorik.
Jenis evaluasi berdasarkan objek dan
subjek evaluasi
Berdasarkan objek :
1. Evaluasi input
Evaluasi
terhadap siswa mencakup kemampuan kepribadian, sikap, keyakinan.
2. Evaluasi tnsformasi
Evaluasi
terhadao unsur-unsur transformasi proses pembelajaran anatara lain materi,
media, metode dan lain-lain.
3. Evaluasi output
Evaluasi
terhadap lulusan yang mengacu pada ketercapaian hasil pembelajaran.
Berdasarkan subjek :
1. Evaluasi internal
Evaluasi yang
dilakukan oleh orang dalam sekolah sebagai evaluator, misalnya guru.
2. Evaluasi eksternal
Evaluasi yang
dilakukan oleh orang luar sekolah sebagai evaluator, misalnya orangtua,
masyarakat.
b. Persyaratan
Evaluasi
Langkah pertama yang perlu
ditempuh guru dalam menilai prestasi belajar siswa adalah menyusun alat
evaluasi(test instrument) yang sesuai
dengan kebutuhan, dalam artian tidak menyimpang dari indicator dan jenis
prestasi yang diharapkan.
Persyaratan pokok penyusunan alat evaluasi yang baik dalam perspektif
psikologi belajar (The Psychology of
learning) meliputi dua macam, yakni: 1). Reliabilitas; 2). Validitas
(Cross, 1974; Barlow, 1985; Butler, 1990).
1)Reliabilitas
Secara sederhana, reliabilitas (reliability) berarti hal tahan uji atau
dapat dipercaya.Sebuah alat evaluasi dipandang reliable atau tahan uji apabila
memiliki konsistensi atau keajegan hasil.
2)
Validitas
Validitas berarti keabsahan atau kebenaran. Sebuah alat evaluasi
dipandang valid atau abash apabila dapat mengukur apa yang seharusnya diukur.
Syarat-syarat
umum yang harus dipenuhi dalam mengadakan kegiatan evaluasi dalam proses
pendidikan menurut Dimyati dan Mudjiono (2006:194-198) terurai sebagai berikut:
1.
Kesahihan
Kesahihan
menggantikan kata validitas (validity) yang dapat diartikan sebagai ketepatan
evaluasi mengevaluasi apa yang seharusnya di evaluasi. untuk memperoleh hasil
evaluasi yang sahih, dibutuhkan insturmen yang memiliki/memenuhi syarat-syarat
kesahihan suatu instrumental evaluasi. Kesahihan instrument evaluasi diperoleh
melalui hasil pemikiran dan hasil pengalaman.
2.
Keterandalan
Keterandalan evaluasi berhubungan dengan masalah kepercayaan, yakni tingkat
kepercayaan bahwa suatu instrument evaluasi mampu memberikan hasil yang tepat.
Gronlund dalam Dimyati dan Mudjiono (2006:196) mengemukakan bahwa,
“keterandalan menunjukkan kepada konsistensi (keajegan) pengukuran yakni
bagaimana keajegan skor tes atau hasil evaluasi lain yang berasal dari
pengukuran yang satu ke pengukuran yang lain”. Dengan kata lain, keterandalan
dapat kita artikan sebagai tingakat kepercayaan keajegan hasil evaluasi yang
diperoleh dari suatu instrument evaluasi.
3.
Kepraktisan
Kepraktisan
evaluasi dapat diartikan sebagai kemudahan-kemudahan yang ada pada instrument
evaluasi baik dalam mempersiapkan, menggunakan, menginterpretasi/ memperoleh
hasil, maupun kemudahan dalam menyimpanya.
Sementara menurut Arikunto dan Jabar
(2010:8-9) evaluasi memiliki ciri-ciri dan persyaratan sebagai berikut :
a)
Proses kegiatan penelitian tidak
menyimpang dari kaidah-kaidah yang berlaku bagi penelitian pada umumnya.
b)
Dalam melaksanakan evaluasi,
peneliti harus berpikir secara sistematis yaitu memandang program yang diteliti
sebagai sebuah kesatuan yang terdiri dari beberapa komponen atau unsur yang
saling berkaitan satu sama lain dalam menunjang kinerja dari objek yang
dievaluasi.
c)
Agar dapat mengetahui secar rinci
kondisi dari objek yang dievaluasi, perlu adanya identifikasi komponen yang
berkedudukan sebagai faktor penentu bagi keberhasilan program.
d)
Menggunakan standar, Kiteria, atau
tolak ukur sebagai perbandingan dalam menentukan kondisi nyata dari data yang
diperoleh dan untuk mengambil kesimpulan.
e)
Kesimpulan atau hasil penelitian
digunakan sebagai masukan atau rekomendasi bagi sebuah kebijakan atau rencana
program yang telah ditentukan.
f)
Agar informasi yang diperoleh dapat
menggambarkan kondisi nyata secara rinci untuk mengetahui bagian mana dari
program yang belum terlaksana, maka perlu ada identifikasi komponen yang
dilanjutkan dengan identifikasi subkomponen, sampai pada indikator dari program
evaluasi.
g)
Standar, kriteria, atau tolak ukur
diterapkan pada indicator, yaitu bagian yang paling kecil dari program agar
dapat dengan cermat diketahui letak kelemahan dari proses kegiatan.
h)
Dari hasil penelitian harus dapat disusun
sebuah rekomendasi secara rinci dan akurat sehingga dapat ditentukan tindak
lanjut secara tepat.
c. Kesalahan
dalam melakukan evaluasi
(a) Indikator pengukuran kerja yang subyektif
Beberapa perusahaan memiliki faktor pengukuran kinerja yang
sangat subyektif, misalnya penilaian terhadap prilaku dan personality dari
karyawan yang mungkin tidak sesuai dengan atasannya. Hal ini apabila
tidak dapat dijalankan dengan teknik implementasi yang positif dapat
mengakibatkan kemunculan konflik dan justru malah menurunkan motivasi kerja
dari karyawan yang bersangkutan.
(b)
Ketidakjelasan dari ruang lingkup pekerjaan
Dalam suatu kelompok kerja yang belum dapat diperjelas ruang
lingkup pekerjaannya, penetapan suatu program evaluasi adalah hal yang sulit
untuk dijalankan. Pembagian dan penetapan proporsi pekerjaan secara tepat
tidak tepat terinformasikan dapat mengakibatkan proses pembobotan terhadap
kinerja menjadi berat sebelah dan berakibat munculnya ketidakberkembangnya dari
suatu mekanisme kerja dalam organisasi.
(c)
Periode pengukuran kinerja
Periode pengukuran yang terlalu panjang dapat menyebabkan
adanya kesulitan untuk melakukan pengukuran yang obyektif, misalnya lupa dalam
mengingat bagaimana performa kerja tersebut dijalankan, tahapan pengembangan
operasional kinerja yang dijalankan tidak tepat sesuai dengan aspek yang
dipertimbangkan dan dikelola serta pencatatan yang mungkin sudah terasa tidak
sesuai dengan konteks yang ada. Hal ini dapat mengakibatkan seorang
pekerja akan fokus untuk bekerja dengan baik justru pada saat dimana waktu yang
ada mendekati batasan waktu pengukuran kinerja yang ada.
(d)
Tidak terbarunya target kerja
Program evaluasi yang dijalankan harus menggunakan target
yang dinamis untuk memastikan status dari proses pencapaian kinerja dan target
selaras dengan pertumbuhan perusahaan. Untuk menciptakan suatu mekanisme
yang tepat dalam peningkatan aspek optimalisasi kinerja maka ada baiknya
apabila target kinerja dapat menjadi suatu bentuk target yang dinamis sehingga
mekanisme dari kehidupan organisasi dalam perusahaan tercapai.
(e)
Komunikasi yang tidak tepat
Sangat penting setelah melakukan program evaluasi program
kerja tersebut, untuk dapat memastikan bagaimana komunikasi yang dijalankan
dalam proses evaluasi kinerja tersebut dapat menstimulasi kinerja yang tepat
bukan menciptakan demotivasi. Pola komunikasi yang tepat dan dibarengi
dengan informasi yang interaktif antara pemegang jabatan dan karyawan yang
bersangkutan akan sangat membantu pengembangan pola komunikasi yang tepat dalam
perusahaan.
5. Istilah-istilah
dalam evaluasi program pembelajaran
Pengertian Evaluasi (Penilaian) Menurut Para Ahli
- Sudiono, Anas (2005) mengemukakan bahwa secara harfiah kata evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Akar katanya adalah value yang artinya nilai. Jadi istilah evaluasi menunjuk pada suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu.
- Frey, Barbara A., and Susan W. Alman. (2003): Evaluation The systematic process of collecting, analyzing, and interpreting information to determine the extent to which pupils are achieving instructional objectives. (Artinya: Evaluasi adalah proses sistematis pengumpulan, analisis, dan interpretasi informasi untuk menentukan sejauh mana siswa yang mencapai tujuan instruksional).
- Mardapi, Djemari (2003), penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran.
- Zainul, Asmawi dan Noehi Nasution (2001), mengartikan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes.
Kesimpulan Tentang Pengertian Evaluasi:
- Evaluasi berasal dari akar kata bahasa Inggris value yang berarti nilai, jadi istilah evaluasi sinonim dengan penilaian.
- Evaluasi merupakan proses sistematis dari mengumpulkan, menganalisis, hingga interpretasi (menafsirkan) data atau informasi yang diperoleh.
- Data atau informasi diperoleh melalui pengukuran (measurement) hasil belajar.melalui tes atau nontes.
- Evaluasi bersifat kualitatif.
Pengertian Pengukuran (Measurement) Menurut Para Ahli
- Alwasilah et al.(1996), measurement (pengukuran) merupakan proses yang mendeskripsikan performa siswa dengan menggunakan suatu skala kuantitatif (sistem angka) sedemikian rupa sehingga sifat kualitatif dari performa siswa tersebut dinyatakan dengan angka-angka
- Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai kegiatan membandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi kuantitatif.
- Cangelosi, James S. (1995), pengukuran adalah proses pengumpulan data secara empiris yang digunakan untuk mengumpulkan informasi yang relevan dengan tujuan yang telah ditentukan.
- Sridadi (2007) pengukuran adalah suatu prose yang dilakukan secara sistematis untuk memperoleh besaran kuantitatif dari suatu obyek tertentu dengan menggunakan alat ukur yang baku.
Kesimpulan Tentang Pengertian Pengukuran:
- Kegiatan pengukuran dilakukan dengan membandingkan hasil belajar dengan suatu ukuran tertentu.
- Dilakukan dengan proses sistematis.
- Hasil pengukuran berupa besaran kuantitatif (sistem angka).
- Pengukuran menggunakan alat ukur yang baku.
Pengertian Asesmen Menurut Para Ahli
- Angelo T.A.(1991): Classroom Assessment is a simple method faculty can use to collect feedback, early and often, on how well their students are learning what they are being taught. (Artinya: asesmen Kelas adalah suatu metode yang sederhana dapat digunakan untuk mengumpulkan umpan balik, baik di awal maupun setelah pembelajaran tentang seberapa baik siswa mempelajari apa yang telah diajarkan kepada mereka.)
- Kizlik, Bob (2009): Assessment is a process by which information is obtained relative to some known objective or goal. Assessment is a broad term that includes testing. A test is a special form of assessment. Tests are assessments made under contrived circumstances especially so that they may be administered. In other words, all tests are assessments, but not all assessments are tests. (Artinya : asesmen adalah suatu proses dimana informasi diperoleh berkaitan dengan tujuan pembelajaran. Asesmen adalah istilah yang luas yang mencakup tes (pengujian). Tes adalah bentuk khusus dari asesmen. Tes adalah salah satu bentuk asesmen. Dengan kata lain, semua tes merupakan asesmen, namun tidak semua asesmen berupa tes)
- Overton, Terry (2008): Assesment is a process of gathering information to monitor progress and make educational decisions if necessary. As noted in my definition of test, an assesment may include a test, but also include methods such as observations, interview, behavior monitoring, etc. (Artinya: sesmen adalah suatu proses pengumpulan informasi untuk memonitor kemajuan dan bila diperlukan pengambilan keputusan dalam bidang pendidikan. Sebagaimana disebutkan dalam definisi saya tentang tes, suatu asesmen bisa saja terdiri dari tes, atau bisa juga terdiri dari berbagai metode seperti observasi, wawancara, monitoring tingkah laku, dan sebagainya).
- Palomba and Banta(1999), Assessment is the systematic collection , review , and use of information about educational programs undertaken for the purpose of improving student learning and development (Artinya: asesmen adalah pengumpulan, reviu, dan penggunaan informasi secara sistematik tentang program pendidikan dengan tujuan meningkatkan belajar dan perkembangan siswa).
Kesimpulan Tentang Pengertian Asesmen:
- Asesmen merupakan metode dan proses yang digunakan untuk mengumpulkan umpan balik tentang seberapa baik siswa belajar.
- Dapat dilakukan di awal, di akhir (sesudah), maupun saat pembelajaran sedang berlangsung.
- Asesmen dapat berupa tes atau nontes.
- Asesmen berupa nontes misalnya penggunaan metode observasi, wawancara, monitoring tingkah laku, dsb.
- Hasilnya dapat digunakan untuk pengambilan keputusan.
- Bertujuan meningkatkan belajar (pembelajaran) dan perkembangan siswa.
Pengertian Tes Menurut Para Ahli
- Wayan Nurkencana (1993), tes adalah suatu cara untuk mengadakan penilaian yang berbentuk suatu tugas yang harus dikerjakan anak atau sekelompok anak sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak tersebut yang kemudian dapat dibandingkan dengan nilai yang dicapai oleh anak-anak lain atau standar yang telah ditetapkan
- Overton, Terry (2008): test is a method to determine a student’s ability to complete certain tasks or demontstrate mastery of a skill or knowledge of content. Some types would be multiple choice tests or a weekly spelling test. While it commonly used interchangeably with assesment, or even evaluation, it can be distinguished by the fact that a test is one form of an assesment. (Tes adalah suatu metode untuk menentukan kemampuan siswa menyelesaikan sejumlah tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan pada suatu materi pelajaran. Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan. Seringkali penggunaannya tertukar dengan asesmen, atau bahkan evaluasi (penilaian), yang mana sebenarnya tes dapat dengan mudah dibedakan berdasarkan kenyataan bahwa tes adalah salah satu bentuk asesmen.)
Kesimpulan Tentang Pengertian Tes:
- Tes adalah cara atau metode untuk menentukan kemampuan siswa menyelesaikan tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan.
- Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan.
- Tes adalah salah satu bentuk asesmen