Sabtu, 07 September 2013

Evaluasi program


1.      Syarat-syarat Evaluasi Program
Sebuah instrumen evaluasi hasil belajar hendaknya memenuhi syarat sebelum di gunakan untuk mengevaluasi atau mengadakan penilaian agar terhindar dari kesalahan dan hasil yang tidak valid (tidak sesuai kenyataan sebenarnya). Alat evaluasi yang kurang baik dapat mengakibatkan hasil penilaian menjadi bias atau tidak sesuainya hasil penilaian dengan kenyataan yang sebenarnya, seperti contoh anak yang pintar dinilai tidak mampu atau sebaliknya.
       Jika terjadi demikian perlu ditanyakan apakah persyaratan instrumen yang digunakan menilai sudah sesuai dengan kaidah-kaidah penyusunan instrumen.

Instrumen Evaluasi yang baik memiliki ciri-ciri dan harus memenuhi beberapa kaidah antara lain :
    * Validitas
    * Reliabilitas
    * Objectivitas
    * Pratikabilitas
    * Ekomonis
    * Taraf  Kesukaran
    * Daya Pembeda
Validitas
       Menurut Kamus Besar Bahasa Indonesia bahwa Validitas diartikan sebagai sifat benar, menurut bukti yang ada, logika berfikir, atau kekuatan hokum. Menurut Diknas bahwa validitas adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya. Sedangkan menurut Wiki pedia Indonesia diterjemahkan , kesahihan, kebenaran yang diperkuat oleh bukti atau data. Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
       Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Dengan demikian kata valid sering diartikan dengan tepat, benar, sahih, absah, sehingga kata valid dapat diartikan ketepatan, kebenaran, kesahihan, atau keabsahan. Menurut Anas Sujiono apabila kata valid dikaitkan dengan fungsi tes sebagai alat pengukur maka tes dikatakan valid adalah apabila tes tersebut dengan secara tepat, secara benar, secara sahih, atau secara absah dapat mengukur apa yang seharusnya diukur, dengan kata lain tes dapat dikatakan telah memiliki Validitas apabila tes tersebut dengan secara tepat, benar, sahih atau absah telah dapat mengungkap atau mengukur apa yang seharus diungkap atau diukur lewat tes tersebut. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
       Dalam kaitannya dengan tes dan penilaian, Retno mengemukakan tiga pokok pengertian yang bisa digunakan sebagai berikut :
a.       Validitas berkenaan dengan hasil dari sutu alat tes atau alat evaluasi, dan tidak menyangkut alat itu sendiri. Tes intelegensi sebagai alat untuk melakukan tes kecerdasan hasilnya valid , tapi kalau digunakan untuk melakukan tes hasil belajar tidak valid.
b.      Validitas adalah persoalan yang menyangkut tingkat (derajat), sehingga istilah yang digunakan adalah derajat validitas suatu tes maka suatu tes ada yangh disebut validitasnya tinggi, sedang dan rendah.
c.       Validitas selalu dibatasi pada pengkususannya dalam penggunaan dan tidak pernah dalam arti kualitas yang umum. Suatu tes berhitung mungkin tinggi validitasnya untuk mengukur keterampilan menjumlah angka, tetapi rendah validitasnya untuk mengukur berfikir matematis dan sedang validitasnya untuk meramal keberhasilan siswa dalam pelajaran matematik yang akan datang.
       Validitas adalah kesahihan pengukuran atau penilaian dalam penelitian. Dalam analisis isi, validitas dilakukan dengan berbagai cara atau metode sebagai berikut.
1.      Pengukuran produktivitas (productivity), yaitu derajat di mana suatu studi menunjukkan indikator yang tepat yang berhubungan dengan variabel.
2.      Predictive validity, yaitu derajat kemampuan pengukuran dengan peristiwa yang akan datang.
3. Construct validity, yaitu derajat kesesuaian teori dan konsep yang dipakai dengan alat pengukuran yang dipakai dalam penelitian tersebut.

Macam-macam Validitas
       Menurut Suharsimi ada dua jenis validitas yaitu validitas logis dan validitas empiris. Sementara Retno validitas itu terbagi menjadi lima tipe yaitu validitas tampang (face validity), validitas logis (logical validity), validitas vaktor (factorikal validity), Validitas isi (conten validity), dan validitas empiris (empirical validity). Sedangkan menurut Anas ternik pengujian validitas hasil belajar secara garis besar dapat dibagi dua, yaitu pengujian validitas tes secara rasional dan pengujian validitas tes secara empirik.
       Pada dasarnya para ahli pendidikan melihat pengujian validitas tes itu dapat dilihat dari:
1.    Pengujian validitas tes secara rasional.
     Istilah lain dari istilah validitas rasional adalah validitas logika, validitas ideal atau validitas dassollen. Istilah validitas logika (logical validity) mengandung kata logis berasal dari kata logika yang berarti penalaran. Dengan makna demikian bahwa validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran, kondisi valid tersebut dipandang terpenuhi karena instrumen bersangkutan sudah dirancang secara baik mengikuti teori dan ketentuan yang ada. Dengan demikian validitas logis ini dikatakan benar apabila tes yang dilakukan sesuai denga ketentuan, peraturan dan teori yang ada, sehingga suatu tes itu dapat dikatakan valid dapat dilihat setelah instrumen soal tes tersebut telah selesai dibuat.

2. Pengujian Validitas Tes secara Empiris
                   Istilah “Validitas empiris” memuat kata “empiris” yang artinya “pengalaman” sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Yang dimaksud dengan validitas empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Sedangkan menurut Ebel bahwa Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.

Faktor-faktor yang mempengaruhi Validitas
Menurut Retno ada beberapa hal yang mempengaruhi validitas alat pengukur sebagai berikut :
1.    Faktor di dalam tes itu sendiri
2.   Faktor dalam respon siswa, ini terjadi jika : Siswa mengalami gangguan emosional dalam menjawab tes, Siswa hanya cendrung menerka-nerka dalam menjawab tes,
3.    Faktor dalam mengadministrasi tes dan pembijian.
       Sebuah Instrumen Evaluasi dikatakan baik manakala memiliki validitas yang tinggi. Yang dimaksud Validitas disini adalah kemampuan instrumen tersebut mengukur apa yang seharusnya diukur. Ada tiga Aspek yang hendak dievaluasi dalam evaluasi hasil belajar yaitu Aspek Kognitif, Psikomotor dan Afektif.Tinggi Rendahnya validitas instrumen dapat di hitung dengan uji validitas dan di nyatakan dengan koefisien validitas.

Reliabilitas
       Instrumen dikatakan memiliki reliabilitas yang tinggi manakala instrumen tersebut dapta menghasilkan hasil pengukuran yang ajeg. Keajegan/ketetapn disini tidak diartikan selalu sama tetapi mengikuti perubahan secara ajeg. Jika keadaan seseorang si upik berada lebih rendah dibandingkan orang lain misalnya si Badu, maka jika dilakukan pengukuran ulang hasilnya si upik juga berada lebih rendah terhadap si badu. Tinggi rendahnya reliabilitas ini dapat di hitung dengan uji reliabilitias dan dinyatakan dengan koefisien reliabilitas.

Objectivitas
       Instrumen evaluasi hendaknya terhindar dari pengaruh-pengaruh subyektifitas pribadi dari si evaluator dalam menetapkan hasilnya. Dalam menekan pengaruh subyektifitas yang tidak bisa dihindari hendaknya evaluasi dilakukan mengacu kepada pedoman tertama menyangkut masalah kontinuitas dan komprehensif.
       Evaluasi harus dilakukan secara kontinu (terus-menerus). Dengan evaluasi yang berkali-kali dilakukan maka evaluator akan memperoleh gambaran yang lebih jelas tentang  keadaan Audience yang dinilai. Evaluasi yang diadakan secara on the spot dan hanya satu atau dua kali, tidak akan dapat memberikan hasil yang obyektif tentang keadaan audience yang di evaluasi. Faktor kebetulan akan sangat mengganggu hasilnya.

Praktikabilitas
       Sebuah intrumen evaluasi dikatakan memiliki praktikabilitas yang tinggi apabila bersifat praktis mudah pengadministrasiannya dan memiliki ciri : Mudah dilaksanakan, tidak menuntut peralatan  yang banyak dan memberi kebebasan kepada audience mengerjakan yang dianggap mudah terlebih dahulu. Mudah pemeriksaannya artinya dilengkapi pedoman skoring, kunci jawaban. Dilengkapi petunjuk yang jelas sehingga dapat di laksanakan oleh orang lain.



Ekonomis
       Pelaksanaan evaluasi menggunakan instrumen tersebut tidak membutuhkan biaya yang mahal tenaga yang banyak dan waktu yang lama.

Taraf Kesukaran
       Instrumen yang baik terdiri dari butir-butir instrumen yang tidak terlalu mudah dan tidak terlalu sukar. Butir soal yang terlalu mudah tidak mampu merangsang audience mempertinggi usaha memecahkannya sebaliknya kalau terlalu sukar membuat audiece putus asa dan tidak memiliki semangat untuk mencoba lagi karena diluar jangkauannya. Di dalam isitlah evaluasi index kesukaran ini diberi simbul p yang dinyatakan dengan “Proporsi”.

Daya Pembeda
       Daya pembeda sebuah instrumen adalah kemampuan instrumen tersebut membedakan antara audience yang pandai (berkemampuan tinggi) dengan audience yang tidak pandai (berkemampuan rendah). Indek daya pembeda ini disingkat dengan D dan dinyatakan dengan Index Diskriminasi. (Ulianta, Artikel Pendidikan).
       Sependapat dengan syarat-syarat di atas, maka Sukardi (2008 : 8) mengemukakan bahwa, suatu evaluasi memenuhi syarat-syarat sebelum diterapkan kepada siswa yang kemudian direfleksikan dalam bentuk tingkah  laku. Evaluasi yang baik, harus mempunyai syarat seperti berikut: 1) valid, 2) andal, 3) objektif , 4) seimbang, 5) membedakan, 6) norma, 7) fair, dan 8) praktis.
       Sedangkan Wina Sanjaya (2008: 352-354), mengatakan bahwa syarat-syarat alat evaluasi yang baik harus:
a.       Memberikan motivasi
Memberikan penilaian evaluasi diarahkan untuk meninkatkan motivasi belajar bagi siswa melalui upaya pemahaman akan kekuatan dan kelemahan yang dimiliki baik oleh guru maupun siswa. Siswa perlu memahami makna dari hasil penilaian.
b.      Validitas
Penilaian diarahkan bukan semata-mata untuk melengkapi syarat administrasi saja, akan tetapi diarahkan untuk memperoleh informasi tentang ketercapaian kompetensi seperti yang terumuskanan dalam kurikulum. Oleh sebab itu, penilaian tidak menyimpang dari kompetensi yang ingin dicapai. Dengan kata lain penilaian harus menjamin validitas.

c.       Adil
 Setiap siswa memiliki kesempatan yang sama dalam proses pembelajaran tanpa memandang perbedaan sosial-ekonomi, latar belakang budaya dan kemampuan. Dalam penilaian, siswa disejajarkan  untuk mendapatkan perlakuan yang sama.
d.      Terbuka
Alat penilaian yang baik adalah alat penilaian yang dipahami baik oleh penilai maupun yang dinilai. Siswa perlu memahami jenis atau prosedur penilaian yang akan dilakukan beserta kriteria penilaian. Keterbukaan ini bukan hanya akan mendorong siswa untuk memperoleh hasil yang baik sehingga motovasi belajara mereka akan bertambah juga, akan tetapi sekaligus mereka akan memahami posisi mereka sendiri dalam pencapaian kompetensi.
e.       Berkesinambungan
Penilaian tidak pernah mengenal waktu kapan penilaian seharusnya dilakukan. Penilaian dilakukan secara terus-menerus dan berkesinambungan.
f.       Bermakna
Penilaian tersusun dan terarah akan memberikan makna kepada semua pihak khususnya siswa untuk mengetahui posisi mereka dalam  memperoleh kompetensi dan memahami kesulitan yang dihadapi dalam mencapai kompetensi. Dengan demikian, hasil penilaian itu juga bermakna bagi guru juga termasuk bagi orang tua dalam memberika bimbingan kepada siswa dalam upaya memperoleh kompetensi sesuai dengan target kurikulu.
g.      Menyeluruh
Kurikulum diarahkan untuk perkembangan siswa secara utuh, baik perkembangan afektif, kognitif maupun psikomotorik. Oleh sebab itu, guru dalam melaksanakan penilaian harus menggunakan ragam penilaian, misalnya tes, penilaian produk, skala sikap, penampilan, dan sebagainya. Hal ini sangat penting, sebab hasil penilaian harus memberikan informasi secara utuk tentang perkembangan setiap aspek.
h.      Edukatif
Penilaian kelas tidak semata-mata diarahkan untuk memperoleh gambaran kemampuan siswa dalam pencapaian kompetensi melalui angka yang diperoleh, akan tetapi hasil penilaian harus memeberikan umpan balik untuk memperbaiki proses pembelajaran, baik yang dilakukan oleh guru maupun siswa, sehingga hasil belajar lebih optimal. Dengan demikian, proses penilaian tidak semata-mata tanggung jawab guru akan tetapi juga merupakan tanggung jawab siswa. Artinya siswa harus ikut terlibat dalam proses penilaian, sehingga mereka meyadari, bahwa penilaian adalah bagian dari proses pembelajara.

Sedangkan Daryanto (1997: 19-28) membagi syarat-syarat evaluasi menjadi 5 (lima) bagian, diantaranya:
1.    Keterpaduan    
Evaluasi merupakan komponen integral dalam  program  pengajaran disamping tujuan serta metode. Tujuan inttruksional, materi dan  metode, serta evaluasi merupakan tiga keterpaduan yang tidak boleh dipisahkan.
2.    Koherensi
Dengan prinsip koherensi diharapkan  evaluasi harus berkualitas dengan materi pengajran yang sudah disajikan dan sesuai dengan ranah kemampuan yang hendak diukur.
3.    Pedagogis
Evaluasi perlu diterapkan sebagai upaya perbaikan sikap dan tingkah laku ditinjau dari segi pedagogis. Evaluasi dan hasilnya hendaknya dapat dipakai sebagai alat motivasi untuk siswa dalam  kegiatan belajarnya.
4.    Akuntabilitas
Sejau mana keberhasilan program pengajaran perlu disampaikan kepada pihak-pihak yang berkepentingan dengan  pendidikan sebagai laporan pertanggungjawaban (accountability).   
Prinsip-Prinsip Evaluasi Prgram
Untuk memperoleh hasil evaluasi yang lebih baik, maka kegiatan evaluasi harus bertitik tolak dari prinsip-prinsip umum sebagai berikut.
a.       Kontinuitas
Evaluasi tidak boleh dilakukan secara insidental karena pemberian sistem sendiriadalah suatu proses yang kontiniu. Oleh sebab itu, evaluasi harus dilakukan secara kontiniu.Hasil evaluasi yang diperoleh pada suatu waktu harus senantiasa dihubungkan dengan hasil-hasil pada waktu sebelumnya, sehingga dapat diperoleh gambaran yang jelas dan berartitentang perkembangan peserta didik. Perkembangan belajar peserta didik tidak dapat dilihatdari dimensi produk saja, tetapi juga dimensi proses bahkan dari dimensi input.
b.      Komprehensif
Dalam melakukan evaluasi terhadap suatu objek, guru harus mengambil seluruh objek itu sebagai bahan evaluasi. Misalnya, jika objek evaluasi itu adalah peserta didik, makaseluruh aspek kepribadian peserta didik itu harus dievaluasi, baik yang menyangkut kognitif,afektif maupun psikomotor. Begitu juga dengan objek-objek evaluasi yang lain.

c.       Adil dan Objektif
Dalam melaksanakan evaluasi, guru harus berlaku adil tanpa pilih kasih. Kata “adil”dan “objektif” memang mudah diucapkan, tetapi sulit dilaksanakan. Meskipun demikian, kewajiban manusia adalah harus berikhtiar. Semua peserta didik harus diberlakukan sama tanpa “pandang bulu”. Guru juga hendaknya bertindak secara objektif, apa adanya sesuaidengan kemampuan peserta didik. Oleh sebab itu, sikap  like  dan dislike, perasaan, keinginandan prasangka yang bersifat negatif harus dijauhkan. Evaluasi harus didasarkan ataskenyataan (data dan fakta) yang sebenarnya, bukan hasil manipulasi atau rekayasa.
d.      Kooperatif
Dalam kegiatan evaluasi guru hendaknya bekerja sama dengan semua pihak, sepertiorang tua peserta didik, sesama guru, kepala sekolah, termasuk dengan peserta didik itusendiri. Hal ini dimaksudkan agar semua pihak merasa puas dengan hasil evaluasi, dan pihak-pihak tersebut merasa dihargai.
e.       Praktis
Praktis mengandung arti mudah digunakan, baik oleh guru itu sendiri yang menyusunalat evaluasi maupun orang lain yang akan menggunakan alat tersebut. Untuk itu harusdiperhatikan bahasa dan petunjuk mengerjakan soal.
2.      Aspek dan dimensi evaluasi program
Empat aspek Model Evaluasi CIPP (context, input, process and output) membantu pengambil keputusan untuk menjawab empat pertanyaan dasar mengenai;
1. Apa yang harus dilakukan (What should we do?); mengumpulkan dan menganalisa needs assessment data untuk menentukan tujuan, prioritas dan sasaran.
2. Bagaimana kita melaksanakannya (How should we do it?); sumber daya dan langkah-langkah yang diperlukan untuk mencapai sasaran dan tujuan dan mungkin meliputi identifikasi program eksternal dan material dalam mengumpulkan informasi
3. Apakah dikerjakan sesuai rencana (Are we doing it as planned?); Ini menyediakan pengambil-keputusan informasi tentang seberapa baik program diterapkan. Dengan secara terus-menerus monitoring program, pengambil-keputusan mempelajari seberapa baik pelaksanaan telah sesuai petunjuk dan rencana, konflik yang timbul, dukungan staff dan moral, kekuatan dan kelemahan material, dan permasalahan penganggaran.
4. Apakah berhasil (Did it work?); Dengan mengukur outcome dan membandingkannya pada hasil yang diharapkan, pengambil-keputusan menjadi lebih mampu memutuskan jika program harus dilanjutkan, dimodifikasi, atau dihentikan sama sekali.

Penjelasan atas masing-masing aspek dalam model evaluasi CIPP adalah sebagai berikut:

1) Evaluasi Konteks
Konteks disini diartikan yaitu situasi atau latar belakang yang mempengaruhi jenis-jenis tujuan dan strategi pendidikan yang akan dikembangkan dalam program yang bersangkutan, seperti : kebijakan departemen atau unit kerja yang bersangkutan, sasaran yang ingin dicapai oleh unit kerja dalam kurun waktu tertentu, masalah ketenagaan yang dihadapi dalam unit kerja yang bersangkutan, dan sebagainya.
Evaluasi Konteks menilai kebutuhan, permasalahan, aset, dan peluang untuk membantu pembuat keputusan menetapkan tujuan dan prioritas serta membantu stakeholder menilai tujuan, prioritas, dan hasil.
Menurut Sarah McCann dalam Arikunto (2004) evaluasi konteks meliputi penggambaran latar belakang program yang dievaluasi, memberikan tujuan program dan analisis kebutuhan dari suatu sistem, menentukan sasaran program, dan menentukan sejauhmana tawaran ini cukup responsif terhadap kebutuhan yang sudah diidentifikasi. Penilaian konteks dilakukan untuk menjawab pertanyaan “Apakah tujuan yang ingin dicapai, yang telah dirumuskan dalam program benar-benar dibutuhkan oleh masyarakat?”
Konteks evaluasi ini membantu merencanakan keputusan, menentukan kebutuhan yang akan dicapai oleh program, dan merumuskan tujuan program.
Evaluasi konteks adalah upaya untuk menggambarkan dan merinci lingkungan, kebutuhan yang tidak terpenuhi, populasi dan sampel yang dilayani, dan tujuan proyek.
2) Evaluasi Masukan (Input)
Tahap kedua dari model CIPP adalah evaluasi masukan. Tujuan utama evaluasi ini adalah untuk mengaitkan tujuan, konteks, input, proses dengan hasil program. Evaluasi ini juga untuk menentukan kesesuaian lingkungan dalam membantu pencapaian tujuan dan objectif program. Disamping itu, evaluasi ini dibuat untuk memperbaiki program bukan untuk membuktikan suatu kebenaran (The purpose of evaluation is not to prove but to Improve, Stufflebeam, 1997 dalam Arikunto 2004).
Model evaluasi CIPP digunakan untuk mengukur, menterjemahkan dan mengesahkan perjalanan suatu program, dimana kekuatan dan kelemahan program dikenali. Kekuatan dan kelemahan program ini meliputi institusi, program itu sendiri, sasaran populasi/ individu.Model evaluasi ini meliputi kegiatan pendeskripsian masukan dan sumberdaya program, perkiraan untung rugi, dan melihat alternatif prosedur dan strategi apa yang perlu disarankan dan dipertimbangkan (Guba & Stufflebeam, 1970). Singkatnya, input merupakan model yang digunakan untuk menentukan bagaimana cara agar penggunaan sumberdaya yang ada bisa mencapai tujuan serta secara esensial memberikan informasi tentang apakah perlu mencari bantuan dari pihak lain atau tidak. Aspek input juga membantu menentukan prosedur dan desain untuk mengimplementasikan program
Evaluasi ini menolong mengatur keputusan, menentukan sumber-sumber yang ada, alternatif apa yang diambil, apa rencana dan strategi untuk mencapai kebutuhan, bagaimana prosedur kerja untuk mencapainya.

3) Evaluasi Proses
Evaluasi proses dalam model CIPP diarahkan pada seberapa jauh kegiatan yang dilaksanakan sudah terlaksana sesuai dengan rencana. Evaluasi proses dalam model CIPP menunjuk pada "apa" (what) kegiatan yang dilakukan dalam program, "siapa" (who) orang yang ditunjuk sebagai penanggung jawab program, "kapan" (when) kegiatan akan selesai. Dalam model CIPP, evaluasi proses diarahkan pada seberapa jauh kegiatan yang dilaksanakan di dalam program sudah terlaksana sesuai dengan rencana. Oleh Stufflebeam(dalam Arikunto, 2004), mengusulkan pertanyaan untuk proses antara lain sebagai berikut:
a. Apakah pelaksanaan program sesuai dengan jadwal.
b. Apakah yang terlibat dalam pelaksanaan program akan sanggup menangani kegiatan selama program berlangsung ?
c. Apakah sarana dan prasarana yang disediakan dimanfaatkan secara maksimal?
d. Hambatan-hambatan apa saja yang dijumpai selama pelaksanaan program?
4) Evaluasi pada produk atau hasil
Evaluasi produk diarahkan pada hal-hal yang menunjukkan perubahan yang terjadi pada masukan mentah. Pertanyaan-pertanyaan yang bisa diajukan antara lain:
a. Apakah tujuan-tujuan yang ditetapkan sudah tercapai?
b. Apakah kebutuhan peserta didik sudah dapat dipenuhi selama proses belajar mengajar?

3.      STANDAR UNTUK MENILAI PROGRAM
Standar merupakan aspek penting dari setiap praktek evaluasi. Standar membantu memastikan bahwa evaluator dan klien mereka berkomunikasi secara efektif dan mencapai pemahaman, yang jelas saling mengenal kriteria yang harus dipenuhi oleh evaluasi. Standar tersebut diperlukan untuk meniadakan kemungkinan bahwa salah satu stakeholder atau evaluator melakukan kecurangan, mungkin membelokkan hasil evaluasi yang sesuai dengan diri mereka sendiri. Tanpa standar yang mendefinisikan layanan evaluatif, kredibilitas prosedur evaluasi, hasil, atau pelaporan yang tersisa akan diragukan. Untuk lebih berwibawa dan kredibel, standar evaluasi harus mencerminkan konsensus umum oleh tokoh-tokoh terkemuka di organisasi profesi yang bersangkutan
Evaluator telah membentuk prinsip-prinsip standar yang digunakan untuk membimbing dan menilai pekerjaan mereka, Selama dua dekade terakhir, profesionalisme evaluasi telah cukup diperkuat oleh pengembangan dan penggunaan standar evaluasi. Selama ini, standar profesional, diarahkan pada praktek melalui prinsip-prinsip yang disepakati, telah menjadi bagian integral dari desakan masyarakat luas pada kriteria dan langkah-langkah untuk menjamin kualitas dan akuntabilitas evaluasi.
Ada beberapa standar yang digunakan Standar Evaluasi Program  yang dikembangkan oleh Badan Komite Bersama.  Standar Evaluasi pendidikan dan diakreditasi oleh Institut Standar Nasional Amerika; Panduan Prinsip-prinsip bagi Evaluator yang dikembangkan dan secara resmi disahkan oleh Asosiasi Evaluasi Amerika dan Komite Etik, Standar Audit Pemerintah yang dikembangkan oleh Kantor Akuntabilitas Pemerintah AS dan diperlukan  dalam Audit Program Pemerintah AS.
Komite Bersama (1994) mendefenisikan standar evaluasi sebagai “Prinsip yang disepakati bersama oleh orang yang terlibat dalam profesi evaluasi, dalam rangka meningkatkan kualitas dan keadilan evaluasi”. Satuan Tugas AEA mencatat bahwa prinsip evaluasi disediakan oleh evaluator dengan panduan yang bersifat umum, konseptual bukan operasional. Kantor Akuntabilitas pemerintah menggambarkan standar audit sebagai pernyataan pertanggung jawaban dari seorang auditor. Pada dasarnya, ketiga dokumen membuat prinsip umum, yang merupakan hal yang penting. Untuk membantu komunikasi, akan dibahas tentang standar evaluasi berdasarkan Standar Evaluasi Program, Pengembangan Prinsip Evaluasi AEA, dan Standar Audit Pemerintah. Ketiga  otoritas dokumen  memberikan arahan untuk membimbing dan mengarahkan studi program evaluasi.
A.    Kebutuhan akan Standar Evaluasi
Setiap evaluator profesional harus tahu, mengerti, dan setia menerapkan standar yang sesuai praktek profesi evaluasi. Standar dan Kode ditetapkan dan diterapkan untuk kepentingan menjamin dan meningkatkan kualitas dan melindungi masyarakat dari tindakan buruk, berbahaya, penipuan jasa evaluasi, atau prilaku boros. Standar evaluasi program memiliki fungsi yang spesifik:
1)                 Memberikan prinsip-prinsip umum untuk mengatasi berbagai masalah praktis dalam pekerjaan evaluasi
2)                 Membantu memastikan bahwa evaluator akan menggunakan praktik terbaik bidang evaluasi yang tersedia
3)                 Memberikan arah untuk melakukan evaluasi perencanaan yang efisien dan termasuk pertanyaan evaluasi yang bersangkutan.
4)                 Menyediakan konten utama untuk pelatihan dan pembimbingan evaluator dan peserta lain dalam proses evaluasi.
5)                 Kehadiran evaluator dan konstituen mereka dilayani dengan bahasa yang sama untuk mempermudah komunikasi dan kolaborasi
6)                 Membantu arsip evaluator dan memelihara kredibilitas di antara profesi lain
7)                 Mendapatkan dan mempertahankan kredibilitas terhadap badan pengawasan publik dan klien
8)                 Mendapatkan dan memelihara kepercayaan publik di bidang evaluasi
9)                 Melindungi konsumen dan masyarakat dari praktek-praktek berbahaya atau merusak
10)             Menyediakan kriteria objektif untuk menilai dan memperkuat layanan evaluasi
11)             Memberikan dasar untuk akuntabilitas oleh evaluator
12)             Memberikan dasar untuk mengadili klaim malpraktek dan sengketa lainnya
13)             Menyediakan kerangka kerja konseptual dan definisi bekerja untuk membantu panduan penelitian dan pengembangan evaluasi.
Berdasarkan fungsi ini, kepatuhan terhadap standar profesional untuk evaluasi adalah di jantung dari profesionalisme dan keselarasan, guna layanan evaluasi. Kami percaya bahwa pernyataan standar untuk evaluasi dapat melayani fungsi di bidang evaluasi.
Beberapa standar disajikan secara sistematis dikembangkan, memiliki kredibilitas yang kuat, dan secara periodik ditinjau dan diperbarui. Tiga set standard yang berbeda tetapi juga saling melengkapi. Belajar dan mengembangkan fasilitas untuk menerapkan tiga set yang berbeda dari standar selektif akan meningkatkan profesionalisme seseorang dan fleksibilitas dalam melakukan evaluasi. Evaluator yang dilengkapi dengan set laporan alternatif standar dibantu dalam melakukan evaluasi berbasis standar dalam berbagai disiplin ilmu dan wilayah layanan. Bahkan kemudian sering menguntungkan untuk mengarahkan bimbingan dari dua atau bahkan semua tiga set standar.
B. Latar Belakang Standar Evaluasi Program
Secara historis, evaluator program yang sudah diperlukan tentang standar profesional yang eksplisit untuk evaluasi program, baru berkembang hanya selama l980 dan 1990-an. Agen federal telah didanai ribuan oleh Presiden Lyndon Jhonson untuk mengevaluasi program sebagai bagian perang melawan kemiskinan dan umumnya mereka menemukan pembiayaan  mahal dalam kualitas buruk. Upaya untuk mereformasi gerakan program evaluasi termasuk standar otoritatif dalam rangka menetapkan prinsip-prinsip untuk menilai dan memperkuat rencana evaluasi dan laporan.
Dengan evolusi evaluasi sebagai profesi menjadi kenyataan hanya selama kuartal terakhir abad kedua puluh, berkembang kode perilaku di antara praktisi yang dapat diterima evaluator. Komite Bersama tentang Standar Evaluasi Pendidikan didirikan pada tahun 1975. Selama bertahun-tahun, ini komite tetap terus disponsori oleh 12 hingga 15 tokoh masyarakat profesional dengan keanggotaan keseluruhan berjumlah hampir 3 juta. Pembiayaan Komite dilakukan untuk melakukan pengembangan berkelanjutan, review, dan revisi Standar untuk evaluasi pendidikan. Komite ini mengeluarkan Standar Evaluasi Pendidikan Program, Proyek, dan Materi pada tahun 1981 dan versi terbaru pada tahun 1994, Standar Program Evaluasi. Komite Bersama juga menerbitkan standar untuk mengevaluasi tenaga kependidikan pada tahun 1988, dan pada tahun 2003 ini mengeluarkan seperangkat standar untuk evaluasi siswa. Komite Bersama diakreditasi oleh American National Standards Institute sebagai satu-satunya badan yang diakui untuk menetapkan standar untuk evaluasi pendidikan di Amerika Serikat.
Pada waktu yang hampir sama dengan standar Komite Bersama diterbitkan, Evaluasi Penelitian Sosial (ERS) menghasilkan perangkat kedua. ERS, didirikan pada tahun 1976, berfokus pada profesi evaluasi program seperti yang dilakukan di berbagai disiplin ilmu, program pemerintah, dan area layanan. Hal ini diterbitkan serangkaian standar berlabel Standar Evaluasi Penelitian Sosial untuk Evaluasi Program (Komite Standard ERS, 1982). Ada lima puluh lima hal secara singkat, pernyataan yang memperingatkan dibagi dalam kategori berikut: Perumusan dan Negosiasi, Struktur dan Desain, Pendataan dan Penyusunan, Analisis Data dan interpretasi, Komunikasi dan Pengungkapan, dan penggunaan Hasil. Pada tahun 1986, ERS digabung dengan Jaringan Evaluasi (ENET) ke Badan Asosiasi Evaluasi America (AEA), yang memiliki keanggotaan hampir tiga ribu. AEA kemudian digabung dengan Standar ERS menghasilkan Prinsip-Prinsip Panduan bagi Evaluator Program (Shadishi, Newman, Scheirer, & Wye, 1995). Pada bulan Juli 2004, keanggotaan AEA meratifikasi revise edisi dari Prinsip-Prinsip Panduan bagi evaluator program.
Kantor Akuntansi Umum AS eksplisit termasuk evaluasi program tahun 1994 dan 2003 nya revisi Standar Audit Pemerintah. Pemerintah Federal AS dalam melawan Kemiskinan, yang dimulai pada 1965, menelurkan banyak program federal yang mahal, yang membutuhkan dana besar untuk audit program keuangan. Pada tahun 1972, Kantor Akuntan Umum mulai mengeluarkan Standar Audit Pemerintahan. Edisi awal dan revisi awal dari standar ditangani hampir secara eksklusif dengan aspek keuangan program federal. Tahun 2003 edisi meliputi audit program dan evaluasi sebagai salah satu fokus dari standar umum dan menyajikan bab-bab yang berisi standar pekerjaan lapangan dan pelaporan untuk audit kinerja.
Terutama yang patut dicatat dalam edisi 2003 adalah bagian baru pada kemandirian, yang secara bersamaan menyediakan auditor dari kedua audit dan jasa konsultasi kepada entitas yang sama. Pergaulan seperti jasa dipandang sebagai konflik kepentingan tidak dapat diterima. Ini dapat menyebabkan auditor untuk mengevaluasi pekerjaan mereka sendiri dan dengan demikian kehilangan Kemandirian dan kredibilitas, mungkin mengalah pada tekanan terlarang laporan distors. Ini telah dibuat secara nyata jelas di sektor swasta.


C. Komite Bersama Standar Evaluasi Program
Tujuh belas anggota tetap Komite Bersama Standar Evaluasi Pendidikan diangkat oleh dua belas organisasi profesional. Organisasi dan anggota yang ditunjuk mereka mewakili berbagai spesialisasi: akredatasi sekolah, konseling dan bimbingan, kurikulum, administrasi pendidikan, pendidikan tinggi, pengukuran pendidikan, penelitian pendidikan, tata kelola pendidikan, evaluasi program, psikologi, statistik, dan pengajaran. Suatu persyaratan mendasar dari komite adalah bahwa hal itu termasuk tentang jumlah yang sama anggota yang mewakili perspektif klien dan evaluator. Selama bertahun-tahun, jumlah organisasi Komite Bersama mensponsori telah sedikit meningkat.
Setiap edisi Standar Evaluasi Program telah diperinci dari tiga puluh standar. Setiap standar berisi pernyataan standar, penjelasan tentang kebutuhannya, alasan, pedoman untuk melaksanakannya, kesalahan umum yang harus diantisipasi dan dihindari, dan kasus ilustratif. Akhir 1994 versi Pendidikan dan pelatihan dalam pengaturan seperti hukum, bisnis, pemerintah, kesehatan, militer, keperawatan, pengembangan profesional, sekolah dasar dan menengah, lembaga pelayanan sosial, dan perguruan tinggi dan universitas.
Tiga puluh standar dikelompokkan sesuai dengan empat atribut penting dari evaluasi: kegunaan, kelayakan, kepatutan dan akurasi. Komite Bersama menyarankan baik evaluator dan klien untuk menerapkan tiga puluh standar sehingga evaluasi mereka memuaskan semua atribut penting dari evaluasi empat suara. Empat konsep mendasar dalam Standar Evaluasi Program adalah utilitas, kelayakan, kepatutan, dan akurasi.
UTULITAS
Suatu evaluasi harus berguna. Ini harus ditujukan kepada orang-orang dan kelompok yang terlibat bertanggung jawab untuk melaksanakan program yang dievaluasi. Para evaluator harus memastikan kebutuhan informasi para pengguna dan melaporkan kepada mereka umpan balik evaluatif yang relevan secara jelas, ringkas, dan tepat waktu. Ini akan membantu mereka mengidentifikasi dan mengurus masalah program dan menyadari kekuatannya. Ini yang paling penting harus menjawab pertanyaan pengguna juga mendapatkan berbagai informasi yang dibutuhkan untuk menilai prestasi dan kelayakan program. Evaluasi seharusnya tidak hanya melaporkan umpan balik tentang kekuatan dan kelemahan, tetapi juga harus membantu pengguna dalam mempelajari dan menerapkan temuan. Standar utilitas mencerminkan konsensus umum ditemukan dalam literatur evaluasi bahwa evaluasi program secara efektif harus membahas kebutuhan informasi dari klien. Untuk itu, harus menginformasikan proses perbaikan program. Jika tidak ada prospek bahwa temuan dari evaluasi dimaksud akan digunakan, evaluasi tidak boleh dilakukan.
KELAYAKAN
Suatu evaluasi harus layak. Evaluasi menggunakan prosedur evaluasi tepat dan beroperasi di lingkungan program. harus menghindari hal yang mengganggu atau merusak dalam program ini. Kita harus mengontrol sebanyak mungkin kekuatan politik yang mungkin menghambat atau merusak evaluasi. Dan itu harus dilakukan secara efisien dan efektif mungkin. Standar menekankan bahwa prosedur evaluasi harus bisa diterapkan di dunia nyata, tidak hanya di laboratorium eksperimental. Secara keseluruhan, standar kelayakan memerlukan evaluasi harus realistis, bijaksana, diplomatik, layak politik, hemat waktu, dan hemat biaya. Eksperimen sering bertentangan dan tidak layak dalam pengaturan lapangan, dan dalam kasus tersebut, evaluator harus lebih realistis, naturalistik, dan studi multimetode.
KEPATUTAN
Suatu evaluasi harus memenuhi kondisi kepatutan. Harus didasarkan pada kejelasan, dan perjanjian tertulis dimana mendefinisikan kewajiban evaluator dan klien untuk mendukung pelaksanakan evaluasi. Evaluasi harus melindungi hak semua pihak yang terlibat dan martabat. Harus jujur ​​dan tidak terdistorsi dengan cara apapun. Laporan harus dibebaskan sesuai dengan perjanjian dan dengan kebebasan yang berlaku undang-undang informasi. Selain itu, laporan harus menyampaikan secara seimbang kelemahan dan kekuatannya. Standar merefleksikan fakta bahwa evaluasi dapat mempengaruhi banyak orang, baik negatif maupun secara positif. Standar kepatutan adalah desain untuk melindungi hak-hak semua pihak dalam evaluasi. Secara umum, standar kepatutan mengharuskan evaluasi dilakukan secara sah, etis, dan dengan memperhatikan kesejahteraan mereka yang terlibat dalam evaluasi serta mereka yang terkena dampak hasil.
AKURASI
Suatu evaluasi harus akurat. Ini jelas harus menjelaskan program seperti yang direncanakan dan dengan benar-benar dieksekusi. Kita harus menjelaskan latar belakang program dan pengaturan. Harus melaporkan temuan yang valid dan reliabel. Ini harus mengidentifikasi dan membuktikan kelayakan sumber informasi evaluasi, metode pengukuran dan perangkat, prosedur analitis, dan ketentuan untuk pengendalian bias dan metaevaluation. Ini harus menyajikan kekuatan, kelemahan, dan keterbatasan rencana evaluasi, prosedur, informasi, dan kesimpulan. Ini harus menggambarkan dan menilai sejauh mana evaluasi memberikan penilaian yang independen berisi sebagai kaitan untuk penilaian diri yang mungkin bias. Secara umum, kelompok akhir dari standar memerlukan evaluator untuk memperoleh informasi teknis suara, menganalisis dengan benar, melaporkan kesimpulan dibenarkan, catat setiap peringatan yang bersangkutan, dan mendapatkan atau melakukan metaevaluation. Nilai keseluruhan evaluasi terhadap dua belas standard akurasi adalah suatu indeks validitas keseluruhan evaluasi ini.
IKHTISAR STANDAR EVALUASI PROGRAM.
KEGUNAAN
Standar utilitas dimaksudkan untuk memastikan bahwa evaluasi akan melayani kebutuhan pengguna informasi.
1.    U1 Identifikasi Stokeholder. Orang yang terlibat dalam atau dipengaruhi oleh evaluasi, sehingga kebutuhan mereka dapat diatasi.
2.    U2 Kredibilitas Evaluator. Orang yang melaksanakan evaluasi harus baik, dapat dipercaya dan kompeten untuk melakukan evaluasi, sehingga hasil evaluasi mencapai maksimum pada tingkat kredibilitas dan penerimaannya.
3.    U3 Informasi Lingkup dan Seleksi. Informasi yang dikumpulkan harus dipilih secara luas untuk menjawab pertanyaan yang bersangkutan mengenai program dan responsif terhadap kebutuhan dan kepentingan klien dan pemangku kepentingan tertentu lainnya.
4.    U4 Identifikasi Nilai. Perspektif, prosedur, dan pemikiran yang digunakan untuk menafsirkan temuan harus hati-hati dijelaskan, sehingga menjadi dasar untuk penilaian yang jelas.
5.    U5 Kejelasan Laporan. Laporan evaluasi harus secara jelas menggambarkan program yang sedang dievaluasi, termasuk konteks dan tujuan, prosedur, dan temuan evaluasi, sehingga informasi penting yang disediakan, dan mudah dipahami.
6.    U6 Ketepatan waktu dan Diseminasi Laporan, temuan sementara yang signifikan dan laporan evaluasi harus disebarluaskan kepada pengguna yang dimaksudkan, sehingga mereka dapat menggunakan secara tepat waktu.
7.    U7 Evaluasi Dampak. Evaluasi harus direncanakan, dilaksanakan, dan dilaporkan dengan cara yang mendorong tindak lanjut oleh para pemangku kepentingan, sehingga kemungkinan bahwa evaluasi akan digunakan meningkat.
KELAYAKAN
Standar kelayakan dimaksudkan untuk memastikan bahwa evaluasi akan menjadi realistis, bijaksana, diplomatik, dan hemat.
·      Fl  Prosedur Praktis. Prosedur evaluasi harus praktis, untuk menjaga gangguan seminimal mungkin untuk memperoleh informasi yang diperlukan,
·      F2 Viabilitas Politik. Evaluasi harus direncanakan dan dilakukan dengan mengantisipasi posisi yang berbeda dari berbagai kepentingan kelompok, sehingga kerjasama mereka dapat diperoleh dan agar ada upaya yang membatasi salah satu kelompok untuk operasi evaluasi atau bias atau penyalahgunaan hasilnya dapat dihindari atau menetralisir.
·      F3 Efektivitas Biaya. Evaluasi harus efisien dan menghasilkan informasi nilai yang cukup, sehingga sumber daya yang dikeluarkan dapat dibenarkan.
KEPATUTAN
Standar kepatutan dimaksudkan untuk memastikan bahwa evaluasi akan dilakukan secara hukum, etis, dan dengan memperhatikan kesejahteraan mereka yang terlibat dalam evaluasi, serta dipengaruhi oleh hasil-hasilnya.
·      P1 Orientasi Layanan. Evaluasi harus dirancang untuk membantu organisasi dan efektif melayani kebutuhan berbagai peserta yang ditargetkan.
·      P2 Kewajiban formal. Kewajiban para pihak formal untuk evaluasi (apa yang harus dilakukan, bagaimana, oleh siapa, kapan) harus disetujui secara tertulis, sehingga pihak yang berwajib mematuhi semua kondisi dari perjanjian resmi atau negosiasi ulang itu.
·      P3 Hak Asasi Manusia. Evaluasi harus dirancang dan dilaksanakan untuk menghormati dan melindungi hak dan kesejahteraan manusia.
·      P4 Interaksi Manusia. Evaluator harus menghormati harkat dan martabat manusia dalam interaksi mereka dengan orang lain yang terkait dengan evaluasi, sehingga peserta tidak merasa terancam atau dirugikan.
·      P5 Penilaian Lengkap dan Adil. Evaluasi harus lengkap dan adil dalam pemeriksaan dan pencatatan kekuatan dan kelemahan program yang dievaluasi, sehingga kekuatan dapat dibangun dan masalah dapat ditangani.
·      P6 Pengungkapan Temuan. Para pihak formal untuk evaluasi harus memastikan bahwa temuan evaluasi bersama dibuat agar dapat diakses oleh orang yang terkena dampak evaluasi dan lain-lain dengan hak legal menyatakan menerima hasilnya.
·      P7 Benturan Kepentingan. Konflik kepentingan harus ditangani secara terbuka dan jujur, sehingga tidak mengorbankan proses evaluasi dan hasil.
·      P8 Tanggung Jawab Fiskal. Alokasi evaluator dan pengeluaran sumber daya harus mencerminkan prosedur yang akuntabilitas dan sebaliknya lebih bijaksana dan etis bertanggung jawab, sehingga pengeluaran dicatat dan tepat.
KETEPATAN
Standar akurasi dimaksudkan untuk memastikan bahwa evaluasi akan mengungkapkan dan menyampaikan informasi teknis yang memadai tentang fitur yang menentukan nilai atau manfaat dari program yang dievaluasi.
•      Al Dokumentasi Program. Program yang dievaluasi harus dijelaskan dan didokumentasikan secara jelas dan akurat, sehingga program ini dengan jelas diidentifikasi.
•      A2 Analisis Konteks. Konteks di mana program ada harus diperiksa secara rinci, sehingga mungkin mempengaruhi program dan dapat diidentifikasi.
•      A3 Menjelaskan Tujuan dan Prosedur. Tujuan dan prosedur evaluasi harus dimonitor dan dijelaskan secara cukup rinci, sehingga dapat diidentifikasi dan dinilai.
•      A4 Sumber Informasi. Sumber informasi yang digunakan dalam evaluasi program harus dijelaskan cukup detail, sehingga kecukupan informasi dapat dinilai.
•      A5 Pembentukan Informasi. Pengumpulan dan prosedur informasi harus dipilih atau dikembangkan dan kemudian diimplementasikan, sehingga mereka akan memastikan bahwa interpretasi berlaku untuk penggunaan yang dimaksudkan.
•      A6 Informasi Terpercaya. Pengumpulan dan prosedur Informasi harus dipilih atau dikembangkan dan kemudian diimplementasikan, sehingga mereka akan memastikan bahwa informasi yang diperoleh cukup dapat diandalkan untuk penggunaan yang dimaksudkan.
•      A7 Informasi Sistematik. Informasi yang dikumpulkan, diproses, dan dilaporkan dalam suatu evaluasi harus secara sistematis terakhir, dan setiap kesalahan yang ditemukan harus diperbaiki.
•      A8 Analisis Kuantitatif Informasi. Informasi kuantitatif dalam suatu evaluasi harus secara tepat dan sistematis dianalisis, sehingga pertanyaan evaluasi secara efektif dijawab.
•      A9 Analisis Kualitatif Informasi. Informasi kualitatif dalam suatu evaluasi harus secara tepat dan sistematis dianalisis, sehingga pertanyaan evaluasi secara efektif dijawab.
•      A10 Kesimpulan. Kesimpulan yang dicapai dalam evaluasi harus secara eksplisit dibenarkan, sehingga stakeholder dapat menilai.
•      A11 Pelaporan Imparsial. Prosedur pelaporan harus waspada terhadap gangguan yang disebabkan oleh perasaan pribadi dan bias dari setiap hal yang menyangkut evaluasi, sehingga laporan evaluasi cukup mencerminkan temuan evaluasi.
•      A12 Metaevaluation. Evaluasi itu sendiri harus secara formatif dan summatively dievaluasi terhadap ini dan standar terkait lainnya, sehingga perilakunya dengan tepat dipandu dan, pada saat penyelesaian, stakeholder erat dapat memeriksa kekuatan dan kelemahan
Komite bersama yang ditawarkan rekomendasi yang mana dari tiga puluh standar yang paling berlaku untuk setiap sepuluh tugas dalam proses evaluasi: memutuskan apakah akan mengevaluasi, mendefinisikan masalah evaluasi, merancang evaluasi, mengumpulkan informasi, menganalisis informasi, pelaporan, evaluasi penganggaran evaluasi, kontrak untuk evaluasi, pengelolaan evaluasi, dan mengulur-ulur evaluasi. Meskipun Komite bersama menyimpulkan bahwa semua standar yang berlaku di semua evaluasi program pendidikan, analisis fungsional ini dimaksudkan untuk membantu evaluator cepat mengidentifikasi standar-standar yang mungkin paling relevan dengan tugas-tugas evaluasi tertentu.
Komite ini disajikan dan menggambarkan lima langkah umum untuk menerapkan standar: (1) mengenal Standar Evaluasi Program, (2) memperjelas tujuan dari evaluasi program, (3) memperjelas konteks evaluasi program, (4 ) menerapkan standar masing-masing berdasarkan tujuan dan konteks, dan (5) memutuskan apa yang harus dilakukan dengan hasilnya. Komite juga menyarankan cara-cara untuk menggunakan standar dalam merancang program pelatihan evaluasi.
Standar Evaluasi Program ini adalah terutama berlaku dalam evaluasi evaluasi, yaitu metaevaluasi. Dalam studi tersebut, metaevaluator mengumpulkan informasi dan penilaian tentang sejauh mana sebuah evaluasi program memenuhi persyaratan untuk memenuhi setiap standar. Kemudian evaluator menilai apakah standar masing-masing ditangani, sebagian ditangani, tidak diperhatikan, atau tidak berlaku. Sebuah profil dari penilaian ini menyediakan dasar untuk menilai evaluasi terhadap pertimbangan utilitas, kelayakan, dan akurasi dan dalam kaitannya dengan standar masing-masing. Ketika metaevaluasi tersebut dilakukan pada awal tahun evaluasi, mereka memberikan umpan balik diagnostik penggunaan dalam memperkuat evaluasi. Ketika selesai setelah evaluasi program, metaevaluation membantu pengguna menilai dan membuat penggunaan yang bijaksana dari temuan-temuan evaluasi dan rekomendasi atau menolak mereka sebagian atau bahkan sepenuhnya.
D. Panduan Prinsip Evaluasi AEA
Pada bulan November 1992, AEA menciptakan sebuah gugus tugas dan dibebankan dengan mengembangkan prinsip-prinsip panduan umum untuk praktek evaluasi. Gugus tugas yang dipimpin oleh William R. Shadish, kemudian merancang Panduan Prinsip Evaluasi. AEA kemudian mempublikasikan prinsip-prinsip dalam edisi khusus dari Arah baru untuk berkala Evaluasi Program (AEA Task Force on Guiding Principles for Evaluators, 1995).
Pentingnya Panduan Prinsip
Panduan Prinsip AEA menyediakan kode perilaku profesi evaluator. Prinsip ini juga berlaku untuk mengevaluasi desain evaluasi dan laporan di berbagai macam disiplin ilmu. Mereka mendorong penilai untuk mengamati penyelidikan sistematis dan menghormati masyarakat dengan bertindak jujur ​​dan mengutamakan kesejahteraan masyarakat melalui karir profesional mereka.
Pedoman Prinsip Asosiasi Evaluasi Amerika (AEA)
A. Pencarian Sistematis. Evaluator melakukannya dengan sistematis, berbasis data pertanyaan, dan dengan demikian harus:
1.        Mematuhi standar teknis tertinggi sesuai dengan metode yang mereka gunakan.
2.        Jelajahi kekurangan dan kekuatan klien dari pertanyaan dan pendekatan evaluasi.
3.        Mengkomunikasikan pendekatan, metode, dan keterbatasan evaluasi secara akurat dan cukup rinci untuk memungkinkan orang lain untuk memahami, menafsirkan, dan mengkritik pekerjaan mereka.
B. Kompetensi. Evaluator memberikan kinerja yang kompeten untuk stakeholder, dan dengan demikian harus:
1.           Pastikan bahwa tim evaluasi bersama memiliki pendidikan, kemampuan, keterampilan, dan pengalaman yang tepat untuk evaluasi.
2.           Pastikan bahwa tim evaluasi kolektif menunjukkan kompetensi budaya dan menggunakan strategi evaluasi yang tepat dan keterampilan untuk bekerja dengan kelompok-kelompok budaya yang berbeda.
3.           Praktek dalam keterbatasan kompetensi mereka, menolak untuk melakukan evaluasi secara substansial di luar batas-batas tersebut, dan membuat keterbatasan yang jelas pada evaluasi yang mungkin timbul jika tidak layak.
4.           Berusaha untuk mempertahankan dan meningkatkan kompetensi mereka dalam rangka untuk mninggikan tingkat kinerja dalam evaluasinya.
5.           C. Integritas / Kejujuran. Evaluator menampilkan kejujuran dan integritas dalam perilaku mereka sendiri, dan berusaha untuk menjamin kejujuran dan integritas proses evaluasi keseluruhan, dan dengan demikian harus:
6.           Bernegosiasi jujur ​​dengan klien dan pihak terkait mengenai biaya, tugas, keterbatasan metodologi, cakupan hasil, dan penggunaan data.
7.           Menyingkap peran atau hubungan apapun yang dapat menimbulkan konflik kepentingan yang nyata sebelum menerima sebuah tugas.
8.           Mencatat dan melaporkan semua perubahan pada rencana awal proyek dinegosiasikan, dan alasan bagi mereka, termasuk kemungkinan dampak yang akan terjadi
9.           Lebih menghormati diri sendiri, klien mereka, dan pemangku kepentingan lainnya dan nilai-nilai terkait dengan evaluasi.
10.       Membuat prosedur secara akurat, data, temuan, dan berusaha untuk mencegah atau memperbaiki penyalahgunaan pekerjaan mereka oleh orang lain.
11.       Bekerja untuk menyelesaikan segala masalah yang berkaitan dengan prosedur atau kegiatan akan menghasilkan informasi evaluatif menyesatkan, menolak untuk melakukan evaluasi jika masalah tidak dapat diselesaikan, dan berkonsultasi rekan kerja atau stakeholder yang relevan tentang cara lain untuk melanjutkan jika menurun tidak layak.
12.       Mengungkapkan semua sumber dukungan keuangan untuk evaluasi, dan sumber permintaan untuk evaluasi.
D. Menghargai Orang. Evaluator menghormati keamanan, martabat, dan harga diri responden, peserta program, klien, dan stakeholder evaluasi lainnya, dan dengan demikian harus:
1.            Mencari pemahaman yang komprehensif dari elemen kontekstual dari evaluasi.
2.            Mematuhi etika profesi saat ini, standar, dan peraturan mengenai kerahasiaan, persetujuan, dan potensi risiko atau merugikan kepada peserta.
3.            Berusaha untuk memaksimalkan manfaat dan mengurangi kerugian yang tidak perlu ada, yang mungkin terjadi dari evaluasi dan hati-hati menilai manfaat atau prosedur karena potensi risikonya.
4.            Melakukan evaluasi dan mengkomunikasikan hasil-hasil dengan cara menghormati martabat para pemangku kepentingan dan harga diri.
5.            Ekuitas sosial dalam evaluasi, jika layak, sehingga mereka yang memberikan informasi akan mendapat imbalan.
6.            Memahami, menghargai, dan mempertimbangkan perbedaan antara para pemangku kepentingan seperti budaya, agama, ketidakmampuan, orientasi umur, seksual dan etnis.
1.         E. Tanggung Jawab Publik. Evaluator mengartikulasikan dan memperhitungkan keragaman kepentingan umum dan publik dan nilai-nilai, dan dengan demikian harus:
1.      Sertakan perspektif yang relevan dan kepentingan berbagai stakeholder.
2.      Mempertimbangkan tidak hanya operasi langsung dan hasil evaluasi, tetapi juga asumsi luas, implikasi dan potensi efek samping.
3.      Memungkinkan akses para stakeholder, dan secara aktif menyebarkan informasi evaluatif, dan hasil evaluasi hadir dalam bentuk dimengerti bahwa orang menghormati dan kehormatan menjanjikan kerahasiaan.
4.      Menjaga keseimbangan antara kebutuhan stakeholder dan klien dan kepentingan lain.
5.      Mempertimbangkan kepentingan umum dan baik, akan melampaui analisis kepentingan stakeholcier khususnya mempertimbangkan kesejahteraan masyarakat secara keseluruhan.
E. Penggunaa Standar Evaluasi
Meskipun tiga set standar diperiksa dalam bab ini bervariasi dalam detail dan orientasi substantif, mereka saling melengkapi, tidak berkontradiksi. Pada dasarnya mereka konsisten dalam prinsip-prinsip yang dianjurkan tetapi memberikan penekanan yang berbeda, cross-cek, dan perawatan melengkapi persyaratan untuk evaluasi. Semua tiga set standar secara substansial mendukung untuk apa yang merupakan praktik evaluasi. Evaluasi harus tidak tercela, dengan evaluator mengikuti semua hukum dan kode etik. Selain itu, evaluator harus menghasilkan temuan yang valid dan harus berhati-hati untuk tidak menyajikan kesimpulan unsupportable dan rekomendasi. Selain itu, evaluator harus hati-hati memilah peran mereka sebagai inquirers independen dari peran sosial mereka advokasi dan memastikan bahwa evaluasi mereka tidak rusak oleh konflik kepentingan. Semua tiga set yang didasarkan pada dalil bahwa suara audit dan evaluasi sangat penting untuk fungsi normal dari suatu Penyedia layanan masyarakat yang sehat dan pemerintah harus secara teratur tunduk layanan mereka untuk evaluasi, dan evaluator harus memberikan layanan yang legal, etis, efektif, akuntabel, dan untuk kepentingan umum. Standar adalah suatu kekuatan yang besar untuk membawa tentang layanan suara diperlukan evaluasi. Jelas, tiga set standar terdiri dari sumber daya berharga dari prinsip-prinsip, konsep, dan prosedur untuk evaluator dan klien mereka.
Tergantung pada tugas evaluasi tertentu, tiga set dapat digunakan bergantian atau digabungkan. Perbandingan substansi Komite Standar bersama dan  dokumen Panduan Prinsip AEA 1995 mengungkapkan perbedaan utama dan persamaan dalam standar dan prinsip-prinsip (Covert, 1995; Sanders, 1995 ). Pada dasarnya segala sesuatu yang tercakup dalam prinsip AEA juga diliput oleh standar Komite Bersama. Namun, cakupan yang terakhir adalah lebih luas, jauh lebih rinci, dan menggali lebih dalam masalah evaluasi. Tidak ada perbandingan yang sama dari semua tiga set standar yang telah diterbitkan. Sebagai penutup, kami menyajikan kembali pada setiap set standar, mendiskusikan prioritas untuk menggunakan setiap set, dan garis besar proses yang umum untuk menerapkan standar.
Panduan Prinsip AEA mengandaikan bahwa evaluasi program harus memenuhi persyaratan untuk menghormati kompetensi penyelidikan sistematis, integritas dan kejujuran bagi orang-orang, dan tanggung jawab untuk kesejahteraan umum dan publik. Dari tiga set standar, Panduan Prinsip-Prinsip memiliki penerapan yang luas dan yang paling umum, secara resmi didukung oleh Asosiasi Evaluasi Amerika dan berlaku untuk evaluasi program di berbagai sektor pelayanan pemerintah dan sosial. Berisi dua puluh tiga pernyataan penting untuk mendukung lima prinsip, tapi juga ketiadaan kriteria rinci dan bimbingan. Diperdebatkan, standar ini harus diterapkan di semua AS. Program evaluasi, namun karena kurangnya spesifisitas mereka sering berfungsi terbaik sebagai seperangkat standar sekunder. Penerapannya berkembang di Amerika Serikat untuk semua evaluator yang memutuskan untuk melakukan evaluasi program mereka sesuai dengan Panduan Prinsip AEA.
Standar Evaluasi Program Komite Bersama ini difokuskan pada evaluasi program pendidikan di Amerika Serikat dan Kanada; menetapkan bahwa evaluasi harus memenuhi persyaratan utilitas, kelayakan, dan kepatutan, dan akurasi, dan memberikan pedoman yang luas dan beragam kasus ilustratif. Pembangunan disponsori oleh lebih dari selusin organisasi profesi yang bersangkutan dengan meningkatkan pendidikan. Juga, American National Standards Institute mengakreditasi Standar Evaluasi Program Komite Bersama untuk dipekerjakan dalam mengevaluasi program pendidikan di Amerika Serikat.
Standar Audit Pemerintahan yang difokuskan pada pemerintah AS yang disponsori program di semua bidang pelayanan pemerintah. Mereka menyediakan standar umum tentang kemandirian, penilaian profesional, kompetensi, dan kontrol kualitas dan jaminan. Mereka juga memberikan standar khusus untuk kerja lapangan dan pelaporan temuan untuk audit keuangan, keterlibatan atestasi, dan audit kinerja. Standar umum dan standar khusus banyak dipakai pada audit kinerja yang relevan dengan non pemerintah serta evaluasi pemerintah di berbagai bidang program. Meskipun mereka dimaksudkan untuk digunakan dalam mengevaluasi program-program pemerintah AS, standar tersebut telah digunakan di negara-negara di seluruh dunia.
Evaluator dapat menggunakan proses sembilan langkah umum dalam menerapkan semua tiga set standar:
1.         Menjadi benar akrab dengan setiap rangkaian standar melalui orientasi dan pelatihan yang sistematis.
2.         Memperjelas tujuan evaluasi itu.
3.         Memperjelas konteks evaluasi.
4.         Mencapai kesepakatan dengan klien yang sesuai dengan standar akan diterapkan dan, jika lebih dari satu set, yang utama, sekunder, atau tersier. Sebagai aturan praktis, Standar Audit Pemerintahan yang utama dalam evaluasi program pemerintah AS, Standar Evaluasi Program Komite Bersama harus utama dalam evaluasi program pendidikan non pemerintah di Amerika Utara, dan Panduan Prinsip AEA harus utama dalam evaluasi program non pemerintah di luar bidang pendidikan dan sekunder dalam semua evaluasi program lain di Amerika Serikat.
5.         Orientasi dan rujukan stakeholder di isi dari standar yang dipilih dan penerapan untuk memastikan kualitas dalam evaluasi dan akhirnya menilai evaluasi program.
6.         Menerapkan standar secara proaktif melalui pemeriksaan berkala pada semua aspek evaluasi.
7.         Memberikan pertimbangan untuk pihak independen yang terlibat untuk menggunakan standar dalam melakukan metaevaluations formatif atau sumatif. Setiap aplikasi formatif dari standar harus mencakup laporan tertulis berkala dan sesi umpan balik yang ditujukan untuk memperkuat evaluasi yang sedang berlangsung.
8.         Menerapkan standar untuk menilai keberhasilan evaluasi program. Seperti metaevaluation sumatif akan memiliki kredibilitas yang lebih jika dilakukan oleh evaluator independen.
9.         Pastikan bahwa laporan metaevaluation sumatif telah dibuat dan efektif dikomunikasikan ke seluruh pihak yang berwenang.
Semua tiga set standar menekankan bahwa standar adalah panduan umum dan bahwa evaluator dan klien mereka harus berkonsultasi dan mempekerjakan banyak materi yang lebih spesifik ketika berhadapan dengan rincian seperti desain, kasus pengukuran penelitian, statistik, pelaporan dan kontraktor
4.      Evaluasi

a.      Jenis-Jenis Evaluasi
    Berdasarkan tujuan, evaluasi dibedakan atas lima jenis :
1. Evaluasi diagnostik
Evaluasi diagnostik adalah evaluasi yang di tujukan untuk menelaah kelemahan-kelemahan siswa beserta faktor-faktor penyebabnya.
2. Evaluasi selektif
Evaluasi selektif adalah evaluasi yang di gunakan untuk memilih siswa yang paling tepat sesuai dengan kriteria program kegiatan tertentu.
3. Evaluasi penempatan
Evaluasi penempatan adalah evaluasi yang digunakan untuk menempatkan siswa dalam program pendidikan tertentu yang sesuai dengan karakteristik siswa.
4. Evaluasi formatif
Evaluasi formatif adalah evaluasi yang dilaksanakan untuk memperbaiki dan meningkatan proses belajar dan mengajar.
6. Evaluasi sumatif
Evaluasi sumatif adalah evaluasi yang dilakukan untuk menentukan hasil dan kemajuan bekajra siswa.

Berdasarkan sasaran, jenis evaluasi dibedakan atas :
1. Evaluasi konteks
Evaluasi yang ditujukan untuk mengukur konteks program baik mengenai rasional tujuan, latar belakang program, maupun kebutuhan-kebutuhan yang muncul dalam perencanaan
2. Evaluasi input
Evaluasi yang diarahkan untuk mengetahui input baik sumber daya maupun strategi yang digunakan untuk mencapai tujuan.
3. Evaluasi proses
Evaluasi yang di tujukan untuk melihat proses pelaksanaan, baik mengenai kalancaran proses, kesesuaian dengan rencana, faktor pendukung dan faktor hambatan yang muncul dalam proses pelaksanaan, dan sejenisnya.
4. Evaluasi hasil atau produk
Evaluasi yang diarahkan untuk melihat hasil program yang dicapai sebagai dasar untuk menentukan keputusan akhir, diperbaiki, dimodifikasi, ditingkatkan atau dihentikan.
5. Evaluasi outcom atau lulusan
Evaluasi yang diarahkan untuk melihat hasil belajar siswa lebih lanjut, yankni evaluasi lulusan setelah terjun ke masyarakat.

Berdasarkan lingkup kegiatan pembelajaran, jenis evaluasi dibedakan atas :
1. Evaluasi program pembelajaran
Evaluais yang mencakup terhadap tujuan pembelajaran, isi program pembelajaran, strategi belajar mengajar, aspe-aspek program pembelajaran yang lain.
2. Evaluasi proses pembelajaran
Evaluasi yang mencakup kesesuaian antara peoses pembelajaran dengan garis-garis besar program pembelajaran yang di tetapkan, kemampuan guru dalam melaksanakan proses pembelajaran, kemampuan siswa dalam mengikuti proses pembelajaran.
3. Evaluasi hasil pembelajaran
Evaluasi hasil belajar mencakup tingkat penguasaan siswa terhadap tujuan pembelajaran yang ditetapkan, baik umum maupun khusus, ditinjau dalam aspek kognitif, afektif, psikomotorik.

Jenis evaluasi berdasarkan objek dan subjek evaluasi
Berdasarkan objek :
1. Evaluasi input
Evaluasi terhadap siswa mencakup kemampuan kepribadian, sikap, keyakinan.
2. Evaluasi tnsformasi
Evaluasi terhadao unsur-unsur transformasi proses pembelajaran anatara lain materi, media, metode dan lain-lain.
3. Evaluasi output
Evaluasi terhadap lulusan yang mengacu pada ketercapaian hasil pembelajaran.
            Berdasarkan subjek :
1. Evaluasi internal
Evaluasi yang dilakukan oleh orang dalam sekolah sebagai evaluator, misalnya guru.

2. Evaluasi eksternal
Evaluasi yang dilakukan oleh orang luar sekolah sebagai evaluator, misalnya orangtua, masyarakat.

b.      Persyaratan Evaluasi
Langkah pertama yang perlu ditempuh guru dalam menilai prestasi belajar siswa adalah menyusun alat evaluasi(test instrument) yang sesuai dengan kebutuhan, dalam artian tidak menyimpang dari indicator dan jenis prestasi yang diharapkan.
Persyaratan pokok penyusunan alat evaluasi yang baik dalam perspektif psikologi belajar (The Psychology of learning) meliputi dua macam, yakni: 1). Reliabilitas; 2). Validitas (Cross, 1974; Barlow, 1985; Butler, 1990).
1)Reliabilitas
Secara sederhana, reliabilitas (reliability) berarti hal tahan uji atau dapat dipercaya.Sebuah alat evaluasi dipandang reliable atau tahan uji apabila memiliki konsistensi atau keajegan hasil.
2)      Validitas
Validitas berarti keabsahan atau kebenaran. Sebuah alat evaluasi dipandang valid atau abash apabila dapat mengukur apa yang seharusnya diukur.

Syarat-syarat umum yang harus dipenuhi dalam mengadakan kegiatan evaluasi dalam proses pendidikan menurut Dimyati dan Mudjiono (2006:194-198) terurai sebagai berikut: 

1.      Kesahihan
Kesahihan menggantikan kata validitas (validity) yang dapat diartikan sebagai ketepatan evaluasi mengevaluasi apa yang seharusnya di evaluasi. untuk memperoleh hasil evaluasi yang sahih, dibutuhkan insturmen yang memiliki/memenuhi syarat-syarat kesahihan suatu instrumental evaluasi. Kesahihan instrument evaluasi diperoleh melalui hasil pemikiran dan hasil pengalaman.

2.      Keterandalan
Keterandalan evaluasi berhubungan dengan masalah kepercayaan, yakni tingkat kepercayaan bahwa suatu instrument evaluasi mampu memberikan hasil yang tepat. Gronlund dalam Dimyati dan Mudjiono (2006:196) mengemukakan bahwa, “keterandalan menunjukkan kepada konsistensi (keajegan) pengukuran yakni bagaimana keajegan skor tes atau hasil evaluasi lain yang berasal dari pengukuran yang satu ke pengukuran yang lain”. Dengan kata lain, keterandalan dapat kita artikan sebagai tingakat kepercayaan keajegan hasil evaluasi yang diperoleh dari suatu instrument evaluasi.

3.      Kepraktisan
Kepraktisan evaluasi dapat diartikan sebagai kemudahan-kemudahan yang ada pada instrument evaluasi baik dalam mempersiapkan, menggunakan, menginterpretasi/ memperoleh hasil, maupun kemudahan dalam menyimpanya.

Sementara menurut Arikunto dan Jabar (2010:8-9) evaluasi memiliki ciri-ciri dan persyaratan sebagai berikut : 
a)      Proses kegiatan penelitian tidak menyimpang dari kaidah-kaidah yang berlaku bagi penelitian pada umumnya.
b)      Dalam melaksanakan evaluasi, peneliti harus berpikir secara sistematis yaitu memandang program yang diteliti sebagai sebuah kesatuan yang terdiri dari beberapa komponen atau unsur yang saling berkaitan satu sama lain dalam menunjang kinerja dari objek yang dievaluasi.
c)      Agar dapat mengetahui secar rinci kondisi dari objek yang dievaluasi, perlu adanya identifikasi komponen yang berkedudukan sebagai faktor penentu bagi keberhasilan program.
d)     Menggunakan standar, Kiteria, atau tolak ukur sebagai perbandingan dalam menentukan kondisi nyata dari data yang diperoleh dan untuk mengambil kesimpulan.
e)      Kesimpulan atau hasil penelitian digunakan sebagai masukan atau rekomendasi bagi sebuah kebijakan atau rencana program yang telah ditentukan.
f)       Agar informasi yang diperoleh dapat menggambarkan kondisi nyata secara rinci untuk mengetahui bagian mana dari program yang belum terlaksana, maka perlu ada identifikasi komponen yang dilanjutkan dengan identifikasi subkomponen, sampai pada indikator dari program evaluasi.
g)      Standar, kriteria, atau tolak ukur diterapkan pada indicator, yaitu bagian yang paling kecil dari program agar dapat dengan cermat diketahui letak kelemahan dari proses kegiatan.
h)      Dari hasil penelitian harus dapat disusun sebuah rekomendasi secara rinci dan akurat sehingga dapat ditentukan tindak lanjut secara tepat.


c.       Kesalahan dalam melakukan evaluasi
  (a) Indikator pengukuran kerja yang subyektif
Beberapa perusahaan memiliki faktor pengukuran kinerja yang sangat subyektif, misalnya penilaian terhadap prilaku dan personality dari karyawan yang mungkin tidak sesuai dengan atasannya.  Hal ini apabila tidak dapat dijalankan dengan teknik implementasi yang positif dapat mengakibatkan kemunculan konflik dan justru malah menurunkan motivasi kerja dari karyawan yang bersangkutan.
(b) Ketidakjelasan dari ruang lingkup pekerjaan
Dalam suatu kelompok kerja yang belum dapat diperjelas ruang lingkup pekerjaannya, penetapan suatu program evaluasi adalah hal yang sulit untuk dijalankan.  Pembagian dan penetapan proporsi pekerjaan secara tepat tidak tepat terinformasikan dapat mengakibatkan proses pembobotan terhadap kinerja menjadi berat sebelah dan berakibat munculnya ketidakberkembangnya dari suatu mekanisme kerja dalam organisasi.
(c) Periode pengukuran kinerja
Periode pengukuran yang terlalu panjang dapat menyebabkan adanya kesulitan untuk melakukan pengukuran yang obyektif, misalnya lupa dalam mengingat bagaimana performa kerja tersebut dijalankan, tahapan pengembangan operasional kinerja yang dijalankan tidak tepat sesuai dengan aspek yang dipertimbangkan dan dikelola serta pencatatan yang mungkin sudah terasa tidak sesuai dengan konteks yang ada.  Hal ini dapat mengakibatkan seorang pekerja akan fokus untuk bekerja dengan baik justru pada saat dimana waktu yang ada mendekati batasan waktu pengukuran kinerja yang ada.
(d) Tidak terbarunya target kerja
Program evaluasi yang dijalankan harus menggunakan target yang dinamis untuk memastikan status dari proses pencapaian kinerja dan target selaras dengan pertumbuhan perusahaan.  Untuk menciptakan suatu mekanisme yang tepat dalam peningkatan aspek optimalisasi kinerja maka ada baiknya apabila target kinerja dapat menjadi suatu bentuk target yang dinamis sehingga mekanisme dari kehidupan organisasi dalam perusahaan tercapai.
(e) Komunikasi yang tidak tepat
Sangat penting setelah melakukan program evaluasi program kerja tersebut, untuk dapat memastikan bagaimana komunikasi yang dijalankan dalam proses evaluasi kinerja tersebut dapat menstimulasi kinerja yang tepat bukan menciptakan demotivasi.  Pola komunikasi yang tepat dan dibarengi dengan informasi yang interaktif antara pemegang jabatan dan karyawan yang bersangkutan akan sangat membantu pengembangan pola komunikasi yang tepat dalam perusahaan.



5.      Istilah-istilah dalam evaluasi program pembelajaran
Pengertian Evaluasi (Penilaian) Menurut Para Ahli
  • Sudiono, Anas (2005) mengemukakan bahwa secara harfiah kata evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Akar katanya adalah value yang artinya nilai. Jadi istilah evaluasi menunjuk pada suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu.
  • Frey, Barbara A., and Susan W. Alman. (2003): Evaluation The systematic process of collecting, analyzing, and interpreting information to determine the extent to which pupils are achieving instructional objectives. (Artinya: Evaluasi adalah proses sistematis pengumpulan, analisis, dan interpretasi informasi untuk menentukan sejauh mana siswa yang mencapai tujuan instruksional).
  • Mardapi, Djemari (2003), penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran.
  • Zainul, Asmawi dan Noehi Nasution (2001), mengartikan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes.
Kesimpulan Tentang Pengertian Evaluasi:
  • Evaluasi berasal dari akar kata bahasa Inggris value yang berarti nilai, jadi istilah evaluasi sinonim dengan penilaian.
  • Evaluasi merupakan proses sistematis dari mengumpulkan, menganalisis, hingga interpretasi (menafsirkan) data atau informasi yang diperoleh.
  • Data atau informasi diperoleh melalui pengukuran (measurement) hasil belajar.melalui tes atau nontes.
  • Evaluasi bersifat kualitatif.
Pengertian Pengukuran (Measurement) Menurut Para Ahli
  • Alwasilah et al.(1996), measurement (pengukuran) merupakan proses yang mendeskripsikan performa siswa dengan menggunakan suatu skala kuantitatif (sistem angka) sedemikian rupa sehingga sifat kualitatif dari performa siswa tersebut dinyatakan dengan angka-angka
  • Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai kegiatan membandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi kuantitatif.
  • Cangelosi, James S. (1995), pengukuran adalah proses pengumpulan data secara empiris yang digunakan untuk mengumpulkan informasi yang relevan dengan tujuan yang telah ditentukan.
  • Sridadi (2007) pengukuran adalah suatu prose yang dilakukan secara sistematis untuk memperoleh besaran kuantitatif dari suatu obyek tertentu dengan menggunakan alat ukur yang baku.
Kesimpulan Tentang Pengertian Pengukuran:
  • Kegiatan pengukuran dilakukan dengan membandingkan hasil belajar dengan suatu ukuran tertentu. 
  • Dilakukan dengan proses sistematis. 
  • Hasil pengukuran berupa besaran kuantitatif (sistem angka). 
  • Pengukuran menggunakan alat ukur yang baku.
Pengertian Asesmen Menurut Para Ahli
  • Angelo T.A.(1991): Classroom Assessment is a simple method faculty can use to collect feedback, early and often, on how well their students are learning what they are being taught. (Artinya: asesmen Kelas adalah suatu metode yang sederhana dapat digunakan untuk mengumpulkan umpan balik, baik di awal maupun setelah pembelajaran tentang seberapa baik siswa mempelajari apa yang telah diajarkan kepada mereka.)
  • Kizlik, Bob (2009): Assessment is a process by which information is obtained relative to some known objective or goal. Assessment is a broad term that includes testing. A test is a special form of assessment. Tests are assessments made under contrived circumstances especially so that they may be administered. In other words, all tests are assessments, but not all assessments are tests. (Artinya : asesmen adalah suatu proses dimana informasi diperoleh berkaitan dengan tujuan pembelajaran. Asesmen adalah istilah yang luas yang mencakup tes (pengujian). Tes adalah bentuk khusus dari asesmen. Tes adalah salah satu bentuk asesmen. Dengan kata lain, semua tes merupakan asesmen, namun tidak semua asesmen berupa tes)
  • Overton, Terry (2008): Assesment is a process of gathering information to monitor progress and make educational decisions if necessary. As noted in my definition of test, an assesment may include a test, but also include methods such as observations, interview, behavior monitoring, etc. (Artinya: sesmen adalah suatu proses pengumpulan informasi untuk memonitor kemajuan dan bila diperlukan pengambilan keputusan dalam bidang pendidikan. Sebagaimana disebutkan dalam definisi saya tentang tes, suatu asesmen bisa saja terdiri dari tes, atau bisa juga terdiri dari berbagai metode seperti observasi, wawancara, monitoring tingkah laku, dan sebagainya).
  • Palomba and Banta(1999), Assessment is the systematic collection , review , and use of information about educational programs undertaken for the purpose of improving student learning and development (Artinya: asesmen adalah pengumpulan, reviu, dan penggunaan informasi secara sistematik tentang program pendidikan dengan tujuan meningkatkan belajar dan perkembangan siswa).
Kesimpulan Tentang Pengertian Asesmen:
  • Asesmen merupakan metode dan proses yang digunakan untuk mengumpulkan umpan balik tentang seberapa baik siswa belajar.
  • Dapat dilakukan di awal, di akhir (sesudah), maupun saat pembelajaran sedang berlangsung.
  • Asesmen dapat berupa tes atau nontes.
  • Asesmen berupa nontes misalnya penggunaan metode observasi, wawancara, monitoring tingkah laku, dsb.
  • Hasilnya dapat digunakan untuk pengambilan keputusan.
  • Bertujuan meningkatkan belajar (pembelajaran) dan perkembangan siswa.
Pengertian Tes Menurut Para Ahli
  • Wayan Nurkencana (1993), tes adalah suatu cara untuk mengadakan penilaian yang berbentuk suatu tugas yang harus dikerjakan anak atau sekelompok anak sehingga menghasilkan suatu nilai tentang tingkah laku atau prestasi anak tersebut yang kemudian dapat dibandingkan dengan nilai yang dicapai oleh anak-anak lain atau standar yang telah ditetapkan
  • Overton, Terry (2008): test is a method to determine a student’s ability to complete certain tasks or demontstrate mastery of a skill or knowledge of content. Some types would be multiple choice tests or a weekly spelling test. While it commonly used interchangeably with assesment, or even evaluation, it can be distinguished by the fact  that a test is one form of an assesment. (Tes adalah suatu metode untuk menentukan kemampuan siswa menyelesaikan sejumlah tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan pada suatu materi pelajaran. Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan. Seringkali penggunaannya tertukar dengan asesmen, atau bahkan evaluasi (penilaian), yang mana sebenarnya tes dapat dengan mudah dibedakan berdasarkan kenyataan bahwa tes adalah salah satu bentuk asesmen.)
Kesimpulan Tentang Pengertian Tes:
  • Tes adalah cara atau metode untuk menentukan kemampuan siswa menyelesaikan tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan.
  • Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan.
  • Tes adalah salah satu bentuk asesmen