A. Validitas
1.
Pengertian
Validitas
Validitas berasal dari bahasa Inggris dari kata validity yang
berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen
asesmen, validitas berarti sejauh mana kecermatan atau ketepatan alat ukur
dalam melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan
data yang tepat seperti yang diinginkan.
Sebagai contoh, jika kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan atau neraca bukan meteran, termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan. Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan mengendalikannya. Berbeda halnya jika kita akan mela kukan pengukuran dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu dipelajari dengan hati -hati. Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang lain.
Sebagai contoh, jika kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan atau neraca bukan meteran, termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan. Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan mengendalikannya. Berbeda halnya jika kita akan mela kukan pengukuran dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu dipelajari dengan hati -hati. Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang lain.
Pada
dasarnya validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes
telah mengukur apa yang seharusnya diukur. Validitas sebuah tes selalu
dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris.
Validitas tes perlu ditentukan, untuk mengetahui kualitas tes dalam kaitannya
dengan mengukur hal yang seharusnya diukur.
Nunnaly
(1972) menyatakan bahwa pengertian validitas senantiasa dikaitkan dengan
penelitian empiris dan pembuktian-pembuktiannya bergantung kepada macam
validitas yang digunakan. Menurut Anastasi (1988), validitas adalah suatu
tingkatan yang menyatakan bahwa suatu alat ukur telah sesuai dengan apa yang
diukur. Sedangkan Gronlund (1985) menyatakan bahwa validitas berkaitan dengan
hasil suatu alat ukur, menunjukan tingkatan, dan bersifat khusus sesuai dengan
tujuan pengukuran yang akan dilakukan.
2.
Bentuk
Validitas
Pada tahun 1954 The American Physicological Association
(APA) melalui Technical Recommendation
For Physicoligical Test an Diagnostic Techniques mengusulkan empat
pendekatan yang sering dinamakan empat muka validitas untuk menentukan
validitas yaitu sebagai berikut:
a. Validitas
Isi (Content Validity)
Validitas
isi sering pula dinamakan validitas kurikulum yang mengandung arti bahwa suatu
alat ukur yang dipandang valid apabila sesuai dengan isi kurikulum yang hendak
diukur.
Salah
satu cara untuk memperoleh validitas isi adalah dengan melihat soal-soal yang
membentuk tes itu. Jika keseluruhan soal nampak mengukur apa yang seharusnya
tes itu digunakan, tidak diragukan lagi bahwa validitas isi sudah terpenuhi.
Dalam dunia pendidikan, sebuah tes dikatakan memiliki isi apabila memgukur
sesuai domain dan tujuan khusus tertentu yang sama dengan isi pelajaran yang
telah diberikan di kelas. Soal matematika dikatakan valid apabila hanya
mengukur kemampuan matematika, bukannya mengukur kemampuan bahasa. Ketika kita
mengatakan akan mengukur kemampuan X peserta tes, maka kita harus mengukur
atribut atau karateristik khusus yang berkaitan dengan X peserta tes yang akan
diukur (Guoin, 1977).
Sebagian
ahli tes berpendapat bahwa tak ada satupun pendekatan statistik yang dapat
digunakan untuk menentukan validitas isi suatu tes. Menurut Guoin (1977),
validitas isi hanya dapat ditentukan berdasarkan judgmen para ahli. Prosedur
yang dapat digunakan antara lain:
ü Mendefinisikan
domain yang hendak diukur
ü Menentukan
domain yang diukur oleh masing-masing soal
ü Membandingkan
masing-masing soal dengan domain yang sudah ditetapkan.
b. Validitas
Konstruk (Construct Validity)
Konstruk
adalah sesuatu yang berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya
dapat diamati dan diukur. Validitas konstruk mengandung arti bahwa suatu alat
ukur dikatakan valid apabila telah cocok dengan konstruksi teoritik dimana tes
itu dibuat. Dengan kata lain sebuah tes dikatakan memiliki validitas konstruksi
apabila soal-soalnya mengukur setiap aspek berpikir seperti yang diuraikan
dalam standar kompetensi, kompetensi dasar, maupun indikator yang terdapat
dalam kurikulum.
Konstruksi
yang dimaksud pada validitas ini bukanlah merupakan konstruksi seperti bangunan
atau susunan, tetapi berupa rekaan psikologis yang berkaitan dengan aspek-aspek
ingatan, pemahaman, aplikasi, sintesis, analisis dan evaluasi.
c. Validitas
Prediksi (Predictive Validity)
Validitas
prediksi menunjukan hubungan antara skor tes yang diperoleh peserta tes dengan
keadaan yang akan terjadi dimasa yang akan datang. Sebuah tes dikatakan
memiliki validitas prediksi apabila mempunyai kemampuan untuk memprediksikan
apa yang akan terjadi dimasa yang akan datang.
Contoh
sederhana misalnya apa yang terjadi pada penerimaan peserta tes berdasarkan
hasil tes seleksi setelah mereka lulus SMA. Peserta tes yang memiliki nilai
bagus dites seleksi tersebut lalu diterima di perguruan tinggi, diperkirakan
akan berhasil ketika mereka belajar di perguruan tinggi. Apabila hal itu
terjadi maka dapat dikatakan tes masuk perguruan tinggi memiliki validitas
prediksi yang bagus. Dan demikian pula sebaliknya.
d. Validitas
Konkruen (Concurrent Validity)
Validitas
concurrent atau biasa disebut validitas yang ada sekarang menunjuk pada hubungan
antara skor tes dengan apa yang dicapai pada keadaan sekarang. Validitas ini
biasa dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
concurrent validity apabila hasilnya sesuai dengan pengalaman.
3.
Mengukur
Validitas
Salah
satu cara untuk menentukan validitas alat ukur adalah dengan menggunakan
korelasi product Moment dengan
simpangan yang dikemukakan oleh Person seperti berikut:
Keterangan
:
=
koofisien korelasi antara variabel x dan variabel y, dua variabel lain
yang dikorelasikan (x = Xi – X
dan y = Yi – Y)
∑xy =
jumlah perkalian antara x dan y
x2 =
kuadrat dari x
y2 = kuadrat dari y
Bentuk lain dari korelasi
product moment adalah dengan menggunakan angka kasar yaitu :
Korelasi product moment
dengan skor kasar dan skor simpangan pada dasarnya setelah dilakukan
perhitungan akan menghasilkan angka yang sama. Bisa saja kedua teknik tersebut
menghasilkan angka yang relatif berbeda, namun perbedaan tersebut umumnya tidak
terlalu signifikan.
Koofisien korelasi umumnya dibagi dalam lima bagian seperti
tampak pada tabel berikut :
Angka
Korelasi
|
Makna
|
0,800
– 1,000
|
Sangat
Tinggi
|
0,600
– 0,799
|
Tinggi
|
0,400
– 0,599
|
Cukup
|
0,200
– 0,399
|
Rendah
|
0,000
– 0,199
|
Sangat
Rendah
|
Sugiyono (2012; 184)
Uji
Validitas Item atau butir dapat juga dilakukan dengan menggunakan software
SPSS. Untuk proses ini, akan digunakan Uji Korelasi Pearson Product Moment.
Dalam uji ini, setiap item akan diuji relasinya dengan skor total variabel yang
dimaksud. Dalam hal ini masing-masing item yang ada di dalam variabel X dan Y
akan diuji relasinya dengan skor total variabel tersebut.
Agar
penelitian ini lebih teliti, sebuah item sebaiknya memiliki korelasi (r) dengan
skor total masing-masing variabel ≥ 0,25. Item yang punya r hitung < 0,25
akan disingkirkan akibat mereka tidak melakukan pengukuran secara sama dengan
yang dimaksud oleh skor total skala dan lebih jauh lagi, tidak memiliki
kontribusi dengan pengukuran seseorang jika bukan malah mengacaukan.
Cara melakukan Uji Validitas dengan SPSS:
- Buat skor total masing-masing variable.
- Klik Analyze > Correlate > Bivariate
- Masukkan seluruh item variable x ke Variables
- Masukkan total skor variable x ke Variables
- Ceklis Pearson ; Two Tailed ; Flag
- Klik OK
- Lihat kolom terakhir. Nilai >= 0,25.
Lakukan hal serupa untuk Variabel Y.
4. Faktor-Faktor yang Mempengaruhi Validitas
Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa
di antaranya tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang
akan berpikir untuk mengukur pengetahuan biologi dengan asesmen matematika.
Demikian pula juga tidak ada guru yang akan mengukur kemampuan memecahkan
masalah (problem solving) biologi kelas 7 SMP dengan menggunakan asesmen
yang didesain untuk kelas 12 SMA. Dalam dua contoh tersebut sudah sangat jelas
hasil asesmen akan menjadi tidak valid. Faktor yang mempengaruhi validitas tes
antara lain:
a. Faktor dari dalam tes itu sendiri
Pengujian terhadap butir tes secara hati-hati akan menunjukkan
apakah tes yang digunakan untuk mengukur isi materi atau fungsi -fungsi mental
yang akan diakses oleh guru. Bagaimanapun juga, beberapa faktor berikut dapat
menjaga butir tes dari fungsi yang dikehendaki dan dengan demikian juga terjaga
dari rendahnya validitas hasil asesmen. Lima faktor yang pertama dapat
diterapkan sejajar dengan asesmen penampilan siswa secara luas serta tes-tes
tradisional. Lima faktor yang terakhir lebih diterapkan secara langsung
terhadap tes pilihan dan tes dengan jawaban singkat dengan jawaban benar atau salah.
a)
Petunjuk
yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu
untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan
apa yang seharusnya dilakukan.
b)
Penggunaan
kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata atau struktur
kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman terhadap
pemahaman maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan
itu sendiri.
c)
Ambiguitas.
Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya
validitas sebuah tes.
d)
Alokasi
waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang cukup untuk
mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan
sebuah tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya
tetapi karena keterbatasan kesempatan untuk mengerjakannya.
e)
Penekanan
yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak
kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas
soal.
f)
Kualitas
butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas yang tidak
memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat
tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes
yang bersifat untuk mengungkap pengetahuan faktual saja.
g)
Susunan
tes yang jelek.
h)
Tes
terlalu pendek.
i)
Penyusunan
butir tes yang tidak runtut .
j)
Pola
jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah
A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C,
B, A, dan sebagainya.
b. Faktor berfungsinya
tes dan prosedur mengajar.
c. Faktor administrasi
dan penskoran. Pemberian skor terhadap jawaban siswa (testee) harus dilakukan
secara hati-hati jangan sampai salah tulis atau meremehkan selisih angka
walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian terhadap
validitas akan memberikan makna yang berbeda.
d. Faktor tanggapan
siswa. Tanggapan siswa yang tidak serius biasanya dijumpai pada saat siswa
diminta untuk mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi
angket secara sembarangan karena merasa tidak penting maupun alasan -alasan
yang lain. Oleh karena itu berikan angket pada waktu dan kondisi yang tepat .
e. Hakikat
kelompok dan kriteria. Seperti sudah dijelaskan di atas bahwa validitas
bersifat spesifik. Sebuah asesmen atau instrumen alat ukur mungkin hanya valid
untuk kelompok tertentu saja dan tidak valid untuk kelompok yang lain. Sebagai
contoh misalnya sebuah tes diujicobakan pada sekelompok siswa pada sebuah
sekolah dengan kualitas biasa –biasa saja tentu akan berbeda hasilnya jika tes
yang sama diberikan pada sekelompok siswa pada sekolah yang favorit.
B.
Reliabilitas
1.
Pengertian
Reliabilitas
Kata reliabilitas dalam bahasa Indonesia yang
digunakan saat ini, sebenarnya diambil dari kata reliability dalam
bahasa Inggris dan berasal dari kata reliable yang artinya dapat
dipercaya,keajegan, konsisten, keandalan, kestabilan. Suatu tes dapat dikatakan
reliabel jika tes tersebut menunjukkan hasil yang dapat dipercaya dan tidak
bertentangan MenurutSugiono (2005)
Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang
memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu
dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi)
suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor
yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang
berbeda-beda. Sedangkan Sukadji (2000) mengatakan bahwa reliabilitas suatu tes
adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang
diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien.
Koefisien tinggi berarti reliabilitas tinggi.
Menurut
Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan
bila fakta atau kenyataan hidup tadi diukur atau diamati berkali–kali dalam
waktu yang berlainan. Alat dan cara mengukur atau mengamati sama–sama memegang
peranan penting dalam waktu yang bersamaan. Sedangkan menurut Arifin (1991),
suatu tes dapat dikatakan andal (reliable) jika tes tersebut mempunyai
hasil yang taat asas (konsisten). Sedangkan Sudjana (2004) mengatakan bahwa
reliabilitas suatu tes adalah ketepatan atau kejegan tes tersebut dalam menilai
apa adanya, artinya kapan pun tes tersebut digunakanakan memberikan hasil yang
sama atau relatif sama.
Berdasarkan beberapa pendapat
tentang reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas
adalah suatu pengukuran terhadap suatu tes yang melihat apakah tes tersebut
dapat mengukur apa yang seharusnya di ukur.
2.
Metode
Sederhana Mengestimasi Reliabilitas
Perbedaan pengertian reliabilitas sangat bergantung
bagaimana indeks reliabilitas dihitung. Perbedaan skor dari suatu pengukuran
kepengukuran lain ini terjadi karena adanya standard eror of measurement atau
standar kesalahan pengukuran. Oleh karena itu koofisien reliabilitas harus
benar-benar diperhitungkan lebih dahulu standar kesalahan pengukurannya itu. Berikut
ini akan ditunjukan bentuk reliabilitas dan prosedur untuk memperolehnya yaitu
dapat dilihat pada tabel berikut :
Bentuk Reliablitas
|
Prosedur
Untuk Memperolehnya
|
Test-Retest Methods (Stabilitas)
Ø Produk Momen dan korelasi intra kelas
|
Ø Sajikan tes yang sama sebanyak 2 kali
kepada peserta tes yang sama dalam waktu yang berbeda dan tentukan korelasi
|
Paralel (Ekuivalen)
Ø Produk Momen dan korelasi intra kelas
|
Ø Sajikan 2 tes yang sama pada peserta
tes dalam waktu yang relatif tidak lama (misalnya 2 minggu). Korelasikan
kedua skor tersebut untuk mencari reliabilitas.
|
Split-Half Methods (Belah Dua)
Ø Persamaan Split-Half dan Spearman_Brown
|
Ø Sajikan 1 kali tes lalu dibelah dua,
gunakan persamaan untuk mengkorelasikan kedua belahan.
|
Internal Consistency
Ø Koofisien Alpha
Ø Kuder-Richardson (KR-20)
Ø Kuder-Richardson (KR-21)
|
Ø Berikan sekali tes, gunakan persamaan
Ø Berikan sekali tes, gunakan persamaan
Ø Berikan sekali tes, gunakan persamaan
|
a. Metode Tes Ulang (Test-Retest
Methods)
Metode ini diterapkan untuk menghindari adanya penyusunan dua seri
tes. Teknisnya adalah sebuah tes yang sama diberikan dua kali kepada responden
yang sama dengan jarak waktu tertentu. Jika hasil tes pertama mempunyai
kesejajaran dengan hasil tes yang kedua maka tes tersbut dikatakan reliable.
Oleh karena pengujian ini dilakukan terhadap sebuah tes yang diujicobakan dua
kali maka sering disebut pula sebagai single-test-double-trial-method. Kelemahan
metode ini adalah jika jeda waktu tes terlalu singkat sedangkan soal tes banyak
mengungkapkan aspek pengetahuan maka responden cenderung masih mengingat materi
yang diteskan, sehingga ada kemungkinan hasil tes yang kedua lebih baik
daripada hasil te s pertama. Sebaliknya jika jeda waktu tes pertama dengan
kedua terlalu lama dikhawatirkan banyak faktor serta situasi dan kondisi sudah
banyak berubah dan mempengaruhi hasil tes yang kedua.
b. Metode Tes Sejajar (Equivalent)
Metode ini mengharuskan adanya dua buah seri soal yang mempunyai
kesamaan tujuan, bobot soal, tingkat kesukaran, susunan soal, tetapi butir
–butir soalnya berbeda. Dengan kata lain, dua buah tes yang digunakan harus
sejajar (paralel, equivalen). Koefisien relibiabilitas diperoleh dengan me
ngkorelasikan hasil tes pertama dengan hasil tes kedua. Oleh karena metode ini
menggunakan dua buah tes yang berbeda dan diteskan pada siswa yang sama maka
disebut juga doublé test – double – trial – method. Sudah tentu metode
ini akan menambah kerepotan. Inilah kelemahan metode ini. Kelebihan dari metode
ini adalah dapat memperbaiki kelemahan pada metode pertama yaitu terhindarnya
dari kondisi “siswa masih mengingat materi tes pertama”. Aspek ingatan dan
hafalan pada pengerjaan tes pertama tidak terbawa pada saat mengerjakan tes
yang kedua.
c. Belah Dua (Split-half
methods)
Metode
ini dapat mengatasi semua kelemahan yang terdapat pada metode tes ulang dan tes
paralel. Metode ini memungkinkan mengestimasi reliabilitas tanpa harus
menggunakan tes 2 kali. Dengan demikian beberapa kelemahan seperti carry-over effect, reactivity effect, dan
khususnya pengaruh waktu terhadap perolehan skor sebenarnya dapat
diminimalisasi. Dengan demikian ketidakajegan perolehan skor bukan karena pennyelenggaraan
tes tetapi karena dalam merespon tes itu sendiri.
Metode
ini dapat menggunakan 3 persamaan sebagai berikut :
a)
Persamaan Produk Momen
r =
b)
Persamaan Flanagan
r11 =
keterangan
: r11 = reliabilitas tes
=
Varian belahan pertama
=
Varian belahan kedua
=
Varian total
c)
Persamaan
Rulon
r11 =
keterangan : r11 = reliabilitas tes
= Varian
beda
d = Perbedaan antara skor belahan pertama
dengan belahan ke-2
=
Varian total
d. Internal Konsistensi (Internal Consistency)
metode
ini didasarkan pada homogenitas atau korelasi antara skor jawaban pada setiap
butir tes. Terdapat beberapa teknik dan persamaan yang digunakan untuk mencari
reliabilitas dengan internal konsistensi diantaranya adalah sebagai berikut :
a). Koofisien alpha (α)
Koofisien
alpha dapat dihitung dengan menggunakan rumus berikut :
keterangan: r11
=
reliabilitas tes
k = jumlah soal
=
jumlah varian dari skor soal
b).
Persamaan Kuder-Richardson (KR-20)
r11 = reliabilitas menggunakan persamaan KR-20
p = proporsi peserta tes menjawab benar
q =
proporsi peserta tes menjawab salah (p=1-p)
∑pq
= jumlah perkalian antara p dan q
k = banyaknya soal
c).
Persamaan Hoyt
r11 = reliabilitas tes
= Varian Sisa
= Varian peserta tes
3.
Faktor-Faktor
yang Mempengaruhi Reliabilitas
a. Jumlah butir tes
Umumnya
semakin besar jumlah butir soal tes samakin tinggi pula reliabilitasnya. Hal
ini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga
semakin banyak perilaku yang terukur dengan lebih tepat. Skor-skor yang
diperoleh tepat dan kemungkinan sedikit mengalami penyimpangan (distorsi) oleh
adanya faktor -faktor yang sudah biasa dikenal dengan sebuah tes yang diberikan
atau kurangnya pemahaman terhadap apa yang diharapkan pada sebuah tes yang
diberikan.
b. Penyebaran skor
Sebagai
catatan awal, koefisien reliabilitas secara langsung dipengaruhi oleh
penyebaran skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin
besar penyebaran skor maka semakin besar pula indeks reliabilitas yang
diperoleh. Karena semakin besar indeks reliabilitas yang dihasilkan ketika
individu-individu berada pada posisi yang relatif sama dalam sebuah kelompok
sebuah asesmen dengan asesmen yang lain, hal ini secara alami mengikuti bahwa
segala sesuatu yang mengurangi kemungkinan bergeser nya posisi dalam kelompok
juga turut andil dalam memperbesar koefisien reliabilitas. Dalam kasus ini,
semakin besar perbedaan skor individu mengurangi kemungkinan pergeseran pososi.
Dengan kata lain kesalahan dalam pengukuran kurang berpengaruh terhadap posisi
relatif individu ketika perbedaan -perbedaan di antara anggota - anggota
kelompok yang besar. Hal ini terjadi ketika skornya tersebar luas.
c. Objektivitas
Objektivitas
sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yang sama
mendapatkan hasil yang sama. Sebagian besar tes bakat dan tes prestasi standar
mempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti
pilihan ganda dan skor yang dihasilkan tidak dipengaruhi oleh keputusan dan
pendapat pemberi skor. Semakin tinggi tingkat objektivitas tes semakin tinggi
pula tingkat reliabilitasnya.
d. Metode estimasi
reliabilitas
Saat
menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakan
untuk menentukan besarnya koefisien reliabilitas merupakan hal yang penting.
Secara umum, besarnya koefisien reliabilitas berkaitan erat dengan metode yang
digunakan untuk estimasi reliabilitas.
a)
Metode
tes ulang (Test Retest Method) : mungkin hasilnya lebih besar
dibandingkan dengan metode belah dua jika interval waktunya pendek. Koefisien
reliabilitas yang dihasilkan menjadi lebih kecil jika interval waktu tesnya
ditingkatkan.
b)
Tes
sejajar (Equivalent Test) tanpa waktu interval: Koefisien reliabilitas
cenderung lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang
menggunakan interval waktu singkat.
c)
Tes
Sejajar dengan interval waktu: koefisien menjadi lebih kecil seiring dengan
peningkatan interval waktu tes.
d) Metode belah dua (Split-half Method): Metode ini menyediakan
sebuah indikasi konsistensi internal tes.
C. Contoh Pengujian Validitas dan Reliabilitas Instrumen
Pengujian validitas tiap butir digunakan analisis
item, yaitu mengkorelasikan skor tiap butir dengan skor total yang merupakan
jumlah tiap skor butir.
Data hasil uji coba adalah sebagai
berikut:
Nomor Responden
|
Nomor Butir Pertanyaan
|
Jumlah
|
||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
||
1
|
5
|
4
|
3
|
5
|
3
|
5
|
3
|
28
|
2
|
5
|
4
|
3
|
4
|
3
|
4
|
3
|
26
|
3
|
4
|
4
|
2
|
4
|
3
|
4
|
3
|
24
|
4
|
4
|
3
|
3
|
3
|
4
|
3
|
4
|
24
|
5
|
5
|
5
|
3
|
4
|
5
|
5
|
4
|
31
|
6
|
3
|
3
|
2
|
3
|
2
|
3
|
1
|
17
|
7
|
3
|
3
|
2
|
3
|
2
|
2
|
2
|
17
|
8
|
3
|
2
|
2
|
3
|
2
|
2
|
2
|
16
|
9
|
2
|
2
|
1
|
2
|
1
|
2
|
1
|
11
|
10
|
2
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
Jumlah
|
36
|
31
|
22
|
32
|
26
|
31
|
24
|
202
|
Penyelesaian:
Untuk
soal no 1
= 0,976
Untuk n=10 dengan alpha sebesar 0,05 didapat nilai
table r=0,631. Karena nilai koefesien korelasi antara skor butir dengan skor
total untuk butir lebih besar dari 0,631, maka butir mempunyai korelasi
signifikan dengan skor total tes. Dengan demikian maka semua butir tes dianggap
valid atau dapat digunakan untuk mengukur hasil belajar.
Dari soal diatas, selanjutnya akan
dihitung koefesien reliabilitas dengan menggunakan rumus koefesien Alpha,
yaitu:
Koefisien reliabilitas dari contoh
diatas dapat dihitung dengan cara pertama-tama dihitung varian butir sebagai
berikut:
Nomor butir
|
Varian Butir
|
1
2
3
4
5
6
7
|
1,24
1,29
0,56
1,16
1,44
1,69
1,24
|
Jumlah
|
8,62
|
Jadi
koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0,97
Tidak ada komentar:
Posting Komentar