Selamat datang di Blog Matematika SMAN 6 Kendari

Jumat, 10 Mei 2013

VALIDITAS DAN RELIABILITAS


A.      Validitas
1.    Pengertian Validitas
Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana kecermatan atau ketepatan alat ukur dalam melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang diinginkan.
Sebagai contoh, jika kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan atau neraca bukan meteran, termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan. Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan mengendalikannya. Berbeda halnya jika kita akan mela kukan pengukuran dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu dipelajari dengan hati -hati. Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang lain.
Pada dasarnya validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya diukur. Validitas sebuah tes selalu dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris. Validitas tes perlu ditentukan, untuk mengetahui kualitas tes dalam kaitannya dengan mengukur hal yang seharusnya diukur.
Nunnaly (1972) menyatakan bahwa pengertian validitas senantiasa dikaitkan dengan penelitian empiris dan pembuktian-pembuktiannya bergantung kepada macam validitas yang digunakan. Menurut Anastasi (1988), validitas adalah suatu tingkatan yang menyatakan bahwa suatu alat ukur telah sesuai dengan apa yang diukur. Sedangkan Gronlund (1985) menyatakan bahwa validitas berkaitan dengan hasil suatu alat ukur, menunjukan tingkatan, dan bersifat khusus sesuai dengan tujuan pengukuran yang akan dilakukan.


2.        Bentuk Validitas
Pada tahun 1954 The American Physicological Association (APA) melalui Technical Recommendation For Physicoligical Test an Diagnostic Techniques mengusulkan empat pendekatan yang sering dinamakan empat muka validitas untuk menentukan validitas yaitu sebagai berikut:
a.       Validitas Isi (Content Validity)
Validitas isi sering pula dinamakan validitas kurikulum yang mengandung arti bahwa suatu alat ukur yang dipandang valid apabila sesuai dengan isi kurikulum yang hendak diukur.
Salah satu cara untuk memperoleh validitas isi adalah dengan melihat soal-soal yang membentuk tes itu. Jika keseluruhan soal nampak mengukur apa yang seharusnya tes itu digunakan, tidak diragukan lagi bahwa validitas isi sudah terpenuhi. Dalam dunia pendidikan, sebuah tes dikatakan memiliki isi apabila memgukur sesuai domain dan tujuan khusus tertentu yang sama dengan isi pelajaran yang telah diberikan di kelas. Soal matematika dikatakan valid apabila hanya mengukur kemampuan matematika, bukannya mengukur kemampuan bahasa. Ketika kita mengatakan akan mengukur kemampuan X peserta tes, maka kita harus mengukur atribut atau karateristik khusus yang berkaitan dengan X peserta tes yang akan diukur (Guoin, 1977).
Sebagian ahli tes berpendapat bahwa tak ada satupun pendekatan statistik yang dapat digunakan untuk menentukan validitas isi suatu tes. Menurut Guoin (1977), validitas isi hanya dapat ditentukan berdasarkan judgmen para ahli. Prosedur yang dapat digunakan antara lain:
ü  Mendefinisikan domain yang hendak diukur
ü  Menentukan domain yang diukur oleh masing-masing soal
ü  Membandingkan masing-masing soal dengan domain yang sudah ditetapkan.
b.      Validitas Konstruk (Construct Validity)
Konstruk adalah sesuatu yang berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat diamati dan diukur. Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan valid apabila telah cocok dengan konstruksi teoritik dimana tes itu dibuat. Dengan kata lain sebuah tes dikatakan memiliki validitas konstruksi apabila soal-soalnya mengukur setiap aspek berpikir seperti yang diuraikan dalam standar kompetensi, kompetensi dasar, maupun indikator yang terdapat dalam kurikulum.
Konstruksi yang dimaksud pada validitas ini bukanlah merupakan konstruksi seperti bangunan atau susunan, tetapi berupa rekaan psikologis yang berkaitan dengan aspek-aspek ingatan, pemahaman, aplikasi, sintesis, analisis dan evaluasi.
c.       Validitas Prediksi (Predictive Validity)
Validitas prediksi menunjukan hubungan antara skor tes yang diperoleh peserta tes dengan keadaan yang akan terjadi dimasa yang akan datang. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai kemampuan untuk memprediksikan apa yang akan terjadi dimasa yang akan datang.
Contoh sederhana misalnya apa yang terjadi pada penerimaan peserta tes berdasarkan hasil tes seleksi setelah mereka lulus SMA. Peserta tes yang memiliki nilai bagus dites seleksi tersebut lalu diterima di perguruan tinggi, diperkirakan akan berhasil ketika mereka belajar di perguruan tinggi. Apabila hal itu terjadi maka dapat dikatakan tes masuk perguruan tinggi memiliki validitas prediksi yang bagus. Dan demikian pula sebaliknya.
d.      Validitas Konkruen (Concurrent Validity)
Validitas concurrent atau biasa disebut validitas yang ada sekarang menunjuk pada hubungan antara skor tes dengan apa yang dicapai pada keadaan sekarang. Validitas ini biasa dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki concurrent validity apabila hasilnya sesuai dengan pengalaman.

3.      Mengukur Validitas
Salah satu cara untuk menentukan validitas alat ukur adalah dengan menggunakan korelasi product Moment dengan simpangan yang dikemukakan oleh Person seperti berikut:

    
       Keterangan :
         =  koofisien korelasi antara variabel x dan variabel y, dua variabel lain yang    dikorelasikan (x = Xi – X dan y = Yi – Y)
         ∑xy        =  jumlah perkalian antara x dan y
          x2         =  kuadrat dari x
         y2           =  kuadrat dari y
               Bentuk lain dari korelasi product moment adalah dengan menggunakan angka kasar yaitu :
      
              Korelasi product moment dengan skor kasar dan skor simpangan pada dasarnya setelah dilakukan perhitungan akan menghasilkan angka yang sama. Bisa saja kedua teknik tersebut menghasilkan angka yang relatif berbeda, namun perbedaan tersebut umumnya tidak terlalu signifikan.
     Koofisien korelasi umumnya dibagi dalam lima bagian seperti tampak pada tabel berikut :
Angka Korelasi
Makna
0,800 – 1,000
Sangat Tinggi
0,600 – 0,799
Tinggi
0,400 – 0,599
Cukup
0,200 – 0,399
Rendah
0,000 – 0,199
Sangat Rendah
                                                               Sugiyono (2012; 184)
                   Uji Validitas Item atau butir dapat juga dilakukan dengan menggunakan software SPSS. Untuk proses ini, akan digunakan Uji Korelasi Pearson Product Moment. Dalam uji ini, setiap item akan diuji relasinya dengan skor total variabel yang dimaksud. Dalam hal ini masing-masing item yang ada di dalam variabel X dan Y akan diuji relasinya dengan skor total variabel tersebut.
                   Agar penelitian ini lebih teliti, sebuah item sebaiknya memiliki korelasi (r) dengan skor total masing-masing variabel ≥ 0,25. Item yang punya r hitung < 0,25 akan disingkirkan akibat mereka tidak melakukan pengukuran secara sama dengan yang dimaksud oleh skor total skala dan lebih jauh lagi, tidak memiliki kontribusi dengan pengukuran seseorang jika bukan malah mengacaukan.
Cara melakukan Uji Validitas dengan SPSS:
  1. Buat skor total masing-masing variable.
  2. Klik Analyze > Correlate > Bivariate
  3. Masukkan seluruh item variable x ke Variables
  4. Masukkan total skor variable x ke Variables
  5. Ceklis Pearson ; Two Tailed ; Flag
  6. Klik OK
  7. Lihat kolom terakhir. Nilai >= 0,25.
Lakukan hal serupa untuk Variabel Y.

4.      Faktor-Faktor yang Mempengaruhi Validitas
Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di antaranya tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang akan berpikir untuk mengukur pengetahuan biologi dengan asesmen matematika. Demikian pula juga tidak ada guru yang akan mengukur kemampuan memecahkan masalah (problem solving) biologi kelas 7 SMP dengan menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contoh tersebut sudah sangat jelas hasil asesmen akan menjadi tidak valid. Faktor yang mempengaruhi validitas tes antara lain:
a. Faktor dari dalam tes itu sendiri
Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes yang digunakan untuk mengukur isi materi atau fungsi -fungsi mental yang akan diakses oleh guru. Bagaimanapun juga, beberapa faktor berikut dapat menjaga butir tes dari fungsi yang dikehendaki dan dengan demikian juga terjaga dari rendahnya validitas hasil asesmen. Lima faktor yang pertama dapat diterapkan sejajar dengan asesmen penampilan siswa secara luas serta tes-tes tradisional. Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes pilihan dan tes dengan jawaban singkat dengan jawaban benar atau salah.
a)      Petunjuk yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan apa yang seharusnya dilakukan.
b)      Penggunaan kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata atau struktur kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman terhadap pemahaman maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri.
c)      Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya validitas sebuah tes.
d)     Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang cukup untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.
e)      Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas soal.
f)       Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas yang tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang bersifat untuk mengungkap pengetahuan faktual saja.
g)      Susunan tes yang jelek.
h)      Tes terlalu pendek.
i)        Penyusunan butir tes yang tidak runtut .
j)        Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C, B, A, dan sebagainya.
       b. Faktor berfungsinya tes dan prosedur mengajar.
       c. Faktor administrasi dan penskoran. Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian terhadap validitas akan memberikan makna yang berbeda.
       d. Faktor tanggapan siswa. Tanggapan siswa yang tidak serius biasanya dijumpai pada saat siswa diminta untuk mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh karena itu berikan angket pada waktu dan kondisi yang tepat .
e. Hakikat kelompok dan kriteria. Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada sekelompok siswa pada sebuah sekolah dengan kualitas biasa –biasa saja tentu akan berbeda hasilnya jika tes yang sama diberikan pada sekelompok siswa pada sekolah yang favorit.
B.       Reliabilitas
1.      Pengertian Reliabilitas
              Kata reliabilitas dalam bahasa Indonesia yang digunakan saat ini, sebenarnya diambil dari kata reliability dalam bahasa Inggris dan berasal dari kata reliable yang artinya dapat dipercaya,keajegan, konsisten, keandalan, kestabilan. Suatu tes dapat dikatakan reliabel jika tes tersebut menunjukkan hasil yang dapat dipercaya dan tidak bertentangan   MenurutSugiono (2005) Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Sedangkan Sukadji (2000) mengatakan bahwa reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
              Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali–kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama–sama memegang peranan penting dalam waktu yang bersamaan. Sedangkan menurut Arifin (1991), suatu tes dapat dikatakan andal (reliable) jika tes tersebut mempunyai hasil yang taat asas (konsisten). Sedangkan Sudjana (2004) mengatakan bahwa reliabilitas suatu tes adalah ketepatan atau kejegan tes tersebut dalam menilai apa adanya, artinya kapan pun tes tersebut digunakanakan memberikan hasil yang sama atau relatif sama.
            Berdasarkan beberapa pendapat tentang reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas adalah suatu pengukuran terhadap suatu tes yang melihat apakah tes tersebut dapat mengukur apa yang seharusnya di ukur.
2.      Metode Sederhana Mengestimasi Reliabilitas
            Perbedaan pengertian reliabilitas sangat bergantung bagaimana indeks reliabilitas dihitung. Perbedaan skor dari suatu pengukuran kepengukuran lain ini terjadi karena adanya standard eror of measurement atau standar kesalahan pengukuran. Oleh karena itu koofisien reliabilitas harus benar-benar diperhitungkan lebih dahulu standar kesalahan pengukurannya itu. Berikut ini akan ditunjukan bentuk reliabilitas dan prosedur untuk memperolehnya yaitu dapat dilihat pada tabel berikut :

Bentuk Reliablitas
Prosedur Untuk Memperolehnya
Test-Retest Methods (Stabilitas)
Ø  Produk Momen dan korelasi intra kelas

Ø Sajikan tes yang sama sebanyak 2 kali kepada peserta tes yang sama dalam waktu yang berbeda dan tentukan korelasi
Paralel (Ekuivalen)
Ø  Produk Momen dan korelasi intra kelas

Ø Sajikan 2 tes yang sama pada peserta tes dalam waktu yang relatif tidak lama (misalnya 2 minggu). Korelasikan kedua skor tersebut untuk mencari reliabilitas.
Split-Half Methods (Belah Dua)
Ø  Persamaan Split-Half dan Spearman_Brown

Ø  Sajikan 1 kali tes lalu dibelah dua, gunakan persamaan untuk mengkorelasikan kedua belahan.
Internal Consistency
Ø  Koofisien Alpha
Ø  Kuder-Richardson (KR-20)
Ø  Kuder-Richardson (KR-21)

Ø Berikan sekali tes, gunakan persamaan
Ø Berikan sekali tes, gunakan persamaan
Ø Berikan sekali tes, gunakan persamaan

a.      Metode Tes Ulang (Test-Retest Methods)
Metode ini diterapkan untuk menghindari adanya penyusunan dua seri tes. Teknisnya adalah sebuah tes yang sama diberikan dua kali kepada responden yang sama dengan jarak waktu tertentu. Jika hasil tes pertama mempunyai kesejajaran dengan hasil tes yang kedua maka tes tersbut dikatakan reliable. Oleh karena pengujian ini dilakukan terhadap sebuah tes yang diujicobakan dua kali maka sering disebut pula sebagai single-test-double-trial-method. Kelemahan metode ini adalah jika jeda waktu tes terlalu singkat sedangkan soal tes banyak mengungkapkan aspek pengetahuan maka responden cenderung masih mengingat materi yang diteskan, sehingga ada kemungkinan hasil tes yang kedua lebih baik daripada hasil te s pertama. Sebaliknya jika jeda waktu tes pertama dengan kedua terlalu lama dikhawatirkan banyak faktor serta situasi dan kondisi sudah banyak berubah dan mempengaruhi hasil tes yang kedua.
b.      Metode Tes Sejajar (Equivalent)
Metode ini mengharuskan adanya dua buah seri soal yang mempunyai kesamaan tujuan, bobot soal, tingkat kesukaran, susunan soal, tetapi butir –butir soalnya berbeda. Dengan kata lain, dua buah tes yang digunakan harus sejajar (paralel, equivalen). Koefisien relibiabilitas diperoleh dengan me ngkorelasikan hasil tes pertama dengan hasil tes kedua. Oleh karena metode ini menggunakan dua buah tes yang berbeda dan diteskan pada siswa yang sama maka disebut juga doublé test – double – trial – method. Sudah tentu metode ini akan menambah kerepotan. Inilah kelemahan metode ini. Kelebihan dari metode ini adalah dapat memperbaiki kelemahan pada metode pertama yaitu terhindarnya dari kondisi “siswa masih mengingat materi tes pertama”. Aspek ingatan dan hafalan pada pengerjaan tes pertama tidak terbawa pada saat mengerjakan tes yang kedua.
c.       Belah Dua (Split-half methods)
Metode ini dapat mengatasi semua kelemahan yang terdapat pada metode tes ulang dan tes paralel. Metode ini memungkinkan mengestimasi reliabilitas tanpa harus menggunakan tes 2 kali. Dengan demikian beberapa kelemahan seperti carry-over effect, reactivity effect, dan khususnya pengaruh waktu terhadap perolehan skor sebenarnya dapat diminimalisasi. Dengan demikian ketidakajegan perolehan skor bukan karena pennyelenggaraan tes tetapi karena dalam merespon tes itu sendiri.

Metode ini dapat menggunakan 3 persamaan sebagai berikut :
a)   Persamaan Produk Momen

 r  =

b)   Persamaan Flanagan
                        r11 = 
                                                keterangan :   r11   = reliabilitas tes
                                                          = Varian belahan pertama
                                                          = Varian belahan kedua
                                                          = Varian total
c)       Persamaan Rulon
r11 = 
            keterangan :   r11   = reliabilitas tes
                                                          = Varian beda
                     d    = Perbedaan antara skor belahan pertama dengan belahan ke-2
                      = Varian total
d.      Internal Konsistensi (Internal Consistency)
metode ini didasarkan pada homogenitas atau korelasi antara skor jawaban pada setiap butir tes. Terdapat beberapa teknik dan persamaan yang digunakan untuk mencari reliabilitas dengan internal konsistensi diantaranya adalah sebagai berikut :
a). Koofisien alpha (α)
Koofisien alpha dapat dihitung dengan menggunakan rumus berikut :
keterangan:  r11 = reliabilitas tes
                      k  = jumlah soal
                       = jumlah varian dari skor soal

b). Persamaan Kuder-Richardson (KR-20)
r11   = reliabilitas menggunakan persamaan KR-20
p      = proporsi peserta tes menjawab benar
q      = proporsi peserta tes menjawab salah (p=1-p)
∑pq = jumlah perkalian antara p dan q
k      = banyaknya soal

c). Persamaan Hoyt
                  
                 r11   = reliabilitas tes
                             = Varian Sisa
                             =  Varian peserta tes
3.      Faktor-Faktor yang Mempengaruhi Reliabilitas
       a. Jumlah butir tes
Umumnya semakin besar jumlah butir soal tes samakin tinggi pula reliabilitasnya. Hal ini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyak perilaku yang terukur dengan lebih tepat. Skor-skor yang diperoleh tepat dan kemungkinan sedikit mengalami penyimpangan (distorsi) oleh adanya faktor -faktor yang sudah biasa dikenal dengan sebuah tes yang diberikan atau kurangnya pemahaman terhadap apa yang diharapkan pada sebuah tes yang diberikan.
b. Penyebaran skor
Sebagai catatan awal, koefisien reliabilitas secara langsung dipengaruhi oleh penyebaran skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besar penyebaran skor maka semakin besar pula indeks reliabilitas yang diperoleh. Karena semakin besar indeks reliabilitas yang dihasilkan ketika individu-individu berada pada posisi yang relatif sama dalam sebuah kelompok sebuah asesmen dengan asesmen yang lain, hal ini secara alami mengikuti bahwa segala sesuatu yang mengurangi kemungkinan bergeser nya posisi dalam kelompok juga turut andil dalam memperbesar koefisien reliabilitas. Dalam kasus ini, semakin besar perbedaan skor individu mengurangi kemungkinan pergeseran pososi. Dengan kata lain kesalahan dalam pengukuran kurang berpengaruh terhadap posisi relatif individu ketika perbedaan -perbedaan di antara anggota - anggota kelompok yang besar. Hal ini terjadi ketika skornya tersebar luas.
       c. Objektivitas
Objektivitas sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yang sama mendapatkan hasil yang sama. Sebagian besar tes bakat dan tes prestasi standar mempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti pilihan ganda dan skor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakin tinggi tingkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya.
       d. Metode estimasi reliabilitas
Saat menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakan untuk menentukan besarnya koefisien reliabilitas merupakan hal yang penting. Secara umum, besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan untuk estimasi reliabilitas.
a)      Metode tes ulang (Test Retest Method) : mungkin hasilnya lebih besar dibandingkan dengan metode belah dua jika interval waktunya pendek. Koefisien reliabilitas yang dihasilkan menjadi lebih kecil jika interval waktu tesnya ditingkatkan.
b)      Tes sejajar (Equivalent Test) tanpa waktu interval: Koefisien reliabilitas cenderung lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang menggunakan interval waktu singkat.
c)      Tes Sejajar dengan interval waktu: koefisien menjadi lebih kecil seiring dengan peningkatan interval waktu tes.
d)     Metode belah dua (Split-half Method): Metode ini menyediakan sebuah indikasi konsistensi internal tes.

C.      Contoh Pengujian Validitas dan Reliabilitas Instrumen
Pengujian validitas tiap butir digunakan analisis item, yaitu mengkorelasikan skor tiap butir dengan skor total yang merupakan jumlah tiap skor butir.

Data hasil uji coba adalah sebagai berikut:
Nomor Responden
Nomor Butir Pertanyaan
Jumlah
1
2
3
4
5
6
7
1
5
4
3
5
3
5
3
28
2
5
4
3
4
3
4
3
26
3
4
4
2
4
3
4
3
24
4
4
3
3
3
4
3
4
24
5
5
5
3
4
5
5
4
31
6
3
3
2
3
2
3
1
17
7
3
3
2
3
2
2
2
17
8
3
2
2
3
2
2
2
16
9
2
2
1
2
1
2
1
11
10
2
1
1
1
1
1
1
8
Jumlah
36
31
22
32
26
31
24
202
Penyelesaian:


Untuk soal no 1
      = 0,976
Untuk n=10 dengan alpha sebesar 0,05 didapat nilai table r=0,631. Karena nilai koefesien korelasi antara skor butir dengan skor total untuk butir lebih besar dari 0,631, maka butir mempunyai korelasi signifikan dengan skor total tes. Dengan demikian maka semua butir tes dianggap valid atau dapat digunakan untuk mengukur hasil belajar.
Dari soal diatas, selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus koefesien Alpha, yaitu:
Koefisien reliabilitas dari contoh diatas dapat dihitung dengan cara pertama-tama dihitung varian butir sebagai berikut:
Nomor butir
Varian Butir
1
2
3
4
5
6
7
1,24
1,29
0,56
1,16
1,44
1,69
1,24
Jumlah
8,62

Jadi koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0,97







         


                                                           






Tidak ada komentar:

Posting Komentar