FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN

About This Presentation

Title:

FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN

Description:

... (e.g. .09) for clinical testing purposes. ... (contoh: Minnesota Multiphasic Personality Inventory, Myers-Briggs Type Indicator) ... – PowerPoint PPT presentation

Number of Views:309

Avg rating:3.0/5.0

Slides: 79

Provided by: MOE46

Category:

more less

Transcript and Presenter's Notes

Title: FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN

1
FCE3900 PENYELIDIKAN PENDIDIKANALAT UKUR
PENYELIDIKAN

Minggu 11

2
OBJEKTIF

Memahami maksud alat pengukuran dalam
penyelidikan.
Menggunakan alat pengukuran dalam penyelidikan
pendidikan.

3
Jenis Alat Ukur atau Instrumen Kajian

Ujian
mengukur prestasi maksimum
Skala/Inventori
mengukur pemeringkatan ciri-ciri subjek (contoh
Minnesota Multiphasic Personality Inventory,
Myers-Briggs Type Indicator)
Soal Selidik
mendapatkan maklumat daripada N yang besar
Lain-lain
teknik sosiometrik teknik projektif (contoh
Thematic Apperception Test, Roscharch Inkblot
Test)

4
Ujian

Satu set rangsangan (soalan atau kenyataan) untuk
mendapatkan respons subjek berasaskan pemarkahan.
Bagi mengukur penguasaan pelajar dalam sesuatu
mata pelajaran, bidang, kemahiran, kecerdasan
atau bakat.
Tahap penguasaan pelajar dikuantifikasikan dengan
memberi markah kepada jawapan yang diberi.

5
Ujian
6
Jenis-jenis Ujian

Ujian Pencapaian.
Ujian Kecerdasan (mental, emosi rohani).
Ujian Prestasi.
Ujian Kecekapan.
Ujian Bakat.
Ujian Personaliti, Sikap dan Minat.

7
Ujian Pencapaian

Mengukur secara khusus sejauh mana pelajar
menguasai isi sesuatu mata pelajaran yang diajar
Mempersoalkan apa yang pelajar telah belajar
Penguasaan isi mata pelajaran berlaku dalam
sesuatu tempoh sama ada selepas sesuatu sesi
pelajaran, satu minggu, setengah semester atau
sepanjang semester.
Boleh digunakan untuk menilai keberkesanan
pengajaran guru.
Ada ujian binaan guru dan ujian piawai

Merancang Ujian Pencapaian
Mengenal pasti objektif.
Menentukan kandungan ujian.
Menentukan jenis item (subjektif / objektif).
Menentukan bilangan item.
Menentukan paras kesukaran.

9
Ujian Kecerdasan

Mengukur kebolehan pelajar menyesuaikan diri
dengan persekitaran.
Kecerdasan melibatkan proses menakul persekitaran
bagi menyelesaikan masalah.
Memberi tumpuan kepada prestasi umum pelajar.
Jenis Kecerdasan mental, kecerdasan emosi dan
kecedasan rohani.

10
Ujian Prestasi

Menghendaki pelajar melakukan aktiviti yang
diperlukan
ujian kertas pensil digunakan untuk mengelak
berlakunya tekaan, dan untuk memberi penekanan
terhadap fakta
Memberi rangsangan kepada pelajar untuk
memperkenal dan mengembangkan aktiviti pemikiran
dan taakulan berasaskan kurikulum yang diajar
Teknik folio, rakaman
Contoh prestasi dalam kursus tertentu

11
Ujian Kecekapan

Mengukur kemahiran dan kecekapan dalam melakukan
sesuatu tugas yang dipelajari
Contoh kecekapan melukis, melakar reka bentuk
bangunan, kecekapan memasak, kecekapan berlari,
dan sebagainya.

12
Ujian Bakat

Digunakan untuk membuat telahan tentang kebolehan
pelajar belajar pada masa hadapan
Bakat merujuk kepada apa yang pelajar boleh
belajar
Contoh Ujian Bakat Bermain Bola Sepak, Ujian
Bakat Seni

13
Ujian Personaliti

Digunakan bagi memahami tingkah laku pelajar
khususnya sikap dan motivasi mereka
Mengukur kewujudan keadaan atau trait dalaman
seseorang (introvert/ekstrovert)
Ujian sikap mengukur kepercayaan yang mendorong
pelajar memberikan gerak balas terhadap sesuatu
rangsangan
Ujian minat mengukur kecenderungan seseorang
pelajar melakukan sesuatu perkara atau terhadap
sesuatu bidang.

14
Skala atau Inventori
15
Skala atau Inventori

Untuk mengukur pemboleh ubah kualitatif yang
berbentuk gagasan seperti ciri tingkah laku,
minat, sikap, dan personaliti yang dapat diukur
secara kuantitatif.
Digunakan dalam ujian personaliti, ujian sikap,
dan persepsi.

16
Soal Selidik
17
Soal Selidik

Digunakan bagi mendapatkan maklumat umum tentang
fakta, kepercayaan, kehendak, status sosio
ekonomi, latar belakang pelajar, pendapatan atau
tahap pendidikan.
Terdiri daripada jenis jawapan dibina, dan
jawapan dipilih.
Soal Selidik boleh dipos atau diberi secara
langsung kepada subjek.

Ciri-ciri soal selidik yang baik
Berasaskan kepada objektif dan definisi operasi.
Disemak dengan pengalaman sorotan berkaitan.
Tentukan kesesuaian soalan atau pernyataan.
Soalan tidak prejudis.
Nyatakan soalan atau pilihan jawapan dengan
jelas.
Jawapan ikhlas.
Soalan tidak memesong/memaksa subjek.
Tempoh menjawab minimum.
Disusun secara psikologi mudah ke susah.

19
Soal Selidik Pos

Digunakan untuk bilangan subjek yang ramai dan
pelbagai.
Penyelidik perlu memastikan pulangan tinggi
dengan cara
Nyatakan kepentingan soal selidik kepada subjek.
Sertakan surat pengenalan (tujuan dan nilai
penyelidikan) dan surat sokongan (pihak
berwibawa).
Sertakan sampul jawapan bersetem yang dan
beralamat sendiri.
Pastikan kesesuaian masa menjawab.
Soalan dan maklumat diperlukan mudah, jelas dan
ringkas.
Format menarik.
Lakukan usaha memastikan pulangan tinggi dengan
minimumkan kesukaran subjek menjawab,
menghantarkan surat ingatan, soal selidik
gantian, dan surat penghargaan dan maklum balas
jika perlu.

20
Temu Bual
21
Temubual

Melibatkan penyelidik dan subjek hadir sama.
Kaedah tertua.
Soalan dibina untuk merangsang maklumat.
Kekuatan
kerjasama, interaksi secara langsung dan aktif.
Mudah suai, mengikut situasi subjek.
Hubungan lebih erat, jawapan lebih tepat.
Kelemahan
Memerlukan masa, tenaga dan kos yang tinggi.
Dipengaruhi oleh personaliti subjek dan
penyelidik.
Pengaruh faktor luaran keletihan, kebosanan,
membuang masa, kebolehan merekod, kurang
pengetahuan tentang kajian, sikap dsb.

22
Pemerhatian
23
Pemerhatian

Memerhati tingkah laku berdasarkan pemboleh ubah
yang dikenal pasti seperti masa berbeza akan
menyebabkan tingkah laku berbeza.
Perlu dikenalpasti tingkah laku secara ekslusif
(tidak ada pertindanan tingkah laku) dan
extensive (kenal pasti kemungkinan kejadian semua
tingkah laku).
Peranan penyelidik sebagai pemerhati.
Aktiviti penyelidik adalah melihat, mendengar dan
merekod.
Penyelidikan bernilai tinggi jika dilakukan
secara objektif.

24
Jenis Pemerhatian

Pemerhatian turut serta
Penyelidik berada dalam unit sosial subjek dan
bergaul dengan subjek tetapi tidak mempengaruhi
subjek.
Penyelidik dan subjek lebih mengenali.
Masalah yang timbul adalah reaksi subjek
Jawapan tepat jika subjek bereaksi positif.
Jawapan kurang tepat jika subjek bereaksi
negatif.
Sukar mencatatkan tingkah laku Isu penerimaan
dan penolakan subjek, isu perasaan seperti
simpati, hilang keobjektifan ketika merekod
maklumat.

Pemerhatian tidak turut serta
Penyelidik berada di luar unit sosial yang
dicerap.
Penyelidik tidak mencampuri tingkah laku subjek.
Maklumat lebih dipercayai kerana kurang
dipengaruhi oleh reaksi subjek, perasaan dan
simpati penyelidik.
Kesan sampingan berlaku jika subjek dan unit
sosial sedar akan kehadiran penyelidikan sebagai
pemerhati.

26
Pembinaan Instrumen
27
Prinsip Pembinaan Instrumen Kajian

Berpandukan objektif penyelidikan.
Berasaskan definisi operasi pemboleh ubah.
Tentukan sama ada jawapan dibina dan atau
dipilih.
Tentukan kesesuaian bilangan.
Tentukan kesesuaian aras kesukaran.
Tentukan kesesuaian aras diskriminasi.
Tentukan kesesuaian kebolehpercayaan.
Mudah tadbir.
Mudah tafsir.

28
Soal Selidik

Digunakan bagi mendapatkan maklumat.
Ciri-ciri soal selidik yang baik
Berasaskan kepada objektif dan definisi operasi.
Disemak dengan pengalaman dan sorotan berkaitan.
Tentukan kesesuaian soalan atau pernyataan.
Soalan tidak prejudis.
Nyatakan soalan atau pilihan jawapan dengan
jelas.
Pilihan jawapan saling ekslusif dan habisan.
Jawapan ikhlas.
Soalan tidak memesong atau memaksa subjek.
Tempoh menjawab minimum.
Disusun secara psikologi mudah ke susah.

29
Langkah Membentuk Instrumen Kajian

Senaraikan pembolehubah yang ingin dikaji dan
rujuk teori dan model berkaitan dengan
pembolehubah yang dikaji.
Bina Jadual Penentuan Indeks Pengukuran.
Jalankan ujian-pra.
Rujuk pakar dalam bidang berkenaan.
Jalankan ujian atau kajian rintis (pilot
test/study).

30
Jadual Penentuan Indeks Pengukuran
Jenis instrumen Soal Selidik Jenis Item aneka
Pilihan Pembolehubah Pemikiran Kreatif
Bil. Sub-Indeks (Pemikiran kreatif) Bil. Item
1. Keaslian 7
2. Kelancaran 6
3. Penghuraian 7
Jumlah item 20 Jumlah item 20 Jumlah item 20
31
KESAHAN (VALIDITY)
32
Validity refers to the degree in which our test
or other measuring device is truly measuring what
we intended it to measure.
KESAHAN (VALIDITY)
Sejauh mana alat mengukur apa yang ia sepatutnya
ukur
33
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan bermaksud kebolehan ujian mengukur apa
yang sepatutnya diukur, Youngman Eggleston,
1982 Sax Newton, 1997)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur data
yang dikehendaki untuk mencapai objektif kajian
(Mohd Majid Konting, 1990)
34
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur data
yang dikehendaki untuk mencapai objektif kajian
(Mohd Majid Konting, 1990)
35
Based on Internal Structure
Construct (determination of the significance,
meaning, purpose, and use of the scores)
Kesahan Gagasan
Tiga Aspek Kesahan
Based on Relations to Other Variables
Based on content
Kesahan Kriteria
Kesahan Kandungan
Criterion-referenced (scores are a predictor of
an outcome or criterion they are expected to
predict)
Content (representative of all possible questions
that could be asked)
Content validation is usually carried out by
experts
Concurrent Evidence
Predictive Evidence
36
Menurut Fraenkel Wallen (1996) kesahan boleh
dibuktikan melalui beberapa kaedah seperti
kesahan isi kandungan (content validity), kesahan
telahan (predictive validity), kesahan serentak
(concurrent validity) dan kesahan gagasan
(construct validity)
37
Evidence Based on Content
Kesahan Kandungan(Content Validity)

Sejauh mana alat merangkumi kandungan sesuatu
bidang.
Matlamat utama ialah untuk memastikan semua isi
dan kandungan bidang yang diukur menggambarkan
bidang tersebut.
Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji.
Pendapat pakar atau penilai luar diperlukan bagi
menilai kesesuaian butiran bagi domain yang
dipilih.

38
Content validity

is concerned with a tests ability to include or
represent all of the content of a particular
construct. The question 1 1 ___ may be a
valid basic addition question. Would it
represent all of the content that makes up the
study of mathematics? It may be included on a
scale of intelligence, but does it represent all
of intelligence? The answer to these questions
is obviously no. To develop a valid test of
intelligence, not only must there be questions on
math, but also questions on verbal reasoning,
analytical ability, and every other aspect of the
construct we call intelligence. There is no easy
way to determine content validity aside from
expert opinion.

39
Content validity

Do the items appear to represent the thing you
are trying to measure?
Does the set of items underrepresented the
constructs content (i.e., have you excluded any
important content areas or topics?)
Do any of the items represent something other
than what you are trying to measure (i.e., have
you included any irrelevant items?)

40
Content validity

Sebelum sesuatu instrumen itu dikatakan mempunyai
kesahan kandungan, lima syarat ini perlu
dipenuhi
Bidang kandungan mestilah dinyatakan dalam bentuk
tingkah laku yang secara umum diterima maknanya.
Bidang mestilah dihuraikan dengan jelas.
Bidang mestilah relevan dengan tujuan penggunaan
ujian.
Hakim-hakim yang berkelayakan mestilah bersetuju
bahawa bidang telah disampel secara mencukupi.

41
Kesahan Gagasan(Construct Validity)
Evidence Based on Internal Structure

To measure several components or dimensions of a
construct.
Use Factor Analysis to analyzes correlations
among test items and tells you the number of
factors present. Its tell you whether the test is
unidimensional or multidimensional.
Unidimensional all the item measure are single
construct.
Multidimensional different set of item tap
different construct or different component of a
broader construct.

42
Internal Structure

Factor analysis tell you how many dimensions or
factors your test items represent.
Also can obtain a measure of test homogeneity
(i.e., the degree to which the different items
measure the same construct or trait)
Use coefficient alpha (Alpha Cronbach) for the
test of homogeneity.
If the alpha is low (e.g., lt.70) for the test,
then some items might be measuring different
constructs or some items might be bad.
Examine the items that are contributing to your
low coefficient alpha and consider eliminating or
revising them.

43
Based on Relations to Other Variables
Kesahan Kriteria (Criterion Validity)

Obtained by relating your test scores to a
relevant criterion.
A criterion is the standard or benchmark that you
want to predict accurately on the basis of scores
from your test.
Sejauh mana kaitan antara alat dengan kriteria
luaran yang berkecuali (sama ada item mengukur
kriteria yang hendak diukur).
Ditentukan dengan analisis korelasi antara dua
set markah.
Calculate correlation coefficients for the study
of validity validity coefficients.

44
Concurrent Validity

Concurrent Validity refers to a measurement
devices ability to vary directly with a measure
of the same construct or indirectly with a
measure of an opposite construct. It allows you
to show that your test is valid by comparing it
with an already valid test. Administering the
focal test and criterion test at approximately
the same point in time (i.e., concurrently) and
then correlating the two set of scores. If the
two sets of scores highly correlated, you have
concurrent evidence.

e.g.
A new test of adult intelligence, for example,
would have concurrent validity if it had a high
positive correlation with the Wechsler Adult
Intelligence Scale since the Wechsler is an
accepted measure of the construct we call
intelligence. An obvious concern relates to the
validity of the test against which you are
comparing your test. Some assumptions must be
made because there are many who argue the
Wechsler scales, for example, are not good
measures of intelligence.
45
Predictive Validity

Obtain predictive evidence of validity by
measuring your participants at one point in time
on your test and then, at a future time,
measuring them on the criterion measure.
Take more time and effort than concurrent
evidence, but it can provide superior evidence
that your test does what you want it to do.

In order for a test to be a valid screening
device for some future behavior, it must have
predictive validity. The SAT is used by college
screening committees as one way to predict
college grades. The GMAT is used to predict
success in business school. And the LSAT is used
as a means to predict law school performance.
The main concern with these, and many other
predictive measures is predictive validity
because without it, they would be worthless

46
Reliability is synonymous with the consistency of
a test, survey, observation, or other measuring
device. Imagine stepping on your bathroom scale
and weighing 140 pounds only to find that your
weight on the same scale changes to 180 pounds an
hour later and 100 pounds an hour after that.
Base on the inconsistency of this scale, any
research relying on it would certainly be
unreliable. Consider an important study on a new
diet program that relies on your inconsistent or
unreliable bathroom scale as the main way to
collect information regarding weight change.
Would you consider their results accurate?
KEBOLEH PERCAYAAN (RELIABILITY)
47
Kebolehpercayaan

Sejauh mana instrumen mengukur dengan tekal apa
yang hendak diukur.
Scores from measuring variables that are stable
and consistent

48
Test-retest Reliability
Types of Reliability
Internal Consistency Reliability
Equivalent Forms Reliability
49
Test-Retest Reliability
Merujuk kepada ketekalan atau stabiliti markah
ujian jika dilakukan pada masa yang berbeza.
Contoh Ujian diberikan kepada 100 individu untuk
satu masa dan diulangi pada masa berlainan. Dua
set markah ini dikorelasikan. Sekiranya individu
memperoleh markah tertinggi dalam ujian 1 juga
memperolehi markah tertinggi dalam ujian 2,
begitu juga individu yang mendapat markah
terendah dalam ujian 1 juga mendapat markah
terendah dalam ujian, maka dikatakan mempunyai
korelasi yang tinggi. Oleh itu soalan ujian
tersebut mempunyai kebolehpercayaan yang tinggi.
50
Equivalent Forms Reliability

Refers to the consistency of a group of
individuals scores on two equivalent forms of a
test designed to measure the same characteristic.
Menggunakan satu alat yang dibina dan satu lagi
yang piawai.
Ditadbir ke atas subjek yang sama dan pada masa
yang sama atau masa yang lain.
Equivalent form means that two tests are
constructed so that they are identical in every
way except for the specific items asked on the
test.
This means that they have the same number of
items, the items are the same difficulty level,
the item measure the same construct, and the test
is administered, scored, and interpreted in the
same way.
The two set of scores are than correlated. If
this reliability coefficient to be very high and
positive, that is the individuals who do well on
the first form of the test should also do well on
the second form, and individuals who performed
poorly on the first form of the test should
perform poorly on the second test.

51
Internal Consistency Reliability

Internal consistency refers to how consistently
the items on a test measure a single construct or
concept.
The test-retest methods of assessing reliability
are general methods that can be used with just
about any test.
Internal consistency measures are convenient and
are very popular with researchers because they
require one group of individuals to take the test
one time.
Two indexes of internal consistency
Split half reliability
Coefficient alpha

52
Split-half reliability

Splitting a test into two equivalent halves and
then assessing the consistency of the scores
across the two halves of the test.
Divide the test into halves and correlate the
scores from the two halves.
Compute the correlation between scores on the two
halves of the test using Spearman-Brown formula.
The low correlation indicates that the test was
unreliable, a high correlation indicates that the
test was reliable.

53
Coefficient alpha

Lee Cronbach 1951) developed coefficient alpha..
Alpha Cronbach
Coefficient alpha tells you the degree to which
the items are interrelated.
Rule of thumb
At a minimum, greater than or equal to .07 for
research purposes and somewhat greater than that
value (e.g. .09) for clinical testing purposes.

54
Validity and reliability
55
Sekiranya pekali kebolehpercayaan rendah???
56
Meningkatkan Kebolehpercayaan

Pernyataan item mestilah jelas dan tepat.
Arahan mestilah jelas dan ringkas.
Item hendaklah bentuk sejenis.
Situasi dan masa pengukuran hendaklah piawai,
serupa dan terkawal.
Elakkan gangguan ke atas subjek.
Elakkan kebimbangan subjek dengan memberi jaminan
keselamatan dan kerahsiaan ke atas maklumat yang
diberi.

57
Fasa terakhir tinjauan sebelum pengumpulan data
bermula.
Ujian Rintis
Matlamatnya adalah untuk mencari masalah dalam
soal selidik, termasuk soalan yang lemah, arahan
yang tidak lengkap dan item yang sukar dijawab.
58
Garis panduan ujian rintis
Tidak boleh gunakan kumpulan fokus sebenar.
Untuk kajian baharu, lakukan dua kali ujian
rintis.
Jumlah responden tidak ditentukan dengan tepat,
dicadangkan sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang.
59
Procedures for Administering the Data Collection
Develop standard written procedures for
administering an instrument
Obtain permission to collect and use public
documents
Train researchers to collect observational data

Respect individuals and sites during data
gathering (ethics)

60
What Permissions Are NeededObtaining Permission
Institutional or organizational (e.g., school
district)
Site-specific (e.g., secondary school)
Individual participants
Parents of participants who are not considered
adults
Campus approval (e.g., university or college) and
Institutional Review Board (IRB)
61
Kesahan

Sejauh mana alat mengukur apa yang ia sepatutnya
ukur.
Tiga Aspek
Kesahan Gagasan
Kesahan Kandungan
Kesahan Kriteria

62
Kesahan Kandungan

Sejauh mana alat merangkumi kandungan sesuatu
bidang.
Matlamat utama ialah untuk memastikan semua isi
dan kandungan bidang yang diukur menggambarkan
bidang tersebut.
Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji.
Jika kandungan luas, perlu persampelan kandungan.
Bina Jadual Penentuan bagi mengenalpasti
domain-domain yang hendak diukur.
Pendapat pakar atau penilai luar diperlukan bagi
menilai kesesuaian butiran bagi domain yang
dipilih.

63
Kesahan Gagasan

Sejauh mana alat menghasilkan gerak balas yang
mewakili gagasan (sikap, motivasi) yang diukur.
Walau pun berbentuk abstrak, terdapat ciri atau
kesan daripada kewujudan atau ketidak wujudan
sesuatu gagasan pendidikan (diukur secara tak
langsung berasaskan kesan atau ciri yang terhasil
daripada gagasan).
Contoh Minat terhadap matematik adalah terdiri
daripada bilangan latihan, tempoh masa membuat
latihan matematik dan sebagainya.
Analisis faktor digunakan bagi membina alat ukur
gagasan.

64
Kesahan Kriteria

Sejauh mana kaitan antara item alat dengan
kriteria luaran yang berkecuali (sama ada butir
mengukur kriteria yang hendak diukur).
Ditentukan dengan analisis korelasi antara dua
set markah (markah alat dibina dengan alat
kriteria).
Kriteria Serentak kriteria yang ditunjukkan pada
masa yang sama dengan pengukuran. Misalnya,
kebolehan semasa bermain muzik.
Kriteria Jangkaan kriteria yang ditunjukkan pada
masa hadapan selepas pengukuran. Misalnya,
kebolehan bermain muzik pada suatu masa hadapan
selepas pengukuran dilakukan.

65
KEBOLEH PERCAYAAN(RELIABILITY)
66
Kebolehpercayaan

Sejauh mana alat mengukur dengan tekal apa yang
hendak diukur.
Keboleh percayaan alat ukur adalah ketekalan alat
mengukur pemboleh ubah atau gagasan.
Variasi atau perubahan yang wujud antara dua
pengukuran dengan menggunakan alat ukur yang sama
merupakan aspek yang penting dalam menentukan
ketekalan alat ukur.

67
Cara menentukan kebolehpercayaan alat ukur

Indeks Kebolehpercayaan
Merupakan pekali yang menunjukkan ketekalan
sesuatu alat ukur.
Ditentukan dengan menggunakan pekali korelasi
antara dua set respons (markah) yang diperolehi
hasil daripada gerak balas subjek terhadap alat
ukur.
Kaedah menguji kebolehpercayaan
1. Kaedah Bahagi Dua (Split-half)
2. Kaedah Uji dan Uji Kembali (Test-retest)
3. Kaedah Bentuk Setara (Equavalent Form)

68
1. Kaedah Bahagi Dua

Alat ukur yang sama ditadbirkan hanya sekali ke
atas subjek (hanya uji sekali).
Respons pada butir yang bernombor ganjil
diasingkan daripada butir yang bernombor genap.
Kedua-dua set markah dikorelasikan.
Pekali korelasi yang positif dan teguh antara dua
set markah menunjukkan indeks kebolehpercayaan
yang tinggi.
Gunakan formula Spearman-Brown, Kuder Richardson
dan Alpha Cronbach untuk mendapatkan pekali
korelasi.

69
Pekali Alpha Cronbach (a)

Digunakan untuk mengukur ketekalan dalaman dan
homogeniti.
Bergantung kepada ketekalan prestasi individu
dari satu butir ke satu butir yang lain (darjah
persetujuan terhadap butir-butir pernyataan).
Pekali Alpha Cronbach adalah berasaskan kepada
sisihan piawai alat ukur dan sisihan piawai
butir-butir yang berlainan.

70
Pekali alpha berasaskan kepada sisihan piawai
alat ukur dan sisihan piawai butir yang berlainan
71
2. Kaedah Uji dan Uji Kembali

Ujian yang sama ditadbirkan dua kali kepada
respondens yang sama, pada masa yang berlainan.
Dua set markah itu dikorelasikan.
Pekali korelasi Indeks keboleh percayaan.

72
3. Kaedah Bentuk Setara (Equavalent Forms)

Digunakan apabila ada kemungkinan subjek akan
ingat respons pada ujian pertama.
Menggunakan satu alat yang dibina dan satu lagi
yang piawai.
Kedua-dua alat setara dari segi kandungan (isi
kandungan dan tahap kesukaran) tetapi berbeza
dari segi penyampaian.
Ditadbir ke atas subjek yang sama dan pada masa
yang sama atau masa yang lain.
Markah dua alat dikorelasikan dan hasil korelasi
adalah sama dengan pekali kestabilan kesetaraan.

73
Meningkatkan Kebolehpercayaan

Pernyataan butir mestilah jelas dan tepat.
Arahan mestilah jelas dan ringkas.
Butir hendaklah bentuk sejenis.
Situasi dan masa pengukuran hendaklah piawai,
serupa dan terkawal.
Elakkan gangguan ke atas subjek.
Elakkan kebimbangan subjek dengan memberi jaminan
keselamatan dan kerahsiaan ke atas maklumat yang
diberi.

74
Ujian Rintis
75

Fasa terakhir tinjauan sebelum pengumpulan data
bermula.
Matlamatnya adalah untuk mencari masalah dalam
soal selidik, termasuk soalan yang lemah, arahan
yang tidak lengkap dan item yang sukar dijawab.

76
Garis panduan ujian rintis

Jumlah responden tidak ditentukan dengan tepat,
dicadangkan sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang.
Untuk kajian baru, lakukan dua kali ujian rintis.
Tidak boleh gunakan kumpulan fokus sebenar.

77
Pengumpulan Data
78
SEKIANTERIMA KASIH

Write a Comment

User Comments (0)