FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN - PowerPoint PPT Presentation

1 / 78
About This Presentation
Title:

FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN

Description:

... (e.g. .09) for clinical testing purposes. ... (contoh: Minnesota Multiphasic Personality Inventory, Myers-Briggs Type Indicator) ... – PowerPoint PPT presentation

Number of Views:309
Avg rating:3.0/5.0
Slides: 79
Provided by: MOE46
Category:

less

Transcript and Presenter's Notes

Title: FCE3900 PENYELIDIKAN PENDIDIKAN ALAT UKUR PENYELIDIKAN


1
FCE3900 PENYELIDIKAN PENDIDIKANALAT UKUR
PENYELIDIKAN
  • Minggu 11

2
OBJEKTIF
  • Memahami maksud alat pengukuran dalam
    penyelidikan.
  • Menggunakan alat pengukuran dalam penyelidikan
    pendidikan.

3
Jenis Alat Ukur atau Instrumen Kajian
  • Ujian
  • mengukur prestasi maksimum
  • Skala/Inventori
  • mengukur pemeringkatan ciri-ciri subjek (contoh
    Minnesota Multiphasic Personality Inventory,
    Myers-Briggs Type Indicator)
  • Soal Selidik
  • mendapatkan maklumat daripada N yang besar
  • Lain-lain
  • teknik sosiometrik teknik projektif (contoh
    Thematic Apperception Test, Roscharch Inkblot
    Test)

4
Ujian
  • Satu set rangsangan (soalan atau kenyataan) untuk
    mendapatkan respons subjek berasaskan pemarkahan.
  • Bagi mengukur penguasaan pelajar dalam sesuatu
    mata pelajaran, bidang, kemahiran, kecerdasan
    atau bakat.
  • Tahap penguasaan pelajar dikuantifikasikan dengan
    memberi markah kepada jawapan yang diberi.

5
Ujian
6
Jenis-jenis Ujian
  • Ujian Pencapaian.
  • Ujian Kecerdasan (mental, emosi rohani).
  • Ujian Prestasi.
  • Ujian Kecekapan.
  • Ujian Bakat.
  • Ujian Personaliti, Sikap dan Minat.

7
Ujian Pencapaian
  • Mengukur secara khusus sejauh mana pelajar
    menguasai isi sesuatu mata pelajaran yang diajar
  • Mempersoalkan apa yang pelajar telah belajar
  • Penguasaan isi mata pelajaran berlaku dalam
    sesuatu tempoh sama ada selepas sesuatu sesi
    pelajaran, satu minggu, setengah semester atau
    sepanjang semester.
  • Boleh digunakan untuk menilai keberkesanan
    pengajaran guru.
  • Ada ujian binaan guru dan ujian piawai

8
  • Merancang Ujian Pencapaian
  • Mengenal pasti objektif.
  • Menentukan kandungan ujian.
  • Menentukan jenis item (subjektif / objektif).
  • Menentukan bilangan item.
  • Menentukan paras kesukaran.

9
Ujian Kecerdasan
  • Mengukur kebolehan pelajar menyesuaikan diri
    dengan persekitaran.
  • Kecerdasan melibatkan proses menakul persekitaran
    bagi menyelesaikan masalah.
  • Memberi tumpuan kepada prestasi umum pelajar.
  • Jenis Kecerdasan mental, kecerdasan emosi dan
    kecedasan rohani.

10
Ujian Prestasi
  • Menghendaki pelajar melakukan aktiviti yang
    diperlukan
  • ujian kertas pensil digunakan untuk mengelak
    berlakunya tekaan, dan untuk memberi penekanan
    terhadap fakta
  • Memberi rangsangan kepada pelajar untuk
    memperkenal dan mengembangkan aktiviti pemikiran
    dan taakulan berasaskan kurikulum yang diajar
  • Teknik folio, rakaman
  • Contoh prestasi dalam kursus tertentu

11
Ujian Kecekapan
  • Mengukur kemahiran dan kecekapan dalam melakukan
    sesuatu tugas yang dipelajari
  • Contoh kecekapan melukis, melakar reka bentuk
    bangunan, kecekapan memasak, kecekapan berlari,
    dan sebagainya.

12
Ujian Bakat
  • Digunakan untuk membuat telahan tentang kebolehan
    pelajar belajar pada masa hadapan
  • Bakat merujuk kepada apa yang pelajar boleh
    belajar
  • Contoh Ujian Bakat Bermain Bola Sepak, Ujian
    Bakat Seni

13
Ujian Personaliti
  • Digunakan bagi memahami tingkah laku pelajar
    khususnya sikap dan motivasi mereka
  • Mengukur kewujudan keadaan atau trait dalaman
    seseorang (introvert/ekstrovert)
  • Ujian sikap mengukur kepercayaan yang mendorong
    pelajar memberikan gerak balas terhadap sesuatu
    rangsangan
  • Ujian minat mengukur kecenderungan seseorang
    pelajar melakukan sesuatu perkara atau terhadap
    sesuatu bidang.

14
Skala atau Inventori
15
Skala atau Inventori
  • Untuk mengukur pemboleh ubah kualitatif yang
    berbentuk gagasan seperti ciri tingkah laku,
    minat, sikap, dan personaliti yang dapat diukur
    secara kuantitatif.
  • Digunakan dalam ujian personaliti, ujian sikap,
    dan persepsi.

16
Soal Selidik
17
Soal Selidik
  • Digunakan bagi mendapatkan maklumat umum tentang
    fakta, kepercayaan, kehendak, status sosio
    ekonomi, latar belakang pelajar, pendapatan atau
    tahap pendidikan.
  • Terdiri daripada jenis jawapan dibina, dan
    jawapan dipilih.
  • Soal Selidik boleh dipos atau diberi secara
    langsung kepada subjek.

18
  • Ciri-ciri soal selidik yang baik
  • Berasaskan kepada objektif dan definisi operasi.
  • Disemak dengan pengalaman sorotan berkaitan.
  • Tentukan kesesuaian soalan atau pernyataan.
  • Soalan tidak prejudis.
  • Nyatakan soalan atau pilihan jawapan dengan
    jelas.
  • Jawapan ikhlas.
  • Soalan tidak memesong/memaksa subjek.
  • Tempoh menjawab minimum.
  • Disusun secara psikologi mudah ke susah.

19
Soal Selidik Pos
  • Digunakan untuk bilangan subjek yang ramai dan
    pelbagai.
  • Penyelidik perlu memastikan pulangan tinggi
    dengan cara
  • Nyatakan kepentingan soal selidik kepada subjek.
  • Sertakan surat pengenalan (tujuan dan nilai
    penyelidikan) dan surat sokongan (pihak
    berwibawa).
  • Sertakan sampul jawapan bersetem yang dan
    beralamat sendiri.
  • Pastikan kesesuaian masa menjawab.
  • Soalan dan maklumat diperlukan mudah, jelas dan
    ringkas.
  • Format menarik.
  • Lakukan usaha memastikan pulangan tinggi dengan
    minimumkan kesukaran subjek menjawab,
    menghantarkan surat ingatan, soal selidik
    gantian, dan surat penghargaan dan maklum balas
    jika perlu.

20
Temu Bual
21
Temubual
  • Melibatkan penyelidik dan subjek hadir sama.
  • Kaedah tertua.
  • Soalan dibina untuk merangsang maklumat.
  • Kekuatan
  • kerjasama, interaksi secara langsung dan aktif.
  • Mudah suai, mengikut situasi subjek.
  • Hubungan lebih erat, jawapan lebih tepat.
  • Kelemahan
  • Memerlukan masa, tenaga dan kos yang tinggi.
  • Dipengaruhi oleh personaliti subjek dan
    penyelidik.
  • Pengaruh faktor luaran keletihan, kebosanan,
    membuang masa, kebolehan merekod, kurang
    pengetahuan tentang kajian, sikap dsb.

22
Pemerhatian
23
Pemerhatian
  • Memerhati tingkah laku berdasarkan pemboleh ubah
    yang dikenal pasti seperti masa berbeza akan
    menyebabkan tingkah laku berbeza.
  • Perlu dikenalpasti tingkah laku secara ekslusif
    (tidak ada pertindanan tingkah laku) dan
    extensive (kenal pasti kemungkinan kejadian semua
    tingkah laku).
  • Peranan penyelidik sebagai pemerhati.
  • Aktiviti penyelidik adalah melihat, mendengar dan
    merekod.
  • Penyelidikan bernilai tinggi jika dilakukan
    secara objektif.

24
Jenis Pemerhatian
  • Pemerhatian turut serta
  • Penyelidik berada dalam unit sosial subjek dan
    bergaul dengan subjek tetapi tidak mempengaruhi
    subjek.
  • Penyelidik dan subjek lebih mengenali.
  • Masalah yang timbul adalah reaksi subjek
  • Jawapan tepat jika subjek bereaksi positif.
  • Jawapan kurang tepat jika subjek bereaksi
    negatif.
  • Sukar mencatatkan tingkah laku Isu penerimaan
    dan penolakan subjek, isu perasaan seperti
    simpati, hilang keobjektifan ketika merekod
    maklumat.

25
  • Pemerhatian tidak turut serta
  • Penyelidik berada di luar unit sosial yang
    dicerap.
  • Penyelidik tidak mencampuri tingkah laku subjek.
  • Maklumat lebih dipercayai kerana kurang
    dipengaruhi oleh reaksi subjek, perasaan dan
    simpati penyelidik.
  • Kesan sampingan berlaku jika subjek dan unit
    sosial sedar akan kehadiran penyelidikan sebagai
    pemerhati.

26
Pembinaan Instrumen
27
Prinsip Pembinaan Instrumen Kajian
  • Berpandukan objektif penyelidikan.
  • Berasaskan definisi operasi pemboleh ubah.
  • Tentukan sama ada jawapan dibina dan atau
    dipilih.
  • Tentukan kesesuaian bilangan.
  • Tentukan kesesuaian aras kesukaran.
  • Tentukan kesesuaian aras diskriminasi.
  • Tentukan kesesuaian kebolehpercayaan.
  • Mudah tadbir.
  • Mudah tafsir.

28
Soal Selidik
  • Digunakan bagi mendapatkan maklumat.
  • Ciri-ciri soal selidik yang baik
  • Berasaskan kepada objektif dan definisi operasi.
  • Disemak dengan pengalaman dan sorotan berkaitan.
  • Tentukan kesesuaian soalan atau pernyataan.
  • Soalan tidak prejudis.
  • Nyatakan soalan atau pilihan jawapan dengan
    jelas.
  • Pilihan jawapan saling ekslusif dan habisan.
  • Jawapan ikhlas.
  • Soalan tidak memesong atau memaksa subjek.
  • Tempoh menjawab minimum.
  • Disusun secara psikologi mudah ke susah.

29
Langkah Membentuk Instrumen Kajian
  1. Senaraikan pembolehubah yang ingin dikaji dan
    rujuk teori dan model berkaitan dengan
    pembolehubah yang dikaji.
  2. Bina Jadual Penentuan Indeks Pengukuran.
  3. Jalankan ujian-pra.
  4. Rujuk pakar dalam bidang berkenaan.
  5. Jalankan ujian atau kajian rintis (pilot
    test/study).

30
Jadual Penentuan Indeks Pengukuran
Jenis instrumen Soal Selidik Jenis Item aneka
Pilihan Pembolehubah Pemikiran Kreatif
Bil. Sub-Indeks (Pemikiran kreatif) Bil. Item
1. Keaslian 7
2. Kelancaran 6
3. Penghuraian 7
Jumlah item 20 Jumlah item 20 Jumlah item 20
31
KESAHAN (VALIDITY)
32
Validity refers to the degree in which our test
or other measuring device is truly measuring what
we intended it to measure.
KESAHAN (VALIDITY)
Sejauh mana alat mengukur apa yang ia sepatutnya
ukur
33
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan bermaksud kebolehan ujian mengukur apa
yang sepatutnya diukur, Youngman Eggleston,
1982 Sax Newton, 1997)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur data
yang dikehendaki untuk mencapai objektif kajian
(Mohd Majid Konting, 1990)
34
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur data
yang dikehendaki untuk mencapai objektif kajian
(Mohd Majid Konting, 1990)
35
Based on Internal Structure
Construct (determination of the significance,
meaning, purpose, and use of the scores)
Kesahan Gagasan
Tiga Aspek Kesahan
Based on Relations to Other Variables
Based on content
Kesahan Kriteria
Kesahan Kandungan
Criterion-referenced (scores are a predictor of
an outcome or criterion they are expected to
predict)
Content (representative of all possible questions
that could be asked)
Content validation is usually carried out by
experts
Concurrent Evidence
Predictive Evidence
36
Menurut Fraenkel Wallen (1996) kesahan boleh
dibuktikan melalui beberapa kaedah seperti
kesahan isi kandungan (content validity), kesahan
telahan (predictive validity), kesahan serentak
(concurrent validity) dan kesahan gagasan
(construct validity)
37
Evidence Based on Content
Kesahan Kandungan(Content Validity)
  • Sejauh mana alat merangkumi kandungan sesuatu
    bidang.
  • Matlamat utama ialah untuk memastikan semua isi
    dan kandungan bidang yang diukur menggambarkan
    bidang tersebut.
  • Berdasarkan kepada skop dan objektif dan
    kandungan sesuatu bidang yang dikaji.
  • Pendapat pakar atau penilai luar diperlukan bagi
    menilai kesesuaian butiran bagi domain yang
    dipilih.

38
Content validity
  • is concerned with a tests ability to include or
    represent all of the content of a particular
    construct. The question 1 1 ___ may be a
    valid basic addition question. Would it
    represent all of the content that makes up the
    study of mathematics? It may be included on a
    scale of intelligence, but does it represent all
    of intelligence? The answer to these questions
    is obviously no. To develop a valid test of
    intelligence, not only must there be questions on
    math, but also questions on verbal reasoning,
    analytical ability, and every other aspect of the
    construct we call intelligence. There is no easy
    way to determine content validity aside from
    expert opinion.

39
Content validity
  1. Do the items appear to represent the thing you
    are trying to measure?
  2. Does the set of items underrepresented the
    constructs content (i.e., have you excluded any
    important content areas or topics?)
  3. Do any of the items represent something other
    than what you are trying to measure (i.e., have
    you included any irrelevant items?)

40
Content validity
  • Sebelum sesuatu instrumen itu dikatakan mempunyai
    kesahan kandungan, lima syarat ini perlu
    dipenuhi
  • Bidang kandungan mestilah dinyatakan dalam bentuk
    tingkah laku yang secara umum diterima maknanya.
  • Bidang mestilah dihuraikan dengan jelas.
  • Bidang mestilah relevan dengan tujuan penggunaan
    ujian.
  • Hakim-hakim yang berkelayakan mestilah bersetuju
    bahawa bidang telah disampel secara mencukupi.

41
Kesahan Gagasan(Construct Validity)
Evidence Based on Internal Structure
  • To measure several components or dimensions of a
    construct.
  • Use Factor Analysis to analyzes correlations
    among test items and tells you the number of
    factors present. Its tell you whether the test is
    unidimensional or multidimensional.
  • Unidimensional all the item measure are single
    construct.
  • Multidimensional different set of item tap
    different construct or different component of a
    broader construct.

42
Internal Structure
  • Factor analysis tell you how many dimensions or
    factors your test items represent.
  • Also can obtain a measure of test homogeneity
    (i.e., the degree to which the different items
    measure the same construct or trait)
  • Use coefficient alpha (Alpha Cronbach) for the
    test of homogeneity.
  • If the alpha is low (e.g., lt.70) for the test,
    then some items might be measuring different
    constructs or some items might be bad.
  • Examine the items that are contributing to your
    low coefficient alpha and consider eliminating or
    revising them.

43
Based on Relations to Other Variables
Kesahan Kriteria (Criterion Validity)
  • Obtained by relating your test scores to a
    relevant criterion.
  • A criterion is the standard or benchmark that you
    want to predict accurately on the basis of scores
    from your test.
  • Sejauh mana kaitan antara alat dengan kriteria
    luaran yang berkecuali (sama ada item mengukur
    kriteria yang hendak diukur).
  • Ditentukan dengan analisis korelasi antara dua
    set markah.
  • Calculate correlation coefficients for the study
    of validity validity coefficients.

44
Concurrent Validity
  • Concurrent Validity refers to a measurement
    devices ability to vary directly with a measure
    of the same construct or indirectly with a
    measure of an opposite construct. It allows you
    to show that your test is valid by comparing it
    with an already valid test. Administering the
    focal test and criterion test at approximately
    the same point in time (i.e., concurrently) and
    then correlating the two set of scores. If the
    two sets of scores highly correlated, you have
    concurrent evidence.

e.g.
A new test of adult intelligence, for example,
would have concurrent validity if it had a high
positive correlation with the Wechsler Adult
Intelligence Scale since the Wechsler is an
accepted measure of the construct we call
intelligence. An obvious concern relates to the
validity of the test against which you are
comparing your test. Some assumptions must be
made because there are many who argue the
Wechsler scales, for example, are not good
measures of intelligence.
45
Predictive Validity
  • Obtain predictive evidence of validity by
    measuring your participants at one point in time
    on your test and then, at a future time,
    measuring them on the criterion measure.
  • Take more time and effort than concurrent
    evidence, but it can provide superior evidence
    that your test does what you want it to do.
  • In order for a test to be a valid screening
    device for some future behavior, it must have
    predictive validity. The SAT is used by college
    screening committees as one way to predict
    college grades. The GMAT is used to predict
    success in business school. And the LSAT is used
    as a means to predict law school performance.
    The main concern with these, and many other
    predictive measures is predictive validity
    because without it, they would be worthless

46
Reliability is synonymous with the consistency of
a test, survey, observation, or other measuring
device. Imagine stepping on your bathroom scale
and weighing 140 pounds only to find that your
weight on the same scale changes to 180 pounds an
hour later and 100 pounds an hour after that.
Base on the inconsistency of this scale, any
research relying on it would certainly be
unreliable. Consider an important study on a new
diet program that relies on your inconsistent or
unreliable bathroom scale as the main way to
collect information regarding weight change.
Would you consider their results accurate?
KEBOLEH PERCAYAAN (RELIABILITY)
47
Kebolehpercayaan
  • Sejauh mana instrumen mengukur dengan tekal apa
    yang hendak diukur.
  • Scores from measuring variables that are stable
    and consistent

48
Test-retest Reliability
Types of Reliability
Internal Consistency Reliability
Equivalent Forms Reliability
49
Test-Retest Reliability
Merujuk kepada ketekalan atau stabiliti markah
ujian jika dilakukan pada masa yang berbeza.
Contoh Ujian diberikan kepada 100 individu untuk
satu masa dan diulangi pada masa berlainan. Dua
set markah ini dikorelasikan. Sekiranya individu
memperoleh markah tertinggi dalam ujian 1 juga
memperolehi markah tertinggi dalam ujian 2,
begitu juga individu yang mendapat markah
terendah dalam ujian 1 juga mendapat markah
terendah dalam ujian, maka dikatakan mempunyai
korelasi yang tinggi. Oleh itu soalan ujian
tersebut mempunyai kebolehpercayaan yang tinggi.
50
Equivalent Forms Reliability
  • Refers to the consistency of a group of
    individuals scores on two equivalent forms of a
    test designed to measure the same characteristic.
  • Menggunakan satu alat yang dibina dan satu lagi
    yang piawai.
  • Ditadbir ke atas subjek yang sama dan pada masa
    yang sama atau masa yang lain.
  • Equivalent form means that two tests are
    constructed so that they are identical in every
    way except for the specific items asked on the
    test.
  • This means that they have the same number of
    items, the items are the same difficulty level,
    the item measure the same construct, and the test
    is administered, scored, and interpreted in the
    same way.
  • The two set of scores are than correlated. If
    this reliability coefficient to be very high and
    positive, that is the individuals who do well on
    the first form of the test should also do well on
    the second form, and individuals who performed
    poorly on the first form of the test should
    perform poorly on the second test.

51
Internal Consistency Reliability
  • Internal consistency refers to how consistently
    the items on a test measure a single construct or
    concept.
  • The test-retest methods of assessing reliability
    are general methods that can be used with just
    about any test.
  • Internal consistency measures are convenient and
    are very popular with researchers because they
    require one group of individuals to take the test
    one time.
  • Two indexes of internal consistency
  • Split half reliability
  • Coefficient alpha

52
Split-half reliability
  • Splitting a test into two equivalent halves and
    then assessing the consistency of the scores
    across the two halves of the test.
  • Divide the test into halves and correlate the
    scores from the two halves.
  • Compute the correlation between scores on the two
    halves of the test using Spearman-Brown formula.
  • The low correlation indicates that the test was
    unreliable, a high correlation indicates that the
    test was reliable.

53
Coefficient alpha
  • Lee Cronbach 1951) developed coefficient alpha..
    Alpha Cronbach
  • Coefficient alpha tells you the degree to which
    the items are interrelated.
  • Rule of thumb
  • At a minimum, greater than or equal to .07 for
    research purposes and somewhat greater than that
    value (e.g. .09) for clinical testing purposes.

54
Validity and reliability
55
Sekiranya pekali kebolehpercayaan rendah???
56
Meningkatkan Kebolehpercayaan
  • Pernyataan item mestilah jelas dan tepat.
  • Arahan mestilah jelas dan ringkas.
  • Item hendaklah bentuk sejenis.
  • Situasi dan masa pengukuran hendaklah piawai,
    serupa dan terkawal.
  • Elakkan gangguan ke atas subjek.
  • Elakkan kebimbangan subjek dengan memberi jaminan
    keselamatan dan kerahsiaan ke atas maklumat yang
    diberi.

57
Fasa terakhir tinjauan sebelum pengumpulan data
bermula.
Ujian Rintis
Matlamatnya adalah untuk mencari masalah dalam
soal selidik, termasuk soalan yang lemah, arahan
yang tidak lengkap dan item yang sukar dijawab.
58
Garis panduan ujian rintis
Tidak boleh gunakan kumpulan fokus sebenar.
Untuk kajian baharu, lakukan dua kali ujian
rintis.
Jumlah responden tidak ditentukan dengan tepat,
dicadangkan sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang.
59
Procedures for Administering the Data Collection
Develop standard written procedures for
administering an instrument
Obtain permission to collect and use public
documents
Train researchers to collect observational data
  • Respect individuals and sites during data
    gathering (ethics)

60
What Permissions Are NeededObtaining Permission
Institutional or organizational (e.g., school
district)
Site-specific (e.g., secondary school)
Individual participants
Parents of participants who are not considered
adults
Campus approval (e.g., university or college) and
Institutional Review Board (IRB)
61
Kesahan
  • Sejauh mana alat mengukur apa yang ia sepatutnya
    ukur.
  • Tiga Aspek
  • Kesahan Gagasan
  • Kesahan Kandungan
  • Kesahan Kriteria

62
Kesahan Kandungan
  • Sejauh mana alat merangkumi kandungan sesuatu
    bidang.
  • Matlamat utama ialah untuk memastikan semua isi
    dan kandungan bidang yang diukur menggambarkan
    bidang tersebut.
  • Berdasarkan kepada skop dan objektif dan
    kandungan sesuatu bidang yang dikaji.
  • Jika kandungan luas, perlu persampelan kandungan.
  • Bina Jadual Penentuan bagi mengenalpasti
    domain-domain yang hendak diukur.
  • Pendapat pakar atau penilai luar diperlukan bagi
    menilai kesesuaian butiran bagi domain yang
    dipilih.

63
Kesahan Gagasan
  • Sejauh mana alat menghasilkan gerak balas yang
    mewakili gagasan (sikap, motivasi) yang diukur.
  • Walau pun berbentuk abstrak, terdapat ciri atau
    kesan daripada kewujudan atau ketidak wujudan
    sesuatu gagasan pendidikan (diukur secara tak
    langsung berasaskan kesan atau ciri yang terhasil
    daripada gagasan).
  • Contoh Minat terhadap matematik adalah terdiri
    daripada bilangan latihan, tempoh masa membuat
    latihan matematik dan sebagainya.
  • Analisis faktor digunakan bagi membina alat ukur
    gagasan.

64
Kesahan Kriteria
  • Sejauh mana kaitan antara item alat dengan
    kriteria luaran yang berkecuali (sama ada butir
    mengukur kriteria yang hendak diukur).
  • Ditentukan dengan analisis korelasi antara dua
    set markah (markah alat dibina dengan alat
    kriteria).
  • Kriteria Serentak kriteria yang ditunjukkan pada
    masa yang sama dengan pengukuran. Misalnya,
    kebolehan semasa bermain muzik.
  • Kriteria Jangkaan kriteria yang ditunjukkan pada
    masa hadapan selepas pengukuran. Misalnya,
    kebolehan bermain muzik pada suatu masa hadapan
    selepas pengukuran dilakukan.

65
KEBOLEH PERCAYAAN(RELIABILITY)
66
Kebolehpercayaan
  • Sejauh mana alat mengukur dengan tekal apa yang
    hendak diukur.
  • Keboleh percayaan alat ukur adalah ketekalan alat
    mengukur pemboleh ubah atau gagasan.
  • Variasi atau perubahan yang wujud antara dua
    pengukuran dengan menggunakan alat ukur yang sama
    merupakan aspek yang penting dalam menentukan
    ketekalan alat ukur.

67
Cara menentukan kebolehpercayaan alat ukur
  • Indeks Kebolehpercayaan
  • Merupakan pekali yang menunjukkan ketekalan
    sesuatu alat ukur.
  • Ditentukan dengan menggunakan pekali korelasi
    antara dua set respons (markah) yang diperolehi
    hasil daripada gerak balas subjek terhadap alat
    ukur.
  • Kaedah menguji kebolehpercayaan
  • 1. Kaedah Bahagi Dua (Split-half)
  • 2. Kaedah Uji dan Uji Kembali (Test-retest)
  • 3. Kaedah Bentuk Setara (Equavalent Form)

68
1. Kaedah Bahagi Dua
  • Alat ukur yang sama ditadbirkan hanya sekali ke
    atas subjek (hanya uji sekali).
  • Respons pada butir yang bernombor ganjil
    diasingkan daripada butir yang bernombor genap.
  • Kedua-dua set markah dikorelasikan.
  • Pekali korelasi yang positif dan teguh antara dua
    set markah menunjukkan indeks kebolehpercayaan
    yang tinggi.
  • Gunakan formula Spearman-Brown, Kuder Richardson
    dan Alpha Cronbach untuk mendapatkan pekali
    korelasi.

69
Pekali Alpha Cronbach (a)
  • Digunakan untuk mengukur ketekalan dalaman dan
    homogeniti.
  • Bergantung kepada ketekalan prestasi individu
    dari satu butir ke satu butir yang lain (darjah
    persetujuan terhadap butir-butir pernyataan).
  • Pekali Alpha Cronbach adalah berasaskan kepada
    sisihan piawai alat ukur dan sisihan piawai
    butir-butir yang berlainan.

70
Pekali alpha berasaskan kepada sisihan piawai
alat ukur dan sisihan piawai butir yang berlainan
71
2. Kaedah Uji dan Uji Kembali
  • Ujian yang sama ditadbirkan dua kali kepada
    respondens yang sama, pada masa yang berlainan.
  • Dua set markah itu dikorelasikan.
  • Pekali korelasi Indeks keboleh percayaan.

72
3. Kaedah Bentuk Setara (Equavalent Forms)
  • Digunakan apabila ada kemungkinan subjek akan
    ingat respons pada ujian pertama.
  • Menggunakan satu alat yang dibina dan satu lagi
    yang piawai.
  • Kedua-dua alat setara dari segi kandungan (isi
    kandungan dan tahap kesukaran) tetapi berbeza
    dari segi penyampaian.
  • Ditadbir ke atas subjek yang sama dan pada masa
    yang sama atau masa yang lain.
  • Markah dua alat dikorelasikan dan hasil korelasi
    adalah sama dengan pekali kestabilan kesetaraan.

73
Meningkatkan Kebolehpercayaan
  • Pernyataan butir mestilah jelas dan tepat.
  • Arahan mestilah jelas dan ringkas.
  • Butir hendaklah bentuk sejenis.
  • Situasi dan masa pengukuran hendaklah piawai,
    serupa dan terkawal.
  • Elakkan gangguan ke atas subjek.
  • Elakkan kebimbangan subjek dengan memberi jaminan
    keselamatan dan kerahsiaan ke atas maklumat yang
    diberi.

74
Ujian Rintis
75
  • Fasa terakhir tinjauan sebelum pengumpulan data
    bermula.
  • Matlamatnya adalah untuk mencari masalah dalam
    soal selidik, termasuk soalan yang lemah, arahan
    yang tidak lengkap dan item yang sukar dijawab.

76
Garis panduan ujian rintis
  1. Jumlah responden tidak ditentukan dengan tepat,
    dicadangkan sekurang-kurangnya 25 orang, lebih
    baik antara 50 75 orang.
  2. Untuk kajian baru, lakukan dua kali ujian rintis.
  3. Tidak boleh gunakan kumpulan fokus sebenar.

77
Pengumpulan Data
78
SEKIANTERIMA KASIH
Write a Comment
User Comments (0)
About PowerShow.com