Differentsial elementning ishlashi - Differential item functioning

Differentsial elementning ishlashi (DIF) - bu ob'ektning statistik xarakteristikasi bo'lib, bu narsa alohida kichik guruhlar a'zolari uchun turli xil qobiliyatlarni o'lchash darajasini ko'rsatib beradi. Sinovda bir xil umumiy ballga ega bo'lgan kichik guruhlar uchun o'rtacha ko'rsatkichlar taqqoslanib, ushbu element barcha kichik guruhlar uchun asosan bir xil tarzda o'lchanadimi yoki yo'qligini aniqlaydi. DIFning mavjudligi tekshirishni va mulohazani talab qiladi va bu tarafkashlik mavjudligini anglatmaydi.[1] DIF tahlili testdagi elementlarning kutilmagan xatti-harakatlarini ko'rsatib beradi. Agar har xil guruhdagi odamlar ma'lum bir javob berish ehtimoli boshqacha bo'lsa, element DIFni ko'rsatmaydi; agar DIF turli guruhlardan bo'lgan odamlar uchun ko'rsatilsa xuddi shu asosiy qobiliyat bilan ma'lum bir javob berish ehtimoli boshqacha. DIFni baholashning umumiy protseduralari Mantel-Haenszel, elementlarga javob berish nazariyasi (IRT) asosidagi usullar va logistik regressiya.[2]

Tavsif

DIF deganda guruhlar bo'yicha ishlarning farqlari, ko'pincha demografik xususiyatga ega bo'lib, ular yashirin xususiyatga mos keladi yoki umuman olganda atribut yoki test bilan o'lchanadi.[3][4] Shuni ta'kidlash kerakki, DIF uchun narsalarni tekshirishda guruhlar o'lchangan atribut bo'yicha mos kelishi kerak, aks holda bu DIFni noto'g'ri aniqlanishiga olib kelishi mumkin. DIF yoki o'lchovlarning noaniqligi to'g'risida umumiy tushunchani yaratish uchun Osterlind va Everson (2009) tomonidan taqdim etilgan quyidagi misolni ko'rib chiqing.[5] Bunday holda, Y maxfiy tomonidan aniqlangan ma'lum bir test topshirig'iga javobni anglatadi qurish o'lchov qilinmoqda. Yashirin konstruktsiya teta (θ) deb nomlanadi, bu erda Y - bu θ ko'rsatkichi bo'yicha joylashtirilishi mumkin ehtimollik taqsimoti ning Y ning θ ifodasi bilan f(Y) | θ. Shuning uchun Y javobi yashirin belgiga (θ) bog'liq. DIF guruhlar o'rtasidagi Y ning shartli ehtimoliy farqlarini o'rgangani uchun, guruhlarni "ma'lumotnoma" va "fokal" guruhlar deb belgilaylik. Belgilash muhim emasligiga qaramay, adabiyotda odatiy amaliyot - referal guruhni imtiyozga ega deb gumon qilinayotgan guruh sifatida belgilash, fokal guruh esa sinovdan noqulay ahvolda qolishi kutilgan guruhni nazarda tutadi.[3] Shuning uchun, funktsional munosabatlarni hisobga olgan holda va bir xil bo'lgan degan taxmin ostida o'lchov xatosi ma'lumotnoma va fokal guruhlar uchun taqsimotlar quyidagicha degan xulosaga kelish mumkin nol gipoteza:

guruhlash o'zgaruvchisiga mos keladigan G bilan, "r" mos yozuvlar guruhi va "f" guruhi. Ushbu tenglama DIF mavjud bo'lmagan misolni anglatadi. Bunday holda, DIF yo'qligi haqiqat bilan belgilanadi shartli ehtimollik Y ning taqsimlanishi guruh a'zoligiga bog'liq emas. Tasvirlash uchun 0 va 1 javob variantlari bo'lgan elementni ko'rib chiqing, bu erda Y = 0 noto'g'ri javobni, Y = 1 esa to'g'ri javobni bildiradi. Ob'ektga to'g'ri javob berish ehtimoli har ikki guruh a'zolari uchun bir xil. Bu shuni anglatadiki, DIF yoki predmetlar tarafkashligi mavjud emas, chunki bir xil asosiy qobiliyat yoki atributga ega bo'lgan mos yozuvlar va fokal guruh a'zolari to'g'ri javob berish ehtimoli bir xil. Shuning uchun, bir guruhning boshqasiga nisbatan tarafkashligi yoki kamchiliklari yo'q, Y ning shartli ehtimoli mos yozuvlar va fokus guruhlari uchun bir xil bo'lmagan holatni ko'rib chiqing. Boshqacha qilib aytganda, bir xil xususiyat yoki qobiliyat darajasiga ega bo'lgan turli guruhlarning a'zolari Y bo'yicha tengsiz taqsimotlarga ega. Agar $ Delta $ ni boshqargan bo'lsak, guruhga a'zolik va ob'ekt bo'yicha ishlash o'rtasida aniq bog'liqlik mavjud. Uchun ikkilamchi ob'ektlar, bu fokal va mos yozuvlar guruhlari $ Delta $ bo'yicha bir joyda joylashganida, to'g'ri javob olish yoki elementni tasdiqlash ehtimoli boshqacha ekanligini ko'rsatadi. Shuning uchun, biron bir narsaga to'g'ri javob berishning yuqori shartli ehtimoli bo'lgan guruh, test topshirig'i uchun afzalroq bo'lgan guruhdir. Bu shuni ko'rsatadiki, test topshirig'i noaniq bo'lib, guruhlar uchun har xil ishlaydi, shuning uchun DIFni namoyish etadi, DIF yoki o'lchovning noaniqligi va oddiy guruh farqlari o'rtasidagi farqni ajratish muhimdir. Guruhlardagi farqlar Y bo'yicha turli xil ballar taqsimotini ko'rsatsa, DIF aniq $ frac {1} $ shartini o'z ichiga oladi. Masalan, quyidagi tenglamani ko'rib chiqing:

Bu shuni ko'rsatadiki, imtihon topshiruvchining ballari guruhlarga qo'shilish sharti bilan belgilanadi, shunda guruhga a'zolik to'g'risidagi ma'lumotlarning to'g'ri javob berish ehtimoli o'zgaradi. Shuning uchun, agar guruhlar $ Delta $ bo'yicha farq qilsa va ishlash $ Delta $ ga bog'liq bo'lsa, u holda yuqoridagi tenglama DIF bo'lmagan taqdirda ham moddiy tarafkashlikni taklif qiladi. Shu sababli, o'lchovlar bo'yicha adabiyotlarda faqatgina Y guruhidagi a'zolik shartli ravishda farqlar xolislikni aniqlash uchun etarli emasligi haqida kelishib olindi.[6][7][8] Darhaqiqat, on yoki qobiliyatdagi farqlar guruhlar orasida keng tarqalgan bo'lib, ko'plab tadqiqotlar uchun asos yaratadi. Yomonlikni yoki DIF ni o'rnatishni unutmang, guruhlar $ Delta $ bilan mos kelishi kerak va keyin $ Y $ ga guruhga a'zolik funktsiyasi sifatida differentsial ehtimollarni namoyish etishi kerak.

Shakllar

Yagona DIF - bu DIFning eng oddiy turi, bu erda shartli bog'liqlik kattaligi yashirin belgi uzluksizligi (θ) bo'yicha nisbatan o'zgarmasdir. Qiziqarli narsa bir guruhga barcha qobiliyatlar darajasida doimiy ravishda ustunlik beradi θ.[9] Elementlarga javob berish nazariyasi (IRT) doirasida, har ikkala element xarakteristikasi egri chiziqlari (ICC) teng ravishda kamsitilgan bo'lsa-da, qiyinchilik parametrlarida farqlar mavjud bo'lganda (ya'ni, ar = af va br f) 1-rasmda tasvirlanganidek.[10] Biroq, bir xil bo'lmagan DIF qiziqarli voqeani taqdim etadi. Qobiliyat uzluksizligi bo'yicha mos yozuvlar guruhiga beriladigan izchil ustunlik o'rniga, shartli bog'liqlik harakat qiladi va o'zgaruvchan yo'nalishni θ doimiyligi bo'yicha turli joylarda o'zgartiradi.[11] Masalan, buyum mos yozuvlar guruhiga doimiylikning pastki qismida kichik ustunlikni, yuqori qismida esa katta ustunlikni berishi mumkin. Bundan tashqari, yagona DIFdan farqli o'laroq, buyum bir vaqtning o'zida ikkala guruh uchun kamsitilishida farq qilishi mumkin, shu bilan birga qiyinchilik jihatidan farq qiladi (ya'ni, ar ≠ af va br f). Unifiform DIFni "kesib o'tish" yanada murakkabroq. Shakl 2da ko'rsatilgandek, bu narsa element doimiy sonning bir uchida mos yozuvlar guruhiga ustunlik berganda, ikkinchi uchida esa fokal guruhga ustunlik berganda sodir bo'ladi. ICC-lardagi farqlar shuni ko'rsatadiki, bir xil qobiliyat darajalariga ega bo'lgan ikki guruhning imtihon topshiruvchilari ob'ektga to'g'ri javob berish ehtimoli teng emas. Agar egri chiziqlar har xil bo'lsa, lekin kesishmasa, bu bir xil DIF dalilidir. Ammo, agar ICC θ shkalasi bo'ylab biron bir nuqtada kesib o'tadigan bo'lsa, unda bir xil bo'lmagan DIF dalillari mavjud.

Uniform DIF curve.pngNonuni DIF ICC.png

DIFni aniqlash protseduralari

Mantel-Haenszel

DIFni aniqlashning keng tarqalgan usuli Mantel-Haenszel (MH) yondashuvidir.[12] MH protsedurasi a kvadratcha favqulodda vaziyatlar jadvaliga asoslangan yondashuv, testning barcha bandlari bo'yicha ma'lumotnoma va fokal guruhlar o'rtasidagi farqlarni birma-bir tekshiradi.[13] Umumiy test natijalari bilan aniqlangan qobiliyatning davomiyligi bo'linadi k keyinchalik ikkala guruh a'zolarini moslashtirish uchun asos bo'lib xizmat qiladigan intervallar.[14] A 2 x 2 favqulodda vaziyatlar jadvali ning har bir intervalida ishlatiladi k ikkala guruhni alohida element bo'yicha taqqoslash. Favqulodda vaziyat jadvalining satrlari guruh a'zoligiga (mos yozuvlar yoki markazlashtirilgan) mos keladi, ustunlar esa to'g'ri yoki noto'g'ri javoblarga mos keladi. Quyidagi jadvalda bitta element uchun umumiy shakl ko'rsatilgan kqobiliyat qobiliyati oralig'i.

MHDIFTable.png

Koeffitsientlar nisbati

MH statistikasini hisoblashning navbatdagi bosqichi kutilmagan holatlar jadvalidagi ma'lumotlardan foydalanib, koeffitsientlar nisbati ma'lum bir narsa bo'yicha ikki guruh uchun k oraliq. Bu so'zlar bilan ifodalanadi p va q qayerda p ifodalaydi mutanosiblik to'g'ri va q mos yozuvlar (R) va fokal (F) guruhlari uchun nisbati noto'g'ri. MH protsedurasi uchun olingan koeffitsient nisbati quyidagicha ifodalanadi a mumkin bo'lgan qiymati 0 dan ∞ gacha. A a 1.0 qiymati DIF yo'qligini va shuning uchun ikkala guruh tomonidan ham shunga o'xshash ko'rsatkichlarni bildiradi. 1.0 dan katta qiymatlar mos yozuvlar guruhi ushbu ob'ektni fokal guruhga qaraganda ustunroq yoki qiyinroq deb hisoblaydi. Boshqa tomondan, agar olingan qiymat 1,0 dan kam bo'lsa, bu narsa fokal guruh uchun unchalik qiyin bo'lmaganligidan dalolat beradi.[8] Yuqoridagi kutilmagan holatlar jadvalidagi o'zgaruvchilardan foydalanib, hisoblash quyidagicha:a =(p.)Rk / qRk)(p.)Fk / qFk) = ​(Ak / (Ak + Bk)) / (Bk / (Ak + Bk)) (Ck / (Ck + D.k)) / (D.k / (Ck + D.k))= ​(Ak / Bk)(Ck / D.k)= ​AkD.kBkCkYuqoridagi hisoblash individual qobiliyatga bitta qobiliyat oralig'ida tegishli. Aholining taxminiy soni a barcha qobiliyat oralig'ida umumiy koeffitsient koeffitsientini aks ettirish uchun kengaytirilishi mumkin k ma'lum bir element uchun. Oddiy koeffitsientlar koeffitsienti belgilanadi aMH va quyidagi tenglama bilan hisoblash mumkin:aMH = ​∑ (AkD.k / Nk) ∑ (B.kCk / Nk)
ning barcha qiymatlari uchun k va qaerda Nk namuna bo'yicha umumiy hajmni ifodalaydi kth interval Olingan aMH ko'pincha qiymatni 0 atrofida markazlashtirgan holda, jurnalni o'zgartirish orqali standartlashtiriladi.[15] Yangi transformator MHD-DIF quyidagicha hisoblanadi:MHD-DIF = -2.35ln (aMH)Shunday qilib, olingan 0 qiymati DIF yo'qligini bildiradi. Tenglamani o'rganishda minus belgisi 0 dan kichik yoki kattaroq qiymatlarning izohlanishini o'zgartirishini ta'kidlash muhim, 0 dan kam qiymatlar mos yozuvlar guruhining ustunligini, 0 dan katta qiymatlar fokal guruh uchun afzalliklarni bildiradi.

Mahsulotlarga javob berish nazariyasi

Ob'ektga javob berish nazariyasi (IRT) - bu DIFni baholashning yana bir keng tarqalgan usuli. IRT test yoki o'lchov natijalari bo'yicha ma'lum narsalarga javoblarni tanqidiy tekshirishga imkon beradi. Yuqorida ta'kidlab o'tilganidek, DIF maxfiy xususiyat yoki qobiliyatga bog'liq bo'lgan narsaga to'g'ri javob berish yoki tasdiqlash ehtimolini tekshiradi. IRT tekshiradi, chunki monotonik javoblar va yashirin xususiyat yoki qobiliyat o'rtasidagi munosabatlar, bu DIFni tekshirishga mos keladigan yondashuv.[16]DIFni aniqlashda IRT-dan foydalanishning uchta asosiy afzalliklari:[17]

  • Ga solishtirganda klassik test nazariyasi, IRT parametr taxminlar namunaviy xususiyatlar bilan chalkash emas.
  • Ob'ektlarning statistik xususiyatlarini aniqlik bilan ifodalash mumkin, bu ikki guruh o'rtasida DIF talqinining aniqligini oshiradi.
  • Ob'ektlarning ushbu statistik xususiyatlari grafik jihatdan ifodalanishi mumkin, bu tushuntirishni yaxshilaydi va elementlarning guruhlar o'rtasida qanday ishlashini tushunishni yaxshilaydi.

DIF bilan bog'liq holda, element parametrlarini baholash hisoblash chiziqlari yoki elementlarga javob berish funktsiyalari (IRF) deb nomlanadigan elementlarning xarakteristik egri chiziqlari (ICC) orqali hisoblab chiqiladi va grafik tekshiriladi. ICClar tekshirilgandan va DIFning keyingi shubhalaridan so'ng, parametrlarni baholash o'rtasidagi farqlarni sinash uchun statistik protseduralar amalga oshiriladi, ICClar latent belgining doimiyligi va aniq javob berish ehtimoli o'rtasidagi bog'liqlikning matematik funktsiyalarini aks ettiradi.[18] Shakl 3 bu munosabatni a sifatida aks ettiradi logistika funktsiyasi. Yashirin xususiyatga ega bo'lmagan yoki qobiliyati past bo'lgan shaxslar to'g'ri javob olish yoki buyumni tasdiqlash ehtimoli past, ayniqsa qiyinchilik kuchayib boradi. Shunday qilib, yashirin xususiyatdan yoki qobiliyatidan yuqori bo'lganlar, to'g'ri javob berish yoki biror narsani tasdiqlash uchun ko'proq imkoniyatga ega. Masalan, depressiya inventarizatsiyasida, depressiya darajasi past bo'lgan odamlarga qaraganda, depressiyaga tushgan odamlarda buyumni tasdiqlash ehtimoli katta bo'ladi. Xuddi shunday, matematik qobiliyatlari yuqori bo'lgan shaxslar ham matematikani to'g'ri tuzish ehtimoli kamroq bo'lganlarga qaraganda ko'proq. ICClarning yana bir muhim jihati quyidagilarga tegishli burilish nuqtasi. Bu ma'lum bir javob ehtimoli .5 bo'lgan egri chiziqdagi nuqta va shuningdek, uchun maksimal qiymatni ifodalaydi Nishab.[19] Ushbu burilish nuqtasi to'g'ri javob berish ehtimoli yoki ob'ektni tasdiqlash ehtimoli 50% dan oshishini ko'rsatadi, faqat v parametr 0 dan katta, keyin burilish nuqtasini 1 + c / 2 darajasiga qo'yadi (tavsif quyida keltirilgan). Burilish nuqtasi qobiliyatning qobiliyatiga yoki yashirin xususiyatning doimiyligiga mos keladigan elementning qiyinligi bilan belgilanadi.[20] Shuning uchun, oson element uchun bu burilish nuqtasi qobiliyatning davomiyligidan pastroq bo'lishi mumkin, qiyin element uchun esa bir xil miqyosda yuqori bo'lishi mumkin.

ICC slope ip.png

Ob'ekt parametrlarining farqlarini sinash uchun statistik protseduralarni taqdim etishdan oldin, avvalo parametrlarni baholashning turli modellari va ular bilan bog'liq parametrlar haqida umumiy tushuncha berish muhimdir. Bularga bitta, ikki va uch parametrli logistik (PL) modellar kiradi. Ushbu modellarning barchasi bitta yashirin xususiyat yoki qobiliyatni o'z ichiga oladi. Ushbu uchala modelda ham elementning qiyinligi parametri ko'rsatilgan b. 1PL va 2PL modellari uchun b parametr, yuqorida aytib o'tilganidek, qobiliyat ko'lamidagi burilish nuqtasiga to'g'ri keladi. 3PL modelida egilish 1 + c / 2 ga to'g'ri keladi, bu erda v pastki asimptota (quyida muhokama qilinadi). Qiyinchilik qiymatlari, nazariy jihatdan, -∞ dan + ∞ gacha bo'lishi mumkin; ammo amalda ular kamdan-kam ± 3 dan oshadi. Yuqori ko'rsatkichlar qiyinroq test topshiriqlaridan dalolat beradi. Kam narsalar namoyish etiladigan narsalar b parametrlari oson sinov elementlari.[21] Taxmin qilinadigan yana bir parametr - belgilangan diskriminatsiya parametri a . Ushbu parametr ob'ektning shaxslarni kamsitish qobiliyatiga tegishli. The a parametr 2PL va 3PL modellarida baholanadi. 1PL modelida ushbu parametr guruhlar o'rtasida teng bo'lishi uchun cheklangan. ICClarga nisbatan a parametr - burilish nuqtasining qiyaligi. Avval aytib o'tganimizdek, burilish nuqtasida nishab maksimal bo'ladi. The a ga o'xshash parametr b parametr, -∞ dan + ∞ gacha bo'lishi mumkin; ammo odatdagi qiymatlar 2 dan kam. Bunday holda, yuqori qiymat shaxslar o'rtasida katta diskriminatsiyani ko'rsatadi.[22] 3PL modelida a deb nomlangan qo'shimcha parametr mavjud taxmin qilish yoki pseudochance parametri va bilan belgilanadi v. Bu pastroqqa to'g'ri keladi asimptota bu mohiyatan shaxsning qobiliyati past bo'lsa ham, o'rtacha yoki qiyin narsalarni to'g'rilash imkoniyatini beradi. Uchun qiymatlar v 0 va 1 oralig'ida, ammo odatda .3 dan pastga tushadi.[23]DIFni baholash uchun statistik protseduralarni qo'llashda a va b parametrlar (kamsitish va qiyinchilik) alohida qiziqish uyg'otadi. Biroq, 1PL modeli ishlatilgan deb taxmin qiling, bu erda a parametrlari ikkala guruh uchun teng bo'lishi uchun cheklangan bo'lib, faqatgina b parametrlar. ICClarni o'rganib chiqqandan so'ng, aniq farq bor b ikkala guruh uchun parametrlar. A ga o'xshash usuldan foydalanish Talabaning t-testi, keyingi qadam qiyinchilikdagi farqning statistik jihatdan ahamiyatli ekanligini aniqlashdir. Nol gipoteza ostidaH0: br = bfLord (1980) osonlik bilan hisoblangan va beradi odatda taqsimlanadi test statistikasi.d = (br - bf) / SE (br - bf)The standart xato orasidagi farqning b parametrlari tomonidan hisoblanadi√ [SE (b.)r)]2 + √ [SE (b.)f)]2

Wald statistikasi

Biroq, 2PL yoki 3PL modeli odatdagidan ko'ra ko'proq ma'lumotlarga mos keladigan 1PL modelini moslashtirishdan ko'ra ko'proq mos keladi. a va b parametrlar DIF uchun sinovdan o'tkazilishi kerak. Lord (1980) ikkalasida ham farqlarni sinash uchun yana bir usulni taklif qildi a va b parametrlar, qaerda v parametrlar guruhlar bo'yicha teng bo'lishi uchun cheklangan. Ushbu test a hosil qiladi Wald statistikasi bu xi-kvadrat taqsimotidan keyin. Bu holda sinov qilinayotgan nol gipotezaH0: ar = af va br = bf.Birinchidan, 2 x 2 kovaryans matritsasi parametrlari bo'yicha har bir guruh uchun hisoblab chiqilgan Sr va Sf ma'lumotnoma va fokal guruhlar uchun. Ushbu kovaryans matritsalari olingan ma'lumot matritsalarini teskari aylantirish yo'li bilan hisoblab chiqiladi, so'ngra taxminiy parametrlar orasidagi farqlar 2 x 1 vektorga qo'yiladi va belgilanadiV '= (ar - af, br - bf)Keyingi, kovaryans matritsasi S yig'ish yo'li bilan baholanadi Sr va Sf.Ushbu ma'lumotdan foydalanib, Wald statistikasi quyidagicha hisoblanadi:χ2 = V'S−1Vbu 2 da baholanadi erkinlik darajasi.

Imkoniyatlar nisbati testi

The Imkoniyatlar nisbati testi DIFni baholash uchun yana bir IRT asosidagi usul. Ushbu protsedura ikkita modelning nisbatlarini taqqoslashni o'z ichiga oladi. Model ostida (Mv) element parametrlari mos yozuvlar va fokal guruhlar o'rtasida teng yoki o'zgarmas bo'lishi uchun cheklangan. Model ostida (Mv) element parametrlari o'zgarishi mumkin.[24] M ostida ehtimollik funktsiyasiv bilan belgilanadi (Lv) M ostida ehtimollik funktsiyasi mavjudv belgilangan (Lv). Tengligi cheklangan narsalar ushbu protsedura uchun langar elementlari bo'lib xizmat qiladi, DIFda gumon qilinayotgan narsalar erkin ravishda o'zgarishi mumkin. Ankraj elementlaridan foydalangan holda va qolgan element parametrlarining o'zgarishiga imkon bergan holda, DIF uchun bir vaqtning o'zida bir nechta elementlarni baholash mumkin.[25] Ammo, agar ehtimollik koeffitsienti potentsial DIFni ko'rsatadigan bo'lsa, DIFni o'z ichiga olgan barcha elementlarni aniqlash uchun elementlar bo'yicha tahlil qilish o'rinli bo'ladi. Ikkala modelning ehtimollik koeffitsienti tomonidan hisoblanadiG2 = 2 ln [Lv / Lv]Shu bilan bir qatorda, nisbati bilan ifodalanishi mumkinG2 = -2ln [Lv / Lv]qaerda Lv va Lv teskari va keyin -2ln.G ga ko'paytiriladi2 taxminan chi kvadrat taqsimotiga amal qiladi, ayniqsa katta namunalar bilan. Shuning uchun, cheklangan modelni erkin o'zgaruvchan modeldan olish uchun zarur bo'lgan cheklovlar soniga mos keladigan erkinlik darajalari bilan baholanadi.[26] Masalan, agar 2PL modeli ishlatilsa va ikkalasi ham a va b parametrlari M ostida o'zgarishi mumkinv va shu ikkita parametr M ostida cheklanganv, keyin bu nisbat 2 daraja erkinlikda baholanadi.

Logistik regressiya

Logistik regressiya DIFni aniqlashga yondashuvlar har bir element uchun alohida tahlil qilishni o'z ichiga oladi. Tahlilga kiritilgan mustaqil o'zgaruvchilar guruhga a'zolik, o'zgaruvchiga mos keladigan qobiliyat, odatda umumiy bal va ikkalasining o'zaro ta'sir muddati. Qiziqishning bog'liq o'zgaruvchisi - bu to'g'ri javob olish yoki biror narsani tasdiqlash ehtimoli yoki ehtimoli. Foizning natijasi ehtimollar bilan ifodalanganligi sababli, maksimal ehtimollikni taxmin qilish tegishli protsedura.[27] Ushbu o'zgaruvchilar to'plamini keyinchalik regressiya tenglamasi bilan ifodalash mumkin:

Y = β0 + β1M + β2G + β3MG

qaerda β0 qolgan G bilan 0 va M ga teng bo'lganda, javobning kesilishiga yoki javob ehtimoliga mos keladis har bir mustaqil o'zgaruvchi uchun vazn koeffitsientlariga mos keladi. Birinchi mustaqil o'zgaruvchi, M - bu qobiliyatni shaxslarni bog'lash uchun ishlatiladigan mos keladigan o'zgaruvchidir, bu holda Mantel-Haenszel protsedurasida ishlatilgan natijalarga o'xshash umumiy sinov ballari. Guruhga a'zolik o'zgaruvchisi G bilan belgilanadi va regressiya holatida qo'pol kodlangan o'zgaruvchilar orqali ifodalanadi. MG yakuniy atamasi yuqorida aytib o'tilgan ikkita o'zgaruvchining o'zaro ta'siriga mos keladi va ushbu protsedura uchun o'zgaruvchilar ierarxik tarzda kiritiladi. Yuqorida keltirilgan regressiya tenglamasining tuzilishidan so'ng o'zgaruvchilar quyidagi ketma-ketlik bilan kiritiladi: mos keladigan M o'zgaruvchisi, G o'zgaruvchisi va o'zaro ta'sir o'zgaruvchisi MG. DIFni aniqlash 2-darajali erkinlik bilan olingan xi-kvadrat statistikani baholash orqali amalga oshiriladi. Bundan tashqari, parametrlarni baholashning ahamiyati sinovdan o'tkaziladi, agar logistik regressiya natijalaridan kelib chiqib, qobiliyatga mos keladigan shaxslar ob'ektga javob berish ehtimoli sezilarli darajada farq qilsa va shu bilan logistik regressiya egri chiziqlari farq qilsa, DIF ko'rsatiladi. Aksincha, agar ikkala guruh uchun egri chiziqlar bir xil bo'lsa, unda narsa xolis va shuning uchun DIF mavjud emas. Bir xil va bir xil bo'lmagan DIF nuqtai nazaridan, agar ikkala guruh uchun to'siqlar va mos keladigan o'zgaruvchan parametrlar teng bo'lmasa, unda bir xil DIF dalillari mavjud. Biroq, nolga teng bo'lmagan o'zaro ta'sir parametri bo'lsa, bu bir xil bo'lmagan DIF ko'rsatkichidir.[28]

Mulohazalar

Namuna hajmi

Birinchi ko'rib chiqish namunaviy hajmdagi masalalarga, xususan ma'lumotnoma va fokal guruhlarga tegishli. Har qanday tahlildan oldin har bir guruhdagi odamlar soni haqida ma'lumot odatda erkaklar / ayollar yoki etnik / irqiy guruhlar a'zolari soni kabi ma'lum. Biroq, bu masala guruhga to'g'ri keladigan odamlar soni etarli bo'lishi uchun etarlicha etarlicha bog'liqdir statistik kuch DIFni aniqlash uchun. Ayrim hollarda, masalan, etnik mansublik guruhlarning tengsizligi dalillari bo'lishi mumkin, masalan, oq tanlilar har bir etnik guruhga qaraganda ancha kattaroq guruh namunasini namoyish etadi. Shuning uchun, bunday holatlarda DIF uchun taqqoslanadigan guruhlar hajmi teng yoki yaqinroq bo'lishi uchun ma'lumotlarni o'zgartirish yoki sozlash maqsadga muvofiq bo'lishi mumkin. Dummy kodlash yoki qayta kodlash - bu ma'lumotnoma va fokal guruh o'lchamidagi nomutanosibliklarni sozlash uchun ishlatiladigan odatiy amaliyotdir. Bunday holda, barcha oq tanli bo'lmagan etnik guruhlarni mos yozuvlar va fokal guruhlar uchun namuna hajmiga nisbatan teng bo'lish uchun birlashtirish mumkin. Bu buyumning ishlashini "ko'pchilik / ozchilik" taqqoslash imkonini beradi. Agar modifikatsiya qilinmasa va DIF protseduralari amalga oshirilsa, DIF guruhlar o'rtasida mavjud bo'lsa ham, DIFni aniqlash uchun etarli statistik kuch bo'lmasligi mumkin. Tanlov hajmiga tegishli yana bir masala to'g'ridan-to'g'ri DIFni aniqlashda foydalaniladigan statistik protseduraga tegishli. Yo'naltiruvchi va fokal guruhlarning namunaviy o'lchamlarini hisobga olmaganda, DIFni aniqlashda foydalaniladigan har bir statistik test taxminlariga mos kelish uchun namunaning o'ziga xos xususiyatlari bajarilishi kerak. Masalan, IRT yondashuvlaridan foydalanish Mantel-Haenszel protsedurasi uchun talab qilinganidan kattaroq namunalarni talab qilishi mumkin. Bu juda muhimdir, chunki guruhning hajmini tekshirish bir protsedurani boshqasiga nisbatan ishlatishga yo'naltirishi mumkin. Logistik regressiya yondashuvi doirasida kaldıraçlı qadriyatlar va haddan tashqari ko'rsatkichlar alohida tashvish tug'diradi va DIFni aniqlashdan oldin tekshirilishi kerak. Bundan tashqari, barcha tahlillarda bo'lgani kabi, statistik test taxminlari ham bajarilishi kerak. Ba'zi protseduralar kichik qoidabuzarliklarga nisbatan kuchliroq, boshqalari esa kamroq. Shunday qilib, har qanday DIF protseduralarini amalga oshirishdan oldin namunaviy javoblarning taqsimot xususiyati tekshirilishi kerak.

Mahsulotlar

DIFni aniqlash uchun foydalaniladigan ob'ektlar sonini aniqlashni hisobga olish kerak. DIFni aniqlash uchun qancha element ishlatilishi kerakligi to'g'risida standart mavjud emas, chunki bu o'quvdan o'rganishga qarab o'zgaradi. Ba'zi hollarda DIF uchun barcha elementlarni sinab ko'rish maqsadga muvofiq bo'lishi mumkin, boshqalarda esa bu kerak bo'lmasligi mumkin. Agar etarli miqdordagi dalil bilan DIFdan faqat ba'zi bir narsalar shubha qilingan bo'lsa, unda ushbu to'plamni emas, balki butun to'plamni sinovdan o'tkazish maqsadga muvofiqdir. Biroq, ko'pincha qaysi narsalar muammoli bo'lishi mumkinligini taxmin qilish qiyin. Shu sababli, ko'pincha DIF uchun barcha test topshiriqlarini bir vaqtning o'zida tekshirish tavsiya etiladi. Bu barcha ma'lumotlar haqida ma'lumot beradi, muammoli narsalarga, shuningdek ma'lumotnomalar va fokal guruhlar uchun o'xshash ishlaydigan narsalarga yoritib beradi. Statistik testlarga kelsak, IRT-Likelihood Ratio testi kabi ba'zi protseduralar ankraj elementlaridan foydalanishni talab qiladi. Ba'zi elementlar guruhlar bo'yicha teng bo'lishi shart, DIFda gumon qilinayotgan narsalar erkin o'zgarishiga yo'l qo'yiladi. Bunday holda, faqat pastki qism DIF elementlari sifatida aniqlanadi, qolganlari esa DIFni aniqlash uchun taqqoslash guruhi bo'lib xizmat qiladi. DIF elementlari aniqlangandan so'ng, dastlabki DIF elementlarini cheklash va dastlabki langar elementlarining erkin o'zgarishiga imkon berish orqali langar elementlarini ham tahlil qilish mumkin. Shunday qilib, barcha elementlarni bir vaqtning o'zida sinab ko'rish yanada samarali protsedura bo'lishi mumkin. Ammo ta'kidlanganidek, amalga oshirilgan protseduraga qarab DIF-elementlarni tanlashning turli usullari qo'llaniladi, DIF-ni aniqlashda ishlatiladigan elementlarning sonini aniqlashdan tashqari, butun test yoki o'lchovning o'zi bo'yicha elementlarning sonini aniqlash muhim ahamiyatga ega. Zumbo (1999) ta'kidlaganidek, odatiy tavsiyalar kamida 20 ta elementdan iborat bo'lishi kerak. Eng kamida 20 ta moddaning asoslanishi mos keladigan mezonlarni shakllantirish bilan bevosita bog'liqdir. Oldingi bo'limlarda ta'kidlab o'tilganidek, umumiy sinov ballari odatda qobiliyatlarni bir-biriga moslashtirish usuli sifatida ishlatiladi. Umumiy test natijalari odatda 3-5 qobiliyat darajalariga (k) bo'linadi, undan keyin DIF tahlil qilish protseduralari oldidan shaxslarni qobiliyatiga moslashtirish uchun foydalaniladi. Eng kamida 20 ta elementdan foydalanish ballarni taqsimlashda katta farqlarni keltirib chiqaradi, natijada qobiliyat guruhlari yanada mazmunli bo'ladi. Asbobning psixometrik xususiyatlarini ishlatishdan oldin baholash kerak bo'lsa-da, ammo amal qilish muddati va ishonchlilik asbob etarli darajada bo'lishi kerak. Qobiliyat darajasining mazmunli guruhlarini yaratish uchun test topshiriqlari qiziqish konstruktsiyasini aniq o'rganib chiqishi kerak. Albatta, ortiqcha narsalarni qo'shib, ishonchlilik koeffitsientlarini ko'paytirmoqchi emas. Muhimi, mazmunli mos keladigan guruhlarni yaratish uchun etarli miqdordagi narsalar bilan ishonchli va ishonchli o'lchovga ega bo'lishdir. Gadermann va boshq. (2012),[29] Revelle va Zinbarg (2009),[30] va Jon va Soto (2007)[31] tizimli tekshirishga zamonaviy yondashuvlar va ishonchliligini baholashning aniqroq va mos usullari haqida ko'proq ma'lumot berish.

Fikrlash bilan taqqoslaganda statistika

Hammada bo'lgani kabi psixologik tadqiqotlar va psixometrik baholash, statistika hayotiy rol o'ynaydi, lekin hech qanday holatda qarorlar va xulosalar uchun yagona asos bo'lmasligi kerak. DIF uchun narsalarni baholashda asosli qaror muhim ahamiyatga ega. Masalan, DIFni aniqlash uchun ishlatiladigan statistik protseduraga qarab, har xil natijalar berilishi mumkin. Ba'zi protseduralar aniqroq, boshqalari esa kamroq. Masalan, Mantel-Haenszel protsedurasi tadqiqotchidan testlarning umumiy ballari asosida qobiliyat darajasini yaratishni talab qiladi, IRT esa odamlarni yashirin belgi yoki qobiliyat davomiyligi bo'yicha yanada samarali joylashtiradi. Shunday qilib, bitta protsedura ba'zi narsalar uchun DIFni ko'rsatishi mumkin, boshqalari buni ko'rsatmaydi. Yana bir masala shundaki, ba'zida DIF ko'rsatilishi mumkin, ammo DIF mavjudligining aniq sababi yo'q. Bu erda asosli qaror qabul qilinadi. Tadqiqotchi DIF tahlillaridan ma'no olish uchun aqlni ishlatishi kerak. Elementlar guruhlar uchun turlicha ishlashini xabar qilishning o'zi etarli emas, nima uchun paydo bo'lishining nazariy sababi bo'lishi kerak. Bundan tashqari, DIF dalillari testdagi adolatsizlikka to'g'ridan-to'g'ri aylanmaydi. DIF tadqiqotlarida DIFni taklif qiladigan ba'zi narsalarni aniqlash odatiy holdir. Bu qayta ko'rib chiqilishi yoki o'tkazib yuborilishi kerak bo'lgan muammoli narsalarning ko'rsatkichi bo'lishi mumkin va adolatsiz sinovning belgisi bo'lishi shart emas. Shuning uchun DIF tahlili buyumlarni tahlil qilish uchun foydali vosita deb qaralishi mumkin, ammo nazariy fikrlash bilan birgalikda samaraliroq bo'ladi.

Statistik dasturiy ta'minot

Quyida bu erda muhokama qilingan protseduralarni bajarishga qodir bo'lgan umumiy statistik dasturlar keltirilgan. Ustiga bosish orqali statistik to'plamlar ro'yxati, siz ochiq manbali, jamoat mulki, bepul dastur va xususiy statistik dasturlarning to'liq ro'yxatiga yo'naltirilasiz.Mantel-Haenszel protsedurasi

  • SPSS
  • SAS
  • Stata
  • R (masalan, 'difR')[32] paket)
  • Systat
  • Lertap 5

IRT asosidagi protseduralar

  • BILOG-MG
  • MULTILOG
  • PARSKALE
  • TESTFACT
  • EQSIRT
  • R (masalan, "difR"[32] yoki "mirt"[33] paket)
  • IRTPRO

Logistik regressiya

  • SPSS
  • SAS
  • Stata
  • R (masalan, "difR"[32] paket)
  • Systat

Shuningdek qarang

Adabiyotlar

  1. ^ Ta'limni o'lchash bo'yicha milliy kengash http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorD Arxivlandi 2017-07-22 da Orqaga qaytish mashinasi
  2. ^ Zumbo, B.D. (2007). Diferensial elementlarning ishlashining uch avlodi (DIF) tahlil qiladi: qayerda bo'lganligi, hozir qayerda va qayerga borishini hisobga olish. Tilni har chorakda baholash, 4, 223–233.
  3. ^ Camilli, G. (2006). Sinov adolati: R. L. (Ed.), Ta'lim o'lchovi (4-nashr, 220-256 betlar). Westport, KT: Ta'lim bo'yicha Amerika Kengashi.
  4. ^ Holland, P. W., & Wainer, H. (1993). Differentsial elementning ishlashi. Xillsdeyl, NJ: Lourens Erlbaum.
  5. ^ Osterlind, S. J. & Everson, H. T. (2009). Differentsial elementning ishlashi. Thousand Oaks, CA: Sage Publishing.
  6. ^ Akkerman, T. (1992). Ko'p o'lchovli nuqtai nazardan predmetning noaniqligi, ta'sir kuchi va buyumning haqiqiyligini didaktik tushuntirish. Ta'limni o'lchash jurnali, 29, 674–691.
  7. ^ Lord, F. M. (1980). Amaliy sinov muammolariga buyumlar javobi nazariyasining qo'llanilishi. Xillsdeyl, NJ: Lourens Erlbaum.
  8. ^ Millsap, R. E., va Everson, H. T. (1993). Uslubiy ko'rib chiqish: O'lchash tarafkashligini baholash uchun statistik yondashuvlar. Amaliy psixologik o'lchov, 17 (4), 297–334.
  9. ^ Walker, C. (2011). DIF nima? Nima uchun differentsial elementlarning ishlash tahlillari asbobni ishlab chiqish va tasdiqlashning muhim qismidir. Psixologik ta'limni baholash jurnali, 29, 364–376
  10. ^ Mellenberg, G. J. (1982). Ob'ektlarning noaniqligini baholash uchun kutilmagan holatlar jadvalining modellari. Ta'lim statistikasi jurnali, 7, 105–118.
  11. ^ Walker, C. M., Beretvas, S. N., Akerman, T. A. (2001). DIF uchun kompyuterga moslashuvchan testda ishlatiladigan konditsioner o'zgaruvchilarni tekshirish. Ta'limdagi amaliy o'lchov, 14, 3–16.
  12. ^ Mantel, N., va Haenszel, V. (1959). Kasallikni retrospektiv tadqiqotlar ma'lumotlarini tahlil qilishning statistik jihatlari. Milliy saraton instituti jurnali, 22, 719–748.
  13. ^ Marasculio, L. A., & Slaughter, R. E. (1981). 2 x 2 statistik ma'lumotlarga asoslanib, ob'ektlarning mumkin bo'lmagan manbalarini aniqlash bo'yicha statistik protseduralar. Ta'limni o'lchash jurnali, 18, 229–248.
  14. ^ Holland, P. W., & Thayer, D. T. (1988). Differentsial elementlarning ishlashi va Mantel-Haenszel protsedurasi. H. Vayner va H. I. Braunda (nashr)., Sinovning haqiqiyligi (129-145-betlar). Xillsdeyl, NJ: Erlbaum.
  15. ^ Dorans, N. J. va Holland, P. V. (1993). DIFni aniqlash va tavsifi: Mantel-Haenszel va standartlashtirish. P. W. Holland va H. Wainer (nashrlari) da, Differentsial elementning ishlashi (35-66 betlar). Xillsdeyl, NJ: Erlbaum.
  16. ^ Steinberg, L., & Thissen, D. (2006). Tadqiqot hisoboti uchun effekt kattaliklaridan foydalanish: Differentsial elementlarning ishlashini tahlil qilish uchun elementlarga javob nazariyasidan foydalangan holda misollar. Psixologik usullar, 11 (4), 402–415.
  17. ^ Camilli, G., & Shepard, L. (1994). Noto'g'ri test topshiriqlarini aniqlash usullari. Ming Oaks, Kaliforniya: Sage.
  18. ^ Reise, S. P., & Ainsworth, A. T., & Haviland, M. G. (2005). Ob'ektga javob berish nazariyasi: Psixologik tadqiqotlarda asoslar, qo'llanmalar va va'da. Psixologiya fanining dolzarb yo'nalishlari, 14, 95–101.
  19. ^ Edelen, M. O., Riv, B. B. (2007). Anketalarni ishlab chiqish, baholash va takomillashtirish uchun moddiy javob berish nazariyasini (IRT) qo'llash. Hayot sifatini o'rganish, 16, 5–18.
  20. ^ DeMars, C. (2010). Mahsulotlarga javob berish nazariyasi. Nyu-York: Oksford Press.
  21. ^ Xarris, D. (1989). 1-, 2-, 3-parametrli IRT modellarini taqqoslash. Ta'lim o'lchovi: muammolar va amaliyot, 8, 35–41.
  22. ^ Beyker, F. B. (2001). Elementlarga javob berish nazariyasi asoslari. ERIC kliring markazi baholash va baholash bo'yicha.
  23. ^ Birnbaum, A. (1968). Ba'zi yashirin belgilar modellari va ulardan imtihon topshiruvchining qobiliyatini aniqlashda foydalanish. F. M. Lord va M. R. Novikdagi 5-qism. Aqliy test natijalarining statistik nazariyalari. Reading, MA: Addison-Uesli
  24. ^ Tissen, D., Shtaynberg, L., Jerrard, M. (1986). Guruh farqlaridan tashqari: tarafkashlik tushunchasi. Psixologik nashr, 99, 118–128.
  25. ^ IRTPRO: Foydalanuvchilar uchun qo'llanma. (2011). Linkolnvud, IL: Scientific Software International, Inc.
  26. ^ Thissen, D., Steinberg, L., & Wainer, H. (1993). Elementlarga javob modellari parametrlari yordamida differentsial elementlarning ishlashini aniqlash. P. W. Holland va & H. Wainer (Eds.), Differentsial elementning ishlashi(67–113-betlar). Xillsdeyl, NJ: Lourens Erlbaum.
  27. ^ Bock, R. D. (1975). Ko'p o'zgaruvchan statistik usullar. Nyu-York: McGraw-Hill.
  28. ^ Swaminathan, H., & Rogers, H. J. (1990). Logistik regressiya protseduralari yordamida differentsial elementlarning ishlashini aniqlash. Ta'limni o'lchash jurnali, 27, 361–370.
  29. ^ Gadermann, A., M., Guhn, M., & Zumbo, B. D. (2012). Likert tipidagi va tartibli elementlarning javob ma'lumotlari uchun tartib ishonchliligini baholash: kontseptual, empirik va amaliy qo'llanma. Amaliy baholash, tadqiqotlar va baholash, 17 (3), 1–13.
  30. ^ Revelle, W., & Zinbarg, R. E. (2009). Alfa, beta, omega va GLB koeffitsientlari: Sijtsma haqida sharhlar. Psixometrika, 74 (1), 145–154.
  31. ^ John, O. P., & Soto, C. J. (2007). Haqiqiy bo'lishning ahamiyati: Ishonchlilik va konstruktsiyani tasdiqlash jarayoni. R. V. Robins, R. C. Fraley va R. F. Krueger (nashrlar), Shaxs psixologiyasida tadqiqot usullari qo'llanmasi (461-494-betlar). Nyu-York, NY: Kembrij universiteti matbuoti.
  32. ^ a b v Magis, Devid; Belandiya, Sebastyan; Tuerlinckx, Frensis; De Boek, Pol (2010). "Ikki tomonlama differentsial elementlarning ishlashini aniqlash uchun umumiy tizim va R to'plami". Xulq-atvorni o'rganish usullari. 42 (3): 847–862. doi:10.3758 / BRM.42.3.847.
  33. ^ Chalmers, R. P. (2012). "mirt: R atrof-muhit uchun ko'p o'lchovli narsalarga javob berish nazariyasi to'plami". Statistik dasturiy ta'minot jurnali. 48 (6): 1–29.