Talabalar qoldiqlari - Studentized residual

Yilda statistika, a talabalar qoldig'i ning bo'linishi natijasida hosil bo'lgan miqdor qoldiq tomonidan smeta uning standart og'ish. Bu a shaklidir Talaba t-statistik, xatolarni baholash nuqtalari orasida o'zgarib turishi bilan.

Bu aniqlashda muhim usuldir chetga chiquvchilar. Bu sharafiga nomlangan bir nechta orasida Uilyam Sili Gosset, taxallus ostida yozgan Talaba. Statistikani a ga bo'lish namunaviy standart og'ish deyiladi talaba bo'lish, bilan o'xshashlikda standartlashtirish va normallashtirish.

Motivatsiya

Talaba bo'lishining asosiy sababi shundaki, regressiya tahlili a ko'p o'zgaruvchan tarqatish, ning farqlari qoldiqlar turli xil kirishlarda o'zgaruvchilar qiymatlari farq qilishi mumkin xatolar bu har xil kirish o'zgaruvchan qiymatlari teng. Muammo orasidagi farq statistikadagi xatolar va qoldiqlar, xususan, regressiyalardagi qoldiqlarning xatti-harakatlari.

Ni ko'rib chiqing oddiy chiziqli regressiya model

Tasodifiy tanlov berilgan (XmenYmen), men = 1, ..., n, har bir juftlik (XmenYmen) qondiradi

qaerda xatolar , bor mustaqil va barchasi bir xil farqga ega . The qoldiqlar haqiqiy xatolar emas, lekin taxminlar, kuzatiladigan ma'lumotlarga asoslanib. Baholash uchun eng kichik kvadratlar usuli qo'llanilganda va , keyin qoldiqlar , xatolardan farqli o'laroq , mustaqil bo'lishi mumkin emas, chunki ular ikkita cheklovni qondiradi

va

(Bu yerda εmen bo'ladi menth xato va bo'ladi menqoldiq.)

Qoldiqlar, xatolardan farqli o'laroq, barchasi bir xil farqga ega emas: dispersiya mos ravishda kamayadi x- qiymat o'rtacha qiymatdan uzoqlashadi x- qiymat. Bu ma'lumotlarning o'ziga xos xususiyati emas, balki domening uchlarida joylashgan regressiya qiymatlari. Shuningdek, u ta'sir funktsiyalari bo'yicha turli xil ma'lumotlar punktlari regressiya koeffitsientlari: so'nggi nuqtalar ko'proq ta'sirga ega. Buni ham ko'rish mumkin, chunki so'nggi nuqtalardagi qoldiqlar o'rnatilgan chiziq chizig'iga juda bog'liq, o'rtadagi qoldiqlar esa qiyalikka nisbatan sezgir emas. Haqiqat qoldiqlarning farqlari farq qiladi, Garchi; .. bo'lsa ham haqiqiy xatolarning farqlari barchasi tengdir bir-biriga, bu asosiy sabab talaba talabasi uchun.

Bu shunchaki populyatsiya parametrlari (o'rtacha va standart og'ish) noma'lum emasligi haqida emas - aynan shu regressiyalar Yo'l bering turli xil qoldiq taqsimotlari da turli xil ma'lumotlar punktlari, farqli o'laroq nuqta taxminchilar ning bitta o'zgaruvchan tarqatish, ulanish a umumiy taqsimot qoldiqlar uchun.

Fon

Ushbu oddiy model uchun dizayn matritsasi bu

va shapka matritsasi H ning matritsasi ortogonal proektsiya dizayn matritsasining ustun maydoniga:

The kaldıraç hII bo'ladi menshapka matritsasida diagonali kirish. Ning o'zgarishi menqoldiq

Agar dizayn matritsasi bo'lsa X faqat ikkita ustunga ega (yuqoridagi misolda bo'lgani kabi), bu tengdir

Agar vaziyatda o'rtacha arifmetik, dizayn matritsasi X faqat bitta ustunga ega (a ularning vektori ) va bu shunchaki:

Hisoblash

Yuqoridagi ta'riflarni hisobga olgan holda Talabalar qoldiqlari keyin

qayerda ning tegishli bahosi σ (pastga qarang).

O'rtacha bo'lsa, bu quyidagilarga teng:

Ichki va tashqi talabalarni o'qitish

Ning odatiy bahosi σ2 bo'ladi ichki talaba qoldiq

qayerda m bu modeldagi parametrlar soni (bizning misolimizda 2 ta).

Ammo agar men Ushbu holat shubhali darajada katta deb gumon qilinmoqda, u holda u odatda tarqatilmaydi. Shuning uchun .ni chiqarib tashlash oqilona men -ni inobatga oladigan bo'lsak, dispersiyani taxmin qilish jarayonidan kuzatish men th holat tashqarida bo'lishi mumkin va buning o'rniga foydalaning tashqi talabalar qoldiq, ya'ni

barcha qoldiqlarga asoslangan bundan mustasno gumonlanuvchi men qoldiq. Shuni ta'kidlash kerak gumondor uchun men bilan hisoblanadi men th ish chiqarib tashlandi.

Agar taxmin bo'lsa σ2 o'z ichiga oladi The men bu holda, u deyiladi ichki talaba qoldiq, (shuningdek,. nomi bilan ham tanilgan standartlashtirilgan qoldiq [1]Agar taxmin bo'lsa o'rniga ishlatiladi, bundan mustasno The men bu holda, u deyiladi tashqi talabalar, .

Tarqatish

Agar xatolar mustaqil bo'lsa va odatda taqsimlanadi bilan kutilayotgan qiymat 0 va dispersiya σ2, keyin ehtimollik taqsimoti ning mentashqi talabalar qoldiqlari a Talabalarning t-taqsimoti bilan n − m − 1 erkinlik darajasi va dan o'zgarishi mumkin ga .

Boshqa tomondan, ichki talabalar qoldiqlari oralig'ida , qayerda ν = n − m qoldiq darajalar soni. Agar tmen ichki talabalar qoldig'ini ifodalaydi va yana xatolar mustaqil ravishda taqsimlangan Gauss o'zgaruvchilari deb taxmin qiladi, keyin:[2]

qayerda t sifatida taqsimlangan tasodifiy o'zgaruvchidir Talabalarning t-taqsimoti bilan ν - 1 daraja erkinlik. Aslida, bu shuni anglatadi tmen2 /ν quyidagicha beta-tarqatish B(1/2,(ν - 1) / 2) .Yuqoridagi taqsimot ba'zan tau taqsimoti;[2] birinchi bo'lib 1935 yilda Tompson tomonidan olingan.[3]

Qachon ν = 3, ichki talabalar qoldiqlari bir xil taqsimlangan o'rtasida va .Agar bitta qoldiq erkinlik darajasi bo'lsa, ichki talabalar qoldiqlarini taqsimlash uchun yuqoridagi formula qo'llanilmaydi. Bu holda tmen barchasi +1 yoki -1, har biri uchun 50% imkoniyat mavjud.

Ichki talabalar qoldig'ini taqsimlashning standart og'ishi har doim 1 ga teng, ammo bu barcha standart og'ish degani emas. tmen Masalan, (0, 0) dan o'tgan to'g'ri chiziqni (1, 4), (2, -1), (2, -1) nuqtalarga o'rnatishda ichki talabalar qoldiqlari. , va ularning standart og'ishi 1 emas.

Talaba qilingan har qanday juftlik qoldig'iga e'tibor bering tmen va tj (qayerda ), i.i.d. EMAS Ular bir xil taqsimotga ega, ammo qoldiqlarning cheklovlari 0 ga teng bo'lishi va ularni dizayn matritsasiga ortogonal bo'lishlari sababli mustaqil emaslar.

Dasturiy ta'minotni amalga oshirish

Kabi ko'plab dasturlar va statistika paketlari R, Python va boshqalar, Studentized qoldiqni amalga oshirishni o'z ichiga oladi.

Til / dasturFunktsiyaIzohlar
Rstandart (model, ...)ichki talaba. Qarang [2]
Rtalaba (model, ...)tashqi talabalar. Qarang [3]


Shuningdek qarang

Adabiyotlar

  1. ^ Regressiyani yo'q qilish diagnostikasi R hujjatlari
  2. ^ a b Allen J. Papa (1976), "Qoldiqlar statistikasi va chet elliklarni aniqlash", AQSh Savdo Departamenti, Milliy Okeanik va Atmosfera Boshqarmasi, Milliy Okean Tadqiqoti, Geodezik tadqiqotlar va rivojlantirish laboratoriyasi, 136 bet, [1], tenglama (6)
  3. ^ Tompson, Uilyam R. (1935). "Kuzatuvlarni rad etish me'yori to'g'risida va standart og'ish namunasiga og'ish nisbatini taqsimlash to'g'risida". Matematik statistika yilnomalari. 6 (4): 214–219. doi:10.1214 / aoms / 1177732567.

Qo'shimcha o'qish