Talabalar qoldiqlari - Studentized residual
Ushbu maqolada bir nechta muammolar mavjud. Iltimos yordam bering uni yaxshilang yoki ushbu masalalarni muhokama qiling munozara sahifasi. (Ushbu shablon xabarlarini qanday va qachon olib tashlashni bilib oling) (Ushbu shablon xabarini qanday va qachon olib tashlashni bilib oling)
|
Serialning bir qismi |
Regressiya tahlili |
---|
Modellar |
Bashorat |
Fon |
|
Yilda statistika, a talabalar qoldig'i ning bo'linishi natijasida hosil bo'lgan miqdor qoldiq tomonidan smeta uning standart og'ish. Bu a shaklidir Talaba t-statistik, xatolarni baholash nuqtalari orasida o'zgarib turishi bilan.
Bu aniqlashda muhim usuldir chetga chiquvchilar. Bu sharafiga nomlangan bir nechta orasida Uilyam Sili Gosset, taxallus ostida yozgan Talaba. Statistikani a ga bo'lish namunaviy standart og'ish deyiladi talaba bo'lish, bilan o'xshashlikda standartlashtirish va normallashtirish.
Motivatsiya
Talaba bo'lishining asosiy sababi shundaki, regressiya tahlili a ko'p o'zgaruvchan tarqatish, ning farqlari qoldiqlar turli xil kirishlarda o'zgaruvchilar qiymatlari farq qilishi mumkin xatolar bu har xil kirish o'zgaruvchan qiymatlari teng. Muammo orasidagi farq statistikadagi xatolar va qoldiqlar, xususan, regressiyalardagi qoldiqlarning xatti-harakatlari.
Ni ko'rib chiqing oddiy chiziqli regressiya model
Tasodifiy tanlov berilgan (Xmen, Ymen), men = 1, ..., n, har bir juftlik (Xmen, Ymen) qondiradi
qaerda xatolar , bor mustaqil va barchasi bir xil farqga ega . The qoldiqlar haqiqiy xatolar emas, lekin taxminlar, kuzatiladigan ma'lumotlarga asoslanib. Baholash uchun eng kichik kvadratlar usuli qo'llanilganda va , keyin qoldiqlar , xatolardan farqli o'laroq , mustaqil bo'lishi mumkin emas, chunki ular ikkita cheklovni qondiradi
va
(Bu yerda εmen bo'ladi menth xato va bo'ladi menqoldiq.)
Qoldiqlar, xatolardan farqli o'laroq, barchasi bir xil farqga ega emas: dispersiya mos ravishda kamayadi x- qiymat o'rtacha qiymatdan uzoqlashadi x- qiymat. Bu ma'lumotlarning o'ziga xos xususiyati emas, balki domening uchlarida joylashgan regressiya qiymatlari. Shuningdek, u ta'sir funktsiyalari bo'yicha turli xil ma'lumotlar punktlari regressiya koeffitsientlari: so'nggi nuqtalar ko'proq ta'sirga ega. Buni ham ko'rish mumkin, chunki so'nggi nuqtalardagi qoldiqlar o'rnatilgan chiziq chizig'iga juda bog'liq, o'rtadagi qoldiqlar esa qiyalikka nisbatan sezgir emas. Haqiqat qoldiqlarning farqlari farq qiladi, Garchi; .. bo'lsa ham haqiqiy xatolarning farqlari barchasi tengdir bir-biriga, bu asosiy sabab talaba talabasi uchun.
Bu shunchaki populyatsiya parametrlari (o'rtacha va standart og'ish) noma'lum emasligi haqida emas - aynan shu regressiyalar Yo'l bering turli xil qoldiq taqsimotlari da turli xil ma'lumotlar punktlari, farqli o'laroq nuqta taxminchilar ning bitta o'zgaruvchan tarqatish, ulanish a umumiy taqsimot qoldiqlar uchun.
Fon
Ushbu oddiy model uchun dizayn matritsasi bu
va shapka matritsasi H ning matritsasi ortogonal proektsiya dizayn matritsasining ustun maydoniga:
The kaldıraç hII bo'ladi menshapka matritsasida diagonali kirish. Ning o'zgarishi menqoldiq
Agar dizayn matritsasi bo'lsa X faqat ikkita ustunga ega (yuqoridagi misolda bo'lgani kabi), bu tengdir
Agar vaziyatda o'rtacha arifmetik, dizayn matritsasi X faqat bitta ustunga ega (a ularning vektori ) va bu shunchaki:
Hisoblash
Yuqoridagi ta'riflarni hisobga olgan holda Talabalar qoldiqlari keyin
qayerda ning tegishli bahosi σ (pastga qarang).
O'rtacha bo'lsa, bu quyidagilarga teng:
Ichki va tashqi talabalarni o'qitish
Ning odatiy bahosi σ2 bo'ladi ichki talaba qoldiq
qayerda m bu modeldagi parametrlar soni (bizning misolimizda 2 ta).
Ammo agar men Ushbu holat shubhali darajada katta deb gumon qilinmoqda, u holda u odatda tarqatilmaydi. Shuning uchun .ni chiqarib tashlash oqilona men -ni inobatga oladigan bo'lsak, dispersiyani taxmin qilish jarayonidan kuzatish men th holat tashqarida bo'lishi mumkin va buning o'rniga foydalaning tashqi talabalar qoldiq, ya'ni
barcha qoldiqlarga asoslangan bundan mustasno gumonlanuvchi men qoldiq. Shuni ta'kidlash kerak gumondor uchun men bilan hisoblanadi men th ish chiqarib tashlandi.
Agar taxmin bo'lsa σ2 o'z ichiga oladi The men bu holda, u deyiladi ichki talaba qoldiq, (shuningdek,. nomi bilan ham tanilgan standartlashtirilgan qoldiq [1]Agar taxmin bo'lsa o'rniga ishlatiladi, bundan mustasno The men bu holda, u deyiladi tashqi talabalar, .
Tarqatish
Agar xatolar mustaqil bo'lsa va odatda taqsimlanadi bilan kutilayotgan qiymat 0 va dispersiya σ2, keyin ehtimollik taqsimoti ning mentashqi talabalar qoldiqlari a Talabalarning t-taqsimoti bilan n − m − 1 erkinlik darajasi va dan o'zgarishi mumkin ga .
Boshqa tomondan, ichki talabalar qoldiqlari oralig'ida , qayerda ν = n − m qoldiq darajalar soni. Agar tmen ichki talabalar qoldig'ini ifodalaydi va yana xatolar mustaqil ravishda taqsimlangan Gauss o'zgaruvchilari deb taxmin qiladi, keyin:[2]
qayerda t sifatida taqsimlangan tasodifiy o'zgaruvchidir Talabalarning t-taqsimoti bilan ν - 1 daraja erkinlik. Aslida, bu shuni anglatadi tmen2 /ν quyidagicha beta-tarqatish B(1/2,(ν - 1) / 2) .Yuqoridagi taqsimot ba'zan tau taqsimoti;[2] birinchi bo'lib 1935 yilda Tompson tomonidan olingan.[3]
Qachon ν = 3, ichki talabalar qoldiqlari bir xil taqsimlangan o'rtasida va .Agar bitta qoldiq erkinlik darajasi bo'lsa, ichki talabalar qoldiqlarini taqsimlash uchun yuqoridagi formula qo'llanilmaydi. Bu holda tmen barchasi +1 yoki -1, har biri uchun 50% imkoniyat mavjud.
Ichki talabalar qoldig'ini taqsimlashning standart og'ishi har doim 1 ga teng, ammo bu barcha standart og'ish degani emas. tmen Masalan, (0, 0) dan o'tgan to'g'ri chiziqni (1, 4), (2, -1), (2, -1) nuqtalarga o'rnatishda ichki talabalar qoldiqlari. , va ularning standart og'ishi 1 emas.
Talaba qilingan har qanday juftlik qoldig'iga e'tibor bering tmen va tj (qayerda ), i.i.d. EMAS Ular bir xil taqsimotga ega, ammo qoldiqlarning cheklovlari 0 ga teng bo'lishi va ularni dizayn matritsasiga ortogonal bo'lishlari sababli mustaqil emaslar.
Dasturiy ta'minotni amalga oshirish
Kabi ko'plab dasturlar va statistika paketlari R, Python va boshqalar, Studentized qoldiqni amalga oshirishni o'z ichiga oladi.
Til / dastur | Funktsiya | Izohlar |
---|---|---|
R | standart (model, ...) | ichki talaba. Qarang [2] |
R | talaba (model, ...) | tashqi talabalar. Qarang [3] |
Shuningdek qarang
- Kukning masofasi - kuzatish o'chirilganda regressiya koeffitsientlarining o'zgarishi o'lchovi
- Grubbsning sinovi
- Normallashtirish (statistika)
- Samuelsonning tengsizligi
- Standart ball
- Uilyam Seali Gosset
Adabiyotlar
- ^ Regressiyani yo'q qilish diagnostikasi R hujjatlari
- ^ a b Allen J. Papa (1976), "Qoldiqlar statistikasi va chet elliklarni aniqlash", AQSh Savdo Departamenti, Milliy Okeanik va Atmosfera Boshqarmasi, Milliy Okean Tadqiqoti, Geodezik tadqiqotlar va rivojlantirish laboratoriyasi, 136 bet, [1], tenglama (6)
- ^ Tompson, Uilyam R. (1935). "Kuzatuvlarni rad etish me'yori to'g'risida va standart og'ish namunasiga og'ish nisbatini taqsimlash to'g'risida". Matematik statistika yilnomalari. 6 (4): 214–219. doi:10.1214 / aoms / 1177732567.
Qo'shimcha o'qish
- Kuk, R. Dennis; Vaysberg, Sanford (1982). Qoldiqlar va regressiyadagi ta'sir (Repr. Tahr.). Nyu York: Chapman va Xoll. ISBN 041224280X. Olingan 23 fevral 2013.