Kesilgan teskari regressiya - Sliced inverse regression

Kesilgan teskari regressiya (SIR) uchun vosita o'lchovni kamaytirish sohasida ko'p o'zgaruvchan statistika.

Yilda statistika, regressiya tahlili javob o'zgaruvchisi o'rtasidagi munosabatni o'rganishning mashhur usuli y va uning tushuntirish o'zgaruvchisi ${ displaystyle { tagiga chizish {x}}}$ , bu a p- o'lchovli vektor. Regressiya atamasiga kiradigan bir necha yondashuvlar mavjud. Masalan, parametrik usullar qatorli regressiyani o'z ichiga oladi; parametrik bo'lmagan texnikalar kiradi mahalliy tekislash.

Yuqori o'lchovli ma'lumotlar bilan (masalan p o'sadi), mahalliy tekislash usullarini qo'llash uchun zarur bo'lgan kuzatuvlar soni keskin o'sib boradi. O'lchamlarning sonini kamaytirish operatsiyani hisoblashga imkon beradi. O'lchovni kamaytirish ma'lumotlarning faqat eng muhim yo'nalishlarini ko'rsatishga qaratilgan. SIR teskari regressiya egri chizig'idan foydalanadi, ${ displaystyle E ({ underline x x}} , | , y)}$ o'lchovlarni kamaytirishning samarali yo'nalishlarini aniqlaydigan og'irlikdagi asosiy tarkibiy tahlillarni o'tkazish.

Ushbu maqola birinchi navbatda o'quvchini o'lchamlarni qisqartirish mavzusi va bu erda model yordamida qanday bajarilishini tanishtiradi. Keyinchalik teskari regressiya bo'yicha qisqacha sharh mavjud bo'lib, keyinchalik bu qismlarni birlashtiradi.

Model

Javob o'zgaruvchisi berilgan ${ displaystyle , Y}$ va (tasodifiy) vektor ${ displaystyle X in mathbb {R} ^ {p}}$ tushuntirish o'zgaruvchilari, SIR modeliga asoslangan

{ displaystyle Y = f ( beta _ {1} ^ { top} X, ldots, beta _ {k} ^ { top} X, varepsilon) quad quad quad quad quad quad ( 1)}

qayerda ${ displaystyle beta _ {1}, ldots, beta _ {k}}$ noma'lum proektsion vektorlar. ${ displaystyle , k}$ noma'lum raqam (biz ma'lumotni kamaytirishga harakat qiladigan bo'shliqning o'lchovliligi) va, albatta, o'lchamni kamaytirishni xohlaganimizdek, ${ displaystyle , p}$ . ${ displaystyle ; f}$ noma'lum funktsiya ${ displaystyle mathbb {R} ^ {k + 1}}$ , bu faqat bog'liq ${ displaystyle , k}$ dalillar va ${ displaystyle varepsilon}$ bilan xato ${ displaystyle E [ varepsilon | X] = 0}$ va cheklangan dispersiya ${ displaystyle sigma ^ {2}}$ . Model ideal echimni tasvirlaydi, qaerda ${ displaystyle , Y}$ bog'liq ${ displaystyle X in mathbb {R} ^ {p}}$ faqat a orqali ${ displaystyle , k}$ o'lchovli pastki bo'shliq; ya'ni izohlanadigan o'zgaruvchilar hajmini kamaytirish mumkin ${ displaystyle , p}$ kichikroq raqamga ${ displaystyle , k}$ hech qanday ma'lumot yo'qotmasdan.

Ning teng versiyasi ${ displaystyle , (1)}$ bu: ning shartli taqsimoti ${ displaystyle , Y}$ berilgan ${ displaystyle , X}$ bog'liq ${ displaystyle , X}$ faqat orqali ${ displaystyle , k}$ o'lchovli tasodifiy vektor ${ displaystyle ( beta _ {1} ^ { top} X, ldots, beta _ {k} ^ { top} X)}$ . Ushbu qisqartirilgan vektor asl nusxasi kabi ma'lumotga ega deb taxmin qilinadi ${ displaystyle , X}$ tushuntirishda ${ displaystyle , Y}$ .

Noma'lum ${ displaystyle , beta _ {i} ning s}$ deyiladi o'lchovlarni kamaytirishning samarali yo'nalishlari (EDR-ko'rsatmalar). Ushbu vektorlar tomonidan kengaytirilgan bo'shliq bo'shliqni kamaytirishning samarali o'lchamlari (EDR-bo'shliq).

Tegishli chiziqli algebra fon

Modelni tasavvur qilish uchun vektor bo'shliqlari bo'yicha qisqa sharhga e'tibor bering:

Vektorli bo'shliqning ta'rifi va ba'zi boshqa xususiyatlar uchun men maqolaga murojaat qilaman Chiziqli algebra va Gram-Shmidt ortogonalizatsiyasi yoki chiziqli algebra bo'yicha har qanday darslik va faqat modelni tushunish uchun eng muhim faktlarni eslatib o'ting.

EDR-bo'shliq bo'lgani kabi ${ displaystyle , k}$ -O'lchovli subspace, biz subspace nima ekanligini bilishimiz kerak. Ning subspace ${ displaystyle mathbb {R} ^ {n}}$ kichik to'plam sifatida aniqlanadi ${ displaystyle U in mathbb {R} ^ {n}}$ , agar u buni ushlab tursa

{ displaystyle { tagiga chizish {a}}, { ostiga chizish {b}} - U Rightarrow { underline {a}} + { underline {b}} - U}

{ displaystyle { U chizilgan {a}} , lambda in mathbb {R} Rightarrow lambda { underline {a}}

Berilgan ${ displaystyle { chiziq osti {a}} _ {1}, ldots, { pastki chiziq {a}} _ {r} in mathbb {R} ^ {n}}$ , keyin ${ displaystyle V: = L ({ pastki chiziq {a}} _ {1}, ldots, { pastki chiziq {a}} _ {r})}$ , ushbu vektorlarning barcha chiziqli birikmalarining to'plami chiziqli pastki bo'shliq deb ataladi va shuning uchun vektor maydoni. Ulardan biri vektorlarni aytadi ${ displaystyle { tagiga chizish {a}} _ {1}, ldots, { underline {a}} _ {r}}$ oraliq ${ displaystyle , V}$ . Ammo bo'shliqni qamrab oluvchi vektorlar ${ displaystyle , V}$ noyob emas. Bu bizni asos tushunchasiga va vektor makonining o'lchamiga olib keladi:

To'plam ${ displaystyle B = {{ tagiga chizish {b}} _ {1}, ldots, { tagiga chizish {b}} _ {r} }}$ vektor fazosining chiziqli mustaqil vektorlari ${ displaystyle , V}$ deyiladi asos ning ${ displaystyle , V}$ , agar u buni ushlab tursa

{ displaystyle V: = L ({ pastki chiziq {b}} _ {1}, ldots, { pastki chiziq {b}} _ {r})}

Ning o'lchamlari ${ displaystyle , V ( in mathbb {R} ^ {n})}$ ichida chiziqli mustaqil vektorlarning maksimal soniga teng ${ displaystyle , V}$ . To'plam ${ displaystyle , n}$ ning chiziqli mustaqil vektorlari ${ displaystyle mathbb {R} ^ {n}}$ asosini tashkil etish ${ displaystyle mathbb {R} ^ {n}}$ . Vektor makonining o'lchami noyobdir, chunki asosning o'zi emas. Xuddi shu bo'shliqni bir nechta bazalar qamrab olishi mumkin, albatta, qaram vektorlar ham bo'shliqni qamrab oladi, ammo ikkinchisining chiziqli birikmalari faqat to'g'ri chiziqda yotgan vektorlar to'plamini keltirib chiqarishi mumkin. Biz qidirayotganimiz kabi ${ displaystyle , k}$ o'lchovli subspace, biz topishga qiziqamiz ${ displaystyle , k}$ ga teng chiziqli mustaqil vektorlar ${ displaystyle , k}$ biz ma'lumotlarimizni loyihalashtirmoqchi bo'lgan o'lchovli pastki maydon.

O'lchovlilikning la'nati

Ma'lumotlarning hajmini kamaytirmoqchi bo'lganimiz sababi "o'lchovning la'nati "va, albatta, grafik maqsadlar uchun. O'lchovlilikning la'nati (matematik) bo'shliqqa qo'shimcha o'lchamlarni qo'shadigan hajmning tez o'sishi bilan bog'liq. Masalan, qo'llab-quvvatlashdan 100 ta kuzatuvni ko'rib chiqing ${ displaystyle [0,1]}$ , bu intervalni juda yaxshi qoplaydi va mos keladigan 100 ta kuzatuv bilan taqqoslanadi ${ displaystyle 10}$ bo'shliqning ajratilgan nuqtalari bo'lgan o'lchov birligi gipersquare. Birinchi holda ma'lumotlarning asosiy xususiyatlari haqida xulosa chiqarish oson, ikkinchisida esa unday emas.

Teskari regressiya

Teskari regressiya egri chizig'ini hisoblash (IQ) izlash o'rniga anglatadi

${ displaystyle , E [Y | X = x]}$ , bu egri chiziq ${ displaystyle mathbb {R} ^ {p}}$

biz hisoblaymiz

${ displaystyle , E [X | Y = y]}$ , bu ham egri chiziq ${ displaystyle mathbb {R} ^ {p}}$ , lekin iborat ${ displaystyle , p}$ bir o'lchovli regressiyalar.

Teskari regressiya egri chizig'ining markazi joylashgan ${ displaystyle , E [E [X | Y]] = E [X]}$ . Shuning uchun markazlashtirilgan teskari regressiya egri chizig'i

${ displaystyle , E [X | Y = y] -E [X]}$

bu ${ displaystyle , p}$ o'lchovli egri chiziq ${ displaystyle mathbb {R} ^ {p}}$ . Quyida biz ushbu markazlashtirilgan teskari regressiya egri chizig'ini ko'rib chiqamiz va uning a ga asoslanganligini ko'ramiz ${ displaystyle , k}$ tomonidan kengaytirilgan o'lchovli pastki bo'shliq ${ displaystyle , Sigma _ {xx} beta _ {i} , s}$ .

Ammo buning to'g'riligini ko'rishdan oldin, teskari regressiya egri chizig'i keyinchalik batafsilroq kiritiladigan SIR-Algoritm ichida qanday hisoblanganligini ko'rib chiqamiz. SIRning "kesilgan" qismi keladi. Teskari regressiya egri chizig'ini oralig'ini bo'lish orqali baholaymiz ${ displaystyle , Y}$ ichiga ${ displaystyle , H}$ bir-birining ustiga chiqmaydigan intervallarni (bo'laklarni), keyin namunaviy vositalarni hisoblash uchun ${ displaystyle , { hat {m}} _ {h}}$ har bir tilimdan. Ushbu namunaviy vositalar IQ egri chizig'ining taxminiy bahosi sifatida ishlatiladi, deb belgilanadi ${ displaystyle , m (y)}$ . Dilimlarni aniqlashning bir necha yo'li mavjud, yoki har bir bo'lakda bir xil darajada ko'p kuzatuvlar bo'lishi mumkin yoki biz har bir tilim uchun sobit diapazonni belgilaymiz, shunda biz turli nisbatlarga ega bo'lamiz. ${ displaystyle , y_ {i} , s}$ har bir bo'lakka tushadigan.

Teskari regressiya va o'lchovni kamaytirish

Yuqorida aytib o'tilganidek, markazlashtirilgan teskari regressiya egri chizig'i a ga to'g'ri keladi ${ displaystyle , k}$ tomonidan kengaytirilgan o'lchovli pastki bo'shliq ${ displaystyle , Sigma _ {xx} beta _ {i} , s}$ (va shuning uchun ham biz taxmin qiladigan taxminiy baho). Bu bizning Modelimiz va teskari regressiya o'rtasidagi bog'liqlik. Dizayn taqsimotida faqat bitta shart bo'lishi kerak bo'lgan holda, biz buni haqiqat deb bilamiz. Bu shart quyidagicha:

{ displaystyle forall , { underline {b}} in mathbb {R} ^ {p}: , E [b ^ { top} X | beta _ {1} ^ { top} X = beta _ {1} ^ { top} x, ldots, beta _ {k} ^ { top} X = beta _ {k} ^ { top} x) = c_ {0} + sum _ {i = 1} ^ {k} c_ {i} beta _ {i} ^ { top} x}

Ya'ni. shartli kutish chiziqli ${ displaystyle beta _ {1} X, ldots, beta _ {k} X}$ , ya'ni ba'zi bir doimiylar uchun ${ displaystyle c_ {0}, ldots, c_ {K}}$ . Ning taqsimlanganda bu shart bajariladi ${ displaystyle , X}$ elliptik nosimmetrikdir (masalan, normal taqsimot). Bu juda kuchli talabga o'xshaydi. Bu, masalan, ma'lumotlarning taqsimlanishini sinchkovlik bilan tekshirishga yordam berishi mumkin, shunda tahlildan oldin haddan tashqari ko'rsatkichlarni olib tashlash yoki klasterlarni ajratish mumkin.

Ushbu shartni hisobga olgan holda va ${ displaystyle , (1)}$ , haqiqatan ham markazlashtirilgan teskari regressiya egri chizig'i ${ displaystyle , E [X | Y = y] -E [X]}$ tomonidan kengaytirilgan chiziqli subspace-da joylashgan ${ displaystyle , Sigma _ {xx} beta _ {k} (k = 1, ldots, K)}$ , qayerda ${ displaystyle , Sigma _ {xx} = Cov (X)}$ . Dalil Duan va Li tomonidan taqdim etilgan Amerika Statistik Uyushmasi jurnali (1991).

EDR yo'nalishlarini baholash

Barcha nazariy xususiyatlarni ko'rib chiqqandan so'ng, bizning maqsadimiz EDR yo'nalishlarini baholashdir. Shu maqsadda biz namunaviy vositalar uchun (vaznli) asosiy komponent tahlilini o'tkazamiz ${ displaystyle , { hat {m}} _ {h} , s}$ , standartlashtirilganidan keyin ${ displaystyle , X}$ ga ${ displaystyle , Z = Sigma _ {xx} ^ {- 1/2} {X-E (X) }}$ . Yuqoridagi teoremaga mos keladigan IQ-egri chiziq ${ displaystyle , m_ {1} (y) = E [Z | Y = y]}$ bo'shliqda yotadi ${ displaystyle , ( eta _ {1}, ldots, eta _ {k})}$ , qayerda ${ displaystyle , eta _ {i} = Sigma _ {xx} ^ {1/2} beta _ {i}}$ . (Oldindan kiritilgan terminologiya tufayli ${ displaystyle , eta _ {i} , s}$ deyiladi standartlashtirilgan samarali o'lchamlarni kamaytirish yo'nalishlari.) Natijada, kovaryans matritsasi ${ displaystyle , cov [E [Z | Y]]}$ ga ortogonal bo'lgan har qanday yo'nalishda degeneratsiya qilinadi ${ displaystyle , eta _ {i} , s}$ . Shuning uchun, o'z vektorlari ${ displaystyle , eta _ {k} (k = 1, ldots, K)}$ bilan bog'liq ${ displaystyle , K}$ eng katta shaxsiy qiymatlar - standartlashtirilgan EDR yo'nalishlari.

PCA-ga qaytish. Ya'ni, biz taxminiy hisoblaymiz ${ displaystyle , Cov {m_ {1} (y) }}$ :

{ displaystyle { hat {V}} = n ^ {- 1} sum _ {i = 1} ^ {S} n_ {s} { bar {z}} _ {s} { bar {z} } _ {s} ^ { top}}

va o'z qiymatlarini aniqlash ${ displaystyle { hat { lambda}} _ {i}}$ va o'z vektorlari ${ displaystyle { hat { eta}} _ {i}}$ ning ${ displaystyle { hat {V}}}$ , bu standartlashtirilgan EDR yo'nalishlari. (Bu haqda ko'proq ma'lumot olish uchun keyingi qismga qarang: Algoritm.) Shuni esda tutingki, kompyuterni o'zgartirishning asosiy g'oyasi dispersiyani maksimal darajaga ko'taradigan eng ma'lumotli proektsiyalarni topishdir!

E'tibor bering, ba'zi holatlarda SIR EDR-ko'rsatmalarini topa olmaydi. Shartli kovaryansni ko'rib chiqish orqali ushbu qiyinchilikni engib o'tish mumkin ${ displaystyle , Cov (X | Y)}$ . Bu tamoyil avvalgidek qolmoqda, ammo IQ egri chizig'ini shartli kutish o'rniga shartli kovaryans bilan tekshiradi. Qo'shimcha ma'lumot va SIR ishlamay qoladigan misol uchun Härdle and Simar (2003) ga qarang.

Algoritm

SIR orqali EDR-yo'nalishlarini taxmin qilish algoritmi quyidagicha. U darslikdan olingan Amaliy ko'p o'zgaruvchan statistik tahlil (Härdle va Simar 2003)

1. Ruxsat bering ${ displaystyle , Sigma _ {xx}}$ ning kovaryans matritsasi bo'ling ${ displaystyle , X}$ . Standartlashtirish ${ displaystyle , X}$ ga

{ displaystyle , Z = Sigma _ {xx} ^ {- 1/2} {X-E (X) }}

(Shuning uchun biz qayta yozishimiz mumkin ${ displaystyle , (1)}$ kabi

{ displaystyle Y = f ( eta _ {1} ^ { top} Z, ldots, eta _ {k} ^ { top} Z, varepsilon)}

qayerda ${ displaystyle , eta _ {k} = beta _ {k} Sigma _ {xx} ^ {1/2} quad forall ; k}$ Standartlashtirilgan o'zgarmaydigan Z uchun uni ushlab turadi ${ displaystyle , E [Z] = 0}$ va ${ displaystyle , Cov (Z) = I}$ .)

2. Oralig'ini ajrating ${ displaystyle , y_ {i}}$ ichiga ${ displaystyle , S}$ bir-biriga yopishmaydigan bo'laklar ${ displaystyle , H_ {s} (s = 1, ldots, S). ; n_ {s}}$ har bir tilim ichidagi kuzatuvlar soni va ${ displaystyle , I_ {H_ {s}}}$ ushbu tilim uchun indikator funktsiyasi:

{ displaystyle n_ {s} = sum _ {i = 1} ^ {n} I_ {H_ {s}} (y_ {i})}

3. Ning o'rtacha qiymatini hisoblang ${ displaystyle , z_ {i}}$ hamma tilim ustida, bu taxminiy taxmin ${ displaystyle , { hat {m}} _ {1}}$ teskari regressiya egri chizig’ining ${ displaystyle , m_ {1}}$ :

{ displaystyle , { bar {z}} _ {s} = n_ {s} ^ {- 1} sum _ {i = 1} ^ {n} z_ {i} I_ {H_ {s}} ( y_ {i})}

4. Uchun smetani hisoblang ${ displaystyle , Cov {m_ {1} (y) }}$ :

{ displaystyle , { hat {V}} = n ^ {- 1} sum _ {i = 1} ^ {S} n_ {s} { bar {z}} _ {s} { bar { z}} _ {s} ^ { top}}

5. O'ziga xos qiymatlarni aniqlang ${ displaystyle , { hat { lambda}} _ {i}}$ va o'z vektorlari ${ displaystyle , { hat { eta}} _ {i}}$ ning ${ displaystyle , { hat {V}}}$ , bu standartlashtirilgan EDR yo'nalishlari.

6. Standartlashtirilgan EDR yo'nalishlarini asl ko'lamiga o'zgartiring. EDR yo'nalishlari bo'yicha taxminlar quyidagicha berilgan:

{ displaystyle , { hat { beta}} _ {i} = { hat { Sigma}} _ {xx} ^ {- 1/2} { hat { eta}} _ {i}}

(ular ortogonal bo'lishi shart emas)

Masalan, Xardle va Simarning (2003) kitobiga qarang.

Adabiyotlar

Li, K-C. (1991) "O'lchamlarni kamaytirish uchun kesilgan teskari regressiya", Amerika Statistik Uyushmasi jurnali, 86, 316–327 Jstor
Kuk, RD va Sanford Vaysberg, S. (1991) "O'lchamlarni kamaytirish uchun kesilgan teskari regressiya: izoh", Amerika Statistik Uyushmasi jurnali, 86, 328–332 Jstor
Xardl, V. va Simar, L. (2003) Amaliy ko'p o'zgaruvchan statistik tahlil, Springer Verlag. ISBN 3-540-03079-4
Kurzfassung zur Vorlesung Mathematik II im Sommersemester 2005, A. Brandt