Yo'naltirilgan statistika - Directional statistics

Yo'naltirilgan statistika (shuningdek dairesel statistika yoki sferik statistika) ning subdiplinasi hisoblanadi statistika bilan shug'ullanadigan ko'rsatmalar (birlik vektorlari yilda Rn), o'qlar (chiziqlar kelib chiqishi orqali Rn) yoki aylanishlar yilda Rn. Umuman olganda, yo'naltirilgan statistika ixcham kuzatuvlar bilan shug'ullanadi Riemann manifoldlari.

A-ning umumiy shakli oqsil birlikdagi nuqtalar ketma-ketligi sifatida parametrlanishi mumkin soha. Sharsimonning ikkita ko'rinishi ko'rsatilgan gistogramma oqsil tuzilmalarining katta to'plami uchun bunday nuqtalardan. Bunday ma'lumotlarning statistik muomalasi yo'naltirilgan statistika sohasida.[1]

0 haqiqat daraja va 360 daraja bir xil burchakka ega, shuning uchun masalan 180 daraja sezgir bo'lmaydi anglatadi 2 daraja va 358 daraja, ba'zi bir ma'lumot turlarini (bu holda burchakli ma'lumotlarni) tahlil qilish uchun maxsus statistik usullar zarurligini ko'rsatadigan bitta rasmni taqdim etadi. Yo'naltirilgan deb hisoblanishi mumkin bo'lgan boshqa ma'lumotlarga vaqtinchalik davrlar (masalan, kun, hafta, oy, yil va hokazo), kompas yo'nalishlari, dihedral burchaklar molekulalarda, yo'nalishlarda, aylanishlarda va boshqalarda.

Dairesel va yuqori o'lchovli taqsimotlar

Har qanday ehtimollik zichligi funktsiyasi (pdf) chiziqda bo'lishi mumkin "o'ralgan" birlik radiusi aylanasi atrofida.[2] Ya'ni o'ralgan o'zgaruvchining pdf

bu

Ushbu kontseptsiyani oddiy o'zgaruvchini soniga kengaytirish orqali ko'p o'zgaruvchan kontekstga etkazish mumkin xususiyatlar maydonidagi barcha o'lchamlarni qamrab oluvchi summalar:

qayerda bo'ladi Evklid asoslari vektori.

Keyingi bo'limlarda ba'zi tegishli dumaloq tarqatmalar ko'rsatilgan.

von Misesning dairesel tarqalishi

The fon Mises tarqatish - bu boshqa har qanday aylanma taqsimot singari, ma'lum bir chiziqli ehtimollik taqsimotini aylana atrofida o'ralgan deb hisoblash mumkin bo'lgan aylanma taqsimot. Fon Mizz taqsimotining asosiy chiziqli ehtimollik taqsimoti matematik jihatdan oson emas; ammo, statistik maqsadlarda, asosiy chiziqli taqsimot bilan shug'ullanishga hojat yo'q. Fon Mizz taqsimotining foydaliligi ikki xil: u oddiyroq statistik tahlilga imkon beradigan barcha dumaloq taqsimotlarning eng matematik ravishda boshqariladigan qismidir va bu normal o'ralgan taqsimot, xuddi shunga o'xshash chiziqli normal taqsimot uchun juda muhimdir, chunki bu ko'p sonli kichik burchakli og'ishlarning yig'indisi. Darhaqiqat, fon Mises taqsimoti, uni ishlatish qulayligi va o'ralgan normal taqsimot bilan chambarchas bog'liqligi sababli, ko'pincha "aylanma normal" taqsimot sifatida tanilgan (Fisher, 1993).

Von Mises tarqatilishining pdf:

qayerda o'zgartirilgan Bessel funktsiyasi buyurtma 0.

Dumaloq bir xil taqsimot

Ning ehtimollik zichligi funktsiyasi (pdf) dairesel bir xil taqsimot tomonidan berilgan

Bundan tashqari, deb o'ylash mumkin yuqoridagi fon Misesning.

Oddiy tarqatish bilan o'ralgan

Pdf o'ralgan normal taqsimot (WN) bu:

bu erda m va respectively navbati bilan taqsimlanmagan taqsimotning o'rtacha va standart og'ishi bo'ladi Jacobi theta funktsiyasi:
qayerda va

Koshi taqsimoti

Pdf o'ralgan Koshi taqsimoti (WC) bu:

qayerda bu o'lchov omili va eng yuqori pozitsiyadir.

Levi tarqatish bilan o'ralgan

Pdf o'ralgan Levi tarqatish (WL) bu:

bu erda summaning qiymati nolga teng bo'lganda olinadi , bu o'lchov omili va joylashuv parametridir.

Yuqori o'lchovli manifoldlarda taqsimlanish

Sferadagi Kentning turli xil taqsimotlaridan olingan uchta nuqta to'plamlari.

Shuningdek, tarqatish mavjud ikki o'lchovli shar (masalan Kentning tarqalishi[3]), the No'lchovli soha (the fon Mises-Fisher tarqatish[4]) yoki torus (the bivariate von Mises tarqatish[5]).

The matrisa fon Mises-Fisher taqsimoti ning taqsimoti Stiefel kollektori, va ehtimollik taqsimotlarini tuzishda foydalanish mumkin aylanish matritsalari.[6]

The Bingem tarqatish ning o'qlari bo'yicha taqsimoti N o'lchamlari yoki teng ravishda, (N - 1) antipodlar aniqlangan o'lchovli shar.[7] Masalan, agar N = 2, o'qlar tekislikdagi kelib chiqishi orqali yo'naltirilmagan chiziqlardir. Bunday holda, har bir eksa tekislikdagi birlik doirasini (bu bir o'lchovli shar) bir-birining antipodlari bo'lgan ikkita nuqtada kesadi. Uchun N = 4, Bingem taqsimoti birlik oralig'idagi taqsimotdir kvaternionlar. Birlik kvaternion aylanish matritsasiga to'g'ri kelganligi sababli, uchun Bingem taqsimoti N = 4, xuddi Matritsa-fon Mises-Fisher taqsimoti singari, aylanish fazosi bo'yicha ehtimollik taqsimotini tuzishda ishlatilishi mumkin.

Ushbu tarqatmalar, masalan, ishlatilgan geologiya,[8] kristallografiya[9] va bioinformatika.[1][10][11]

Lahzalar

Dumaloq taqsimotning xom vektor (yoki trigonometrik) momentlari quyidagicha aniqlanadi

qayerda har qanday uzunlik oralig'i , dumaloq tarqatishning PDF-si va . Integraldan beri bu birlik, va integratsiya oralig'i cheklangan, shundan kelib chiqadiki, har qanday dumaloq taqsimot momentlari har doim cheklangan va yaxshi aniqlangan.

Namuna momentlari o'xshash tarzda aniqlanadi:

Populyatsiyaning natijaviy vektori, uzunligi va o'rtacha burchagi mos keladigan parametr parametrlariga o'xshash tarzda aniqlanadi.

Bundan tashqari, yuqori momentlarning uzunligi quyidagicha aniqlanadi:

yuqori lahzalarning burchak qismlari esa adolatli . Barcha momentlarning uzunligi 0 dan 1 gacha bo'ladi.

Joylashuv va tarqalish choralari

Ham aholi uchun, ham shu populyatsiyadan olingan namuna uchun joylashish va tarqalishning turli o'lchovlari belgilanishi mumkin.[12] Joylashuvning eng keng tarqalgan o'lchovi - bu dumaloq o'rtacha. Populyatsiyaning o'rtacha doirasi shunchaki taqsimlanishning birinchi momenti, tanlangan o'rtacha esa tanlanishning birinchi momentidir. Namunaviy o'rtacha aholi o'rtacha qiymatini xolis baholovchi bo'lib xizmat qiladi.

Ma'lumotlar konsentratsiyalangan bo'lsa, o'rtacha va rejim chiziqli holatga o'xshashlik bilan aniqlanishi mumkin, ammo ko'proq tarqalgan yoki ko'p modali ma'lumotlar uchun bu tushunchalar foydali emas.

Dumaloq tarqalishning eng keng tarqalgan choralari:

  • The dumaloq dispersiya. Namuna uchun dumaloq dispersiya quyidagicha aniqlanadi:
va aholi uchun
Ikkalasi ham 0 dan 1 gacha qiymatlarga ega bo'ladi.
  • The dumaloq standart og'ish
0 va cheksizlik orasidagi qiymatlar bilan. Standart og'ishning ushbu ta'rifi (dispersiyaning kvadrat ildizidan ko'ra) foydalidir, chunki o'ralgan normal taqsimot uchun u asosiy normal taqsimotning standart og'ishini baholovchi hisoblanadi. Shuning uchun bu dumaloq taqsimotni standart og'ishning kichik qiymatlari uchun chiziqli holatda bo'lgani kabi standartlashtirishga imkon beradi. Bu, shuningdek, o'ralgan normal taqsimotga yaqin keladigan fon Mises taqsimotiga ham tegishli. E'tibor bering, kichik uchun , bizda ... bor .
  • The dairesel dispersiya
0 va cheksizlik orasidagi qiymatlar bilan. Ushbu tarqalish o'lchovi dispersiyani statistik tahlilida foydalidir.

O'rtacha taqsimot

To'plami berilgan N o'lchovlar ning o'rtacha qiymati z quyidagicha aniqlanadi:

sifatida ifodalanishi mumkin

qayerda

yoki, muqobil ravishda:

qayerda

O'rtacha taqsimot () dumaloq pdf uchun P(θ) quyidagilar tomonidan beriladi:

qayerda har qanday uzunlik oralig'ida va integral bu cheklovga bo'ysunadi va doimiy, yoki, muqobil ravishda, shu va doimiydir.

Ko'pgina dumaloq taqsimotlar uchun o'rtacha taqsimotni hisoblash analitik jihatdan mumkin emas va dispersiyani tahlil qilish uchun raqamli yoki matematik yaqinlashuvlar zarur.[13]

The markaziy chegara teoremasi namunaviy vositalarni taqsimlashda qo'llanilishi mumkin. (asosiy maqola: Yo'naltirilgan statistika uchun markaziy chegara teoremasi ). Buni ko'rsatish mumkin[13] ning taqsimlanishi yaqinlashadi a normal taqsimotning ikki o'zgaruvchanligi katta namuna hajmi chegarasida.

Muvofiqlik va ahamiyatlilikni sinash

Tsiklik ma'lumotlar uchun - (masalan, u bir xil taqsimlanganmi):

Shuningdek qarang

Adabiyotlar

  1. ^ a b Xemelrik, Tomas; Kent, Jon T.; Krogh, Anders (2006). "Hamelryck, T., Kent, J., Krogh, A. (2006) Mahalliy strukturaviy tarafkashlikdan foydalangan holda haqiqiy oqsil konformatsiyalaridan namuna olish. PLoS Comput. Biol., 2 (9): e131". PLOS hisoblash biologiyasi. 2 (9): e131. Bibcode:2006PLSCB ... 2..131H. doi:10.1371 / journal.pcbi.0020131. PMC  1570370. PMID  17002495.
  2. ^ Bahlmann, C., (2006), Onlaynda qo'l yozuvini tanib olishda yo'nalish xususiyatlari, Pattern Recognition, 39
  3. ^ Kent, J (1982) Sferadagi Fisher-Bingem taqsimoti. J Royal Stat Soc, 44, 71-80.
  4. ^ Fisher, RA (1953) Sharning tarqalishi. Proc. Roy. Soc. London ser. A., 217, 295-305
  5. ^ Mardiya, KM. Teylor; CC; Subramaniam, GK. (2007). "Proteinli bioinformatika va burchakli ma'lumotlar uchun Bivariate von Mises tarqalishining aralashmalari". Biometriya. 63 (2): 505–512. doi:10.1111 / j.1541-0420.2006.00682.x. PMID  17688502.
  6. ^ Downs (1972). "Orientatsion statistika". Biometrika. 59 (3): 665–676. doi:10.1093 / biomet / 59.3.665.
  7. ^ Bingem, S (1974). "Sferadagi antipodal simmetrik taqsimot". Ann. Stat. 2 (6): 1201–1225. doi:10.1214 / aos / 1176342874.
  8. ^ Peel, D .; Whiten, WJ.; McLachlan, GJ. (2001). "Birgalikda to'plamni identifikatsiyalashga yordam beradigan Kent tarqatish mos aralashmalari" (PDF). J. Am. Stat. Dos. 96 (453): 56–63. doi:10.1198/016214501750332974. S2CID  11667311.
  9. ^ Kriger Lassen, N. S.; Xyul Jensen, D.; Konradsen, K. (1994). "Yo'naltirilgan ma'lumotlarning statistik tahlili to'g'risida". Acta Crystallogr. A50 (6): 741–748. doi:10.1107 / S010876739400437X.
  10. ^ Kent, JT, Hamelryk, T. (2005). Fisher-Bingem taqsimotidan oqsil tuzilishi uchun stoxastik modellarda foydalanish. S. Barberda, P.D. Baxter, K.V.Mardiya va R.E. Devorlar (Eds.), Miqdoriy biologiya, Shakllarni tahlil qilish va to'lqinlar, 57-60 betlar. Lids, Lids universiteti matbuoti
  11. ^ Boomsma, Vouter; Mardiya, Kanti V.; Teylor, Charlz S.; Ferkinghoff-Borx, Jezper; Krog, Anders; Xemelrik, Tomas (2008). "Mahalliy oqsil tuzilishining generativ, ehtimol modeli". Milliy fanlar akademiyasi materiallari. 105 (26): 8932–8937. Bibcode:2008 yil PNAS..105.8932B. doi:10.1073 / pnas.0801715105. PMC  2440424. PMID  18579771.
  12. ^ Fisher, NI., Doiraviy ma'lumotlarning statistik tahlili, Kembrij universiteti matbuoti, 1993 y. ISBN  0-521-35018-2
  13. ^ a b Jammalamadaka, S. Rao; Sengupta, A. (2001). Dumaloq statistikadagi mavzular. Nyu-Jersi: Jahon ilmiy. ISBN  978-981-02-3778-3. Olingan 2011-05-15.

Yo'naltirilgan statistika bo'yicha kitoblar

  • Batschelet, E. Biologiyada doiraviy statistika, Academic Press, London, 1981 yil. ISBN  0-12-081050-6.
  • Fisher, NI., Doiraviy ma'lumotlarning statistik tahlili, Kembrij universiteti matbuoti, 1993 y. ISBN  0-521-35018-2
  • Fisher, NI., Lyuis, T., Embleton, BJJ. Sferik ma'lumotlarning statistik tahlili, Kembrij universiteti matbuoti, 1993 y. ISBN  0-521-45699-1
  • Jammalamadaka S. Rao va SenGupta A. Doiraviy statistikadagi mavzular, World Scientific, 2001 yil. ISBN  981-02-3778-2
  • Mardiya, KV. va Yupp P., Yo'nalishli statistika (ikkinchi nashr), John Wiley and Sons Ltd., 2000 yil. ISBN  0-471-95333-4
  • Ley, C. va Verdebout, T., Zamonaviy yo'naltirilgan statistika, CRC Press Taylor & Francis Group, 2017 yil. ISBN  978-1-4987-0664-3