Multinomial tarqatish - Multinomial distribution

Ko'p pulli
Parametrlar sinovlar soni (tamsayı )
voqea ehtimollari ()
Qo'llab-quvvatlash
PMF
Anglatadi
Varians
Entropiya
MGF
CF qayerda
PGF

Yilda ehtimollik nazariyasi, multinomial tarqatish ning umumlashtirilishi binomial taqsimot. Masalan, u a ning har bir tomoni uchun hisoblash ehtimolini modellashtiradi k- yonboshlab o'ralgan n marta. Uchun n mustaqil ularning har biri aynan bittasi uchun muvaffaqiyatga olib keladigan sinovlar k toifalar, har bir toifada ma'lum bir muvaffaqiyatga erishish ehtimoli mavjud bo'lib, multinomial taqsimot turli toifalar uchun muvaffaqiyatlar sonining har qanday aniq kombinatsiyasini ehtimolini beradi.

Qachon k 2 va n 1 ga teng, multinomial taqsimot Bernulli taqsimoti. Qachon k 2 va n 1 dan katta, u binomial taqsimot. $ K $ $ 2 $ va $ dan kattaroq bo'lganda n 1 ga teng, u kategorik taqsimot.

The Bernulli taqsimoti bitta natijani modellashtiradi Bernulli sudi. Boshqacha qilib aytganda, u a (ehtimol) ni aylantirishni modellaydi xolis ) bir marta tanga muvaffaqiyatli bo'lishiga (bosh olish) yoki muvaffaqiyatsizlikka (quyruq olish) olib keladi. The binomial taqsimot buni bosh ijrochilar soniga qarab umumlashtiradi n bir xil tanga mustaqil burilishlari (Bernulli sinovlari). Multinomial taqsimot natijani modellashtiradi n tajribalar, bu erda har bir sinov natijasi a kategorik taqsimot, masalan, prokat a k- ikki tomonlama o'lim n marta.

Ruxsat bering k sobit sonli son bo'lishi. Matematik jihatdan bizda k tegishli ehtimolliklar bilan o'zaro istisno qilinadigan natijalar p1, ..., pkva n mustaqil sinovlar. Beri k natijalar bir-birini istisno qiladi va bunga erishishimiz kerak pmen ≥ 0 uchun men = 1, ..., k va . Keyin tasodifiy o'zgaruvchilar bo'lsa Xmen natija sonining sonini ko'rsating men ustidan kuzatiladi n sinovlar, vektor X = (X1, ..., Xk) parametrlari bilan multinomial taqsimotga amal qiladi n va p, qayerda p = (p1, ..., pk). Sinovlar mustaqil bo'lsa-da, ularning natijalari X bog'liqdir, chunki ular n ga yig'ilishi kerak.

Kabi ba'zi sohalarda tabiiy tilni qayta ishlash, kategorik va multinomial taqsimotlar sinonimdir va agar ko'p sonli taqsimot haqida gapirish odatiy holdir kategorik taqsimot aslida nazarda tutilgan. Bu ba'zida toifali taqsimot natijalarini butun son sifatida emas, balki "1 ning of K" vektori (bitta elementi 1 ga va boshqa barcha elementlari 0 bo'lgan vektor) sifatida ifodalash qulay bo'lganidan kelib chiqadi. oralig'ida ; ushbu shaklda kategorik taqsimot bitta sinov davomida ko'p monomial taqsimotga tengdir.

Texnik xususiyatlari

Ehtimollik massasi funktsiyasi

Aytaylik, ekstraktsiya bo'yicha tajriba o'tkazdi n to'plari k sumkadan har xil ranglar, har bir tortishdan keyin chiqarilgan sharlarni almashtiring. Bir xil rangdagi to'plar tengdir. Olingan rang to'plari soni bo'lgan o'zgaruvchini belgilang men (men = 1, ..., k) kabi Xmenva kabi belgilang pmen berilgan ekstraktsiyaning rangli bo'lish ehtimoli men. The ehtimollik massasi funktsiyasi ushbu multinomial taqsimot quyidagilar:

manfiy bo'lmagan butun sonlar uchun x1, ..., xk.

Ehtimollik massasi funktsiyasi yordamida ifodalanishi mumkin gamma funktsiyasi kabi:

Ushbu shakl uning o'xshashligini ko'rsatadi Dirichlet tarqatish, bu uning oldingi konjugat.

Vizualizatsiya

Umumlashtirilgan Paskal uchburchagi bo'laklari sifatida

Xuddi shunday talqin qilish mumkin binomial taqsimot sifatida (normallashtirilgan) bir o'lchovli (1D) bo'laklari Paskal uchburchagi, shuning uchun ham multinomial taqsimotni 2D (uchburchak) bo'laklari sifatida izohlash mumkin Paskal piramidasi, yoki Paskal uchburchagi yuqori o'lchovli analoglarining 3D / 4D / + (piramida shaklidagi) bo'laklari. Bu "ning" talqinini ochib beradi oralig'i taqsimot: ixtiyoriy o'lchamdagi diskretlangan teng materialli "piramidalar", ya'ni. a oddiy panjara bilan.[iqtibos kerak ]

Polinom koeffitsientlari sifatida

Xuddi shunday, xuddi shunday talqin qilish mumkin binomial taqsimot ning polinom koeffitsientlari sifatida kengaytirilganda multinomial taqsimotni koeffitsientlari sifatida izohlash mumkin kengaytirilganda. (E'tibor bering, binomial taqsimot singari koeffitsientlar ham 1 ga teng bo'lishi kerak.) Bu ismning kelib chiqishi "multinomial tarqatish ".

Xususiyatlari

The kutilgan natija necha marta men ustidan kuzatilgan n sinovlar

The kovaryans matritsasi quyidagicha. Har bir diagonal yozuv dispersiya binomial taqsimlangan tasodifiy o'zgaruvchining, va shuning uchun

Diagonaldan tashqari yozuvlar kovaryanslar:

uchun men, j aniq.

Barcha kovaryanslar salbiy, chunki ular aniqlanadi n, multinomial vektorning bitta komponentining ko'payishi boshqa komponentning kamayishini talab qiladi.

Ushbu iboralar bilan matritsaga birlashtirilganda men, j element natija a k × k ijobiy-yarim cheksiz kovaryans matritsasi daraja k - 1. qaerda bo'lgan maxsus holatda k = n va qaerda pmen barchasi teng, kovaryans matritsasi esa markazlashtiruvchi matritsa.

Tegishli yozuvlar korrelyatsiya matritsasi bor

E'tibor bering, namuna hajmi ushbu ifodadan chiqib ketadi.

Har biri k komponentlar alohida parametrlarga ega binomial taqsimotga ega n va pmen, pastki indeksning tegishli qiymati uchun men.

The qo'llab-quvvatlash multinomial taqsimotning to'plamidir

Uning elementlari soni

Matritsa yozuvlari

Matritsa yozuvida,

va

bilan pT = ustunli vektorning qatorli vektor transpozitsiyasi p.

Misol

Deylik, katta mamlakat uchun uch tomonlama saylovlarda A nomzodi 20%, B nomzodi 30%, C nomzodi esa 50% ovoz oldi. Agar oltita saylovchi tasodifiy tanlansa, unda A nomzod uchun to'liq bitta, B nomzod uchun ikkita va C nomzod uchun uchta tarafdor bo'lish ehtimoli qanday?

Izoh: Ovoz beruvchilar soni ko'p deb taxmin qilayotganimiz sababli, namuna uchun saylovchi tanlangandan so'ng, ehtimolliklar o'zgarmas deb o'ylash o'rinli va joizdir. Texnik ma'noda, bu almashtirishsiz namuna olishdir, shuning uchun to'g'ri tarqatish bu ko'p o'zgaruvchan gipergeometrik taqsimot, ammo aholi ko'payishi bilan taqsimotlar birlashadi.

Multinomial taqsimotdan namuna olish

Birinchidan, parametrlarni qayta tartiblang shunday qilib ular kamayish tartibida saralanadi (bu faqat hisoblashni tezlashtirish uchun va juda zarur emas). Endi, har bir sinov uchun, yordamchi o'zgaruvchini torting X bir xil (0, 1) taqsimotdan. Olingan natija - bu tarkibiy qism

{Xj = 1, Xk = 0 uchun k ≠ j } - bu multinomial taqsimotning bitta kuzatuvi va n = 1. Ushbu eksperimentning mustaqil takrorlanishlari yig'indisi - bilan ko'p yadroli taqsimotdan kuzatuv n bunday takrorlashlar soniga teng.

Multinomial taqsimotdan taqlid qilish

Multinomial taqsimotni simulyatsiya qilish uchun turli usullardan foydalanish mumkin. Juda oddiy echim (0,1) da bir xil psevdo-tasodifiy sonlar generatoridan foydalanishdir. Birinchidan, (0,1) oraliqni ikkiga ajratamizk ning ehtimolliklariga teng uzunlikdagi subintervallar k toifalar. Keyin, biz ishlab chiqaramiz n qaysi birida ekanligini aniqlash uchun mustaqil psevdo-tasodifiy sonlar k ular paydo bo'ladigan intervallar va har bir intervalda paydo bo'lish sonini hisoblaydi.

Misol

Agar bizda:

Kategoriyalar123456
Ehtimollar0.150.200.300.160.120.07
Subintervallarning yuqori chegaralari0.150.350.650.810.931.00

Keyin Excel kabi dasturiy ta'minot bilan biz quyidagi retseptdan foydalanishimiz mumkin:

Hujayralar:AiBiSalom...Gi
Formulalar:Rand ()= Agar ($ Ai <0.15; 1; 0)= Agar (Va ($ Ai> = 0,15; $ Ai <0,35); 1; 0)...= Agar ($ Ai> = 0.93; 1; 0)

Shundan so'ng, biz kuzatilgan natijalarni toifalar bo'yicha to'plash va har bir taqlid qilingan namuna uchun taxminiy kovaryans matritsasini hisoblash uchun SumIf kabi funktsiyalardan foydalanamiz.

Yana bir usul - diskret tasodifiy sonlar generatoridan foydalanish. Bunday holda, toifalar raqamli qiymatlar bilan belgilanishi yoki qayta yozilishi kerak.

Ikkala holatda, natijada bilan multinomial tarqatish bo'ladi k toifalar. Bu taqlid qilish uchun doimiy tasodifiy taqsimot bilan tengdir k mustaqil standartlashtirilgan normal taqsimotlar yoki N (0, I) ega bo'lgan juda g'ayritabiiy taqsimot k komponentlar bir xil taqsimlangan va statistik jihatdan mustaqil.

Barcha toifalar soni sinovlar sonini yig'ishi kerak bo'lganligi sababli, toifalar soni har doim salbiy bog'liqdir.[1]

Multinomial taqsimot uchun ekvivalentlik testlari

Ekvivalentlikni sinashning maqsadi - nazariy multinomial taqsimot va kuzatilgan hisoblash chastotalari o'rtasida kelishuvni o'rnatish. Nazariy taqsimot to'liq ko'rsatilgan multinomial taqsimot yoki multinomial taqsimotlarning parametrik oilasi bo'lishi mumkin.

Ruxsat bering nazariy multinomial taqsimotni belgilang va ruxsat bering haqiqiy asosiy taqsimot bo'lishi. Tarqatish va agar teng bo'lsa, ular hisoblanadi masofa uchun va bardoshlik parametri . Ekvivalentlik testi muammosi ga qarshi . Haqiqiy asosiy tarqatish noma'lum. Buning o'rniga, hisoblash chastotalari kuzatilmoqda, qaerda namuna hajmi. Ekvivalentlik testidan foydalaniladi rad qilmoq . Agar rad etilishi mumkin, keyin o'rtasidagi ekvivalentlik va berilgan ahamiyat darajasida ko'rsatilgan. Evklid masofasi uchun ekvivalentlik testini Wellek (2010) darsligida topish mumkin.[2] Umumiy o'zgaruvchan masofa uchun ekvivalentlik testi Ostrovskida (2017) ishlab chiqilgan.[3] Maxsus kümülatif masofa uchun aniq ekvivalentlik testi Frey (2009) da taklif qilingan.[4]

Haqiqiy asosiy taqsimot orasidagi masofa va multinomial tarqatish oilasi bilan belgilanadi . Keyin ekvivalentlik testi muammosi tomonidan berilgan va . Masofa odatda raqamli optimallashtirish yordamida hisoblanadi. Ushbu holat bo'yicha testlar yaqinda Ostrovskida (2018) ishlab chiqilgan.[5]

Tegishli tarqatishlar

Adabiyotlar

Iqtiboslar

  1. ^ "1.7 - Multinomial Distribution | STAT 504". onlinecourses.science.psu.edu. Olingan 2016-09-11.
  2. ^ Wellek, Stefan (2010). Ekvivalentlik va kam bo'lmaganlikning statistik gipotezalarini sinovdan o'tkazish. Chapman va Hall / CRC. ISBN  978-1439808184.
  3. ^ Ostrovski, Vladimir (2017 yil may). "Multinomial taqsimotlarning ekvivalentligini sinash". Statistika va ehtimollik xatlari. 124: 77–82. doi:10.1016 / j.spl.2017.01.004. S2CID  126293429.Rasmiy veb-havola (obuna shart). Muqobil, bepul veb-havola.
  4. ^ Frey, Jessi (2009 yil mart). "Ekvivalentlik uchun aniq multinomial sinov". Kanada statistika jurnali. 37: 47–59. doi:10.1002 / cjs.10000.Rasmiy veb-havola (obuna shart).
  5. ^ Ostrovski, Vladimir (2018 yil mart). "Mustaqillik modelini qo'llagan holda ko'p pulli tarqatish oilalariga tenglikni sinash". Statistika va ehtimollik xatlari. 139: 61–66. doi:10.1016 / j.spl.2018.03.014. S2CID  126261081.Rasmiy veb-havola (obuna shart). Muqobil, bepul veb-havola.

Manbalar