Dispersiyani tahlil qilish - Analysis of variance

Dispersiyani tahlil qilish (ANOVA) to'plamidir statistik modellar va ular bilan bog'liq bo'lgan vositalar o'rtasidagi farqlarni tahlil qilish uchun foydalaniladigan taxminiy protseduralar (masalan, "guruhlar orasidagi va guruhlar o'rtasidagi farq") namuna. ANOVA tomonidan ishlab chiqilgan statistik Ronald Fisher. ANOVA asoslanadi umumiy dispersiya qonuni, qaerda kuzatilgan dispersiya ma'lum bir o'zgaruvchida turli xil o'zgarish manbalariga tegishli qismlarga bo'linadi. Eng sodda shaklda ANOVA a statistik test ikki yoki undan ortiq aholi borligi degani teng, va shuning uchun t- sinov ikki vositadan tashqari.

Tarix

20-asrda dispersiyani tahlil qilish o'z samarasini bergan bo'lsa-da, Stiglerning fikriga ko'ra, o'tmishdagi asrlar o'tmishda davom etmoqda.[1] Bularga gipotezani sinash, kvadratlar yig'indisini ajratish, eksperimental usullar va qo'shimchalar modeli kiradi. Laplas 1770-yillarda gipotezani sinovdan o'tkazgan.[2] Taxminan 1800 yilda Laplas va Gauss kuzatishlarni birlashtirish uchun eng kichik kvadratlarni ishlab chiqdi, keyinchalik astronomiya va geodeziyada qo'llaniladigan usullarni takomillashtirdi. Shuningdek, u kvadratlarning yig'indisiga qo'shilgan hissalarni o'rganishni boshladi. Laplas kvadratlarning qoldiq yig'indisidan (jami emas) farqni qanday baholashni bilar edi.[3] 1827 yilga kelib Laplas foydalangan eng kichik kvadratchalar atmosfera oqimlarini o'lchash bo'yicha ANOVA muammolarini hal qilish usullari.[4] 1800 yilgacha astronomlar reaktsiya vaqtlari ("shaxsiy tenglama ") va xatolarni kamaytirish usullarini ishlab chiqdi.[5] Shaxsiy tenglamani o'rganishda qo'llanilgan eksperimental usullar keyinchalik paydo bo'lgan psixologiya sohasi tomonidan qabul qilindi [6] tez orada randomizatsiya va ko'r-ko'rona qo'shilgan kuchli (to'liq faktorial) eksperimental usullarni ishlab chiqdi.[7] Qo'shimcha effektlar modelining matematik bo'lmagan tushuntirishlari 1885 yilda mavjud edi.[8]

Ronald Fisher atamasini kiritdi dispersiya va 1918 yilgi maqolada uning rasmiy tahlilini taklif qildi Mendel merosini taxmin qilish bo'yicha qarindoshlar o'rtasidagi o'zaro bog'liqlik.[9] Uning dispersiyani tahlil qilish bo'yicha birinchi qo'llanmasi 1921 yilda nashr etilgan.[10] Variantlarni tahlil qilish Fisherning 1925 yilgi kitobiga kiritilganidan keyin keng ma'lum bo'ldi Tadqiqotchilar uchun statistik usullar.

Tasodifiy modellar bir nechta tadqiqotchilar tomonidan ishlab chiqilgan. Birinchisi Polsha tilida nashr etilgan Jerzy Neyman 1923 yilda.[11]

ANOVA-ning dastlabki mashhurligini ta'minlovchi xususiyatlaridan biri hisoblash nafisligi edi. Qo'shimcha modelning tuzilishi qo'shimcha koeffitsientlarni matritsa hisob-kitoblari bilan emas, balki oddiy algebra bilan hal qilishga imkon beradi. Mexanik kalkulyatorlar davrida bu soddalik juda muhim edi. Statistik ahamiyatni aniqlash uchun dastlabki statistik matnlar bilan ta'minlangan F funktsiyasining jadvallariga kirishni talab qildilar.

Misol

Yaroqsiz: Yosh va keksa, kalta sochli va uzun sochli
Adolatli uyg'unlik: Uy hayvonlari va ishchi zotlar va kam sportchilar va boshqalar
Juda yaxshi mos keladi: Og'irligi zoti bo'yicha

Variantlar tahlili kuzatuvlarni tushuntirish uchun izlovchi vosita sifatida ishlatilishi mumkin. Itlar namoyishi misol keltiradi. Itlar namoyishi bu zotning tasodifiy tanlanishi emas: odatda kattalar, toza nasl va namunali itlar bilan cheklanadi. Ko'rgazmadan olingan itlarning og'irliklari gistogrammasi, masalan, rasmlarda ko'rsatilgan sariq-to'q sariq taqsimot kabi juda murakkab bo'lishi mumkin. Aytaylik, biz har bir itning o'ziga xos xususiyatlariga ko'ra itning vaznini taxmin qilishni xohladik. Buning bir usuli - bu tushuntiring itlarning populyatsiyasini o'sha xususiyatlarga qarab guruhlarga bo'lish orqali og'irliklarni taqsimlash. Muvaffaqiyatli guruhlash itlarni ikkiga ajratadi (a) har bir guruh itlar vaznining kam farqlanishiga ega (bu guruh nisbatan bir hil degan ma'noni anglatadi) va (b) har bir guruhning o'rtacha ko'rsatkichi aniq (agar ikkita guruh o'rtacha bir xil bo'lsa, u holda guruhlar, aslida, har qanday mazmunli tarzda ajratilgan degan xulosaga kelish mantiqiy emas).

O'ngdagi rasmlarda guruhlar quyidagicha aniqlangan X1, X2Va hokazo. Birinchi rasmda itlar ikkitomonlama guruhlarning mahsulotiga (o'zaro ta'siriga) qarab bo'linadi: yosh va keksa va kalta sochli va uzun sochli (masalan, 1 guruh yosh, kalta sochli itlar, guruh) 2 yosh, uzun sochli itlar va boshqalar). Itlarning vazni guruhlarning har birida taqsimlanishi (ko'k rangda ko'rsatilgan) nisbatan katta farqga ega bo'lgani uchun va vositalar guruhlar bo'yicha juda o'xshash bo'lganligi sababli, itlarni bu xususiyatlar bo'yicha guruhlash itlar vaznining o'zgarishini tushuntirishning samarali usulini keltirib chiqarmaydi. : itning qaysi guruhda ekanligini bilish, uning itini shunchaki itlar ko'rgazmasida bo'lishidan ko'ra uning vaznini bashorat qilishga imkon bermaydi. Shunday qilib, ushbu guruhlash umumiy taqsimotning o'zgarishini tushuntira olmaydi (sariq-to'q sariq).

Itlarni guruhlarga ajratish orqali vazn taqsimotini tushuntirishga urinish uy hayvonlari va ishchi zotlar va kamroq atletik va ko'proq sportchi ehtimol biroz muvaffaqiyatli (adolatli) bo'lishi mumkin. Eng og'ir shou itlari katta, kuchli, ishlaydigan zotlar bo'lishi mumkin, uy hayvonlari sifatida saqlanadigan zotlar esa mayda va shu tariqa engilroq. Ikkinchi rasmda ko'rsatilgandek, taqsimotlarning farqlari birinchi holatga qaraganda ancha kichik bo'lib, vositalar ko'proq ajralib turadi. Ammo, masalan, taqsimotlarning sezilarli darajada bir-biriga to'g'ri kelishi biz ajrata olmasligimizni anglatadi X1 va X2 ishonchli. Tangalar varag'iga ko'ra itlarni guruhlash shu kabi taqsimotlarni keltirib chiqarishi mumkin.

Og'irlikni naslga ko'ra tushuntirishga urinish juda mos keladi. Barcha Chihuaxalar yengil va Sent-Bernardlarning hammasi og'ir. Setters va Pointers o'rtasidagi vazn farqi alohida nasllarni oqlamaydi. Variantlarning tahlili ushbu intuitiv hukmlarni asoslash uchun rasmiy vositalarni taqdim etadi. Usulning keng tarqalgan usuli eksperimental ma'lumotlarni tahlil qilish yoki modellarni ishlab chiqishdir. Usulning korrelyatsiyaga nisbatan ba'zi bir afzalliklari bor: ma'lumotlarning hammasi ham raqamli bo'lmasligi kerak va usulning bitta natijasi tushuntirish munosabatlariga bo'lgan ishonchdir.

Fon va terminologiya

ANOVA - bu shakl statistik gipotezani sinovdan o'tkazish eksperimental ma'lumotlarni tahlil qilishda juda ko'p ishlatiladi. Sinov natijasi (dan hisoblangan nol gipoteza va namuna) tasodifan sodir bo'lishi mumkin emas deb hisoblansa, statistik ahamiyatga ega deb nomlanadi, nol gipotezaning haqiqatini taxmin qilish. Statistik jihatdan muhim natija, ehtimollik (p- qiymat ) oldindan belgilangan chegaradan (ahamiyatlilik darajasidan) kam, ning rad etilishini asoslaydi nol gipoteza, lekin faqat null gipotezaning apriori ehtimoli katta bo'lmasa.

ANOVA ning odatiy qo'llanilishida nol gipoteza shundan iboratki, barcha guruhlar bir xil populyatsiyadan olingan tasodifiy namunalardir. Masalan, turli xil davolash usullarining bemorlarning o'xshash namunalariga ta'sirini o'rganayotganda, barcha muolajalar bir xil ta'sirga ega bo'lishi mumkin (ehtimol yo'q). Nol gipotezani rad etish, davolanish guruhlari o'rtasidagi kuzatilgan ta'sirlarning farqlari tasodifiy tasodif tufayli yuzaga kelishi mumkin emas degan ma'noni anglatadi.

Tuzilishi bo'yicha, gipotezani sinash stavkasini cheklaydi I toifa xatolar (noto'g'ri ijobiy) muhimlik darajasiga. Eksperiment o'tkazuvchilar ham cheklashni xohlashadi II turdagi xatolar (yolg'on salbiy). II toifa xatolarining darajasi asosan namuna kattaligiga (kichikroq namunalar uchun stavka kattaroq), ahamiyatlilik darajasiga bog'liq (isbotlash darajasi yuqori bo'lsa, kashfiyotga e'tibor bermaslik ehtimoli ham yuqori) va effekt hajmi (kichikroq effekt hajmi II toifa xatosiga ko'proq moyil bo'ladi).

ANOVA terminologiyasi asosan statistik ma'lumotlarga asoslangan tajribalarni loyihalash. Tajriba o'tkazuvchi omilni belgilaydi va ta'sirni aniqlash uchun javoblarni o'lchaydi. Tajriba birliklariga omillar tasodifiy birikma va blokirovka qilish natijalarning haqiqiyligini ta'minlash. Ko'zi ojiz tarozini xolis tutadi. Javoblar qisman ta'sir natijasi bo'lgan va qisman tasodifiy xato bo'lgan o'zgaruvchanlikni ko'rsatadi.

ANOVA bir nechta g'oyalarning sintezi bo'lib, u bir nechta maqsadlarda qo'llaniladi. Natijada, qisqacha yoki aniq belgilash qiyin.

Balansli ma'lumotlar uchun "klassik" ANOVA bir vaqtning o'zida uchta narsani bajaradi:

  1. Sifatida izlanish ma'lumotlarini tahlil qilish, ANOVA qo'shimcha ravishda dekompozitsiyani ishlatadi va uning kvadratlari yig'indisi parchalanishning har bir tarkibiy qismining (yoki teng ravishda har bir chiziqli model shartlarining to'plamining) o'zgarishini ko'rsatadi.
  2. O'rtacha kvadratlarni an bilan birga taqqoslash F- sinov ... ichki modellar ketma-ketligini sinab ko'rishga ruxsat berish.
  3. ANOVA bilan chambarchas bog'liq bo'lgan koeffitsient baholari va standart xatolar bilan mos keladigan chiziqli model.[12]

Qisqacha aytganda, ANOVA kuzatilgan ma'lumotlar uchun tushuntirishni ishlab chiqish va tasdiqlash uchun bir necha usullarda ishlatiladigan statistik vosita.

Qo'shimcha:

  1. U o'z taxminlarini buzilishiga qarshi hisoblashda nafis va nisbatan mustahkamdir.
  2. ANOVA kuchli (ko'p namunali taqqoslash) statistik tahlilni taqdim etadi.
  3. U turli xil eksperimental dizaynlarni tahlil qilishga moslashtirildi.

Natijada: ANOVA "uzoq vaqtdan beri psixologik tadqiqotlarda eng ko'p ishlatiladigan (ba'zilari suiiste'mol qilingan deb aytadigan) statistik texnika maqomiga ega edi."[13]ANOVA "ehtimol statistik xulosa chiqarish sohasidagi eng foydali uslubdir."[14]

ANOVA-ni, ayniqsa, murakkab tajribalar uchun o'rgatish qiyin bo'linadigan uchastkalarning dizayni taniqli bo'lish.[15] Ba'zi hollarda usulni to'g'ri qo'llash muammolarni aniqlash orqali aniqlanadi va undan keyin klassik vakolatli test bilan maslahatlashiladi.[16]

Eksperiment dizayni shartlari

("NIST muhandislik statistikasi qo'llanmasidan" qisqartirilgan: 5.7-bo'lim. DOE terminologiyasining lug'ati.)[17]

Balansli dizayn
Barcha hujayralar (ya'ni davolash kombinatsiyasi) bir xil miqdordagi kuzatuvlarga ega bo'lgan eksperimental dizayn.
Bloklash
Xomashyo, operatorlar, mashinalar va boshqalarning ma'lum o'zgarishi tufayli eksperimental natijalarga ta'sir qiladigan har qanday ta'sir blokirovka o'zgaruvchisi darajasida to'planib qolishi uchun eksperimental tadqiqotda davolash kombinatsiyalarini o'tkazish jadvali. Bloklashning sababi sistematik effektni ajratish va uni asosiy effektlarni yashirishga yo'l qo'ymaslikdir. Bloklash randomizatsiyani cheklash orqali amalga oshiriladi.
Dizayn
Muayyan modelga moslashish va effektlarni baholashga imkon beradigan eksperimental ishlarning to'plami.
QILING
Tajribalarni loyihalash. Muammoni hal qilishda ishonchli, himoyalanadigan va qo'llab-quvvatlanadigan xulosalarni qo'llab-quvvatlaydigan ma'lumotlar to'plamini o'z ichiga olgan yondashuv.[18]
Effekt
Faktor parametrlarini o'zgartirish javobni qanday o'zgartiradi. Bitta omilning ta'siri asosiy effekt deb ham ataladi.
Xato
Kuzatishlar to'plamidagi tushunarsiz o'zgarish. DOE odatda tasodifiy xatolarni va mos kelmaydigan xatolarni tushunishni talab qiladi.
Tajriba bo'limi
Muayyan davolash kombinatsiyasi qo'llaniladigan ob'ekt.
Omillar
Tergovchining natijasini o'zgartirishi uchun manipulyatsiya qiladigan ishlov berish ma'lumotlari.
Sig'maslikning xatosi
Tahlil jarayon modelidagi bir yoki bir nechta muhim shartlarni yoki omillarni chiqarib tashlaganida yuzaga keladigan xato. DOE-ga takrorlashni kiritish eksperimental xatoni uning tarkibiy qismlariga ajratishga imkon beradi: mos kelmaydigan va tasodifiy (toza) xato.
Model
Berilgan javobning o'zgarishini bir yoki bir nechta omillarning o'zgarishiga bog'laydigan matematik munosabatlar.
Tasodifiy xato
Jarayonning tabiiy o'zgarishi tufayli yuzaga keladigan xato. Tasodifiy xato odatda nol o'rtacha va doimiy o'zgaruvchanlik bilan taqsimlangan deb hisoblanadi. Tasodifiy xatoni eksperimental xato deb ham atashadi.
Tasodifiylashtirish
Davolash materialini taqsimlash va DOE-da davolanish kombinatsiyalarini o'tkazish jadvali, bir yugurishdagi sharoitlar avvalgi yugurish shartlariga bog'liq emas va keyingi ishlarda shartlarni bashorat qilmaydi.[nb 1]
Replikatsiya
Xuddi shu davolash kombinatsiyasini bir necha marta bajarish. Replikatsiya, shu jumladan tasodifiy xatoni har qanday mos keladigan xatolikdan mustaqil ravishda baholashga imkon beradi.
Javoblar
Jarayonning natijalari. Ba'zan qaram o'zgaruvchi (lar) deb ataladi.
Davolash
Davolash - bu ta'sirning boshqa davolash usullari bilan taqqoslanishi kerak bo'lgan omil darajalarining o'ziga xos kombinatsiyasi.

Modellar sinflari

Variantlarni tahlil qilishda modellarning uchta klassi qo'llaniladi va ular bu erda keltirilgan.

Ruxsat etilgan effektli modellar

Variantlarni tahlil qilishning qat'iy effektli modeli (I sinf) eksperiment o'tkazuvchisi eksperiment sub'ektlariga bir yoki bir nechta davolash usullarini qo'llagan vaziyatlarga nisbatan qo'llaniladi. javob o'zgaruvchisi qiymatlar o'zgaradi. Bu eksperimentatorga davolanish butun populyatsiyada hosil bo'ladigan javob o'zgaruvchan qiymatlari oralig'ini baholashga imkon beradi.

Tasodifiy effektli modellar

Tasodifiy effektlar modeli (II sinf) muolajalar aniqlanmagan hollarda qo'llaniladi. Bu turli omillar darajalari ko'proq populyatsiyadan tanlanganida sodir bo'ladi. Chunki darajalarning o'zi tasodifiy o'zgaruvchilar, ba'zi taxminlar va muolajalarni qarama-qarshi qilish usuli (oddiy farqlarning ko'p o'zgaruvchan umumlashtirilishi) sobit effektlar modelidan farq qiladi.[19]

Aralash effektli modellar

Aralash effektli model (III sinf) ikkala turga mos ravishda har xil talqin va tahlillarni o'z ichiga olgan sobit va tasodifiy effekt turlarining eksperimental omillarini o'z ichiga oladi.

Masalan: O'qitish tajribalarini kollej yoki universitet kafedrasi tomonidan yaxshi kirish darsligini topish uchun amalga oshirish mumkin, har bir matn muolaja deb hisoblanadi. Ruxsat etilgan effektlar modeli nomzodlar matnlari ro'yxatini taqqoslaydi. Tasodifiy effektli model tasodifiy tanlangan matnlar ro'yxatida muhim farqlar mavjudligini aniqlaydi. Aralash effektlar modeli amaldagi matnlarni (tasodifiy) tasodifiy tanlangan alternativalar bilan taqqoslaydi.

Ruxsat etilgan va tasodifiy effektlarni aniqlash qiyin, chunki raqobatdosh ta'riflar lingvistik botqoqqa olib keladi.[20]

Taxminlar

Variantlar tahlili bir necha yondashuvlardan o'rganilgan bo'lib, ulardan eng keng tarqalgan usullaridan biri chiziqli model bu muolajalar va bloklarga munosabat bilan bog'liq. Model parametrlari bo'yicha chiziqli, ammo faktor darajalari bo'yicha chiziqli bo'lishi mumkinligini unutmang. Ma'lumotlar omillar bo'yicha muvozanatlashgan bo'lsa, izohlash oson, ammo muvozanatsiz ma'lumotlar uchun chuqurroq tushunish kerak.

Oddiy taqsimot yordamida darsliklarni tahlil qilish

Disversiya tahlili a nuqtai nazaridan taqdim etilishi mumkin chiziqli model, bu haqida quyidagi taxminlarni keltirib chiqaradi ehtimollik taqsimoti javoblar:[21][22][23][24]

  • Mustaqillik kuzatishlar - bu statistik tahlilni soddalashtiradigan model taxminidir.
  • Oddiylik - ning taqsimoti qoldiqlar bor normal.
  • Variantlarning tengligi (yoki "bir xillik") deb nomlanadi gomosedastiklik - ma'lumotlarning guruhlardagi farqi bir xil bo'lishi kerak.

Darslik modelining alohida taxminlari shuni anglatadiki xatolar mustaqil ravishda, bir xil va odatiy effektlar modellari uchun taqsimlanadi, ya'ni xatolar () mustaqil va

Randomizatsiyaga asoslangan tahlil

A tasodifiy boshqariladigan tajriba, muolajalar eksperimental protokolga binoan, tasodifiy ravishda eksperimental birliklarga tayinlanadi. Ushbu randomizatsiya ob'ektiv va tajriba o'tkazilishidan oldin e'lon qilinadi. Ob'ektiv tasodifiy tayinlash g'oyalariga rioya qilgan holda nol gipotezaning ahamiyatini sinash uchun ishlatiladi C. S. Peirce va Ronald Fisher. Ushbu dizaynga asoslangan tahlil tomonidan muhokama qilingan va ishlab chiqilgan Frensis J. Anscombe da Rotamsted tajriba stantsiyasi va tomonidan Oskar Kemphorn da Ayova shtati universiteti.[25] Kemphorne va uning shogirdlari taxmin qilmoqdalar birlik davolash qo'shimchasi, bu Kemphorn va. kitoblarida muhokama qilinadi Devid R. Koks.[iqtibos kerak ]

Birlik-davolash qo'shimchasi

Oddiy shaklda, davolash-davolash qo'shimchasini taxmin qilish[nb 2] kuzatilgan javobni bildiradi tajriba birligidan davolanish paytida birlik javobining yig'indisi sifatida yozilishi mumkin va davolash samarasi , anavi [26][27][28]

Birlik-davolash qo'shimchasining taxmin qilinishi har bir davolash uchun shuni nazarda tutadi , th davolash ham xuddi shunday ta'sirga ega har bir tajriba birligida.

Birlikning davolash qo'shimchasini taxmin qilish odatda to'g'ridan-to'g'ri bo'lishi mumkin emas soxtalashtirilgan, Koks va Kemphornning so'zlariga ko'ra. Biroq, ko'pchilik oqibatlari davolash-birlik qo'shimchasini soxtalashtirish mumkin. Randomizatsiyalashgan tajriba uchun birlik bilan davolash qo'shimchasini kiritish nazarda tutadi dispersiya barcha muolajalar uchun doimiydir. Shuning uchun, tomonidan qarama-qarshilik, davolashni qo'shib qo'yishning zaruriy sharti shundaki, bu dispersiya doimiydir.

Birlik davolash qo'shimchasi va randomizatsiyadan foydalanish cheklangan populyatsiyada standart bo'lgan dizaynga asoslangan xulosaga o'xshaydi tadqiqot namunalari.

Chiziqli model

Kemphorne tasodifiy tarqatish va taxminni qo'llaydi birlik davolash qo'shimchasi ishlab chiqarish olingan chiziqli model, ilgari muhokama qilingan darslik modeliga juda o'xshash.[29] Ushbu olingan chiziqli modelning sinov statistikasi taxminiy teoremalar va simulyatsiya tadqiqotlariga muvofiq tegishli normal chiziqli modelning sinov statistikasi bilan chambarchas yaqinlashadi.[30] Biroq, farqlar mavjud. Masalan, randomizatsiyaga asoslangan tahlil kuzatuvlar o'rtasida kichik, ammo (qat'iy) salbiy bog'liqlikni keltirib chiqaradi.[31][32] Randomizatsiyaga asoslangan tahlilda mavjud taxmin yo'q a normal tarqatish va albatta taxmin yo'q ning mustaqillik. Aksincha, kuzatishlar bog'liqdir!

Randomizatsiyaga asoslangan tahlilning kamchiliklari shundaki, uning ekspozitsiyasi zerikarli algebra va ko'p vaqtni o'z ichiga oladi. Randomizatsiyaga asoslangan tahlil murakkab va oddiy chiziqli model yordamida yondashuv bilan chambarchas bog'liq bo'lganligi sababli, o'qituvchilarning ko'pchiligi oddiy chiziqli model yondashuvini ta'kidlaydilar. Balansli tasodifiy eksperimentlarni modelga asoslangan tahliliga ozgina statistiklar qarshi.

Kuzatish ma'lumotlari uchun statistik modellar

Biroq, tasodifiy bo'lmagan tajribalardan olingan ma'lumotlarga nisbatan yoki kuzatuv ishlari, modelga asoslangan tahlilda tasodifiylashtirish kafolati yo'q.[33] Kuzatuv ma'lumotlari uchun ishonch oralig'idan foydalanish kerak sub'ektiv modellari, ta'kidlaganidek Ronald Fisher va uning izdoshlari. Amalda, kuzatuv tadqiqotlari natijasida davolash ta'sirining baholari odatda bir-biriga mos kelmaydi. Amalda "statistik modellar" va kuzatuv ma'lumotlari jamoatchilik tomonidan juda ehtiyotkorlik bilan ko'rib chiqilishi kerak bo'lgan farazlarni taklif qilish uchun foydalidir.[34]

Taxminlarning qisqacha mazmuni

Oddiy modelga asoslangan ANOVA tahlili qoldiqlarning mustaqilligi, normalligi va bir xilligini taxmin qiladi. Randomizatsiyaga asoslangan tahlil faqat qoldiqlar dispersiyalarining bir xilligini (birlik-davolash qo'shimchasining natijasi sifatida) qabul qiladi va eksperimentning tasodifiy tartibidan foydalanadi. Ushbu ikkala tahlil ham talab qiladi gomosedastiklik, odatdagi model tahlili uchun taxmin sifatida va tasodifiy asoslangan tahlil uchun tasodifiylik va qo'shimchalar natijasida.

Biroq, vositalarni emas, balki dispersiyalarni o'zgartiradigan jarayonlarni o'rganish (dispersiya effektlari deb ataladi) ANOVA yordamida muvaffaqiyatli o'tkazildi.[35] Lar boryo'q ANOVA uchun zarur bo'lgan taxminlar to'liq umumiylikda, ammoF- ANOVA gipotezasini sinash uchun ishlatiladigan test doimiy taxminlarga ega bo'lgan taxminlar va amaliy cheklovlarga ega.

ANOVA taxminlarini qondirmaydigan muammolar ko'pincha taxminlarni qondirish uchun o'zgartirilishi mumkin. Birlik-davolash qo'shimchasining xususiyati "o'lchov o'zgarishi" ostida o'zgarmas emas, shuning uchun statistikistlar ko'pincha davolash-davolash qo'shimchasiga erishish uchun transformatsiyalardan foydalanadilar. Agar javob o'zgaruvchisi ehtimollik taqsimotining parametrik oilasiga amal qilishi kutilsa, u holda statistik xodim (tajriba yoki kuzatuv ishi bayonnomasida) javoblarni dispersiyani barqarorlashtirish uchun o'zgartirilishini ko'rsatishi mumkin.[36] Shuningdek, statistik mutaxassis multiplikativ modelga amal qiladi deb hisoblanadigan javoblarga logaritmik transformatsiyalar qo'llanilishini aniqlab berishi mumkin.[27][37]Koshining so'zlariga ko'ra funktsional tenglama teorema logaritma haqiqiy ko'paytishni qo'shishga o'zgartiradigan yagona doimiy o'zgarishdir.[iqtibos kerak ]

Xususiyatlari

ANOVA qiyosiy eksperimentlarni tahlil qilishda qo'llaniladi, natijada natijalarning farqi faqat qiziqish uyg'otadi. Eksperimentning statistik ahamiyati ikki dispersiya nisbati bilan aniqlanadi. Ushbu nisbat eksperimental kuzatuvlar uchun bir nechta mumkin bo'lgan o'zgarishlarga bog'liq emas: barcha kuzatuvlarga doimiylikni qo'shish ahamiyatini o'zgartirmaydi. Barcha kuzatuvlarni doimiyga ko'paytirish ahamiyatini o'zgartirmaydi. Shunday qilib, ANOVA statistik ahamiyati doimiy tanqidiy va miqyosli xatolardan hamda kuzatuvlarni ifodalashda ishlatiladigan birliklardan mustaqildir. Mexanik hisoblash davrida ma'lumotlarni kiritishni soddalashtirish uchun barcha kuzatuvlardan (etakchi raqamlarni tushirishga teng bo'lganda) doimiyni chiqarib tashlash odatiy hol edi.[38][39] Bu ma'lumotlarga misolkodlash.

Mantiq

ANOVA hisob-kitoblari statistik ahamiyatni aniqlash uchun bir qator vositalar va dispersiyalarni hisoblash, ikkita dispersiyani ajratish va qo'llanma qiymatiga nisbati bilan taqqoslash sifatida tavsiflanishi mumkin. Davolash samarasini hisoblash shunchaki ahamiyatsiz bo'ladi: "har qanday davolashning samarasi davolanishni olgan kuzatuvlar o'rtacha va o'rtacha o'rtacha o'rtasidagi farqni hisobga olgan holda baholanadi".[40]

Kvadratchalar yig'indisining bo'linishi

ANOVA an'anaviy standartlashtirilgan terminologiyadan foydalanadi. Namuna dispersiyasining ta'rifli tenglamasi quyidagicha, bu erda bo'linuvchi erkinlik darajalari (DF), yig'indisi kvadratlar yig'indisi (SS), natija o'rtacha kvadrat (MS) deb nomlanadi va kvadratik hadlar namunaviy o'rtacha qiymatdan chetga chiqadi. ANOVA 3 ta namunaviy dispersiyani taxmin qiladi: kuzatuvning o'rtacha o'rtacha qiymatidan barcha og'ishlariga asoslangan umumiy dispersiya, ularning tegishli davolash vositalaridan barcha kuzatuvlar sapmalariga asoslangan xatolik dispersiyasi va davolashning dispersiyasi. Davolashning dispersiyasi davolash vositalarining katta o'rtacha qiymatdan chetlanishiga asoslanadi, natijada har bir muolajadagi kuzatuvlar soniga ko'paytiriladi va kuzatuvlar dispersiyasi va vositalar dispersiyasi o'rtasidagi farq hisobga olinadi.

Asosiy texnika - bu jami bo'linish kvadratlar yig'indisi SS modelda ishlatiladigan effektlar bilan bog'liq komponentlarga. Masalan, har xil darajadagi davolashning bir turi bilan soddalashtirilgan ANOVA modeli.

Soni erkinlik darajasi DF shunga o'xshash tarzda bo'linishi mumkin: ushbu tarkibiy qismlardan biri (xato uchun) a ni belgilaydi kvadratchalar bo'yicha taqsimlash kvadratlarning bog'langan yig'indisini tavsiflaydi, agar davolanish effekti bo'lmasa, "muolajalar" uchun ham xuddi shunday.

Shuningdek qarang Kvadratlarning etishmasligi.

The F- sinov

The F- sinov umumiy og'ish omillarini taqqoslash uchun ishlatiladi. Masalan, bir tomonlama yoki bitta faktorli ANOVAda statistik ahamiyat F test statistikasini taqqoslash orqali tekshiriladi.

qayerda XONIM o'rtacha kvadrat, = muolajalar soni va = ishlarning umumiy soni

uchun F- tarqatish bilan , erkinlik darajasi. Dan foydalanish F-taqsimlash tabiiy nomzoddir, chunki test statistikasi bu har biri miqyoslangan kvadratlarga teng bo'lgan ikki kvadratik yig'indilarning nisbati. kvadratchalar bo'yicha taqsimlash.

F ning kutilayotgan qiymati (qayerda davolash namunasining hajmi), bu davolash samarasi yo'qligi uchun 1 ga teng. F qiymatlari 1dan oshganda, dalillar nol gipotezaga tobora mos kelmayapti. F ni oshirishning ikkita aniq eksperimental usuli - namunaviy hajmni oshirish va qattiq eksperimental boshqaruv yordamida xatolar dispersiyasini kamaytirish.

ANOVA gipotezasi testini yakunlashning ikkita usuli mavjud, ularning ikkalasi ham bir xil natijani beradi:

  • Darslik usuli F ning kuzatilgan qiymatini jadvallar bo'yicha aniqlangan F ning kritik qiymati bilan taqqoslashdan iborat. F ning kritik qiymati bu raqam va maxrajning erkinlik darajalari va ahamiyatlilik darajasi (a) funktsiyasidir. Agar F ≥ F bo'lsaMuhim, nol gipoteza rad etildi.
  • Kompyuter usuli F qiymatining kuzatilgan qiymatdan katta yoki unga teng ehtimolligini (p-qiymati) hisoblab chiqadi. Agar bu ehtimollik ahamiyatlilik darajasidan (a) dan kam yoki teng bo'lsa, nol gipoteza rad etiladi.

ANOVA F-test soxta ijobiy xatolarning sobit darajasi uchun soxta manfiy xatolarni minimallashtirish ma'nosida deyarli maqbul ekanligi ma'lum (ya'ni qat'iy belgilangan darajadagi quvvatni maksimal darajaga ko'tarish). Masalan, turli xil tibbiy muolajalar bir xil ta'sirga ega degan farazni sinab ko'rish uchun F- sinov "s p-qiymatlar taxminan ga yaqinlashadi almashtirish testi "s p-qiymatlari: Dizayn muvozanatlashgan taqdirda, ayniqsa, yaqinlashadi.[30][41] Bunday almashtirish sinovlari xarakterlash maksimal quvvat bilan sinovlar hammaga qarshi muqobil gipotezalar, Rozenbaum tomonidan kuzatilganidek.[nb 3] ANOVA F-test (barcha muolajalar bir xil ta'sirga ega degan nol gipotezadan) ko'plab muqobil taqsimotlarga nisbatan mustahkamligi uchun amaliy sinov sifatida tavsiya etiladi.[42][nb 4]

Kengaytirilgan mantiq

ANOVA ajratiladigan qismlardan iborat; dispersiya manbalarini taqsimlash va gipotezani sinash alohida ishlatilishi mumkin. ANOVA boshqa statistik vositalarni qo'llab-quvvatlash uchun ishlatiladi. Regressiya avvalroq murakkab modellarni ma'lumotlarga moslashtirish uchun ishlatiladi, so'ng ANOVA ma'lumotni etarli darajada tavsiflaydigan oddiy (r) modellarni tanlash maqsadi bilan modellarni taqqoslash uchun ishlatiladi. "Bunday modellar ANOVA-ga ishora qilmasdan mos tushishi mumkin edi, ammo keyinchalik ANOVA vositalari o'rnatilgan modellarni bir oz tushunishi va koeffitsientlar to'plamlari haqidagi farazlarni sinab ko'rish uchun ishlatilishi mumkin."[43] "[V] dispersiyani tahlil qilishni ko'p darajali modellarni tushunish va tuzish usuli deb o'ylayman - bu regressga alternativa emas, balki murakkab yuqori o'lchovli xulosalarni sarhisob qilish vositasi ..."[43]

Bitta omil uchun

ANOVA tahlili uchun mos bo'lgan eng oddiy tajriba - bu bitta faktor bilan to'liq tasodifiy tajriba. Bitta faktor bilan murakkabroq tajribalar randomizatsiyadagi cheklovlarni o'z ichiga oladi va butunlay tasodifiy bloklar va lotin kvadratlarini o'z ichiga oladi (va variantlari: Greko-Lotin kvadratlari va boshqalar). Keyinchalik murakkab tajribalar ko'plab omillarning ko'pgina murakkabliklarini baham ko'radi. To'liq tasodifiy eksperimentning tahlilini (modellari, ma'lumotlarning qisqacha mazmuni, ANOVA jadvali) nisbatan to'liq muhokamasi mavjud.

Ko'p omillar uchun

ANOVA ko'p omillarning ta'sirini o'rganishni umumlashtiradi. Agar tajriba har bir omil darajasining barcha kombinatsiyalarida kuzatuvlarni o'z ichiga oladigan bo'lsa, u muddat deb ataladi faktorial. Faktorial eksperimentlar bir qator faktorli tajribalarga qaraganda samaraliroq va omillar soni ko'payishi bilan samaradorlik o'sib boradi.[44] Binobarin, faktorial dizaynlar juda ko'p qo'llaniladi.

Ko'p omillarning ta'sirini o'rganish uchun ANOVA dan foydalanish asoratlarni keltirib chiqaradi. X, y va z omillarga ega bo'lgan 3 tomonlama ANOVA-da ANOVA modeli asosiy effektlar uchun shartlarni (x, y, z) va o'zaro ta'sirlar (xy, xz, yz, xyz). Barcha shartlar gipoteza sinovlarini talab qiladi. O'zaro ta'sir qilish shartlarining ko'payishi, ba'zi bir gipoteza sinovlari tasodifan noto'g'ri ijobiy natijalarga olib kelish xavfini oshiradi. Yaxshiyamki, tajriba shuni ko'rsatadiki, yuqori darajadagi o'zaro ta'sirlar kamdan-kam uchraydi.[45][tekshirish kerak ]O'zaro ta'sirlarni aniqlash qobiliyati ANOVA ko'p omillarining asosiy afzalligi hisoblanadi. Bir vaqtning o'zida bitta omilni sinab ko'rish shovqinlarni yashiradi, ammo bir-biriga mos kelmaydigan eksperimental natijalarni beradi.[44]

O'zaro ta'sirlarga duch kelganda ehtiyotkorlik tavsiya etiladi; Avvalo o'zaro ta'sir qilish shartlarini sinab ko'ring va o'zaro ta'sirlar mavjud bo'lsa, tahlilni ANOVA dan tashqari kengaytiring. Matnlar o'zaro aloqada bo'lganidan keyin ANOVA protsedurasini davom ettirish bo'yicha o'zlarining tavsiyalarida farq qiladi. O'zaro ta'sirlar eksperimental ma'lumotlarning talqinini murakkablashtiradi. Muhim hisob-kitoblarni ham, taxmin qilingan davolash effektlarini ham nominal qiymati bo'yicha qabul qilib bo'lmaydi. "Muhim ta'sir o'tkazish ko'pincha asosiy effektlarning ahamiyatini yashiradi."[46] Tushunishni yaxshilash uchun grafik usullar tavsiya etiladi. Regressiya ko'pincha foydalidir. O'zaro ta'sirlarning uzoq munozarasi Cox (1958) da mavjud.[47] Ba'zi o'zaro ta'sirlarni (o'zgartirishlar bilan) olib tashlash mumkin, boshqalari esa yo'q.

Xarajatlarni kamaytirish uchun ANOVA ko'p omillari bilan turli xil usullardan foydalaniladi. Faktorial konstruktsiyalarda qo'llaniladigan usullardan biri bu replikatsiyani minimallashtirishdir (ehtimol qo'llab-quvvatlash bilan takrorlash mumkin emas) analitik hiyla-nayrang ) va natijalar statistik (yoki amalda) ahamiyatsiz deb topilganda guruhlarni birlashtirish. Ko'pgina ahamiyatsiz omillar bilan o'tkazilgan tajriba ko'plab takrorlashlar tomonidan qo'llab-quvvatlanadigan bir nechta omillarga ega bo'lishi mumkin.[48]

Raqamli misollar ishladi

Ko'p sonli to'liq ishlaydigan raqamli misollar standart darsliklarda va Internetda mavjud. A oddiy ish bir tomonlama (bitta omil) tahlildan foydalanadi.

Bilan bog'liq tahlil

Ni qo'llab-quvvatlash uchun ba'zi tahlillar talab qilinadi dizayn Boshqa tahlillar, omillarning o'zgarishi rasmiy ravishda aniqlanganidan so'ng, javoblarda statistik jihatdan muhim o'zgarishlarni keltirib chiqarishi bilan amalga oshiriladi. Eksperiment takrorlanuvchi bo'lgani uchun, bitta tajriba natijalari keyingi tajribalarning rejalarini o'zgartiradi.

Tayyorgarlik tahlili

Eksperimental birliklar soni

Eksperimentni loyihalashda tajriba maqsadlarini qondirish uchun eksperimental birliklar soni rejalashtirilgan. Tajriba ko'pincha ketma-ketlikda bo'ladi.

Dastlabki tajribalar ko'pincha davolash effektlari va eksperimental xatolarning o'rtacha xolis baholarini ta'minlash uchun ishlab chiqilgan. Keyinchalik tajribalar ko'pincha davolash effekti muhim kattalikka ega degan farazni sinash uchun mo'ljallangan; bu holda, eksperimental birliklar soni tanlanadi, shunda tajriba byudjet doirasida bo'ladi va boshqa maqsadlar qatorida etarli kuchga ega bo'ladi.

Hisobot namunalarini tahlil qilish odatda psixologiyada talab qilinadi. "Namuna hajmi va tanlov bo'yicha qarorlar qabul qilishga sabab bo'lgan jarayon haqida ma'lumot bering."[49] Eksperiment o'tkazilishidan oldin eksperimental protokolda yozilgan tahlil grant dasturlari va ma'muriy ko'rib chiqish kengashlarida ko'rib chiqiladi.

Quvvatni tahlil qilishdan tashqari, eksperimental birliklar sonini tanlashning rasmiy usullari kam. Ular orasida noto'g'ri salbiy xatolar ehtimolini cheklashga asoslangan grafik usullar, kutilayotgan o'zgarishlarning ko'payishiga asoslangan grafik usullar (qoldiqlardan yuqori) va kerakli ishonch oralig'iga erishish usullari kiradi.[50]

Quvvatni tahlil qilish

Quvvatni tahlil qilish ANOVA kontekstida nol gipotezani muvaffaqiyatli rad etish ehtimolligini baholash uchun ANOVA kontekstida qo'llaniladi, agar ma'lum bir ANOVA dizayni, populyatsiyadagi ta'sir hajmi, namuna hajmi va ahamiyat darajasi. Quvvatni tahlil qilish, muqobil gipoteza haqiqat bo'lganda bo'sh gipotezani rad etish uchun o'rtacha imkoniyatga ega bo'lish uchun qanday namunaviy hajm talab qilinishini aniqlash orqali tadqiqotni loyihalashda yordam beradi.[51][52][53][54]

Ta'sir hajmi

ANOVA uchun taxmin qiluvchi (lar) va bog'liq o'zgaruvchi o'rtasidagi bog'liqlik kuchini yoki to'liq modelning umumiy standartlashtirilgan farqini sarhisob qilish uchun bir nechta standartlashtirilgan ta'sir choralari taklif qilingan. Standartlashtirilgan effekt-o'lchovlar tadqiqotlari va fanlari bo'yicha natijalarni taqqoslashni osonlashtiradi. Biroq, professional adabiyotlarning ko'pchiligida standartlashtirilgan effekt o'lchovlari odatda qo'llanilgan bo'lsa-da, hisobot uchun darhol "mazmunli" birliklarga ega bo'lgan ta'sir hajmining nostandart o'lchovi afzalroq bo'lishi mumkin.[55]

Keyingi tahlil

Chegaralarni diqqat bilan ko'rib chiqish har doim o'rinli. Ular statistik xulosalarga nomutanosib ta'sir ko'rsatadi va ko'pincha xatolar natijasidir.

Modelni tasdiqlash

ANOVA taxminlari bajarilganligini tekshirish oqilona. Qoldiqlar tasdiqlash uchun tekshiriladi yoki tahlil qilinadi gomosedastiklik va qo'pol normallik.[56] Qoldiqlar vaqt va modellashtirilgan ma'lumotlar qiymatlarini o'z ichiga olgan har qanday narsaning funktsiyasi sifatida tuzilganda (nol o'rtacha normal taqsimot) shovqin ko'rinishiga ega bo'lishi kerak. Trends hint at interactions among factors or among observations. One rule of thumb: "If the largest standard deviation is less than twice the smallest standard deviation, we can use methods based on the assumption of equal standard deviations and our results will still be approximately correct."[57]

Keyingi testlar

A statistically significant effect in ANOVA is often followed up with one or more different follow-up tests. This can be done in order to assess which groups are different from which other groups or to test various other focused hypotheses. Follow-up tests are often distinguished in terms of whether they are planned (apriori ) yoki post hoc. Planned tests are determined before looking at the data and post hoc tests are performed after looking at the data.

Often one of the "treatments" is none, so the treatment group can act as a control. Dunnett sinovi (a modification of the t-test) tests whether each of the other treatment groups has the same mean as the control.[58]

Post hoc tests such as Tukeyning masofa sinovi most commonly compare every group mean with every other group mean and typically incorporate some method of controlling for Type I errors. Comparisons, which are most commonly planned, can be either simple or compound. Simple comparisons compare one group mean with one other group mean. Compound comparisons typically compare two sets of groups means where one set has two or more groups (e.g., compare average group means of group A, B and C with group D). Comparisons can also look at tests of trend, such as linear and quadratic relationships, when the independent variable involves ordered levels.

Following ANOVA with pair-wise multiple-comparison tests has been criticized on several grounds.[55][59] There are many such tests (10 in one table) and recommendations regarding their use are vague or conflicting.[60][61]

Study designs

There are several types of ANOVA. Many statisticians base ANOVA on the design of the experiment,[62] especially on the protocol that specifies the tasodifiy topshiriq of treatments to subjects; the protocol's description of the assignment mechanism should include a specification of the structure of the treatments and of any blokirovka qilish. It is also common to apply ANOVA to observational data using an appropriate statistical model.[iqtibos kerak ]

Some popular designs use the following types of ANOVA:

  • Bir tomonlama ANOVA is used to test for differences among two or more mustaqil groups (means), e.g. different levels of urea application in a crop, or different levels of antibiotic action on several different bacterial species,[63] or different levels of effect of some medicine on groups of patients. However, should these groups not be independent, and there is an order in the groups (such as mild, moderate and severe disease), or in the dose of a drug (such as 5 mg/mL, 10 mg/mL, 20 mg/mL) given to the same group of patients, then a linear trend estimation ishlatilishi kerak. Typically, however, the one-way ANOVA is used to test for differences among at least three groups, since the two-group case can be covered by a t-sinov.[64] When there are only two means to compare, the t-sinov and the ANOVA F- sinov tengdir; the relation between ANOVA and t tomonidan berilgan F = t2.
  • Faktorial ANOVA is used when the experimenter wants to study the interaction effects among the treatments.
  • Repeated measures ANOVA is used when the same subjects are used for each treatment (e.g., in a uzunlamasına o'rganish ).
  • Variantlarning ko'p o'zgaruvchan tahlili (MANOVA) is used when there is more than one javob o'zgaruvchisi.

Ogohlantirishlar

Balanced experiments (those with an equal sample size for each treatment) are relatively easy to interpret; Unbalanced experiments offer more complexity. For single-factor (one-way) ANOVA, the adjustment for unbalanced data is easy, but the unbalanced analysis lacks both robustness and power.[65] For more complex designs the lack of balance leads to further complications. "The orthogonality property of main effects and interactions present in balanced data does not carry over to the unbalanced case. This means that the usual analysis of variance techniques do not apply. Consequently, the analysis of unbalanced factorials is much more difficult than that for balanced designs."[66] In the general case, "The analysis of variance can also be applied to unbalanced data, but then the sums of squares, mean squares, and F-ratios will depend on the order in which the sources of variation are considered."[43] The simplest techniques for handling unbalanced data restore balance by either throwing out data or by synthesizing missing data. More complex techniques use regression.

ANOVA is (in part) a test of statistical significance. The American Psychological Association (and many other organisations) holds the view that simply reporting statistical significance is insufficient and that reporting confidence bounds is preferred.[55]

While ANOVA is conservative (in maintaining a significance level) against ko'p taqqoslash in one dimension, it is not conservative against comparisons in multiple dimensions.[67]

A common mistake is to use an ANOVA (or Kruskal – Uollis ) for analysis of ordered groups, e.g. in time sequence (changes over months), in disease severity (mild, moderate, severe), or in distance from a set point (10 km, 25 km, 50 km). Data in three or more ordered groups that are defined by the researcher should be analysed by linear trend estimation.

Umumlashtirish

ANOVA is considered to be a special case of chiziqli regressiya[68][69] which in turn is a special case of the general linear model.[70] All consider the observations to be the sum of a model (fit) and a residual (error) to be minimized.

The Kruskal–Wallis test va Fridman testi bor parametrsiz tests, which do not rely on an assumption of normality.[71][72]

Connection to linear regression

Below we make clear the connection between multi-way ANOVA and linear regression.

Linearly re-order the data so that observation is associated with a response va omillar qayerda denotes the different factors and is the total number of factors. In one-way ANOVA and in two-way ANOVA . Furthermore, we assume the factor has levels, namely . Now, we can one-hot encode the factors into the dimensional vector .

The one-hot encoding function is defined such that the kirish bu

The vector is the concatenation of all of the above vectors for all . Shunday qilib, . In order to obtain a fully general -way interaction ANOVA we must also concatenate every additional interaction term in the vector and then add an intercept term. Let that vector be .

With this notation in place, we now have the exact connection with linear regression. We simply regress response against the vector . However, there is a concern about identifikatsiya qilish. In order to overcome such issues we assume that the sum of the parameters within each set of interactions is equal to zero. From here, one can use F-statistics or other methods to determine the relevance of the individual factors.

Misol

We can consider the 2-way interaction example where we assume that the first factor has 2 levels and the second factor has 3 levels.

Aniqlang agar va agar , ya'ni is the one-hot encoding of the first factor and is the one-hot encoding of the second factor.

Shu bilan,

where the last term is an intercept term. For a more concrete example suppose that
Keyin,

Shuningdek qarang

Izohlar

  1. ^ Randomization is a term used in multiple ways in thismaterial. "Randomization has three roles in applications: as a device for eliminating biases, for example from unobserved explanatory variables and selection effects; as a basis for estimating standard errors; and as a foundation for formally exact significance tests." Cox (2006, page 192) Hinkelmann and Kempthorne use randomization both in experimental design and for statistical analysis.
  2. ^ Unit-treatment additivity is simply termed additivity in most texts. Hinkelmann and Kempthorne add adjectives and distinguish between additivity in the strict and broad senses. This allows a detailed consideration of multiple error sources (treatment, state, selection, measurement and sampling) on page 161.
  3. ^ Rosenbaum (2002, page 40) cites Section 5.7 (Permutation Tests), Theorem 2.3 (actually Theorem 3, page 184) of Lehman "s Statistik gipotezalarni sinovdan o'tkazish (1959).
  4. ^ The F-test for the comparison of variances has a mixed reputation. It is not recommended as a hypothesis test to determine whether two different samples have the same variance. It is recommended for ANOVA where two estimates of the variance of the bir xil sample are compared. Da F-test is not generally robust against departures from normality, it has been found to be robust in the special case of ANOVA. Citations from Moore & McCabe (2003): "Analysis of variance uses F statistics, but these are not the same as the F statistic for comparing two population standard deviations." (page 554) "The F test and other procedures for inference about variances are so lacking in robustness as to be of little use in practice." (page 556) "[The ANOVA F-test] is relatively insensitive to moderate nonnormality and unequal variances, especially when the sample sizes are similar." (page 763) ANOVA assumes homoscedasticity, but it is robust. The statistical test for homoscedasticity (the F-test) is not robust. Moore & McCabe recommend a rule of thumb.

Izohlar

  1. ^ Stigler (1986)
  2. ^ Stigler (1986, p 134)
  3. ^ Stigler (1986, p 153)
  4. ^ Stigler (1986, pp 154–155)
  5. ^ Stigler (1986, pp 240–242)
  6. ^ Stigler (1986, Chapter 7 – Psychophysics as a Counterpoint)
  7. ^ Stigler (1986, p 253)
  8. ^ Stigler (1986, pp 314–315)
  9. ^ Mendel merosini taxmin qilish bo'yicha qarindoshlar o'rtasidagi o'zaro bog'liqlik. Ronald A. Fisher. Philosophical Transactions of the Royal Society of Edinburgh. 1918. (volume 52, pages 399–433)
  10. ^ On the "Probable Error" of a Coefficient of Correlation Deduced from a Small Sample. Ronald A. Fisher. Metron, 1: 3–32 (1921)
  11. ^ Scheffé (1959, p 291, "Randomization models were first formulated by Neyman (1923) for the completely randomized design, by Neyman (1935) for randomized blocks, by Welch (1937) and Pitman (1937) for the Latin square under a certain null hypothesis, and by Kempthorne (1952, 1955) and Wilk (1955) for many other designs.")
  12. ^ Gelman (2005, p 2)
  13. ^ Howell (2002, p 320)
  14. ^ Montgomery (2001, p 63)
  15. ^ Gelman (2005, p 1)
  16. ^ Gelman (2005, p 5)
  17. ^ "Section 5.7. A Glossary of DOE Terminology". NIST Engineering Statistics handbook. NIST. Olingan 5 aprel 2012.
  18. ^ "Section 4.3.1 A Glossary of DOE Terminology". NIST Engineering Statistics handbook. NIST. Olingan 14 avgust 2012.
  19. ^ Montgomery (2001, Chapter 12: Experiments with random factors)
  20. ^ Gelman (2005, pp. 20–21)
  21. ^ Snedecor, George W.; Cochran, William G. (1967). Statistik usullar (6-nashr). p. 321.
  22. ^ Cochran & Cox (1992, p 48)
  23. ^ Howell (2002, p 323)
  24. ^ Anderson, Devid R.; Sweeney, Dennis J.; Williams, Thomas A. (1996). Statistics for business and economics (6-nashr). Minneapolis / St. Pol: West Pub. Co. pp. 452–453. ISBN  978-0-314-06378-6.
  25. ^ Anscombe (1948)
  26. ^ Kempthorne (1979, p 30)
  27. ^ a b Cox (1958, Chapter 2: Some Key Assumptions)
  28. ^ Hinkelmann and Kempthorne (2008, Volume 1, Throughout. Introduced in Section 2.3.3: Principles of experimental design; The linear model; Outline of a model)
  29. ^ Hinkelmann and Kempthorne (2008, Volume 1, Section 6.3: Completely Randomized Design; Derived Linear Model)
  30. ^ a b Hinkelmann and Kempthorne (2008, Volume 1, Section 6.6: Completely randomized design; Approximating the randomization test)
  31. ^ Bailey (2008, Chapter 2.14 "A More General Model" in Bailey, pp. 38–40)
  32. ^ Hinkelmann and Kempthorne (2008, Volume 1, Chapter 7: Comparison of Treatments)
  33. ^ Kempthorne (1979, pp 125–126, "The experimenter must decide which of the various causes that he feels will produce variations in his results must be controlled experimentally. Those causes that he does not control experimentally, because he is not cognizant of them, he must control by the device of randomization." "[O]nly when the treatments in the experiment are applied by the experimenter using the full randomization procedure is the chain of inductive inference sound. It is faqat under these circumstances that the experimenter can attribute whatever effects he observes to the treatment and the treatment only. Under these circumstances his conclusions are reliable in the statistical sense.")
  34. ^ Fridman[to'liq iqtibos kerak ]
  35. ^ Montgomery (2001, Section 3.8: Discovering dispersion effects)
  36. ^ Hinkelmann and Kempthorne (2008, Volume 1, Section 6.10: Completely randomized design; Transformations)
  37. ^ Bailey (2008)
  38. ^ Montgomery (2001, Section 3-3: Experiments with a single factor: The analysis of variance; Analysis of the fixed effects model)
  39. ^ Cochran & Cox (1992, p 2 example)
  40. ^ Cochran & Cox (1992, p 49)
  41. ^ Hinkelmann and Kempthorne (2008, Volume 1, Section 6.7: Completely randomized design; CRD with unequal numbers of replications)
  42. ^ Moore and McCabe (2003, page 763)
  43. ^ a b v Gelman (2008)
  44. ^ a b Montgomery (2001, Section 5-2: Introduction to factorial designs; The advantages of factorials)
  45. ^ Belle (2008, Section 8.4: High-order interactions occur rarely)
  46. ^ Montgomery (2001, Section 5-1: Introduction to factorial designs; Basic definitions and principles)
  47. ^ Cox (1958, Chapter 6: Basic ideas about factorial experiments)
  48. ^ Montgomery (2001, Section 5-3.7: Introduction to factorial designs; The two-factor factorial design; One observation per cell)
  49. ^ Wilkinson (1999, p 596)
  50. ^ Montgomery (2001, Section 3-7: Determining sample size)
  51. ^ Howell (2002, Chapter 8: Power)
  52. ^ Howell (2002, Section 11.12: Power (in ANOVA))
  53. ^ Howell (2002, Section 13.7: Power analysis for factorial experiments)
  54. ^ Moore and McCabe (2003, pp 778–780)
  55. ^ a b v Wilkinson (1999, p 599)
  56. ^ Montgomery (2001, Section 3-4: Model adequacy checking)
  57. ^ Moore and McCabe (2003, p 755, Qualifications to this rule appear in a footnote.)
  58. ^ Montgomery (2001, Section 3-5.8: Experiments with a single factor: The analysis of variance; Practical interpretation of results; Comparing means with a control)
  59. ^ Hinkelmann and Kempthorne (2008, Volume 1, Section 7.5: Comparison of Treatments; Multiple Comparison Procedures)
  60. ^ Howell (2002, Chapter 12: Multiple comparisons among treatment means)
  61. ^ Montgomery (2001, Section 3-5: Practical interpretation of results)
  62. ^ Cochran & Cox (1957, p 9,"[T]he general rule [is] that the way in which the experiment is conducted determines not only whether inferences can be made, but also the calculations required to make them.")
  63. ^ "Bandar Ceme Online | Domino99 | Poker | 99Ceme | DominoQQ". 99ceme.in. Arxivlandi asl nusxasi 2014 yil 7-noyabrda.
  64. ^ "O'rtacha ehtimolli xato" (PDF). Biometrika. 6: 1–25. 1908. doi:10.1093 / biomet / 6.1.1. hdl:10338.dmlcz / 143545.
  65. ^ Montgomery (2001, Section 3-3.4: Unbalanced data)
  66. ^ Montgomery (2001, Section 14-2: Unbalanced data in factorial design)
  67. ^ Wilkinson (1999, p 600)
  68. ^ Gelman (2005, p.1) (with qualification in the later text)
  69. ^ Montgomery (2001, Section 3.9: The Regression Approach to the Analysis of Variance)
  70. ^ Howell (2002, p 604)
  71. ^ Howell (2002, Chapter 18: Resampling and nonparametric approaches to data)
  72. ^ Montgomery (2001, Section 3-10: Nonparametric methods in the analysis of variance)

Adabiyotlar

Qo'shimcha o'qish

Tashqi havolalar