Q qiymati (statistika) - Q-value (statistics)

Yilda statistik gipotezani sinovdan o'tkazish, xususan ko'p gipotezani sinash, q- qiymat ni boshqarish vositasini taqdim etadi ijobiy noto'g'ri kashfiyot darajasi (pFDR).[1] Xuddi p- qiymat kutilgan narsani beradi noto'g'ri ijobiy stavka rad etish natijasida olingan nol gipoteza teng yoki kichikroq bo'lgan har qanday natija uchun p-value, the q-value har qanday natija uchun teng yoki kichikroq nol gipotezani rad etish natijasida olingan kutilgan pFDRni beradi q- qiymat.

Tarix

Yagona gipotezani sinash uchun mos usullardan foydalangan holda bir nechta farazlarni bir vaqtning o'zida sinab ko'rish statistikada ko'plab noto'g'ri ijobiy natijalarni keltirib chiqaradi: bir nechta taqqoslash muammosi.[2] Masalan, barchasi 1000 ta nol gipotezani sinab ko'rdi, ularning barchasi haqiqat va (bitta gipotezani sinashda odatdagidek) null gipotezani ahamiyat darajasi 0,05 dan; tasodifiy tasodif tufayli, natijalarning 5% muhim ko'rinishini kutishi mumkin (P <0.05), 50 ta noto'g'ri pozitsiyani keltirib chiqaradi (bekor gipotezani rad etish).[3] 1950-yillardan boshlab statistik mutaxassislar ko'p marta taqqoslash usullarini ishlab chiqmoqdalar, masalan, noto'g'ri pozitsiyalar sonini kamaytirish oilaviy xatolar darajasi (FWER) yordamida Bonferroni tuzatish, ammo bu usullar soxta salbiy sonlarni ko'paytirdi (ya'ni statistik kuch ).[2] 1995 yilda, Yoav Benjamini va Yosef Xochberg nazorat qilishni taklif qildi noto'g'ri kashfiyot darajasi (FDR) bir nechta gipoteza sinovlarida FWERni boshqarish uchun statistik jihatdan kuchli alternativ sifatida.[2] PFDR va q-qiymati tomonidan kiritilgan Jon D. Stori 2002 yilda FDRning cheklanishini yaxshilash uchun, ya'ni ijobiy natijalar bo'lmagan taqdirda FDR aniqlanmagan.[1][4]

Ta'rif

Nol gipoteza bo'lsin va an muqobil gipoteza . Amalga oshirish gipoteza sinovlari; ruxsat bering test statistikasi bo'lishi i.i.d. tasodifiy o'zgaruvchilar shu kabi . Ya'ni, agar sinov uchun to'g'ri (), keyin quyidagicha bekor tarqatish ; agar bo'lsa haqiqat (), keyin muqobil taqsimotga amal qiladi . Ruxsat bering , ya'ni har bir test uchun, ehtimollik bilan to'g'ri va ehtimollik bilan to'g'ri . Belgilang muhim mintaqa (ning qiymatlari buning uchun rad etildi) at ahamiyat darajasi tomonidan . Tajriba qiymat bersin test statistikasi uchun. The q- qiymati sifatida rasmiy ravishda belgilanadi

Ya'ni q- qiymat cheksiz agar pFDR qiymatlari bilan test statistikasi uchun rad etilgan . Teng ravishda q- qiymat teng

bu ehtimollikning eng past darajasi shuni hisobga olgan holda to'g'ri rad etildi (the noto'g'ri kashfiyot darajasi ).[1]

Bilan munosabatlar p- qiymat

The p-valit quyidagicha aniqlanadi

ehtimolligining cheksizligi shuni hisobga olgan holda rad etiladi to'g'ri (the noto'g'ri ijobiy stavka ). Ning ta'riflarini taqqoslash p- va q-qadriyatlar, ko'rinib turibdiki q- qiymat minimaldir orqa ehtimollik bu haqiqat.[1]

Tafsir

The q-valu soxta kashfiyot darajasi (FDR) sifatida talqin qilinishi mumkin: barcha ijobiy natijalar orasida noto'g'ri pozitsiyalarning nisbati. Sinov statistikasi to'plami va ular bilan bog'liq berilgan q- barcha testlar uchun nol gipotezani rad etgan qiymatlar q-valu biron bir chegaradan kichik yoki unga teng soxta kashfiyot stavkasining kutilgan qiymati bo'lishini ta'minlaydi .[5]

Ilovalar

Biologiya

Gen ifodasi

Differentsial gen ekspressionining genomik tahlillari bir vaqtning o'zida sinovni o'z ichiga oladi ifoda minglab genlar. FWER-ni boshqarish (odatda 0,05 gacha) haddan tashqari noto'g'ri pozitsiyalarni oldini oladi (ya'ni genda differentsial ifodalanmagan differentsial ekspressionni aniqlash), ammo p- ko'plab noto'g'ri negativlarni keltirib chiqaradigan qiymat (ko'plab differentsial ekspluatatsiya qilingan genlar e'tiborga olinmaydi). Shu bilan birga, pFDR-ni muhim genlarni tanlash orqali boshqarish q-qiymatlar soxta salbiy sonlarni kamaytiradi (statistik quvvatni oshiradi), shu bilan birga barcha ijobiy natijalar orasida noto'g'ri pozitsiyalar ulushining kutilayotgan qiymati past (masalan, 5%).[5]

Masalan, sinovdan o'tgan 10000 gen orasida 1000 tasi aslida boshqacha ifodalangan, 9000 tasi quyidagicha emas deylik.

  • Agar har bir genni a bilan ko'rib chiqsak p- 0,05 dan kam bo'lgan qiymat differentsial tarzda ifodalanadigan bo'lsa, biz differentsial ravishda ifoda etilmagan 9000 genning 450 (5%) farqli ravishda (450 yolg'on ijobiy) ko'rinishda bo'lishini kutamiz.
  • Agar biz FWER-ni 0,05 gacha boshqaradigan bo'lsak, unda kamida bitta noto'g'ri musbat olish ehtimoli atigi 5%. Biroq, bu juda qat'iy mezon kuchni pasaytiradi, shunda aslida differentsial ifoda etilgan 1000 genning oz qismi differentsial tarzda ifoda etilgan bo'lib ko'rinadi (ko'plab yolg'on salbiy).
  • Agar biz aF bilan barcha genlarni hisobga olgan holda pFDRni 0,05 gacha boshqaradigan bo'lsak q-0,05 dan kam bo'lgan qiymat differentsial tarzda ifodalanishi kerak, shunda biz ijobiy natijalarning 5% yolg'on ijobiy (masalan, 900 ta haqiqiy ijobiy, 45 ta noto'g'ri, 100 ta noto'g'ri, 8 955 ta haqiqiy salbiy) bo'lishini kutmoqdamiz. Ushbu strategiya soxta ijobiy va noto'g'ri negativlarning nisbatan kam sonini olishga imkon beradi.

Amaliyotlar

Izoh: to'liq bo'lmagan ro'yxat.

R

  • The qvalue paket R taxminlar q- ro'yxatidagi qiymatlar p-qiymatlar.[6]

Adabiyotlar

  1. ^ a b v d Stori, Jon D. (2003). "Soxta kashfiyotlarning ijobiy darajasi: Bayescha talqin va q-qiymat". Statistika yilnomalari. 31 (6): 2013–2035. doi:10.1214 / aos / 1074290335.
  2. ^ a b v Benjamini, Yoav; Xoxberg, Yosef (1995). "Soxta kashfiyotlar tezligini boshqarish: tomultiple sinovi uchun amaliy va kuchli yondashuv". Qirollik statistika jamiyati jurnali. B seriyasi (uslubiy). 57: 289–300. doi:10.1111 / j.2517-6161.1995.tb02031.x.
  3. ^ Nuzzo, Regina (2014). "Ilmiy uslub: Statistik xatolar". Tabiat. Olingan 5 mart 2019.
  4. ^ Stori, Jon D. (2002). "Soxta kashfiyot stavkalariga to'g'ridan-to'g'ri yondashuv". Qirollik statistika jamiyati jurnali: B seriyasi (Statistik metodologiya). 64 (3): 479–498. CiteSeerX  10.1.1.320.7131. doi:10.1111/1467-9868.00346.
  5. ^ a b Stori, Jon D.; Tibshirani, Robert (2003). "Genomevid tadqiqotlari uchun statistik ahamiyatga". PNAS. 100 (16): 9440–9445. Bibcode:2003 PNAS..100.9440S. doi:10.1073 / pnas.1530509100. PMC  170937. PMID  12883005.
  6. ^ Stori, Jon D.; Bass, Endryu J.; Dabni, Alan; Robinson, Devid; Warnes, Gregori (2019). "qvalue: soxta kashfiyotlar tezligini boshqarish uchun Q qiymatini baholash". Bio o'tkazgich.