Gaplotipni taxmin qilish - Haplotype estimation

Yilda genetika, haplotipni baholash (shuningdek, "fazalash" deb ham ataladi) bu statistik baholash jarayoniga ishora qiladi haplotiplar dan genotip ma'lumotlar. Eng keng tarqalgan vaziyat genotiplar bir guruh shaxslardan polimorfik joylar to'plamida to'planganda paydo bo'ladi. Masalan, inson genetikasida, genom bo'yicha assotsiatsiya tadqiqotlari mikroarraylar yordamida minglab odamlarda 200-50000 SNP oralig'ida genotiplarni yig'ish. Ushbu ma'lumotlar to'plamlarini tahlil qilishda gaplotiplarni baholash usullari qo'llaniladi va imkon beradi genotip imputatsiyasi [1][2] kabi ma'lumot bazalaridan olingan allellar HapMap loyihasi va 1000 genom loyihasi.

Genotiplar va haplotiplar

Genotiplar har bir joyda allellarning tartibsiz birikmasini o'lchaydilar, haplotiplar esa bu allellarning shaxsning ota-onasidan birgalikda meros qilib olingan ikkita ketma-ketligi. Qachon mavjud bo'lsa heterozigot individual genotiplar to'plamida mavjud bo'lgan genotiplar mavjud bo'ladi genotiplar asosida yotadigan haplotiplarning mumkin bo'lgan juftliklari. Masalan, qachon , bizda quyidagi haplotiplar mavjud: AA / TT, AT / TA, TA / AT va TT / AA. Agar etishmayotgan genotiplar mavjud bo'lsa, unda mumkin bo'lgan haplotip juftlari soni ko'payadi.

Gaplotipni baholash usullari

Gaplotiplarni baholash uchun ko'plab statistik usullar taklif qilingan. Dastlabki yondashuvlarning bir qismida namunaga mos keladigan har bir haplotipga noma'lum chastota parametri berilgan va bu parametrlar Kutish - maksimallashtirish algoritmi. Ushbu yondashuvlar bir vaqtning o'zida faqat oz sonli saytlar bilan ishlashga qodir edi, ammo keyinchalik ketma-ket versiyalar ishlab chiqildi, xususan SNPHAP usuli.

Gaplotipni baholash uchun eng aniq va keng qo'llaniladigan usullar ba'zi bir shakllardan foydalanadi yashirin Markov modeli (HMM) xulosani amalga oshirish uchun. Uzoq vaqt davomida FAZ[3] eng aniq usul edi. FAZ - fikrlarni ishlatishda birinchi usul birlashma nazariyasi haplotiplarning birgalikdagi tarqalishi to'g'risida. Ushbu usulda a Gibbs namunalari yondashuv, har bir alohida shaxs haplotiplari barcha boshqa namunalardagi haplotiplarning joriy bahosiga binoan yangilangan. Gibbs namunasini shartli taqsimlash uchun boshqa haplotiplar to'plamiga bog'liq bo'lgan haplotipning taqsimlanishiga yaqinlashuvlardan foydalanilgan. Faza haplotiplarni taxmin qilish uchun ishlatilgan HapMap loyihasi. FAZ tezligi bilan cheklangan va genom bo'yicha assotsiatsiya tadqiqotlari ma'lumotlar to'plamiga taalluqli emas edi.

FastPHASE [4] va BEAGLE usullari [5] qo'llaniladigan haplotipli klaster modellari GWAS - hajmli ma'lumotlar to'plamlari. Keyinchalik IMPUTE2[6] va MaCH[7] PHASE yondashuviga o'xshash, ammo juda tezroq usullar joriy etildi. Ushbu usullar har bir namunadagi haplotip taxminlarini boshqa namunalarning K haplotipi taxminlari to'plamiga qarab shartli ravishda yangilaydi. IMPUTE2 aniqlikni yaxshilash uchun haplotiplarning qaysi turini shartli ravishda sinchkovlik bilan tanlash g'oyasini ilgari surdi. Aniqlik K bilan, lekin kvadrat bilan ortadi hisoblash murakkabligi.

SHAPEIT1 usuli chiziqli usulni joriy qilish orqali katta yutuqlarga erishdi faqat individual genotiplarga mos keladigan haplotiplar makonida ishlaydigan murakkablik usuli.[8] Keyinchalik HAPI-UR usuli juda o'xshash usulni taklif qildi.[9] SHAPEIT2 [10] samaradorlik va aniqlikni oshirish uchun SHAPEIT1 va IMPUTE2-ning eng yaxshi xususiyatlarini birlashtiradi.

Shuningdek qarang

Adabiyotlar

  1. ^ Marchini, J .; Howie, B. (2010). "Genom bo'yicha assotsiatsiyani o'rganish uchun genotipning ta'siri". Genetika haqidagi sharhlar. 11 (7): 499–511. doi:10.1038 / nrg2796. PMID  20517342. S2CID  1465707.
  2. ^ Xaui, B .; Fuchsberger, S .; Stivens, M.; Marchini, J .; Abecasis, G. A. R. (2012). "Genom bo'yicha assotsiatsiyani bosqichma-bosqich o'tkazish orqali tez va aniq genotip imputatsiyasi". Tabiat genetikasi. 44 (8): 955–959. doi:10.1038 / ng.2354. PMC  3696580. PMID  22820512.
  3. ^ Stivens, M.; Smit, N. J .; Donnelly, P. (2001). "Aholining ma'lumotlaridan gaplotipni tiklashning yangi statistik usuli". Amerika inson genetikasi jurnali. 68 (4): 978–989. doi:10.1086/319501. PMC  1275651. PMID  11254454.
  4. ^ Sxema, P.; Stephens, M. (2006). "Aholining keng ko'lamli genotip ma'lumotlari uchun tezkor va moslashuvchan statistik model: yo'qolgan genotiplar va gaplotipik faza to'g'risida ilova". Amerika inson genetikasi jurnali. 78 (4): 629–644. doi:10.1086/502802. PMC  1424677. PMID  16532393.
  5. ^ Braunning, S. R .; Browning, B. L. (2007). "Mahalliy gaplotip klasteridan foydalangan holda butun genom assotsiatsiyasini o'rganish uchun tezkor va aniq gaplotiplarni bosqichma-bosqichligi va yo'qolgan ma'lumotlar to'g'risida xulosa". Amerika inson genetikasi jurnali. 81 (5): 1084–1097. doi:10.1086/521987. PMC  2265661. PMID  17924348.
  6. ^ Xaui, B. N .; Donnelli, P .; Marchini, J. (2009). Schork, Nikolas J (tahrir). "Genom-keng assotsiatsiyani o'rganish uchun keyingi avlod uchun genotipni moslashuvchan va to'g'ri hisoblash usuli". PLOS Genetika. 5 (6): e1000529. doi:10.1371 / journal.pgen.1000529. PMC  2689936. PMID  19543373.
  7. ^ Li, Y .; Viller, C. J .; Ding, J .; Sxema, P.; Abecasis, G. A. R. (2010). "MaCH: Gaplotiplar va kuzatilmagan genotiplarni taxmin qilish uchun ketma-ketlik va genotip ma'lumotlaridan foydalanish". Genetik epidemiologiya. 34 (8): 816–834. doi:10.1002 / gepi.20533. PMC  3175618. PMID  21058334.
  8. ^ Delaneau, O .; Marchini, J .; Zagury, J. F. O. (2011). "Minglab genomlar uchun bosqichma-bosqich chiziqli usul". Tabiat usullari. 9 (2): 179–181. doi:10.1038 / nmeth.1785. PMID  22138821. S2CID  13765612.
  9. ^ Uilyams, A. L .; Patterson, N .; Glessner, J .; Xakonarson, H.; Reyx, D. (2012). "Ko'p minglab genotip namunalarni bosqichma-bosqich o'zgartirish". Amerika inson genetikasi jurnali. 91 (2): 238–251. doi:10.1016 / j.ajhg.2012.06.013. PMC  3415548. PMID  22883141.
  10. ^ Delaneau, O .; Zagury, J. F .; Marchini, J. (2012). "Kasallik va populyatsiyani genetik tadqiq qilish uchun yaxlit xromosoma fazalari yaxshilandi". Tabiat usullari. 10 (1): 5–6. doi:10.1038 / nmeth.2307. PMID  23269371. S2CID  205421216.