Gen kasalliklari bo'yicha ma'lumotlar bazasi - Gene Disease Database

Gen kasalliklari bo'yicha ma'lumotlar bazasi
TasnifiBioinformatika
SubklassifikatsiyaMa'lumotlar bazalari
Ma'lumotlar bazalari turiBiologik
Ma'lumotlar bazalarining pastki turiGen-kasallik

Yilda bioinformatika, a Gen kasalliklari bo'yicha ma'lumotlar bazasi bu murakkab kasalliklarning asosiy mexanizmlarini anglash uchun, haqiqat tomonlarini modellashtirish uchun tuzilgan, ma'lumotlar o'rtasidagi tizimlashtirilgan ma'lumotlar to'plami bo'lib, ular o'rtasida bir nechta kompozitsion o'zaro ta'sirlarni tushunishdir. fenotip -genotip munosabatlar va gen-kasallik mexanizmlari.[1] Gen kasalliklari bo'yicha ma'lumotlar bazalari insonning gen kasalliklari assotsiatsiyasini turli mutaxassislar tomonidan tuzilgan ma'lumotlar bazalaridan va matn qazib olish Mendelian, murakkab va atrof-muhit kasalliklarini o'z ichiga olgan kelib chiqqan birlashmalar.[2][3]

Kirish

Biologiyaning turli sohalari bo'yicha mutaxassislar va bioinformatika uzoq vaqt davomida profilaktika va terapevtik strategiyalarni ishlab chiqish uchun kasalliklarning molekulyar mexanizmlarini tushunishga harakat qilmoqdalar. Ba'zi kasalliklar uchun, bu kasallik bilan bog'liq genlar indeksini olish uchun etarli emasligi uchun, ammo hujayradagi molekulyar kataklarning buzilishi kasallik fenotiplarini qanday paydo bo'lishini aniqlash uchun kerakli darajada adovat qilish kerakligi aniq bo'ldi.[4] Bundan tashqari, misli ko'rilmagan ma'lumotlarga ega bo'lgan holda ham, bunday kataloglarni olish juda qiyin.

Genetik Keng ma'noda aytganda, genetik kasalliklar genlardagi aberatsiyalar yoki xromosomalar. Ko'pgina genetik kasalliklar tug'ilishdan oldin rivojlangan. Genetika kasalliklari bizning jamiyatimizdagi sog'liqni saqlash muammolarining katta qismini tashkil qiladi. Ushbu kasalliklarni tushunishdagi yutuqlar genetik kasalliklarga chalinganlarning ko'pchiligida ham umr ko'rishni, ham hayot sifatini oshirdi. Bioinformatika va laboratoriya genetikasi sohasidagi so'nggi o'zgarishlar ma'lum malformatsiya va aqliy zaiflik sindromlarini yaxshiroq belgilashga imkon berdi, shuning uchun ularning merosxo'rlik usuli tushunilishi mumkin edi. Ushbu ma'lumot genetik maslahatchiga ko'p sonli genetik kasalliklarning paydo bo'lish xavfini bashorat qilishga imkon beradi.[2] Ko'pgina genetik maslahat, faqat kamida bitta zarar ko'rgan shaxs tug'ilgandan keyingina oilani genetik buzilishi bo'lgan bolalarni tug'ilishiga moyilligi to'g'risida ogohlantirgandan keyingina amalga oshiriladi. Bitta genning kasallikka qo'shilishi kamdan-kam uchraydi va genetik kasallik yuqadigan kasallik bo'lishi mumkin yoki bo'lmasligi mumkin.[5] Ba'zi irsiy kasalliklar ota-onaning genlaridan meros bo'lib o'tgan bo'lsa, boshqalari yangi kasalliklardan kelib chiqadi mutatsiyalar yoki ga o'zgartirishlar DNK. Boshqa holatlarda, xuddi shu kasallik, masalan, ba'zi shakllari karsinoma yoki melanoma, ba'zi odamlarda tug'ma holatdan, boshqa odamlardagi yangi o'zgarishlardan va boshqa odamlarda genetik bo'lmagan sabablardan kelib chiqishi mumkin.[6]

Olti mingdan ziyod ma'lum bo'lgan bitta genning buzilishi (monogen), ular har 200 tug'ilishdan taxminan 1tasida uchraydi.[1] Ularning atamasidan ko'rinib turibdiki, bu kasalliklar bitta genning mutatsiyasiga uchraydi. Aksincha, poligenik kasalliklarni atrof-muhit omillari bilan muntazam ravishda bir nechta genlar keltirib chiqaradi.[7] Genetik fenotiplarga misollar kiradi Altsgeymer kasalligi, ko'krak bezi saratoni, leykemiya, Daun sindromi, yurak nuqsonlari va karlik; shuning uchun genlar bilan bog'liq barcha kasalliklarni saralash uchun katalogizatsiya zarur.

Yaratilish bilan bog'liq muammolar

A Gene prioritization
Inson kasalliklarini genlarni ustuvorlashtirish jarayonlari: Odatda ro'yxatlar bog'lanish mintaqalaridan, xromosomal aberratsiyalardan, assotsiatsiyani o'rganish joylaridan, deferentsial ravishda ifodalangan genlar ro'yxatlaridan yoki genlar ketma-ketligi bilan aniqlangan. Shu bilan bir qatorda, to'liq genomga ustuvor ahamiyat berish mumkin, ammo keyinchalik ancha yolg'on ijobiy natijalar kutiladi.

Har qanday gen kasalligi loyihasining turli bosqichlarida, molekulyar biologlar tanlash kerak, hatto diqqat bilan statistik ma'lumotlar tahlilidan so'ng, qaysi genlar yoki oqsillar eksperimental ravishda tekshirish va resurslar cheklanganligi sababli qaysi birini qoldirish kerak. Murakkab, heterojen ma'lumotlar to'plamini birlashtirgan hisoblash usullari, masalan, ekspresiya ma'lumotlari, ketma-ketlik ma'lumotlari, funktsional annotatsiya va biotibbiyot adabiyotlari, kelajakda o'rganish uchun genlarni ustuvorroq ma'lumot berishga imkon beradi. Bunday usullar quyi oqimlarni o'rganish samaradorligini sezilarli darajada oshirishi mumkin va tadqiqotchilar uchun bebaho bo'lib qolmoqda. Shunday qilib, biologik va biotibbiy tadqiqot bu murakkab genetik fenotiplarning asosidagi mexanizmlarni aniqlashdir. Kasalliklar bilan bog'liq genlarni topishga katta kuch sarflandi[8]

Biroq, tobora ko'payib borayotgan dalillar shuni ko'rsatadiki, odamlarning ko'pgina kasalliklarini bitta genga bog'lash mumkin emas, lekin ko'plab genetik variantlar va atrof-muhit uchun xavfli omillar o'rtasidagi o'zaro ta'sirlar tufayli paydo bo'ladi. Taqqoslanadigan Toksikogenomika Ma'lumotlar Bazasi (CTD), Odamdagi Onlayn Mendelian Meroslik (OMIM), Genetik Uyushma Ma'lumotlar Bazasi (GAD) yoki Kasalliklarni genetik assotsiatsiyasi ma'lumotlar bazasi (DisGeNET) kabi genlar va kasalliklar o'rtasidagi assotsiatsiyani saqlash uchun bir nechta ma'lumotlar bazalari ishlab chiqilgan. Ushbu ma'lumotlar bazalarining har biri fenotip-genotip munosabatlarining turli jihatlariga e'tiborni qaratadi va ma'lumotlar bazasini tuzish jarayoni xususiyati tufayli ular to'liq emas, balki bir-birlari bilan bir-birini to'liq to'ldiradi.[9]

Ma'lumotlar bazalarining turlari

Aslida, ma'lumotlar bazalarining to'rt turi mavjud: tuzilgan ma'lumotlar bazalari, bashoratli ma'lumotlar bazalari, adabiyotlar ma'lumotlar bazalari va integral ma'lumotlar bazalari[1]

Ma'lumotlar bazalari

Tavsiya etilgan ma'lumotlar atamasi bunday ma'lumot olish uchun malakali deb hisoblangan bir yoki bir nechta mutaxassislar tomonidan tuzilgan va tayyorlangan tuzilgan ma'lumotlar, ilmiy yangilanishlar va tuzilgan bilimlar uchun eng zamonaviy hisoblash formatlarini o'z ichiga olishi mumkin bo'lgan ma'lumotlarga ishora qiladi. faoliyat[10] Buning ma'nosi shuki, natijada olingan ma'lumotlar bazasi yuqori sifatga ega. Qarama-qarshilik, ba'zi bir avtomatlashtirilgan jarayonlar orqali to'plangan yoki ayniqsa past yoki tajribasiz ma'lumotlarning sifati bilan qo'llab-quvvatlanmagan va ehtimol ishonchga sazovor bo'lmagan ma'lumotlar yordamida to'plangan bo'lishi mumkin.[10] Ba'zi eng keng tarqalgan misollarga quyidagilar kiradi: CTD va UNIPROT.

Qiyosiy toksikogenomika ma'lumotlar bazasi (CTD)

The Qiyosiy toksikogenomika ma'lumotlar bazasi, genlar va oqsillar bilan biokimyoviy o'zaro ta'sirlarni, kasalliklar va kimyoviy moddalar bilan kasalliklar va genlar yoki oqsillarni o'zaro bog'liqligini tavsiflash uchun ilmiy ilmiy adabiyotlardan olingan ma'lumotlarni birlashtirib, atrof-muhit birikmalarining inson sog'lig'iga ta'siri haqida tushunishga yordam beradi.[11] CTD tarkibida o'zgaruvchan sezuvchanlik va atrof muhitga ta'sir etuvchi kasalliklarga asoslangan molekulyar mexanizmlarni yoritish uchun xoch-genlar / oqsillarning o'zaro ta'siri va kimyoviy- va gen-kasallik birlashmalarini aniqlaydigan aniqlangan ma'lumotlar mavjud. Ushbu ma'lumotlar kimyoviy-gen va oqsillarning o'zaro ta'sirlashish tarmoqlari haqida ma'lumot beradi. Ushbu ma'lumotlar bazasidagi asosiy manbalardan biri OMIM tomonidan olingan ma'lumotdir.[11]

CTD noyob manbadir, bu erda bioinformatika mutaxassislari ilmiy adabiyotlarni o'qiydilar va to'rt turdagi asosiy ma'lumotlarni qo'lda tuzadilar:

  • Kimyoviy-genlarning o'zaro ta'siri
  • Kimyoviy kasalliklar assotsiatsiyasi
  • Gen kasalliklari assotsiatsiyasi
  • Kimyoviy-fenotip birlashmalari

Umumjahon oqsil resurslari (UNIPROT)

Umumjahon oqsil resurslari (UniProt ) oqsillar ketma-ketligi va izohlash ma'lumotlari uchun inklyuziv manba hisoblanadi. Bu oqsillar ketma-ketligi va funktsional ma'lumotlarning keng qamrovli, birinchi darajali va erkin foydalaniladigan ma'lumotlar bazasi bo'lib, unda ko'plab yozuvlar mavjud. genom loyihalarni ketma-ketligi. U tarkibida oqsillarning biologik funktsiyasi to'g'risida juda ko'p ma'lumot mavjud bo'lib, ular gen-oqsil-kasallik o'rtasidagi to'g'ridan-to'g'ri bog'liqlikni ko'rsatishi mumkin.[12]

UniProt
Tarkib
TavsifUniProt bo'ladi universal oqsil resurs, markaziy ombor oqsil Swiss-Prot, TrEMBL va PIR-PSD-ni birlashtirish orqali yaratilgan ma'lumotlar ma'lumotlar bazalari.
Ma'lumot turlari
qo'lga olindi
Proteinli izoh
OrganizmlarHammasi
Aloqa
Ilmiy-tadqiqot markaziEMBL-EBI, Buyuk Britaniya; SIB, Shveytsariya; PIR, BIZ.
Birlamchi iqtibosUniversal Protein Resursidagi doimiy va kelajakdagi o'zgarishlar[13]
Kirish
Ma'lumotlar formatiMaxsus tekis fayl, FASTA, GFF, RDF, XML.
Veb-saytwww.uniprot.org
www.uniprot.org/Yangiliklar/
URLni yuklab olishwww.uniprot.org/ yuklamalar & to'liq ma'lumotlar to'plamini yuklab olish uchun ftp.uniprot.org
Veb-xizmat URL manziliHa - JAVA API ma'lumotni ko'ring Bu yerga & Dam olish ma'lumotni ko'ring Bu yerga
Asboblar
InternetKengaytirilgan qidiruv, Portlash, Kustal O, ommaviy qidirish / yuklab olish, identifikatorni xaritalash
Turli xil
LitsenziyaCreative Commons Attribution-NoDerivs
VersiyalarHa
Ma'lumotlarni chiqarish
chastota
4 hafta
Kuratsiya siyosatiHa - qo'lda va avtomatik. Ma'lumotlar bazasi kuratorlari va hisoblash algoritmlari tomonidan yaratilgan avtomatik izohlash qoidalari.
Xatcho'plar
sub'ektlar
Ha - har ikkala individual oqsil yozuvlari va qidiruvlari
Ma'lumotlar bazasini tuzish va tuzatish jarayoni
Tavsiya etilgan ma'lumotlar amaliy tajriba va adabiyotlarni ko'rib chiqishdan ma'lumotlar bazasining veb-nashrlariga qadar bo'lgan jarayonni o'z ichiga olishi mumkin[14]

Bashoratli ma'lumotlar bazalari

Bashoratli ma'lumotlar bazasi - bu statistik xulosaga asoslangan ma'lumotlar bazasi. Bunday xulosaga alohida yondashuv bashoratli xulosa deb nomlanadi, ammo bashorat statistik xulosaga bir nechta yondashuvlardan birida amalga oshirilishi mumkin. Darhaqiqat, biostatistikaning tavsiflaridan biri shundaki, u genetik populyatsiya namunasi haqidagi bilimlarni butun aholiga etkazish vositasini taqdim etadi (genomika ) va boshqa tegishli genlarga yoki genomlarga, bu vaqt o'tishi bilan bashorat qilish shart emas.[15] Axborot vaqt o'tishi bilan, ko'pincha ma'lum vaqt nuqtalariga uzatilganda, jarayon bashorat qilish deb nomlanadi. Ushbu toifada ko'rib chiqilishi mumkin bo'lgan ma'lumotlar bazalarining uchta asosiy namunalariga quyidagilar kiradi: Sichqoncha genomlari ma'lumotlar bazasi (MGD), Rat genom ma'lumotlar bazasi (RGD), OMIM va Ensembl-dan SIFT vositasi.[1]

Sichqoncha genomining ma'lumotlar bazasi (MGD)

Sichqoncha genomining ma'lumotlar bazasi (MGD) laboratoriya sichqonchasi haqida yaxlit genetik, genomik va biologik ma'lumotlar uchun xalqaro hamjamiyat manbai hisoblanadi. MGD fenotiplar va odam kasalliklari assotsiatsiyasining sichqon modellari (genotiplar) uchun to'liq izohini beradi, bu sutemizuvchilar fenotipi ontologiyasi va OMIM kasalliklari nomlari.[16]

Rat Genom ma'lumotlar bazasi (RGD)

RGD
Tarkib
TavsifThe Rat Genom ma'lumotlar bazasi
OrganizmlarRattus norvegicus (kalamush)
Aloqa
Ilmiy-tadqiqot markaziViskonsin tibbiyot kolleji
LaboratoriyaInson molekulyar va genetika markazi
MualliflarMeri E. Shimoyama, tibbiyot fanlari nomzodi; Xovard J. Jeykob, tibbiyot fanlari nomzodi
Birlamchi iqtibosPMID  25355511
Kirish
Veb-saytrgd.mcw.edu
URLni yuklab olishRGD ma'lumotlarini chiqarish

The Rat Genom ma'lumotlar bazasi (RGD) kalamush genetik va genomik tadqiqotlar bilan shug'ullanadigan etakchi tadqiqot muassasalari o'rtasida hamkorlikda harakat sifatida boshlandi. Sichqoncha tadqiqotchilar tomonidan kasallik biologiyasi va patofizyologiyasini o'rganish uchun namuna organizm sifatida keng qo'llanilmoqda. So'nggi bir necha yil ichida kalamushlarning genetik va genomik ma'lumotlari tez sur'atlarda o'sib bormoqda.[17] Ushbu ma'lumot portlashi butun dunyo bo'ylab tadqiqotchilarga ushbu ma'lumotlarning kalamushka asoslangan ko'rinishini samarali va samarali ravishda to'plash, boshqarish va tarqatish uchun markazlashtirilgan ma'lumotlar bazasiga ehtiyoj borligini ta'kidladi. Rat Genom ma'lumotlar bazasi kalamushlarning genetik va genomik ma'lumotlari, shuningdek xaritalash, shtamm va fiziologik ma'lumotlarning ombori sifatida xizmat qilish uchun yaratilgan. Shuningdek, ushbu ma'lumotlarni qidirish, qazib olish va bashorat qilish vositalarini taqdim etish orqali tergovchilar tadqiqotlarini osonlashtiradi.[17]

Kasallik genlarini tekshiradigan tadqiqotchilar uchun foydali bo'lgan RGD ma'lumotlariga kalamush, sichqon va odam genlari uchun kasallik izohlari kiradi. Izohlar adabiyotdan qo'lda tuziladi yoki boshqa kasalliklar bilan bog'liq ma'lumotlar bazalaridan avtomatlashtirilgan quvur liniyalari orqali yuklab olinadi. Yuklab olingan izohlar ma'lumotlar to'plami bo'yicha izchillikni ta'minlash uchun qo'lda izohlash uchun ishlatilgan kasallik lug'atiga mos keladi. RGD shuningdek, kalamush uchun kasallik bilan bog'liq miqdoriy fenotip ma'lumotlarini saqlaydi (PhenoMiner).[18]

Insonda Onlayn Mendel merosi (OMIM )

Insonda Onlayn Mendel merosi
Tarkib
TavsifOMIM - bu inson genlari va genetik fenotiplari to'plamidir.
OrganizmlarInson (H. Sapiens)
Aloqa
Ilmiy-tadqiqot markaziNCBI
Birlamchi iqtibosPMID  25398906
Kirish
Veb-saytwww.ncbi.nlm.nih.gov/ omim

NCBI tomonidan qo'llab-quvvatlanadigan "Onlayn Mendelian Inheritance in Man" (OMIM) - bu ma'lum bo'lgan barcha kasalliklarni genetik komponent bilan kataloglaydigan va ularning inson genomidagi tegishli genlar bilan aloqalarini bashorat qiladigan ma'lumotlar bazasi va keyingi tadqiqotlar uchun ma'lumotnomalar va genomik tahlil qilish vositalari. kataloglangan gen.[19] OMIM - inson genlari va genetik fenotiplarning har kuni taqdim etiladigan keng qamrovli, obro'li kompendiumi. Ma'lumotlar bazasi tegishli ma'lumotni meros qilib olingan sharoitlarga bashorat qilish uchun manba sifatida ishlatilgan.[19]

A Pathway Hogeneity
Yo'lning bir xilligi va shunga o'xshash genlar Kasalliklarning turli xil genlar bilan katta aloqasi borligi kontseptsiyasini ko'rsatib, bitta kasallikning o'rtacha bir xilligi va tasodifiy tekshiruvlar har bir kasallik uchun bog'liq bo'lgan gen mahsulotlarining soni bo'yicha to'rtta tarmoq uchun belgilanadi. Ushbu grafik 4 xil ma'lumotlar bazalarida ko'plab kasalliklarni va muvofiqlikni o'zaro bog'lash qanchalik qiyinligini ko'rsatadi, shuning uchun gen kasalliklari ma'lumotlar bazalari ushbu munosabatlarni sinab ko'rmoqda

Ensembl SIFT vositasi

Ensembl genom ma'lumotlar bazasi loyihasi.
Ensembl release58 sgcb screenshot.png
Tarkib
TavsifAnsambl
Aloqa
Ilmiy-tadqiqot markazi
Birlamchi iqtibosXabard, va boshq. (2002)[20]
Kirish
Veb-saytwww.ensembl.org

Bu barcha genomik va genetik tadqiqotlar uchun mavjud bo'lgan eng katta manbalardan biri bo'lib, u genetiklar, molekulyar biologlar va o'z turlarimiz va boshqa umurtqali hayvonlar genetikasini o'rganadigan va kasallik organizmlarini modellashtiradigan boshqa tadqiqotchilar uchun markazlashtirilgan manbadir. Ansambl genomik kasallik haqida ma'lumot olish uchun taniqli genom brauzerlaridan biridir. Ensembl variatsiya ma'lumotlarini turli xil manbalardan import qiladi, Ensembl variantlarning ta'sirini bashorat qiladi.[21] Yo'naltiruvchi genomga mos keladigan har bir o'zgarish uchun har bir Ensembl transkripsiyasi o'zgarganligi bilan mos keladigan aniqlanadi. Keyin har bir allelning transkriptga ta'sirini taxmin qilish uchun qoidalarga asoslangan yondashuvdan foydalaniladi. Sequence Ontology (SO) tomonidan belgilangan natijalar atamalari to'plami hozirda allel va transkriptning har bir birikmasiga berilishi mumkin. Har bir o'zgaruvchan har bir allel turli xil transkriptlarda boshqacha ta'sir ko'rsatishi mumkin. Ensembl ma'lumotlar bazasida inson mutatsiyalarini bashorat qilish uchun turli xil vositalardan foydalaniladi, ulardan biri SIFT bo'lib, aminokislota almashinuvi ketma-ket homologiya va fizik-kimyoviy o'xshashlik asosida protein funktsiyasiga ta'sir qilishi mumkinligini taxmin qiladi. muqobil aminokislotalar. Har bir aminokislotani almashtirish uchun berilgan ma'lumotlar ball va sifatli bashorat ("toqatli" yoki "zararli"). Skor aminokislotalarning o'zgarishiga toqat qilinadigan normallashtirilgan ehtimollikdir, shuning uchun 0 ga yaqin ballar zararli bo'lishi mumkin. Sifatli bashorat shu baldan kelib chiqadiki, <0,05 ball bilan almashtirishlar «zararli», qolganlari esa «bardoshli» deb nomlanadi. SIFT fenotip xarakteristikalarida munosabatlarni o'rnatishga olib keladigan tabiiy ravishda noma'lum polimorfizmlarga va laboratoriya tomonidan olib boriladigan missens mutatsiyalarga qo'llanilishi mumkin, proteomika va genomika.[21]

Adabiyot ma'lumotlar bazalari

Ushbu turdagi ma'lumotlar bazalari kitoblar, maqolalar, kitoblarga obzorlar, dissertatsiyalar va gen kasalliklari haqidagi ma'lumotlar bazalariga izohlarni umumlashtiradi. Quyidagilardan ba'zilari ushbu turdagi misollar: GAD, LGHDN va BeFree Data.

Genetik assotsiatsiya ma'lumotlar bazasi (GAD)

Genetik assotsiatsiya ma'lumotlar bazasi - bu insonning genetik assotsiatsiyasining murakkab kasalliklarni o'rganish arxivi. GAD birinchi navbatda OMIMda uchraydigan kam uchraydigan mendel kasalliklari emas, balki odamning umumiy murakkab kasalliklari to'g'risidagi ma'lumotlarni arxivlashga qaratilgan. Unda nomzod geni va genomining keng assotsiatsiyasi tadqiqotlari (pe) tomonidan ko'rib chiqilgan jurnallarda chop etilgan maqolalardan olingan xulosali xulosalar (GWAS ).[22] GAD 2014 yil 1 sentyabrdan muzlatilgan, ammo uni yuklab olish mumkin.[23]

Adabiyotdan kelib chiqqan inson geni kasalliklari tarmog'i (LHGDN)

Adabiyotdan kelib chiqqan inson geni kasalliklari tarmog'i (LHGDN) - bu bir nechta biomolekulyar sharoitlarga bog'liq ravishda gen kasalliklari assotsiatsiyasini ajratish va tasniflashga qaratilgan matnli qazib olishdan olingan ma'lumotlar bazasi. Matn qiziqish manbasidan genetik kasalliklar semantik munosabatlarini ajratib olish uchun mashinada o'rganishga asoslangan algoritmdan foydalaniladi. Bu Germaniyaning Myunxen shahridagi LMU bilan bog'liq bo'lgan hayotiy ma'lumotlarning bir qismidir.[1]

BeFree ma'lumotlar

BeFree tizimi yordamida MEDLINE referatidan gen kasalliklari assotsiatsiyasini ajratib oladi. BeFree kasalliklarni va genlarni aniqlash uchun biomedikal Named Entity Recognition (BioNER) moduli va morfosintaktik ma'lumotlarga asoslangan aloqalarni chiqarish modulidan iborat.[24]

Integral ma'lumotlar bazalari

Ushbu turdagi ma'lumotlar bazalari Mendeliyani, birikma va atrof-muhit kasalliklarini gen-kasallik assotsiatsiyasining yaxlit arxiviga kiritadi va modullik tushunchasi ularning barchasi uchun amal qilishini ko'rsatadi. Ular yangi biologik tushunchalar bo'lgan taqdirda kasalliklarning funktsional tahlilini o'tkazadilar. gen-kasallik assotsiatsiyasining har birini mustaqil ravishda ko'rib chiqishda topilgan. Shuning uchun ular giyohvand moddalar kabi genetik va atrof-muhit omillari kasalliklarga qanday ta'sir qilishini o'rganish uchun mos asoslarni taqdim etadilar. Ushbu turdagi ma'lumotlar bazasi uchun eng yaxshi misol DisGeNET.[8][25]

DisGeNET gen kasalliklari assotsiatsiyasining ma'lumotlar bazasi

DisGeNET
Tarkib
TavsifInsonning gen-kasallik assotsiatsiyasini birlashtiradi
Ma'lumot turlari
qo'lga olindi
Uyushmalar ma'lumotlar bazasi
OrganizmlarInson (H. Sapiens)
Aloqa
Ilmiy-tadqiqot markaziBiomedikal informatika bo'yicha tadqiqot dasturi (GRIB) IMIM-UPF
LaboratoriyaIntegrativ biomedikal informatika guruhi
MualliflarFerran Sanz va Laura I. Furlong (Pinero va boshq, 2015)
Birlamchi iqtibosPMID  25877637
Kirish
Veb-saytwww.disgenet.org
Turli xil
Ma'lumotlarni chiqarish
chastota
yillik
Versiya3

DisGeNET bu kasalliklarning turli xil biotibbiyot jihatlarini qamrab oladigan bir necha manbalardan assotsiatsiyalarni birlashtirgan gen-kasalliklar assotsiatsiyasining to'liq ma'lumotlar bazasi.[25] Xususan, u insonning genetik kasalliklari, shu jumladan Mendeliya, murakkab va atrof-muhit kasalliklari haqidagi hozirgi bilimlarga yo'naltirilgan. Odamlar kasalliklarining modulligi tushunchasini baholash uchun ushbu ma'lumotlar bazasi tarmoq genologiyasi va funktsional annotatsiya tahlili yordamida inson gen-kasalliklari tarmoqlarining paydo bo'ladigan xususiyatlarini muntazam o'rganib chiqadi.[1] Natijalar odam kasalliklarining umumiy genetik kelib chiqishini ko'rsatadi va ko'p kasalliklarda, shu jumladan Mendeliyada murakkab va atrof-muhit kasalliklarida funktsional modullar mavjudligini ko'rsatadi. Bundan tashqari, biologik yo'llarning asosiy to'plami odamlarning ko'pgina kasalliklari bilan bog'liqligi aniqlandi. O'qish paytida shunga o'xshash natijalarni olish klasterlar Ushbu ma'lumotlar bazasidagi topilmalar hujayralardagi keng tarqalgan biologik jarayonlarning buzilishi sababli kasalliklarning paydo bo'lishi mumkinligini ko'rsatadi. Ushbu birlashtirilgan ma'lumotlar bazasining tarmoq tahlili shuni ko'rsatadiki, inson kasalliklari genetik manzarasi to'g'risida keng qamrovli fikr olish uchun ma'lumotlar integratsiyasi zarur va murakkab kasalliklarning genetik kelib chiqishi kutilganidan ancha keng tarqalgan.[1]

DisGeNET gen-kasallik assotsiatsiyasi ontologiyasi
Ushbu ontologiyada har bir assotsiatsiya turining tavsifi quyidagicha: # Terapevtik assotsiatsiya: Gen / oqsil kasallikning meliorativ holatida terapevtik rolga ega. #Biomarker assotsiatsiyasi: Gen / oqsil yoki kasallikning etiologiyasida rol o'ynaydi (masalan, kasallikka olib keladigan molekulyar mexanizmda ishtirok etadi) yoki kasallik uchun biomarker hisoblanadi. #Genetik o'zgaruvchanlik assotsiatsiyasi: ketma-ketlik o'zgarishi (mutatsiya, SNP) kasallik fenotipi bilan bog'liq bo'lsa ishlatiladi, ammo bu o'zgarishni kasallikka olib keladi degan dalil hali ham mavjud emas. Ba'zi hollarda variantlarning mavjudligi kasallikka moyillikni oshiradi. Umuman olganda, NCBI SNP identifikatorlari taqdim etiladi. # O'zgargan ifoda assotsiatsiyasi: Genning o'zgargan ekspressioni orqali oqsil funktsiyasining o'zgarishi kasallik fenotipi bilan bog'liq. # Tarjimadan keyingi modifikatsiya assotsiatsiyasi: Translyatsiyadan keyingi modifikatsiyalar yordamida oqsil funktsiyasining o'zgarishi (oqsilning metilatsiyasi yoki fosforillanishi) kasallik fenotipi bilan bog'liq. [1]

Ba'zilar ishlardan foydalanadilar

Gen-Kasallik ma'lumotlar bazalarini ishlatadigan ba'zi qiziqarli holatlarni quyidagi hujjatlarda topishingiz mumkin:[1][8]

Gen kasalliklari ma'lumotlar bazalarida kelajak haqida eslatmalar

Gen kasalliklarida munosabatlar

Odam genomining tugallanishi kasallik genlarini izlash usulini o'zgartirdi. Ilgari, bir vaqtning o'zida bir yoki bir nechta genlarga e'tibor qaratish kerak edi. Endi DisGeNET kabi loyihalar bitta yoki bir nechta kasalliklarga chalingan barcha genlarning o'zgarishini tizimli ravishda tahlil qilish bo'yicha harakatlarni misol qilib keltiradi.[26] Keyingi qadam kasalliklarning mexanistik jihatlari va ularga qarshi dorilarning dizayni haqida to'liq tasavvur hosil qilishdir. Buning uchun ikkita yondashuvning kombinatsiyasi zarur bo'ladi: har bir genni muntazam ravishda izlash va chuqur o'rganish.Bu sohaning kelajagi turli xil manbalardan olingan katta hajmli ma'lumotlarni birlashtirish va funktsional ma'lumotlarni o'z ichiga olgan yangi usullar bilan belgilanadi. bioinformatik tadqiqotlar natijasida hosil bo'lgan keng ko'lamli ma'lumotlarni tahlil qilish.[1]

Bioinformatika - bu o'zlarining metodologiyasining bir qismi sifatida kompyuter dasturlarini ishlatadigan biologik gen kasalliklarini o'rganish uchun atamadir, shuningdek, qayta-qayta ishlatiladigan, xususan genetika va genomika sohalarida aniq tahlil o'tkazgichlariga havola.[1] Bioinformatikaning keng tarqalgan qo'llanilishiga nomzod genlar va nukleotidlarni aniqlash kiradi, SNPlar. Ko'pincha, bunday identifikatsiya kasallikning genetik asoslarini, noyob moslashuvlarini, kerakli xususiyatlarini yoki populyatsiyalar o'rtasidagi farqlarni yaxshiroq anglash maqsadida amalga oshiriladi. Kamroq rasmiy ravishda bioinformatika nuklein kislota va oqsillar ketma-ketligi ichidagi tashkiliy tamoyillarni tushunishga harakat qiladi.[1]

Bioinformatikaning yangi eksperimental texnikaga javobi eksperimental ma'lumotlarni tahlil qilishda yangi istiqbolni keltirib chiqaradi, buni gen kasalliklari ma'lumotlar bazalari va boshqa texnologiyalardan olingan ma'lumotlarni tahlil qilishda erishilgan yutuqlar ko'rsatmoqda. Ushbu tendentsiya yangi texnologiyalarga javob berish uchun yangi yondashuvlar bilan davom etishi kutilmoqda, masalan, yangi avlod ketma-ketligi texnologiyalari. Masalan, ko'p sonli individual genomlarning mavjudligi noyob variantlarni hisoblash tahlillarini ishlab chiqishga, shu jumladan ularning turmush tarzi, giyohvand moddalar bilan o'zaro aloqalari va boshqa omillarga nisbatan statistik ma'lumotlarni ishlab chiqishga yordam beradi.[1]Biotibbiy tadqiqotlar, shuningdek, mavjud va doimiy ravishda ishlab chiqarilgan biomedikal ma'lumotlarning katta qismini samarali ravishda qazib olish qobiliyatimizga bog'liq bo'ladi. Matnni qazib olish texnikasi, xususan, boshqa molekulyar ma'lumotlar bilan birlashganda, gen mutatsiyalari va o'zaro ta'sirlari to'g'risida ma'lumot berishi mumkin va biotibbiyot tadqiqotlarida hosil bo'lgan ma'lumotlarning ekspansional o'sishidan oldinda qolish uchun juda muhimdir. Molekulyar, klinik va dori-darmonlarni tahlil qilishda kon qazish va integratsiyalashuv yutuqlaridan foydalanadigan yana bir yo'nalish bu farmakogenomika. Silikonda odamlarning o'zgarishi va ularning kasalliklarga ta'siri o'rtasidagi munosabatlarni o'rganish shaxsiy tibbiyotni rivojlantirishda muhim ahamiyatga ega.[8]Xulosa qilib aytganda, gen kasalliklari bo'yicha ma'lumotlar bazalari allaqachon kasallik genlarini izlashni o'zgartirgan va tibbiy tadqiqotlarning boshqa yo'nalishlarining hal qiluvchi qismiga aylanish imkoniyatiga ega.[1]

Shuningdek qarang

Adabiyotlar

  1. ^ a b v d e f g h men j k l m n A. Bauer-Mehren, "Gen-Kasallik tarmog'ini tahlil qilish funktsional modullarni ochib beradi Mendelian, Murakkab va ekologik kasalliklar, "PLOS One, 2011 yil 1-3 betlar.
  2. ^ a b Botstein, D (2003). "Inson fenotiplari asosidagi genotiplarni kashf etish: Mendeliyalik kasalliklari uchun o'tgan yutuqlar, murakkab kasalliklarga kelajakdagi yondashuvlar". Tabiat genetikasi. 33 (1): 228–237. doi:10.1038 / ng1090. PMID  12610532.
  3. ^ Wren JD, Bateman A (2008). "Ma'lumotlar bazalari, ma'lumotlar qabrlari va shamoldagi chang". Bioinformatika. 24 (19): 2127–8. doi:10.1093 / bioinformatics / btn464. PMID  18819940.
  4. ^ Amerika tibbiyot informatika assotsiatsiyasi, "Amerika tibbiyot informatika assotsiatsiyasining strategik rejasi", 2011 yil avgust. [Onlayn]. Mavjud: http://www.amia.org/inside/stratplan/. [Kirish 2014 yil 15-oktabr].
  5. ^ Oti, M (2007). "Genetik kasalliklarning modulli tabiati". Klinik genetika. 71 (1): 1–11. doi:10.1111 / j.1399-0004.2006.00708.x. PMID  17204041.
  6. ^ Devis, A .; King, B. (2011). "Toksikogenomikaning qiyosiy ma'lumotlar bazasi: yangilanish 2011". Nuklein kislotalari rez. 39 (1): 1067–1072. doi:10.1093 / nar / gkq813. PMC  3013756. PMID  20864448.
  7. ^ Devis, A .; Wiegers, T. (2013). "Matnni qazib olish taqqoslanadigan toksikogenomika ma'lumotlar bazasida kimyoviy-gen kasalliklarini davolashni yaxshilash bo'yicha adabiyotlarni samarali ravishda baholaydi va baholaydi". PLOS One. 8 (4): 1–29. Bibcode:2013PLoSO ... 858201D. doi:10.1371 / journal.pone.0058201. PMC  3629079. PMID  23613709.
  8. ^ a b v d Bauer-Mehren, A .; Rautscha, M. (2010). "DisGeNET: gen kasalliklari tarmoqlarini tasavvur qilish, integratsiya qilish, qidirish va tahlil qilish uchun sitoskop plagini". Bioinformatika. 26 (22): 2924–2926. doi:10.1093 / bioinformatics / btq538. PMID  20861032.
  9. ^ Vogt, I. (2014). "Sutemizuvchilar bezovtalanishida organlar tizimi fenotiplariga ta'sir qiluvchi gen xususiyatlarini tizimli tahlil qilish". Bioinformatika. 30 (21): 3093–3100. doi:10.1093 / bioinformatika / btu487.
  10. ^ a b Buneman, P. (2008). "Tayyorlangan ma'lumotlar bazalari". Bibliometriya. 978 (1): 152–162.
  11. ^ a b Merfi, C .; Devis, A. (2009). "Toksikogenomikaning qiyosiy ma'lumotlar bazasi: kimyoviy-gen-kasallik tarmoqlari uchun bilimlar bazasi va kashfiyot vositasi". Bioinformatika. 37 (1): 786–792. doi:10.1093 / nar / gkn580. PMC  2686584. PMID  18782832.
  12. ^ "Umumiy oqsil resurslari (UniProt)". Nuklein kislotalarni tadqiq qilish. 36 (1): 190–195. 2008. doi:10.1093 / nar / gkm895. PMC  1669721. PMID  18045787.
  13. ^ Uniprot, C. (2010). "Universal Protein Resursidagi doimiy va kelajakdagi o'zgarishlar". Nuklein kislotalarni tadqiq qilish. 39 (Ma'lumotlar bazasi muammosi): D214-D219. doi:10.1093 / nar / gkq1020. PMC  3013648. PMID  21051339.
  14. ^ K. Braun, "Insonlarning o'zaro ta'sirining onlayn bashorat qilingan ma'lumotlar bazasi" Bioinformatika, vol. 21, yo'q. 9, 2076-2082, 2005 yil.
  15. ^ S. Hunter va P. Jons, "InterPro 2011 yilda: oila va domenni bashorat qilish ma'lumotlar bazasidagi yangi o'zgarishlar" Nuklein kislotalarni tadqiq qilish, vol. 10, yo'q. 1, 12-22 betlar, 2011 yil
  16. ^ C. Bult va J. Eppig, "Sichqoncha genomining ma'lumotlar bazasi (MGD): sichqon biologiyasi va model tizimlari" Nuklein kislotalarni tadqiq qilish, vol. 36, yo'q. 1, 724-728-betlar, 2007 y
  17. ^ a b M. Dvinell, E. Vorthey va S. M, "Rat genom ma'lumotlar bazasi 2009: variatsiya, ontologiya va yo'llar". Nuklein kislotalarni tadqiq qilish, vol. 37, yo'q. 1, 744-749-betlar, 2009 y
  18. ^ Shimoyama M, De Pons J, Xeyman GT va boshq. (2015). "Rat Genom ma'lumotlar bazasi 2015: genomik, fenotipik va atrof-muhit o'zgarishlari va kasalliklar". Nuklein kislotalarni tadqiq qilish. 43 (Ma'lumotlar bazasi muammosi): D743–50. doi:10.1093 / nar / gku1026. PMC  4383884. PMID  25355511.
  19. ^ a b A. Xomosh, "Odamdagi onlayn Mendelian merosi (OMIM), inson genlari va genetik kasalliklarning bilim bazasi" Nuklein kislotalarni tadqiq qilish, vol. 33, yo'q. 1, 514-517-betlar, 2005 yil
  20. ^ Xabard T va boshq. (2002 yil yanvar). "Ensembl genom ma'lumotlar bazasi loyihasi". Nuklein kislotalarni tadqiq qilish. 30 (1): 38–41. doi:10.1093 / nar / 30.1.38. PMC  99161. PMID  11752248. Olingan 11 noyabr 2014.
  21. ^ a b P. Flicek va M. Ridvan, "Ensembl 2012", Nuklein kislotalarni tadqiq qilish, vol. 40, yo'q. 1, 84-90-betlar, 2012 yil
  22. ^ Beker, K .; Barns, K. (2004). "Genetik assotsiatsiya ma'lumotlar bazasi". Tabiat genetikasi. 36 (5): 431–432. doi:10.1038 / ng0504-431. PMID  15118671.
  23. ^ https://geneticassociationdb.nih.gov/
  24. ^ Bravo, A; va boshq. (2014). "Matndan genlar va kasalliklar o'rtasidagi munosabatlarni ajratish va ma'lumotlarning keng ko'lamli tahlili: tarjima tadqiqotlari uchun natijalar". BMC Bioinformatika. 16 (1): 55. doi:10.1186 / s12859-015-0472-9. PMC  4466840. PMID  25886734.
  25. ^ a b Piñero; va boshq. (2015). "DisGeNET: inson kasalliklari va ularning genlarini dinamik ravishda o'rganish uchun kashfiyot platformasi". Ma'lumotlar bazasi. 2015: bav028. doi:10.1093 / ma'lumotlar bazasi / bav028. PMC  4397996. PMID  25877637.
  26. ^ Oti, M (2006). "Protein-oqsil o'zaro ta'siridan foydalangan holda kasallik genlarini bashorat qilish". J. Med. Genet. 43 (8): 691–698. doi:10.1136 / jmg.2006.041376. PMC  2564594. PMID  16611749.