Velvet montajchisi - Velvet assembler

Velvet montajchisi
Tuzuvchi (lar)Daniel Zerbino,[1] Evan Birni
Dastlabki chiqarilish2008
Barqaror chiqish
1.2.10
Operatsion tizimUnixga o'xshash
Mavjud:C
TuriBioinformatika
LitsenziyaGPL
Veb-saytwww.ebi.ac.uk/ ~ zerbino/ baxmal/

Velvet bilan ishlashga mo'ljallangan algoritm to'plamidir de novo genom yig'ilishi va qisqa o'qish hizalamalar ketma-ketligi. Bunga manipulyatsiya orqali erishiladi de Bruijn grafikalari xatolarni olib tashlash va takrorlanadigan mintaqalarni soddalashtirish orqali genomik ketma-ketlikni yig'ish uchun.[2] Velvet shuningdek, tijorat paketlarida, masalan Sequencher, Saxiy, MacVector va BioNumerics.

Kirish

Ning rivojlanishi keyingi avlod sekvensiyalari (NGS) juda qisqa o'qish tartibida iqtisodiy samaradorlikni oshirishga imkon berdi. Hizalama usuli sifatida de Bruijn grafikalarini manipulyatsiyasi yanada aniqroq bo'ldi, ammo xatolar va takrorlanishlar bilan bog'liq muammolarni hal qilish uchun qo'shimcha rivojlanish zarur edi.[3] Bu Daniel Zerbino va "Velvet" ning rivojlanishiga olib keldi Evan Birni da Evropa bioinformatika instituti Buyuk Britaniyada.[4]

Velvet de Bruijn grafikalarini samarali ravishda manipulyatsiya qilish orqali soddalashtirish va siqish orqali, grafik ma'lumotlarini yo'qotmasdan, kesishmaydigan yo'llarni bitta tugunlarga aylantirish orqali ishlaydi. Xatolarni yo'q qiladi va takroriylikni birinchi navbatda ketma-ketlikni birlashtirgan xatolarni tuzatish algoritmi yordamida hal qiladi. So'ngra takroriy ketma-ketlikdan ketma-ketlik olib tashlanadi, bu mahalliy bir-biriga mos keladigan yo'llarni ajratib turadi.

Qisqa o'qish va o'qish juftlarining kombinatsiyasi "Velvet" ga kichik takrorlanishlarni hal qilishga va ishlab chiqarishga imkon beradi qo'shni o'rtacha uzunlik. Velvetning ushbu ilovasi a bilan birikma hosil qilishi mumkin N50 juftlik uchida uzunligi 50 kb prokaryotik ma'lumotlar va mintaqalar uchun uzunligi 3 kb sutemizuvchi ma'lumotlar.

Algoritm

Yuqorida aytib o'tilganidek, Velvet qisqa o'qishlarni yig'ish uchun de Bruijn grafikasidan foydalanadi. Aniqrog'i Velvet har birining o'ziga xosligini anglatadi k-mer grafadagi noyob tugun orqali o'qishdan olingan. Agar uning k-mersida k-1 ustma-ust tushgan bo'lsa, ikkita tugun ulanadi. Boshqacha qilib aytganda, A tugunidan B tugunigacha yoy mavjud bo'lsa, agar A tomonidan ko'rsatilgan k-merning oxirgi k-1 belgilari, B tomonidan ko'rsatilgan k-merning birinchi k-1 belgilar bo'lsa, quyidagi rasmda ko'rsatilgan Velvet bilan yaratilgan de Bruijn grafigiga misol:

1-rasm: O'qishni xeshlash va tegishli Bruijn grafigiga misol

Xuddi shu jarayon bir vaqtning o'zida teskari to‘ldiruvchi Qarama-qarshi chiziqlar o'qilishi orasidagi o'zaro bog'liqliklarni hisobga olish uchun barcha k-merslardan iborat bo'lib, soddalashtirish va xatolarni yo'q qilishni o'z ichiga olgan grafada bir qator optimallashtirishlarni amalga oshirish mumkin.

Soddalashtirish

Xotira xarajatlarini tejashning oson usuli bu grafada hosil qilingan yo'lga ta'sir qilmaydigan tugunlarni birlashtirishdir, ya'ni har doim A tugunida B tuguniga ishora qiluvchi bitta chiqadigan yoy bo'lsa, faqat bitta kiruvchi yoy bilan tugunlarni birlashtirish mumkin. . Ikkala tugunni ham, ularni va ularning barcha ma'lumotlarini birlashtirib, bitta sifatida ko'rsatish mumkin. Keyingi rasm ushbu jarayonni dastlabki misolni soddalashtirishda aks ettiradi.

2-rasm: Soddalashtirilgan de Bryuyn grafigi

Olib tashlashda xatolik yuz berdi

Grafikdagi xatolar ketma-ketlik jarayoni natijasida kelib chiqishi mumkin yoki shunchaki biologik namunada ba'zi xatolar bo'lishi mumkin (masalan.) polimorfizmlar ). Velvet uch xil xatolarni tan oladi: maslahatlar; pufakchalar; va noto'g'ri ulanishlar.

Maslahatlar

Tugun uchi hisoblanadi va uni uchlaridan birida uzib qo'yilsa, tugunda saqlanadigan ma'lumot uzunligi 2k dan kam bo'lsa va ushbu tugunga olib boruvchi kamon ko'p sonli bo'lsa ( boshq grafikni qurish paytida topilgan) va natijada boshqa muqobil yo'llar bilan taqqoslab bo'lmaydi. Ushbu xatolar olib tashlanganidan so'ng, grafik yana bir bor soddalashtiriladi.

3-rasm: Maslahatlar namunasi

Pufakchalar

Ko'piklar ikkita aniq yo'l bir xil tugunlarda boshlanib tugaganda hosil bo'ladi. Odatda pufakchalar xatolar yoki biologik variantlardan kelib chiqadi. Ushbu xatolar a ga o'xshash Tour Bus algoritmi yordamida o'chiriladi Dijkstra algoritmi, a kenglik bo'yicha birinchi qidiruv bu eng yaxshi yo'lni aniqlaydi va qaysi birini yo'q qilish kerakligini belgilaydi. Oddiy misol 4-rasmda keltirilgan.

4-rasm: Ko'pikni o'chirish misoli

Ushbu jarayon 1 va 2-rasmlarda keltirilgan misollardan keyin 5-rasmda ham ko'rsatilgan.

5-rasm: qabariqni aniqlash misoli

Xato ulanishlar

Bu to'g'ri yo'llarni yaratmaydigan yoki grafada taniqli tuzilmalarni yaratmaydigan ulanishlar. Velvet Tour Bus algoritmi tugagandan so'ng, foydalanuvchi tomonidan belgilanishi kerak bo'lgan oddiy qoplama chegarasini qo'llagan holda ushbu xatolarni o'chirib tashlaydi.

Velvet buyruqlari

Velvet quyidagi funktsiyalarni ta'minlaydi:

velvet
Ushbu buyruq kadife uchun ma'lumotlar to'plamini yaratishga yordam beradi (o'qilganlarni xeshga qo'shadi) va har bir ketma-ketlik fayllarining ma'nosi haqida ma'lumotlarni o'z ichiga oladi.
baxmal
Ushbu buyruq de-Bruijn grafigini velvet orqali olingan k-mersdan tuzadi va grafada soddalashtirish va xatolarni tuzatishni amalga oshiradi. Keyin u tutashganlarni chiqaradi.

Velvetg ishlagandan so'ng bir qator fayllar yaratiladi. Eng muhimi, kontiglar fayli 2k dan uzun tutashgan ketma-ketliklarni o'z ichiga oladi, bu erda k - velvetda ishlatiladigan so'z uzunligi.

Batafsil ma'lumot va misollar uchun Velvet qo'llanmasi [5]

Motivatsiya

Hozirgi DNK sekvensiya texnologiyalari, shu jumladan NGS cheklangan genomlar har qanday o'qish uzunligidan ancha katta. Odatda, NGS kichik o'qish bilan ishlaydi, 400 bp dan kam va o'qish narxi avvalgisiga nisbatan ancha past birinchi avlod mashinalari. Bundan tashqari, yuqori parallel ishlash va yuqori rentabellik bilan ishlash osonroq.[3]

Shu bilan birga, qisqa o'qishlar kattaroq o'qishlarga qaraganda kamroq ma'lumotni o'z ichiga oladi, shuning uchun bir-birining aniqlanishiga imkon berish uchun yuqori o'qishni qamrab olishni talab qiladi. Bu o'z navbatida ketma-ketlikning murakkabligini oshiradi va hisoblash talablarini sezilarli darajada oshiradi. Ko'proq o'qishlar soni bir-biriga mos keladigan grafik hajmini oshiradi, bu esa hisoblashni qiyinlashtiradi va uzoqlashtiradi. O'qishlar orasidagi bog'lanishlar noaniq bo'lib, bir-birining ustiga chiqadigan qismlarning kamayishi tufayli xatolar ehtimoli katta bo'ladi.

Ushbu muammolarni bartaraf etish uchun samarali, yuqori iqtisodiy samaradorlikka ega va xatolar va takrorlanishlarni bartaraf etishga qodir bo'lgan dinamik ketma-ketlik dasturlari ishlab chiqildi. Velvet algoritmlari shu uchun ishlab chiqilgan bo'lib, ular nisbatan qisqa hisoblash vaqtlarida va boshqa montajchilarga nisbatan kamroq xotira sarfida qisqa o'qish tartibini moslashtirishni amalga oshirishga qodir.[6]

Grafik interfeys

Velvetni ishlatishda asosiy kamchiliklardan biri bu buyruq qatori interfeysidan foydalanish va foydalanuvchilar, ayniqsa yangi boshlanuvchilar o'zlarining ma'lumotlarini amalga oshirishda duch keladigan qiyinchiliklardir. Velvet assembler uchun grafik foydalanuvchi interfeysi 2012 yilda ishlab chiqilgan va ushbu muammoni bartaraf etish va Velvet ishini soddalashtirish uchun mo'ljallangan.[7].

Shuningdek qarang

Adabiyotlar

  1. ^ Zerbino, D. R. (2010). "Velvetde novo-dan foydalanish Yig'uvchi qisqa o'qiladigan ketma-ketlik texnologiyalari uchun ". Andreas D. Baxevanisda (tahrir). Qisqa o'qiladigan ketma-ketlik texnologiyalari uchun Velvet de novo assembleridan foydalanish. 11.5-birlik. doi:10.1002 / 0471250953.bi1105s31. ISBN  0471250953. PMC  2952100. PMID  20836074.
  2. ^ Zerbino, D. R .; Birney, E. (2008). "Velvet: de novo assambleyasi juda qisqa o'qishlar yordamida". Qabul qilingan 2013-10-18.
  3. ^ a b Miller, J. R .; Koren, S; Satton, G (2010). "Keyingi avlod ma'lumotlarini ketma-ketligini yig'ish algoritmlari". Genomika. 95 (6): 315–27. doi:10.1016 / j.ygeno.2010.03.001. PMC  2874646. PMID  20211242.
  4. ^ Zerbino, D. R .; Birni, E. (2008). "Velvet: de Bruijn grafikalari yordamida de novo qisqa o'qiladigan yig'ilish algoritmlari". Genom tadqiqotlari. 18 (5): 821–829. doi:10.1101 / gr.074492.107. PMC  2336801. PMID  18349386.
  5. ^ "Velvet qo'llanmasi" Qabul qilingan 2013-10-18
  6. ^ Chjan, V.; Chen, J .; Yang, Y .; Tang Y .; Shang, J .; Shen, B. (2011). "De Novo Genome Assambleyasi dasturlarini keyingi avlod ketma-ketligi texnologiyalari uchun amaliy taqqoslash". PLOS ONE. 6 (3): e17915. doi:10.1371 / journal.pone.0017915. PMC  3056720. PMID  21423806.
  7. ^ Pauell, D. R .; Seemann, T (2013). "VAGUE: Velvet assembler uchun grafik foydalanuvchi interfeysi". Bioinformatika. 29 (2): 264–5. doi:10.1093 / bioinformatics / bts664. PMID  23162059.