Filogeniyada eng kam kvadratchalar xulosasi - Least squares inference in phylogeny

Filogeniyada eng kam kvadratchalar xulosasi hosil qiladi afilogenetik daraxt kuzatiladigan matritsaga asoslangan juftlik irsiy masofalar va ixtiyoriy ravishda og'irlik matritsasi. Maqsad iloji boricha asbest masofani cheklaydigan daraxtni topishdir.

Oddiy va eng kichik kvadratchalar

Kuzatilgan juftlik masofalari o'rtasidagi tafovut va masofalar filogenetik daraxt ustida (ya'ni novdaning yig'indisi bargdan yo'lda barg qoldirmoq) bilan o'lchanadi

og'irliklar qaerda Eng kam kvadratchalar usuliga bog'liq.Qisqa kvadratchalar masofa daraxt qurilishi daraxtni (topologiya va novda uzunliklarini) minimal S bilan topishga qaratilgan bo'lib, bu ahamiyatsiz muammo. Bunga uncha ko'p bo'lmagan barglarning soniga nisbatan eksponent bo'lgan, unroatsiz ikki tomonlama daraxt topologiyalarining alohida maydonini qidirish kiradi. N barg uchun 1 • 3 • 5 • ... • (2n-3) har xil topologiyalar mavjud. Ularni sanash barglarning oz sonli qismi uchun allaqachon mumkin emas. Evristik qidirish usullari oqilona yaxshi topologiyani topish uchun ishlatiladi. Berilgan topologiya uchun S ni baholash (shu bilan filial uzunliklarini hisoblashni o'z ichiga oladi) chiziqli eng kichik kvadratchalar Muammo Kvadrat xatolarni og'irlashtirishning bir necha yo'li mavjud, kuzatilgan farqlarning farqlari haqidagi bilim va taxminlarga bog'liq. Xatolar haqida hech narsa ma'lum bo'lmaganda yoki ular mustaqil ravishda taqsimlangan va barcha kuzatilgan masofalar uchun teng deb hisoblansa, unda barcha og'irliklar biriga o'rnatiladi. Bu eng oddiy kvadratchalar taxminiga olib keladi, eng kichik kvadratlarda xatolar mustaqil deb qabul qilinadi (yoki ularning o'zaro bog'liqligi noma'lum). Mustaqil xatolarni hisobga olgan holda, muayyan vazn og'irligi mos keladigan masofaning farqi teskari tomonga o'rnatilishi kerak. Ba'zan farqlar ma'lum bo'lmasligi mumkin, ammo ularni masofaviy hisob-kitoblar funktsiyasi sifatida modellashtirish mumkin. Fitch vaMargoliash usulida[1]masalan, bu dispersiyalar kvadrat kattaliklarga mutanosib deb hisoblanadi.

Umumiy kichkina kvadratchalar

Yuqorida tavsiflangan oddiy va eng kichik kvadratchalar usullari mustaqil masofani taxmin qilishni nazarda tutadi. Agar masofalar genomik ma'lumotlardan kelib chiqadigan bo'lsa, ularning taxminiy kovari bo'ladi, chunki ichki tarmoqlardagi (haqiqiy daraxtning) evolyutsion hodisalari bir vaqtning o'zida bir necha masofani yuqoriga yoki pastga surib qo'yishi mumkin. Olingan kovaryanslarni umumlashtirilgan eng kichik kvadratlar usuli yordamida, ya'ni quyidagi miqdorni minimallashtirishni hisobga olish mumkin.

qayerda ning teskari yozuvlari kovaryans matritsasi masofaviy hisob-kitoblarning.

Hisoblash murakkabligi

Daraxt va novdalar uzunligini topish, eng kichik kvadratlarning qoldiqlarini minimallashtirish To'liq emas muammo.[2] Biroq, ma'lum bir daraxt uchun eng maqbul novdalar uzunligini aniqlash mumkin oddiy kichkina kvadratchalar uchun vaqt, eng kichik kvadratchalar uchun vaqt va umumlashtirilgan eng kichik kvadratlar uchun vaqt (ning teskarisi berilgan kovaryans matritsasi ).[3]

Tashqi havolalar

  • FILIP, erkin taqsimlangan filogenetik tahlil to'plami, eng kichik kvadratchalar usulini qo'llashni o'z ichiga oladi
  • PAUP, sotib olish uchun o'xshash paket mavjud
  • Darvin, statistika, raqamlar, ketma-ketlik va filogenetik tahlil funktsiyalari kutubxonasiga ega dasturiy muhit

Adabiyotlar

  1. ^ Fitch WM, Margoliash E. (1967). Filogenetik daraxtlarni qurish. Ilm-fan 155: 279-84.
  2. ^ Uilyam H.E. Kun, O'xshamaslik matritsalaridan kelib chiqadigan filogeniyalarning hisoblash murakkabligi, Matematik biologiya byulleteni, 49-jild, 1987 yil 4-son, 461-467 betlar, ISSN 0092-8240, doi:10.1016 / S0092-8240 (87) 80007-1.
  3. ^ Devid Brayant, Piter Vaddell, Filogenetik daraxtlardagi eng kichik kvadratlar va minimal evolyutsiya mezonlarini tezkor baholash, Mol Biol Evol (1998) 15 (10): 1346