Ichki so'z - Nested word

Yilda Kompyuter fanlari, aniqrog'i avtomatlar va rasmiy til nazariya, ichki so'zlar tomonidan taklif qilingan tushuncha Alur va Madhusudan qo'shma umumlashtirish sifatida so'zlar, an'anaviy ravishda modellashtirish uchun ishlatilgan chiziqli buyurtma qilingan tuzilmalar va buyurtma qilinmagan holda daraxtlar, an'anaviy ravishda ierarxik tuzilmalarni modellashtirish uchun ishlatiladi. Ichki so'zlar uchun cheklangan holatdagi qabul qiluvchilar o'rnatilgan avtomat, keyin yanada aniqroq umumlashtirilishini bering cheklangan avtomatlar so'zlar bo'yicha. Cheklangan ichki avtomatika tomonidan qabul qilingan tillarning chiziqli kodlashlari sinfini beradi pastga tushadigan tillar. Oxirgi til sinfi o'rtasida to'g'ri yotadi oddiy tillar va kontekstsiz deterministik tillar. 2004 yilda kiritilganidan beri ushbu tushunchalar ushbu sohada ko'plab izlanishlarga sabab bo'ldi.[1]

Rasmiy ta'rif

Belgilash uchun ichki so'zlar, avval aniqlang mos keladigan munosabatlar. A salbiy bo'lmagan butun son , yozuv to'plamni bildiradi , maxsus ish bilan .

A taalukli munosabat ↝ uzunlik ning pastki qismi shu kabi:

  1. barcha uya chekkalari oldinga, ya'ni agar bo'lsa men ↝ j keyin men < j;
  2. uya chekkalari hech qachon umumiy nuqtai nazarga ega emas, ya'ni uchun −∞ < men < ∞, eng ko'p bitta pozitsiya mavjud h shu kabi h ↝ menva eng ko'p bitta pozitsiya mavjud j shu kabi menj; va
  3. uya chekkalari hech qachon kesilmaydi, ya'ni yo'q men < men ′ ≤ j < j ′ ikkalasi ham shunday men ↝ j va men ′ ↝ j ′.

Lavozim men deb nomlanadi

  • a qo'ng'iroq pozitsiyasi, agar menj kimdir uchun j,
  • a qo'ng'iroq kutilmoqda agar men ↝ ∞,
  • a qaytish pozitsiyasi, agar hmen kimdir uchun h,
  • a qaytib kelishni kutmoqda agar −∞ ↝ menva
  • an ichki pozitsiya qolgan barcha holatlarda.

A ichki so'z uzunlik ustidan alifbo Σ juftlik (w, ↝), qaerda w bu so'z yoki mag'lubiyat, uzunligi ustiga over va ↝ uzunlikning mos keladigan munosabati .

Ichki so'zlarni oddiy so'zlarga kodlash

Alfavit ustida joylashgan so'zlar orqali "oddiy" so'zlarga kodlanishi mumkin belgilangan alifbo , unda har bir belgi a dan Σ ga uchta o'xshash analog mavjud: ramz .A bilan belgilangan ichki so'zda qo'ng'iroq pozitsiyasini kodlash uchun a, belgi a⟩ bilan belgilangan qaytish pozitsiyasini kodlash uchun ava nihoyat ramz a bilan belgilangan ichki pozitsiyani ifodalash uchun o'zi a. Aniqrog'i, ruxsat bering φ ichki so'zlarni Σ dan ortiq so'zlarga xaritalash funktsiyasi bo'ling har bir ichki so'z (, ↝) so'zga mos keltirilgan , qaerda xat teng .A, ava a⟩, agar va men mos ravishda (kutilayotgan) chaqiruv pozitsiyasi, ichki pozitsiya va (kutilayotgan bo'lishi mumkin) qaytish pozitsiyasi.

Misol

Misol uchun, ruxsat bering n = (w, ↝) bilan uchlik alfavit orqali joylashtirilgan so'z bo'ling w=abaabccca va mos keladigan munosabat ↝ = {(−∞,1),(2,∞),(3,4),(5,7),(8,∞)}. So'ngra uni so'z sifatida kodlash quyidagicha o'qiladi φ(n) = a⟩⟨baa⟩⟨yashirin⟩⟨taxminan.

Avtomatlar

Ichki so'z avtomat

A avtomat avtomat cheklangan sonli holatlarga ega va deyarli a kabi ishlaydi aniqlangan cheklangan avtomat klassik satrlarda: klassik cheklangan avtomat kirish so'zini o'qiydi chapdan o'ngga va o'qiganidan keyin avtomat holati jth xat avtomat o'qishdan oldin bo'lgan holatiga bog'liq .

Ichki so'zda avtomat, pozitsiya ichki so'zda (w, ↝) qaytish pozitsiyasi bo'lishi mumkin; agar shunday bo'lsa, o'qishdan keyin davlat nafaqat bog'liq bo'ladi chiziqli holat u erda avtomat o'qishdan oldin bo'lgan , shuningdek, a ierarxik holat tegishli qo'ng'iroq holatida bo'lgan paytda avtomat tomonidan tarqaladi. O'xshashligi bilan oddiy tillar so'zlar, to'plam L uyali so'zlar deyiladi muntazam agar u ba'zi (cheklangan holat) ichki o'rnatilgan so'z avtomat tomonidan qabul qilinsa.

Ko'rinib turgan tarzda pastga tushirish avtomati

Ichki so'z avtomatlari - ichki so'zlarni qabul qiladigan avtomat model. (Oddiy) so'zlar bilan ishlaydigan ekvivalent avtomat modeli mavjud. Ya'ni, a tushunchasi deterministik ko'rinadigan surish avtomati a tushunchasini cheklashdir deterministik surish avtomati.

Alur va Madhusudan keyin,[2] deterministik ko'rinadigan surish avtomati rasmiy ravishda 6-karra sifatida aniqlanadi qayerda

  • sonli to'plamidir davlatlar,
  • bo'ladi kirish alifbosi, bu oddiy surish avtomatlaridan farqli o'laroq - uchta to'plamga bo'lingan , va . Alifbo to'plamini bildiradi chaqirish belgilari, o'z ichiga oladi qaytish belgilariva to'plam o'z ichiga oladi ichki belgilar,
  • deb nomlangan cheklangan to'plamdir stack alifbosi, maxsus belgini o'z ichiga olgan bo'sh to'plamni belgilab,
  • bo'ladi o'tish funktsiyasi, bu uch qismga bo'lingan bo'lib, ular qo'ng'iroq o'tish, qaytish va ichki o'tishga mos keladi
    • , qo'ng'iroq o'tish funktsiyasi
    • , qaytish o'tish funktsiyasi
    • , ichki o'tish funktsiyasi,
  • bo'ladi dastlabki holatva
  • ning to'plami qabul qiluvchi davlatlar.

Tushunchasi hisoblash Ko'rinib turgan tarzda pastga tushirish avtomatining ishlatilishi cheklanganligi pastga tushirish avtomatlari. Ko'rinib turadigan pastga tushirish avtomatlari faqat qo'ng'iroq belgisini o'qiyotganda stekka belgi qo'shadi , ular faqat qaytish belgisini o'qiyotganda yuqori elementni to'plamdan olib tashlashadi va ular ichki hodisani o'qiyotganda to'plamni o'zgartirmaydi . Qabul qilish holatida tugaydigan hisoblash hisob-kitoblarni qabul qilish.

Natijada, ko'rinadigan tarzda pastga tushirish avtomati bir xil kirish belgisi bilan stekka itarib, popdan chiqa olmaydi. Shunday qilib til har qanday qism uchun ko'rinadigan surish avtomati tomonidan qabul qilinishi mumkin emas Biroq, ushbu tilni qabul qiladigan avtomatlashtirilgan avtomatlar mavjud.

Agar a til belgilangan alifbo orqali aniqlanadigan pastga tushirish avtomati tomonidan qabul qilinadi, keyin deyiladi a pastga tushirish tili.

Nondeterministik ko'rinadigan pastga tushirish avtomatlari

Nondeterministik pastga tushirish avtomatlari aniqlanganlar kabi ifodali. Demak, nondeterministik ko'rinadigan surish avtomatini deterministikka aylantirish mumkin, ammo agar nondeterministik avtomat bo'lsa davlatlar, deterministikka qadar bo'lishi mumkin davlatlar.[3]

Qaror bilan bog'liq muammolar

Ruxsat bering avtomat tavsifining kattaligi bo'lishi , keyin biron bir so'z yoki yo'qligini tekshirish mumkin n avtomat tomonidan o'z vaqtida qabul qilinadi . Xususan, bo'shliq muammosi vaqt o'tishi bilan hal qilinadi .Agar sobit, uni vaqt ichida hal qilish mumkin va makon qayerda ning chuqurligi n oqim ko'rishda. Bundan tashqari, bo'shliq bilan hal qilish mumkin va vaqt va chuqurlikning bir xil mantiqiy zanjiri bo'yicha .[2]

Ikki noaniq avtomat uchun A va B, qabul qilingan so'zlar to'plami yoki yo'qligini hal qilish A tomonidan qabul qilingan so'zning bir qismidir B bu MAQSAD - to'liq. Qabul qilinmaydigan so'z bor-yo'qligini aniqlash ham EXPTIME tugallangan.[2]

Tillar

Ko'rinib turadigan pastga tushirish avtomatlarining ta'rifi ko'rsatilgandek, aniq ko'rinadigan pastga tushirish avtomatlari maxsus holat sifatida qaralishi mumkin deterministik surish avtomatlari; Shunday qilib to'plam VPL pastga siljish tillari to'plamning kichik qismini tashkil qiladi DCFL ning kontekstsiz deterministik tillar belgilar to'plami ustida . Xususan, uyali so'zlardan mos keladigan munosabatni olib tashlaydigan funktsiya oddiy tillarni ichki so'zlar o'rniga kontekstsiz tillarga aylantiradi.

Yopish xususiyatlari

Ko'rinib turadigan pastga tushirish tillari to'plami quyidagi operatsiyalar bo'yicha yopiladi:[3]

  • operatsiyalarni o'rnatish:
    • birlashma
    • kesishish
    • to'ldiruvchi,
Shunday qilib a mantiqiy algebra.

Kesishish uchun VPA qurish mumkin M berilgan ikkita VPA ni simulyatsiya qilish va oddiy mahsulot qurilishi bilan (Alur va Madhusudan 2004 yil ): Uchun , taxmin qiling sifatida berilgan . Keyin avtomat uchun M, davlatlar to'plami , dastlabki holat , yakuniy holatlar to'plami , stek alifbosi tomonidan berilgan va boshlang'ich stek belgisi .

Agar holatidadir o'qishda a qo'ng'iroq belgisi , keyin stek belgisini bosadi va davlatga ketadi , qayerda tomonidan bosilgan stek belgisi davlatdan o'tish paytida ga o'qishni kiritish to'g'risida .

Agar holatidadir o'qish haqida ichki belgi , keyin davlatga o'tadi , har doim davlatdan o'tish ga o'qish to'g'risida a.

Agar holatidadir o'qishda a qaytish belgisi , keyin belgisini ochadi to'plamdan va davlatga o'tishni boshlaydi , qayerda tomonidan qo'yilgan stek belgisi davlatdan o'tish paytida ga o'qish to'g'risida .

Yuqoridagi qurilmaning to'g'riligi juda muhim, simulyatsiya qilingan mashinalarning turtki va pop harakatlari. va o'qilgan kirish belgilari bo'yicha sinxronlashtiriladi. Aslida, shunga o'xshash simulyatsiya endi mumkin emas deterministik surish avtomatlari, chunki deterministik kontekstsiz tillarning kattaroq sinfi kesishma ostida yopilmaydi.

Yuqorida ko'rsatilgan birlashtirish uchun konstruktsiyadan farqli o'laroq, pastga tushadigan avtomatlar uchun komplementatsiya konstruktsiyasi standart konstruktsiyaga parallel[4] deterministik surish avtomatlari uchun.

Bundan tashqari, kontekstsiz tillar sinfi singari ko'rinadigan surish tillari klassi ham yopiq prefiksni yopish va teskari, shuning uchun ham qo'shimchani yopish.

Boshqa til darslari bilan aloqasi

Alur va Madhusudan (2004) Shuni ta'kidlash kerakki, pastga tushirish tillari taklif qilingan qavs tillaridan ko'ra umumiyroq McNaughton (1967). Ko'rsatilgandek Crespi Reghizzi va Mandrioli (2012), o'z navbatida, pastga tushirish tillari aniq ta'riflangan tillar sinfida mavjud operator-ustunlik grammatikalari tomonidan kiritilgan Floyd (1963) va bir xil yopish xususiyatlari va xususiyatlaridan bahramand bo'ling (qarang Lonati va boshq. (2015) ω tillari va mantiqiy va avtomatlashtirilgan xarakteristikalar uchun). Ga nisbatan konjunktiv grammatikalar, kontekstsiz grammatikalarni umumlashtirish, Okhotin (2011) chiziqli qo'shma tillar ko'rinadigan surish tillarining superklassini tashkil etishini ko'rsatadi. Ushbu maqolaning oxiridagi jadval, boshqa til oilalariga nisbatan ko'rinadigan surish tillari oilasini qo'yadi Xomskiy ierarxiyasi.Rajeev Alur va Parthasaratiya Madhusudan[5][6] oddiy ikkilik daraxtlar tillari subklassini ko'rinadigan surish tillariga bog'ladi.

Ta'rifning boshqa modellari

Ko'rinib turibdiki, pastga tushirish grammatikalari

Ko'rinib turgan tarzda pastga tushirish tillari aniq ta'riflanadigan tillardir pastga tushirish grammatikalari.[2]

Ko'rinib turgan tarzda pastga tushirish grammatikasini cheklash sifatida aniqlash mumkin kontekstsiz grammatikalar. Ko'rinib turgan tarzda pastga tushirish grammatikasi G 4- bilan belgilanadipanjara:

qayerda

  • va ajratilgan sonli to'plamlar; har bir element deyiladi terminal bo'lmagan belgi yoki a o'zgaruvchan. Har bir o'zgaruvchi gapdagi turlicha iboralar yoki gaplarni ifodalaydi. Har bir o'zgaruvchi tilning sub-tilini belgilaydi va ning pastki tillari Qo'ng'iroqlarni kutishsiz yoki qaytib kelishni kutishsiz.
  • sonli to'plamidir Terminals, ajratish , jumlaning haqiqiy mazmunini tashkil etuvchi. Terminallar to'plami grammatika bilan aniqlangan til alifbosi .
  • dan cheklangan munosabatdir ga shu kabi . A'zolari deyiladi (qayta yozish) qoidasis yoki ishlab chiqarishgrammatikaning s. Qayta yozishning uchta turi mavjud. Uchun , va
    • va agar keyin va
    • va agar keyin
  • bo'ladi start o'zgaruvchisi (yoki boshlanish belgisi), butun jumlani (yoki dasturni) ifodalash uchun ishlatiladi.

Bu erda yulduzcha Kleene yulduzi operatsiya va bu bo'sh so'z.

Bir xil mantiqiy zanjirlar

Muammo uzunlik so'zi bo'ladimi berilgan ichki so'z tomonidan qabul qilingan avtomat forma yordamida echilishi mumkin boolean davrlari chuqurlik .[2]

Mantiqiy tavsif

Ichki so'zlar ustidagi odatiy tillar aniq tasvirlangan tillar to'plamidir monadik ikkinchi darajali mantiq ikkita unary predicates bilan qo'ng'iroq qiling va qaytish, chiziqli voris va mos keladigan munosabat ↝.[2]

Shuningdek qarang

Izohlar

  1. ^ Google Scholar qidiruv natijalari "ichki so'zlar" uchun yoki "ko'rinadigan tarzda pastga tushirish"
  2. ^ a b v d e f Alur va Madhusudan (2009)
  3. ^ a b Alur va Madhusudan (2004)
  4. ^ Hopcroft & Ullman (1979 yil), p. 238 f).
  5. ^ Alur, R .; Madhusudan, P. (2004). "Ko'zga tashlanadigan tillar" (PDF). Hisoblash nazariyasi bo'yicha har yili o'ttiz oltinchi ACM simpoziumi materiallari - STOC '04. 202-211 betlar. doi:10.1145/1007352.1007390. ISBN  978-1581138528.CS1 maint: ref = harv (havola) 4-bo'lim, 5-teorema,
  6. ^ Alur, R .; Madhusudan, P. (2009). "So'zlarga uyalash tuzilishini qo'shish" (PDF). ACM jurnali. 56 (3): 1–43. CiteSeerX  10.1.1.145.9971. doi:10.1145/1516512.1516518.CS1 maint: ref = harv (havola) 7-bo'lim

Adabiyotlar

Tashqi havolalar