To'xtatish (sintaksis) - Stropping (syntax)

Yilda kompyuter tili dizayn, to'xtab turish harflar ketma-ketligini maxsus xususiyatga ega deb aniq belgilash usuli, masalan, a kalit so'z yoki ma'lum bir turdagi o'zgaruvchan yoki saqlash joyi va shu bilan to'qnashuvlarning oldini olish uchun oddiy nomlardan ("identifikatorlar") boshqa nomlar oralig'ida yashaydi. Stropping zamonaviy tillarning aksariyatida qo'llanilmaydi - aksincha, kalit so'zlar saqlangan so'zlar va identifikator sifatida ishlatib bo'lmaydi. To'xtatish bir xil harflar ketma-ketligini kalit so'z sifatida ham, an sifatida ham ishlatishga imkon beradi identifikator va soddalashtiradi tahlil qilish u holda - masalan, nomlangan o'zgaruvchiga ruxsat berish agar kalit so'z bilan to'qnashmasdan agar.

To'xtash birinchi navbatda bog'liqdir ALGOL va 60-yillarda tegishli tillar. Garchi u topsa ham zamonaviy foydalanish, boshqalari bilan osonlikcha aralashib ketadi shunga o'xshash texnikalar yuzaki o'xshash.

Tarix

Stropping usuli va "stropping" atamasi rivojlanishida paydo bo'lgan ALGOL 1960-yillarda, u to'g'ridan-to'g'ri apparat tilida ifodalanishi mumkin bo'lmagan nashr tilida topilgan bosma farqlarni (qalin va pastki chiziqlar) ifodalash uchun ishlatilgan - yozuv mashinasi qalin belgilarga ega bo'lishi mumkin edi, ammo shtamp kartalarida kodlashda qalin bo'lmagan belgilar. "Stropping" atamasi paydo bo'ldi ALGOL 60, "danapostrof ", ALGOL 60 ning ba'zi bir dasturlari qalin atrofni ko'rsatish uchun matn atrofidagi apostroflardan foydalanganligi sababli,[1] kabi "agar" kalit so'zni ifodalash uchun agar. To'xtatish ham muhim ahamiyatga ega ALGOL 68, bu erda "tortib olish rejimlari" deb nomlanuvchi bir nechta to'xtash usullari qo'llaniladi; ALGOL 60-dan mos keladigan asl apostroflar keng qo'llanilmagan, etakchi davr yoki katta harflar keng tarqalgan,[2] kabi .IF yoki IF va bularning barchasiga "to'xtash" atamasi qo'llanilgan.

Sintaksislar

To'xtatish uchun turli xil sintaksislardan foydalanilgan:

  • Algol 60 odatda so'z atrofida bitta tirnoq konvensiyasida, odatda apostrof sifatida ishlatiladi, bu erda "to'xtash" nomi (masalan, 'BOSHLASH').
  • Algol 68[3][2] ba'zi ilovalarda bitta tirnoq bilan qo'shilgan harflar ketma-ketligini kalit so'z sifatida ko'rib chiqing (masalan, 'BOSHLASH)[4]

Darhaqiqat, ko'pincha bitta tilda bir nechta to'xtatuvchi konventsiyalar qo'llanilishi mumkin edi. Masalan, ichida ALGOL 68, to'xtash konventsiyasini tanlash kompilyator tomonidan belgilanishi mumkin direktiv (ALGOL terminologiyasida "pragmat "), ya'ni POINT, UPPER, QUOTE yoki RES:

  • 6-bitli POINT (kichik harflar uchun etarli emas), xuddi shunday .UCHUN - shunga o'xshash konventsiya FORTRAN 77-da ishlatiladi, bu erda Mantiqiy kalit so'zlar to'xtatiladi .EQ. va boshqalar (pastga qarang)
  • 7-bit uchun UPPER, xuddi bo'lgani kabi UCHUN - oddiy identifikatorlar uchun ishlatiladigan kichik harflar bilan
  • ALGOL 60-dagi kabi QUOTE, xuddi shunday 'uchun'
  • Zamonaviy tillarda ishlatiladigan RES so'zlari - uchun ajratilgan va oddiy identifikatorlar uchun mavjud emas

Turli xil qoidalar rejimlari a leksik spetsifikatsiya qo'yilgan belgilar uchun, ba'zi hollarda bu oddiy talqinlarga ega: bitta apostrof va nuqta rejimlarida birinchi belgi qochish xarakteri, mos keladigan apostroflar rejimida apostroflar quyidagicha ishlaydi ajratuvchilar, kabi torli harflar.

Boshqa misollar:

  • Atlas avtokod uchta tanlovga ega edi: kalit so'zlar bo'lishi mumkin chizilgan orqaga qaytish va overstrike yordamida a Flexowriter klaviatura, ular a tomonidan taqdim etilishi mumkin % foiz% belgisiyoki ular yozilishi mumkin edi Yuqori ish ajratuvchi belgisiz ("katta harflar bilan chegaralash" rejimi, bu holda barcha o'zgaruvchilar kichik harflar bilan yozilishi kerak edi).
  • ALGOL 68RS dasturlarga, hatto bitta til protsessori ichida ham bir nechta to'xtash variantlaridan foydalanishga ruxsat beriladi.
  • Edinburg IMP Atlas avtokodini meros qilib oldi % foiz% belgisi prefiks konvensiyasi, ammo boshqa to'xtash imkoniyatlari emas

Turli xil ALGOL 68 uslublarining namunalari

Etakchiga e'tibor bering pr (ning qisqartmasi pragmat) direktiv, o'zi POINT yoki tirnoq uslubida to'xtatilgan va ¢ izoh uchun (dan "") - qarang ALGOL 68: pr & co: Pragmatlar va sharhlar tafsilotlar uchun.

Algol68 "qattiq"
odatda nashr etilganidek
Iqtibosni to'xtatish
(kabi) vikitekst )
Uchun 7-bit belgi
kod kompilyatori
Uchun 6-bit belgi
kod kompilyatori
Algol68 res stropping yordamida
(ajratilgan so'z)
¢ tagiga chizilgan yoki qalin shrift bilan rejimi xint = int; xint yig'indisi sq: = 0; uchun men esa   yig'indisi kvadrat ≠ 70 × 70 qil   yig'indisi sq +: = i-2 od
'pr' quote 'pr''mode' 'xint' = 'int'; 'xint' sum sq: = 0; 'for' i 'while' sum sq-70 × 70'do 'sum sq +: = i-2 "od"
.PR UPPER .PRMODE XINT = INT; XINT sum sq: = 0; I WHILE sum sq / = 70 * 70DO sum sq +: = i ** 2OD
.PR POINT .PR.MODE .XINT = .INT; .XINT SUM SQ: = 0;. I .WHILE SUM SQ .NE 70 * 70.DO SUM SQ .PLUSAB I .UP 2.OD
.PR RES .PRmode .xint = int; .xint sum sq: = 0; i uchun sum sq ≠ 70 × 70do'shimcha sq +: = i ↑ 2od

Boshqa tillar

Turli sabablarga ko'ra Fortran 77 quyidagi "mantiqiy" qiymatlar va operatorlarga ega: .To'g'ri., .FALSE., .EQ., .NE., .LT., .LE., .GT., .GE., .EQV., .NEQV., .VA., .VA., .YO'Q.[5]

.VA., .VA. va .XOR. da birlashtirilgan testlarda ishlatiladi IF va IFF bayonotlar ommaviy fayllar ostida yugurish JP dasturi kabi buyruq qatori protsessorlari 4DOS,[6] 4OS2 va 4NT / buyruqni oling.

Zamonaviy foydalanish

Zamonaviy kompyuter tillarining aksariyati to'xtash rejimidan foydalanmaydi, ikkita muhim istisno bundan mustasno:

Microsoft tillarida ko'plab tillardan foydalanish .NET Umumiy til infratuzilmasi (CLI) chaqiruv tilidagi kalit so'zlar bo'lishi mumkin bo'lgan boshqa tildagi o'zgaruvchilardan foydalanish usulini talab qiladi. Bu ba'zan prefikslar tomonidan amalga oshiriladi, masalan @ C # -da yoki identifikatorni qavs ichida, ichida Visual Basic.NET.

Ikkinchi muhim misol ko'plab dasturlarda Tuzilmaviy so'rovlar tili. Ushbu tillarda zaxira qilingan so'zlarni ustun, jadval yoki o'zgarmaydigan nomlar sifatida leksik jihatdan chegaralash orqali foydalanish mumkin. Standart zaxira qilingan so'zlarni ikki tirnoq bilan belgilaydi, ammo amalda aniq mexanizm amalga oshirilishidan farq qiladi; MySQL masalan, zaxira qilingan so'zlarni boshqa kontekstda ularni orqa nuqta ichiga qo'shib ishlatishga imkon beradi va Microsoft SQL Server kvadrat qavslardan foydalaniladi.

Tugatish, shuningdek, da ishlatilishi mumkin Nim dasturlash tili. Nimda zaxira qilingan so'zni retikstlarga qo'shish orqali identifikator sifatida foydalanish mumkin.

Boshqa kichikroq misollar mavjud. Masalan, Veb-IDL etakchi pastki chiziqdan foydalanadi _ aks holda zaxira qilingan so'zlar bilan to'qnashadigan identifikatorlarni to'xtatish uchun: identifikatorning qiymati bu etakchining pastki chizig'ini belgilaydi va nomlash shartiga emas, balki bu to'xtashga imkon beradi.[7]

Tuzuvchi tomonidan o'chirish

A kompilyator frontend, bekor qilish dastlab boshlang'ich paytida sodir bo'lgan liniyani qayta qurish faza, bu bo'shliqni ham yo'q qildi. Buning ortidan ergashdi skanersiz tahlil qilish (tokenizatsiya yo'q); bu 1960-yillarda, xususan ALGOL uchun standart edi. Zamonaviy foydalanishda bekor qilish odatda bir qismi sifatida amalga oshiriladi leksik tahlil. Agar lekserni skaner va baholovchining ikki bosqichiga ajratib turadigan bo'lsa, bu aniq: skaner to'xtatilgan ketma-ketlikni to'g'ri toifaga ajratadi, so'ngra qiymatni hisoblashda baholovchi to'xtaydi. Masalan, zaxira qilingan so'zlar bilan to'qnashuvni oldini olish uchun identifikatorlarni to'xtatish uchun boshlang'ich chiziq chizig'i ishlatilgan tilda, ketma-ketlik _if identifikator sifatida tasniflanadi (zaxiralangan so'z sifatida emas) agar) skaner tomonidan, keyin esa baholovchi bu qiymatni beradi agar, hosil berish (Identifikator, agar) token turi va qiymati sifatida.

Shunga o'xshash usullar

Shunga o'xshash bir qator texnikalar mavjud, odatda turli xil muolajalarni ko'rsatish uchun identifikatorning prefiksi yoki qo'shimchasi, ammo semantikasi har xil. To'liq aytganda, to'xtash turli xil nomlar maydonlarida bir xil nomdagi (qiymatdagi) turli xil tasvirlardan iborat bo'lib, tokenizatsiya bosqichida sodir bo'ladi. Masalan, ALGOL 60-da mos keladigan apostrof qo'yilishi bilan, "agar" (Keyword, if), while sifatida tokenlangan agar sifatida tokenized (Identifier, if) - har xil token sinflarida bir xil qiymat.

Kalit so'zlar uchun katta harflardan foydalanish leksing va tahlil qilish uchun grammatikalarni yozish uchun odatiy hol bo'lib qolmoqda - zahiralangan so'zni belgilash agar token sinfi sifatida IF va keyin if-then-else iborasini ibora bilan ifodalaydi IF Ifoda, keyin BOShQA BOShQA bayonoti bu erda katta so'zlar kalit so'zlar va katta harflar bilan yozilgan notekis belgilar a ishlab chiqarish qoidasi (terminal belgilari kabi kichik harflar bilan belgilanadi identifikator yoki tamsayı, uchun tamsayı ).

Konventsiyalarni nomlash

Eng erkin, ulardan foydalanish mumkin nomlash konvensiyalari to'qnashuvlarga yo'l qo'ymaslik uchun, xuddi oldingidek, pastki chiziq bilan prefiks yoki qo'shimchalar if_ yoki _sondan keyin. Ob'ektga yo'naltirilgan dasturlashda xususiy a'zolarni ko'rsatish uchun etakchi pastki chiziq ko'pincha ishlatiladi.

Ushbu nomlar kompilyator tomonidan talqin qilinishi va ma'lum darajada ta'sir qilishi mumkin, ammo bu odatda tokenizatsiya bosqichida emas, balki semantik tahlil bosqichida amalga oshiriladi. Masalan, Python-da bitta etakchi pastki chiziq zaif xususiy ko'rsatkich bo'lib, modul importida qaysi identifikatorlar import qilinishiga ta'sir qiladi, shu bilan birga sinf atributidagi ikkita etakchi pastki chiziq (va bittadan ko'p bo'lmagan pastki chiziq) chaqiriladi mangling nomlari.[8]

Saqlangan so'zlar

Zamonaviy tillar odatda kalit so'zlarni identifikatorlardan ajratish uchun to'xtash o'rniga, zahiralangan so'zlardan foydalanadi - masalan, yaratish agar ajratilgan - ular tez-tez identifikatorlarning sintaktik sinfini kalit so'zlar sifatida saqlab qo'yishadi, bu esa to'xtash rejimi sifatida talqin qilinishi mumkin, ammo buning o'rniga zaxira so'zlarning semantikasiga ega.

Bu pastki chiziq bilan boshlanadigan identifikatorlar saqlanadigan C-da juda muhimdir, ammo qaysi identifikatorlar qaysi doirada saqlanganligi va etakchi pastki chiziqlar har qanday foydalanish uchun saqlanadi;[9] xuddi shunday C ++ da har qanday identifikator o'z ichiga oladi er-xotin pastki chiziq har qanday foydalanish uchun saqlanadi, pastki chiziq bilan boshlangan identifikator esa global maydonda saqlanadi.[nb 1] Shunday qilib, yangi kalit so'zni qo'shish mumkin foo ajratilgan so'zdan foydalanish __foo. Bu to'xtashga yuzaki o'xshash bo'lsa-da, semantikasi boshqacha. Ipga ajratilgan so'z sifatida __foo aniqlovchini ifodalaydi __foo umumiy identifikator nom maydonida. Qabul qilishda (kalit so'zlarni prefiks bilan __), mag'lubiyat __foo kalit so'zni anglatadi foo alohida kalit so'zlar nomlari maydonida. Shunday qilib, ajratilgan so'zlardan foydalanib, belgilar __foo va foo (identifikator, __foo) va (identifikator, foo) - bir xil toifadagi turli qiymatlar - tokenlarni to'xtatishda __foo va foo are (kalit so'z, foo) va (identifikator, foo) - har xil toifadagi bir xil qiymatlar. Ular bir xil nomlar maydonidagi to'qnashuvlarni dasturchi uchun bir xil, ammo rasmiy grammatika va amalga oshirish jihatidan farq qiladigan tarzda hal qilishadi.

Mangling nomi

Mangling nomi identifikatorlarning nomini o'zgartirish orqali nomdagi to'qnashuvlarga ham murojaat qiladi, ammo bu keyinchalik tokenizatsiya paytida emas, balki semantik tahlil paytida kompilyatsiya paytida amalga oshiriladi. Bu to'qnashuvlarning oldini olish uchun va ismning o'zida zarur semantik ma'lumotlarni kiritish uchun, avvalambor, bog'lovchilar tomonidan foydalanish uchun hajm va turdagi ma'lumotlarni o'z ichiga olgan nomlarni yaratishdan iborat. Bunday hollarda asl identifikatorlar bir xil bo'lishi mumkin, ammo funktsiyalardagi kabi kontekst boshqacha foo (int x) ga qarshi foo (char x), ikkala holatda ham bir xil identifikator mavjud foo, lekin boshqa imzo. Ushbu ismlar mangled bo'lishi mumkin foo_i va foo_c, masalan, turdagi ma'lumotlarni kiritish uchun.

Sigils

Sintaktik jihatdan o'xshash, ammo semantik jihatdan boshqacha hodisa sigillar, buning o'rniga o'zgaruvchilar xususiyatlarini bildiradi. Ular keng tarqalgan Perl, Yoqut, va o'zgaruvchilar / konstantalarning xususiyatlarini aniqlash uchun turli xil boshqa tillar: o'zgaruvchan turini belgilash uchun Perl, o'zgaruvchini doimiylardan ajratish va ko'lamini ko'rsatish uchun Ruby. E'tibor bering, bu semantik o'zgaruvchining emas, balki sintaksis bu identifikator yoki kalit so'zmi.

Inson tilidagi o'xshashliklar

Stropping kompyuter dasturlash tillarida kompilyator ning (yoki aniqrog'i, tahlilchi ) osonroq ishlash, ya'ni 20-asrda hisoblashning dastlabki kunlarida mavjud bo'lgan nisbatan kichik va sekin kompyuterlarning imkoniyatlari doirasida. Biroq, shunga o'xshash metodlar odatda odamlar uchun ham o'qishni tushunishga yordam berish uchun ishlatilgan. Ba'zi bir misollar:

  • Muhim so'zlarni joylashtirish qalin, masalan, birinchi eslatish kabi to'xtab turish sahifaning boshida, chunki to'xtashni belgilash sahifaning maqsadi.
  • Yangi so'zlarni formatlash kursiv turi ular birinchi marta matnga kiritilganda. Bu odatda ishlatiladi ilmiy fantastika va xayol ixtiro qilingan o'simliklar, oziq-ovqat, jonzotlar bilan tanishtirishda; yilda sayohatnoma va begona xorijiy so'zlarni tavsiflashda tarixiy yozuv; va hokazo. Shuningdek, ehtimol ushbu til bilan bog'liq bo'lgan maxsus shrift yordamida, masalan Gotik shrift uchun Nemis so'zlar.
  • Odatda boshqa tildan foydalanish Lotin yoki Yunoncha texnik shartlarni imzolash. Bu zaxiralangan so'zlardan foydalanishga o'xshaydi, lekin odatda o'qishga yordam berish uchun kursiv matn bilan birlashtiriladi. Masalan:
  • Yozma ravishda Yapon, ga qo'shimcha sifatida Kanji belgilar, ikkita alifbo (aniqrog'i, heceler ) Xiragana va Katakana, ikkalasi ham bir xil tovushlar majmuasini ifodalaydi, fonetik jihatdan yozilgan yapon so'zlarini chetdan keltirilgan chet el so'zlaridan ajratish uchun ishlatiladi; Katakana ham shunga o'xshash ta'kidlash uchun ishlatiladi kursiv inglizchada.

Shuningdek qarang

Izohlar

  1. ^ Boshqa cheklovlar mavjud, masalan, pastki chiziq bilan boshlangan identifikator, so'ngra katta harf.

Adabiyotlar

  1. ^ King, Peter R., ed. (1974-06-18). "(noma'lum)". ALGOL 68 dasturini amalga oshirish bo'yicha xalqaro konferentsiya materiallari. Manitoba universiteti kompyuter fanlari bo'limi, Vinnipeg: Manitoba universiteti, kompyuter fanlari bo'limi: 148. ISBN  9780919628113. Qalin matnni rim matnidan ajratish uchun ishlatiladigan "to'xtash" ko'proq jiddiy muammolarni keltirib chiqaradi. Ba'zi dasturlar qalin harf atrofida apostroflarni talab qiladi (bu erda nom bekor qilinadi); boshqalari orqaga qaytishni va ostiga chizishni talab qiladi; […] Cite umumiy sarlavhadan foydalanadi (Yordam bering)
  2. ^ a b van Vijngaarden, Adriaan; Mailloux, Barri Jeyms; Pek, Jon Edvard Lanselot; Koster, Cornelis Hermanus Antonius; Sintzoff, Mishel; Lindsey, Charlz Xojson; Meertens, Lambert Giyom Lui Terodor; Fisker, Richard G., tahr. (1976). "9.3-bo'lim vakolatxonalari" (PDF). Algoritmik til bo'yicha qayta ko'rib chiqilgan hisobot ALGOL 68. Springer-Verlag. 94, 123 betlar. ISBN  978-0-387-07592-1. OCLC  1991170. Arxivlandi (PDF) asl nusxasidan 2019-04-19. Olingan 2019-05-11.
  3. ^ http://www.fh-jena.de/~kleine/history/languages/Algol68-RR-HardwareRepresentation.pdf
  4. ^ Lindsey, Charlz Xojson; van der Meulen, Sietse G. (1977). ALGOL 68 ga norasmiy kirish. Shimoliy-Gollandiya. 348-349 betlar. ISBN  978-0-7204-0726-6. OCLC  230034877.
  5. ^ http://www.personal.psu.edu/jhm/f90/lectures/10.html
  6. ^ Birodarlar, Hardin; Rouson, Tom; Conn, Rex C.; Pol, Matias R.; Bo'yoq, Charlz E .; Georgiev, Luchezar I. (2002-02-27). 4DOS 8.00 onlayn yordam.
  7. ^ Veb-IDL, "3.1. Ismlar ". […] Ushbu konstruktsiyalarning barchasi uchun identifikator U + 005F LOW LINE (" _ ") belgisi olib tashlangan (pastki chiziq) olib tashlangan identifikator belgisining qiymati hisoblanadi. […] Izoh […] Yetakchi" _ "identifikatordan ajratilgan so'zga o'xshab qochish uchun ishlatiladi, masalan," interfeys "deb nomlangan interfeysni aniqlash mumkin." _ "etakchi identifikatorni o'chirish uchun tushiriladi. […]
  8. ^ PEP 008: Ta'riflovchi: Uslublarni nomlash
  9. ^ C99 standart, 7.1.3 zaxiralangan identifikatorlar

Qo'shimcha o'qish