ISO 11940 - ISO 11940

ISO 11940 bu ISO uchun standart transliteratsiya ning Tailandcha belgilar, 1998 yilda nashr etilgan va 2003 yil sentyabrda yangilangan va 2008 yilda tasdiqlangan. Ushbu standartning kengaytirilgan nomi ISO 11940-2 unga asoslangan soddalashtirilgan transkripsiyani belgilaydi.

Undoshlar

Tailandcha
ISOkk̄hḳ̄hxkʹhḳhngvc̄hchsc̣h
 
Tailandcha 
ISOṭ̄hṯhtʹhdtt̄hthṭhn
 
Tailandcha 
ISObpp̄hphfp̣hm
 
Tailandcha
ISOyrvlłwṣ̄s̄ʹx

The transliteratsiya poklarning undoshlar ularning boshlang'ich undoshi sifatida odatdagi talaffuzidan kelib chiqadi. Belgilanmagan h shakllantirish uchun ishlatiladi digraflar belgilaydigan aspiratsiyalangan undoshlar. Yuqori va past juft undoshlar a ni qo'llash orqali sistematik ravishda farqlanadi makron yuqori sinf undoshiga. Bir xil bo'lgan undoshlarni yanada farqlash fonetik funktsiyani eng tez-tez belgisiz qoldirish, ikkinchisini eng pastda nuqta bilan belgilash, uchinchisini shox bilan belgilash va to'rtinchisini pastki chiziq bilan belgilash orqali olinadi. Quyidagi nuqtadan foydalanish shunga o'xshash ta'sirga ega Indologik farqlash amaliyoti retrofleks undoshlari Quyidagi nuqta bilan, ammo nozik farqlar mavjud - bu $ pi $ ning transliteratsiyasi tanga va ศ shunday sala tegishli emas, balki quyida nuqta qo'yilgan retrofleks undoshlari. Undoshlarning transliteratsiyasini tartib harfiga, agar mavjud bo'lsa makronga, so'ngra quyida nuqta, shox yoki "makron ostida" kiritilishi kerak.

Faqat uchta undoshning translyatsiyasida shox bor, ฅ xon, ฒ th phuthao va ษ shuning uchun ruesiva faqat bitta undoshning pastki chizig'i bor, ฑ tho nang montho.

Unlilar

Tailandcha–ั–ิ–ี–ึ–ื–ุ–ูฤๅฦๅ
ISOaāåmenīụ̄sizūeæomenvłłɨywx

Xat å translyatsiya natijalarida ko'rsatilgan yagona oldindan tuzilgan belgidir.

Lakkhangyao (ๅ) faqat ฤ va v unli harflari bilan birgalikda ko'rsatilgan. Standartda shunchaki ฤ va ฦ undoshlari va lakkhangyao unlilar bilan. Izolyatsiya qilingan lakkhangyao zarb bilan kichik "i" harfi bilan ham transliteratsiya qilinadi (ɨ), ammo bunday holat Tayland, Pali yoki Sanskrit tillarida bo'lmasligi kerak.

ว ning transliteratsiyasi voy wen va อ o ang to'liq unli belgilar sifatida ishlatilganligi sababli bu erga kiritilgan, ammo ularning translyatsiyasi ularning qanday ishlatilishiga bog'liq emas va standart ularni shunchaki undoshlar bilan ro'yxatlaydi.

Murakkab unli belgilar ularning tarkibiy qismlariga muvofiq translyatsiya qilinadi.

Boshqa birlashtiruvchi belgilar

Tailandcha–่–้–๊–๋–็–์–๎–ํ–ฺ
ISO–̀–̂–́–̌–̆–̒~–̊–̥

Yozib oling yamakkan (- ๎) ustki tilda emas, balki oraliq tilde bilan ifodalanadi.

Tinish belgilari va raqamlar

Tailandcha
ISO«ǂ§ǀǁ»0123456789

ISO 11940: 1998 qisqartirish belgisini ajratib turadi paiyannoi (ฯ) gapni tugatuvchidan angkhandiao (ฯ), garchi na milliy belgilar standarti TIS 620-2533 na Unicode 5.0 versiyasi ularni ajratib turadi. Paiyannoy deb transliteratsiya qilingan ǂ va angkhandiao deb transliteratsiya qilingan ǀ. Yozib oling paiyannoi, angkhandiao va angkhankhu (๚) Uchun ishlatiladigan harflar bilan transliteratsiya qilingan undoshlarni bosing, ikki xanjar bilan emas, vertikal chiziqlar yoki dandalar.

Belgilar ketma-ketligi

Umuman olganda belgilar chapdan o'ngga va belgilar bir xil gorizontal holatga ega bo'lgan joylarda yuqoridan pastgacha translyatsiya qilinadi. Vertikal ketma-ketlik aslida oddiygina ohang belgilari va sifatida ko'rsatilgan tanxat (- ์) undoshning ustidagi yoki pastidagi boshqa har qanday belgilar oldida. 4.2-bo'lim oxirida standart bu kombinatsiyani rad etadi sara u (◌ ุ, ◌ ู) va nikxaxit (◌ ํ) paydo bo'lishi mumkin va keyin translyatsiyasini ko'rsatishda unga misol keltiradi nikxaxit, lekin kombinatsiyaning transliteratsiyasini ko'rsatmaydi. Ushbu qoidalarning ta'siri shundaki, bundan mustasno nikxaxit, Tailand tilidagi undoshga biriktirilgan barcha unli bo'lmagan belgilar, Rim translyatsiyasida undoshga biriktirilgan.

Standart buni qabul qiladi urinish oldindan qo'yilgan unli va undoshlarni ko'chirish odatlanib qolganlarga tasalli berishi mumkin Rim alifbosi, lekin oldindan qilingan unlilarni ko'chirmaslikni tavsiya qiladi.

Masalan, ภาษา ไทย (RTGSPhasa Thai) ga aylantirilishi kerak phhas̛̄āịthy va เชียงใหม่ (RTGSChiang May) ga echīnghyh̄m̀.

O'zgarishlar

Sabablari

Standartda urg'ularni yozish tartibi belgilanadi, ammo hamma kirish tizimlarida aksanlar yozilgan tartibda yozib olinmaydi. Unicode bir nechta aksanli harflar uchun ikkita normallashtirilgan shaklni belgilaydi va translyatsiya qilingan matn ushbu shakllardan birida saqlanishi mumkin. Bu avtomatik orqaga translyatsiyani murakkablashtiradi. Unicode-ga mos keladigan jarayonlar bunday o'zgarishlarni to'g'ri bajarishi kerakligi sababli, ushbu sahifadagi transliteratsiyalar ekranning qulayligi uchun tanlangan - hozirgi kundagi renderlash tizimlari teng shakllarni boshqacha ko'rsatishi mumkin.

Ko'p shriftlarda yangi undoshlar va aksanlarning yangi birikmalari yomon ko'rinadi. Masalan, institut Estoniya tili uchun standartning qo'llanilishini tushuntiradi Tailandcha Internetda va bitta istisno bilan bu standartga mos keladigan ko'rinadi. Istisno shundaki, makrondan tashqari, undoshlar ustidagi urg'u aslida o'ng tomonga siljiydi va ular mos kelmaydigan belgilar sifatida kiritilganligi taassurot qoldiradi. Standart kodli punktlarda translyatsiyani belgilaydi, ammo bu bepul tushuntirish asosida ishlaydigan kishi ohang urg'usining oraliq shakllaridan foydalanish kerakligini osonlikcha xulosa qilishi mumkin.

ICU (CLDR 1.4.1)

The ICU dasturining 1.4.1-versiyasida qayd etilgan Oddiy mahalliy ma'lumotlar ombori homiysi Unicode,[1] undoshlar translyatsiyasida shox o‘rniga tubdan foydalanadi. Bu ฅ ning translyatsiyasiga ta'sir qiladi xon, ฒ th phuthao va ษ shuning uchun bo ruesi. ฏ patak qilmoq kabi, boshqacha tarzda transliteratsiya qilingan dan ko'ra .

Ushbu dastur ำ ni transliteratsiya qiladi o'rniga å gipotetik tay skriptlari ketma-ketligi bilan noaniqlikni oldini olish uchun ะํ (sara a, nikxaxit). ICU dasturi transl ni transliteratsiya qiladi beshinchi kabi ˌbilan bog'liq muammolarni oldini olish o'rniga Unicode normalizatsiya. Bu notekis undoshga qo'llanganda o'qish qobiliyatini yaxshilashning yon ta'siri bor.

ICU dasturi transl ni transliteratsiya qiladi paiyannoi kabi (ikki xanjar) va angkhankhu kabi || (ikkita ASCII vertikal chiziq). ICU dasturi Unicode-dan foydalanganligi sababli, uni ishonchli tarzda ajrata olmaydi angkhandiao dan paiyannoi semantik tahlilsiz va bunday urinish qilmaydi.

ICU dasturining belgilar ketma-ketligi boshqacha. U oldindan hosil qilingan unlilarni quyidagi undosh bilan transpozitsiya qiladi va undoshdagi belgilarni ular xotirada saqlanish tartibida qayta ishlaydi. (Taylandcha kiritish usullarining aksariyati belgilar pastdan yuqoriga qarab saqlanishini ta'minlaydi.) To'liq undosh klasterlari bilan oldindan tayyorlangan unlilarni ko'chirmaydi; undosh klasterlarni to'liq aniqlik bilan aniqlash mumkin emas va unlilarni klasterlar bilan almashtirish Tayland yozuviga qaytish uchun qo'shimcha belgini talab qiladi.

Masalan, ushbu dastur doirasida ภาษา ไทย transliteratsiya qiladi p̣hās̄ʹāthịy va เชียงใหม่ ga cheīyngh̄ym̀.

Va nihoyat, ushbu dastur translatsiyalarni yaratadi Unicode Normalizatsiya S shakli (NFC).

Shuningdek qarang

Adabiyotlar

  1. ^ http://unicode.org/Public/cldr/1.4.1/core.zip fayllar o'zgartiradi / ThaiLogical-Latin.xml va o'zgartiradi / Thai-ThaiLogical.xml (foydalanadigan ICU translyatorlari "Tailand-Lotin" va "Lotin-Tailand")

Tashqi havolalar