Indik hisoblash - Indic computing

Indikiy hisoblash "hisoblash" degan ma'noni anglatadi Indik "ya'ni hind yozuvlari va tillari. Bu rivojlanishni o'z ichiga oladi dasturiy ta'minot yilda Hind tilidagi skriptlar / tillar, Kirish usullari, Mahalliylashtirish kompyuter dasturlari, veb-ishlab chiqish, Ma'lumotlar bazasini boshqarish, Imlo tekshirgichlari, Matndan nutq va Nutqqa matn ilovalar va OCR hind tillarida.

Keng qo'llaniladigan hind yozuvlarining aksariyati kodlangan Unicode kompyuterlar va Internetda ishlash uchun. 10.0 versiyasidan boshlab, Bengal tili, Devanagari, Gujarati, Gurmuxi, Kannada, Limbu, Malayalam, Masaram Gondi,[1] Nevari, Ol Chiki, Oriya, Sinxala, Tamilcha va Telugu skriptlar kodlangan va qo'llab-quvvatlanadi. Kabi tarixiy qo'llanilgan yozuv tizimlari Arvi,[2] Ahom alifbosi,[2] Granta,[3] Xudabodiy,[3] Mahajani,[3] Modi alifbosi,[3] Siddxem ssenariysi,[3] Siloti Nagri,[4] Tirxuta[3] shuningdek, kiritilgan. Yana hindcha skriptlar ishlab chiqilmoqda va masalan, unicode-ga kiritiladi Tulu ssenariysi.

Indic Computing bo'yicha ko'plab loyihalar amalga oshirilmoqda. Ularga ba'zi davlat sektori kompaniyalari, ba'zi bir ko'ngillilar guruhlari va ayrim odamlar jalb qilingan.

Davlat sektori

Hindiston Ittifoqi hukumati Hindistonda telefonlari ishlab chiqarilgan, saqlangan, sotilgan va tarqatilgan uyali aloqa kompaniyalari uchun matnni o'qishni qo'llab-quvvatlashni majburiy qildi. barchasi 22 tilda.[5] Ushbu qadam millionlab foydalanuvchilar tomonidan hind tillaridan foydalanishning ko'payishiga olib keldi.[6]

TDIL

The Elektron va axborot texnologiyalari kafedrasi, Hindiston tashabbusi bilan TDIL[7] (Hind tillari uchun texnologiyalarni ishlab chiqish) til bilan to'siqsiz inson va mashinaning o'zaro ta'sirini osonlashtirish uchun Axborotni qayta ishlash vositalari va usullarini ishlab chiqish; ko'p tilli bilim resurslarini yaratish va ulardan foydalanish; va ularni innovatsion foydalanuvchi mahsulotlari va xizmatlarini ishlab chiqish uchun birlashtirish.

2005 yilda u hukumat / akademik / xususiy kompaniyalar tomonidan ishlab chiqilgan tijorat maqsadlarida foydalanish uchun kompakt-disk shaklida dasturiy ta'minot vositalarini tarqatishni boshladi.

TDIL dasturining ba'zi natijalari hind tili texnologiyalarini tarqatish va tarqatish markaziga joylashtirilgan. Ushbu markaz TDIL mablag'lari hisobidan ishlab chiqilgan barcha lingvistik manbalarni, vositalarni va dasturlarni tarqatadi. Ushbu dastur doktor Svaran Lata boshchiligida tobora kengayib bordi, u dasturning xalqaro nashrlarini ham yaratdi.

C-DAC

C-DAC bu Hindiston til bilan bog'liq dasturiy ta'minotni ishlab chiqishda ishtirok etadigan davlat dasturiy ta'minot kompaniyasi. Bu rivojlanish uchun eng yaxshi ma'lum InScript klaviaturasi, hind tillari uchun standart klaviatura. Shuningdek, u hind tilidagi ko'plab echimlarni ishlab chiqdi, shu jumladan Word Protsessorlari, matn terish vositalari, matnni nutq dasturiga, OCR hind tillarida va boshqalar.

BharateeyaOO.org

CDAC-dan ishlab chiqilgan ish, Bangalor (ilgari NCST, Bangalor nomi bilan tanilgan) BharateeyaOO bo'ldi.[8] OpenOffice 2.1 10 dan ortiq hind tillarini qo'llab-quvvatladi.

BOSS

BOSS DIT tashabbusi bilan bepul / ochiq kodli dasturiy ta'minot uchun Milliy Resurs Markazi tomonidan ishlab chiqilgan. Uning faoliyati C-DAC Chennai va Anna universiteti KBC tadqiqot markazi tomonidan muvofiqlashtiriladi. Foydalanuvchilarni qo'llab-quvvatlash uchun Hindistonning bir nechta shaharlarida Yordam markazlari tashkil etilgan.

NNT va ko'ngillilar guruhlari

Indlinux

Indlinux tashkilot Linuxning turli xil indikatsion tillari va uning ilovalari ustida ishlaydigan individual ko'ngillilarni tashkil qilishga yordam berdi.

Sarovar

Sarovar.org bu Hindiston Bepul / Ochiq kodli litsenziyalar ostida loyihalarni joylashtirish uchun birinchi portal. U joylashgan Trivandrum, Hindiston va Asianet ma'lumotlar markazida joylashtirilgan. Sarovar.org Linuxense tomonidan jamoat xizmatlarining bir qismi sifatida moslashtirilgan, o'rnatiladi va saqlanadi va River Valley Technologies homiyligida. Sarovar.org Debian Etch va GForge-da yaratilgan va METTLE-dan ishlaydi.

Pinaak

Pinaak - bu hind tilida hisoblash bilan shug'ullanadigan nodavlat xayriya jamiyati. U dasturiy ta'minotni mahalliylashtirish, til dasturlarini ishlab chiqish, ochiq kodli dasturiy ta'minotni mahalliylashtirish, onlayn entsiklopediyalarni boyitish va hk. Uchun ishlaydi. Bundan tashqari, Pinaak odamlarni hisoblash, Internetdan axloqiy foydalanish va Hind tillari Internetda.

Ankur guruhi

Ankur Group Bengal tilini qo'llab-quvvatlashga harakat qilmoqda (Bengal tili ) ustida Linux operatsion tizim, shu jumladan mahalliy Bengal GUI, Jonli CD, Ingliz tilidan bengal tiliga tarjimon, bengal tili OCR va Bengalcha lug'at va boshqalar.[9]

BxashaIndia

SMC

SMC bepul dasturiy ta'minot guruhi bo'lib, Keralada tillar o'rtasidagi bo'linishni bartaraf etish uchun ishlaydi va bugungi kunda Hindistondagi eng yirik tillarni hisoblash jamoasidir.[10]

Kirish usullari

Reverie klaviaturasi Android-da yozish uchun qo'llab-quvvatlanadigan hind tillarini ro'yxatlaydi

To'liq o'lchamdagi klaviaturalar

Kelishi bilan Unicode hind matnini kompyuterga kiritish juda oson bo'ldi. Buning uchun bir qator usullar mavjud, ammo ulardan asosiylari: -

InScript

Yozuv hind tillari uchun standart klaviatura. Tomonidan ishlab chiqilgan C-DAC va Hindiston hukumati tomonidan standartlashtirilgan. Hozirgi kunda u barcha asosiy operatsion tizimlarda, shu jumladan o'rnatilgan Microsoft Windows (2000, XP, Vista, 7), Linux va Macintosh.

Fonetik translyatsiya

Bu matn terish usuli, masalan foydalanuvchi hind tilidagi matnni yozadi Rim belgilar va fonetik ravishda real vaqt rejimida hind yozuvidagi ekvivalent matnga aylantirildi. Ushbu turdagi konvertatsiya fonetik matn muharrirlari, matn protsessorlari va dastur plaginlari tomonidan amalga oshiriladi. Fikrga asoslanib, fonetikadan foydalanish mumkin IME imkon beradigan vositalar Indik har qanday dasturga kiritiladigan matn.

Fonetik translyatorlarning ayrim misollari Xlit, Google Indic Transliteration, BarahaIME, Indik IME, Rupantar, SMC ning Indic Keyboard va Microsoft hind tiliga kirish vositasi. SMC Hind klaviaturasi 23 tilni qo'llab-quvvatlaydi, Google hind klaviaturasi esa faqat 11 hind tilini qo'llab-quvvatlaydi.[10]

Ularni quyidagicha tasniflash mumkin:

Remington (yozuv mashinasi)

Ushbu maket hind tillari bilan ixtiro qilinmagan yoki joylashtirilmagan paytlarda ishlab chiqilgan va yozuv mashinalari hind yozuvlarida matn terishning yagona vositasi bo'lgan. Yozish mashinalari mexanik bo'lgani uchun va skript protsessor dvigatelini o'z ichiga olmaydi, har bir belgi klaviaturada alohida joylashtirilishi kerak edi, natijada klaviatura tartibini o'rganish juda murakkab va qiyin bo'ldi.

Kelishi bilan Unicode, Remington maketi orqaga qarab muvofiqligi uchun har xil terish vositalariga qo'shildi, shuning uchun eski yozuv mashinalari yangi klaviatura tartibini o'rganishlari shart emas edi. Hozirgi kunda ushbu maketdan faqat bir necha yillik foydalanish tufayli ushbu maketga odatlanib qolgan eski yozuv mashinalari foydalanadilar. Remington tartibini o'z ichiga oladigan vositalardan biri Indik IME. Remington klaviatura tartibiga asoslangan shrift Kruti Dev. Kruti Dev yordamida eski Remington klaviatura tartibini yaqindan qo'llab-quvvatlaydigan yana bir onlayn vosita Remington Typing vositasidir.

Brayl shrifti

Yetti hind tilini qo'llab-quvvatlovchi IBus Sharada Brayl shrifti tomonidan ishlab chiqilgan SMC.[10]

Raqamli klaviaturali mobil telefonlar

Nokia 1108 hind

Mobil / qo'l / uyali telefonlarning asosiy modellarida oddiy eski telefon klaviaturasi kabi 12 ta kalit mavjud. Ma'lumotlarni ingliz tilida kiritishni osonlashtirish uchun har bir kalit 3 yoki 4 inglizcha harflar bilan taqqoslanadi. Ushbu turdagi klaviatura bilan hind tillarini kiritish uchun buning ikki yo'li mavjud. Birinchidan, ko'p tegish usuli, ikkinchisi esa Panini klaviaturasi kabi vizual yordamdan foydalanadi. Asosiy foydalanish SMS. Ingliz / rim tillari uchun ishlatiladigan 140 ta belgidan Unicode-da faqat 70 ga yaqin til belgilarini joylashtirish uchun foydalanish mumkin[11] Xususiy kompressiya hind kabi murakkab skript tillari uchun bitta xabar hajmini oshirish uchun bir necha bor ishlatiladi. Tadqiqot[12] Tavsiya etilgan standartning mavjud usullari va tavsiyalaridan Hindistonning Keng tarmoqli simsiz konsortsiumi (BWCI) tomonidan chiqarilgan.

Transliteratsiya / Fonetik usullar

Ingliz tili hind tillarida matn terish uchun ishlatiladi.QuillPad[13]IndiSMS[14]

Mahalliy usullar

Mahalliy usullarda tilning harflari ekranda raqamlar tugmachalariga mos ravishda ushbu til uchun ushbu harflarning ehtimoli asosida ko'rsatiladi. Qo'shimcha harflarga maxsus kalit yordamida kirish mumkin. So'z qisman terilganda, foydalanuvchi tanlovni amalga oshirishi mumkin bo'lgan variantlar taqdim etiladi.[15]

Qwerty klaviaturali aqlli telefonlar

Ko'pgina aqlli telefonlarda asosan 35 ta kalit mavjud bo'lib, ular asosan ingliz tilida ishlaydi. Raqamlarga va ba'zi belgilarga Alt deb nomlangan maxsus tugma orqali erishiladi. Ushbu turdagi telefonlar uchun indikator kiritish usullari hali qo'llab-quvvatlanmaydi Unicode ko'rsatish uchun keng foydalanish mumkin emas.

Yumshoq / Virtual klaviaturali aqlli telefonlar uchun

Inscript aqlli telefondan foydalanish uchun qabul qilinmoqda. Hind tillarini taqdim eta oladigan Android telefonlari uchun Swalekh ko'p tilli klaviatura[16] Multiling Keyboard dasturi[17][18] mavjud. Gboard bir nechta hind tillarini qo'llab-quvvatlashni taklif qiladi.[19]

Mahalliylashtirish

Mahalliylashtirish deganda hind tilida dasturiy ta'minot, operatsion tizim, veb-sayt va boshqalarni tarjima qilish tushuniladi. Ushbu yo'nalishda turli xil ko'ngillilar guruhlari ishlamoqda.

Mandrake Tamil versiyasi

Ajoyib misol - Mandrake linuxining Tamil tilidagi versiyasi. Tamil tilida so'zlashuvchilar Toronto (Kanada) ozod qilindi Mandrake, GNU / Linux dasturi, Tamil versiyasi bilan chiqadi.[20] Shuni ta'kidlash kerakki, barcha xususiyatlarga Tamil tilida kirish mumkin. Shu bilan Tamil tilini biladiganlar uchun kompyuterlardan foydalanish uchun ingliz tilini bilish sharti bekor qilindi.

IndLinux

IndLinux - bu tarjima qilishni maqsad qilgan ko'ngilli guruh Linux operatsion tizim hind tillariga. Ushbu guruhning sa'y-harakatlari bilan Linux deyarli hind va boshqa hind tillarida mahalliylashtirildi.

Nipun

Nipun - bu turli xil dasturlarni tarjima qilishga qaratilgan onlayn tarjima tizimi Hind. Bu qismdir Akshargram tarmog'i.

Veb-saytlarni mahalliylashtirish

GoDaddy veb-saytini mahalliylashtirdi Hind, Marati va Tamilcha Shuningdek, IVR uchun qo'ng'iroq hajmining 40% hind tillarida ekanligini ta'kidladilar.[21]

Hind bloglari

Hind bloglari hind tillarida blog yuritishni anglatadi. Bloglarni hind tillarida yuritishni targ'ib qilish bo'yicha turli harakatlar amalga oshirildi.

Ijtimoiy tarmoqlar

Ba'zi ijtimoiy tarmoqlar hind tillarida ochilgan.[22]

Dasturlash

Indik dasturlash tillari

Ramkalar

Gherkin, mashhur Domenga xos til Gujarati, Hind, Kannada, Panjob, Tamil, Telugu va Urdu tillarini qo'llab-quvvatlaydi[23]

Kutubxonalar

Tabiiy tilni hind tillarida qayta ishlash avj olmoqda. INLTK, StanfordNLP kabi bir nechta kutubxonalar mavjud.[24]

Tarjima

Google hind, benqal, marathi, Tamil, Telugu, Gujarati, Panjob, Malayalam va Kannada uchun tarjima qilishning yaxshilangan xususiyatlarini taklif etadi.[19] oflayn qo'llab-quvvatlash bilan ham.[25] Microsoft shuningdek ushbu tillarning ba'zilari uchun tarjima qilishni taklif qiladi.

Dasturiy ta'minot

Hind tillari to'plami

Tomonidan birgalikda tashkil etilgan simpoziumda FICCI va TDIL, Hindiston hukumati elektron va axborot texnologiyalari vazirligi kotibi janob Ajay Prakash Savnining so'zlariga ko'ra, Indian Language Stack aloqa to'siqlarini engishga yordam beradi.[26] Unda hind tillaridagi suhbat sun'iy intellekti uchun zarur bo'lgan turli xil dasturiy ta'minot texnologiyalari va dasturlarni yaratish uchun mos kirish nuqtalarining qatlamlari taqdim etilishi kerak.[27]

Imlo tekshiruvchilari

Transliteratsiya vositalari

Transliteratsiya vositalari foydalanuvchilarga boshqa skriptdagi matnni o'qishga imkon beradi. Hozirda, Aksharamuxa ko'pgina hind yozuvlariga ruxsat beruvchi vositadir. Google ham taklif qiladi Indikali translyatsiya. Ushbu skriptlarning har qandayidan olingan matn boshqa har qanday skriptga aylantirilishi mumkin va aksincha. Google va Microsoft lotin harflaridan hind yozuvlariga o'tish imkoniyatini beradi.

Matndan nutqqa

Karnegi Mellon universiteti, Hear2Read loyihasi bilan hamkorlikda ko'r-ko'zi ojizlarga mahalliy hind tillarida matn tinglashda yordam beradigan matndan nutqqa (TTS) dastur yaratdi. Ayni paytda, Tamilcha taklif qilinmoqda va hind, bengal, gujarati, marati, kannada, panjob va telugu tillarida nashrlar 2016 yilning qolgan qismida kutilmoqda.[28]

Nutqdan matngacha

Xalqaro domen nomlari

Operatsion tizimlar

Elektron pochta

Microsoft Inc. hind, benqal va tamil elektron pochta manzillarini qo'llab-quvvatlaydi. Kelajakda boshqa hind tillarini ham o'z ichiga olishi kutilmoqda.

Virtual yordamchilar

AIga asoslangan virtual yordamchilar Google yordamchisi turli hind tillarini qo'llab-quvvatlaydi.

Foydalanish va o'sish

Ga binoan GoDaddy, Hind, Marati va Tamilcha tillar Hindiston internet-trafikining 61 foizini tashkil etdi.[21] Onlayn tarkibning 1 foizdan kamrog'i hind tillarida. Yangi yaratilgan eng yaxshi ilovalar bir nechta hind tillarini qo'llab-quvvatlaydi va / yoki hind tilidagi tarkibni targ'ib qiladi. Hindiston foydalanuvchilarining 61% WhatsApp u bilan muloqot qilish uchun birinchi navbatda o'z ona tillaridan foydalaning.[29] Yaqinda o'tkazilgan tadqiqotlar shuni ko'rsatdiki, Internetni o'zlashtirish Tamil, hind, Kannada, Bengal, Maratiy, Telugu, Gujarati va Malayalam kabi mahalliy tillar orasida eng yuqori ko'rsatkichdir. Hisob-kitoblarga ko'ra, marathi, bengal, tamil va telugu mamlakatdagi mahalliy tillarda so'zlashadigan foydalanuvchilar sonining 30 foizini tashkil qiladi. Ayni paytda Tamil 42% da Internetni qabul qilish darajasi bo'yicha eng yuqori ko'rsatkichga ega, undan keyin 39% hindcha va 37% Kannada.[30] Intex mintaqaviy tillardan foydalanishning 87% hind, bengal, tamil, gujarati va marati tillarida so'zlashuvchilarga tegishli ekanligini xabar qildi.[6] Lava mobillari Tamil va Malayalam telefonlarida hind tilidan ham ko'proq mashhurligi haqida xabar berishdi.[6]

Shuningdek qarang

Adabiyotlar

  1. ^ Unicode 10.0
  2. ^ a b Unicode 8.0
  3. ^ a b v d e f Unicode 7.0
  4. ^ Unicode 4.1
  5. ^ Indik tilidagi telefonlarni ishlab chiqarish muddati 2017 yil 1 oktyabrgacha uzaytirildi
  6. ^ a b v Markazning mintaqaviy tilni qo'llab-quvvatlashga bo'lgan intilishi - Hindu biznes yo'nalishi
  7. ^ "TDIL: Hind tillari uchun texnologiyalarni rivojlantirish dasturi, Hindiston". Arxivlandi asl nusxasi 2015 yil 23 martda. Olingan 28 mart 2015.
  8. ^ "BharateeyaOOo". Olingan 28 mart 2015.
  9. ^ "Ankur uyining arxivi". Ankur guruhi, Bengalinux.org guruhi. Arxivlandi asl nusxasi 2005 yil 29 mayda. Olingan 26 dekabr 2015.
  10. ^ a b v Malayalam tiliga raqamli sakrashda yordam berish - Yangi Indian Express
  11. ^ "Quillpad Mobile - tez-tez so'raladigan savollar". Arxivlandi asl nusxasi 2015 yil 2 aprelda. Olingan 28 mart 2015.
  12. ^ "Hind tilidagi SMS bo'yicha SIG hisoboti, 2010 yil noyabr". (PDF). Arxivlandi asl nusxasi (PDF) 2015 yil 2 aprelda. Olingan 11 noyabr 2011.
  13. ^ "Quillpad Mobile - mobil telefoningiz uchun hind SMS-ilovasi". Arxivlandi asl nusxasi 2015 yil 2 aprelda. Olingan 28 mart 2015.
  14. ^ "Eterno Infotech". Arxivlandi asl nusxasi 2015 yil 28 martda. Olingan 28 mart 2015.
  15. ^ "Uyali telefon klaviaturasi - Uyali telefon klaviaturasi - Uyali telefonda matn terish uchun klaviatura-Uyali telefon orqali yozish uchun klaviatura". Olingan 28 mart 2015.
  16. ^ Ushbu Bengaluraga asoslangan startap aqlli hind klaviaturasi - NDTV ni yaratganiga ishonadi
  17. ^ Xonso. "MultiLing Keyboard - Google Play-da Android ilovalari". Olingan 28 mart 2015.
  18. ^ Xonso. "Plugin Hindi tili - Google Play-da Android ilovalari". Olingan 28 mart 2015.
  19. ^ a b 9 ta hind tili uchun Google Translate, yana 11 ta klaviatura yordami - Live Mint
  20. ^ Frederik Noronha. "Hind tilidagi hisoblash: oldinga uzoq yo'l - Xususiyatlar - Texnologiya". Infochange Hindiston. Olingan 28 mart 2015.
  21. ^ a b GoDaddy hind, marathi va tamil tillarida xizmatlarni ishga tushiradi - EconomicTimes.com
  22. ^ Google va Facebook-ning Hindistonga e'tibor qaratishi hind hisobini tezlashtirishi mumkin - Live Mint
  23. ^ Gherkin tiliga ma'lumot
  24. ^ NLP TOP KUTUBXONALARI VA HIND TILLARI UCHUN MA'LUMOTLAR - Analytics India Mag
  25. ^ Google sizga 7 ta hind tiliga tarjima qilishga ruxsat beradi - Deccan Chronicle
  26. ^ Savni, Shri. Ajay Prakash (2018 yil 30-iyul). "Indian Language Stack aloqa to'siqlarini engib o'tish uchun zarur edi: IT kotibi". Matbuot Axborot byurosi GoI. Olingan 27 sentyabr 2020.
  27. ^ Bhārat Bhāṣā Stack uchun masala - Ovozli yordamchi va suhbatdosh sun'iy intellektning innovatsiyalari uchun hind tilidagi texnologik ekotizim
  28. ^ Carnegie Mellon universiteti (3-avgust 2016). "Android ilovasi Hindistonda ko'rish qobiliyati cheklanganlarga ona tillaridagi matnlarni tinglashga imkon beradi-CMU yangiliklari". Karnegi Mellon universiteti. Olingan 23 avgust 2016.
  29. ^ Biz hind internetini hali qurmaganmiz!
  30. ^ Faqat inglizcha vinglish yo'q: Hindistonda Internetga kiradigan 90% yangi Internet foydalanuvchilari ingliz tilida so'zlashmaydigan odamlardir