Gibrid mashina tarjimasi - Hybrid machine translation - Wikipedia

Gibrid mashina tarjimasi usuli hisoblanadi mashina tarjimasi bu bitta mashina tarjimasi tizimida bir nechta mashinaviy tarjima yondashuvlaridan foydalanish bilan tavsiflanadi. Gibrid mashina tarjima tizimlarini rivojlantirish motivatsiyasi har qanday texnikaning qoniqarli darajada aniqlikka erisha olmaslikidan kelib chiqadi. Ko'pgina gibrid mashinali tarjima tizimlari tarjimalarning aniqligini oshirishda muvaffaqiyat qozondi va gibrid usullarni qo'llaydigan bir nechta mashhur mashinali tarjima tizimlari mavjud. Ular orasida PROMT, SISTRAN va Omniscien Technologies (sobiq Asia Online).

Yondashuvlar

Ko'p motorli

Gibrid mashina tarjimasiga ushbu yondashuv bir nechta mashina tarjima tizimlarini parallel ravishda ishlashni o'z ichiga oladi. Yakuniy chiqish barcha quyi tizimlarning natijalarini birlashtirish orqali hosil bo'ladi. Odatda, ushbu tizimlar statistik va qoidalarga asoslangan tarjima quyi tizimlaridan foydalanadilar,[1] ammo boshqa kombinatsiyalar o'rganildi. Masalan, tadqiqotchilar Karnegi Mellon universiteti birlashtirilib, bir nechta muvaffaqiyatga erishdilar misollarga asoslangan, transferga asoslangan, bilimga asoslangan va statistik tarjima quyi tizimlarini bitta mashinaga tarjima tizimiga o'tkazish.[2]

Statistik qoidalarni yaratish

Ushbu yondashuv ishlab chiqarish uchun statistik ma'lumotlardan foydalanishni o'z ichiga oladi leksik va sintaktik qoidalar. So'ngra kirish ushbu qoidalar bilan xuddi a kabi qayta ishlanadi qoidalarga asoslangan tarjimon.[1] Ushbu yondashuv ushbu qoidalarni o'quv korpusidan chiqarib, har tomonlama, nozik lingvistik qoidalar to'plamini yaratish qiyin va ko'p vaqt talab qiladigan vazifadan qochishga harakat qiladi. Ushbu yondashuv hali ham odatdagi ko'plab muammolardan aziyat chekmoqda statistik mashina tarjimasi, ya'ni tarjimaning aniqligi, kirish matnining o'quv korpusi matni bilan o'xshashligiga juda bog'liq bo'ladi. Natijada, ushbu uslub domenga xos dasturlarda eng ko'p muvaffaqiyatga erishdi va domenga moslashishda ham ko'p qiyinchiliklarga duch keldi statistik mashina tarjimasi tizimlar.[3]

Ko'p o'tish

Ushbu yondashuv kiritishni ketma-ket qayta ishlashni o'z ichiga oladi. Mashinalarni translatsiya qilishning ko'p o'tish tizimlarida qo'llaniladigan eng keng tarqalgan usul oldingi jarayon a bilan kirish qoidalarga asoslangan mashina tarjima tizimi. Qoidalarga asoslangan oldingi protsessorning chiqishi a ga uzatiladi statistik mashina tarjimasi yakuniy mahsulotni ishlab chiqaradigan tizim. Ushbu uslub statistika tizimiga kerak bo'lgan ma'lumotlarning hajmini cheklash va qayta ishlash quvvatini sezilarli darajada kamaytirish uchun ishlatiladi. Bundan tashqari, qoidalarga asoslangan tizim til uchun to'liq tarjima tizimi bo'lishi zarurligini olib tashlaydi, bu tizimni yaratish uchun inson kuchi va mehnat sarfini sezilarli darajada kamaytiradi.[4]

Ishonchga asoslangan

Ushbu yondashuv boshqa gibrid yondashuvlardan farq qiladi, chunki ko'p hollarda faqat bitta tarjima texnologiyasidan foydalaniladi. Har bir tarjima qilingan jumla uchun ishonch metrikasi ishlab chiqiladi, undan ikkinchi darajali tarjima texnologiyasini sinab ko'rish yoki dastlabki tarjima natijalarini davom ettirish to'g'risida qaror qabul qilinishi mumkin. Omniscien Technologies ushbu yondashuvni qo'llaydigan bitta kompaniya bo'lib, NMT asosiy texnologiya hisoblanadi, ammo ishonch ballari chegaradan pastroq bo'lsa yoki gapning uzunligi juda qisqa bo'lsa (ya'ni 1 yoki 2 so'z), SMTga qaytadi. SMT shuningdek, diqqatni jalb qilish mexanizmi chalkashganda NMT bilan odatdagidek bir nechta takroriy so'zlar kabi ketma-ket paydo bo'ladigan keng tarqalgan xato naqshlari ishlatiladi.

Shuningdek qarang

Adabiyotlar

  1. ^ a b Xattins, J. 2007 yil. Mashinada tarjima: qisqacha tarix. Kompyuter yordamida tarjima: Nazariya va amaliyot.
  2. ^ Hogan, C. va Frederking, R. 1998. Ko'p motorli MT arxitekturasini baholash. Kompyuter fanidan ma'ruza matnlari, 1529 113-123 betlar.
  3. ^ Chang, J. va Su, K. 1997. Tayvanda korpusga asoslangan statistikaga asoslangan (CBSO) mashinalarni tarjima qilish bo'yicha tadqiqotlar. AMTA (1997), 165-173-betlar.
  4. ^ Hovy, E. 1996 yil. Hikmatni yoki murosasiz tamoyillarni chuqurlashtirish - statistik va ramziy MT tizimlarini duragaylash. IEEE mutaxassisi, 11 (2), 16-18 betlar.