Matn mazmuni - Textual entailment

Matn mazmuni (TE) ichida tabiiy tilni qayta ishlash matn parchalari orasidagi yo'naltiruvchi munosabatdir. Aloqalar bitta matn parchasining haqiqati boshqa matndan kelib chiqqanda amalga oshiriladi. TE doirasida, jalb qilingan va jalb qilingan matnlarga atama berilgan matn (t) va gipoteza (h) navbati bilan. Matnni jalb qilish toza bilan bir xil emas mantiqiy sabab - bu yanada qulayroq ta'rifga ega: "t sabab bo'ladi h" (th) agar odatda odam o'qisa t degan xulosaga keladi h ehtimol haqiqatdir.[1] (Shu bilan bir qatorda: th agar va faqat, odatda, inson o'qishi bo'lsa t tomonidan ifoda etilgan taklifni xulosa qilishda oqlanadi h tomonidan ifodalangan taklifdan t.[2]) Munosabat yo'naltirilgan, chunki "t sabab bo'ladi h", teskari"h sabab bo'ladi t"juda kam aniq.[3][4]

Ushbu munosabatlarning mavjudligini aniqlash norasmiy vazifa bo'lib, ba'zida rasmiy vazifalar bilan qoplanadi rasmiy semantik (qat'iy shartni qondirish odatda unchalik qattiq bo'lmagan shartni qondirishni anglatadi); qo'shimcha ravishda, matnga bog'liqlik qisman qisqartiriladi so'zni keltirib chiqarish.

Misollar

Matnni uch xil munosabatlarning misollari bilan tasvirlash mumkin:[5]

A misoli ijobiy TE (matn farazni keltirib chiqaradi) bu:

  • matn: Agar siz muhtojlarga yordam bersangiz, Xudo sizga mukofot beradi.
gipoteza: Kambag'al odamga pul berish yaxshi oqibatlarga olib keladi.

A misoli salbiy TE (matn gipotezaga zid keladi) bu:

  • matn: Agar siz muhtojlarga yordam bersangiz, Xudo sizga mukofot beradi.
gipoteza: Kambag'al odamga pul berishning oqibati yo'q.

A misoli TE bo'lmagan (matn sabab bo'lmaydi va qarama-qarshi emas) bu:

  • matn: Agar siz muhtojlarga yordam bersangiz, Xudo sizga mukofot beradi.
gipoteza: Kambag'al odamga pul berish sizni yaxshi odamga aylantiradi.

Tabiiy tilning noaniqligi

Tabiiy tilning o'ziga xos xususiyati shundaki, aytmoqchi bo'lgan narsani bayon qilishning turli xil usullari mavjud: bitta matnda bir nechta ma'no bo'lishi mumkin va bir xil ma'no turli xil matnlarda ifodalanishi mumkin. Semantik ifodaning bu o'zgaruvchanligini til noaniqligining ikki tomonlama muammosi sifatida ko'rish mumkin. Ular birgalikda a ko'p-ko'p til iboralari va ma'nolari o'rtasida xaritalash. Vazifasi parafrazlash ikki matn bir xil ma'noga ega bo'lganligini tan olishni va deyarli bir xil ma'lumotni etkazadigan o'xshash yoki qisqaroq matnni yaratishni o'z ichiga oladi. Matnni jalb qilish shunga o'xshash[6] lekin munosabatlarni bir tomonlama bo'lishi uchun zaiflashtiradi. Matnni jalb qilish uchun matematik echimlar ushbu aloqaning yo'naltirilgan xususiyatiga asoslanib, tegishli matnlarning ba'zi yo'nalish o'xshashliklari o'rtasida taqqoslash orqali amalga oshirilishi mumkin.[4]

Yondashuvlar

Matnni jalb qilish choralari tabiiy tilni tushunish chunki matnni semantik talqin qilishni so'raydi va uning umumiyligi tufayli tadqiqotning faol yo'nalishi bo'lib qolmoqda. Kabi ko'plab yondashuvlar va yondashuvlarni takomillashtirish ko'rib chiqildi so'zni kiritish, mantiqiy modellar, grafik modellar, qoidalar tizimlari, kontekstli fokuslash va mashinada o'rganish.[6] Amaliy yoki keng ko'lamli echimlar ushbu murakkab usullardan qochadi va buning o'rniga faqat sirt sintaksisini yoki leksik munosabatlarni qo'llaydi, ammo shunga mos ravishda unchalik aniq emas.[3] Biroq, hatto zamonaviy tizimlar ham hali ham odamlarning ishlashidan uzoqdir; tadqiqotda odamlarning 95,25% ma'lumotlar bazasi bo'yicha kelishuvga erishganligi aniqlandi,[7] 2016 yilda algoritmlar hali 90% ga erishmagan bo'lsa.[8]

Ilovalar

Kabi ko'plab tabiiy tillarni qayta ishlash dasturlari savolga javob berish, ma'lumot olish, umumlashtirish, ko'p hujjat umumlashtirish va baholash mashina tarjimasi tizimlar, ma'lum bir maqsad ma'nosi turli xil matn variantlaridan kelib chiqishi mumkinligini anglashlari kerak. Odatda, bu katta tizimning bir qismi sifatida ishlatiladi, masalan, ahamiyatsiz yoki aniq bashoratlarni filtrlash uchun bashorat qilish tizimida.[9]

Shuningdek qarang

Adabiyotlar

  1. ^ Ido Dagan, Oren Glikman va Bernardo Magnini. Matnni jalb qilish bo'yicha taniqli PASCAL tanlovi, p. 2018-04-02 121 2 ichida: Kinonero-Kandela, J.; Dagan, I .; Magnini, B .; d'Alche-Buc, F. (nashr) Mashinada o'qitishning muammolari. Kompyuter fanidan ma'ruza matnlari, Jild 3944, 177-190 betlar, Springer, 2006 y.
  2. ^ Korman, Daniel Z.; Mak, Erik; Jett, Jeykob; Renear, Allen H. (2018-03-09). "Matn mazmunini aniqlash". Axborot fanlari va texnologiyalari assotsiatsiyasi jurnali. 69 (6): 763–772. doi:10.1002 / asi.24007. ISSN  2330-1635.
  3. ^ a b Dagan, I. va O. Glikman. "Ehtimoliy matnli sabab: til o'zgaruvchanligini umumiy amaliy modellashtirish" ichida: Matnni tushunish va qazib olishni o'rganish usullari bo'yicha PASCAL seminari (2004) Grenobl.
  4. ^ a b Tătar, D. e.a. Yo'nalish aloqasi sifatida matnni jalb qilish
  5. ^ Matnni jalb qilish portali ustida Kompyuter tilshunosligi assotsiatsiyasi wiki
  6. ^ a b Androutsopulos, Ion; Malakasiotis, Prodromos (2010). "Parafrazing va matnni jalb qilish usullari bo'yicha so'rov" (PDF). Sun'iy intellekt tadqiqotlari jurnali. 38: 135–187. arXiv:0912.3747. doi:10.1613 / jair.2985. Olingan 13 fevral 2017.
  7. ^ Bos, Yoxan; Markert, Katja (2005 yil 1-yanvar). "Mantiqiy xulosalar yordamida matnni tanib olish" (PDF). Inson tili texnologiyasi va tabiiy tilni qayta ishlashda empirik usullar bo'yicha konferentsiya materiallari: 628–635. doi:10.3115/1220575.1220654. Olingan 13 fevral 2017.
  8. ^ Chjao, Kay; Xuang, Liang; Ma, Mingbo (2017 yil 4-yanvar). "Tarkibiy diqqat va kompozitsiya bilan matnli jalb qilish". arXiv:1701.01126 [cs.CL ].
  9. ^ Shani, Ayelett (2013 yil 25-oktabr). "Doktor Kira Radinskiy qanday qilib Misrdagi tartibsizliklarni bashorat qilish uchun algoritmlardan foydalangan". Haaretz. Olingan 13 fevral 2017.

Tashqi havolalar