Yagona yo'nalish - Coreference

Yilda tilshunoslik, yadro, ba'zan yoziladi birgalikda ma'lumotnoma, matndagi ikki yoki undan ortiq iboralar bir kishiga yoki narsaga ishora qilganda yuz beradi; ular bir xil referent, masalan. Bill u kelishini aytdi; tegishli ism Bill va olmoshi u xuddi shu shaxsga, ya'ni Billga murojaat qiling.[1] Coreference asosidagi asosiy tushuncha majburiy sintaksis sohasidagi hodisalar. Majburiylik nazariyasi jumlalar va matnlardagi yadroli ifodalar o'rtasida mavjud bo'lgan sintaktik munosabatlarni o'rganadi. Ikki ibora asosiy ahamiyatga ega bo'lganda, odatda to'liq shakl bo'ladi (the oldingi ) va boshqasi qisqartirilgan shakl (a proform yoki anafora). Tilshunoslar, misolda i indeksida bo'lgani kabi, indekslardan foydalanib, yadro kuchini ko'rsatadi Billmen dedi umen kelardi. Bir xil ma'lumotga ega bo'lgan ikkita ibora koindexslangan, shuning uchun ushbu misolda Bill va u ular asosiy ma'lumot sifatida talqin qilinishi kerakligini ko'rsatib, koindexed qilingan.

Turlari

Asosiy konferentsiyani o'rganishda ko'plab farqlar mavjud, masalan. anafora, katafora, bo'linib ketgan avvalgi so'zlar, asosiy so'zlarni ifodalovchi ismli iboralar va boshqalar.[2] Muomala qilishda formulalar (olmoshlar, pro-fe'llar, pro-sifatlar va boshqalar), anafora va kataforani ajratib turadi. Proform o'zi murojaat qilgan iborani ta'qib qilganda, anafora mavjud (proform anafora), va u ilgari surilgan iboradan oldin bo'lsa, katafora mavjud (proform katafora). Ushbu tushunchalar quyidagicha tasvirlangan:

Anafora
a. Musiqamen juda baland edi umen zavqlana olmadi. - Anafora u u murojaat qilgan iborani (uning oldingi holatini) kuzatib boradi.
b. Bizning qo'shnilarimizmen musiqani yoqtirmaslik. Agar ularmen g'azablangan, tez orada politsiyachilar paydo bo'ladi. - anafora ular u murojaat qilgan iborani (uning oldingi holatini) kuzatib boradi.
Katafora
a. Agar ularmen musiqadan g'azablanadilar, qo'shnilarmen politsiyani chaqiradi. - katafora ular u murojaat qilgan iboradan oldin (uning postedenti).
b. Shunga qaramay unimen qiyinchilik, Vilmamen fikrni anglab yetdi. - katafora uni u murojaat qilgan iboradan oldin (uning postedenti)
Oldingi qismlarni ajratish
a. Kerolmen aytdi Bobmen partiyada qatnashish. Ularmen birga keldi. - anafora ular ikkalasini ham nazarda tutgan holda, bo'linish oldingi holatga ega Kerol va Bob.
b. Qachon Kerolmen yordam beradi Bobmen va Bobmen yordam beradi Kerolmen, ularmen har qanday vazifani bajara oladi. - anafora ular ikkalasini ham nazarda tutgan holda, bo'linib ketgan oldingi holatga ega Kerol va Bob.
Ism jumlalari
a. Loyiha rahbarimen yordam berishdan bosh tortmoqda. Jirkanchmen faqat o'zi haqida o'ylaydi. - Ism jumlalarining asosiy yo'nalishi, bu erda ikkinchi ism iborasi birinchisiga nisbatan predikatsiya hisoblanadi.
b. Ba'zi hamkasblarimiz1 qo'llab-quvvatlaydi. Bunday odamlar1 bizning minnatdorchiligimizni qozonadi. - Ism jumlalarining asosiy yo'nalishi, bu erda ikkinchi ism iborasi birinchisiga nisbatan predikatsiya hisoblanadi.

Qarama-qarshi o'zgaruvchilar

Semantikistlar va mantiqchilar ba'zan yadrolik va a deb nomlanuvchi narsalarni farqlaydilar bog'liq o'zgaruvchi.[3] Bog'langan o'zgaruvchining misoli asosiy qarama-qarshilikka o'xshash bo'lishi mumkin, ammo texnik nuqtai nazardan, u aslida bunday emasligini ta'kidlashi mumkin. Bog'lanish o'zgaruvchilari proformaga oldingi narsa noaniq miqdoriy ifoda bo'lganda paydo bo'ladi, masalan.[4]

a. Har bir talabamen oldi uningmen sinf. - olmosh uning chegaralangan o'zgaruvchiga misoldir
b. Talaba yo'qmen xafa bo'ldi uningmen sinf. - olmosh uning chegaralangan o'zgaruvchiga misoldir

Miqdoriy ifodalar kabi har bir talaba va talaba yo'q mos yozuvlar emas, balki texnik nuqtai nazardan. Mavzular har bir talaba va talaba yo'q grammatik jihatdan birlikdir, ammo ular nutq dunyosida bitta referentni tanlamaydilar. Shunday qilib egalik sifatdoshi bilan oldingi gaplardan beri uning ma'lumotnoma emas, buni ham aytish mumkin emas uning ma'lumotnoma. Buning o'rniga, kimdir buni aytadi o'zgaruvchan anavi bog'langan avvalgilariga ko'ra. Uning ma'lumotnomasi nutq dunyosidagi talabalarning qaysi biri haqida o'ylanishiga qarab farq qiladi. Agar Jek, Jon va Jerri so'zlashuv dunyosidagi uchta talaba bo'lsa, demak uning Jek, Djon yoki Jerri aqlning diqqat markazida ekanligiga qarab farq qiladi. Bog'langan o'zgaruvchilar mavjudligi quyidagi misol bilan yanada aniqroq ko'rinadi:

v. Faqat Jekmen yoqadi uningmen sinf. - olmosh uning chegaralangan o'zgaruvchi bo'lishi mumkin.

Ushbu jumla noaniq. Bu Jekning bahosini yoqtirishini anglatishi mumkin, ammo boshqalarning barchasi Jekning bahosini yoqtirmasligi mumkin yoki ehtimol bu Jekning bahosini yoqtiradi, lekin Jon uning (Jonning) bahosini va Jerri uning (Jerrining) bahosini yoqtirmaydi. Ikkinchi, tabiiyroq o'qish - bu o'zgaruvchan o'qish. Asosiy yadro va bog'langan o'zgaruvchilar o'rtasidagi farq haqiqiy bo'lishi mumkin bo'lsa-da, koindexatsiya ikkalasini ham moslashtirishi mumkin. Ya'ni, ikki yoki undan ortiq iboralar birlashtirilganda, bu yadro yoki cheklangan o'zgaruvchi bilan ish olib borishini bildiradi.

Coreference piksellar sonini

Yilda hisoblash lingvistikasi, yadro qarama-qarshiliklari yaxshi o'rganilgan muammo nutq. Matnni to'g'ri talqin qilish yoki hattoki turli xil mavzular, olmoshlar va boshqalarning nisbiy ahamiyatini baholash iboralarga murojaat qilish kerakli shaxslarga ulangan bo'lishi kerak. Asosiy fikrlarni echishga mo'ljallangan algoritmlar odatda avvalgi havolaga mos keladigan oldingi shaxsga murojaat qiladi. Masalan, u kabi oldingi ifodaga qo'shilishi mumkin ayol yoki Anne, lekin emas Bill. Kabi olmoshlar o'zi juda qattiq cheklovlarga ega. Ko'pgina lingvistik vazifalarda bo'lgani kabi, ular orasida ham savdo-sotiq mavjud aniqlik va eslash, hisoblash har xil bo'lishi mumkin, chunki yadro zanjirlarining sifatini o'lchash uchun bitta algoritm mavjud emas. Klaster asosiy o'lchov algoritmlarini baholash uchun odatda ishlatiladigan sifat ko'rsatkichlari Rand indeksi, sozlangan Rand indeksi yoki boshqacha o'zaro ma'lumot asoslangan usullar.

Ingliz tilida asosiy echimlarni hal qilish uchun klassik muammo bu olmoshdir u, bu juda ko'p foydalanishga ega. Bu shunga o'xshash narsalarga murojaat qilishi mumkin u va u, faqat umuman jonsiz narsalarga taalluqlidir (qoidalar aslida ancha murakkab: hayvonlar har qanday bo'lishi mumkin) u, u, yoki u; kemalar an'anaviy ravishda u; odatda bo'ronlar bo'ladi u ism-shariflarga qaramay). Bu mavjudotlarga emas, balki mavhumliklarga ham murojaat qilishi mumkin, masalan. Unga eng kam ish haqi to'langan, ammo bunga qarshi bo'lmagan. Nihoyat, u ham bor pleonastik aniq bir narsaga ishora qilmaydigan foydalanadi:

a. Buyomg'ir yog'moqda.
b. Bubu haqiqatan ham uyat.
v. Bu muvaffaqiyatga erishish uchun ko'p mehnat talab etiladi.
d. Ba'zan bueng ta'sirchan bo'lgan eng baland ovozda.

Pleonastik foydalanish mos yozuvlar deb hisoblanmaydi va shuning uchun asosiy ma'lumotlarning bir qismi emas.[5]

Asosiy qarama-qarshiliklarga yondashuvlarni asosan eslatib o'tuvchi juftlik, eslatish reytingi yoki shaxsga asoslangan algoritmlarga ajratish mumkin. Eslatib o'tilgan algoritmlarni o'z ichiga oladi ikkilik agar ikkita zikr qilingan juftlik bir xil narsaga tegishli bo'lsa, qarorlar. Shaxsiy tashkilotning cheklovlari jins hisobga olinmaydi, bu esa olib keladi xato tarqalishi. Masalan, olmoshlar u yoki u ikkalasi ham yadro kuchini yuqori ehtimolga ega bo'lishi mumkin muallim, lekin bir-birlari bilan asosiy aloqada bo'lish mumkin emas. Eslatib o'tuvchi algoritmlar ushbu g'oyani kengaytiradi, ammo buning o'rniga bitta eslatma faqat bitta (avvalgi) eslatib o'tilishi mumkin. Natijada, har bir oldingi eslatmaga ball qo'yilishi kerak va eng yuqori ball (yoki eslatilmagan) bilan bog'langan bo'lishi kerak. Va nihoyat, sub'ektga asoslangan usullarda eslatmalar alohida eslatmalar o'rniga butun yadro zanjiri ma'lumotlari asosida bog'lanadi. O'zgaruvchan kenglikdagi zanjirning namoyishi eslatib o'tilgan usullarga qaraganda ancha murakkab va hisob-kitob qilish jihatidan qimmatroqdir, bu esa ushbu algoritmlarni asosan asoslangan bo'lishiga olib keladi. neyron tarmoq me'morchilik.

Shuningdek qarang

Izohlar

  1. ^ Konferentsiya ta'riflari uchun masalan, Crystal (1997: 94) va Radford (2004: 332) ga qarang.
  2. ^ Ushbu farqlar (anafora, katafora, bo'linib ketgan antecedents, asosiy so'z birikmalari va boshqalar) Jurafskiy va Martinda muhokama qilingan (2000: 669ff.).
  3. ^ Bog'langan o'zgaruvchilar haqida, masalan, Portner-ga qarang (2005: 102ff.).
  4. ^ Bu erda keltirilgan o'xshash o'zgaruvchiga misol uchun Jurafskiy va Martinni (2000: 701) ko'ring.
  5. ^ Li va boshq. (2009) pleonastikani ajratishda yuqori aniqlikni namoyish etdi uva bu muvaffaqiyat umuman yadro aniqligi aniqligini oshirishni va'da qilmoqda.

Adabiyotlar

  • Kristal, D. 1997. Tilshunoslik va fonetika lug'ati. 4-nashr. Kembrij, MA: Blackwell nashriyoti.
  • Jurafskiy, D. va H. Martin 2000. Nutq va tilni qayta ishlash: Tabiiy tilni qayta ishlash, hisoblash lingvistikasi va nutqni tanib olishga kirish. Nyu-Dehli, Hindiston: Pearson Ta'lim.
  • Portner, P. 2005. Semantika nima ?: Rasmiy semantika asoslari. Malden, MA: Blackwell nashriyoti.
  • Radford, A. 2004 yil. Ingliz sintaksis: Kirish. Kembrij, Buyuk Britaniya: Kembrij universiteti matbuoti.
  • Yifan, L., P. Musilek, M. Reformat va L. Vyard-Skott 2009 yil. Pleonastikani aniqlash u Internetdan foydalanish. Sun'iy intellekt tadqiqotlari jurnali 34, 339–389.