MontyLingua - MontyLingua

MontyLingua mashhurdir tabiiy tilni qayta ishlash asboblar to'plami. Bu to'plam kutubxonalar ramziy va statistik uchun dasturlar tabiiy tilni qayta ishlash (NLP) ikkalasi uchun Python va Java dasturlash tillari. U boyitilgan umumiy ma'noda kundalik dunyo haqida bilim Mind Common Sense-ni oching. Inglizcha jumlalardan u sub'ekt / fe'l / ob'ekt tuzilmalarini chiqaradi, sifatlar, ism so'zlari va fe'l iboralarini ajratadi va odamlarning ismlari, joylari, voqealari, sanalari va vaqtlari va boshqa semantik ma'lumotlarni chiqaradi. Bu o'qitishni talab qilmaydi. U Ugo Lyu tomonidan yozilgan MIT 2003 yilda.
Chunki u boyitilgan umumiy ma'noda bilim ko'plab xatolardan qochishi mumkin. masalan:

  • "(NX the / DT mosquito / NN bit / NN NX) (NX the / DT boy / NN NX)"


va boshqalar

  • "(NX the / DT mosquito / NN NX) (VX bit / VBD VX) (NX the / DT boy / NN NX)"[1]

Notijorat maqsadlarda foydalanish bepul. Agar ushbu dasturiy ta'minotni notijorat maqsadlarida, masalan, ilmiy tadqiqot maqsadlarida ishlatmoqchi bo'lsangiz, ushbu dastur bepul va GNU tomonidan qamrab olingan GPL litsenziyasi.

Qobiliyatlar

  • MontyTokenizer: qisqartmalarga sezgirlik bilan tinish belgilarini, oraliqni va qisqarishni normallashtiradi.
  • MontyTagger: Nutqning bir qismini belgilash Penn yordamida Daraxt banki tagset, "Open Mind Common Sense" loyihasining "Common Sense" bilan boyitilgan. Standart o'quv fayllari yordamida Brill94 tbl tagger-ning aniqligidan oshib ketadi
  • MontyREChunker: matnni fe'lga, ismga va sifat qismlariga ajratilgan qismlar (navbati bilan VX, NX va AX)
  • MontyExtractor: fe'l-argument tuzilmalari, iboralar va boshqa semantik jihatdan qimmatli ma'lumotlarni jumlalardan ajratib oladi va jumlani "hazm qilish" ga qaytaradi.
  • MontyLemmatiser: nutqning bir qismi sezgir lemmatizatsiya. Ko'plik (g'ozlar -> g'oz) va zamon (bor -> bo'lishi, bor edi -> bor) chiziqlari. Humphreys va Carroll's morph.lex va UPENN ning XTAG korpuslaridan regexpslarni o'z ichiga oladi
  • MontyNLGenerator: xulosalar hosil qiladi, er usti shaklidagi jumlalarni hosil qiladi, NP va fe'llarning zamonlarini aniqlaydi va raqamlaydi, sentences_type uchun hisobga olinadi

Adabiyotlar

  1. ^ "MontyLingua V.2.1 (Python va Java) Ingliz tili uchun bepul, umumiy ma'noda boyitilgan tabiiy tilni tushunuvchi". Olingan 2008-12-30.

Tashqi havolalar