Kengaytirilgan WordNet - EXtended WordNet

The eXtended WordNet da loyiha Dallasdagi Texas universiteti (va. tomonidan moliyalashtiriladi Milliy Ilmiy Jamg'arma ) takomillashtirishga qaratilgan WordNet semantik jihatdan ajrating nashrida Shunday qilib, ushbu ta'riflarda keltirilgan ma'lumotlarni bilimlarni avtomatik qayta ishlash tizimlari uchun mavjud qilish. Bu ostida erkin foydalanish mumkin BSD uslubidagi litsenziya. 2004 yil noyabr oyidan beri yangilanmagan bo'lsa-da (eng so'nggi versiyasi WordNet 2.0-ga asoslangan), ammo u hali ham foydali manba bo'lib qolmoqda.

Ma'lumotlar bazasi formati

Ma'lumotlar bazasi to'rt kishilik to'plam sifatida mavjud XML fayllar - bittadan fe'llar, zarflar, otlar va sifatlar. Yoritgichlardan quyidagi ma'lumotlar olinadi:

Masalan, quyidagi ma'lumotlar mavjud sinset ajoyib, birinchi darajali, hayoliy:

Yorqinligi:

 eng sifatli

So'z ma'nosini ajratish:

   pos ="IN" >ning</wf>   pos ="DT" >The</wf>   pos ="JJS" lemma ="eng yuqori" sifat ="normal" wnsn ="1" >eng yuqori</wf>   pos ="NN" lemma ="sifat" sifat ="normal" wnsn ="2" >sifat</wf>

Daraxt daraxti:

 (TOP (S (NP (JJ zo'r))) (VP (VBZ)) (NP (NP (NN narsa))) (PP (IN)) (NP (DT the) (eng yuqori JJS) (NN sifat))))) (.)))

Mantiqiy shakl:

 zo'r: JJ (x1) -> of: IN (x1, x2) eng yuqori: JJ (x2) sifat: NN (x2)

Ma'lumotlar sifati

Har bir nashrida birinchi belgilangan foydalanish Brillning yorlig'i. Keyin porlashlar ikkalasi yordamida tahlil qilinadi Charniak ajralish moslamasi va uyda Kollinz uslubni tahlil qiluvchi. Keyin tahlil qilingan har bir nashrida sifat darajasi beriladi:

  • Oltin: qo'lda tekshirilganlar
  • Kumush: ikkala tahlilchilar ham bir xil mahsulot ishlab chiqarganlar
  • Oddiy: har xil natijalar ishlab chiqarilgan joylar - bu holatlarda ichki analizatorning chiqishi ishlatiladi

Adabiyotlar

Tashqi havolalar

Hozirda sahifa mavjud emas