Umumlashtirilgan vektor makon modeli - Generalized vector space model

The Umumlashtirilgan vektor makon modeli ning umumlashtirilishi vektor kosmik modeli ichida ishlatilgan ma'lumot olish. Vong va boshq.[1] juftlik ortogonalligi taxmin qilgan muammolar tahlili taqdim etildi vektor kosmik modeli (VSM) yaratadi. Bu erdan ular VSMni umumlashgan vektor makon modeliga (GVSM) kengaytirdilar.

Ta'riflar

GVSM terminali korrelyatsiyaga atamani kiritadi, bu juftlik ortogonalligi taxminini bekor qiladi. Aniqrog'i, omil har bir atama vektori bo'lgan yangi maydonni ko'rib chiqdi tmen ning chiziqli birikmasi sifatida ifodalangan 2n vektorlar mr qayerda r = 1 ... 2n.

Hujjat uchun dk va so'rov q o'xshashlik funktsiyasi endi quyidagicha bo'ladi:

qayerda tmen va tj endi a vektorlari 2n o'lchovli bo'shliq.

Muddatli korrelyatsiya bir necha usulda amalga oshirilishi mumkin. Masalan, Vong va boshq. avtomatik indekslash natijasida olingan chastota matritsasi atamasini ularning algoritmiga kirish sifatida ishlatadi. Vujudga kelish va chiqish atamasi har qanday juft indeks atamalari o'rtasidagi o'zaro bog'liqlik atamasidir.

GVSM bo'yicha semantik ma'lumotlar

Qidiruv modelga terminlarni qo'shish uchun kamida ikkita asosiy yo'nalish mavjud, aniq so'z birikmasidan tashqari:

  1. atamalar orasidagi semantik korrelyatsiyalarni hisoblash
  2. yirik korporatsiyalar tomonidan chastotalarning birgalikda sodir bo'lish statistikasini hisoblash

Yaqinda Tsatsaronis[2] birinchi yondashuvga e'tibor qaratdi.

Ular semantik yaqinlikni o'lchaydilar (SR) tezaurus yordamida (O) kabi WordNet. Bu ixchamlik bilan olingan yo'l uzunligini hisobga oladi (SCM) va semantik yo'lni ishlab chiqish yo'li bilan olingan yo'l chuqurligi (SPEUlar taxmin qilishadi ichki mahsulot:

qayerda smen va sj atamalarning hissiyotidir tmen va tj navbati bilan, maksimal darajaga ko'tarish .

Birinchi yondashuv asosida Waitelonis va boshqalar. al.[3] dan semantik yaqinlikni hisobladilar Bog'langan ochiq ma'lumotlar resurslar, shu jumladan DBpediya shuningdek YAGO taksonomiyasi.Ushbu bilan ular hujjatlar va so'rovlarda semantik sub'ektlar o'rtasidagi taksonomik aloqalardan foydalanadilar nomlangan shaxsni bog'lash.



Adabiyotlar

  1. ^ Vong, S. K. M.; Ziarko, Voytsex; Vong, Patrik C. N. (1985-06-05), "Axborot olishda umumiy vektor bo'shliqlari modeli", Axborot olishda tadqiqotlar va ishlanmalar bo'yicha 8-yillik ACM SIGIR xalqaro konferentsiyasi materiallari - SIGIR '85, SIGIR ACM, 18-25 betlar, doi:10.1145/253495.253506, ISBN  0897911598
  2. ^ Tsatsaronis, Jorj; Panagiotopouu, Viki (2009-04-02), Semantik yaqinlik asosida matnni qidirish uchun umumiy vektor makon modeli (PDF), EACL ACM
  3. ^ Vaitelonis, Yorg; Exeler, Klaudiya; Sack, Harald (2015-09-11), Bog'langan ma'lumotlar hujjatlarni qidirishni yaxshilash uchun Umumlashtirilgan vektor makon modelini yoqdi (PDF), ISWC 2015, CEUR-WS 1581