Ehtimolning dolzarbligi modeli - Probabilistic relevance model

The ehtimoliy dolzarblik modeli[1][2] tomonidan ishlab chiqilgan Stiven E. Robertson va Karen Spark Jons uchun ramka sifatida ehtimollik modellari kelmoq. Bu rasmiylik ma'lumot olish olish uchun foydalidir reyting funktsiyalari tomonidan ishlatilgan qidiruv tizimlari va veb-qidiruv tizimlari mos keladigan hujjatlarni ularga muvofiq tartiblash uchun dolzarbligi berilgan qidiruv so'roviga.

Bu hujjatning ehtimolligini taxminiy nazariy model dj so'rovga mos keladi q. Model, ushbu dolzarblik ehtimoli so'rov va hujjat ko'rsatmalariga bog'liq deb taxmin qiladi. Bundan tashqari, u foydalanuvchi tomonidan so'rov uchun javoblar to'plami sifatida tanlangan barcha hujjatlarning bir qismi mavjud deb taxmin qiladi q. Bunday ideal javoblar to'plami deyiladi R va ushbu foydalanuvchiga tegishli umumiy ehtimolligini maksimal darajada oshirishi kerak. Ushbu to'plamdagi hujjatlar taxmin qilinmoqda R so'rovga tegishli, to'plamda bo'lmagan hujjatlar esa ahamiyatsiz.

Tegishli modellar

Ushbu ramkada ba'zi cheklashlar mavjud bo'lib, ularni yanada rivojlantirish orqali hal qilish kerak:

  • Birinchi ishga tushirish ehtimoli uchun aniq taxmin yo'q
  • Indeks shartlari tortilmagan
  • Shartlar o'zaro mustaqil deb hisoblanadi

Ushbu va boshqa muammolarni hal qilish uchun ehtimoliy ahamiyatga ega bo'lgan boshqa modellar ishlab chiqilgan, ular orasida Ikkilik mustaqillik modeli o'sha muallifdan. Ushbu ramkaning eng taniqli hosilasi bu Okapi (BM25) BM25F bilan birga tortish sxemasi, uning modifikatsiyasi.

Adabiyotlar

  1. ^ Robertson, S. E.; Jons, K. Spark (1976 yil may). "Qidiruv so'zlarining dolzarbligi". Amerika Axborot Ilmiy Jamiyati jurnali. 27 (3): 129–146. doi:10.1002 / asi.4630270302.
  2. ^ Robertson, Stiven; Saragoza, Gyugo (2009). "Ehtimollarning dolzarbligi doirasi: BM25 va undan tashqarida". Axborot olish asoslari va tendentsiyalari. 3 (4): 333–389. CiteSeerX  10.1.1.156.5282. doi:10.1561/1500000019.