XML qidirish - XML retrieval - Wikipedia

XML qidirish, yoki XML ma'lumotlarini qidirish, bilan tuzilgan hujjatlarni mazmunan qidirib topishdir XML (kengaytiriladigan belgilash tili). Shunday qilib, u hisoblash uchun ishlatiladi dolzarbligi XML hujjatlaridan.[1]

So'rovlar

XML qidirish usullarining aksariyati buni ma'lumot olish (IQ) maydoni, masalan. kalit so'zlardan (so'rov atamalaridan) iborat bo'lgan so'rov va hujjat o'rtasidagi o'xshashlikni hisoblash orqali. Biroq, XML-Retrieval-da so'rov o'z ichiga olishi mumkin tizimli maslahatlar. "Tarkib va ​​tuzilma" (CAS) deb nomlangan so'rovlar foydalanuvchilarga so'ralgan tarkib qaysi tuzilishga ega bo'lishi yoki bo'lishi kerakligini belgilashga imkon beradi.

XML tuzilishini ekspluatatsiya qilish

Dan foydalanib o'z-o'zini ta'riflash XML hujjatlari tarkibi XML hujjatlarini qidirishni sezilarli darajada yaxshilashi mumkin. Bunga CAS so'rovlaridan foydalanish, turli xil XML elementlarining tortish tartibi va subdujjatlarni yo'naltirilgan qidirish kiradi.

Reyting

XML-Retrieval-da reyting tarkibning dolzarbligini ham, strukturaning o'xshashligini ham o'z ichiga olishi mumkin, bu so'rovda berilgan struktura bilan hujjat tuzilishi o'rtasidagi o'xshashlikdir. Shuningdek, XML so'rovidan kelib chiqadigan qidirish birliklari har doim ham to'liq hujjat bo'lmasligi mumkin, lekin har qanday chuqur joylashtirilgan XML elementlari, ya'ni dinamik hujjatlar bo'lishi mumkin. Maqsad juda dolzarb bo'lgan eng kichik qidirish birligini topishdir. Muvofiqlikni aniqlik tushunchasiga ko'ra aniqlash mumkin, bu qidirish birligi so'rov mavzusiga qanchalik e'tibor qaratadi.[2]

Mavjud XML qidiruv tizimlari

Ikkita potentsial yondashuvlarning umumiy ko'rinishi mavjud.[3][4] XML-qidiruvni baholash tashabbusi (INEX) 2002 yilda tashkil etilgan va ularni baholash uchun platforma yaratadi algoritmlar.[2] Uch xil yo'nalish XML-qidiruvga ta'sir qiladi:[5]

An'anaviy XML so'rovlar tillari

So'rov tillari kabi W3C standart XQuery[6] murakkab so'rovlarni etkazib berish, lekin faqat aniq mosliklarni qidirish. Shuning uchun, ularni dolzarb hisoblash bilan noaniq izlashga imkon berish uchun ularni kengaytirish kerak. XMLga asoslangan yondashuvlarning aksariyati hujjatlarni to'liq bilishni anglatadi ' sxemalar.[7]

Ma'lumotlar bazalari

Klassik ma'lumotlar bazasi tizimlar saqlash imkoniyatini qabul qildilar yarim tuzilgan ma'lumotlar[5] va rivojlanishiga olib keldi XML ma'lumotlar bazalari. Ko'pincha, ular juda rasmiy, reytingga qaraganda ko'proq qidirishga e'tibor berishadi va murakkab so'rovlarni shakllantirishga qodir bo'lgan tajribali foydalanuvchilar tomonidan foydalaniladi.

Axborot olish

Kabi klassik ma'lumot olish modellari vektor kosmik modeli dolzarblik reytingini taqdim etish, lekin hujjat tuzilishini o'z ichiga olmaydi; faqat tekis so'rovlar qo'llab-quvvatlanadi. Shuningdek, ular statik hujjat kontseptsiyasini qo'llaydilar, shuning uchun qidirish birliklari odatda butun hujjatlardir.[7] Ular tarkibiy ma'lumot va dinamik hujjatlarni qidirishni ko'rib chiqish uchun kengaytirilishi mumkin. Vektorli makon modellarini kengaytirishga misollar mavjud: ular hujjatdan foydalanadilar kichik daraxtlar (indeks shartlari va tuzilish) vektor makonining o'lchamlari sifatida.[8]

Ma'lumotlarga asoslangan XML ma'lumotlar to'plamlari

Ma'lumotlarga asoslangan XML ma'lumotlar to'plamlari uchun noyob va aniq kalit so'zlarni qidirish usuli, ya'ni XDMA[9] XML ma'lumotlar bazalari uchun ikki tomonlama indeksatsiya va o'zaro yig'ish asosida ishlab chiqilgan va ishlab chiqilgan.

Shuningdek qarang

Adabiyotlar

  1. ^ Qish, Judit; Drobnik, Osvald (2007 yil 9-noyabr). "Peer-to-peer" muhitida XML ma'lumotlarini olish me'morchiligi " (PDF). ACM. Olingan 2009-02-10.
  2. ^ a b Malik, Saadiya; Trotman, Endryu; Lalmas, Mouniya; Fur, Norbert (2007). "INEX 2006 ga sharh" (PDF). XML qidirib topishni baholash tashabbusining beshinchi seminari materiallari. Arxivlandi asl nusxasi (PDF) 2008 yil 16 oktyabrda. Olingan 2009-02-10.
  3. ^ Amer-Yahia, Sihem; Lalmas, Moniya (2006). "XML qidiruvi: tillar, INEX va ballar" (PDF). SIGMOD Rec. 35 (4). doi:10.1145/1228268.1228271. S2CID  17300151. Olingan 2009-02-10.[o'lik havola ]
  4. ^ Pal, Sukomal (2006 yil 30-iyun). "XML qidiruvi: So'rovnoma". Texnik hisobot, CVPR. CiteSeerX  10.1.1.109.5986. Iqtibos jurnali talab qiladi | jurnal = (Yordam bering)
  5. ^ a b Fur, Norbert; Gövert, N .; Qozay, Gabriella; Lalmas, Moniya (2003). "INEX: XML qidirishni baholash tashabbusi" (PDF). Birinchi INEX seminarining materiallari, Dagstuhl, Germaniya, 2002 y. ERCIM Workshop Proceedings, Frantsiya. Arxivlandi asl nusxasi (PDF) 2008 yil 21-noyabrda. Olingan 2009-02-10.
  6. ^ Boag, Skott; Chamberlin, Don; Fernandes, Meri F.; Floresku, Daniela; Robi, Jonatan; Siméon, Jerom (2007 yil 23-yanvar). "XQuery 1.0: XML so'rovlar tili". W3C tavsiyasi. Butunjahon Internet tarmog'idagi konsortsium. Olingan 2009-02-10.
  7. ^ a b Shlyeder, Torsten; Meuss, Xolger (2002). "XML hujjatlarini so'rov va reytingi". Amerika Axborot Fanlari va Texnologiyalari Jamiyati jurnali. 53 (6): 489–503. doi:10.1002 / asi.10060. Arxivlandi asl nusxasi 2007 yil 10-iyunda. Olingan 2009-02-10.
  8. ^ Liu, Shaorong; Tsou, Tsinxua; Chu, Uesli V. (2004). "XML ma'lumotlarini olish uchun konfiguratsiya qilinadigan indeksatsiya va reyting" (PDF). SIGIR'04. ACM. Olingan 2009-02-10.
  9. ^ Selvaganesan, S .; Xa, Su-Cheng; Yaqinda Lay-Ki (2014). "XDMA: ikkilangan indekslash va o'zaro xulosaga asoslangan kalit so'zlarni qidirish algoritmi XML ma'lumotlar bazalari". Dastur muhandisligi va bilim muhandisligi xalqaro jurnali. 24 (4): 591–615. doi:10.1142 / s0218194014500223.