Semantik veb - Semantic Web - Wikipedia

The Semantik veb ning kengaytmasi Butunjahon tarmog'i tomonidan belgilangan standartlar orqali Butunjahon Internet tarmog'idagi konsortsium (W3C).[1] Semantik veb-ning maqsadi shundan iborat Internet ma'lumotlar mashinada o'qilishi mumkin.

Kodlashni yoqish uchun semantik kabi ma'lumotlar, texnologiyalar bilan Resurs ta'rifi doirasi (RDF)[2] va Veb-ontologiya tili (OWL)[3] ishlatiladi. Ushbu texnologiyalar rasmiy ravishda namoyish qilish uchun ishlatiladi metadata. Masalan, ontologiya tushunchalarni, mavjudotlar o'rtasidagi munosabatlarni va narsalarning toifalarini tavsiflashi mumkin. Ushbu o'rnatilgan semantika ma'lumotlarga nisbatan mulohaza yuritish va heterojen ma'lumotlar manbalari bilan ishlash kabi muhim afzalliklarga ega.[4]

Ushbu standartlar keng tarqalgan ma'lumotlar formatlarini va Internetda almashinuv protokollarini, asosan, RDFni targ'ib qiladi. W3C ma'lumotlariga ko'ra, "Semantic Web dastur, korxona va jamoat chegaralarida ma'lumotlarni almashish va qayta ishlatishga imkon beradigan umumiy asosni taqdim etadi."[5] Shuning uchun Semantic Web turli xil tarkib va ​​axborot dasturlari va tizimlari bo'yicha integrator sifatida qaraladi.

Ushbu atama tomonidan ishlab chiqilgan Tim Berners-Li ma'lumotlar tarmog'i uchun (yoki ma'lumotlar tarmog'i)[6] mashinalar tomonidan qayta ishlanishi mumkin[7]- bu juda ko'p bo'lganlardan biri ma'no bu mashinada o'qiladigan. Uning tanqidchilari uning maqsadga muvofiqligini shubha ostiga qo'ygan bo'lsalar-da, tarafdorlar kutubxona va axborot fanlari, sanoat, biologiya va gumanitar fanlarni tadqiq qilishda qo'llaniladigan dasturlar asl tushunchaning to'g'riligini allaqachon isbotlagan deb ta'kidlaydilar.[8]

Berners-Li dastlab Semantik veb-ga bo'lgan qarashlarini 1999 yilda quyidagicha ifodalagan:

Men Internetda (bu erda kompyuterlar) Internetdagi barcha ma'lumotlarni - odamlar va kompyuterlar o'rtasidagi tarkibni, havolalarni va tranzaktsiyalarni tahlil qilishga qodir bo'lgan orzuim bor. Buni amalga oshiradigan "semantik veb" hali paydo bo'lmadi, ammo paydo bo'lganda, savdo, byurokratiya va kundalik hayotning kundalik mexanizmlari mashinalar bilan gaplashadigan mashinalar tomonidan boshqariladi. "aqlli agentlar "odamlar asrlar davomida tanqid qilganlar, nihoyat amalga oshadi.[9]

2001 yil Ilmiy Amerika Berners-Li tomonidan maqola, Xendler va Lassila Mavjud veb-saytning kutilayotgan evolyutsiyasini semantik vebga tasvirlab berdi.[10] 2006 yilda Berners-Li va uning hamkasblari: "Bu oddiy g'oya deyarli amalga oshmay qolmoqda", deb ta'kidladilar.[11]2013 yilda to'rt milliondan ortiq veb-domenlarda Semantik veb-belgilar mavjud edi.[12]

Misol

Quyidagi misolda veb-saytdagi "Pol Shuster Drezdenda tug'ilgan" matni izohlanadi va insonni tug'ilgan joyi bilan bog'laydi. Quyidagi HTML fragment kichik grafik qanday tasvirlanganligini ko'rsatadi RDFa -sintaksis schema.org lug'at va a Vikidata ID:

<div vokab="https://schema.org/" tipo="Shaxs">  <oraliq mulk="ism">Pol Shuster</oraliq> yilda tug'ilgan <oraliq mulk="birthPlace" tipo="Joy" href="https://www.wikidata.org/entity/Q1731">    <oraliq mulk="ism">Drezden</oraliq>.  </oraliq></div>
RDFa misolida olingan grafik

Misol quyidagi beshlikni belgilaydi uch baravar (ko'rsatilgan Kaplumbağa sintaksis). Har bir uchlik natijada olingan grafada bitta qirrani aks ettiradi: uchlikning birinchi elementi (the Mavzu) - bu chekka boshlanadigan tugunning nomi, ikkinchi element ( predikat) chekka turi va oxirgi va uchinchi element (the ob'ekt) yoki chekka tugaydigan tugunning nomi yoki harfiy qiymati (masalan, matn, raqam va boshqalar).

Uchlik natijada ko'rsatilgan grafik paydo bo'ladi berilgan raqam.

Internetdagi qo'shimcha ma'lumotlar bilan boyitilgan RDFa misolidan olingan grafik

Foydalanishning afzalliklaridan biri Resurs identifikatorlari (URI) yordamida ularni ajratib ko'rsatish mumkin HTTP protokol. Deb atalmish ko'ra Bog'langan ochiq ma'lumotlar printsiplariga ko'ra, bunday ajratilgan URI ushbu URI haqida qo'shimcha ma'lumotlarni taqdim etadigan hujjatga olib kelishi kerak. Ushbu misolda barcha URI-lar, ham qirralar, ham tugunlar uchun (masalan. http://schema.org/Person, http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) ajratilishi mumkin va natijada RDF grafikalari paydo bo'ladi, URI tavsiflanadi, masalan. Drezden Germaniyaning shahri yoki u URI ma'nosida odam xayoliy bo'lishi mumkin.

Ikkinchi grafikda avvalgi misol keltirilgan, ammo endi hujjatlarning bir-biridan ajratish natijasida hosil bo'lgan uchtaligi bilan boyitilgan https://schema.org/Person (yashil chekka) va https://www.wikidata.org/entity/Q1731 (ko'k qirralar).

Qatnashgan hujjatlarda aniq ko'rsatilgan qirralarga qo'shimcha ravishda avtomatik ravishda qirralarning xulosasi berilishi mumkin: uchlik

original RDFa fragmentidan va uchlikdan

da hujjatdan https://schema.org/Person (rasmdagi yashil chekka) berilgan quyidagi uchtalikni xulosa qilishga imkon beradi Boyqush semantik (ikkinchi rasmda qizil chiziq):

Fon

Tushunchasi semantik tarmoq model 1960-yillarning boshlarida kognitiv olim kabi tadqiqotchilar tomonidan shakllangan Allan M. Kollinz, tilshunos M. Ross Kvillian va psixolog Elizabeth F. Loftus semantik jihatdan tuzilgan bilimlarni namoyish etish shakli sifatida. Zamonaviy Internet kontekstida qo'llanilganda, u tarmoqni kengaytiradi gipermurojaat qilingan inson tomonidan tushunarli veb-sahifalar mashinaga o'qiladigan narsalarni kiritish orqali metadata sahifalar va ularning bir-biri bilan qanday bog'liqligi haqida. Bu avtomatlashtirilgan agentlarga Internetga yanada oqilona kirishga va foydalanuvchilar nomidan ko'proq vazifalarni bajarishga imkon beradi. "Semantik veb" atamasi tomonidan ishlab chiqilgan Tim Berners-Li,[7] World Wide Web ixtirochisi va direktori Butunjahon Internet tarmog'idagi konsortsium ("W3C Tavsiya etilgan Semantik veb-standartlarning ishlab chiqilishini nazorat qiluvchi "). U Semantic Web-ni" to'g'ridan-to'g'ri va bilvosita mashinalar tomonidan qayta ishlanishi mumkin bo'lgan ma'lumotlar tarmog'i "deb ta'riflaydi.

W3C tomonidan taklif qilingan ko'plab texnologiyalar W3C soyaboni ostida joylashishdan oldin allaqachon mavjud bo'lgan. Ular turli xil kontekstlarda, xususan, cheklangan va aniq belgilangan sohani qamrab oladigan ma'lumotlar bilan shug'ullanadigan va ma'lumot almashish, masalan, ilmiy tadqiqotlar yoki korxonalar o'rtasida ma'lumotlar almashinuvi zarur bo'lgan hollarda qo'llaniladi. Bundan tashqari, shunga o'xshash maqsadlarga ega bo'lgan boshqa texnologiyalar paydo bo'ldi mikroformatlar.

HTML ning cheklovlari

Oddiy kompyuterdagi ko'plab fayllarni erkin ravishda odam o'qiydigan qismlarga bo'lish mumkin hujjatlar va mashinada o'qiladigan ma'lumotlar. Pochta xabarlari, hisobotlar va risolalar kabi hujjatlarni odamlar o'qiydi. Taqvimlar, manzillar kitoblari, pleylistlar va elektron jadvallar kabi ma'lumotlar ularni ko'rish, qidirish va birlashtirishga imkon beradigan dastur dasturi yordamida taqdim etiladi.

Hozirda World Wide Web asosan yozilgan hujjatlarga asoslangan Gipermatnni belgilash tili (HTML ), tasvirlar va interaktiv shakllar kabi multimedia moslamalari bilan kesilgan matn tanasini kodlash uchun ishlatiladigan belgilash konvensiyasi. Metadata teglari kompyuterlar veb-sahifalar tarkibini turkumlashi mumkin bo'lgan usulni taqdim etadi. Quyidagi misollarda "kalit so'zlar", "tavsif" va "muallif" maydon nomlariga "hisoblash", "sotiladigan arzon vidjetlar" va "Jon Dou" kabi qiymatlar berilgan.

<meta ism="kalit so'zlar" tarkib="hisoblash, kompyuter tadqiqotlari, kompyuter" /><meta ism="tavsif" tarkib="Arzon vidjetlar sotilmoqda" /><meta ism="muallif" tarkib="Jon Dou" />

Ushbu metama'lumotlarni belgilash va toifalashtirish tufayli ushbu ma'lumotlarga kirishni va ular bilan bo'lishishni istagan boshqa kompyuter tizimlari tegishli qiymatlarni osongina aniqlashlari mumkin.

HTML va uni ko'rsatish vositasi bilan (ehtimol veb-brauzer dasturiy ta'minot, ehtimol boshqasi foydalanuvchi agenti ), sotish uchun narsalar ro'yxati berilgan sahifani yaratishi va taqdim etishi mumkin. Ushbu katalog sahifasining HTML-si hujjat darajasida sodda, "ushbu hujjatning nomi" Vidjet Superstore "'", lekin HTML-ning o'zida, masalan, X586172 elementi chakana narxi 199 evro bo'lgan Acme Gizmo ekanligini yoki u iste'mol mahsuloti ekanligini aniq tasdiqlash imkoniyati mavjud emas. Aksincha, HTML faqatgina "X586172" matni "Acme Gizmo" va "199 €" va boshqalar yonida joylashtirilishi kerak bo'lgan narsadir. "Bu katalog" deb aytish yoki hatto "Acme Gizmo" ning o'ziga xos turi ekanligini aniqlashning iloji yo'q. sarlavha yoki "199 €" bu narx. Bundan tashqari, ushbu ma'lumotlar alohida sahifani tavsiflashda, ehtimol sahifada keltirilgan boshqa narsalardan farqli ravishda bir-biriga bog'langanligini ifoda etishning iloji yo'q.

Semantik HTML to'g'ridan-to'g'ri maket tafsilotlarini ko'rsatmasdan, niyatdan keyin belgilashning an'anaviy HTML amaliyotiga ishora qiladi. Masalan, dan foydalanish <em> o'rniga "urg'u" ni belgilaydi <i>, bu aniqlaydi kursiv. Joylashtirish tafsilotlari bilan birgalikda brauzerda qoldiriladi Kaskadli jadvallar. Ammo bu amaliyot sotiladigan narsalar yoki narxlar kabi ob'ektlarning semantikasini belgilashga to'g'ri kelmaydi.

Mikroformatlar yaratish uchun HTML sintaksisini kengaytiradi mashinada o'qiladigan ob'ektlar, jumladan odamlar, tashkilotlar, tadbirlar va mahsulotlar haqida semantik belgilash.[13] Shu kabi tashabbuslarga RDFa, Mikrodata va Schema.org.

Semantik veb-echimlar

Semantik veb bu echimni yanada kuchaytiradi. Bu ma'lumotlar uchun maxsus mo'ljallangan tillarda nashr etishni o'z ichiga oladi: Resurs ta'rifi doirasi (RDF), veb-ontologiya tili (OWL) va kengaytiriladigan belgilash tili (XML ). HTML hujjatlarni va ular orasidagi bog'lanishlarni tavsiflaydi. RDF, OWL va XML, aksincha, odamlar, uchrashuvlar yoki samolyot qismlari kabi o'zboshimchalik bilan narsalarni tasvirlashi mumkin.

Ushbu texnologiyalar veb-hujjatlar tarkibini to'ldiruvchi yoki almashtiradigan tavsiflarni taqdim etish maqsadida birlashtirilgan. Shunday qilib, tarkib Internetda saqlanadigan tavsiflovchi ma'lumotlar sifatida o'zini namoyon qilishi mumkin ma'lumotlar bazalari,[14] yoki hujjatlardagi belgi sifatida (xususan, Extensible HTML-da (XHTML ) XML bilan kesilgan, yoki ko'pincha, faqat XML-da, tartib yoki ko'rsatma belgilari alohida saqlanadi). Mashinada o'qiladigan tavsiflar tarkib menejerlariga tarkibga ma'no qo'shishga, ya'ni ushbu tarkib haqida biz olgan bilimlarning tuzilishini tavsiflashga imkon beradi. Shu tarzda, mashina odamga o'xshash jarayonlardan foydalangan holda matn o'rniga, bilimni o'zi qayta ishlashi mumkin deduktiv fikrlash va xulosa, shu bilan yanada mazmunli natijalarga erishish va kompyuterlarga avtomatlashtirilgan ma'lumotlarni yig'ish va tadqiq qilishda yordam berish.

Semantik bo'lmagan veb-sahifada ishlatiladigan tegga misol:

<item>blog</item>

Shunga o'xshash ma'lumotlarni semantik veb-sahifada kodlash quyidagicha ko'rinishi mumkin:

 rdf: taxminan ="https://example.org/semantic-web/">Semantik veb</item>

Tim Berners-Li paydo bo'lgan tarmoqni chaqiradi Bog'langan ma'lumotlar The Gigant global grafik, HTML-dan farqli o'laroq Butunjahon tarmog'i. Berners-Li fikricha, agar o'tmish hujjatlarni almashish bo'lgan bo'lsa, kelajak kelajakda bo'ladi ma'lumotlar almashish. Uning "qanday" degan savoliga javobi uchta ko'rsatma beradi. Bittasi, URL ma'lumotlarga ishora qilishi kerak. Ikkinchidan, URL manziliga kirgan har bir kishi ma'lumotlarni qaytarib olishi kerak. Uchinchidan, ma'lumotlardagi munosabatlar ma'lumotlar bilan qo'shimcha URL manzillarini ko'rsatishi kerak.

Veb 3.0

Tim Berners-Li Semantic Web-ni tarkibiy qismi deb ta'riflagan Veb 3.0.[15]

Odamlar Web 3.0 nima ekanligini so'rashda davom etmoqdalar. O'ylaymanki, qachonki sizda ortiqcha narsa bo'lsa o'lchovli vektorli grafikalar - hamma narsa to'lqinlanuvchi, katlanuvchi va tumanli ko'rinishda Veb 2.0 va juda katta ma'lumotlar maydoniga birlashtirilgan semantik Internetga kirish, siz ishonib bo'lmaydigan ma'lumotlar manbasiga kirishingiz mumkin ...

— Tim Berners-Li, 2006 yil

"Semantic Web" ba'zan "Web 3.0" ning sinonimi sifatida ishlatiladi,[16] har bir atamaning ta'rifi turlicha bo'lsa ham. Veb 3.0-dan uzoqlashish harakati sifatida paydo bo'la boshladi markazlashtirish bitta tashkilotning ishlashiga bog'liq bo'lgan qidiruv, ijtimoiy media va chat dasturlari kabi xizmatlarning.[17]

Guardian jurnalist Jon Xarris ko'rib chiqildi Veb 3.0 2019 yil boshida kontseptsiya va xususan Berners Li tomonidan ishlab chiqarilgan loyihada ishlash Qattiq, shaxsiy ma'lumotlar do'konlari yoki "podkastlar" atrofida joylashgan bo'lib, ular ustidan shaxslar nazoratni saqlab qolishadi.[18] Berners ‑ Li g'oyani ilgari surish va ko'ngilli ishlab chiquvchilarni jalb qilish uchun "Inrupt" startapini yaratdi.[19][20]

Qiyinchiliklar

Semantik veb uchun ba'zi qiyinchiliklarga kenglik, noaniqlik, noaniqlik, nomuvofiqlik va hiyla-nayrang kiradi. Avtomatlashtirilgan fikrlash tizimlari Semantik Internetning va'dasini bajarish uchun ushbu muammolarning barchasi bilan shug'ullanishi kerak.

  • Kenglik: Butunjahon tarmog'ida ko'plab milliard sahifalar mavjud. The SNOMED CT tibbiyot terminologiyasi ontologiya faqatgina 370,000 sinf nomlarini o'z ichiga oladi va mavjud texnologiya hali ham semantik jihatdan takrorlangan barcha atamalarni yo'q qilishga qodir emas. Har qanday avtomatlashtirilgan fikrlash tizimi haqiqatan ham ulkan kirishlar bilan shug'ullanishi kerak.
  • Noaniqlik: Bular "yosh" yoki "uzun bo'yli" kabi noaniq tushunchalar. Bu foydalanuvchi so'rovlarining noaniqligidan, kontent-provayderlar tomonidan taqdim etilgan tushunchalarning, so'rovlar atamalarini provayderning atamalariga mos kelishidan va turli xil bilimlar bazalarini bir-birini takrorlaydigan, ammo bir-biridan farq qiladigan tushunchalar bilan birlashtirishga urinishdan kelib chiqadi. Bulaniq mantiq noaniqlik bilan kurashishning eng keng tarqalgan usuli.
  • Noaniqlik: Bu noaniq qiymatlarga ega bo'lgan aniq tushunchalar. Masalan, bemor har xil ehtimollik bilan har xil aniq tashxislarga mos keladigan alomatlar to'plamini ko'rsatishi mumkin. Ehtimolli noaniqlikni bartaraf etish uchun mulohaza yuritish texnikasi odatda qo'llaniladi.
  • Mos kelmaslik: Bular mantiqiy qarama-qarshiliklar bo'lib, ular muqarrar ravishda yirik ontologiyalarning rivojlanishi jarayonida va alohida manbalardan olingan ontologiyalar birlashtirilganda paydo bo'ladi. Deduktiv fikrlash nomuvofiqlikka duch kelganda katastrofik ravishda muvaffaqiyatsizlikka uchraydi, chunki "har qanday narsa qarama-qarshilikdan kelib chiqadi". Muvaffaqiyatsiz fikrlash va parakonsistent fikrlash nomuvofiqlik bilan kurashish uchun ishlatilishi mumkin bo'lgan ikkita usul.
  • Yolg'on: Bu ma'lumot ishlab chiqaruvchisi qasddan ma'lumot iste'molchisini yo'ldan ozdirganda. Kriptografiya hozirda ushbu tahdidni engillashtirish uchun texnikalardan foydalanilmoqda. Axborotning yaxlitligini, shu jumladan ma'lumotni ishlab chiqargan yoki nashr etgan shaxsning shaxsiga tegishli bo'lgan ma'lumotlarni aniqlash vositasini taqdim etish orqali ishonchlilik mumkin bo'lgan firibgarlik holatlarida hali ham muammolarni hal qilish kerak.

Ushbu muammolarning ro'yxati to'liq emas, balki tasviriy xususiyatga ega va u Semantik Internetning "birlashtiruvchi mantig'i" va "isbot" qatlamlari muammolariga qaratilgan. World Wide Web Consortium (W3C) Inkubator guruhi uchun noaniqlik mulohazalari uchun Internet (URW3-XG) yakuniy hisoboti ushbu muammolarni "noaniqlik" yagona sarlavhasi ostida birlashtirdi.[21] Bu erda aytib o'tilgan ko'plab texnikalar, masalan, shartli ehtimolliklarga izoh berish uchun veb-ontologiya tiliga (OWL) kengaytmalarni talab qiladi. Bu faol tadqiqotlar sohasi.[22]

Standartlar

Web 3.0 kontekstida Semantic Web uchun standartlashtirish W3C tomonidan nazorat qilinadi.[23]

Komponentlar

"Semantik veb" atamasi ko'pincha unga imkon beradigan format va texnologiyalarga nisbatan ko'proq aniqroq qo'llaniladi.[5] Bog'langan ma'lumotlarni yig'ish, tuzish va tiklashni ta'minlaydigan texnologiyalar yordamida amalga oshiriladi rasmiy tavsif tushunchalar, atamalar va berilgan doiradagi munosabatlar bilim doirasi. Ushbu texnologiyalar W3C standartlari sifatida ko'rsatilgan va quyidagilarni o'z ichiga oladi:

The Semantik veb-to'plam Semantik Internetning arxitekturasini aks ettiradi. Komponentlarning funktsiyalari va munosabatlari quyidagicha umumlashtirilishi mumkin:[24]

  • XML hujjatlar tarkibidagi tarkib uchun elementar sintaksisni ta'minlaydi, ammo hech qanday semantikani tarkibidagi tarkib bilan birlashtirmaydi. XML hozirgi vaqtda ko'p hollarda Semantik veb-texnologiyalarning zaruriy tarkibiy qismi emas, chunki muqobil sintaksislar mavjud, masalan Kaplumbağa. Kaplumbağa amalda standartdir, ammo rasmiy standartlashtirish jarayonidan o'tmagan.
  • XML sxemasi XML hujjatlari tarkibidagi elementlarning tarkibi va tarkibini ta'minlash va cheklash uchun til.
  • RDF - bu ifoda etish uchun oddiy til ma'lumotlar modellari, ob'ektlarga tegishli (""veb-resurslar ") va ularning munosabatlari. RDF asosidagi model turli xil sintaksislarda ifodalanishi mumkin, masalan, RDF / XML, N3, Turtle va RDFa. RDF - bu Semantic Web-ning asosiy standarti.[25][26]
  • RDF sxemasi RDF-ni kengaytiradi va RDF-ga asoslangan resurslarning xususiyatlari va sinflarini tavsiflash uchun lug'at bo'lib, bunday xususiyatlar va sinflarning umumlashtirilgan-ierarxiyalari uchun semantikaga ega.
  • OWL xususiyatlar va sinflarni tavsiflash uchun ko'proq so'z birikmalarini qo'shadi: boshqalar qatorida sinflar o'rtasidagi munosabatlar (masalan, kelishmovchilik), kardinallik (masalan, "to'liq bitta"), tenglik, xususiyatlarning yanada boy yozilishi, xususiyatlarning xususiyatlari (masalan, simmetriya) va sanab o'tilgan sinflar.
  • SPARQL - bu semantik veb-ma'lumot manbalari uchun protokol va so'rovlar tili.
  • RIF - bu W3C qoida almashinuvi formati. Bu kompyuterlar bajarishi mumkin bo'lgan veb-qoidalarni ifodalash uchun XML tili. RIF dialektlar deb nomlangan bir nechta versiyalarni taqdim etadi. U RIF asosiy mantiqiy dialektini (RIF-BLD) va RIF ishlab chiqarish qoidalari dialektini (RIF PRD) o'z ichiga oladi.

Standartlashtirishning hozirgi holati

Yaxshi o'rnatilgan standartlar:

Hali to'liq amalga oshirilmagan:

Ilovalar

Buning maqsadi qulaylik Internetning foydaliligi va uning o'zaro bog'liqligi resurslar yaratish orqali semantik veb-xizmatlar, kabi:

  • RDF va SPARQL standartlaridan foydalangan holda mavjud ma'lumotlar tizimlarini ochadigan serverlar. RDF-ga ko'plab konvertorlar turli xil dasturlardan mavjud.[27] Relyatsion ma'lumotlar bazalari muhim manba hisoblanadi. Semantik veb-server mavjud tizimga uning ishlashiga ta'sir qilmasdan qo'shiladi.
  • Semantik ma'lumotlar bilan "belgilangan" hujjatlar (an.) kengaytma HTML ning <meta> teglar uchun ma'lumot etkazib berish uchun bugungi veb-sahifalarda foydalaniladi Veb-qidiruv tizimlari foydalanish veb-brauzerlar ). Bu bo'lishi mumkin mashinada tushunarli hujjatning inson tomonidan tushunarli tarkibi to'g'risidagi ma'lumotlar (muallif, sarlavha, tavsif va boshqalar kabi) yoki u faqat bo'lishi mumkin metadata bir qator faktlarni aks ettirish (masalan, saytning boshqa joylarida manbalar va xizmatlar). Yozib oling har qanday narsa bilan aniqlanishi mumkin Resursning yagona identifikatori (URI) tasvirlangan bo'lishi mumkin, shuning uchun semantik veb hayvonlar, odamlar, joylar, g'oyalar va boshqalar haqida fikr yuritishi mumkin. HTML hujjatlarida to'rtta semantik izohlash formatlari mavjud; Mikroformat, RDFa, Microdata va JSON-LD.[28] Semantik belgilash ko'pincha qo'lda emas, balki avtomatik ravishda yaratiladi.
  • Umumiy metama'lumotlar lug'ati (ontologiyalar ) va hujjat yaratuvchilarga hujjatlarni qanday belgilashni bilishlariga imkon beradigan so'z birikmalari orasidagi xaritalar, agentlar berilgan metama'lumotlardagi ma'lumotlardan foydalanishi uchun (shunday qilib) Muallif "Sahifa muallifi" ma'nosida aralashtirilmaydi Muallif kitobni ko'rib chiqish mavzusi bo'lgan kitob ma'nosida).
  • Ushbu ma'lumotlardan foydalangan holda semantik veb foydalanuvchilari uchun vazifalarni bajaradigan avtomatlashtirilgan agentlar.
  • Ma'lumotlarni agentlarga maxsus etkazib beradigan veb-xizmatlar (ko'pincha o'zlarining agentlari bilan), masalan, a Ishonchli xizmat agent ba'zi onlayn-do'konlarda yomon xizmat ko'rsatish tarixi borligini so'rashi mumkin spam-xabar.

Bunday xizmatlar ommaviy qidiruv tizimlari uchun foydali bo'lishi mumkin yoki undan foydalanilishi mumkin bilimlarni boshqarish tashkilot ichida. Biznes dasturlariga quyidagilar kiradi:

  • Aralash manbalardan olingan ma'lumotlarni birlashtirishga ko'maklashish
  • Korporativ terminologiyadagi noaniqliklarni echish
  • Yaxshilash ma'lumot olish shu bilan kamaytirish ma'lumotning haddan tashqari yuklanishi va olingan ma'lumotlarning aniqligi va aniqligini oshirish[29][30][31][32]
  • Berilgan domenga tegishli ma'lumotlarni aniqlash[33]
  • Qaror qabul qilishni qo'llab-quvvatlash

Korporatsiyada yopiq foydalanuvchilar guruhi mavjud va menejment kompaniyaning ko'rsatmalarini bajarishga qodir, masalan, maxsus qabul qilish. ontologiyalar va foydalanish semantik izoh. Ommaviy Semantik Internet bilan taqqoslaganda kamroq talablar mavjud ölçeklenebilirlik va kompaniya ichida aylanayotgan ma'lumotlarga umuman ko'proq ishonish mumkin; maxfiylik mijozlar ma'lumotlarini ishlatishdan tashqarida kamroq muammo.

Shubhali reaktsiyalar

Amaliy maqsadga muvofiqligi

Tanqidchilar Semantic Web-ni to'liq yoki hatto qisman bajarilishining asosiy maqsadga muvofiqligini shubha ostiga qo'yadilar va uni o'rnatishda har ikkala qiyinchilikni ham, kerakli harakatlarni sarmoya kiritishga xalaqit beradigan umumiy maqsadli foydasizlikni ham ta'kidlaydilar. 2003 yilgi maqolasida Marshall va Shipman an'anaviy veb-mualliflik bilan taqqoslaganda, bilimlarni rasmiylashtirishga xos bo'lgan bilimga oid xarajatlarni ta'kidladilar. gipermatn:[34]

HTML asoslarini o'rganish nisbatan sodda bo'lsa-da, bilimni namoyish etish tili yoki vositasini o'rganish muallifdan vakillikning mavhumlash usullari va ularning fikrlashga ta'siri haqida ma'lumot olishni talab qiladi. Masalan, sinf-instansiya munosabatlari yoki superklass-subklass munosabatlarini tushunish, bitta tushuncha boshqa tushunchaning "turi" ekanligini tushunishdan ko'proqdir. […] Ushbu abstraktlar odatda kompyuter olimlari va bilim muhandislariga o'rgatiladi, ammo shunga o'xshash tabiiy til ma'nosiga mos kelmaydi. Bunday rasmiy vakillikdan samarali foydalanish muallifdan domen talab qiladigan boshqa ko'nikmalarga qo'shimcha ravishda malakali bilim muhandisi bo'lishini talab qiladi. […] Rasmiy vakillik tilini o'rganib chiqqaningizdan so'ng, bu rasmiy vakolatxonada g'oyalarni ifoda etishga unchalik rasmiy bo'lmagan vakolatxonaga qaraganda ko'proq harakat qilish kerak […]. Darhaqiqat, bu semantik ma'lumotlar deklaratsiyasiga asoslangan dasturlash shakli bo'lib, mulohaza algoritmlari muallif tuzilmalarini qanday talqin qilishini tushunishni talab qiladi.

Marshall va Shipmanning so'zlariga ko'ra jim va ko'plab bilimlarning o'zgaruvchan tabiati ularga qo'shimcha qiladi bilim muhandisligi muammo va Semantic Web-ning ma'lum domenlarga nisbatan qo'llanilishini cheklaydi. Ular ta'kidlagan yana bir masala - bu faqat texnik vositalar bilan emas, balki jamoaviy kelishuv orqali hal qilinishi kerak bo'lgan bilimlarni ifoda etishning domen yoki tashkilotga xos usullari.[34] Ma'lum bo'lishicha, kompaniya ichidagi loyihalar uchun ixtisoslashgan jamoalar va tashkilotlar periferik va kam ixtisoslashgan jamoalarga qaraganda semantik veb-texnologiyalarni o'zlashtirishga intilishgan.[35] Qabul qilish bo'yicha amaliy cheklovlar, keng omma va Butunjahon Internetiga qaraganda domen va ko'lam cheklangan joylarda unchalik qiyin bo'lmagan.[35]

Va nihoyat, Marshall va Shipman (Bilim navigatori - uslub) asosan qo'lda boshqariladigan Semantik Internetda ishlaydigan aqlli agentlar:[34]

Foydalanuvchilarning ehtiyojlari ma'lum bo'lgan va tarqatilgan axborot resurslari yaxshi tavsiflangan vaziyatlarda ushbu yondashuv yuqori samaradorlikka ega bo'lishi mumkin; kutilmagan bir qator axborot resurslarini birlashtirgan vaziyatlarda Google yondashuvi yanada kuchliroqdir. Bundan tashqari, Semantik Internet mo'rtroq xulosalar zanjirlariga tayanadi; zanjirning etishmayotgan elementi kerakli harakatni bajarmay qolishiga olib keladi, odam esa etishmayotgan qismlarni Googlega o'xshash usulda etkazib berishi mumkin. […] Iqtisodiy va foydali savdolar oqilona tuzilgan domenga xos axborot resurslarini birlashtirishga qaratilgan maxsus yaratilgan Semantik veb-meta-ma'lumotlar foydasiga ishlashi mumkin; foydalanuvchilar / mijozlar ehtiyojlariga katta e'tibor ushbu federatsiyalarni muvaffaqiyatli bo'lishiga olib keladi.

Cory Doctorow tanqid ("metakrap ") inson xulq-atvori va shaxsiy imtiyozlari nuqtai nazaridan. Masalan, odamlar metamalumotlarning to'g'riligini sodda deb hisoblaydigan Semantik veb-dvigatellarni yo'ldan ozdirish uchun soxta metama'lumotlarni veb-sahifalarga kiritishi mumkin. Ushbu hodisa metamahsulotlarni aldagan metataglar bilan yaxshi tanilgan edi. Altavista algoritmni ma'lum veb-sahifalar reytingini ko'tarish darajasiga ko'tarish. Piter Gardenfors va Timo Xonkela mantiqqa asoslangan semantik veb-texnologiyalar semantikaga oid tegishli hodisalarning faqat bir qismini qamrab olishiga e'tibor bering.[36][37]

Tsenzura va shaxsiy hayot

Semantik vebga bo'lgan ishtiyoqni tashvishga soladigan muammolar kamaytirishi mumkin tsenzura va maxfiylik. Masalan; misol uchun, matnni tahlil qilish texnikani endi boshqa so'zlar, masalan metafora yordamida yoki so'zlar o'rniga rasmlardan foydalanish orqali osonlikcha chetlab o'tish mumkin. Semantik veb-ning ilg'or tatbiq etilishi hukumatlar uchun onlayn ma'lumotni ko'rish va yaratishni nazorat qilishni ancha osonlashtirar edi, chunki bu ma'lumotlarni avtomatlashtirilgan kontentni blokirovka qilish mashinasi tushunishi ancha oson bo'ladi. Bundan tashqari, foydalanish masalasi ham ko'tarilgan FOAF fayllar va geolokatsiya meta-ma'lumotlar, shaxsiy blog kabi narsalarga oid maqolalar muallifligi bilan bog'liq bo'lgan juda kam yashirinlik bo'ladi. Ushbu xavotirlarning ba'zilari "Siyosatdan xabardor veb" loyihasida ko'rib chiqildi[38] va faol tadqiqot va rivojlantirish mavzusi.

Chiqish formatlarini ikki baravar oshirish

Semantik veb-saytlarning yana bir tanqidi shundaki, tarkibni yaratish va nashr etish ancha vaqt talab qiladi, chunki bitta ma'lumot uchun ikkita format bo'lishi kerak: biri odamni ko'rish uchun, ikkinchisi esa mashinalar uchun. Biroq, ko'pchilik veb-ilovalar ishlab chiqishda ma'lumotlar nashr etilgandan keyin yoki bunday ma'lumotlar uchun mashinaning iltimosiga binoan mashinada o'qiladigan formatni yaratish orqali ushbu muammo hal qilinmoqda. Mikroformatlarning rivojlanishi ushbu turdagi tanqidlarga reaktsiya bo'ldi. Semantik veb-saytning maqsadga muvofiqligini himoya qilishda yana bir dalil - bu raqamli mehnat bozorlarida insonning aql-idrok vazifalari narxining pasayishi, masalan Amazon "s Mexanik turk.[iqtibos kerak ]

Kabi texnik xususiyatlar eRDF va RDFa o'zboshimchalik bilan RDF ma'lumotlarini HTML-sahifalarga joylashtirishga imkon beradi. The GRDDL (Til dialektlaridan olingan Gleaning Resurs Descriptions of Language dialects) mexanizmi mavjud materialni (shu jumladan mikroformatlarni) avtomatik ravishda RDF deb talqin qilishga imkon beradi, shuning uchun noshirlar faqat bitta formatdan, masalan HTML dan foydalanishlari kerak.

Korporativ dasturlar bo'yicha tadqiqot faoliyati

Korporativ semantik veb-saytga aniq e'tibor qaratgan birinchi tadqiqot guruhi ACACIA jamoasi edi INRIA-Sofiya-Antipolis, 2002 yilda tashkil etilgan. Ularning ish natijalariga quyidagilar kiradi RDF (S) asoslangan Korese[39] qidiruv tizimi, va semantik veb-texnologiyalarni sohada qo'llash tarqatilgan sun'iy intellekt uchun bilimlarni boshqarish (masalan, ontologiyalar va ko'p agentli tizimlar korporativ semantik veb uchun) [40] va Elektron ta'lim.[41]

2008 yildan buyon joylashgan korporativ semantik veb-tadqiqot guruhi Berlin bepul universiteti, asosiy bloklarga e'tiborni qaratadi: Korporativ semantik izlash, korporativ semantik hamkorlik va korporativ ontologiya muhandisligi.[42]

Ontologik muhandislik tadqiqotlari ontologiya va semantik izohli tarkibni yaratishda mutaxassis bo'lmagan foydalanuvchilarni qanday jalb qilish masalasini o'z ichiga oladi[43] va korxonalar ichidagi foydalanuvchilarning o'zaro munosabatlaridan aniq bilimlarni olish uchun.

Ilovalarning kelajagi

Tim O'Rayli Veb 2.0 atamasini ishlab chiqqan, zamonaviy dasturlar ma'lumotlar tarmog'ini boshqaradigan Semantik veb-ning ma'lumotlar tarmog'i sifatida uzoq muddatli tasavvurini taklif qildi.[44] Ma'lumotlar tarmog'i World Wide Web-ni a dan o'zgartiradi tarqatildi fayl tizimi tarqatilgan ma'lumotlar bazasi tizimiga.[45]

Shuningdek qarang

Adabiyotlar

  1. ^ "XML va Semantic Web W3C standartlari xronologiyasi" (PDF). 2012-02-04.
  2. ^ "World Wide Web Consortium (W3C)," RDF / XML sintaksis spetsifikatsiyasi (qayta ko'rib chiqilgan) ", 2004 yil 10 fevral".
  3. ^ "World Wide Web Consortium (W3C)," OWL Web Ontology Language Overview ", W3C Tavsiyasi, 2004 yil 10 fevral".
  4. ^ Chung, Seung-Xva (2018). "MOUSE yondashuvi: tizim muhandislari uchun UML yordamida ontologiyalarni xaritalash". Kompyuter sharhlari jurnali: 8–29. ISSN  2581-6640.
  5. ^ a b "W3C semantik veb-faoliyati". Butunjahon Internet tarmog'idagi konsortsium (W3C). 2011 yil 7-noyabr. Olingan 26-noyabr, 2011.
  6. ^ "Tim Berners-Li bilan savol-javob, maxsus reportaj". businessweek.com. Olingan 14 aprel 2018.
  7. ^ a b Berners-Li, Tim; Jeyms Xendler; Ora Lassila (2001 yil 17-may). "Semantik veb". Ilmiy Amerika. Olingan 2 iyul, 2019.
  8. ^ Li Feygenbaum (2007 yil 1-may). "Semantik veb amalda". Ilmiy Amerika. Olingan 24-fevral, 2010.
  9. ^ Berners-Li, Tim; Fishetti, Mark (1999). Internetni to'qish. HarperSanFrancisco. 12-bob. ISBN  978-0-06-251587-2.
  10. ^ Berners-Li, Tim (2001 yil 17-may). "Semantik veb" (PDF). Ilmiy Amerika. S2CID  32015696. Olingan 13 mart, 2008.
  11. ^ Nayjel Shadbolt; Vendi Xoll; Tim Berners-Li (2006). "Semantik veb qayta ko'rib chiqildi" (PDF). IEEE Aqlli tizimlar. Olingan 13 aprel, 2007.
  12. ^ Ramanatan V. Guha (2013). "Tunnel oxirida yorug'lik". Xalqaro semantik veb-konferentsiya 2013 yil asosiy so'z. Olingan 8 mart, 2015.
  13. ^ Allsopp, Jon (2007 yil mart). Mikroformatlar: Web 2.0 uchun Markup-ni kuchaytirish. ED do'stlari. p.368. ISBN  978-1-59059-814-6.
  14. ^ Artem Chebotko va Shiyong Lu, "Semantik veb-so'rov: relyatsion ma'lumotlar bazalari yordamida samarali yondashuv", LAP Lambert akademik nashriyoti, ISBN  978-3-8383-0264-5, 2009.
  15. ^ Shannon, Viktoriya (2006 yil 23-may). "Yanada inqilobiy" veb-sayt ". International Herald Tribune. Olingan 26 iyun 2006.
  16. ^ Sharma, Axilesh. "Veb 3.0 kontseptsiyasi bilan tanishish". Tweak and Trick. Olingan 10 yanvar 2017.
  17. ^ Xojson, Metyu (2016 yil 9 oktyabr). "Markazlashtirilmagan tarmoq odamlarga on-layn quvvatni qaytaradi". TechCrunch. AOL Inc.. Olingan 1 dekabr 2016.
  18. ^ Xarris, Jon (7 yanvar 2019). "Birgalikda biz katta texnologik ma'lumotlarning to'planishiga xalaqit bera olamiz: mana shunday". Guardian. London, Buyuk Britaniya. ISSN  0261-3077. Olingan 7 yanvar 2019.
  19. ^ Bruker, Katrina (2018 yil 29 sentyabr). "Eksklyuziv: Tim Berners-Li bizga Butunjahon Internet tarmog'ini rivojlantirish bo'yicha o'zining tub rejasini aytib berdi". Tezkor kompaniya. AQSH. Olingan 7 yanvar 2019.
  20. ^ "Bosh sahifa | noto'g'ri". Xato. Olingan 7 yanvar 2019.
  21. ^ "Internetni noaniqlik uchun mulohaza qilish". W3.org. Olingan 20 dekabr 2018.
  22. ^ Lukasevich, Tomas; Umberto Straccia (2008). "Semantik veb uchun tavsiflash mantiqidagi noaniqlik va noaniqlikni boshqarish" (PDF). Veb semantikasi: Butunjahon tarmog'idagi fan, xizmatlar va agentlar. 6 (4): 291–308. doi:10.1016 / j.websem.2008.04.001.
  23. ^ "Semantik veb-standartlar". W3.org. Olingan 14 aprel 2018.
  24. ^ "OWL veb-ontologiya tiliga umumiy nuqtai". Butunjahon Internet tarmog'idagi konsortsium (W3C). 2004 yil 10 fevral. Olingan 26-noyabr, 2011.
  25. ^ "Resurslarni tavsiflash doirasi (RDF)". Butunjahon Internet tarmog'idagi konsortsium.
  26. ^ Allemang, dekan; Xendler, Jeyms; Gandon, Fabien (3 avgust, 2020 yil). Ishlayotgan ontolog uchun semantik veb: bog'langan ma'lumotlar, RDFS va OWL uchun samarali modellashtirish (Uchinchi nashr). [Nyu-York, NY, AQSh]: ACM Books; 3-nashr. ISBN  978-1450376143.
  27. ^ "ConverterToRdf - W3C Wiki". W3.org. Olingan 20 dekabr 2018.
  28. ^ Sikos, Lesli F. (2015). Semantik veb-da tuzilgan ma'lumotlarni o'zlashtirish: HTML5 Microdata'dan bog'langan ochiq ma'lumotlarga. Apress. p. 23. ISBN  978-1-4842-1049-9.
  29. ^ Omar Alonso va Ugo Saragoza. 2008. Axborot olishda semantik izohlardan foydalanish: ESAIR '08. SIGIR Forum 42, 1 (2008 yil iyun), 55-58. doi:10.1145/1394251.1394262
  30. ^ Yaap Kamps, Jussi Karlgren, va Ralf Shenkel. 2011. Axborot olishda semantik izohlardan foydalanish bo'yicha uchinchi seminar (ESAIR) haqida hisobot. SIGIR Forum 45, 1 (2011 yil may), 33–41. doi:10.1145/1988852.1988858
  31. ^ Yaap Kamps, Jussi Karlgren, Piter Mika va Vanessa Murdok. 2012. Axborot olishda semantik izohlardan foydalanish bo'yicha beshinchi seminar: ESAIR '12). Axborot va bilimlarni boshqarish bo'yicha 21-ACM xalqaro konferentsiyasi (CIKM '12) materiallari to'plamida. ACM, Nyu-York, Nyu-York, AQSh, 2772–2773. doi:10.1145/2396761.2398761
  32. ^ Omar Alonso, Yaap Kamps va Jussi Karlgren. 2015. Axborot olishda semantik izohlarni ekspluatatsiya qilish bo'yicha ettinchi seminar to'g'risida hisobot (ESAIR '14). SIGIR Forum 49, 1 (2015 yil iyun), 27-34. doi:10.1145/2795403.2795412
  33. ^ Kuriakose, Jon (sentyabr 2009). "Semantik veb-texnologiyalarni tushunish va qabul qilish". Cutter IT Journal. CUTTER INFORMATION CORP. 22 (9): 10–18.
  34. ^ a b v Marshall, Ketrin C.; Shipman, Frank M. (2003). Qaysi semantik veb? (PDF). Proc. ACM konf. gipermatn va gipermedia haqida. 57-66 betlar.
  35. ^ a b Ivan Herman (2007). Semantik Internetning holati (PDF). Semantik kunlar 2007 yil. Olingan 26 iyul, 2007.
  36. ^ Gardenfors, Piter (2004). Semantik Internetni qanday qilib semantik qilish kerak. Axborot tizimlaridagi rasmiy ontologiya: uchinchi xalqaro konferentsiya materiallari (FOIS-2004). IOS Press. 17-34 betlar.
  37. ^ Xonkela, Timo; Könenen, Vill; Lind-Knuutila, Tiina; Paukkeri, Mari-Sanna (2008). "Kontseptsiyani shakllantirish va aloqa jarayonlarini simulyatsiya qilish". Iqtisodiy metodologiya jurnali. 15 (3): 245–259. doi:10.1080/13501780802321350.
  38. ^ "Siyosatdan xabardor veb-loyiha". Policyawareweb.org. Olingan 2013-06-14.
  39. ^ Kori, Olivye; Dieng-Kuntz, Roza; Tsuker, Ketrin Faron; Gandon, Fabien (NaN). "Semantik veb-qidiruv: Ontologiyalar asosida so'rovlarni taxminiy qayta ishlash". IEEE Intelligent Systems. 21: 20–27. doi:10.1109 / MIS.2006.16. S2CID  11488848. Sana qiymatlarini tekshiring: | sana = (Yordam bering)
  40. ^ Gandon, Fabien (2002 yil 7-noyabr). "Tarqatilgan sun'iy intellekt va bilimlarni boshqarish: korporativ semantik veb uchun ontologiyalar va ko'p agentlik tizimlar". Université Nice Sophia Antipolis.
  41. ^ Buffa, Mishel; Dehors, Silvain; Faron-Tsuker, Ketrin; Sander, Piter (2005). "O'quv tizimlarini loyihalashda korporativ semantik veb-yondashuv tomon: sinovli Solutioinlar loyihasini ko'rib chiqish" (PDF). Elektron ta'lim uchun semantik veb-texnologiyalarni qo'llash bo'yicha xalqaro seminar. Amsterdam, Gollandiya. 73-76 betlar.
  42. ^ "Korporativ semantik veb - uy". Corporate-semantic-web.de. Olingan 14 aprel 2018.
  43. ^ Xinze, Annika; Xiz, Ralf; Luczak-Rosh, Markus; Paschke, Adrian (2012). "Mutaxassis bo'lmaganlar tomonidan semantik boyitish: qo'lda izohlash vositalaridan foydalanish" (PDF). ISWC'12 - Semantik Internetdagi 11-xalqaro konferentsiya materiallari. Boston, AQSh 165-181 betlar.
  44. ^ Mathieson, S. A. (2006 yil 6 aprel). "So'zni tarqating va unga qo'shiling". Guardian. Olingan 14 aprel 2018.
  45. ^ Spivack, Nova (2007 yil 18-sentyabr). "Semantik veb, kollektiv razvedka va giperdata". novaspivack.typepad.com/nova_spivacks_weblog [Ushbu blog NovaSpivack.com saytiga ko'chirilgan]. Olingan 14 aprel 2018.

Qo'shimcha o'qish

Tashqi havolalar