Hamma joyda bilimlarni qayta ishlash laboratoriyasi - Ubiquitous Knowledge Processing Lab - Wikipedia

The Hamma joyda bilimlarni qayta ishlash laboratoriyasi (shuningdek UKP laboratoriyasi) tadqiqot laboratoriyasi Kompyuter fanlari kafedrasi da Technische Universität Darmstadt. U 2006 yilda tashkil etilgan Iryna Gurevich.

Tadqiqot faoliyati

UKP laboratoriyasi rivojlanmoqda tabiiy tilni qayta ishlash avtomatik ravishda yozma matnni tushunish texnikasi va ularni shu kabi axborotni boshqarish uchun qo'llaydi ma'lumot olish, savolga javob berish va tarkibidagi ma'lumotlarni tuzish Vikilar.[1]

Hamma joyda mavjud bo'lgan bilimlarni qayta ishlash laboratoriyasi foydalanish sohasida etakchi ilmiy-tadqiqot institutlaridan biri hisoblanadi Veb 2.0 mazmuni manbai sifatida leksik semantik tabiiy tilni qayta ishlash uchun ma'lumot (NLP). Vikipediya va Vikilug'at birgalikda yaratilgan leksik semantik manbalar sifatida ishlatiladi va shunga o'xshash mutaxassislar tomonidan yaratilgan resurslarni takomillashtirish uchun ishlatiladi WordNet.Bu manbalar ma'lumot olish va savollarga javob berish uchun semantik jihatdan yaxshilangan algoritmlarni ishlab chiqishda foydalaniladi. Misol semantik qidiruv: Agar foydalanuvchi qidiruv tizimiga "pirog-meva" so'rovini kiritsa, standart qidiruv tizimi "olma" so'zi emas, balki "meva" so'zini o'z ichiga olgan sahifalarni oladi va "olma pirogi" da juda ko'p sahifalarni taqdim etadi. Aqlli qidiruv tizimi foydalanuvchiga biron bir mevaning turidan foydalanmaydigan pirog retseptlari va tegishli hujjatlarni olish bilan qiziqishini "tushunadi".[2]

UKP laboratoriyasidagi keyingi tadqiqotlar matnni avtomatik ravishda sifatini baholash, hissiyotlarni tahlil qilish va fikrlarni qazib olish. Ilmiy-tadqiqot faoliyati quyidagi tadqiqot yo'nalishlari bo'yicha tashkil etilgan:

  • Tabiiy tilni qayta ishlash
  • Ko'p tilli semantik axborotni boshqarish
  • Vikilar uchun tabiiy tilni qayta ishlash

UKP Laboratoriyasida katta e'tibor tabiiy tillarni qayta ishlashning yangi algoritmlaridan real hayotda foydalanishga qaratilgan. UKP Laboratoriyasi, masalan, turli xil dastur stsenariylarini takomillashtirish uchun akademik va sanoat sheriklari bilan hamkorlik qiladi mijozlar bilan munosabatlarni boshqarish, raqamli gumanitar fanlar, ta'lim dasturlari yoki jamoat xavfsizligi.

Dasturiy ta'minot

UKP Laboratoriyasida olib borilayotgan tadqiqot ishlarining bir qismi tabiiy tilni qayta ishlash (NLP) dasturiy ta'minot. Tadqiqot uchun quyidagi dasturiy ta'minot to'plamlaridan erkin foydalanish mumkin:

DKPro

Darmstadt bilimlarini qayta ishlash dasturiy ta'minot ombori (DKPro) - bu tabiiy tilni qayta ishlashga yo'naltirilgan dasturiy ta'minot loyihalarining ochiq manbali hamjamiyati. U IBM-ning ustiga o'rnatilgan NLP komponentlarini ishlatishga tayyor bo'lgan mustahkamligini taklif etadi Tuzilmasiz Axborotni boshqarish arxitekturasi (UIMA) umumiy va ochiq sifatida ramka.

DKPro tarkibida tabiiy tilni qayta ishlashning asosiy komponentlari mavjud nutqning bir qismini belgilash va lemmatizatsiya. Bundan tashqari, to'plam foydalanuvchi tomonidan ishlab chiqilgan nutqni qayta ishlashni qo'llab-quvvatlovchi komponentlarni taqdim etadi. Foydalanuvchilar tomonidan yaratilgan tarkibda standart NLP komponentlarini to'g'ridan-to'g'ri qo'llashni taqiqlovchi imlo xatolari, qisqartmalar va smayliklar mavjud. DKPro kerakli ishlov berish vositalarini taqdim etadi.

Vikipediya API

Java Vikipediya kutubxonasi (JWPL)[3] shuningdek UKP laboratoriyasida ishlab chiqilgan. Bu Java asoslangan dastur dasturlash interfeysi Vikipediya uchun va tarkibidagi barcha ma'lumotlarga dasturiy kirish imkonini beradi Vikipediya.

Vikilug'at APIsi

JWPL-ga parallel ravishda, Java Vikipediya kutubxonasi (JWKTL)[3] ning ingliz va nemis tillarida joylashgan ma'lumotlariga dasturiy kirishni taklif qiladi Vikilug'at.

Adabiyotlar

  1. ^ Gessen-IT yangiliklari 03/2008.
  2. ^ Misol: Impulse für die Wissenschaft 2010 (Volkswagenstiftung).
  3. ^ a b Malumot nashrlari: [1] Zesch, Myuller, Gurevych: Vikipediya va Vikilug'atdan leksik semantik bilimlarni chiqarib olish, LREC 2008 yildagi ishlar.

Tashqi havolalar

Koordinatalar: 49 ° 52′38 ″ N. 8 ° 39′17 ″ E / 49.877235 ° N 8.654688 ° E / 49.877235; 8.654688