Uyushma qoidalarini o'rganish - Association rule learning - Wikipedia

Uyushma qoidalarini o'rganish a qoidalarga asoslangan mashinalarni o'rganish katta ma'lumotlar bazalarida o'zgaruvchilar o'rtasidagi qiziqarli munosabatlarni aniqlash usuli. Ba'zi qiziqarli o'lchovlar yordamida ma'lumotlar bazalarida aniqlangan kuchli qoidalarni aniqlashga mo'ljallangan.[1]

Kuchli qoidalar kontseptsiyasiga asoslanib, Rakesh Agrawal, Tomasz Imieliński va Arun Swami[2] tomonidan ro'yxatga olingan keng ko'lamli operatsiyalar ma'lumotlarida mahsulotlar o'rtasidagi qonuniyatlarni aniqlash uchun assotsiatsiya qoidalarini joriy qildi savdo nuqtasi Supermarketlardagi (POS) tizimlar. Masalan, qoida supermarketning savdo ma'lumotlarida, agar mijoz piyoz va kartoshkani birgalikda sotib olsa, ular ham gamburger go'shtini sotib olishlari mumkin. Bunday ma'lumotlar marketing faoliyati to'g'risida qaror qabul qilish uchun asos sifatida ishlatilishi mumkin, masalan, reklama kabi narxlash yoki mahsulotni joylashtirish.

Dan yuqoridagi misolga qo'shimcha ravishda bozor savatini tahlil qilish assotsiatsiya qoidalari bugungi kunda ko'plab dastur sohalarida, shu jumladan Internetdan foydalanish konlari, kirishni aniqlash, uzluksiz ishlab chiqarish va bioinformatika. Bilan farqli o'laroq ketma-ket qazib olish, assotsiatsiya qoidalarini o'rganish, odatda, bitim doirasidagi yoki bitimlardagi narsalar tartibini hisobga olmaydi.

Ta'rif

5 ta bitim va 5 ta ma'lumotlar bilan namunaviy ma'lumotlar bazasi
tranzaksiya identifikatorisutnonsariyog 'pivotagliklar
111000
200100
300011
411100
501000

Agrawal, Imieliński, Swami tomonidan berilgan asl ta'rifga rioya qilgan holda[2] assotsiatsiya qoidalarini qazib olish muammosi quyidagicha aniqlanadi:

Ruxsat bering to'plami bo'ling chaqirilgan ikkilik atributlar buyumlar.

Ruxsat bering deb nomlangan bitimlar to'plami bo'lishi mumkin ma'lumotlar bazasi.

Har biri bitim yilda noyob tranzaksiya identifikatoriga ega va elementlarning kichik qismini o'z ichiga oladi .

A qoida shaklning ma'nosi sifatida belgilanadi:

, qayerda .

Agrawalda, Imielikiski, Swami[2] a qoida faqat to'plam va bitta element o'rtasida aniqlanadi, uchun .

Har qanday qoida ikki xil elementlar to'plamidan iborat bo'lib, ular ham ma'lum buyumlar to'plamlari, va , qayerda deyiladi oldingi yoki chap tomon (LHS) va natijada yoki o'ng tomon (RHS).

Kontseptsiyalarni tasvirlash uchun biz supermarketlar domenidan olingan kichik bir misoldan foydalanamiz. Ob'ektlar to'plami va jadvalda elementlarni o'z ichiga olgan kichik ma'lumotlar bazasi ko'rsatilgan, bu erda har bir yozuvda 1 qiymati mos keladigan bitimdagi element mavjudligini anglatadi va 0 qiymati ushbu operatsiyadagi element yo'qligini anglatadi.

Supermarket uchun namunaviy qoida bo'lishi mumkin ya'ni sariyog 'va non sotib olinsa, xaridorlar sutni ham sotib olishadi.

Izoh: bu misol juda kichik. Amaliy qo'llanmalarda qoida statistik ahamiyatga ega deb hisoblanishidan oldin bir necha yuz operatsiyalarni qo'llab-quvvatlashga muhtoj,[3] va ma'lumotlar to'plamlari ko'pincha minglab yoki millionlab operatsiyalarni o'z ichiga oladi.

Foydali tushunchalar

Barcha mumkin bo'lgan qoidalar to'plamidan qiziqarli qoidalarni tanlash uchun har xil ahamiyatga va qiziqish o'lchovlariga cheklovlar qo'llaniladi. Eng taniqli cheklovlar - qo'llab-quvvatlash va ishonchning minimal chegaralari.

Ruxsat bering buyumlar bo'ling, birlashma qoidasi va berilgan ma'lumotlar bazasi operatsiyalari to'plami.

Qo'llab-quvvatlash

Qo'llab-quvvatlash, ma'lumotlar to'plamida ma'lumotlar to'plamining qanchalik tez-tez paydo bo'lishining ko'rsatkichidir.

Qo'llab-quvvatlash munosabat bilan bitimlarning ulushi sifatida aniqlanadi ma'lumotlar to'plamida joylashgan ma'lumotlar to'plamida .

Ma'lumotlar to'plami misolida, ma'lumotlar to'plami ning qo'llab-quvvatlashiga ega chunki bu barcha bitimlarning 20 foizida (5 bitimdan bittasi) sodir bo'ladi. Ning argumenti old shartlarning to'plamidir va shu bilan u o'sib borishi bilan cheklovga aylanadi (ko'proq inklyuziv o'rniga).[4]

Bundan tashqari, buyumlar to'plami ning qo'llab-quvvatlashiga ega barcha operatsiyalarning 20 foizida ham bo'lgani kabi.

Ishonch

Ishonch bu qoidaning qanchalik tez-tez aniqlanganligidan dalolat beradi.

The ishonch qoidaning qiymati, , bitimlar to'plamiga nisbatan , o'z ichiga olgan bitimlarning ulushi u ham o'z ichiga oladi .

Ishonch quyidagicha ta'riflanadi:

Masalan, qoida ishonchiga ega ma'lumotlar bazasida, bu sariyog 'va nonni o'z ichiga olgan bitimlarning 100% uchun to'g'ri bo'lganligini anglatadi (xaridor sariyog' va non sotib olganida 100%, sut ham sotib olinadi).

Yozib oling X va Y elementlarning birlashishini qo'llab-quvvatlashni anglatadi. Bu biroz chalkash, chunki biz odatda ehtimolliklar nuqtai nazaridan o'ylaymiz voqealar va buyumlar to'plami emas. Qayta yozishimiz mumkin ehtimollik sifatida , qayerda va bitim elementlar to'plamini o'z ichiga olgan hodisalar va navbati bilan.[5]

Shunday qilib ishonchni baholash sifatida izohlash mumkin shartli ehtimollik , ushbu bitimlarda LHS ham bo'lishi sharti bilan operatsiyalarda qoidaning RHS-ni topish ehtimoli.[4][6]

Ko'taring

The ko'tarish qoida quyidagicha aniqlanadi:

yoki kuzatilgan qo'llab-quvvatlashning X va Y bo'lsa, kutilgan natijaga nisbati mustaqil.

Masalan, qoida ko'taruvchiga ega .

Agar qoida 1 koeffitsientiga ega bo'lsa, demak, oldingi va keyingi oqibatlarning yuzaga kelish ehtimoli bir-biridan mustaqil ekanligini anglatadi. Ikki hodisa bir-biridan mustaqil bo'lganda, ushbu ikki hodisani o'z ichiga olgan hech qanday qoida tuzish mumkin emas.

Agar ko'tarish> 1 bo'lsa, bu bizga ushbu ikkita hodisaning bir-biriga bog'liqligini bilib olishga imkon beradi va ushbu qoidalarni kelajakdagi ma'lumotlar to'plamida natijani bashorat qilish uchun foydali bo'ladi.

Agar ko'tarish <1 bo'lsa, bu narsalar bir-birining o'rnini bosuvchi ekanligini bilib olamiz. Bu shuni anglatadiki, bitta buyumning mavjudligi boshqa narsaning mavjudligiga salbiy ta'sir qiladi va aksincha.

Liftning qiymati shundaki, u qoidani qo'llab-quvvatlashni va umumiy ma'lumotlar to'plamini hisobga oladi.[4]

Sudlanganlik

The ishonchlilik qoidalar quyidagicha aniqlanadi .[7]

Masalan, qoida hukmiga ega , va agar X va Y mustaqil bo'lgan holda, noto'g'ri bashoratlarning kuzatilgan chastotasiga bo'linib ketgan bo'lsa, kutilmaganda X ning Y holda sodir bo'ladigan nisbati (ya'ni qoida noto'g'ri bashorat qiladigan chastota) deb talqin qilinishi mumkin. Ushbu misolda sudlanganlik qiymati 1,2 bu qoidani ko'rsatmoqda agar X va Y o'rtasidagi bog'liqlik tasodifiy tasodif bo'lsa, 20% tez-tez (1,2 marta tez-tez) noto'g'ri bo'ladi.

Qiziqishning alternativ o'lchovlari

Ishonchdan tashqari, ning boshqa choralari qiziqish chunki qoidalar taklif qilingan. Ba'zi mashhur tadbirlar:

Tan va boshqalar tomonidan yana bir qancha chora-tadbirlar keltirilgan va taqqoslangan.[11] va Xaxler tomonidan.[5] Foydalanuvchiga ma'lum bo'lgan narsalarni modellashtirishga qodir bo'lgan texnikalarni qidirish (va ushbu modellardan qiziqish o'lchovlari sifatida foydalanish) hozirgi kunda "Sub'ektiv qiziqish" nomi ostida faol tadqiqot tendentsiyasidir.


Jarayon

Tez-tez joylashgan buyumlar panjarasi, bu erda qutining rangi, bitimlarning kombinatsiyasini o'z ichiga olgan qancha tranzaktsiyalarni ko'rsatadi. Shuni unutmangki, panjaraning quyi sathlari, eng kamida, ularning ota-onalarining buyumlarining eng kam sonini o'z ichiga olishi mumkin; masalan. {ac} maksimal darajada bo'lishi mumkin buyumlar. Bunga pastga yopilish xususiyati.[2]

Birlashma qoidalari odatda foydalanuvchi tomonidan belgilangan minimal qo'llab-quvvatlashni va foydalanuvchi tomonidan belgilangan minimal ishonchni bir vaqtning o'zida qondirish uchun talab qilinadi. Uyushma qoidalarini yaratish odatda ikkita alohida bosqichga bo'linadi:

  1. Barchasini topish uchun minimal qo'llab-quvvatlash chegarasi qo'llaniladi tez-tez ishlatiladigan buyumlar ma'lumotlar bazasida.
  2. Ushbu tez-tez uchraydigan narsalarga qoidalarni shakllantirish uchun minimal ishonch cheklovi qo'llaniladi.

Ikkinchi qadam to'g'ri bo'lsa-da, birinchi qadam ko'proq e'tibor talab qiladi.

Ma'lumotlar bazasida barcha tez-tez uchraydigan elementlarni topish qiyin, chunki barcha mumkin bo'lgan ma'lumotlar to'plamlarini qidirishni o'z ichiga oladi (elementlarning kombinatsiyasi). Mumkin elementlar to'plami quvvat o'rnatilgan ustida va o'lchamga ega (yaroqsiz ma'lumotlar to'plami bo'lmagan bo'sh to'plam bundan mustasno). Quvvat to'plamining hajmi buyumlar soniga nisbatan keskin o'sib borishiga qaramay yilda yordamida samarali qidirish mumkin pastga yopilish xususiyati qo'llab-quvvatlash[2][12] (shuningdek, deyiladi monotonizmga qarshi[13]), bu tez-tez elementlar to'plami uchun uning barcha pastki to'plamlari ham tez-tez bo'lishini kafolatlaydi va shuning uchun kamdan-kam uchraydigan ma'lumotlar to'plami tez-tez ma'lumotlar to'plamining pastki qismi bo'lishi mumkin emas. Ushbu xususiyatdan foydalanish, samarali algoritmlar (masalan, Apriori[14] va Eclat[15]) barcha tez-tez topiladigan narsalarni topishi mumkin.

Tarix

Assotsiatsiya qoidalari tushunchasi, xususan, 1993 yilda Agrawal va boshqalarning maqolasi tufayli ommalashgan.[2] 2015 yil avgust holatiga ko'ra Google Scholar ma'lumotlariga ko'ra 18000 dan ortiq havolalarni qo'lga kiritdi va shu bilan Data Mining sohasidagi eng ko'p keltirilgan maqolalardan biridir. Biroq, endi "uyushma qoidalari" deb nomlangan narsa 1966 yilgi maqolada allaqachon kiritilgan[16] tomonidan ishlab chiqilgan GUHA bo'yicha umumiy ma'lumotlarni qazib olish usuli Petr Xajek va boshq.[17]

Barcha assotsiatsiya qoidalarini topish uchun (1989 yilga yaqin) minimal qo'llab-quvvatlash va ishonchdan foydalanish bu barcha qoidalarni topgan Xususiyatlarga asoslangan modellashtirish tizimidir. va foydalanuvchi tomonidan belgilangan cheklovlardan kattaroq.[18]

Statistik jihatdan ishonchli assotsiatsiyalar

Uyushmalarni kashf etish uchun standart yondashuvning bir cheklovi shundaki, ulangan assotsiatsiyalarning to'plamlarini izlash uchun mumkin bo'lgan birlashmalarning ko'p sonini izlash orqali ko'plab soxta uyushmalarni topish xavfi katta. Bu ma'lumotlar kutilmagan chastotasi bilan birgalikda yuzaga keladigan elementlarning to'plamlari, ammo buni faqat tasodifan amalga oshiradilar. Masalan, biz 10000 ta buyumlar to'plamini ko'rib chiqamiz va chap tomonda ikkita va o'ng tomonda 1 ta elementlardan iborat qoidalarni qidirmoqdamiz. Taxminan 1 000 000 000 000 ta bunday qoidalar mavjud. Agar biz mustaqillik uchun 0,05 ahamiyatga ega bo'lgan statistik testni qo'llasak, bu assotsiatsiya bo'lmasa, qoidani qabul qilishning 5% ehtimoli borligini anglatadi. Agar assotsiatsiyalar yo'q deb hisoblasak, shunga qaramay, biz 50,000,000,000 qoidalarini topishni kutishimiz kerak. Statistik jihatdan aniq birlashma kashfiyoti[19][20] ushbu xavfni boshqaradi, aksariyat hollarda topish xavfini kamaytiradi har qanday foydalanuvchi tomonidan belgilangan ahamiyatga ega bo'lgan darajadagi soxta birlashmalar.

Algoritmlar

Assotsiatsiya qoidalarini yaratish uchun ko'plab algoritmlar taklif qilingan.

Ba'zi taniqli algoritmlar Apriori, Eclat va FP-Growth, ammo ular ishning faqat yarmini bajaradilar, chunki ular tez-tez topiladigan elementlarni qazib olish algoritmidir. Ma'lumotlar bazasida tez-tez uchraydigan ma'lumotlar to'plamidan qoidalar yaratish uchun yana bir qadam qo'yish kerak.

Apriori algoritmi

Apriori[14] ma'lumotlar to'plamini qo'llab-quvvatlashni hisoblash uchun birinchi navbatda qidirish strategiyasidan foydalanadi va qo'llab-quvvatlashning yopilish xususiyatidan foydalanadigan nomzod yaratish funktsiyasidan foydalanadi.

Eclat algoritmi

Eklat[15] (alt. ECLAT, ekvivalentlik sinfining o'zgarishi degan ma'noni anglatadi) a birinchi chuqurlikdagi qidiruv o'rnatilgan kesishma asosida algoritm. Mahalliylikni oshiruvchi xususiyatlarga ega bo'lgan ketma-ket va parallel bajarish uchun javob beradi.[21][22]

FP-o'sish algoritmi

FP tez-tez naqshni anglatadi.[23]

Birinchi o'tishda algoritm tranzaktsiyalar ma'lumotlar bazasida elementlarning (atribut-qiymat juftliklari) paydo bo'lishini hisoblaydi va bu hisoblarni "sarlavha jadvali" da saqlaydi. Ikkinchi o'tishda u a-ga operatsiyalarni qo'shish orqali FP-daraxt tuzilishini yaratadi uchlik.

Daraxtni tezda qayta ishlashini ta'minlash uchun har bir operatsiyadagi elementlar ma'lumotlar to'plamidagi chastotalarining kamayish tartibiga ko'ra tartiblangan bo'lishi kerak, chunki har bir operatsiyadagi minimal qo'llab-quvvatlash talablariga javob bermaydigan narsalar bekor qilinadi. FP-daraxt daraxt ildiziga yaqin yuqori siqishni ta'minlaydi.

Asosiy ma'lumotlar to'plamining ushbu siqilgan versiyasini rekursiv ravishda qayta ishlash, nomzodlar elementlarini yaratish va ularni butun ma'lumotlar bazasida sinab ko'rish o'rniga (apriori algoritmida bo'lgani kabi) to'g'ridan-to'g'ri elementlar to'plamini ko'paytiradi.

O'sish sarlavha jadvalining pastki qismidan boshlanadi, ya'ni eng kichik qo'llab-quvvatlanadigan element, ushbu element bilan yakunlangan barcha operatsiyalarni topish orqali. Ushbu elementga qo'ng'iroq qiling .

Yangi shartli daraxt yaratiladi, u asl FP-daraxtga proektsiyalangan . Rejalashtirilgan daraxtdagi barcha tugunlarning tayanchlari har bir tugun bilan uning bolalari yig'indisi hisoblanganda qayta hisoblanadi. Minimal qo'llab-quvvatlashga mos kelmaydigan tugunlar (va shuning uchun pastki daraxtlar) kesiladi. Rekursiv o'sish hech qanday alohida element shartli bo'lmaganida tugaydi minimal qo'llab-quvvatlash chegarasini qondirish. Olingan yo'llar ildizdan tez-tez buyumlar bo'ladi. Ushbu bosqichdan so'ng, ishlov berish asl FP-daraxtining keyingi eng kam qo'llab-quvvatlanadigan sarlavha elementi bilan davom etadi.

Rekursiv jarayon tugagandan so'ng, barcha tez-tez elementlar to'plamlari topiladi va assotsiatsiya qoidalarini yaratish boshlanadi.[24]

Boshqalar

ASSOC

ASSOC protsedurasi[25] tez ishlatiladigan umumiy assotsiatsiya qoidalarini ishlab chiqaradigan GUHA usuli iplar operatsiyalar. Ushbu usul bilan ishlab chiqarilgan assotsiatsiya qoidalari apriori chiqarganga qaraganda ancha umumiydir, masalan, "buyumlar" birlashma va ajratish bilan ham bog'lanishi mumkin va qoidaning oldingi va oqibati o'rtasidagi bog'liqlik quyidagi kabi minimal qo'llab-quvvatlash va ishonchni belgilash bilan cheklanmaydi. apriori: qo'llab-quvvatlanadigan foiz o'lchovlarining o'zboshimchalik bilan kombinatsiyasidan foydalanish mumkin.

OPUS qidiruvi

OPUS - ko'pgina alternativalardan farqli o'laroq, monoton yoki minimal qo'llab-quvvatlash kabi monoton cheklovlarni talab qilmaydigan qoidalarni aniqlashning samarali algoritmi.[26] Dastlab aniq natijalar uchun qoidalarni topish uchun foydalanilgan[26][27] keyinchalik har qanday element bilan qoidalarni topish uchun kengaytirildi.[28] OPUS qidiruvi mashhur Magnum Opus assotsiatsiyasi kashfiyot tizimining asosiy texnologiyasidir.

Lore

Assotsiatsiya qoidalarini qazib olish to'g'risida mashhur hikoya "pivo va bezi" hikoyasidir. Supermarketlar xaridorlarining xatti-harakatlari bo'yicha o'tkazilgan so'rov natijalariga ko'ra, tagliklar sotib olgan xaridorlar (ehtimol yosh erkaklar) ham pivo sotib olishadi. Ushbu latifalar kundalik ma'lumotlardan kutilmagan assotsiatsiya qoidalarini topish mumkinligiga misol sifatida mashhur bo'ldi. Hikoyaning qanchalik haqiqat ekanligi to'g'risida turli xil fikrlar mavjud.[29] Daniel Pauers shunday deydi:[29]

1992 yilda Tomas Blishok, chakana savdo bo'yicha konsalting guruhining menejeri Teradata, va uning xodimlari 25 ga yaqin Osco Drug do'konlaridan 1,2 million bozor savati tahlilini tayyorladilar. Qarindoshlikni aniqlash uchun ma'lumotlar bazasi so'rovlari ishlab chiqildi. Tahlillar "soat 17:00 dan 19:00 gacha iste'molchilar pivo va tagliklar sotib olganligini aniqladilar". Osco menejerlari mahsulotlarni javonlarda bir-biriga yaqinlashtirib, pivo va taglik munosabatlaridan foydalana olmadilar.

Uyushma qoidalarini qazib olishning boshqa turlari

Ko'p munosabatlar assotsiatsiyasi qoidalari: Ko'p munosabatlar assotsiatsiyasi qoidalari (MRAR) - bu har bir element bir nechta munosabatlarga ega bo'lishi mumkin bo'lgan assotsiatsiya qoidalari. Ushbu munosabatlar sub'ektlar o'rtasidagi bilvosita munosabatlarni ko'rsatadi. Birinchi element uchta aloqadan iborat bo'lgan quyidagi MRARni ko'rib chiqing yashash, yaqin va nam: "O'sha kim yashash bo'lgan joy yaqin bilan shahar nam iqlim turi va yoshroq 20 dan -> ularning sog'liq holati yaxshi ”. Bunday assotsiatsiya qoidalari RDBMS ma'lumotlaridan yoki semantik veb-ma'lumotlardan olinishi mumkin.[30]

Qarama-qarshi to'plamni o'rganish assotsiativ ta'lim shaklidir. O'quvchilarning kontrasti pastki to'plamlar bo'yicha taqsimlanishida mazmunli farq qiladigan qoidalardan foydalaning.[31][32]

Sinflarni og'irlik bilan o'rganish bu ma'lumotni qazib olish natijalari bo'yicha iste'molchini tashvishga soladigan muayyan masalaga e'tiborni qaratish uchun sinflarga og'irlik berilishi mumkin bo'lgan assotsiativ ta'limning yana bir shakli.

Yuqori darajadagi naqshlarni topish murakkab real dunyo ma'lumotlariga xos bo'lgan yuqori tartibli (poletik) naqshlar yoki hodisalar assotsiatsiyasini olishni osonlashtirish.[33]

K-optimal naqshni kashf qilish har bir naqsh ma'lumotlarda tez-tez ko'rinishini talab qiladigan assotsiatsiya qoidalarini o'rganishga standart yondashuvga alternativa beradi.

Taxminan tez-tez mahsulot to'plami konchilik - bu tez-tez mahsulotlarni qazib olishning bo'shashtirilgan versiyasi, bu qatorlarning ayrim qismlarini 0 ga tenglashtirishga imkon beradi.[34]

Umumlashtirilgan assotsiatsiya qoidalari iyerarxik taksonomiya (tushuncha iyerarxiyasi)

Kantitativ assotsiatsiya qoidalari kategorik va miqdoriy ma'lumotlar

Intervalli ma'lumotlar assotsiatsiyasi qoidalari masalan. yoshni 5 yillik o'sishga bo'lish

Ketma-ket naqsh qazib olish minsupdan ko'proq uchun odatiy bo'lgan kashfiyotlarni kashf etadi[tushuntirish kerak ] ketma-ketlik ma'lumotlar bazasidagi ketma-ketliklar, bu erda minsup foydalanuvchi tomonidan o'rnatiladi. Ketma-ketlik - bu operatsiyalarning buyurtma qilingan ro'yxati.[35]

Subspace klastering, ma'lum bir turi Yuqori o'lchovli ma'lumotlarni klasterlash, ko'plab variantlarda, shuningdek, ma'lum klasterlash modellari uchun pastga yopilish xususiyatiga asoslangan.[36]

Warmr ACE ma'lumotlarini yig'ish to'plamining bir qismi sifatida yuboriladi. Bu birinchi tartibli munosabatlar qoidalari uchun assotsiatsiya qoidalarini o'rganishga imkon beradi.[37]

Shuningdek qarang

Adabiyotlar

  1. ^ Piatetskiy-Shapiro, Gregori (1991), Kuchli qoidalarni kashf qilish, tahlil qilish va taqdim etish, Piatetskiy-Shapiro shahrida, Gregori; va Frouli, Uilyam J.; eds., Ma'lumotlar bazalarida bilimlarni kashf etish, AAAI / MIT Press, Kembrij, MA.
  2. ^ a b v d e f Agrawal, R .; Imieliński, T .; Swami, A. (1993). "Katta ma'lumotlar bazalaridagi ma'lumotlar to'plamlari orasidagi tog'-kon assotsiatsiyasi qoidalari". Ma'lumotlarni boshqarish bo'yicha 1993 yilgi ACM SIGMOD xalqaro konferentsiyasi materiallari - SIGMOD '93. p. 207. CiteSeerX  10.1.1.40.6984. doi:10.1145/170035.170072. ISBN  978-0897915922. S2CID  490415.
  3. ^ Xolid, Sayfulloh (2018). "Apriori algoritmi". Muhandislikda amaliy hisoblash intellekti va yumshoq hisoblash. Misr: Hindawi Limited. 288-289 betlar. ISBN  9781522531296.
  4. ^ a b v Xassler, Maykl (2005). "Arulalar bilan tanishish - tog'-kon assotsiatsiyasi qoidalari va tez-tez mahsulot to'plamlari uchun hisoblash muhiti" (PDF). Statistik dasturiy ta'minot jurnali. doi:10.18637 / jss.v014.i15.
  5. ^ a b Maykl Xaxler (2015). Uyushma qoidalari uchun tez-tez ishlatiladigan qiziqish choralarini ehtimoliy taqqoslash. http://michael.hahsler.net/research/association_rules/measures.html
  6. ^ Xipp, J .; Gyuntser U .; Nakhaeizadeh, G. (2000). "Assotsiatsiya qoidalarini qazib olish algoritmlari --- umumiy so'rov va taqqoslash". ACM SIGKDD Explorations yangiliklari. 2: 58–64. CiteSeerX  10.1.1.38.5305. doi:10.1145/360402.360421. S2CID  9248096.
  7. ^ Brin, Sergey; Motvani, Rajeev; Ullman, Jeffri D.; Tsur, Shalom (1997). "Bozor savati ma'lumotlari uchun dinamik ma'lumotlar to'plamini hisoblash va implikatsiya qoidalari". Ma'lumotlarni boshqarish bo'yicha 1997 yilgi ACM SIGMOD xalqaro konferentsiyasi materiallari - SIGMOD '97. 255-264 betlar. CiteSeerX  10.1.1.41.6476. doi:10.1145/253260.253325. ISBN  978-0897919111. S2CID  15385590.
  8. ^ Omiecinski, ER (2003). "Ma'lumotlar bazalarida tog'-kon birlashmalari uchun foizlarning muqobil choralari". IEEE bilimlari va ma'lumotlar muhandisligi bo'yicha operatsiyalar. 15: 57–69. CiteSeerX  10.1.1.329.5344. doi:10.1109 / TKDE.2003.1161582.
  9. ^ Aggarval, Charu S.; Yu, Filipp S. (1998). "Elementlar to'plamini yaratish uchun yangi asos". Ma'lumotlar bazalari tizimlari asoslari bo'yicha o'n ettinchi ACM SIGACT-SIGMOD-SIGART simpoziumi materiallari - PODS '98. 18-24 betlar. CiteSeerX  10.1.1.24.714. doi:10.1145/275487.275490. ISBN  978-0897919968. S2CID  11934586.
  10. ^ Piatetskiy-Shapiro, Gregori; Kuchli qoidalarni kashf qilish, tahlil qilish va taqdim etish, Ma'lumotlar bazalarida bilimlarni kashf etish, 1991, 229-248 betlar
  11. ^ Tan, Pang-Ning; Kumar, Vipin; Srivastava, Jayp (2004). "Uyushma tahlili uchun to'g'ri ob'ektiv o'lchovni tanlash". Axborot tizimlari. 29 (4): 293–313. CiteSeerX  10.1.1.331.4740. doi:10.1016 / S0306-4379 (03) 00072-3.
  12. ^ Tan, Pang-Ning; Maykl, Shtaynbax; Kumar, Vipin (2005). "6-bob. Assotsiatsiyani tahlil qilish: asosiy tushuncha va algoritmlar" (PDF). Ma'lumotlarni qazib olishga kirish. Addison-Uesli. ISBN  978-0-321-32136-7.
  13. ^ Dzyan Pei; Jiavey Xan; Lakshmanan, L.V.S. (2001). "Konvertatsiya qilinadigan cheklovlar bilan tez-tez ishlatiladigan buyumlarni qazib olish". Ma'lumotlar muhandisligi bo'yicha 17-xalqaro konferentsiya materiallari. 433-442 betlar. CiteSeerX  10.1.1.205.2150. doi:10.1109 / ICDE.2001.914856. ISBN  978-0-7695-1001-9. S2CID  1080975.
  14. ^ a b Agrawal, Rakesh; Srikant, Ramakrishnan; Katta ma'lumotlar bazalarida kon assotsiatsiyasi qoidalarining tezkor algoritmlari Arxivlandi 2015-02-25 da Orqaga qaytish mashinasi, Bokada, Xorxe B.; Jarke, Matias; va Zaniolo, Karlo; muharrirlar, Juda katta ma'lumotlar bazalari bo'yicha 20-xalqaro konferentsiya (VLDB) materiallari, Santyago, Chili, 1994 yil sentyabr., 487-499 betlar
  15. ^ a b Zaki, M. J. (2000). "Assotsiatsiyani qazib olishning kengaytirilgan algoritmlari". IEEE bilimlari va ma'lumotlar muhandisligi bo'yicha operatsiyalar. 12 (3): 372–390. CiteSeerX  10.1.1.79.9448. doi:10.1109/69.846291.
  16. ^ Xajek, P .; Havel, I .; Chitil, M. (1966). "Avtomatik farazlarni aniqlashning GUHA usuli". Hisoblash. 1 (4): 293–308. doi:10.1007 / BF02345483. S2CID  10511114.
  17. ^ Xajek, Petr; Rauch, Jan; Kufal, Devid; Feglar, Tomash (2004). "GUHA usuli, ma'lumotlarni qayta ishlash va qazib olish". Ma'lumotlarni qazib olish dasturlari uchun ma'lumotlar bazasini qo'llab-quvvatlash. Kompyuter fanidan ma'ruza matnlari. 2682. 135-153 betlar. doi:10.1007/978-3-540-44497-8_7. ISBN  978-3-540-22479-2.
  18. ^ Uebb, Jefri (1989). "Talabalarni modellashtirishga avtomatlashtirilgan yondashuv". Sun'iy intellekt bo'yicha uchinchi Avstraliya qo'shma konferentsiyasining materiallari (AI 89): 195–205.
  19. ^ Veb, Geoffrey I. (2007). "Muhim naqshlarni kashf etish". Mashinada o'rganish. 68: 1–33. doi:10.1007 / s10994-007-5006-x.
  20. ^ Gionis, Aristid; Mannila, Xeyki; Miyelikaynen, Taneli; Tsaparas, Panayiotis (2007). "Ma'lumotlarni qazib olish natijalarini almashtirish randomizatsiyasi yordamida baholash". Ma'lumotlardan ma'lumotni kashf qilish bo'yicha ACM operatsiyalari. 1 (3): 14 yosh. CiteSeerX  10.1.1.141.2607. doi:10.1145/1297332.1297338. S2CID  52305658.
  21. ^ Zaki, Muhammad Javid; Parfasaratiya, Srinivasan; Ogixara, Mitsunori; Li, Vey (1997). "Uyushma qoidalarini tezkor kashf etishning yangi algoritmlari": 283–286. CiteSeerX  10.1.1.42.3283. hdl:1802/501. Iqtibos jurnali talab qiladi | jurnal = (Yordam bering)
  22. ^ Zaki, Muhammad J.; Parfasaratiya, Srinivasan; Ogixara, Mitsunori; Li, Vey (1997). "Uyushma qoidalarini kashf qilishning parallel algoritmlari". Ma'lumotlarni qazib olish va bilimlarni kashf etish. 1 (4): 343–373. doi:10.1023 / A: 1009773317876. S2CID  10038675.
  23. ^ Xan (2000). "Nomzod avlodsiz konchilikning tez-tez naqshlari". Ma'lumotlarni boshqarish bo'yicha 2000 ACM SIGMOD xalqaro konferentsiyasi materiallari - SIGMOD '00. Ma'lumotlarni boshqarish bo'yicha 2000 yil ACM SIGMOD xalqaro konferentsiyasi materiallari. SIGMOD '00. 1-12 betlar. CiteSeerX  10.1.1.40.4436. doi:10.1145/342009.335372. ISBN  978-1581132175. S2CID  6059661.
  24. ^ Witten, Frank, Xoll: Ma'lumotlarni qazib olishda amaliy mashina o'rganish vositalari va texnikasi, 3-nashr[sahifa kerak ]
  25. ^ Xajek, Petr; Xavranek, Tomash (1978). Gipotezani shakllantirishni mexanizatsiyalash: Umumiy nazariya uchun matematik asoslar. Springer-Verlag. ISBN  978-3-540-08738-0.
  26. ^ a b Uebb, Jeoffri I. (1995); OPUS: tartibsiz qidirish uchun samarali qabul qilinadigan algoritm, Sun'iy intellekt tadqiqotlari jurnali 3, Menlo Park, CA: AAAI Press, 431-465 betlar. onlayn kirish
  27. ^ Bayardo, Roberto J., kichik; Agrawal, Rakesh; Gunopulos, Dimitrios (2000). "Katta, zich ma'lumotlar bazalarida cheklovlarga asoslangan qoidalarni qazib olish". Ma'lumotlarni qazib olish va bilimlarni kashf etish. 4 (2): 217–240. doi:10.1023 / A: 1009895914772. S2CID  5120441.
  28. ^ Veb, Geoffrey I. (2000). "Uyushma qoidalarini samarali qidirish". Bilimlarni topish va ma'lumotlarni qazib olish bo'yicha ACM SIGKDD oltinchi xalqaro konferentsiyasi materiallari - KDD '00. 99-107 betlar. CiteSeerX  10.1.1.33.1309. doi:10.1145/347090.347112. ISBN  978-1581132335. S2CID  5444097.
  29. ^ a b "DSS yangiliklari: 3-jild, № 23".
  30. ^ Ramezani, Rizo, Mohamad Sunniee va Muhammad Ali Ne'matbaxsh; MRAR: Konchilikning ko'p munosabatlar assotsiatsiyasi qoidalari, Hisoblash va xavfsizlik jurnali, 1, yo'q. 2 (2014)
  31. ^ GI Uebb va S. Butler va D. Newlands (2003). Guruhlar o'rtasidagi farqlarni aniqlash to'g'risida. KDD'03 To'qqizinchi ACM SIGKDD Xalqaro Konferentsiyasi Ma'lumotlarni Kashf etish va Ma'lumotlarni qazib olish bo'yicha konferentsiyasi.
  32. ^ Menzies, T .; Ying Xu (2003). "Hisoblash amaliyoti - juda band odamlar uchun ma'lumotlar qazib olish". Kompyuter. 36 (11): 22–29. doi:10.1109 / MC.2003.1244531.
  33. ^ Vong, AK; Yang Vang (1997). "Diskret qiymatli ma'lumotlardan yuqori tartibli naqshni kashf etish". IEEE bilimlari va ma'lumotlar muhandisligi bo'yicha operatsiyalar. 9 (6): 877–893. CiteSeerX  10.1.1.189.1704. doi:10.1109/69.649314.
  34. ^ Liu, Tszinze; Polsen, Syuzan; Quyosh, Xing; Vang, Vey; Nobel, Endryu; Prins, yanvar (2006). "Shovqin mavjud bo'lgan davrda konlarni taxminiy tez-tez yig'ish: algoritm va tahlil". Ma'lumotlarni qazib olish bo'yicha 2006 yilgi SIAM Xalqaro konferentsiyasi materiallari. 407-418 betlar. CiteSeerX  10.1.1.215.3599. doi:10.1137/1.9781611972764.36. ISBN  978-0-89871-611-5.
  35. ^ Zaki, Muhammad J. (2001); SPADE: Konchilikning tez-tez ketma-ketligi uchun samarali algoritm, Machine Learning Journal, 42, 31-60 betlar
  36. ^ Zimek, Artur; Assent, Ira; Vriken, Jilles (2014). Tez-tez naqshlarni qazib olish. 403-423 betlar. doi:10.1007/978-3-319-07821-2_16. ISBN  978-3-319-07820-5.
  37. ^ King, R.D .; Srinivasan, A .; Dehaspe, L. (2001 yil fevral). "Warmr: kimyoviy ma'lumotlar uchun ma'lumotlarni yig'ish vositasi". J hisoblash texnikasi bilan ta'minlangan mol. 15 (2): 173–81. Bibcode:2001 yil JCAMD..15..173K. doi:10.1023 / A: 1008171016861. PMID  11272703. S2CID  3055046.

Bibliografiyalar