Juda katta ma'lumotlar bazasi - Very large database

A juda katta ma'lumotlar bazasi, (dastlab yozilgan juda katta ma'lumotlar bazasi) yoki VLDB,[1] juda katta hajmdagi ma'lumotlarni o'z ichiga olgan ma'lumotlar bazasi bo'lib, u uchun maxsus arxitektura, boshqarish, qayta ishlash va texnik xizmat ko'rsatish metodologiyalari talab qilinishi mumkin.[2][3][4][5]

Ta'rif

Ning noaniq sifatlari juda va katta keng va sub'ektiv talqin qilishga imkon beradi, ammo o'lchov va chegarani aniqlashga urinishlar qilingan. Dastlabki ko'rsatkichlar ma'lumotlar bazasining hajmi a kanonik shakl orqali ma'lumotlar bazasini normalizatsiya qilish yoki a kabi to'liq ma'lumotlar bazasi ishlashi uchun vaqt zaxira nusxasi. Texnologiyalarni takomillashtirish doimo ko'rib chiqilayotgan narsani o'zgartirib turdi juda katta.[6][7]

Bir ta'rifga ko'ra, ma'lumotlar bazasi "imkoniyatlar oynasida saqlanib bo'lmaydigan darajada katta bo'lganida ... ma'lumotlar bazasi tinch bo'lgan vaqt" VLDBga aylangan.[8]

VLDB ma'lumotlar bazasining o'lchamlari

Keltirilgan ma'lumotlarning mutlaq miqdori yo'q. Masalan, bitta qila olmaydi 1 TB dan ortiq ma'lumotlarga ega bo'lgan har qanday ma'lumotlar bazasi VLDB deb hisoblanadi. Ma'lumotlarning ushbu mutlaq miqdori vaqt o'tishi bilan o'zgarib turdi, chunki kompyuterni qayta ishlash, saqlash va zaxiralash usullari katta hajmdagi ma'lumotlarni boshqarish imkoniyatiga ega bo'ldi.[5] Ya'ni, VLDB muammolari 1 silga yaqinlashganda paydo bo'lishi mumkin,[8][9] va 30 TB dan oshganligi sababli paydo bo'lishi ehtimoli ko'proq.[10]

VLDB muammolari

VLDB muammolarga duch kelishi mumkin bo'lgan asosiy sohalarga konfiguratsiya, saqlash, ishlash, texnik xizmat ko'rsatish, boshqarish, mavjudlik va server manbalari kiradi.[11]:11

Konfiguratsiya

VLDB ma'lumotlar bazalari tomonidan ko'tarilgan muammolarni yumshatish yoki kamaytirish uchun VLDB sohasida joylashgan ma'lumotlar bazalarini ehtiyotkorlik bilan sozlash zarur.[11]:36–53[12]

Ma'muriyat

VLDB-ni boshqarishning murakkabligi, uchun keskin o'sib borishi mumkin ma'lumotlar bazasi ma'muri ma'lumotlar bazasi hajmi oshgani sayin.[13]

Mavjudligi va texnik xizmat ko'rsatishi

Ma'lumotlar bazasini qayta tashkil etish va qayta tiklash bilan bog'liq VLDB operatsiyalari bilan shug'ullanayotganda, ma'lumotlar bazasini qayta tashkil etish va VLDB bo'lmaganlarga nisbatan amaliy bo'lgan fayl nusxalari VLDB ma'lumotlar bazasi uchun juda muhim vaqt va resurslarni oladi.[14] Xususan, odatda odatdagidek uchrashish mumkin emas tiklanish vaqtining maqsadi (RTO), diskdan yoki boshqa saqlash arxivlaridan fayllarni nusxalashni o'z ichiga olgan usullar bilan ma'lumotlar bazasining uzilishi sababli mavjud bo'lmasligi kutilayotgan maksimal vaqt.[13] Ushbu muammolarni bartaraf etish uchun klasterlash, klonlash / takrorlash / kutish bazalari, fayllarning suratlari, saqlash rasmlari yoki zaxira menejeri kabi usullar RTO va mavjud bo'lishiga yordam berishi mumkin, ammo ayrim usullar cheklovlar, ogohlantirishlar, litsenziya va infratuzilma talablariga ega bo'lishi mumkin. ma'lumotlar yo'qotilishiga olib kelishi mumkin va tiklash nuqtasi maqsadiga (RPO) to'g'ri kelmaydi.[15][16][13][17][18] Ko'pgina tizimlar uchun faqat geografik jihatdan masofaviy echimlar qabul qilinishi mumkin.[19]

Zaxiralash va tiklash

Eng yaxshi amaliyot - bu zaxira nusxasini yaratish va qayta tiklash umumiy mavjudlik va biznesning uzluksiz echimi nuqtai nazaridan arxitektura qilinadi.[20][21]

Ishlash

Xuddi shu infratuzilmani hisobga olgan holda odatda ishlashning pasayishi bo'lishi mumkin, ya'ni o'sish javob vaqti ma'lumotlar bazasi hajmi oshgani sayin. Ba'zi kirishlarda ishlov berish (ko'rish) uchun ko'proq ma'lumotlar bo'ladi, bu mutanosib ravishda uzoqroq davom etadi (chiziqli vaqt ); ma'lumotlarga kirish uchun ishlatiladigan indekslar bir oz balandlikda o'sishi mumkin, ma'lumotlarga erishish uchun qo'shimcha saqlash imkoniyatini talab qiladi (pastki chiziqli vaqt ).[22] Boshqa effektlar ham bo'lishi mumkin keshlash unchalik samarasiz bo'lib qolmoqda, chunki mutanosib ravishda kamroq ma'lumotlarni keshlash mumkin, ba'zilari esa indekslar shunday B + boshqalar kabi o'sish bilan avtomatik ravishda yaxshi ta'minlang xash jadvali qayta tiklanishi kerak bo'lishi mumkin.

Ma'lumotlar bazasi hajmining oshishi ma'lumotlar bazasiga kiruvchilar sonining ko'payishiga olib keladigan bo'lsa, ko'proq server va tarmoq resurslari iste'mol qilinishi mumkin, va bahs ko'payadi. Ishlashni tiklash uchun ba'zi echimlar o'z ichiga oladi bo'lish, klasterlash, ehtimol bilan parchalanish, yoki a dan foydalanish ma'lumotlar bazasi mashinasi.[23]:390[24]

Bo'linish

Partitioning VLDB-da ommaviy operatsiyalarni bajarishda yordam berishi mumkin, shu jumladan zaxiralash va tiklash.[25] tufayli ommaviy harakatlar axborotni hayot aylanishini boshqarish (ILM),[26]:3[27]:105–118 nizolarni kamaytirish[27]:327–329 shuningdek, ba'zi bir so'rovlarni qayta ishlashni optimallashtirishga imkon berish.[27]:215–230

Saqlash

VLDB ehtiyojlarini qondirish uchun ma'lumotlar bazasi saqlash kirish imkoniyati past bo'lishi kerak kechikish va bahs, baland ishlab chiqarish va yuqori darajadagi mavjudlik.

Server manbalari

VLDB ning kattalashib borishi server va tarmoq resurslariga bosim o'tkazishi va infratuzilma sarmoyasini talab qilishi mumkin bo'lgan to'siq paydo bo'lishi mumkin.[13][28]

Katta ma'lumotlarga aloqadorlik

VLDB bir xil emas katta ma'lumotlar, ammo saqlash tomoni katta ma'lumotlar VLDB ma'lumotlar bazasini o'z ichiga olishi mumkin.[2] Bu ba'zi bir saqlash echimlarini qo'llab-quvvatladi katta ma'lumotlar katta hajmdagi ma'lumotlarni qo'llab-quvvatlash uchun boshidan boshlab ishlab chiqilgan, shuning uchun ma'lumotlar bazasi ma'murlari an'anaviy versiyalarning VLDB muammolariga duch kelmasligi mumkin RDBMS duch kelishi mumkin.[29]

Shuningdek qarang

Adabiyotlar

  1. ^ "Oracle Database Online Documentation 11g Release 1 (11.1) / Ma'lumotlar bazasini boshqarish uchun ma'lumotlar bazasi tushunchalari". oracle. 18 juda katta ma'lumotlar bazalari (VLDB). Olingan 3 oktyabr 2018.
  2. ^ a b "Juda katta ma'lumotlar bazasi (VLDB)". Technopedia. Arxivlandi asl nusxasidan 2018 yil 4-iyul kuni. Olingan 3 oktyabr 2018.
  3. ^ Geyns, R. S. va R. Gammill. Juda katta ma'lumotlar bazalari: Rivojlanayotgan tadqiqot sohasi, norasmiy ish qog'ozi, RAND korporatsiyasi
  4. ^ Ma'lumotlarni qayta ishlash jurnali. Shimoliy Amerika nashriyot kompaniyasi. 1964. p. 18,58.
  5. ^ a b Vidleyk, Marin (2009 yil 18 sentyabr). "VLDB nima?". mwidlake. Arxivlandi asl nusxasidan 2018 yil 6 oktyabrda. Olingan 7 oktyabr 2018.
  6. ^ Sidli, Edgar H. (1980 yil 1 aprel). Kompyuter fanlari va texnologiyalar entsiklopediyasi: 14-jild - nolinchi xotiraga va ma'lumotlar bazasiga juda katta ma'lumotlar bazasi tizimlari. CRC Press. 1-18 betlar. ISBN  9780824722142.
  7. ^ Gerritsen, Rob; Morgan, Xovard; Zisman, Maykl (1977 yil iyun). "Ma'lumotlar bazalari uchun ba'zi ko'rsatkichlar bo'yicha yoki juda katta ma'lumotlar bazasi nima?". ACM SIGMOD yozuvi. 9 (1): 50–74. doi:10.1145/984382.984393. ISSN  0163-5808. S2CID  6359244.
  8. ^ a b Rankins, Rey; Jensen, Pol; Bertuchchi, Pol (2002 yil 18-dekabr). "21". Microsoft SQL Server 2000 (2-nashr). SAMS. ISBN  978-0672324673. Juda katta SQL Server ma'lumotlar bazalarini boshqarish.
  9. ^ "Oracle Database Release 18 - VLDB va bo'linish bo'yicha qo'llanma". Oracle. 1 Juda katta ma'lumotlar bazalariga kirish. Arxivlandi asl nusxasidan 2018 yil 3 oktyabrda. Olingan 3 oktyabr 2018.
  10. ^ "Ma'lumotlar bazasining juda katta muammosi - 30-100 TB ma'lumotlar bazasini qanday zaxiralash va tiklash" (PDF). aktifio. Arxivlandi (PDF) asl nusxasidan 2018 yil 19 fevralda.
  11. ^ a b Hussain, Syed Jaffer (2014). "Juda katta ma'lumotlar bazalarida (VLDB) eng yaxshi amaliyotlarni sozlash va qo'llash" (PDF). Sangam: AIOUG. Arxivlandi (PDF) asl nusxasidan 2018 yil 4 oktyabrda.
  12. ^ Chaves, Warner (2015 yil 7-yanvar). "SQL Server juda katta ma'lumotlar bazasi uchun bajarilishi kerak bo'lgan eng yaxshi 10 narsa". SQLTURBO. Arxivlandi asl nusxasidan 2017 yil 13 dekabrda. Olingan 5 oktyabr 2018.
  13. ^ a b v d Furman, Dimitri (22 yanvar 2018). Rajesh Setlem; Mayk Vayner; Xiaochen Wu (tahr.). "Azure-da SQL Server VLDB: DBA vazifalari sodda". MSDN. Arxivlandi asl nusxasidan 2018 yil 6 oktyabrda. Olingan 6 oktyabr 2018.
  14. ^ "Ma'lumotlarning relyatsion omborlari serverlariga ixtisoslashtirilgan talablar". Red Brick Systems, Inc. 21 iyun 1996. Arxivlangan asl nusxasi 1997 yil 10 oktyabrda.
  15. ^ "Klaster dizayni bo'yicha fikrlar". Crouchbase. Arxivlandi asl nusxasidan 2018 yil 17 oktyabrda. Olingan 17 oktyabr 2017.
  16. ^ "O'zaro faoliyat ma'lumotlar markazining replikatsiyasi (XDCR)". Crouchbase. Arxivlandi asl nusxasidan 2018 yil 17 oktyabrda. Olingan 17 oktyabr 2017.
  17. ^ Chien, Tim. "Suratlar zaxira nusxalari emas". Oracle texnika vositalari. Arxivlandi asl nusxasidan 2018 yil 7 sentyabrda. Olingan 10 oktyabr 2018.
  18. ^ "Split oynadan zaxira rasm sifatida foydalanish". IBM bilim markazi. Arxivlandi asl nusxasidan 2018 yil 9 yanvarda. Olingan 10 oktyabr 2018.
  19. ^ "1-bob yuqori darajadagi mavjudlik va miqyosi". dev.mysql. Arxivlandi asl nusxasidan 2016 yil 15 dekabrda. Olingan 12 oktyabr 2018.
  20. ^ Bruks, Sharlotta; Leung, Klem; Mirzo, Aslam; Nil, Kertis; Tsyu, Yin Ley; Qo'shiq ayt, Jon; Vong, Frensis TH; Rayt, Yan R (2007 yil mart). "1-bob. Biznes echimlarining uchta segmenti aniqlandi". IBM System Storage Business Continuity: 2-qism echimlari bo'yicha qo'llanma. IBM Redbooks. ISBN  978-0738489728.
  21. ^ Axtar, Ali Navid; Buxolts, Jef; Rayan, Maykl; Setti, Kumar (2012). "Ma'lumotlar bazasini zaxiralash va tiklashning eng yaxshi usullari". Arxivlandi asl nusxasidan 2018 yil 29 iyunda. Olingan 12 oktyabr 2012.
  22. ^ Tariq, Ovais (2011 yil 14-iyul). "B + daraxtlari indekslari va ularning ishlash ko'rsatkichlariga ta'siri". ovaistariq.net. Arxivlandi asl nusxasidan 2018 yil 7 fevralda. Olingan 10 oktyabr 2018.
  23. ^ Shrestha, Raju (2017). Bulutda ma'lumotlar bazasining yuqori mavjudligi va ishlashi - zamonaviy klasterga asoslangan echimlarga nisbatan xo'jayin-qulning an'anaviy replikatsiyasi.. Bulutli hisoblash va xizmatlar bo'yicha 7-xalqaro konferentsiya. 1: YAQIN. SCITEPRESS - Fan va texnika nashrlari, Lda. doi:10.5220/0006294604130420. ISBN  978-989-758-243-1. Arxivlandi asl nusxasidan 2018 yil 17 oktyabrda.
  24. ^ "Entsiklopediya". Ta'rifi: ma'lumotlar bazasi mashinasi. Arxivlandi asl nusxasidan 2016 yil 4 iyulda. Olingan 10 oktyabr 2018.
  25. ^ Burleson, Donald (2015 yil 26 mart). "Oracle Backup VLDB bo'yicha maslahatlar". Burleson konsalting kompaniyasi. Arxivlandi asl nusxasidan 2017 yil 30 iyunda. Olingan 11 oktyabr 2016.
  26. ^ "Oracle ma'lumotlar bazasidagi Oracle Partitioning 12c Release 2 Har bir tizim uchun ma'lumotlarning ekstremal boshqaruvi va ishlashi" (PDF). Oracle. 2017 yil mart. Arxivlandi (PDF) asl nusxasidan 2017 yil 15 dekabrda. Olingan 17 oktyabr 2018.
  27. ^ a b v Teske, Tomas (2018 yil 8-fevral). Oracle Partitioning-dan yaxshiroq foydalaning - amaliy qo'llanma va ma'lumotnoma (PDF) (Nutq). Cern. Herman Bar. 40-S2-C01 - Salle Kyuri (CERN): Oracle. Arxivlandi (PDF) asl nusxasidan 2018 yil 12 oktyabrda. Olingan 12 oktyabr 2018.CS1 tarmog'i: joylashuvi (havola)
  28. ^ Po'lat, Fil; Poggemeyer, Liza; Plett, Kori (2018 yil 1-avgust). "Server uskunasining ishlash ko'rsatkichlari". Microsoft IT Pro Center. Arxivlandi asl nusxasidan 2018 yil 17 oktyabrda. Olingan 17 oktyabr 2018.
  29. ^ Li, Yishan; Manoharan, Satiamorti (2013). SQL va NoSQL ma'lumotlar bazalarining ishlash ko'rsatkichlarini taqqoslash. 2013 yil IEEE Tinch okeani bo'yidagi aloqa, kompyuterlar va signallarni qayta ishlash bo'yicha konferentsiya (PACRIM). IEEE. p. 15. doi:10.1109 / PACRIM.2013.6625441. ISBN  978-1-4799-1501-9.