ClickHouse - ClickHouse

Klikhouse
Clickhouse.png
Tuzuvchi (lar)Yandeks
Dastlabki chiqarilish2016 yil 15-iyun; 4 yil oldin (2016-06-15)
Barqaror chiqish
v20.11.3.3-barqaror / 2020 yil 13-noyabr; 10 kun oldin (2020-11-13)[1]
Ko'rib chiqish versiyasi
v20.7.1.4310 / 2020 yil 8-avgust; 3 oy oldin (2020-08-08)[2]
Omborgithub.com/ ClickHouse/ ClickHouse/
YozilganC ++
Operatsion tizimLinux, FreeBSD, macOS
LitsenziyaApache litsenziyasi 2.0
Veb-saytklikxona.tech

ClickHouse ochiq manba hisoblanadi ustunli yo'naltirilgan ma'lumotlar bazasi (ma'lumotlar bazasini ustunli boshqarish tizimi) uchun onlayn analitik ishlov berish (OLAP).

ClickHouse Rossiyaning IT-kompaniyasi tomonidan ishlab chiqilgan Yandeks uchun Yandex.Metrica veb-tahlil xizmati.[3][4][5][6] ClickHouse real vaqtda yangilanadigan ma'lumotlarni tahlil qilishga imkon beradi. Tizim yuqori ishlash uchun sotiladi.[7]

Loyiha sifatida chiqarilgan ochiq manbali dasturiy ta'minot ostida Apache 2 litsenziyasi 2016 yil iyun oyida.[8]

ClickHouse Yandex.Tank yukini sinash vositasi tomonidan ishlatiladi.[8] Yandex.Market ClickHouse-dan saytga kirish va KPI-ni nazorat qilish uchun foydalanadi.[9] ClickHouse ham amalga oshirildi CERN ning LHCb tajribasi[10] saqlash va qayta ishlash metadata har bir tadbir uchun 1000 dan ortiq atributlarga ega 10 milliard tadbirlarda va Tinkoff Bank loyiha uchun ma'lumotlar do'koni sifatida ClickHouse-dan foydalanadi.[11]

Tarix

Yandex.Metrica ilgari xom ma'lumotlar yig'ma shaklda saqlanganda klassik yondashuvni qo'llagan.[12] Ushbu yondashuv saqlangan ma'lumotlar miqdorini kamaytirishga yordam beradi. Biroq, uning bir nechta cheklovlari va kamchiliklari mavjud:

  • Mavjud hisobotlarning ro'yxati oldindan belgilanishi kerak va maxsus hisobot tuzishning imkoni yo'q.
  • Ma'lumotlar hajmi yig'ilgandan keyin ko'payishi mumkin. Bu ma'lumotlar ko'p sonli tugmachalar bilan birlashtirilganda yoki yuqori tugmachalardan foydalanilganda sodir bo'ladi kardinallik (kabi URL manzillari ).
  • Turli xil birlashmalarga ega hisobotlar atrofida mantiqiy izchillikni qo'llab-quvvatlash qiyin.

Turli xil yondashuv - yig'ilmagan ma'lumotlarni saqlash. Xom ma'lumotlarga ishlov berish yuqori samarali tizimni talab qiladi, chunki barcha hisob-kitoblar real vaqtda amalga oshiriladi. Ushbu muammoni hal qilish uchun ustunga yo'naltirilgan Ma'lumotlar bazasi butun miqyosdagi analitik ma'lumotlarga ega bo'lishi kerak Internet. Yandex o'zining ishlab chiqilishini boshladi. Birinchi ClickHouse prototipi 2009 yilda paydo bo'lgan. 2014 yil oxiriga kelib Yandex.Metrica 2.0 versiyasi chiqarildi. Yangi versiya maxsus hisobotlarni yaratish uchun interfeysga ega va ma'lumotlarni saqlash va qayta ishlash uchun ClickHouse-dan foydalanadi.

Xususiyatlari

ClickHouse DBMS-ning asosiy xususiyatlari:[13]

  • Haqiqiy ustunga yo'naltirilgan Ma'lumotlar bazasi. Qadriyatlar bilan hech narsa saqlanmaydi. Masalan, doimiy uzunlik qiymatlari qiymatlar yonida ularning uzunligini "raqamini" saqlamaslik uchun qo'llab-quvvatlanadi.
  • Lineer miqyosi. Serverlarni qo'shish orqali klasterni kengaytirish mumkin.
  • Xatolarga bardoshlik. Tizim shards klasteridir, bu erda har bir shard nusxalar guruhidir. ClickHouse asenkron multimaster replikatsiyasidan foydalanadi. Ma'lumotlar mavjud bo'lgan barcha nusxalarga yoziladi, so'ng qolgan barcha nusxalarga tarqatiladi. ZooKeeper jarayonlarni muvofiqlashtirish uchun ishlatiladi, ammo u so'rovlarni qayta ishlash va bajarishda ishtirok etmaydi.
  • Petabaytli ma'lumotlarni saqlash va qayta ishlash imkoniyati.
  • SQL qo'llab-quvvatlash. ClickHouse kengaytirilgan qo'llab-quvvatlaydi SQL - massivlarni va ichki tuzilgan ma'lumotlarni o'z ichiga olgan til kabi, taxminiy va URI funktsiyalar va tashqi kalit-qiymat do'konini ulash imkoniyati.
  • Yuqori ishlash.[14]
    • Vektorli hisob-kitoblardan foydalaniladi. Ma'lumotlar nafaqat ustunlar tomonidan saqlanadi, balki vektorlar (ustunlar qismlari) tomonidan qayta ishlanadi. Ushbu yondashuv yuqori natijalarga erishishga imkon beradi Markaziy protsessor ishlash.
    • Namuna olish va taxminiy hisob-kitoblar qo'llab-quvvatlanadi.
    • Parallel va tarqatilgan so'rovlarni qayta ishlash mavjud (shu jumladan QO'ShILISH ).
  • Ma'lumotlarni siqish.
  • Qattiq disk drayveri (HDD) optimallashtirish. Tizim mos bo'lmagan ma'lumotlarni qayta ishlashi mumkin tezkor kirish xotirasi (RAM).
  • Mijozlar uchun ma'lumotlar bazasi (JB) ulanish. Ma'lumotlar bazasiga ulanish parametrlariga konsol mijozi, HTTP API, yoki ulardan biri o'rash (o'rash uchun mavjud Python, PHP,[15] NodeJS,[16] Perl,[17] Yoqut[18] va R[19]). A JDBC drayveri ClickHouse uchun ham mavjud.[20]
  • Batafsil hujjatlar.

Cheklovlar

ClickHouse-ning kamchiliklari deb hisoblanishi mumkin bo'lgan ba'zi xususiyatlari mavjud:

  • Hech qanday yordam yo'q bitimlar.
  • Birlashmalarni bajarishda sukut bo'yicha so'rovning oraliq holatlari Ram bitta serverda. Ammo ClickHouse-ni bunday holatda diskka to'kiladigan qilib sozlash mumkin.
  • To'liq UPDATE / DELETE dasturining etishmasligi.

Ishlardan foydalaning

ClickHouse uchun yaratilgan OLAP so'rovlar.[13]

  • Ko'p sonli ustunlarni o'z ichiga olgan oz sonli jadvallar bilan ishlaydi.
  • So'rovlarda juda ko'p qatorlardan foydalanish mumkin JB, lekin faqat kichik ustunlar to'plami.
  • So'rovlar nisbatan kam uchraydi (odatda har bir server uchun 100 RPS atrofida).
  • Oddiy so'rovlar uchun taxminan 50 milodiy kechikishga ruxsat beriladi.
  • Ustun qiymatlari juda kichik, odatda raqamlar va qisqa qatorlardan iborat (masalan, 60) bayt per URL manzili ).
  • Bitta so'rovni qayta ishlashda yuqori samaradorlik talab qilinadi (har bir serverda soniyada milliardlab qatorgacha).
  • So'rov natijasi asosan filtrlanadi yoki to'planadi.
  • Ma'lumotlarni yangilash oddiy stsenariydan foydalanadi (odatda faqat ommaviy, murakkab operatsiyalarsiz).

ClickHouse uchun keng tarqalgan holatlardan biri bu server jurnalini tahlil qilishdir. Ma'lumotlarni ClickHouse-ga muntazam ravishda yuklashni o'rnatgandan so'ng (ma'lumotlarni 1000 qatordan yuqori bo'lgan juda katta to'plamlarga kiritish tavsiya etiladi), voqealarni tezkor so'rovlar bilan tahlil qilish yoki xizmatning o'lchov ko'rsatkichlarini, masalan, xato darajasi, javob berish vaqti va boshqalarni kuzatish mumkin.

ClickHouse ichki tahlilchilar uchun ichki ma'lumotlar ombori sifatida ham foydalanish mumkin. ClickHouse turli xil tizimlardagi ma'lumotlarni saqlashi mumkin (masalan Hadoop yoki ba'zi jurnallar) va tahlilchilar ma'lumotlar bilan ichki boshqaruv panellarini yaratishlari yoki biznes maqsadlarida real vaqtda tahlil qilishlari mumkin.

Sinov natijalari

Ga binoan benchmark ishlab chiquvchilar tomonidan o'tkazilgan testlar,[14] uchun OLAP so'rovlar ClickHouse nisbatan 100 baravar tezroq Kovan (a Ma'lumotlar bazasi asosida Hadoop texnologiya to'plami) yoki MySQL (umumiy RDBMS ).

Shuningdek qarang

Adabiyotlar

  1. ^ "Github Release v20.11.3.3-barqaror". Github. Olingan 17 noyabr 2020.
  2. ^ "Relizlar". Github. Olingan 2 sentyabr 2019.
  3. ^ "Veb-saytlar uchun trafikni tahlil qilish vositalaridan foydalanish statistikasi va bozor ulushi, 2016 yil noyabr". w3techs.com. Olingan 2016-11-10.
  4. ^ Datanyze. "Analytics Market Share Report | Raqobatchilar tahlili | Google Analytics, Google Universal Analytics, Yandex Metrica". Datanyze. Arxivlandi asl nusxasi 2016-10-21 kunlari. Olingan 2016-11-10.
  5. ^ Wappalyzer (2011-12-30). "Analitika". wappalyzer.com. Arxivlandi asl nusxasi 2017-05-12. Olingan 2016-11-10.
  6. ^ "Analytics - SEOMON.com". seomon.com. Olingan 2016-11-10.
  7. ^ "ClickHouse: Analytics uchun yuqori samarali tarqatilgan ma'lumotlar bazalari | Percona Live Amsterdam - Open Source Database Conference 2016". www.percona.com. Olingan 2016-11-10.
  8. ^ a b "Yandeks otkryvaet ClickHouse". Olingan 2016-11-10.
  9. ^ "Zdorovee Marketa: kak my prevrazchaem logi v grafiki, Dmitriy Andreev (Yandeks) - Sobytiya Yndeksa". events.yandex.ru. Olingan 2016-11-10.
  10. ^ "Yandex - Yandex CERN-da LHC tadbirlarini qidirish vositasini ishga tushirdi". Yandeks. Olingan 2016-11-10.
  11. ^ "Sravnenie analiticheskix xotiradagi baz dannyx". Olingan 2016-11-10.
  12. ^ "Evolyutsiya tuzilishi dannyx v Yandeks.Metrika". Olingan 2016-11-10.
  13. ^ a b "ClickHouse qo'llanmasi". clickhouse.yandex. Olingan 2016-11-10.
  14. ^ a b "Analitik DBMS ko'rsatkichlarini taqqoslash". clickhouse.yandex. Olingan 2016-11-10.
  15. ^ "smi2 / phpClickHouse". GitHub. Olingan 2016-11-10.
  16. ^ "apla / node-clickhouse". GitHub. Olingan 2016-11-10.
  17. ^ "elcamlost / perl-DBD-ClickHouse". GitHub. Olingan 2016-11-10.
  18. ^ "archan937 / clickhouse". GitHub. Olingan 2016-11-10.
  19. ^ "hannesmuehleisen / clickhouse-r". GitHub. Olingan 2016-11-10.
  20. ^ "yandex / clickhouse-jdbc". GitHub. Olingan 2016-11-10.

Tashqi havolalar