Yorqinlik (fayl tizimi) - Lustre (file system)

Yorqinlik
Yorqin fayl tizimi logo.gif
Dastlabki chiqarilish2003 yil 16-dekabr; 16 yil oldin (2003-12-16)[1]
Barqaror chiqish
2.13.0 (so'nggi yirik versiya), [2]

2.12.5 (so'nggi texnik nashr), [3]

/ 2020 yil 8-iyun; 5 oy oldin (2020-06-08)
Omborgit.whamcloud.com? p = fs% 2Flustre-release.git
YozilganC
Operatsion tizimLinux yadrosi
TuriTarqatilgan fayl tizimi
LitsenziyaGPL v2 LGPL
Veb-saytyorqinlik.org
Klaster fayl tizimlari, Inc.
Xususiy
Tashkil etilgan2001
Ta'sischiPiter J. Braam
Bosh ofis
Asosiy odamlar
Andreas Dilger, Erik Barton (HPC), Fil Shvan
MahsulotlarYorqin fayl tizimi
Yorqinlik
Tanishtirdi2003 yil dekabrda Linux bilan
Tuzilmalar
Katalog tarkibiHN, 2,7+ da DNE bilan aralashtirilgan xash
Fayl turifayl, katalog, hardlink, symlink, maxsus blok, maxsus belgilar, rozetka, FIFO
Yuklash mumkinYo'q
Cheklovlar
Min. tovush hajmi32 MB
Maks. tovush hajmi300 PB (ishlab chiqarish), 16 EB dan yuqori (nazariy)
Maks. fayl hajmi3.2 PB (ext4), 16 EB (ZFS)
Fayl o'lchamining donadorligi4 KB
Maks. fayllar soniMetadata bo'yicha maqsad (MDT): 4 milliard fayl (ldiskfs backend), 256 trillion fayl (ZFS backend),[4] bitta fayl tizimiga 128 MDTgacha
Maks. fayl nomi uzunligi255 bayt
Maks. dirname uzunligi255 bayt
Maks. katalog chuqurligi4096 bayt
Fayl nomlarida ruxsat berilgan belgilarNUL (' 0') va '/' dan tashqari barcha baytlar va maxsus fayl nomlari. " va ".."
Xususiyatlari
Yozilgan sanalaro'zgartirish (mtime), atributni o'zgartirish (ctime), kirish (atime), o'chirish (dtime), yaratish (crtime)
Sana oralig'i2 ^ 34 bit (ext4), 2 ^ 64 bit (ZFS)
Sana rezolyutsiyasi1 s
VilkalarYo'q
Xususiyatlar32bitapi, acl, checksum, flock, lazystatfs, localflock, lruresize, noacl, nochecksum, noflock, nolazystatfs, nolruresize, nouser_fid2path, nouser_xattr, user_fid2path, user_xattr
Fayl tizimining ruxsatlariPOSIX, POSIX.1e ACL, SELinux
Shaffof siqilishHa (faqat ZFS)
Shaffof shifrlashHa (tarmoq, faqat ZFS 0.8 bilan saqlash)
Ma'lumotlarni takrorlashHa (faqat ZFS)
Yozishda nusxa ko'chirishHa (faqat ZFS)
Boshqalar
Qo'llab-quvvatlanadi operatsion tizimlarLinux yadrosi

Yorqinlik parallellikning bir turi tarqatilgan fayl tizimi, odatda keng ko'lamda ishlatiladi klasterli hisoblash. Luster nomi a portmanteau so'zi dan olingan Linux va klaster.[5] Luster fayl tizimining dasturiy ta'minoti ostida mavjud GNU umumiy jamoat litsenziyasi (faqat 2-versiya) va kichik ishchi guruh klasterlaridan katta ko'lamli, ko'p saytli tizimlarga qadar bo'lgan kompyuter klasterlari uchun yuqori mahsuldorlikka ega fayl tizimlarini taqdim etadi. 2005 yil iyun oyidan boshlab Luster doimiy ravishda eng yaxshi o'nlikning kamida yarmi va eng tezkor 100-ning 60 dan ortig'i tomonidan doimiy ravishda ishlatilib kelinmoqda. superkompyuterlar dunyoda,[6][7][8]shu jumladan dunyodagi 1-o'rinni egalladi TOP500 2020 yil iyun oyida superkompyuter, Fugaku,[9] kabi oldingi eng yaxshi superkompyuterlar kabi Titan[10] va Sequoia.[11]

Yorqinlikdagi fayl tizimlari miqyosli va o'n minglab kompyuterlar bir nechta klasterlarining bir qismi bo'lishi mumkin mijoz tugunlar, yuzlab serverlarda o'nlab petabayt (PB) va sekundiga terabaytdan ortiq (TB / s) I / U agregati ishlab chiqarish.[12][13] Bu Luster fayl tizimlarini yirik ma'lumotlar markazlari, shu kabi sohalardagi korxonalar uchun mashhur tanlovga aylantiradi meteorologiya, simulyatsiya,[14] neft va gaz, hayot haqidagi fan, boy ommaviy axborot vositalari va moliya.[15] Lusterning I / U ishlashi ushbu dasturlarga keng ta'sir ko'rsatdi va keng e'tiborni tortdi.[16][17][18][19]

Tarix

Luster fayl tizimi arxitekturasi 1999 yilda tadqiqot loyihasi sifatida boshlangan Piter J. Braam, kimning shtabi edi Karnegi Mellon universiteti (CMU) o'sha paytda. Braam 2001 yilda o'zining Cluster File Systems kompaniyasini yaratishga kirishdi,[20] bo'yicha ishdan boshlab InterMezzo fayl tizimi ichida Coda loyihasi CMU da.[21]Yorqinlik ostida ishlab chiqilgan Tezlashtirilgan strategik hisoblash tashabbusi "Oldinga yo'nalish" loyihasi Amerika Qo'shma Shtatlari Energetika vazirligi, shu jumladan Hewlett-Packard va Intel.[22]2007 yil sentyabr oyida, Quyosh mikrosistemalari intellektual mulkni o'z ichiga olgan Cluster File Systems Inc aktivlarini sotib oldi.[23][24]Quyosh Lustrni o'z ichiga olgan yuqori samarali hisoblash Luster texnologiyalarini Sun's-ga etkazish maqsadida apparat takliflari ZFS fayl tizimi va Solaris operatsion tizim. 2008 yil noyabr oyida Braam Sun Microsystems-ni tark etdi va Erik Barton va Andreas Dilger loyihani boshqarishni o'z zimmalariga oldilar. Oracle korporatsiyasi, Quyoshni sotib olish yo'li bilan Lusterni boshqarishni va chiqarishni boshladi.

2010 yil dekabr oyida Oracle Luster 2.x ishlab chiqarishni to'xtatishini va Luster 1.8-ni faqat texnik qo'llab-quvvatlashga joylashtirishi va fayl tizimining kelajakdagi rivojlanishi to'g'risida noaniqlik yaratishi haqida e'lon qildi.[25]Ushbu e'londan so'ng, jamoatchilikni rivojlantirishning ochiq modeli, shu jumladan Whamcloud-da qo'llab-quvvatlash va rivojlantirish uchun bir nechta yangi tashkilotlar paydo bo'ldi,[26]Open Scalable File Systems, Inc. (OpenSFS), EUROPEAN Open File Systems (EOFS) va boshqalar. 2010 yil oxiriga kelib, aksariyat Luster dasturchilari Oracle-dan chiqib ketishdi. Braam va bir nechta sheriklar apparatga yo'naltirilgan qo'shilishdi Xiratex u ClusterStor aktivlarini sotib olganida,[27][28]Barton, Dilger va boshqalar Whamcloud dasturiy ta'minotini yaratib, u erda Lusterda ishlashni davom ettirdilar.[29]

2011 yil avgust oyida, OpenSFS Whustcloud-ga Luster xususiyatlarini ishlab chiqish uchun shartnoma tuzdi.[30] Ushbu shartnoma Lusterga ko'p yadroli metadata serveridan yaxshiroq foydalanish imkoniyatini beradigan yagona server metadata ishlash ko'rsatkichlarini takomillashtirishni o'z ichiga olgan funktsiyalarni yakunlashni o'z ichiga olgan; fayl tizimini o'rnatishda va ishlatishda ma'lumotlar va metama'lumotlar serverlari o'rtasida tarqatilgan fayl tizimining holatini tekshirishga imkon beruvchi Lusterning tarqatilgan fayl tizimini onlayn tekshirish (LFSCK); va tarqatilgan ismlar maydoni muhiti (DNE), ilgari Klasterli metama'lumotlar (CMD), bu Luster meta-ma'lumotlarini bir nechta serverlarga tarqatishga imkon beradi. Rivojlanish, shuningdek, ZFS-ga asoslangan ob'ektlarni saqlashda davom etdi Lourens Livermor milliy laboratoriyasi.[11] Ushbu xususiyatlar Luster 2.2-dan 2.4-ga qadar jamoatchilik uchun chiqariladigan yo'l xaritasida bo'lgan.[31]2011 yil noyabr oyida Lustr kodi yetarli darajada sinovdan o'tishini va xatolarni tuzatishni yangi funktsiyalar ishlab chiqilishini ta'minlash uchun Luster 2.x manba kodini saqlash uchun Whamcloud-ga alohida shartnoma tuzildi.[32]

2012 yil iyul oyida Whamcloud tomonidan sotib olingan Intel,[33][34] Whamcloud FastForward DOE shartnomasini qo'lga kiritgandan so'ng, Luster-ni kengaytirish uchun exascale hisoblash tizimlar 2018 yil muddatida.[35] OpenSFS keyin Lusterni rivojlantirish bo'yicha shartnomalarni Intelga o'tkazdi.

2013 yil fevral oyida Xyratex Ltd. Oracle kompaniyasidan asl Luster savdo markasi, logotipi, veb-sayti va tegishli intellektual mulkni sotib olganligini e'lon qildi.[27] 2013 yil iyun oyida Intel Luster-dan foydalanishni an'anaviy HPC-dan tashqari kengaytira boshladi, masalan Hadoop.[36] Umuman olganda, 2013 yil uchun OpenSFS Luster xususiyatlarini ishlab chiqish, fayl tizimining parallel vositalari, Luster texnik qarzlarini hal qilish va parallel fayl tizimi inkubatorlarini qamrab olish bo'yicha takliflar (RFP) e'lon qildi.[37] OpenSFS shuningdek, Luster jamoatchilik portalini tashkil etdi, bu Luster ochiq manbali hamjamiyatini qo'llab-quvvatlash uchun ma'lumot va ko'rsatmalar berish uchun bir sohada ma'lumotlar va hujjatlar to'plamini taqdim etadigan texnik sayt. 2014 yil 8 aprelda Ken Kleffi Xyratex / Seagate xayriya qilganini e'lon qildi lustre.org domenni foydalanuvchi hamjamiyatiga qaytarish,[38] va bu 2015 yil mart oyida yakunlandi.

2018 yil iyun oyida Luster jamoasi va aktivlari Intel tomonidan sotib olingan DDN. DDN yangi sotib olishni mustaqil bo'linma sifatida tashkil etdi va yangi bo'lim uchun Whamcloud nomini qayta tikladi.[39]

2019 yil noyabr oyida, OpenSFS va EOFS da e'lon qilingan SC19 Luster savdo markasi ularga birgalikda o'tkazilgan Luster BOF Seagate.[40]

Chiqarish tarixi

Luster fayl tizimi birinchi marta 2003 yil mart oyida MCR Linux klasterida ishlab chiqarish uchun o'rnatildi Lourens Livermor milliy laboratoriyasi,[41] o'sha paytdagi eng katta superkompyuterlardan biri.[42]

Luster 1.0.0 2003 yil dekabrda chiqarilgan,[1] va serverning ishdan chiqishi va qayta tiklanishini o'z ichiga olgan Luster fayl tizimining asosiy funktsiyalarini taqdim etdi.

2004 yil mart oyida chiqarilgan Luster 1.2.0 ustida ishladi Linux yadrosi 2.6-da yozilgan fayllarni blokirovka qilishni bekor qilish va mijozlar tomonidan ma'lumotlarni qayta yozib olish uchun keshni hisobga olish (grant) oldini olish uchun "o'lchamlarni ko'rish" xususiyati mavjud edi.

2004 yil noyabr oyida chiqarilgan Luster 1.4.0 versiyalari o'rtasida protokollarning mosligini ta'minlagan InfiniBand tarmoqlarida ishlaydi va kengaytmalarni ishlatishi mumkin ldiskfs diskdagi fayllar tizimi.

2007 yil aprel oyida chiqarilgan Luster 1.6.0, serverlarni "mkfs" va "mount" bilan sozlash imkonini beruvchi o'rnatish konfiguratsiyasiga ("mountconf") ruxsat berdi, dinamik qo'shimchalarga ruxsat berdi ob'ektni saqlash maqsadlari (OST), yoqilgan Luster tarqatilgan blokirovka menejeri (LDLM) miqyosi nosimmetrik ko'p ishlov berish (SMP) serverlari va ob'ektlarni ajratish uchun bo'sh joyni boshqarish ta'minlandi.

2009 yil may oyida chiqarilgan Luster 1.8.0 OSS Read Cache-ni taqdim etdi, bir nechta nosozliklar paytida tiklanishni yaxshiladi, OST hovuzlari orqali asosiy heterojen saqlash boshqaruvi, tarmoqning moslashuvchan vaqt tugashi va versiya asosida qayta tiklanishini ta'minladi. Bu Luster 1.6 va Luster 2.0 bilan o'zaro bog'liq bo'lgan o'tish versiyasi edi.[43]

2010 yil avgust oyida chiqarilgan Luster 2.0 yirik me'morchilik yutuqlariga tayyorgarlik ko'rish uchun muhim ichki qayta tuzilgan kodga asoslangan edi. Yorqinlik 2.x mijozlar 1.8 yoki undan oldingi versiyalar bilan o'zaro hamkorlik qila olmaydi serverlar. Biroq, Luster 1.8.6 va undan keyingi mijozlar Luster 2.0 va undan keyingi serverlar bilan hamkorlik qilishlari mumkin. Metadata Target (MDT) va 1.8 formatidagi OST diskdagi formati 2.0 ga ko'tarilishi mumkin va undan keyin fayl tizimini qayta formatlash kerak bo'lmaydi.

2011 yil sentyabr oyida chiqarilgan Luster 2.1, bu Luster 2.x versiyalarida Oracle ishlab chiqarishni to'xtatishga javoban jamoatchilik tashabbusi edi.[44] Red Hat Linux 6-da serverlarni ishga tushirish qobiliyati qo'shildi va maksimal ext4 asosidagi OST hajmini 24 TB dan 128 TB ga oshirdi,[45] shuningdek, ishlash va barqarorlikni bir qator yaxshilash. Luster 2.1 serverlari 1.8.6 va undan keyingi mijozlar bilan o'zaro aloqada bo'lib qoldi.

2012 yil mart oyida chiqarilgan Luster 2.2, metama'lumotlarning ishlashini yaxshilash va yangi xususiyatlarni taqdim etishga qaratilgan.[46] U bir nechta mijozlarga bir vaqtning o'zida bitta katta katalogni bosib o'tishi va o'zgartirishi, serverdagi nosozliklarni tezroq tiklashi, bitta fayl uchun chiziqlar sonini ko'paytirish (2000 OSTgacha) va bitta klient katalogining o'tish qobiliyatini yaxshilashga imkon beradigan parallel katalog operatsiyalarini qo'shdi.

2012 yil oktyabr oyida chiqarilgan Luster 2.3, ko'plab CPU yadrolari (16 yoshdan yuqori) bo'lgan tugunlarda ichki blokirovka to'siqlarini olib tashlash uchun metadata server kodini takomillashtirishni davom ettirdi. Ob'ektlar do'koni foydalanishning dastlabki qobiliyatini qo'shdi ZFS zaxira fayl tizimi sifatida. Luster File System ChecK (LFSCK) xususiyati fayl tizimi zaxiralash / tiklashdan so'ng yoki MDS buzilgan taqdirda, fayl tizimi ishlatilayotgan paytda MDS ob'ekti indeksini (OI) tekshirishi va tuzatishi mumkin. Kabi serverlarning IO statistikasi yaxshilandi, masalan, ommaviy ishlarni rejalashtirish bilan integratsiyani ta'minlashga imkon berdi AHLAT ish boshiga statistikani kuzatib borish. Mijozlar uchun dasturiy ta'minot 3.0 versiyasiga qadar Linux yadrolari bilan ishlash uchun yangilandi.

2013 yil may oyida chiqarilgan Luster 2.4, ko'plab to'g'ridan-to'g'ri moliyalashtiriladigan ko'plab asosiy funktsiyalarni qo'shdi OpenSFS. Distributed Namespace Environment (DNE) bitta nom maydonining pastki katalog daraxtlarini alohida MDTlarda joylashtirishga imkon berish orqali 2,4 mijoz uchun gorizontal metama'lumotlar hajmi va ishlash ko'lamini kengaytirishga imkon beradi. ZFS endi MDT va OST saqlash uchun zaxira fayllar tizimi sifatida foydalanish mumkin. LFSCK xususiyati MDT FID va LinkEA atributlarining ichki muvofiqligini tekshirish va tekshirish qobiliyatini qo'shdi. Tarmoq so'rovlarini rejalashtirish dasturi[47][48](NRS) diskda buyurtma berish yoki adolat uchun mijoz so'rovini qayta ishlashni optimallashtirish uchun siyosat qo'shadi. Mijozlar ixtiyoriy ravishda hajmi 4 MB gacha bo'lgan ommaviy RPClarni yuborishlari mumkin. Mijozlar uchun mo'ljallangan dasturiy ta'minot Linux yadrolari bilan ishlash uchun 3.6 versiyasiga qadar yangilandi va hanuzgacha 1,8 mijoz bilan o'zaro aloqada.

2013 yil oktyabr oyida chiqarilgan Luster 2.5 kutilgan xususiyatni qo'shdi, Ierarxik saqlashni boshqarish (HSM). Korxona muhitidagi asosiy talab HSM mijozlarga o'zlarining ish sharoitlarida darajali saqlash echimlarini osongina tatbiq etishlariga imkon beradi. Ushbu versiya Lustrning joriy OpenSFS-ning Ta'minot-Reliz filiali.[49][50][51][52] Eng so'nggi texnik xizmat versiyasi 2.5.3 bo'lib, 2014 yil sentyabr oyida chiqarilgan.[53]

Luster 2.6, 2014 yil iyulda chiqarilgan,[54] OF-da mahalliy muvofiqlikni tekshirishni, shuningdek MDT va OST moslamalari o'rtasidagi muvofiqlikni tekshirishni amalga oshirish uchun LFSCK funktsiyasini qo'shib, juda oddiy chiqish xususiyati edi. NRS token paqir filtri[55](TBF) siyosati qo'shildi. Bitta mijozning IO ishlashi avvalgi versiyalarga nisbatan yaxshilandi.[56] Ushbu nashr shuningdek, DNE chiziqli kataloglarini oldindan ko'rishni qo'shib qo'ydi, bu esa bitta katta kataloglarni ishlash va ko'lamini yaxshilash uchun bir nechta MDT-larda saqlashga imkon beradi.

Luster 2.7, 2015 yil mart oyida chiqarilgan,[57] bir nechta MDTlar orasidagi masofali va chiziqli kataloglarning DNE muvofiqligini tekshirish uchun LFSCK funktsiyasini qo'shdi. Dynamic LNet Config LNet tarmoq interfeyslarini, marshrutlarini va routerlarini ish vaqtida sozlash va o'zgartirish qobiliyatini qo'shadi. Turli xil ma'muriy domenlarga ega bo'lgan mijozlar uchun UID / GID xaritalash uchun yangi baholash xususiyati qo'shildi, shuningdek DNE chiziqli katalogining ishlashi yaxshilandi.

2016 yil mart oyida chiqarilgan Luster 2.8,[58] MDN va cross-MDT o'rtasida kataloglarni ko'chirishni qo'llab-quvvatlashni o'z ichiga olgan DNE chiziqli katalog xususiyatini tugatdi qattiq havola va nomini o'zgartirish. Shuningdek, unga yaxshilangan qo'llab-quvvatlash kiradi Xavfsizligi yaxshilangan Linux (SELinux ) mijozga, Kerberos autentifikatsiya va tarmoq orqali RPC shifrlash va LFSCK uchun ishlashni yaxshilash.

Luster 2.9 2016 yil dekabrda chiqarildi[59]va xavfsizlik va ishlash bilan bog'liq bir qator xususiyatlarni o'z ichiga olgan. Shared Secret Key xavfsizlik lazzati ham xuddi shunday ishlatadi GSSAPI mijoz va server tugunlari autentifikatsiyasini va RPC xabarlarining yaxlitligi va xavfsizligini (shifrlash) ta'minlash uchun Kerberos mexanizmi. Nodemap xususiyati mijoz tugunlarini guruhlarga ajratish va keyinchalik ushbu mijozlar uchun UID / GID-ni xaritalashga imkon beradi, masofadan boshqariladigan mijozlarga barcha mijoz tugunlari uchun bitta UID / GID to'plamiga ega bo'lmasdan birgalikda fayl tizimidan shaffof foydalanish imkonini beradi. Subdirektorni o'rnatish xususiyati mijozlarga MDS-dan fayl tizimi nomlari maydonining kichik qismini o'rnatishga imkon beradi. Ushbu versiya, shuningdek, diskka I / U-ni yanada samarali yuborish uchun 16MiB gacha bo'lgan RPC-larni qo'llab-quvvatladi va qo'shdi ladviz Fayl ma'lumotlarini server keshiga oldindan yuklash yoki fayl ma'lumotlarini server keshidan o'chirish uchun mijozlarga serverlarga I / U ko'rsatmalarini taqdim etish uchun interfeys. Fayl tizimidagi standart OST havuzlarini aniqlash uchun yaxshilangan qo'llab-quvvatlash va boshqa fayllarni joylashtirish parametrlari bilan birgalikda OST havzalarini meros qilib olish yaxshilandi.

Luster 2.10 2017 yil iyul oyida chiqarildi[60]va bir qator sezilarli yaxshilanishlarga ega. The LNet Multi-Rail (LMR) xususiyati bir nechta tarmoq interfeyslarini bog'lashga imkon beradi (InfiniBand, Omni-yo'l va / yoki Ethernet ) I / U o'tkazuvchanligini yig'ish hajmini oshirish uchun mijoz va serverda. Shaxsiy fayllar bir nechta tarkibiy qismlardan tashkil topgan, fayllarni ofsetga asoslangan fayl mintaqalari bo'lgan, chiziqlar soni, OST havzasi / saqlash turi va boshqalar kabi turli xil tartib parametrlariga imkon beradigan kompozitsion fayl sxemalarini ishlatishi mumkin. Progressive File Layout (PFL) - bu kompozitsion maketlardan foydalanishning birinchi xususiyati, ammo uni aks ettirish va o'chirish kodlash kabi boshqa fayllar maketlari bilan ishlash uchun moslashuvchan. NRS Token Bucket Filter (TBF) server tomonidan rejalashtiruvchisi yangi qoida turlarini, shu jumladan RPC tipidagi rejalashtirishni va qoidalarni moslashtirish uchun JobID va NID kabi bir nechta parametrlarni belgilash qobiliyatini o'z ichiga oldi. MDF va OST ZFS oniy rasmlarini alohida Luster o'rnatish nuqtalari sifatida yaratish, o'rnatish va boshqarishni soddalashtirish uchun Luster fayl tizimlarining ZFS oniy rasmlarini boshqarish vositalari qo'shildi.

Luster 2.11 2018 yil aprel oyida chiqarilgan[61]va ikkita muhim yangi xususiyatni va bir nechta kichik xususiyatlarni o'z ichiga oladi. The Fayl darajasining ortiqcha bo'lishi (FLR) xususiyati 2.10 PFL dasturini kengaytiradi va belgilash imkoniyatini qo'shadi aks ettirilgan Saqlash yoki server ishlamay qolganda va / yoki yuqori darajadagi o'qishlar bilan ishlashni yaxshilagan holda yaxshilangan fayllar uchun maketlar. The MDT bo'yicha ma'lumotlar (DoM) xususiyati kichik (bir necha MiB) fayllarni MDT-da saqlashga imkon beradi, chunki OST-larda ishlatiladigan odatdagi HDD RAID-6 xotirasi o'rniga kam kechikish va kamaytirilgan IO ziddiyatlari uchun fleshka asoslangan odatdagi RAID-10 xotiradan foydalanish. LNet Dynamic Discovery xususiyati LNet tarmog'ini almashadigan tengdoshlar o'rtasida LNet Multi-Rail-ni avtomatik ravishda sozlash imkonini beradi. LDLM Lock Ahead xususiyati tegishli ravishda o'zgartirilgan dasturlar va kutubxonalarga fayllar uchun OST-lardan DLM-darajadagi qulflarni oldindan olish imkoniyatini beradi, agar ilova ushbu fayl hajmi yaqin kelajakda o'zgartirilishini bilsa (yoki bashorat qilsa), bu blokirovka nizosini kamaytirishi mumkin bir xil faylga yozadigan bir nechta mijozlar.

Luster 2.12 2018 yil 21-dekabrda chiqdi[62] va Luster 2.11-ga qo'shilgan FLR va DoM funktsiyalarining ishlashi va funksionalligini yaxshilagan holda, shuningdek, NRS-dagi kichikroq o'zgarishlarni o'z ichiga olgan holda, nashrida foydalanish va barqarorlikni yaxshilashga e'tibor qaratdi. TBF, HSM va JobStats. Bu qo'shildi LNet Network Health Luster 2.10-dan LNet Multi-Rail xususiyatiga, tugun bir nechta tarmoq interfeyslariga ega bo'lganda tarmoq xatolarini yaxshiroq hal qilishga imkon berish. MDT bo'yicha dangasa o'lcham[63] (LSOM) xususiyati MDT-da siyosat dvigatellari, fayl tizimining skanerlari va boshqa boshqaruv vositalaridan foydalanish uchun fayl hajmini taxminiy ravishda saqlashga imkon beradi, bu esa fayllar to'g'risida to'liq aniq hajmdagi qarorlar qabul qila olmaydi yoki bloklar soni so'ralmasdan talab qilinmaydi. Ushbu ma'lumot uchun OST. Ushbu versiya shuningdek, qo'lda ishlash qobiliyatini qo'shdi qayta pishgan ko'p sonli fayllar bilan kataloglarni ko'chirishga ruxsat berish uchun bir nechta MDT tugmachalarining hajmi va ishlashidan foydalanish uchun bir nechta MDT-larda mavjud bo'lgan katalog. Luster RPC ma'lumotlarini tekshirish summasi qo'shildi SCSI T10-PI ma'lumotlarning birlashtirilgan summasi[64] mijozdan yadro bloklari qatlamiga, SCSI xost adapteri va T10 yoqilgan qattiq disklar.

Luster 2.13 2019 yil 5-dekabrda chiqarilgan[2] va doimiy ishlash uchun keshni ishlashga oid yangi xususiyatlarni qo'shdi[65] (PCC), bu to'g'ridan-to'g'ri foydalanishga imkon beradi NVMe va NVRAM fayllarni global fayl tizimining nomlar maydonining bir qismini saqlash paytida mijoz tugunlarida saqlash va OST Overstriping[66] tezkor OSS uskunasidan yaxshiroq foydalanish uchun fayllarni bitta OST-da bir nechta chiziqlarni saqlashga imkon beradi. LNet RDMA yo'riqnoma tugunlari bilan ishlash uchun LNet Multi-Rail Network Health funktsiyasi yaxshilandi. PFL funktsiyasi Self-Extensions Layouts yordamida yaxshilandi[67] (SEL) fayl komponentlarini dinamik ravishda o'lchamiga imkon berish, shu fayl tizimidagi disk OST-laridan ancha kichik bo'lishi mumkin bo'lgan flesh OST-lar bilan yaxshiroq ishlash. Chiqarishda MDT-larda DNE masofaviy katalog yaratilishini muvozanatlash, "lfs find" yukini kamaytirish uchun Lazy-size-on-MDT-dan foydalanish, ldiskfs uchun har bir shardga 10M faylli kataloglar va ommaviy RPC kabi bir qator kichik yaxshilanishlar mavjud. 64 MBgacha bo'lgan o'lchamlar.[68]

Arxitektura

Luster fayl tizimida uchta asosiy funktsional birlik mavjud:

  • Bir yoki bir nechtasi metadata serverlari (MDS) bitta yoki bir nechtasiga ega tugunlar metadata nishon (MDT) Fayl nomlari, kataloglar, kirish uchun ruxsatlar va fayllarning joylashuvi kabi nomlar maydonining metama'lumotlarini saqlaydigan har bir Luster fayl tizimidagi qurilmalar. MDT ma'lumotlari mahalliy disk fayl tizimida saqlanadi. Ammo, masalan, bloklarga asoslangan tarqatilgan fayl tizimlaridan farqli o'laroq GPFS va PanFS, metama'lumotlar serveri barcha bloklarni taqsimlashni boshqaradigan joyda, Luster metama'lumotlari serveri faqat yo'l nomlari va ruxsatlarni tekshirishda qatnashadi va hech qanday fayl kiritish-chiqarish operatsiyalarida qatnashmaydi, metamalumotlar serveridagi I / U ölçeklenebilirliğindeki to'siqlardan qochadi. Bitta fayl tizimida bir nechta MDT-larga ega bo'lish qobiliyati Luster 2.4-dagi yangi xususiyat bo'lib, katalog pastki daraxtlari ikkilamchi MDT-larda yashashiga imkon beradi, 2.7 va undan keyin esa katta yagona kataloglarni bir nechta MDT-larda ham tarqatishga imkon beradi.
  • Bir yoki bir nechtasi ob'ektni saqlash serveri (OSS) fayl ma'lumotlarini bir yoki bir nechtasida saqlaydigan tugunlar ob'ektni saqlash maqsadi (OST) qurilmalar. Serverning apparatiga qarab, OSS odatda ikkitadan sakkizgacha OST orasida ishlaydi, har bir OST bitta mahalliy disk fayl tizimini boshqaradi. Luster fayl tizimining hajmi OSTlar tomonidan taqdim etilgan imkoniyatlarning yig'indisidir.
  • Mijoz (lar) ma'lumotlarga kirish va ulardan foydalanish. Luster barcha mijozlarga standartlardan foydalangan holda fayl tizimidagi barcha fayllar va ma'lumotlar uchun birlashtirilgan nom maydonini taqdim etadi POSIX semantikasi va fayl tizimidagi fayllarni bir vaqtda va izchil o'qish va yozish imkoniyatini beradi.

MDT, OST va mijoz bir tugunda bo'lishi mumkin (odatda sinov maqsadida), lekin odatdagi ishlab chiqarish qurilmalarida ushbu qurilmalar tarmoq orqali aloqa qiluvchi alohida tugunlarda joylashgan. Har bir MDT va OST faqat bitta fayl tizimining bir qismi bo'lishi mumkin, biroq bitta tugunda bir nechta MDT yoki OST bo'lishi mumkin, ular turli xil fayl tizimlarining bir qismi hisoblanadi. The Yorqinlik tarmog'i (LNet) qatlam bir necha turdagi o'zaro bog'liqliklardan, shu jumladan mahalliydan foydalanishi mumkin InfiniBand fe'llar, Omni-yo'l, RoCE va iWARP orqali OFED, TCP / IP kuni Ethernet kabi boshqa mulkiy tarmoq texnologiyalari Cray Egizaklar o'zaro aloqasi. Luster 2.3 va undan oldingi versiyalarida, Mirinet, Quadrics, Cray SeaStar va RapidArray tarmoqlari ham qo'llab-quvvatlandi, ammo ushbu tarmoqlar drayverlari endi sotuvga chiqarilmagandan so'ng bekor qilindi va Luster 2.8 da qo'llab-quvvatlash butunlay olib tashlandi. Yorqinlik xotiraga masofadan to'g'ridan-to'g'ri kirish imkoniyatidan foydalanadi (RDMA ) o'tkazmalar, agar mavjud bo'lsa, samaradorlikni oshirish va protsessordan foydalanishni kamaytirish.

MDT va OST zaxira fayl tizimlari uchun ishlatiladigan xotira odatda apparat tomonidan ta'minlanadi RAID qurilmalar, ammo har qanday blok qurilmalar bilan ishlaydi. Luster 2.4 dan boshlab, MDT va OST ham foydalanishi mumkin ZFS fayl tizimiga qo'shimcha ravishda ext4, ulardan samarali foydalanishga imkon beradi JBOD apparat RAID qurilmalari o'rniga saqlash. Luster OSS va MDS serverlari ma'lumotlarni qo'llab-quvvatlovchi fayl tizimi tomonidan o'rnatilgan formatdagi ma'lumotlarni o'qiydi, yozadi va o'zgartiradi va bu ma'lumotlarni mijozlarga qaytaradi. Bu Lusterga asosiy fayl tizimidagi yaxshilanishlar va funktsiyalardan foydalanishga imkon beradi, masalan, ZFS-da siqishni va ma'lumotlarni tekshirish summasi. Mijozlar asosiy xotiraga to'g'ridan-to'g'ri kirish huquqiga ega emaslar, bu noto'g'ri yoki zararli mijoz fayl tizimi tuzilishini buzmasligini ta'minlaydi.

OST - bu o'qish / yozish operatsiyalari uchun fayl ob'ektlarining baytlar oralig'iga interfeysni eksport qiladigan, ajratilgan fayl tizimi darajada ma'lumotlar izchilligini himoya qilish uchun qulflar. MDT - bu inodlarni, kataloglarni, POSIX va kengaytirilgan fayl atributlari, faylga kirish uchun ruxsatlarni boshqaradi /ACL va mijozlarga har bir oddiy faylni tashkil etuvchi ob'ekt (lar) ning joylashishini aytib beradi. Hozirda MDT va OST-lar kengaytirilgan versiyasidan foydalaniladi ext4 deb nomlangan ldiskfs, yoki ZFS / DMU fayllarni / ob'ektlarni saqlash uchun ma'lumotlarni saqlash uchun orqa tomon uchun[69] ochiq manbali ZFS-on-Linux portidan foydalanish.[70]

Mijoz Luster fayl tizimini lokal ravishda a bilan o'rnatadi VFS uchun haydovchi Linux mijozni server (lar) bilan bog'laydigan yadro. Dastlabki o'rnatilgandan so'ng, mijozga Fayl identifikatori (FID) taqdim etiladi ildiz katalogi o'rnatish nuqtasining. Mijoz faylga kirganda, uni MDS-da fayl nomini qidirishni amalga oshiradi. MDS fayl nomini qidirish tugagandan so'ng va foydalanuvchi va mijoz faylga kirish va / yoki uni yaratishga ruxsat olganida, mavjud faylning tartibi mijozga qaytariladi yoki agar so'ralsa, mijoz nomidan yangi fayl yaratiladi. O'qish yoki yozish operatsiyalari uchun mijoz keyinchalik fayl tartibini mantiqiy ob'ekt hajmi (LOV) qatlam, qaysi faylni mantiqiy ofset va hajmini bir yoki bir nechta ob'ektga moslashtiradi. Mijoz keyin fayllar qatorini bloklaydi ma'lumotlar ob'ektlarini ushlab turadigan OSS tugunlariga to'g'ridan-to'g'ri bir yoki bir nechta o'qish yoki yozish operatsiyalarini bajaradi va bajaradi. Ushbu yondashuv bilan mijoz-OSS aloqalari uchun to'siqlar bartaraf etiladi, shuning uchun fayl tizimidagi OST soni bilan ma'lumotlar shkalalarini o'qish va yozish uchun mijozlar uchun mavjud bo'lgan umumiy tarmoqli kengligi.

Fayl maketining dastlabki izlanishidan so'ng MDS odatda fayl IO operatsiyalarida qatnashmaydi, chunki barcha bloklarni taqsimlash va ma'lumotlar IO OST tomonidan ichki boshqariladi. Mijozlar OST fayl tizimidagi ob'ektlarni yoki ma'lumotlarni to'g'ridan-to'g'ri o'zgartirmaydilar, aksincha ushbu vazifani OSS tugunlariga topshiradilar. Ushbu yondashuv keng ko'lamli klasterlar va superkompyuterlar uchun ko'lamini kengaytiradi, shuningdek xavfsizlik va ishonchlilikni yaxshilaydi. Aksincha, umumiy bloklarga asoslangan fayl tizimlari GPFS va OCFS fayl tizimidagi barcha mijozlar tomonidan asosiy omborga to'g'ridan-to'g'ri kirishga ruxsat berish, bu katta orqa tomonni talab qiladi SAN barcha mijozlarga biriktirilgan va noto'g'ri ishlash / nuqsonli mijozlar tomonidan fayl tizimining buzilishi xavfini oshiradi.

Amalga oshirish

Linux mijoziga odatiy Luster o'rnatishda Luster fayl tizimi drayveri moduli yadroga yuklanadi va fayl tizimi boshqa har qanday mahalliy yoki tarmoq fayl tizimi singari o'rnatiladi. Mijoz dasturlari bitta, birlashtirilgan fayl tizimini ko'radi, garchi u o'nlab-minglab shaxsiy serverlar va MDT / OST fayl tizimlaridan iborat bo'lsa ham.

Ba'zilarida massiv parallel protsessor (MPP) o'rnatmalari, hisoblash protsessorlari Luster fayl tizimiga kirish-chiqish so'rovlarini Luster mijozi sifatida tuzilgan ajratilgan I / U tuguniga yo'naltirish orqali kirishlari mumkin. Ushbu yondashuv Moviy gen o'rnatish[71] da Lourens Livermor milliy laboratoriyasi.

Lustrning dastlabki yillarida qo'llanilgan yana bir yondashuv bu liblustre kutubxona Cray XT3 yordamida Catamount operatsion tizimi kabi tizimlarda Sandia Red Storm,[72] bu foydalanuvchilarning kosmik dasturlariga to'g'ridan-to'g'ri fayl tizimiga kirishni ta'minladi. Liblustre foydalanuvchi darajasidagi kutubxona bo'lib, hisoblash protsessorlariga Luster fayl tizimini o'rnatishga va mijoz sifatida ishlatishga imkon beradi. Liblustre-dan foydalanib, ish boshlangan xizmat tuguni Linux mijozi bo'lmasa ham, hisoblash protsessorlari Luster fayl tizimiga kirishlari mumkin. Liblustre ma'lumotlar yadrosi orqali intervalgacha nusxasini talab qilmasdan to'g'ridan-to'g'ri dastur maydoni va Luster OSS o'rtasida harakatlanishiga yo'l qo'ydi va shu bilan hisoblash protsessorlaridan Luster fayl tizimiga to'g'ridan-to'g'ri cheklangan ish muhitida kirishni ta'minladi. Lustlustre funktsiyasi Luster 2.6.0 dan beri o'chirib qo'yilganidan keyin Luster 2.7.0-dan o'chirildi va Luster 2.3.0-dan beri sinovdan o'tkazilmadi.

Linux Kernel 4.18 versiyasida Luster mijozining to'liq bo'lmagan porti rivojlanish va yangi yadrolarga ko'chirishni tezlashtirish uchun yadrolarni joylashtirish maydonidan olib tashlandi.[73] Daraxtdan tashqaridagi Luster mijozi va serveridan RHEL, SLES va Ubuntu distro yadrolari hamda vanil yadrolari mavjud.

Ma'lumotlar ob'ektlari va fayllar tasmasi

An'anaviy Unix disk fayl tizimida inode ma'lumotlar tuzilmasi har bir fayl haqida asosiy ma'lumotlarni o'z ichiga oladi, masalan, fayl tarkibidagi ma'lumotlar qaerda saqlanadi. Luster fayllar tizimi shuningdek inode-lardan foydalanadi, ammo MDT-lardagi inodlar ma'lumotlar bloklariga emas, balki fayl bilan bog'liq bo'lgan bir yoki bir nechta OST moslamalariga ishora qiladi. Ushbu ob'ektlar OST-larda fayl sifatida amalga oshiriladi. Mijoz faylni ochganda, faylni ochish operatsiyasi ob'ekt identifikatorlari to'plamini va ularning joylashishini MDS-dan mijozga uzatadi, shunda mijoz ob'ekt saqlanadigan OSS tuguniga bevosita ta'sir o'tkazishi mumkin. Bu mijozga MDS bilan qo'shimcha aloqa o'rnatmasdan fayldagi barcha OST moslamalari bo'yicha parallel ravishda I / O-ni bajarishga imkon beradi.

Agar bitta OST ob'ekti MDT inode bilan bog'langan bo'lsa, u ob'ekt Luster faylidagi barcha ma'lumotlarni o'z ichiga oladi. Fayl bilan bir nechta ob'ekt bog'langanda, fayldagi ma'lumotlar a qismlarga "chiziqli" bo'ladi dumaloq robin o'xshash OST ob'ektlari bo'ylab uslub RAID 0 bo'laklarda odatda 1 MB yoki undan katta. Faylni bir nechta OST moslamalari ustiga chizish, agar bitta katta hajmli faylga yuqori tarmoqli kengligidan foydalanish zarurati bo'lsa, ishlashning muhim afzalliklarini beradi. Stripingdan foydalanilganda maksimal fayl hajmi bitta maqsadning o'lchami bilan chegaralanmaydi. Fayl chizilgan OST soni bilan sig'imi va umumiy I / U tarmoqli kengligi shkalasi. Bundan tashqari, har bir ob'ektni blokirovkalash har bir OST uchun mustaqil ravishda boshqarilishi sababli, qo'shimcha chiziqlar qo'shilishi (har bir OST uchun bittasi) faylning kirish / chiqish blokirovkalash qobiliyatini mutanosib ravishda o'lchamoqda. Fayl tizimida yaratilgan har bir faylda chiziqlar soni (ushbu faylni tashkil etuvchi OST moslamalari soni), chiziqlar kattaligi (har biriga har bir OST-da saqlanadigan ma'lumotlar birligi) va OST tanlovi kabi turli xil tartib parametrlari ko'rsatilishi mumkin. ishlash va hajmni har bir fayl uchun maqbul ravishda sozlash mumkin. Ko'pgina dastur satrlari parallel ravishda alohida fayllarni o'qish yoki yozish paytida bitta faylga bitta chiziq to'g'ri keladi, chunki dastur o'zining parallelligini ta'minlaydi. Bitta katta faylni bir vaqtning o'zida o'qish yoki yozish uchun juda ko'p sonli ma'lumotlar mavjud bo'lganda, ushbu faylning ishlashi va hajmini maksimal darajada oshirish uchun har bir OST-da bitta chiziq bo'lishi maqbuldir.

Luster 2.10 versiyasida, ko'rsatish qobiliyati kompozitsion maketlar fayllar faylning turli mintaqalari uchun turli xil tartib parametrlariga ega bo'lishiga imkon berish uchun qo'shilgan. The Progressive File Layout (PFL) xususiyati faylning IO ishlashini yanada kengroq ish hajmida yaxshilash, shuningdek foydalanishni va boshqarishni soddalashtirish uchun kompozitsion maketlardan foydalanadi. Masalan, kichik PFL faylida kirishning pastligi uchun fleshkada bitta chiziq bo'lishi mumkin, kattaroq fayllarda yuqori tarmoqli kengligi va OST yukini yaxshi muvozanatlash uchun ko'plab chiziqlar bo'lishi mumkin. Kompozit sxemalar 2.11 versiyasida yanada yaxshilanadi Fayl darajasining ortiqcha bo'lishi (FLR) xususiyati, bu faylga fayl uchun bir-birining ustiga bir-birining ustiga o'ralgan tartiblarni kiritish imkonini beradi RAID 0 + 1 ushbu fayllar uchun ortiqcha, shuningdek o'qish ish faoliyatini yaxshilaydi. Luster 2.11 versiyasi ham qo'shdi Ma'lumotlar metama'lumotlari Ga imkon beradigan (DoM) xususiyati birinchi to'g'ridan-to'g'ri inode bilan MDT-da saqlanadigan PFL faylining tarkibiy qismi. Bu kichik hajmdagi fayllarga kirish uchun xarajatlarni qisqartiradi, ham bo'sh joydan foydalanish (OST ob'ekti kerak emas), ham tarmoqdan foydalanish (ma'lumotlarga kirish uchun kamroq RPC). DoM, agar MDT bo'lsa, kichik fayllar uchun ishlashni yaxshilaydi SSD OSTlar diskka asoslangan holda. Luster 2.13 da OST overstriping xususiyati bitta komponentga bitta OST-da bir nechta chiziqlarga ega bo'lishiga imkon beradi O'z-o'zini kengaytirish tartibi xususiyati yozish paytida komponent hajmi dinamik bo'lishiga imkon beradi, shunda u butun fayl tizimi bo'shashmasdan oldin bo'sh joy tugashi (flesh) bilan kurashishi mumkin.

Metadata ob'ektlari va DNE masofaviy yoki chiziqli kataloglar

Dastlab mijoz fayl tizimini o'rnatganda, unga o'rnatish nuqtasi uchun ildiz katalogining 128-bitli porlashi uchun fayl identifikatori (64-bitli ketma-ketlik raqami, 32-bitli ob'ekt identifikatori va 32-bitli versiya) dan iborat bo'lgan FID taqdim etiladi. Fayl nomini qidirishni amalga oshirayotganda, mijoz har bir yo'l nomining komponentasini qidirishni ota-katalog FID ketma-ketlik raqamini FID joylashuv ma'lumotlar bazasi (FLDB) orqali ma'lum bir MDT-ga xaritalash orqali amalga oshiradi va keyin ushbu MDT-ni ota-ona yordamida boshqaradigan MDS-ga qo'ng'iroq qiladi. FID va fayl nomi. MDS so'ralgan yo'l nomi komponenti uchun FID-ni a bilan birga qaytaradi DLM qulflash. Oxirgi ota-katalogning MDT-si aniqlangandan so'ng, boshqa katalog operatsiyalari (chiziqsiz kataloglar uchun) faqat MDT-larda tortishuvlarga yo'l qo'ymaslik uchun faqat shu MDT-da amalga oshiriladi. DNE chiziqli kataloglari uchun ota-katalogda saqlanadigan har bir katalog rejasi xash funktsiyasini va katalog tarqatiladigan MDT katalogi FID-lari ro'yxatini beradi. The Mantiqiy metadata hajmi Mijozdagi (LMV) fayl nomini zaxira qiladi va uni ma'lum bir MDT katalogiga qo'shadi parcha, bu faylda qo'shimcha operatsiyalarni xuddi shu tarzda chiziqsiz katalog bilan ishlaydi. Uchun readdir () operatsiyalari, har bir katalog shardidagi yozuvlar mahalliy MDT katalogining xash tartibida tartiblangan mijozga qaytariladi va mijoz fayl nomlarini xash tartibida qo'shish uchun birlashma tartibini amalga oshiradi, shunda bitta 64 bitli cookie-fayl yordamida katalog ichidagi joriy ofset.

Qulflash

Yorqinlik tarqatilgan blok menejeri (LDLM), da amalga oshirilgan OpenVMS uslubi, har bir fayl ma'lumotlari va metama'lumotlarining yaxlitligini himoya qiladi. Luster fayliga kirish va o'zgartirish to'liq kesh izchil barcha mijozlar orasida. Metadata qulflari MDT tomonidan boshqariladi inode manba nomi sifatida FID-dan foydalangan holda fayl uchun. Metadata qulflari faylni qidirishni himoya qiladigan alohida bitlarga bo'linadi (fayl egasi va guruhi, ruxsat va rejim va kirishni boshqarish ro'yxati (ACL)), inode holati (katalog hajmi, katalog tarkibi, havolalar soni, vaqt tamg'alari), maket (Luster 2.4 dan beri fayllar chizig'i) va kengaytirilgan atributlar (xattrs, Luster 2.5 dan beri). Mijoz bitta RPC so'rovi bilan bitta inode uchun bir nechta metadata blokirovka bitlarini olishi mumkin, ammo hozirda ularga faqat inode uchun o'qish blokirovkasi beriladi. MDS blokirovkaning oldini olish uchun inode-ning barcha modifikatsiyalarini boshqaradi resurs qarama-qarshiliklari va hozirda inodlarda yozishni blokirovka qiladigan yagona tugun.

Fayl ma'lumotlarini blokirovkalari bayt oralig'idan foydalangan holda faylning har bir ob'ekti chizilgan OST tomonidan boshqariladi darajada qulflar. Mijozlarga faylning bir qismi yoki bir qismi uchun bir vaqtning o'zida bir nechta o'qiydiganlarga ruxsat berish va / yoki faylning mustaqil hududlari uchun bir-birining ustiga yozish hajmini blokirovkalash huquqi berilishi mumkin. Bu ko'plab Luster mijozlariga o'qish va yozish uchun bitta faylga bir vaqtning o'zida kirish huquqini beradi, bu esa faylni kiritish-chiqarish paytida to'siqlardan qochadi. Amalda, chunki Linux mijozlari ma'lumotlar keshini birliklar ichida boshqaradilar sahifalar, the clients will request locks that are always an integer multiple of the page size (4096 bytes on most clients). When a client is requesting an extent lock the OST may grant a lock for a larger extent than originally requested, in order to reduce the number of lock requests that the client makes. The actual size of the granted lock depends on several factors, including the number of currently granted locks on that object, whether there are conflicting write locks for the requested lock extent, and the number of pending lock requests on that object. The granted lock is never smaller than the originally requested extent. OST extent locks use the Lustre FID of the object as the resource name for the lock. Since the number of extent lock servers scales with the number of OSTs in the filesystem, this also scales the aggregate locking performance of the filesystem, and of a single file if it is striped over multiple OSTs.

Tarmoq

The communication between the Lustre clients and servers is implemented using Lustre Networking (LNet), which was originally based on the Sandiya Portallar tarmoq dasturlash dastur dasturlash interfeysi. Disk storage is connected to the Lustre MDS and OSS server nodes using direct attached storage (SAS, FK, iSCSI ) or traditional saqlash maydoni tarmog'i (SAN) technologies, which is independent of the client-to-server network.

LNet can use many commonly used network types, such as InfiniBand and TCP (commonly Ethernet ) networks, and allows simultaneous availability across multiple network types with routing between them. Masofadan xotiraga to'g'ridan-to'g'ri kirish (RDMA) is used for data and metadata transfer between nodes when provided by the underlying networks, such as InfiniBand, RoCE, iWARP va Omni-Path, as well as proprietary high-speed networks such as Cray Aries and Gemini, and Atos BXI. High availability and recovery features enable transparent recovery in conjunction with failover servers.

Since Lustre 2.10 the LNet Multi-Rail (MR) feature[74]allows havolani birlashtirish of two or more network interfaces between a client and server to improve bandwidth. The LNet interface types do not need to be the same network type. In 2.12 Multi-Rail was enhanced to improve fault tolerance if multiple network interfaces are available between peers.

LNet provides end-to-end throughput over Gigabit chekilgan networks in excess of 100 MB/s,[75] throughput up to 11 GB/s using InfiniBand enhanced data rate (EDR) links, and throughput over 11 GB/s across 100 Gigabit Ethernet interfeyslar.[76]

Mavjudligi yuqori

Lustre file system high availability features include a robust failover and recovery mechanism, making server failures and reboots transparent. Version interoperability between successive minor versions of the Lustre software enables a server to be upgraded by taking it offline (or failing it over to a standby server), performing the upgrade, and restarting it, while all active jobs continue to run, experiencing a delay while the backup server takes over the storage.

Lustre MDSes are configured as an active/passive pair exporting a single MDT, or one or more active/active MDS pairs with DNE exporting two or more separate MDTs, while OSSes are typically deployed in an active/active configuration exporting separate OSTs to provide redundancy without extra system overhead. In single-MDT filesystems, the standby MDS for one filesystem is the MGS and/or monitoring node, or the active MDS for another file system, so no nodes are idle in the cluster.

HSM (Hierarchical Storage Management)

Lustre provides the capability to have multiple storage tiers within a single filesystem namespace. It allows traditional HSM functionality to copy (archive) files off the primary filesystem to a secondary archive storage tier. The archive tier is typically a tape-based system, that is often fronted by a disk cache. Once a file is archived, it can be released from the main filesystem, leaving only a stub that references the archive copy. If a released file is opened, the Coordinator blocks the open, sends a restore request to a copytool, and then completes the open once the copytool has completed restoring the file.

In addition to external storage tiering, it is possible to have multiple storage tiers within a single filesystem namespace. OSTs of different types (e.g. HDD and SSD) can be declared in named storage pools. The OST pools can be selected when specifying file layouts, and different pools can be used within a single PFL file layout. Files can be migrated between storage tiers either manually or under control of the Policy Engine. Since Lustre 2.11, it is also possible to mirror a file to different OST pools with a FLR file layout, for example to pre-stage files into flash for a computing job.

HSM includes some additional Lustre components to manage the interface between the primary filesystem and the archive:

  • Coordinator: receives archive and restore requests and dispatches them to agent nodes.
  • Agent: runs a copytool to copy data from primary storage to the archive and vice versa.
  • Copytool: handles data motion and metadata updates. There are different copytools to interface with different archive systems. A generic POSIX copytool is available for archives that provide a POSIX-like front-end interface. Copytools are also available for the Yuqori samarali saqlash tizimi[77] (HPSS), Tivoli Storage Manager[78] (TSM), Amazon S3[79]va Google Drive.[80]
  • Policy Engine: watches filesystem Changelogs for new files to archive, applies policies to release files based on age or space usage, and communicates with MDT and Coordinator. The Policy Engine can also trigger actions like migration between, purge, and removal. The most commonly used policy engine is RobinHood, but other policy engines can also be used.

HSM also defines new states for files including: [81]

  • Exist: Some copy, possibly incomplete exists in a HSM.
  • Archive: A full copy exists on the archive side of the HSM.
  • Dirty: The primary copy of the file has been modified and differs from the archived copy.
  • Released: A stub inode exists on an MDT, but the data objects have been removed and the only copy exists in the archive.
  • Lost: the archive copy of the file has been lost and cannot be restored
  • No Release: the file should not be released from the filesystem
  • No Archive: the file should not be archived

Deployments

Lustre is used by many of the TOP500 supercomputers and large multi-cluster sites. Six of the top 10 and more than 60 of the top 100 supercomputers use Lustre file systems. Bunga quyidagilar kiradi: K kompyuter da RIKEN Advanced Institute for Computational Science,[11] The Tyanxe-1A da Milliy superkompyuter markazi yilda Tyantszin, Xitoy, Yaguar va Titan da Oak Ridge milliy laboratoriyasi (ORNL), Blue Waters da Illinoys universiteti va Sequoia va Moviy gen /L at Lourens Livermor milliy laboratoriyasi (LLNL).

There are also large Lustre filesystems at the Milliy energetika tadqiqotlari ilmiy hisoblash markazi, Tinch okeanining shimoli-g'arbiy milliy laboratoriyasi, Texas Kengaytirilgan Hisoblash Markazi, Brazilian National Laboratory of Scientific Computing,[82] va NASA[83] in North America, in Asia at Tokyo Institute of Technology,[84] Evropada CEA,[85][86] va boshqalar.

Commercial technical support

Commercial technical support for Lustre is often bundled along with the computing system or storage hardware sold by the vendor. Some vendors includeDell,[87] Hewlett-Packard (as the HP StorageWorks Scalable File Share, circa 2004 through 2008),[88]Groupe Bull, Fujitsu.[89] Vendors selling storage hardware with bundled Lustre support include Hitachi Data Systems,[90] DataDirect tarmoqlari (DDN),[91] NetApp va boshqalar. It is also possible to get software-only support for Lustre file systems from some vendors, including Whamcloud.[92]

Amazon veb-xizmatlari offers Amazon FSx for Lustre[93], a fully managed service, making it easy to launch and run high-performance file systems cost effectively in the cloud.

Shuningdek qarang

Adabiyotlar

  1. ^ a b Corbet, Jonathon (December 17, 2003). "Lustre 1.0 released". Linux haftalik yangiliklari. LWN.net. Olingan 15 mart, 2015.
  2. ^ a b "Release 2.13.0". Lustre Wiki. OpenSFS. 2019 yil 5-dekabr. Olingan 5 dekabr, 2019.
  3. ^ "Lustre 2.12.5 released". Lustre.org. 2020 yil 8-iyun. Olingan 8 iyun, 2020.
  4. ^ Oracle Corporation / Intel Corporation (August 4, 2002). "Lustre* Software Release 2.x Operations Manual" (PDF). Foydalanish bo'yicha qo'llanma. Intel. Olingan 19 may, 2015.
  5. ^ "Lustre Home". Arxivlandi asl nusxasi 2001 yil 31 martda. Olingan 23 sentyabr, 2013.
  6. ^ "Lustre File System, Version 2.4 Released". Open Scalable File Systems. Olingan 2014-10-18.
  7. ^ "Open-source Lustre gets supercomputing nod". Olingan 2014-10-18.
  8. ^ "Xyratex Captures Oracle's Lustre". HPCWire. Olingan 2014-10-18.
  9. ^ "Post-K (Fugaku) Information". Fujitsu. Olingan 2020-06-23.
  10. ^ "Titan System Overview". Oak Ridge milliy laboratoriyasi. Arxivlandi asl nusxasi 2018-02-13 kunlari. Olingan 2013-09-19.
  11. ^ a b v Brian Behlendorf. "ZFS on Linux for Lustre" (PDF). Lourens Livermor milliy laboratoriyasi. Arxivlandi asl nusxasi (PDF) 2014-10-31 kunlari. Olingan 2020-06-23.
  12. ^ "Spider Center-Wide File System". Oak Ridge Leadership Computing Facility. Arxivlandi asl nusxasi 2016-03-04 da. Olingan 2012-02-02.
  13. ^ "Rock-Hard Lustre: Trends in Scalability and Quality" (PDF). Nathan Rutman, Xyratex. Olingan 2012-02-02.
  14. ^ Vang, Teng; Bina, Suren; Dong, Bin; Tang, Xoujun (sentyabr 2018). "UniviStor: HPC uchun o'rnatilgan ierarxik va tarqatilgan saqlash". Klasterli hisoblash bo'yicha IEEE 2018 xalqaro konferentsiyasi (klaster). IEEE. 134–144 betlar. doi:10.1109 / KLUSTER.2018.00025. ISBN  978-1-5386-8319-4. S2CID  53235423.
  15. ^ Lustre File System presentation, November 2007 kuni YouTube By Peter Braam, November 10, 2007
  16. ^ Vang, Teng; Bina, Suren; Lockwood, Glenn K.; Snyder, Shane; Karns, Filipp; Kim, Sunggon; Wright, Nicholas J. (May 2019). "A Zoom-in Analysis of I/O Logs to Detect Root Causes of I/O Performance Bottlenecks". 2019 19th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID). IEEE. 102–111 betlar. doi:10.1109/CCGRID.2019.00021. ISBN  978-1-7281-0912-1. S2CID  195832257.
  17. ^ "Comparative I/O workload characterization of two leadership class storage clusters" (PDF). ACM. Noyabr 2015.
  18. ^ Vang, Teng; Snyder, Shane; Lockwood, Glenn; Karns, Filipp; Wright, Nicholas; Byna, Suren (Dec 2018). "IOMiner: Large-Scale Analytics Framework for Gaining Knowledge from I/O Logs". Klasterli hisoblash bo'yicha IEEE 2018 xalqaro konferentsiyasi (klaster). IEEE. pp. 466–476. doi:10.1109/CLUSTER.2018.00062. ISBN  978-1-5386-8319-4. S2CID  53235850.
  19. ^ Saini, Subhash; Rappleye, Jason; Chang, Johnny; Barker, Devid; Mehrotra, Piyush; Biswas, Rupak (Dec 2012). "I/O performance characterization of Lustre and NASA applications on Pleiades". 2012 19th International Conference on High Performance Computing. IEEE. 1-10 betlar. doi:10.1109/HiPC.2012.6507507. ISBN  978-1-4673-2371-0. S2CID  14323627.
  20. ^ "Kompaniya". old web site. Cluster File Systems, Inc. Archived from the original on August 12, 2007.CS1 maint: BOT: original-url holati noma'lum (havola)
  21. ^ Peter J. Braam (August 4, 2002). "Lustre, The Inter-Galactic File System" (PDF). Taqdimot slaydlari. Lourens Livermor milliy laboratoriyasi. Olingan 23 sentyabr, 2013.
  22. ^ R. Kent Koeninger (June 2003). "The Ultra-Scalable HPTC Lustre Filesystem" (PDF). Slides for presentation at Cluster World 2003. Olingan 23 sentyabr, 2013.
  23. ^ Britta Wülfing (September 13, 2007). "Sun Assimilates Lustre Filesystem". Linux jurnali. Olingan 23 sentyabr, 2013.
  24. ^ "Quyosh mikrosistemalari yuqori mahsuldorlik bo'yicha hisobot portfelini klasterli fayl tizimlarini, shu jumladan klasterli fayl tizimlarini sotib olishga aniq kelishuv bilan kengaytiradi". Matbuot xabari. Quyosh mikrosistemalari. September 12, 2007. Archived from asl nusxasi 2007 yil 2 oktyabrda. Olingan 23 sentyabr, 2013.
  25. ^ "Oracle has Kicked Lustre to the Curb". HPC ichida. 2011-01-10.
  26. ^ J. Leidel (August 20, 2010). "Whamcloud aims to make sure Lustre has a future in HPC". HPC ichida. Olingan 23 sentyabr, 2013.
  27. ^ a b "Xyratex Advances Lustre® Initiative, Assumes Ownership of Related Assets". Matbuot xabari. Xyratex. 2013 yil 19 fevral. Arxivlangan asl nusxasi 2016 yil 7 sentyabrda. Olingan 18 sentyabr, 2013.
  28. ^ Rich Brueckner (November 9, 2010). "Bojanic & Braam Getting Lustre Band Back Together at Xyratex". HPC ichida. Olingan 23 sentyabr, 2013.
  29. ^ Rich Brueckner (January 4, 2011). "Whamcloud Staffs up for Brighter Lustre". HPC ichida. Olingan 18 sentyabr, 2013.
  30. ^ "Whamcloud Signs Multi-Year Lustre Development Contract With OpenSFS". Matbuot xabari. HPC Wire. 2011 yil 16-avgust. Arxivlangan asl nusxasi 2013 yil 25-yanvarda. Olingan 23 sentyabr, 2013.
  31. ^ Galen Shipman (November 18, 2011). "OpenSFS Update" (PDF). Slides for Supercomputing 2011 presentation. Open Scalable File Systems. Olingan 23 sentyabr, 2013.
  32. ^ Whamcloud (November 15, 2011). "OpenSFS and Whamcloud Sign Lustre Community Tree Development Agreement". Matbuot xabari. Olingan 23 sentyabr, 2013.
  33. ^ Joab Jackson (2012-07-16). "Intel Purchases Lustre Purveyor Whamcloud". Kompyuter dunyosi.
  34. ^ Timothy Prickett Morgan (2012-07-16). "Intel gobbles Lustre file system expert Whamcloud". Ro'yxatdan o'tish.
  35. ^ Timothy Prickett Morgan (2012-07-11). "DOE doles out cash to AMD, Whamcloud for exascale research". Ro'yxatdan o'tish.
  36. ^ Nicole Hemsoth (June 12, 2013). "Intel Carves Mainstream Highway for Lustre". HPC Wire. Olingan 23 sentyabr, 2013.
  37. ^ Brueckner, Rich. "With New RFP, OpenSFS to Invest in Critical Open Source Technologies for HPC". ichidaHPC. Olingan 1 oktyabr 2013.
  38. ^ "Seagate Donates Lustre.org Back to the User Community". Olingan 9 sentyabr 2014.
  39. ^ Daniel Robinson (June 27, 2018). "DDN Breathes New Life Into Lustre File System".
  40. ^ "Lustre Trademark Released to User Community". InsideHPC. November 24, 2019. Olingan 5 dekabr, 2019.
  41. ^ "Lustre Helps Power Third Fastest Supercomputer". DSStar. Arxivlandi asl nusxasi 2013-02-03 da.
  42. ^ "MCR Linux Cluster Xeon 2.4 GHz – Quadrics". Top500.Org.
  43. ^ Peter Bojanic (June 15, 2008). "Lustre Roadmap and Future Plans" (PDF). Presentation to Sun HPC Consortium. Quyosh mikrosistemalari. Olingan 23 sentyabr, 2013.
  44. ^ "OpenSFS Announces Collaborative Effort to Support Lustre 2.1 Community Distribution". Open Scalable File Systems. 2011 yil 8 fevral. Arxivlangan asl nusxasi 2011 yil 23 mayda. Olingan 13 dekabr, 2016.
  45. ^ "Lustre 2.1 Released". Olingan 2012-02-02.
  46. ^ "Lustre 2.2 Released". Yahoo! Moliya. Olingan 2012-05-08.
  47. ^ "A Novel Network Request Scheduler for a Large Scale Storage System" (PDF). Lustre Wiki. OpenSFS. 2009 yil iyun.
  48. ^ "A Novel Network Request Scheduler for a Large Scale Storage System". Lustre Wiki. OpenSFS. 2009 yil iyun.
  49. ^ Priket Morgan, Timoti. "OpenSFS Announces Availability of Lustre 2.5". EnterpriseTech.
  50. ^ Brueckner, Rich. "Video: New Lustre 2.5 Release Offers HSM Capabilities". Katta ma'lumotlar ichida. Olingan 11 dekabr 2013.
  51. ^ Hemsoth, Nicole. "Lustre Gets Business Class Upgrade with HSM". HPCwire. Arxivlandi asl nusxasi 2013 yil 17-dekabrda. Olingan 11 dekabr 2013.
  52. ^ "Lustre 2.5". Ilmiy hisoblash dunyosi. Olingan 11 dekabr 2013.
  53. ^ Jones, Peter (September 9, 2014). "Lustre 2.5.3 released". HPDD-discuss mailing list archive. Olingan 21 oktyabr, 2014.Morrone, Chris (Dec 7, 2015). "Retired Release Terminology". Lustre Wiki. Olingan 18 yanvar, 2016.
  54. ^ "Lustre 2.6.0 released". HPDD-discuss mailing list archive. July 30, 2014. Olingan 21 oktyabr, 2014.
  55. ^ Ihara, Shuichi (2014-10-14). "Lustre QoS Based on NRS Policy of Token Bucket Filter" (PDF).
  56. ^ Uselton, Andrew. "Demonstrating the Improvement in the Performance of a Single Lustre Client from Version 1.8 to Version 2.6" (PDF). Olingan 2014-10-18.
  57. ^ Jones, Peter (March 13, 2015). "Lustre 2.7.0 released". HPDD-discuss mailing list archive. Olingan 15 mart, 2015.
  58. ^ Jones, Peter (March 16, 2016). "Lustre 2.8.0 released". Lustre-announce mailing list archive. OpenSFS. Olingan 28 mart, 2016.
  59. ^ "Lustre 2.9.0 Changelog". Lustre Wiki. OpenSFS. 2016 yil 7-dekabr. Olingan 8 dekabr, 2016.
  60. ^ "Lustre 2.10.0 Changelog". Lustre Wiki. OpenSFS. 2017 yil 13-iyul. Olingan 3 oktyabr, 2017.
  61. ^ "Release 2.11.0". Lustre Wiki. OpenSFS. 2018 yil 3-aprel. Olingan 4-aprel, 2018.
  62. ^ "Release 2.12.0". Lustre Wiki. OpenSFS. 2018 yil 21-dekabr. Olingan 11 fevral, 2019.
  63. ^ Li Xi, DDN (June 2018). "Lazy Size on MDS" (PDF). Lustre Wiki. Olingan 5 dekabr, 2019.
  64. ^ Shuichi Ihara, DDN (June 2018). "T10PI End-to-End Data Integrity Protection for Lustre" (PDF). Lustre Wiki. Olingan 5 dekabr, 2019.
  65. ^ Li Xi, Whamcloud (June 2018). "Lustre Persistent Client Cache" (PDF). Lustre Wiki. Olingan 5 dekabr, 2019.
  66. ^ Patrick Farrell, Whamcloud (April 2019). "Overstriping: Extracting Maximum Shared File Performance" (PDF). Lustre Wiki. Olingan 5 dekabr, 2019.
  67. ^ Patrick Farrell, Cray (March 15, 2019). "Spillover Space: Self-Extending Layouts HLD" (PDF). Olingan 5 dekabr, 2019.
  68. ^ "Lustre 2.13.0 Changelog". Lustre Wiki. 2019 yil 5-dekabr.
  69. ^ "Lustre to run on ZFS". Hukumat kompyuter yangiliklari. 2008-10-26.
  70. ^ "ZFS on Lustre". 2011-05-10. Arxivlandi asl nusxasi 2011-12-05 kunlari. Olingan 2011-11-25.
  71. ^ "DataDirect Selected As Storage Tech Powering BlueGene/L". HPC Wire. 2004 yil 15 oktyabr. Arxivlangan asl nusxasi on June 14, 2013. Olingan 9 may, 2012.
  72. ^ Suzanne M. Kelly (2006). "Catamount Software Architecture with Dual Core Extensions" (PDF). Olingan 2016-02-16.
  73. ^ "Linux Kernel 4.18rc1 release notes".
  74. ^ Shehata, Amir. "Multi-Rail LNet for Lustre" (PDF). Lustre User Group, April 2016.
  75. ^ Lafoucrière, Jacques-Charles. "Lustre Experience at CEA/DIF" (PDF). HEPiX Forum, April 2007. Archived from asl nusxasi (PDF) on 2012-02-08.
  76. ^ Caldwell, Blane (March 9, 2016). "Lustre Networking Technologies: Ethernet vs. Infiniband" (PDF). OLCF Lustre Center of Excellence. Olingan 6 dekabr, 2019.
  77. ^ Aurélien Degrémont (September 17, 2013). "LUSTRE/HSM BINDING IS THERE!" (PDF).
  78. ^ Thomas Stibor (September 20, 2016). "TSM Copytool for Lustre HSM" (PDF).
  79. ^ Robert Read (March 24, 2015). "Lustre HSM in the Cloud" (PDF).
  80. ^ Stéphane Thiell. "Lustre/HSM Google Drive copytool".
  81. ^ Aurélien Degrémont; Thomas Leibovici (April 16, 2009). "Lustre HSM Project—Lustre User Advanced Seminars" (PDF). Arxivlandi (PDF) asl nusxasidan 2010 yil 25 mayda. Olingan 5 may, 2018.
  82. ^ "LNCC – Laboratório Nacional de Computação Científica". Lncc.br. Olingan 2015-05-27.
  83. ^ "Pleiades Supercomputer". www.nas.nasa.gov. 2008-08-18.
  84. ^ "TOP500 List – November 2006". TOP500.Org.
  85. ^ "TOP500 List – June 2006". TOP500.Org.
  86. ^ "French Atomic Energy Group Expands HPC File System to 11 Petabytes". HPCwire.com. 2012-06-15. Arxivlandi asl nusxasi 2012-02-04 da. Olingan 2012-06-15.
  87. ^ "Dell HPC Solutions". 2015-04-14.
  88. ^ "HP StorageWorks Scalable File Share". Hewlett-Packard. Arxivlandi asl nusxasi 2008 yil 12-iyun kuni. Olingan 13 dekabr, 2016.
  89. ^ "Fujitsu Releases World's Highest-Performance File System – FEFS scalable file system software for advanced x86 HPC cluster systems". 2015-06-13.
  90. ^ "High Throughput Storage Solutions with Lustre". 2015-04-14.
  91. ^ "Exascaler: Massively Scalable, High Performance, Lustre File System Appliance". 2015-04-14.
  92. ^ "Lustre Support". 2018-11-27.
  93. ^ "Amazon FSx for Lustre". 2019-06-11.

Tashqi havolalar

Information wikis

Community foundations

Hardware/software vendors

  1. ^ Qora, Dag. "Cray Moves to Acquire the Seagate ClusterStor Line". HPCWire. HPCWire. Olingan 2017-12-01.