Avstraliya veb-arxivi - Australian Web Archive

The Avstraliya veb-arxivi (AWA) ommaga ochiq onlayn ma'lumotlar bazasi arxivlangan Avstraliya veb-saytlari Avstraliya milliy kutubxonasi (NLA) uning ustiga Trove platforma, onlayn kutubxona ma'lumotlar bazasini yig'uvchi. U NLA-ni o'z ichiga oladi PANDORA arxivi, Avstraliya hukumatining veb-arxivi (AGWA) va Avstraliya milliy kutubxonasi ".au" domen to'plamlar. Kirish Trove-da bitta interfeys orqali amalga oshiriladi, bu hammaga ochiq.[1][2][3] Avstraliya veb-arxivi 2019 yil mart oyida yaratilgan,[4] va bu eng kattalaridan biri veb-arxivlar dunyoda.[5] Uning maqsadi tarixchilar va tadqiqotchilar uchun hozir va kelajak uchun manba berishdir.[5]

Uch komponentning tarixi

PANDORA xizmati 1996 yil oktyabr oyida veb-saytlarni arxivlashni boshladi.[6]

2005 yilda NLA butun Avstraliya veb-domenining yillik suratlarini arxivlashni boshladi (URL manzillari bilan qo'shimchasi. ".au"[4]),[7] katta orqali to'plangan emaklab yig'ib olish.[8] Keyinchalik .au veb-domenidagi 1996 yildagi dastlabki veb-saytlar Internet arxivi. 2019 yilda ushbu tarkib birinchi bo'lib Trove orqali ommaga ochiq qilindi.[9]

Kichik hajmdagi tanlab olish uchun yaxshi ishlaydigan PANDORA infratuzilmasi veb-tarkibni "ommaviy yig'ish" ga mos kelmaydi, shuning uchun yangi texnik tizim yaratilishi kerak edi, bu orqali arxivlangan veb-saytlarni etkazib berishni birlashtiradigan veb-arxiv xizmati kerak edi. arxivlangan veb-saytlarni foydalanuvchiga muammosiz etkazib beradigan jonli veb-sayt interfeysi ichida, bu texnik jihatdan erishish qiyin.[10]

AGWA

Avstraliya hukumati veb-saytlar Hamdo'stlik yozuvlari hisoblanadi va shuning uchun ularga muvofiq boshqariladigan nashrlardir Arxivlar to'g'risidagi qonun 1983 yil.[11]

Avstraliya hukumatining veb-arxivi (AGWA) ommaviy arxivlashdan iborat Hamdo'stlik hukumati veb-saytlar. 2011 yil iyun oyida NLA veb-saytlarni muntazam ravishda yig'ib olishni boshladi,[12] 2010 yil may oyida tuzilgan ma'muriy kelishuv bilan muhim to'siq bartaraf etilgandan so'ng, NLA har bir veb-sayt yoki hujjat uchun oldindan ruxsat so'ramasdan, avvalgi holatlarda bo'lgani kabi, hukumat veb-saytlarini to'plash, saqlash va ularga kirish imkoniyatini yaratishga imkon beradi. Xizmatda Heritrix yig'ish uchun veb-brauzer, WARC fayllari saqlash uchun va xizmatni etkazib berish uchun Open Wayback. Hukumat tomonidan nashr etilishi juda katta, ammo tarkibni saqlab qolish uchun juda ko'p muammolarni hal qilish, masalan, uning to'satdan yo'q bo'lib ketishi. 2014 yil mart oyida AGWA jamoatchilikka ochiq qilindi.[10]

AGWA veb-saytlarni "milliy arxiv sifatida saqlang" (RNK) materiallari sifatida saqlash va saqlash talablariga javob beradi. Arxivlar to'g'risidagi qonun; ammo videolar va hujjat fayllari (masalan PDF-fayllar yoki Word hujjatlari ) har doim ham qo'lga olinmaydi, shuning uchun ularni alohida boshqarish kerak.[11]

2015 yil boshidan boshlab AGWA tarkibiga tarkib 2005 yildan boshlab 144 million faylni tashkil etdi va 15 ta faylni egalladi terabayt. U faqat Hamdo'stlik hukumati veb-saytlarini o'z ichiga olgan bo'lib, ular 1000 ga yaqin urug 'URL-larining ommaviy yig'im-terimi orqali yig'iladi. O'rim-yig'imlarni jadvali hali belgilangan emas, ammo hozirda yig'im-terim yiliga taxminan uch marta o'tkazilmoqda.[10]

Amalgamatsiya

2017 yilda AGWA va PANDORA arxivlari boshqa veb-arxiv to'plamlari bilan birlashtirilib, Trove veb-arxiv to'plamini shakllantirishdi.[9] Keyinchalik rivojlangan va Avstraliya veb-arxivi yaratilgandan so'ng, AGWA orqali arxivlangan va hozirda AWA tarkibiga kiritilgan davlat veb-saytlarini "Kengaytirilgan qidirish" opsiyasi yordamida alohida-alohida qidirish mumkin.[9]

AWA tavsifi

Veb-arxiv NLA tomonidan "veb-saytlarga kirish vaqtida olingan va keyin statik nusxada saqlanadigan veb-saytlarning suratlari to'plami" sifatida tavsiflanadi. AWA-da arxivlangan to'plam "Avstraliya va avstraliyaliklarning madaniy, ijtimoiy, siyosiy, tadqiqot va tijorat hayoti va faoliyatiga tegishli". U tanlangan veb-saytlarni va nashrlarni hamda ba'zilarini rejalashtirilgan arxivlash orqali veb-materiallarni to'playdi maxsus muhim voqealarga tegishli hosil.[9]

2019 yil mart oyidan boshlab, u boshlanganda, AWA allaqachon 600 atrofida bo'lgan terabayt ma'lumotlar, 9 milliard yozuvlar bilan.[5][13] Unga qaraganda ko'proq funktsiyalar mavjud Orqaga qaytish mashinasi, mezbonlik qilgan Internet arxivi, ruxsat berish to'liq matnli qidirish yordamida qidiruv tizimi uyda qurilgan. Ishlab chiquvchilar, shuningdek, kiruvchi "shovqin" ni filtrlash texnikasini ishlab chiqdilar. Ma'lumotlar kutubxona serverlarida qoladi, ammo bulut kelajakda, tarkib o'sib borishi bilan ko'zda tutilgan.[5] Rivojlanish jarayonida foydalanuvchilarning keng doirasi uchun qulaylik, xususan qidirish funksiyalari asosiy e'tiborni tortdi.[9]

Arxivni ishlab chiquvchilar tomonidan qo'llaniladigan texnikalar kombinatsiyasi asosida to'liq qidirish mumkin. Har bir jamoa o'ziga xos va kompleksni yaratdi qidirish algoritmi versiyasini moslashtirish orqali Google Sahifalarni tartiblashtirish algoritmi (sahifadagi sekin urish chastotasi), yaxshiroq va yuqori sifatli manbalarga olib kelishi uchun o'zgartirilgan. Boshqa texnologiyalarga quyidagilar kiradi Bayes filtri (samarali a spam-filtr ), a Ish uchun xavfsiz emas dan tasniflagich Yahoo va mashinada o'rganish.[14]

Qidirishdan oldin "gov.au veb-domeniga cheklov" opsiyasi mavjud,[15] va AGWA orqali arxivlangan hukumat veb-saytlarini "Kengaytirilgan qidirish" opsiyasi yordamida alohida-alohida qidirish mumkin.[9] Kengaytirilgan qidiruvning boshqa variantlari oniy tasvirlar, domen va fayl turlarini vaqt oralig'ida cheklashdir.[16]

1990-yillardagi ko'plab avvalgi veb-saytlar, asosan, veb-platformalarning tez-tez o'zgarib turishi sababli, yo'qolganligi sababli, Avstraliya veb-arxivi hozirgi va kelajakdagi veb-sahifalarni, ayniqsa avstraliyalik tarkibni saqlashga yordam beradigan muhim tashabbusdir.[4] Arxivga materiallar qo'shilishi davom etadi va shunga muvofiq to'plangan boshqa onlayn materiallar Milliy kutubxona to'g'risidagi qonun 1960 yil, qonuniy depozit qoidalari Mualliflik huquqi to'g'risidagi qonun 1968 yil va NLA raqamli to'plamlarni tanlash siyosati.[9]

Osiyo / Tinch okeani veb-saytlari

Veb-saytlari Osiyo Tinch okeani mintaqasi AWA-ga kiritilmagan, ammo NLA-ning sheriklari Internet arxivi "muayyan hodisalar yoki ijtimoiy-siyosiy guruhlar bilan bog'liq bo'lgan tanlangan Osiyo / Tinch okeani veb-saytlarini" to'plash va saqlash.[17]

Shuningdek qarang

Adabiyotlar

  1. ^ "Avstraliyaning tarmoqli DO hujjatli manbalarini saqlash va ulardan foydalanish". Pandora arxivi. Olingan 30 aprel 2020.
  2. ^ "Arxivlangan veb-saytlar". Avstraliya milliy kutubxonasi. 23 mart 2020 yil. Olingan 30 aprel 2020.
  3. ^ Koerbin, Pol (2015 yil 11-fevral). "Avstraliya hukumatining veb-arxivi". Avstraliya milliy kutubxonasi. Olingan 30 aprel 2020.
  4. ^ a b v Bruns, Axel (2019 yil 14 mart). "Avstraliya veb-arxivi bu juda katta yutuq, ammo bu erdan ishlar qiyinlashadi". Suhbat. Olingan 30 aprel 2020.
  5. ^ a b v d Nott, Jorj (11 mart 2019). "Milliy kutubxona Avstraliya Internetining" ulkan "arxivini ishga tushirdi". Computerworld. Olingan 6 may 2020.
  6. ^ "Tarix va yutuqlar". PANDORA. 2009 yil 18-fevral. Olingan 6 may 2020.
  7. ^ McKenzie, Amelia (2019 yil 12 mart). "Avstraliyaning veb-tarixini saqlab qolish: Avstraliya veb-arxivining boshlanishi". Avstraliya milliy kutubxonasi. Olingan 6 may 2020.
  8. ^ "Arxivlangan veb-saytlar (1996 - hozir)". Trove. Olingan 6 may 2020.
  9. ^ a b v d e f g "Avstraliya veb-arxivi to'g'risida". Yordam markazini qidirib toping. Olingan 8 may 2020.
  10. ^ a b v Koerbin, Pol (2015 yil 11-fevral). "Avstraliya hukumatining veb-arxivi: hukumatning onlayn hujjatli merosini yig'ish katta miqyosga ega". Avstraliya milliy kutubxonasi. Olingan 6 may 2020.
  11. ^ a b "Avstraliya hukumati veb-saytlarini arxivlash". Avstraliya milliy arxivi. Olingan 8 may 2020.
  12. ^ "Arxivlangan veb-saytlar". Avstraliya milliy kutubxonasi. 7 dekabr 2018 yil. Olingan 6 may 2020.
  13. ^ Izoh: AWA yordam sahifasida 400 tb, 8 milliard yozuv bor
  14. ^ "Avstraliyaning veb-arxivini tekshiring". Janubiy telefon. 11-aprel, 2019-yil. Olingan 8 may 2020.
  15. ^ "Avstraliya veb-arxivi". Trove. Olingan 8 may 2020.
  16. ^ "Avstraliya veb-arxivi - kengaytirilgan qidiruv". Trove. Olingan 8 may 2020.
  17. ^ "Arxivlangan veb-saytlar". Avstraliya milliy kutubxonasi. 23 mart 2020 yil. Olingan 8 may 2020.

Tashqi havolalar