Darvin asosiy arxivi - Darwin Core Archive

Darvin asosiy arxivi (DwC-A) a bioxilma-xillik informatika dan foydalanadigan ma'lumotlar standarti Darvin Core turlarning paydo bo'lishi, nazorat ro'yxati, namuna olish hodisasi yoki ma'lumotlarning namunaviy ma'lumotlari uchun yagona, mustaqil ma'lumotlar to'plamini yaratish shartlari. Aslida bu sizning fayllaringiz qanday tartiblanganligini boshqalarga xabar berish uchun oddiy tavsiflovchi (meta.xml) bo'lgan matnli (CSV) fayllar to'plami. Format Darvin asosiy matn qo'llanmasida aniqlangan.[1] Ma'lumotlarni nashr qilish uchun afzal qilingan format GBIF tarmoq.

Darvin Core

Darvin yadrosi standarti[2] GBIF tarmog'idagi namunalar va kuzatuv yozuvlarining aksariyatini safarbar qilish uchun ishlatilgan.[3] The Darvin Core standart dastlab zamonaviy biologik namunalar, ularning makon-vaqtinchalik paydo bo'lishi va ularning tasdiqlovchi dalillari (fizikaviy yoki raqamli) haqida ma'lumotni topish, qidirish va birlashtirishga yordam berish uchun ishlab chiqilgan.

Darvin yadrosi bugungi kunda ko'lami jihatidan kengroq. Bu biologik xilma-xillik to'g'risida ma'lumot almashish uchun barqaror, standart ma'lumotnomani taqdim etishga qaratilgan. Darvin yadrosi atamalarning lug'ati sifatida har xil kontekstda maksimal darajada qayta foydalanish maqsadiga ega bo'lgan barqaror semantik ta'riflarni beradi. Bu shuni anglatadiki, Darvin yadrosi hanuzgacha tarixda ishlatilgan usulda ishlatilishi mumkin, lekin ayni paytda umumiy terminlar to'plami orqali o'zaro muvofiqlikni ta'minlab, yanada murakkab almashinuv formatlarini yaratish uchun asos bo'lib xizmat qilishi mumkin.

Arxiv formati

Arxivning asosiy g'oyasi shundaki, uning ma'lumotlar fayllari mantiqiy ravishda yulduzcha shaklda joylashtirilgan bo'lib, bitta asosiy ma'lumotlar fayli har qanday "kengaytmalar" bilan o'ralgan. Har bir kengaytma yozuvi (yoki "kengaytma fayli qatori") asosiy fayldagi yozuvga ishora qiladi; Shunday qilib, har bir yadroli yozuv uchun noldan ko'pgacha kengaytirilgan yozuvlar mavjud bo'lishi mumkin, aks holda ko'plab bo'sh kataklarni o'z ichiga olishi mumkin bo'lgan barcha ma'lumotlarni bitta jadvalga qo'shishning o'rniga, ma'lumotlarni uzatish uchun juda samarali usul.

Tavsiya etilgan kengaytmalar haqida batafsil ma'lumotni ularning tegishli bo'limlarida topish mumkin va barcha mavjud kengaytmalarni kataloglashtiradigan GBIF registrida keng hujjatlashtiriladi.

DiGIR va TAPIR kabi sahifali veb-xizmatlardan foydalanish o'rniga butun ma'lumotlar to'plamlarini almashish ma'lumotlar uzatishning sodda va samarali bo'lishiga imkon beradi. Masalan, TAPIR orqali 260 ming yozuvni olish taxminan to'qqiz soat davom etadi va 500 MB XML formatidagi ma'lumotlarni uzatish uchun 1300 http so'rov yuboradi. DwC-A bilan kodlangan va ziplangan xuddi shu ma'lumotlar to'plami 3 MB hajmdagi faylga aylanadi. Shuning uchun GBIF DwC-A yaratishda ZIP yoki GZIP yordamida arxivni siqishni juda tavsiya qiladi.

Arxiv asosiy yozuvlar uchun barqaror identifikatorlarni talab qiladi, ammo kengaytmalar uchun emas. Umumiy ma'lumotlarning har qanday turi uchun mahalliy yozuv identifikatorlariga ega bo'lish zarur. Vaqt o'tishi bilan barqaror bo'lgan va yozuv o'chirilgandan keyin qayta ishlatilmaydigan identifikatorlarni asl ma'lumotlari bilan saqlash yaxshi amaliyotdir. Agar iloji bo'lsa, iltimos, mahalliy emas, balki global identifikatorlarni taqdim eting.

Arxiv identifikatori

Tugatish uchun.


Ma'lumotlar to'plami metama'lumotlari

Darvinning asosiy arxivida butun ma'lumotlar to'plamini tavsiflovchi metadata bo'lgan fayl bo'lishi kerak. The Ekologik metadata tili (EML) bu eng keng tarqalgan format, ammo oddiy Dublin Core fayllaridan ham foydalanilmoqda.

Adabiyotlar

  1. ^ Darvin uchun asosiy qo'llanma
  2. ^ Wieczorek, Jon; D. Bloom; R. Guralnik; S. Blum; M. Döring; R. De Jovanni; T. Robertson; D. Vieglais (2012). "Darvin yadrosi: Jamiyat tomonidan ishlab chiqilgan biologik xilma-xillik to'g'risidagi ma'lumotlar standarti". PLOS ONE. 7 (1): e29715. Bibcode:2012PLoSO ... 729715W. doi:10.1371 / journal.pone.0029715. PMC  3253084. PMID  22238640.
  3. ^ Darvin asosiy arxivlari - Qanday qo'llanma

Tashqi havolalar