Izchil tezlashtiruvchi protsessor interfeysi - Coherent Accelerator Processor Interface

Izchil tezlashtiruvchi protsessor interfeysi
Yaratilgan yil2014; 6 yil oldin (2014)
Tomonidan yaratilgan
O'chiradi
Veb-saytochiq eshiklar.org

Izchil tezlashtiruvchi protsessor interfeysi (CAPI), bu yuqori tezlikda ishlaydigan protsessorni kengaytirish shinasi standarti, dastlab tepada qatlamlanishi uchun mo'ljallangan PCI Express, to'g'ridan-to'g'ri ulanish uchun CPU kabi tashqi tezlatgichlarga Grafik protsessorlar, ASIC, FPGA yoki tezkor saqlash.[1][2] Turli xil qurilmalar o'rtasida past kechikish, yuqori tezlik, xotiraga bevosita ulanish imkoniyati mavjud ko'rsatmalar to'plami arxitekturalari.

CAPI bo'yicha batafsil ma'lumot va hujjatlarni bu erda topishingiz mumkin OpenCAPI konsortsiumi veb-sayt va OpenPOWER uchun IBM portali.

Tarix

An'anaga bog'liq bo'lgan ishlash ko'lamini kengaytirish Mur qonuni - 1965 yildan beri boshlangan - ikkalasi ham Intel singari 2004 yilga kelib siqila boshladi Preskott arxitektura va IBM Uyali protsessor 4 gigagertsli ish chastotasi tomon surildi. Bu erda har ikkala loyiha ham termal miqyosdagi devorga duch keldi va shu bilan ishchi chastotani yanada ko'payishi bilan bog'liq issiqlik chiqarish muammolari, aylanishlarning qisqarish vaqtidagi yutuqlardan ancha ustun keldi.

Keyingi o'n yil ichida bir nechta tijorat protsessor mahsuloti 4 gigagertsdan oshdi, natijada ishlashning aksariyat yaxshilanishi asta-sekin takomillashtirilgan mikroarxitekturalar, tizimlarning yaxshilanishi va yuqori hisoblash zichligi hisobiga amalga oshiriladi - bu asosan mustaqil yadrolarning ko'p sonli to'plami shaklida o'sha o'ladi, ko'pincha xarajatlar eng yuqori ish chastotasi (Intelning 24 yadroli Xeon E7-8890 2016 yil iyun oyidan boshlab ishchi chastotasi atigi 2,2 gigagertsni tashkil etadi, shuning uchun bitta soketli 165 Vt quvvat sarfi va sovutish byudjeti chegaralarida ishlaydi).

Ishlashda katta yutuqlarga erishilganda, bu ko'pincha tobora ixtisoslashgan hisoblash birliklari bilan bog'liq edi, masalan, protsessor o'limiga qo'shilgan GPU birliklari yoki tashqi GPU yoki FPGA asosidagi tezlatgichlar. Ko'pgina dasturlarda tezlatgichlar o'zaro bog'lanishning ishlash chegaralari bilan (tarmoqli kengligi va kechikish) yoki o'zaro bog'lanishning arxitekturasi (masalan, xotira izchilligi yo'qligi) tufayli cheklovlar bilan kurashadi. Ayniqsa, ma'lumotlar markazida o'zaro aloqani yaxshilash heterojen me'morchilikka o'tishda muhim ahamiyat kasb etdi, bunda qo'shimcha qurilmalar aniq hisoblash yuklariga moslashtiriladi.

CAPI kompyuterlarga ixtisoslashgan tezlatkichlarni osonroq va samarali biriktirish uchun mo'ljallangan. Xotirani intensiv va hisoblash kabi intensiv ishlaydi matritsani ko'paytirish chuqur uchun asab tarmoqlari CAPI tomonidan qo'llab-quvvatlanadigan platformalarga yuklash mumkin.[3] Uni ishlatish uchun IBM tomonidan ishlab chiqilgan Quvvat8 2014 yilda bozorga chiqqan asoslangan tizimlar. Shu bilan birga, IBM va boshqa bir qancha kompaniyalar asos solgan OpenPOWER Foundation atrofida ekotizim yaratish Quvvat asoslangan texnologiyalar, shu jumladan CAPI. 2016 yil oktyabr oyida bir nechta OpenPOWER sheriklari OpenCAPI konsortsiumi GPU va protsessor dizaynerlari bilan birgalikda AMD va tizim dizaynerlari Dell EMC va Hewlett Packard Enterprise texnologiyani OpenPOWER va IBM doirasidan tashqarida tarqatish.[4]

Amalga oshirish

CAPI

CAPI protsessor ichidagi funktsional birlik sifatida amalga oshiriladi, unga muvofiq tezlatgichda Power Service Layer (PSL) deb nomlangan mos keluvchi izchil tezlashtiruvchi protsessor proksi (CAPP) deyiladi. CAPP va PSL birliklari kesh katalogi kabi ishlaydi, shu sababli biriktirilgan qurilma va protsessor bir xil izchil xotira maydonini baham ko'rishlari mumkin va akselerator akselerator funktsiyalari bo'linmasiga (AFU) aylanadi, protsessorga o'rnatilgan boshqa funktsional birliklarga tengdosh.[5][6]

CPU va AFU bir xil xotira maydoniga ega bo'lganligi sababli, past kechikish va yuqori tezlikka erishish mumkin, chunki protsessor protsessorning asosiy xotirasi va tezlatgichning xotira bo'shliqlari o'rtasida xotira tarjimalarini va xotirani aralashtirishni amalga oshirishi shart emas. Ilova tezlatgichdan maxsus qurilma drayverlarisiz foydalanishi mumkin, chunki hammasi xost operatsion tizimidagi umumiy CAPI yadrosi kengaytmasi bilan ta'minlanadi. CPU va PSL dastur talabiga binoan bir-birlarining xotiralari va registrlariga to'g'ridan-to'g'ri o'qishlari va yozishlari mumkin.

CAPI

CAPI yuqori qatlamli PCIe Gen 3, 16 PCIe qatoridan foydalangan holda va CAPI yoqilgan tizimlarda PCIe uyalari uchun qo'shimcha funktsiya. Odatda bunday mashinalarda CAPI yoqilgan PCIe slotlari mavjud. Har bir POWER8 protsessoriga bitta CAPP bo'lganligi sababli, mumkin bo'lgan CAPI birliklari soni, qancha PCIe uyasi bo'lishidan qat'i nazar, POWER8 protsessorlari soniga qarab belgilanadi. Muayyan POWER8 tizimlarida IBM ikkita chipli modullardan foydalanadi va shu bilan protsessor soketiga CAPI hajmini ikki baravar oshiradi.

PCIe qurilmasi va protsessor o'rtasidagi an'anaviy operatsiyalar 20000 operatsiyani bajarishi mumkin, CAPI-ga ulangan qurilma esa atigi 500 atrofida ishlaydi, kechikishni sezilarli darajada kamaytiradi va qo'shimcha xarajatlar kamayishi sababli o'tkazuvchanlikni samarali oshiradi.[6]

CAPI portining umumiy o'tkazuvchanligi asosiy PCIe 3.0 x16 texnologiyasi bilan aniqlanadi, taxminan 16 GB / s tezlikda, ikki tomonlama.[7]

CAPI 2

CAPI-2 - bu IBM POWER9 protsessori bilan kiritilgan texnologiyaning bosqichma-bosqich rivojlanishi.[7] U PCIe Gen 4-ning yuqori qismida ishlaydi, bu esa ishlashni 32 Gb / s gacha samarali ravishda ikki baravar oshiradi. Shuningdek, DMA va Atomics-ni tezlatgichdan qo'llab-quvvatlash kabi ba'zi yangi xususiyatlar mavjud.

OpenCAPI

OpenCAPI texnologiyasi OpenCAPI konsortsiumi, 2016 yil oktyabr oyida tashkil etilgan AMD, Google, IBM, Mellanoks va Mikron sheriklar bilan birgalikda Nvidia, Hewlett Packard Enterprise, Dell EMC va Xilinx.[8]

OpenCAPI 3

OpenCAPI, ilgari Yangi CAPI yoki CAPI 3.0, PCIe ustiga qatlamlanmagan va shuning uchun PCIe uyalaridan foydalanilmaydi. IBM protsessorida KUCH 9 u ishlatadi Bluelink 25G U bilan baham ko'radigan I / O moslamasi NVLink 2.0, eng yuqori darajasi 50 GB / s.[9] OpenCAPI-ga tezlatgichda PSL birligi kerak emas (CAPI 1 va 2 uchun talab qilinadi), chunki u PCIe-ning yuqori qismida emas, balki o'zining tranzaksiya protokolidan foydalanadi.[10]

OpenCAPI 4

POWER9-ning umumiy mavjudligidan keyin kelajakdagi chip uchun rejalashtirilgan.[11]

Ketma-ket biriktirilgan xotira

Mikrochip texnologiyasi SMC 1000 OpenCapi xotirasi "bozorda ketma-ket biriktirilgan xotirani qabul qiladigan navbatdagi taraqqiyot" sifatida tavsiflanadi.[12]

Shuningdek qarang

Adabiyotlar

  1. ^ Agam Shoh (2014 yil 17-dekabr). "IBMning yangi Power8 kompaniyasi Watson chipining ish faoliyatini ikki baravar oshirdi". Kompyuter dunyosi. Olingan 17 dekabr 2014.
  2. ^ "IBM Power8 protsessori batafsil - 12 yadroli, 96 MB eDRAM L3 keshli va 4 gigagertsli soat tezligi bilan 22nm dizayni bilan ajralib turadi". WCCFtech. Olingan 17 dekabr 2014.
  3. ^ MD Syadus Sefat, Semih Aslan, Jeffri V Kellington, Apan Qasem (2019-10-03). "CAPI asosidagi FPGA-da chuqur neyron tarmoqlarda HotSpotlarni tezlashtirish". IEEE.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  4. ^ OpenCAPI ochildi: AMD, IBM, Google, Xilinx, Micron va Mellanox heterojen hisoblash davrida kuchlarni birlashtirdi
  5. ^ POWER8 tizimlari uchun izchil tezlashtiruvchi protsessor interfeysi (CAPI) - Oq qog'oz
  6. ^ a b Katta ma'lumotlar va bulut uchun qayta sozlanadigan tezlatgichlar - RAW 2016
  7. ^ a b Izchil tezlashtirish uchun server avtobusini ochish
  8. ^ Texnik rahbarlar katta ma'lumotlar, kompyuterda o'rganish, tahlil va boshqa paydo bo'layotgan ish yuklari uchun yangi bulutli ma'lumotlar markazining server dizaynini yoqish uchun birlashmoqdalar.
  9. ^ Katta ko'k Power9 bilan osmonga intiladi
  10. ^ OpenCAPI PCIe-ni oladi, 10X yaxshilanishiga va'da beradi
  11. ^ Stuecheli, Jeff (2017 yil 26-yanvar). "Veb-seminar POWER9" (Videoyozuv / slaydlar). AIX Virtual foydalanuvchilar guruhi. - Slaydlar (PDF) - AIX VUG sahifasi slaydlar va videolarga havolalarga ega
  12. ^ Patrik Kennedi (2019 yil 5-avgust), Microchip SMC 1000 ketma-ket biriktirilgan xotira kelajagi uchun, Servethehome

Tashqi havolalar