Hujayra mikroprotsessorlari - Cell microprocessor implementations

Birinchi reklama Uyali mikroprotsessor, Cell BE, Sony PlayStation 3 uchun ishlab chiqilgan. IBM PowerXCell 8i-ni ishlatish uchun mo'ljallangan Roadrunner superkompyuteri.[1]

Amalga oshirish

90 nm CMOS-da birinchi marta chiqarilgan hujayra

IBM ushbu jarayonda Cellning ikki xil versiyasiga oid ma'lumotlarni e'lon qildi, bu erta muhandislik namunasi DD1va yaxshilangan versiyasi belgilangan DD2 ishlab chiqarish uchun mo'ljallangan.

90 nm jarayonda ma'lum bo'lgan hujayra variantlari
BelgilashDie maydoniBirinchi marta oshkor qilindiKuchaytirish
DD1221 mm2ISSCC 2005
DD2235 mm2Cool Chips 2005 yil aprelKengaytirilgan PPE yadrosi

DD2-ning asosiy yaxshilanishi "ko'proq SIMD / vektor ijro etuvchi resurslarini o'z ichiga olganligi" haqida xabar berilgan katta PPE yadrosini joylashtirish uchun matritsani biroz uzaytirishi edi.[1].IBM tomonidan e'lon qilingan ba'zi dastlabki ma'lumotlar DD1 variantiga murojaat qiladi. Natijada, hujayraning imkoniyatlari haqidagi dastlabki dastlabki jurnalistik ma'lumotlar endi ishlab chiqarish uskunalaridan farq qiladi.

Hujayra floorplan

Doktor Piter Xofsti tomonidan berilgan STI prezentatsiyasiga qo'shilgan Powerpoint materialiga DD2 Cell (o'ldirilgan) hujayralari o'limining funktsional birlik chegaralari bilan tushirilgan fotosurati kiradi va ular nomi bilan yozilgan bo'lib, ular silikon maydonining funktsiya birligi bo'yicha buzilishini ochib beradi:


Hujayra funktsiyalari birliklari va izi
Hujayra funktsiyasi birligiMaydon (%)Tavsif
XDR interfeysi5.7Rambus tizim xotirasiga interfeys
xotira tekshiruvi4.4Tashqi xotira va L2 keshini boshqaradi
512 KiB L2 kesh10.3PPE uchun kesh xotirasi
PPE yadrosi11.1PowerPC protsessori
sinov2.0Belirtilmemiş "mantiqiy sinov va dekodlash"
EIB3.1Elementni o'zaro bog'laydigan avtobusni bog'laydigan protsessorlar
SPE (har biri) × 86.2Sinergetik qayta ishlash elementi
Kirish-chiqarish boshqaruvchisi6.6Tashqi kiritish-chiqarish mantig'i
Rambus FlexIO5.7I / U pinlari uchun tashqi signalizatsiya

SPE floorplan

Ichki SPE dasturiga oid qo'shimcha tafsilotlar, shu jumladan IBM muhandislari tomonidan oshkor qilingan Piter Xofsti, IBMning sinergetik ishlov berish elementining bosh me'mori, ilmiy IEEE nashrida.[2]

Ushbu hujjat 90 nmda bajarilgan 2,54 × 5,81 mm SPE fotosuratini o'z ichiga oladi SHUNDAY QILIB MEN. Ushbu texnologiyada SPE 21 million tranzistorni o'z ichiga oladi, ularning 14 millioni massivlarda joylashgan (bu atama, ehtimol registr fayllari va mahalliy do'konni belgilaydi), 7 million tranzistor esa mantiqan to'g'ri keladi. Ushbu fotosurat funktsional birlik chegaralari bilan chizilgan bo'lib, ular nomi bilan yozilgan bo'lib, bu silikon maydonining funktsiya birligi bo'yicha buzilishini ko'rsatadi:

SPU funktsiyalari va izlari
SPU funktsiyasi birligiMaydon (%)TavsifQuvur
bitta aniqlik10.0bitta aniqlikdagi FP ijro etuvchi birligihatto
ikki tomonlama aniqlik4.4ikki marta aniqlikdagi FP ijro etish birligihatto
oddiy sobit3.25sobit nuqtani bajarish birligihatto
muammolarni nazorat qilish2.5ijro etuvchi birliklarni oziqlantiradi
oldinga so'l3.75ijro etuvchi birliklarni oziqlantiradi
GPR6.25umumiy maqsadli ro'yxatga olish fayli
permute3.25permute ijro birligig'alati
filial2.5filial ijro birligig'alati
kanal6.75kanal interfeysi (uchta alohida blok)g'alati
LS0-LS330.0mahalliy do'konlarning to'rtta 64 KiB bloklarig'alati
MMU4.75xotirani boshqarish bo'limi
DMA7.5to'g'ridan-to'g'ri xotiraga kirish birligi
BIU9.0avtobus interfeysi birligi
RTB2.5qator o'rnatilgan blok (ABIST)
ATO1.6atomik DMA yangilanishlari uchun atom birligi
HB0.5tushunarsiz

Dispetcherlik quvurlarini tushunish samarali kod yozish uchun muhimdir. SPU arxitekturasida belgilangan dispetcherlik quvurlari yordamida har bir soat tsiklida ikkita ko'rsatma yuborilishi (boshlanishi) mumkin hatto va g'alati. Yuqoridagi jadvalda ko'rsatilgandek, ikkita quvur turli xil ijro etuvchi birliklarni taqdim etadi. IBM buni qismlarga ajratganligi sababli, arifmetik ko'rsatmalarning aksariyati hatto xotira ko'rsatmalarining aksariyati g'alati quvur. Permute birligi xotira ko'rsatmalari bilan chambarchas bog'liq, chunki u xotirada joylashgan ma'lumotlar tuzilmalarini SPU eng samarali ravishda hisoblab chiqadigan SIMD formatidagi bir nechta operand formatiga to'plash va ochish uchun xizmat qiladi.

Turli xil ijro etuvchi quvurlarni ta'minlaydigan boshqa protsessor dizaynlaridan farqli o'laroq, har bir SPU yo'riqnomasi faqat bitta quvurda yuborilishi mumkin. Raqobatlashayotgan dizaynlarda bir nechta quvurlar juda keng tarqalgan ko'rsatmalar bilan ishlashga mo'ljallangan bo'lishi mumkin qo'shish, muvozanatsiz ish oqimlari samaradorligini oshirishga xizmat qilishi mumkin bo'lgan ushbu ko'rsatmalarning ikkitasini yoki bir nechtasini bir vaqtning o'zida bajarishga ruxsat berish. Spartalik dizayn falsafasiga muvofiq, SPU uchun ijro etilish birliklari ko'p ta'minlanmaydi.

Quvurlarni cheklaydigan ikkita dizayndagi cheklovlarni tushunish dasturchi eng kam abstraktsiya darajasida samarali SPU kodini yozish uchun tushunishi kerak bo'lgan asosiy tushunchalardan biridir. Abstraktsiyaning yuqori darajalarida ishlaydigan dasturchilar uchun yaxshi kompilyator iloji boricha avtomatik ravishda quvur liniyasi tengligini muvozanatlashtiradi.

SPE kuchi va ishlashi

IBM tomonidan og'ir transformatsiya va yoritish ish yuki ostida sinov o'tkazilgandek [o'rtacha IPC 1,4], bitta SPU protsessori uchun ushbu dasturning ishlashi quyidagicha malakaga ega:

Tezlikning haroratga bog'liqligi
Kuchlanish (V)Chastotani (gigagerts)Quvvat (V)Temper. (° C)
0.92.0125
0.93.0227
1.03.8331
1.14.0438
1.24.4747
1.35.01163

0,9 V da 2,0 gigagertsli ishlash uchun kirish kam quvvatli konfiguratsiyani anglatadi. Boshqa yozuvlar har bir kuchlanish kuchayishi bilan erishilgan eng yuqori barqaror ish chastotasini ko'rsatadi. CMOS zanjirlarida umumiy qoida sifatida, quvvat tarqalishi V ga nisbatan qo'pol munosabatda ko'tariladi2F, kuchlanish chastotasi ish chastotasidan kattaroq.

IBM mualliflari tomonidan taqdim etilgan quvvat o'lchovlari aniqlikka ega bo'lmasa-da, ular umumiy tendentsiyani yaxshi anglaydilar. Ushbu raqamlar ushbu qism sinov laboratoriyasi sharoitida 5 gigagertsdan yuqori tezlikda ishlashga qodirligini ko'rsatadi, garchi standart tijorat konfiguratsiyasi uchun juda issiq bo'lsa. Savdoga qo'yilgan birinchi Hujayra protsessorlari IBM tomonidan 3,2 gigagertsli tezlikda ishlaydi, bu ish tezligi bu erda 30 daraja qulay bo'lgan joyda SPU o'lishi harorati ko'rsatilgan.

Shuni esda tutingki, bitta SPU Cell protsessorining o'lish maydonining 6% ni tashkil qiladi. Yuqoridagi jadvalda keltirilgan quvvat ko'rsatkichlari umumiy quvvat byudjetining ozgina qismini tashkil etadi.

IBM energiya iste'molini yaxshilash uchun 90 nm tugundan past bo'lgan kelajakdagi texnologiyada Cell dasturini amalga oshirish niyatida ekanligini e'lon qildi. Quvvat sarfini kamaytirish mumkin potentsial mavjud bo'lgan mahsulotlarning issiqlik cheklovlarini oshirmasdan mavjud dizaynni 5 gigagerts yoki undan yuqori darajaga ko'tarishga imkon bering.

Hujayra 65 nm

Hujayraning birinchi kichrayishi 65 nm tugunda bo'lgan. 65 nmgacha qisqartirish mavjud 230 mm ga qisqardi2 90 nm jarayonga asoslangan holda o'ling, hozirgi o'lchamining taxminan 120 mm gacha2, shuningdek IBM ishlab chiqarish xarajatlarini sezilarli darajada kamaytiradi.

2007 yil 12 martda IBM o'zining East Fishkill fabrikasida 65 nm Hujayralar ishlab chiqarishni boshlaganligini e'lon qildi. U erda ishlab chiqarilgan chiplar, ehtimol, faqat IBM kompaniyalariga tegishli bo'lgan Cell uchun mo'ljallangan pichoq birinchi bo'lib 65 nm hujayralarni olgan serverlar. Sony 2007 yil noyabr oyida PS3 ning uchinchi avlodini taqdim etdi, bu PS2 bilan mos kelmaydigan 40 Gb model edi tasdiqlangan 65 nm hujayradan foydalanish uchun. Kichraytirilgan Cell tufayli quvvat sarfi 200 dan kamaydi V dan 135 gacha V

Avvaliga faqat 65 nm-Hujayralar 6 gigagertsgacha ishlaydigan va 1,3 da ishlaydiganligi ma'lum bo'lgan V yadro kuchlanishi, kabi namoyish etildi ustida ISSCC 2007. Bu chipga nazariy eng yuqori ko'rsatkichni 384 ga etkazgan bo'lar edi FP8 chorak aniqligida GFLOPS (48 FP64 dual aniqlikdagi GFLOP), 204.8 ga sezilarli yaxshilanish GFLOPS cho'qqisi (25.6 90 nm 3,2 gigagertsli uyali 8 ta faol SPU bilan ta'minlaydigan GFLOPs FP64 ikkilamchi aniqligi). Bundan tashqari, IBM yangi energiya tejaydigan xususiyatlar va SRAM massivi uchun er-xotin quvvat manbaini joriy qilganligini e'lon qildi. Ushbu versiya hali ko'pdan beri mish-mishlar tarqalmagan "Cell +" emas, balki yaxshilangan suzuvchi nuqta ko'rsatkichi bilan yaxshilandi, bu birinchi marta 2008 yil o'rtalarida Roadrunner superkompyuteri shaklida QS22 PowerXCell pichoqlari. Garchi IBM ilgari yuqori soatlik Hujayralar haqida gapirgan va hattoki ularni namoyish etgan bo'lsa ham, soat tezligi, hattoki Roadrunner-ning "Cell +" ikkilamchi aniqligi uchun ham 3,2 gigagerts chastotasida doimiy bo'lib qoldi. Soat tezligini doimiy ravishda saqlagan holda, IBM energiya sarfini kamaytirishni tanladi. PowerXCell hatto eng yaxshi IBMlarni ham klaster qiladi Moviy gen klasterlar (371 MFLOPS / vatt), ular an'anaviy protsessorlardan tashkil topgan klasterlarga qaraganda ancha tejamkor (265) MFLOPS / vatt va undan past).

CMOS-da kelgusi nashrlar

45 nm istiqbollari

ISSCC 2008 da, IBM e'lon qilindi 45 nm tugundagi hujayra. IBM bir xil soat tezligida 65 nm kuchga ega bo'lganidan 40 foiz kam quvvat talab qilishi va o'lim maydoni 34 foizga qisqarishini aytdi. 45 nm Hujayra kamroq sovutishni talab qiladi va arzonroq ishlab chiqarishga imkon beradi, shuningdek, juda kichikroq sovutgich yordamida. Dastlab ommaviy ishlab chiqarish 2008 yil oxirida boshlanishi kerak edi, ammo ko'chib o'tdi 2009 yil boshi.

45 nm dan ortiq istiqbollar

Sony, IBM va Toshiba e'lon qilindi 2006 yil yanvar oyida 32 nm kichik hujayra ustida ishlashni boshlash, lekin fablardagi jarayonlar qisqarishi odatda individual chip miqyosida emas, balki global miqyosda sodir bo'lganligi sababli, bu shunchaki Cellni 32 nm ga olib chiqish majburiyati edi.

Adabiyotlar

  1. ^ Kevin J. Barker, Key Devis, Adolfi Xuzi, Darren J. Kerbison, Mayk Lang, Skott Pakin, Xose Sancho."Petaflop davriga kirish: Roadrunner me'morchiligi va faoliyati".