Hujayra (mikroprotsessor) - Cell (microprocessor)

Hujayra a ko'p yadroli mikroprotsessor umumiy maqsadni birlashtirgan mikro arxitektura PowerPC yadro soddalashtirilgan holda kamtarona ishlash qayta ishlash elementlar[1] bu juda tezlashadi multimedia va vektorli ishlov berish dasturlar, shuningdek, boshqa ko'plab maxsus hisoblash turlari.[1]

U tomonidan ishlab chiqilgan Sony, Toshiba va IBM, "STI" nomi bilan tanilgan ittifoq. Arxitektura dizayni va birinchi tatbiq etilishi STI Dizayn markazida amalga oshirildi Ostin, Texas 2001 yil martidan boshlangan to'rt yillik davr mobaynida Sony tomonidan byudjet hisobiga yaqinlashmoqda AQSH$ 400 million.[2] Hujayra stenografiya Uyali keng polosali dvigatel arxitekturasi, odatda qisqartirilgan CBEA to'liq yoki Hujayra BE qisman

Cell-ning birinchi yirik tijorat dasturi Sony-da bo'lgan PlayStation 3 o'yin konsoli, 2006 yilda chiqarilgan. 2008 yil may oyida Cell-based IBM Roadrunner superkompyuter birinchi bo'ldi TOP500 LINPACK 1.0 petaflops tizimi barqaror.[3][4] Merkuriy kompyuter tizimlari Hujayra asosida dizaynlarni ham ishlab chiqdi.

Hujayra arxitekturasi a ni o'z ichiga oladi xotira izchilligi energiya samaradorligini ta'kidlaydigan arxitektura, ustuvor ahamiyatga ega tarmoqli kengligi juda past kechikish va hisoblashning eng yuqori darajasiga ega ishlab chiqarish soddaligi ustidan dastur kodi. Shu sabablarga ko'ra Hujayra juda qiyin muhit sifatida qaraladi dasturiy ta'minotni ishlab chiqish.[5] IBM kompaniyasi a Linux - ishlab chiquvchilarga Cell chiplari dasturini ishlab chiqishda yordam beradigan ishlab chiqilgan platforma.[6]

Tarix

Anakartdagi PS3-da paydo bo'lganidek, BE hujayrasi
Piter Xofsti, Uyali mikroprotsessorning bosh me'morlaridan biri

2000 yil o'rtalarida, Sony Computer Entertainment, Toshiba korporatsiyasi va IBM protsessorni loyihalashtirish va ishlab chiqarish uchun "STI" deb nomlanuvchi ittifoq tuzdi.[7]

STI Dizayn Markazi 2001 yil mart oyida ochilgan.[8] Hujayra to'rt yil davomida ishlab chiqilgan bo'lib, ular uchun mo'ljallangan dizayn vositalarining takomillashtirilgan versiyalaridan foydalanilgan Quvvat4 protsessor. Uchta kompaniyaning 400 dan ortiq muhandislari Ostinda birga ishladilar va IBMning o'n bir dizayn markazlari tomonidan qo'llab-quvvatlandi.[8] Ushbu davrda IBM ko'plarni topshirdi patentlar hujayra arxitekturasi, ishlab chiqarish jarayoni va dasturiy ta'minot muhitiga tegishli. Keng polosali dvigatelning dastlabki patent versiyasi to'rtta "ishlov berish elementlari" ni o'z ichiga olgan chip to'plami bo'lib chiqdi, bu hozirgi kunda patent nomi bilan mashhur bo'lgan patentning tavsifi edi. Quvvatni qayta ishlash elementi (PPE). Har bir ishlov berish elementida 8 ta bo'lishi kerak "Sinergik ishlov berish elementlari" (SPElar ) chipda. Ushbu chip to'plami 4 gigagertsli soat tezligida va 32 ta 32 ta SPE bilan ishlashi kerak edigigaFLOPS har birida (FP8 chorak aniqligi), keng polosali dvigatel nazariyada 1 ta teraFLOPS xom hisoblash quvvatiga ega bo'lishi kerak edi.

4 ta PPE va 32 ta SPE bilan dizayn hech qachon amalga oshirilmadi. Buning o'rniga Sony va IBM faqat bitta PPE va 8 ta SPE bilan dizayn ishlab chiqardi. Ushbu kichik dizayn, Cell Broadband Engine yoki Cell / BE a yordamida ishlab chiqarilgan 90 nm SHUNDAY QILIB MEN jarayon.[9]

2007 yil mart oyida IBM e'lon qildi 65 nm Cell / BE versiyasi o'z zavodida (o'sha paytda, hozirda GlobalFoundries) ishlab chiqarilmoqda East Fishkill, Nyu-York.[9][10]

Bandai Namco Entertainment ular uchun Cell / BE protsessoridan foydalangan 357 Arkada taxtasi, shuningdek keyingi 369.

2008 yil fevral oyida IBM kompaniyasi bilan uyali protsessorlarni ishlab chiqarishni boshlashini e'lon qildi 45 nm jarayon.[11]

2008 yil may oyida IBM Cell protsessorining yuqori mahsuldor ikki aniqlikdagi suzuvchi nuqta versiyasini taqdim etdi PowerXCell 8i,[12] 65 nm xususiyat o'lchamida.

2008 yil may oyida an Opteron - va PowerXCell 8i-ga asoslangan superkompyuter, IBM Roadrunner tizimi, bitta petaFLOPS-ga erishgan dunyodagi birinchi tizimga aylandi va 2009 yil uchinchi choragiga qadar dunyodagi eng tezkor kompyuter bo'ldi. Dunyoda eng tejamli uchta superkompyuter Yashil 500 ro'yxati, xuddi shunday PowerXCell 8i-ga asoslangan.

45 nm uyali protsessor Sony bilan birgalikda taqdim etildi PlayStation 3 Slim 2009 yil avgustda.[13]

2009 yil noyabr oyiga qadar IBM 32 ta APUli hujayra protsessorini ishlab chiqarishni to'xtatdi[14][15] ammo boshqa Cell mahsulotlarini ishlab chiqarishda davom etmoqda.[16]

Tijoratlashtirish

2005 yil 17-mayda Sony Computer Entertainment keyinchalik kelgusida etkazib beriladigan Cell protsessorining ba'zi xususiyatlarini tasdiqladi. PlayStation 3 konsol.[17][18][19] Ushbu Hujayra konfiguratsiyasi yadrosida bitta PPE mavjud, silikonda sakkizta jismoniy SPE mavjud.[19] PlayStation 3-da, bitta SPE sinov jarayonida blokirovka qilinadi, bu ishlab chiqarish samaradorligini oshirishga yordam beradi, ikkinchisi esa OS uchun ajratilgan bo'lib, 6 bepul SPE-ni o'yin kodi ishlatishi mumkin.[20] Kirish paytida maqsadli soat chastotasi - 3.2Gigagertsli.[18] Kirish dizayni 90 nm SOI jarayoni yordamida ishlab chiqarilgan bo'lib, dastlabki ishlab chiqarish hajmi IBM korxonasi uchun mo'ljallangan East Fishkill, Nyu-York.[9]

O'rtasidagi munosabatlar yadrolari va iplar chalkashlikning umumiy manbai hisoblanadi. PPE yadrosi ikkita tishli va dasturiy ta'minotda ikkita mustaqil ijro etilishi, har bir faol SPE esa bitta ish zarrachasi sifatida namoyon bo'ladi. Sony tomonidan tavsiflangan PlayStation 3 konfiguratsiyasida Cell protsessori to'qqiz mustaqil ijro etilishini ta'minlaydi.

2005 yil 28 iyunda IBM va Merkuriy kompyuter tizimlari uchun uyali kompyuter tizimlarini yaratish bo'yicha hamkorlik shartnomasini e'lon qildi ko'milgan kabi ilovalar tibbiy tasvir, sanoat nazorati, aerokosmik va mudofaa, seysmik qayta ishlash va telekommunikatsiya.[21] O'shandan beri Merkuriy chiqarildi pichoqlar, an'anaviy rack serverlari va PCI Express hujayra protsessorlari bilan tezlatuvchi platalar.[21]

2006 yilning kuzida IBM QS20 ni chiqardi pichoq moduli ba'zi dasturlarda ulkan ishlash uchun er-xotin Cell BE protsessorlaridan foydalanib, modul uchun FP8 chorak aniqligida 410 gigaFLOPS cho'qqisiga erishdi. The QS22 uchun PowerXCell 8i protsessori ishlatilgan IBM Roadrunner superkompyuter. Mercury va IBM sakkizta faol SPE bilan to'liq ishlatilgan Cell protsessoridan foydalanadi. 2008 yil 8 aprelda Fixstars korporatsiyasi a PCI Express PowerXCell 8i protsessoriga asoslangan tezlatgich platasi.[22]

Sony-ning yuqori mahsuldor media-server ZEGO 3,2 gigagertsli Cell / B.E protsessoridan foydalanadi.

Umumiy nuqtai

The Uyali keng polosali dvigatel, yoki Hujayra odatdagidek ma'lum bo'lganidek, odatdagi ish stoli protsessorlarining gibridi sifatida mo'ljallangan mikroprotsessor (masalan, Athlon 64 va Asosiy 2 kabi yuqori malakali protsessorlar, masalan NVIDIA va ATI grafik protsessorlar (Grafik protsessorlar ). Uzunroq nom uning maqsadli ishlatilishini, ya'ni hozirgi va kelajakdagi tarkibiy qism sifatida ko'rsatib beradi onlayn tarqatish tizimlar; shuning uchun u yuqori aniqlikdagi displeylarda va yozuv uskunalarida ishlatilishi mumkin, shuningdek HDTV tizimlar. Bundan tashqari, protsessor mos kelishi mumkin raqamli tasvirlash tizimlar (tibbiy, ilmiy, va boshqalar.) va jismoniy simulyatsiya (masalan., ilmiy va qurilish muhandisligi modellashtirish).

Oddiy tahlilda Hujayra protsessorini to'rt komponentga bo'lish mumkin: tashqi kirish va chiqish tuzilmalari, asosiy protsessor Quvvatni qayta ishlash elementi (PPE) (ikki tomonlama bir vaqtning o'zida ko'p qirrali PowerPC 2.02 yadro),[23] deb nomlangan sakkizta to'liq ishlaydigan qo'shma protsessorlar Sinergik ishlov berish elementlari, yoki SPE va ixtisoslashgan yuqori tarmoqli kengligi dairesel ma'lumotlar avtobusi PPE, kirish / chiqish elementlari va SPE-ni birlashtiruvchi Element Interconnect Bus yoki EIB.

Matematik jihatdan intensiv vazifalarni bajarish uchun zarur bo'lgan yuqori ko'rsatkichlarga erishish uchun, masalan, dekodlash / kodlash MPEG oqimlar, uch o'lchovli ma'lumotlarni yaratish yoki o'zgartirish yoki o'z zimmasiga olish Furye tahlili Ma'lumotlarga ko'ra, uyali protsessor EIB orqali SPE va PPE-ga to'liq kirish huquqini berish uchun uylanadi kesh izchil DMA (xotiraga bevosita kirish), ham asosiy xotiraga, ham boshqa tashqi ma'lumotlarni saqlashga. EIB-dan maksimal darajada foydalanish, hisoblash va ma'lumotlarni uzatish bilan to'qnashish uchun to'qqizta ishlov berish elementlarining har biri (PPE va SPE) jihozlangan DMA dvigateli. SPE-ning yuklash / saqlash bo'yicha ko'rsatmalar faqat o'z mahalliy dasturiga kirishi mumkinligi sababli skretchli xotira, har bir SPE to'liq DMA-larga asosiy xotiraga va boshqa SPE-larning mahalliy xotiralariga ma'lumotlarni uzatish uchun bog'liqdir. DMA operatsiyasi 16KB gacha bo'lgan bitta blok maydonini yoki 2 dan 2048 gacha bo'lgan bloklarning ro'yxatini o'tkazishi mumkin. Cell arxitekturasidagi asosiy loyihalashtirish qarorlaridan biri bu chip ichidagi ma'lumotlarni qayta ishlashda maksimal darajadagi asenkroniya va bir vaqtda ishlashni ta'minlash maqsadida DMA-lardan ma'lumotlar uzatishning markaziy vositasi sifatida foydalanishdir.[24]

An'anaviy operatsion tizimni boshqarishga qodir bo'lgan PPE SPE-ni boshqaradi va SPE-da ishlaydigan jarayonlarni boshlashi, to'xtatishi, to'xtatishi va rejalashtirishi mumkin. Shu maqsadda, PPE-da SPE-ni boshqarish bilan bog'liq qo'shimcha ko'rsatmalar mavjud. SPE-lardan farqli o'laroq, PPE standart yuklash / saqlash bo'yicha ko'rsatmalar orqali asosiy xotirani va SPE-larning mahalliy xotiralarini o'qishi va yozishi mumkin. Bunga qaramay Turing tugadi Arxitektura, SPElar to'liq avtonom emas va ular foydali ishlarni amalga oshirishdan oldin PPE-dan ularni asrashni talab qiladi. Tizimning "ot kuchi" ning aksariyati sinergetik qayta ishlash elementlaridan kelib chiqqanligi sababli DMA ma'lumotlar uzatish usuli sifatida va har bir SPE-ning cheklangan mahalliy xotirasi izlari ushbu CPU kuchidan maksimal darajada foydalanishni xohlaydigan dasturiy ta'minot ishlab chiqaruvchilariga katta qiyinchilik tug'diradi va ushbu protsessordan maksimal darajada ishlashni talab qiladi.

PPE va avtobus arxitekturasi turli darajadagi ish rejimlarini o'z ichiga oladi xotirani himoya qilish, xotira maydonlarini SPE yoki PPE-da ishlaydigan maxsus jarayonlar bilan kirishdan himoya qilishga imkon beradi.

Ham PPE, ham SPE RISC belgilangan kenglikdagi 32-bitli ko'rsatma formatidagi arxitekturalar. PPE 64-bitni o'z ichiga oladi umumiy maqsadlar uchun registr to'plam (GPR), 64 bitli suzuvchi nuqta registrlar to'plami (FPR) va 128 bit Altivec registrlar to'plami. SPE faqat 128-bitli registrlarni o'z ichiga oladi. Ular 8-bitdan 64-bitgacha bo'lgan o'lchamdagi ma'lumotlarning skaler turlari uchun ishlatilishi mumkin SIMD turli xil butun va suzuvchi nuqta formatlaridagi hisoblashlar. Ham PPE, ham SPE uchun tizim xotirasi manzillari 2 ta nazariy manzillar diapazoni uchun 64 bitli qiymatlar bilan ifodalanadi64 bayt (16 eksabayt yoki 16 777 216 terabayt). Amaliyotda ushbu bitlarning barchasi ham apparatda bajarilmaydi. SPU (Synergistic Processor Unit) protsessorining ichki do'kon manzillari 32 bitli so'z sifatida ifodalanadi. Hujayra bilan bog'liq hujjatlarda so'z har doim 32 bitni, ikkilangan so'z 64 bitni va to'rt so'z 128 bitni bildiradi.

PowerXCell 8i

2008 yilda IBM Cellning qayta ko'rib chiqilgan variantini e'lon qildi PowerXCell 8i,[25] QS22 da mavjud Blade serverlari IBM kompaniyasidan. PowerXCell a-da ishlab chiqarilgan 65 nm 32 Gbaytgacha bo'lgan DDR2 xotirasini qo'llab-quvvatlaydi va SPE-larda suzuvchi nuqta ko'rsatkichlarini ikki baravar yuqori ko'rsatkichini taxminan 12,8 darajadan yaxshilaydi.GFLOPS jami sakkizta SPE uchun 102,4 GFLOPS gacha, bu tasodifan eng yuqori ko'rsatkichga teng NEC SX-9 vektorli protsessor bir vaqtning o'zida chiqarildi. The IBM Roadrunner 2008-2009 yillarda dunyodagi eng tezkor superkompyuter, 12240 ta PowerXCell 8i protsessorlari va 6562 ta AMD Opteron protsessorlar.[26] PowerXCell 8i bilan ishlaydigan super kompyuterlar, shuningdek, Green500 ro'yxatidagi dunyodagi eng yuqori MFLOPS / Watt superkompyuterlari bo'lgan eng yaxshi 6 ta "yashil" tizimlarning barchasida ustunlik qildi.[27] QS22 va superkompyuterlardan tashqari PowerXCell protsessori PCI Express kartasida tezlatuvchi sifatida ham mavjud va yadro protsessori sifatida ishlatiladi. QPACE loyiha.

PowerXCell 8i RAMBUS xotira interfeysini olib tashlaganligi va DDR2 interfeyslarini sezilarli darajada qo'shganligi va kengaytirilgan SPE-larini o'rnatganligi sababli chiplar sxemasini qayta ishlashga to'g'ri keldi, natijada ikkala kattaroq chip o'ldi va qadoqlandi.[28]

Arxitektura

Cell chipi bir nechta turli xil konfiguratsiyalarga ega bo'lishi mumkin bo'lsa-da, asosiy konfiguratsiya a ko'p yadroli bitta "Quvvatli protsessor elementi" ("PPE") (ba'zan "Processing Element" yoki "PE" deb nomlanadi) va bir nechta "Synergistic Processing Elements" ("SPE") dan iborat.[29] PPE va SPE "Element Interconnect Bus" ("EIB") deb nomlangan ichki yuqori tezlikda ishlaydigan avtobus bilan bog'langan.

Quvvatli protsessor elementi (PPE)

The PPE[30][31][32] bo'ladi PowerPC asoslangan, ikki tomonlama tartibda ikki tomonlama bir vaqtning o'zida ko'p qirrali sakkizta SPE uchun nazorat qiluvchi vazifasini bajaradigan 23-bosqichli quvur liniyasi bilan yadro. PPE buyurtmalarni bajarish uchun cheklangan imkoniyatlarga ega; u yuklarni tartibsiz bajarishi mumkin va ega kechiktirilgan ijro quvurlari. PPE boshqa 64-bitli PowerPC protsessorlariga o'xshashligi sababli an'anaviy operatsion tizimlar bilan ishlaydi, SPE esa suzuvchi nuqta kodining vektorlashtirilgan bajarilishi uchun mo'ljallangan. PPE 64 ni o'z ichiga oladi KiB 1-daraja kesh (32 KiB ko'rsatma va 32 KiB ma'lumot) va 512 KiB 2-darajali kesh. Kesh satrining hajmi 128 baytni tashkil qiladi. Bundan tashqari, IBM an AltiVec (VMX) birligi[33] uchun to'liq quvurli bitta aniqlik suzuvchi nuqta (Altivec 1 qo'llab-quvvatlamaydi ikki tomonlama aniqlik suzuvchi nuqta vektorlari.), 32-bit Ruxsat etilgan nuqta birligi (FXU) har bir ip uchun 64 bitli registr fayli bilan, Yuklash va saqlash bo'limi (LSU), 64-bit Suzuvchi nuqta birligi (FPU), Filial bo'limi (BRU) va filiallarni ijro etish bo'limi (BXU).[30]PPE uchta asosiy qismdan iborat: Instruction Unit (IU), Execution Unit (XU) va vektor / skaler ijro etuvchi birlik (VSU). IU L1 ko'rsatmalar keshini, filiallarni bashorat qilish apparati, buyruqlar buferlari va qaramlikni tekshirishni hisobga olishni o'z ichiga oladi. XU tarkibida butun bajarilish birliklari (FXU) va yuklarni saqlash birligi (LSU) mavjud. VSU FPU va VMX uchun barcha bajarilish manbalarini o'z ichiga oladi. Har bir PPE skaler bilan birlashtirilgan-ko'paytiriladigan qo'shimchali ko'rsatma yordamida soat tsikli bo'yicha ikkita ikki aniqlikdagi operatsiyani bajarishi mumkin, bu esa 6,4 ga aylanadi.GFLOPS 3,2 gigagertsli chastotada; yoki 3,2 gigagertsli chastotada 25,6 GFLOPS ga aylanadigan vektorli ko'paytirish-qo'shish ko'rsatmasi bilan soat tsikli uchun sakkizta aniqlikdagi operatsiyalar.[34]

Xbox 360-dagi ksenon

PPE Cell protsessori uchun maxsus ishlab chiqilgan, ammo rivojlanish jarayonida, Microsoft o'zi uchun yuqori samarali protsessor yadrosi istagan IBMga murojaat qildi Xbox 360. IBM uchta yadroni bajardi va qildi Ksenonli protsessor, VMX128 kengaytmalari qo'shilgan PPE ning ozgina o'zgartirilgan versiyasiga asoslangan.[35][36]

Sinergik ishlov berish elementlari (SPE)

Har bir SPE - bu "Synergistic Processing Unit" dan tashkil topgan buyurtma protsessori, ikkita muammo,[37] SPU va "Xotira oqimini boshqarish", MFC (DMA, MMU va avtobus interfeysi). SPE-larda yo'q filialni bashorat qilish apparat (shu sababli kompilyatorga og'ir yuk tushadi).[38] Har bir SPE-da har bir SPE-da g'alati va juft quvurlar o'rtasida bo'linadigan 6 ta ijro bo'linmasi mavjud: SPU maxsus ishlab chiqilgan ko'rsatmalar to'plami (ISA) bilan 128 bit SIMD tashkilot[33][39][40] bitta va ikkita aniqlik bo'yicha ko'rsatmalar uchun. Hujayraning hozirgi avlodi bilan har bir SPE 256 dan iboratKiB o'rnatilgan SRAM ko'rsatma va ma'lumotlar uchun chaqirilgan "Mahalliy saqlash" (Sony-ning VRAM-ga tegishli hujjatlaridagi "Mahalliy xotira" deb xato qilmaslik kerak), bu PPE-ga ko'rinadi va to'g'ridan-to'g'ri dasturiy ta'minot orqali hal qilinishi mumkin. Har bir SPE 4 tagacha qo'llab-quvvatlashi mumkin GiB mahalliy do'kon xotirasi. Mahalliy do'kon odatdagidek ishlamaydi CPU keshi chunki u dasturiy ta'minot uchun shaffof emas va qaysi ma'lumotlarning yuklanishini taxmin qiladigan apparat tuzilmalarini o'z ichiga olmaydi. SPElar 128-bitli, 128-yozuvlarni o'z ichiga oladi faylni ro'yxatdan o'tkazing va o'lchamlari 14,5 mm2 90 nm jarayonda. SPE bitta soat tsiklida o'n oltita 8-bitli, sakkizta 16-bitli, to'rtta 32-bitli yoki to'rtta aniqlikdagi suzuvchi nuqta sonlarda ishlashi mumkin, shuningdek, xotira operatsiyasi. SPU to'g'ridan-to'g'ri tizim xotirasiga kira olmasligini unutmang; SPU tomonidan tashkil etilgan 64-bitli virtual xotira manzillari SPU-dan SPE xotira oqimini boshqaruvchisiga (MFC) tizim manzil maydonida DMA operatsiyasini o'rnatish uchun uzatilishi kerak.

Odatiy foydalanish ssenariysida tizim SPE-larni kichik dasturlar bilan yuklaydi (o'xshash iplar ), murakkab operatsiyadagi har bir qadamni bajarish uchun SPE-larni zanjirga bog'lash. Masalan, a stol usti qutisi DVD, video va audio dekodlashni o'qish uchun dasturlarni yuklashi va displeyni ko'rsatishi va ma'lumotlar televizorda tugaguniga qadar SPE dan SPE ga uzatilishi mumkin edi. Yana bir imkoniyat - bu kirish ma'lumotlar to'plamini qismlarga ajratish va bir xil SPE-larga parallel ravishda bir xil operatsiyalarni bajarish. 3.2 gigagertsli chastotada har bir SPE nazariy 25.6 ni beradi GFLOPS bir aniqlikdagi ishlash.

Uning bilan taqqoslaganda shaxsiy kompyuter zamondoshlari, Hujayra protsessorining umumiy suzuvchi nuqta ko'rsatkichi nisbatan yuqori bo'lganligi kabi, protsessorlarda SIMD birligining qobiliyatini mitti qiladi. Pentium 4 va Athlon 64. Biroq, tizimning faqat suzuvchi nuqta qobiliyatlarini taqqoslash bir o'lchovli va dasturga xos bo'lgan o'lchovdir. Uyali protsessordan farqli o'laroq, bunday ish stoli protsessorlari odatda shaxsiy kompyuterlarda ishlaydigan umumiy dasturlarga ko'proq mos keladi. Intel va AMD funktsiyalari protsessorlari soatiga bir nechta ko'rsatmalarni bajarishdan tashqari filialni bashorat qiluvchilar. Hujayra kompilyator yordami bilan uni kompensatsiya qilish uchun mo'ljallangan bo'lib, unda tarmoqqa tayyor ko'rsatmalar yaratiladi. Ba'zan shaxsiy kompyuterlarda ishlatiladigan va ko'pincha ilmiy hisoblashda ishlatiladigan ikki aniqlikdagi suzuvchi nuqta operatsiyalari uchun hujayraning ishlashi kattaligi bo'yicha pasayadi, ammo baribir 20,8 GFLOPS ga teng (SPE uchun 1,8 GFLOPS, PPE uchun 6,4 GFLOPS). Ikki aniqlik uchun maxsus ishlab chiqilgan PowerXCell 8i varianti ikki marta aniq hisoblashda 102,4 GFLOPS ga etadi.[41]

IBM tomonidan o'tkazilgan testlar shuni ko'rsatadiki, SPElar matritsani optimallashtirilgan ko'paytirish bilan optimallashtirilgan teorik ko'rsatkichlarining 98 foiziga etishi mumkin.[34]

Toshiba ishlab chiqdi a birgalikda protsessor to'rtta SPE bilan ishlaydi, ammo "PPE" deb nomlanmaydi SpursEngine maishiy elektronikada 3D va kino effektlarini tezlashtirish uchun mo'ljallangan.

Har bir SPE 256 KB mahalliy xotiraga ega.[42] Hammasi bo'lib SPE-larda 2 MB mahalliy xotira mavjud.

Element Interconnect Bus (EIB)

EIB - bu hujayraning turli xil tizim elementlarini: PPE protsessori, xotira boshqaruvchisi (MIC), sakkizta SPE koprotsessorlari va ikkita chipdan tashqaridagi I / U interfeyslarini birlashtirgan Cell protsessorining ichki aloqasi. PS3 ning 12 ishtirokchisining (SPU soni sanoat dasturlarida farq qilishi mumkin). EIB tarkibiga svetoforlar to'plami sifatida ishlaydigan hakamlik bo'limi ham kiradi. Ba'zi hujjatlarda IBM EIB ishtirokchilarini "birliklar" deb ataydi.

Hozirgi kunda EIB 16 baytlik to'rtta bir yo'nalishli kanallardan tashkil topgan dumaloq halqa sifatida amalga oshiriladi, ular juft-juft bo'lib aylanadilar. Trafik sxemalariga ruxsat berilganda, har bir kanal bir vaqtning o'zida uchta operatsiyani o'tkazishi mumkin. EIB tizimning soat tezligining yarmida ishlayotganligi sababli, har ikki tizim soatlarida samarali kanal tezligi 16 baytni tashkil qiladi. Maksimal darajada bir vaqtda, to'rtta halqaning har birida uchta faol bitimlar bilan, eng yuqori nuqtasi bir zumda EIB o'tkazuvchanligi soatiga 96 baytni tashkil etadi (12 ta bir vaqtning o'zida tranzaksiyalar × 16 bayt kengligida / har bir o'tkazmada 2 ta tizim soatlari). Ushbu raqam ko'pincha IBM adabiyotlarida keltirilgan bo'lsa-da, bu raqamni protsessorning soat tezligi bo'yicha shunchaki kattalashtirish haqiqatdan ham mumkin emas. Hakamlik sudi bo'limi qo'shimcha cheklovlarni keltirib chiqaradi.

IBM katta muhandisi Devid Krolak, EIB etakchi dizayner, o'xshashlik modelini quyidagicha tushuntiradi:

Ring har uch tsikldagi yangi opni boshlashi mumkin. Har bir transfer har doim sakkiz marta uradi. Bu biz amalga oshirgan soddalashtirishlardan biri edi, bu juda ko'p ma'lumotlarni uzatish uchun optimallashtirilgan. Agar siz kichik opsiyalar qilsangiz, u ham ishlamaydi. Agar siz ushbu trek atrofida sakkizta vagonli poezdlar harakat qilayotganini tasavvur qilsangiz, poezdlar bir-biriga to'g'ri kelmasa, ular trekda birga yashashi mumkin.[43]

EIBning har bir ishtirokchisida bitta 16 baytli o'qish porti va bitta 16 baytlik yozish porti mavjud. Bitta ishtirokchining chegarasi EIB soatiga 16 bayt tezlikda o'qish va yozishdir (soddaligi uchun ko'pincha tizim soatiga 8 bayt). Har bir SPU protsessorida maxsus ajratilgan mavjud DMA SPUning doimiy hisob-kitoblariga xalaqit bermasdan har xil so'nggi nuqtalarga tranzaktsiyalarning uzoq ketma-ketligini rejalashtirishga qodir bo'lgan boshqaruv navbati; ushbu DMA navbatlari mahalliy yoki masofadan boshqarilishi mumkin, bu esa boshqaruv modelida qo'shimcha moslashuvchanlikni ta'minlaydi.

Ma'lumotlar halqa atrofida qadam-baqadam EIB kanalida oqadi. O'n ikki ishtirokchi bo'lganligi sababli, kanal atrofida kelib chiqish nuqtasiga qadamlarning umumiy soni o'n ikki. Olti qadam - har qanday juftlik ishtirokchilari orasidagi eng uzoq masofa. EIB kanaliga olti bosqichdan ko'proq vaqtni talab qiladigan ma'lumotlarni uzatishga ruxsat berilmaydi; bunday ma'lumotlar boshqa yo'nalishda aylana bo'ylab qisqa yo'lni bosib o'tishlari kerak. Paketni jo'natish bilan bog'liq bo'lgan qadamlar soni uzatish kechikishiga juda oz ta'sir qiladi: qadamlarni boshqaradigan soat tezligi boshqa fikrlarga nisbatan juda tez. Biroq, uzoqroq aloqa masofalari bor EIBning umumiy ko'rsatkichlariga zarar etkazadi, chunki ular mavjud bo'lgan parallellikni kamaytiradi.

IBM EIB-ni yanada kuchli to'siq sifatida tatbiq etish istagiga qaramay, ular resurslarni zaxira qilish uchun qabul qilgan dumaloq konfiguratsiya kamdan-kam hollarda umuman Cell chipining ishlashini cheklovchi omilni anglatadi. Eng yomon holatda, dasturchi EIB yuqori darajadagi paralellik darajasida ishlashga qodir bo'lgan aloqa rejimlarini rejalashtirish uchun juda ehtiyot bo'lishi kerak.

Devid Krolak tushuntirdi:

Dastlab, rivojlanish jarayonining boshida bir nechta odamlar to'siqni almashtirishni talab qilishdi va avtobusning dizayni qanday bo'lsa, siz EIB-ni tortib olishingiz mumkin va agar siz ko'proq kremniy bag'ishlamoqchi bo'lsangiz, to'siqni o'chirib qo'yishingiz mumkin. Kabelga bo'sh joy. Biz ulanish va maydon o'rtasida muvozanatni topishimiz kerak edi, va to'liq to'siqni almashtirish uchun joy etarli emas edi. Shuning uchun biz juda qiziqarli deb o'ylaydigan ushbu halqa konstruktsiyasini ishlab chiqdik. U hudud cheklovlariga mos keladi va hali ham juda ta'sirli o'tkazuvchanlikka ega.[43]

Tarmoqli kengligini baholash

3,2 gigagertsli chastotada har bir kanal 25,6 Gb / s tezlikda oqadi. EIBni u bog'laydigan tizim elementlaridan ajratib ko'rish, shu oqim tezligi bo'yicha bir vaqtning o'zida o'n ikkita tranzaktsiyani amalga oshirish 307,2 Gb / s gacha bo'lgan abstrakt EIB o'tkazuvchanligi darajasida ishlaydi. Ushbu fikrga asoslanib, ko'plab IBM nashrlari mavjud EIB o'tkazuvchanligini "300 Gb / s dan yuqori" deb tasvirlashadi. Ushbu raqam eng yuqori nuqtani aks ettiradi bir zumda EIB tarmoqli kengligi protsessor chastotasi bilan o'lchanadi.[44]

Biroq, avtobusga qabul qilingan paketlar uchun hakamlik mexanizmida boshqa texnik cheklovlar mavjud. IBM Systems Performance guruhi quyidagilarni tushuntirdi:

EIBdagi har bir birlik bir vaqtning o'zida har bir avtobus tsiklida 16 bayt ma'lumotlarni yuborishi va qabul qilishi mumkin. Butun EIB ma'lumotlarining maksimal o'tkazuvchanligi tizimdagi barcha birliklar bo'ylab manzillarni tekshirishning maksimal tezligi bilan cheklangan, bu bitta avtobus tsikli uchun bitta. Yashirilgan har bir manzil so'rovi 128 baytgacha o'tkazishi mumkin bo'lganligi sababli, 3.2 gigagertsli chastotada EIB-ning nazariy yig'ilish tezligi 128Bx1.6 gigagertsli = 204.8 Gb / s ni tashkil qiladi.[34]

Ushbu taklif, aftidan IBM tomonidan ushbu mexanizm va uning ta'sirini ommaviy ravishda oshkor qilishning to'liq hajmini aks ettiradi. EIB arbitraj bo'limi, ko'zdan kechirish mexanizmi va segment yoki sahifa tarjimasidagi nosozliklarda uzilishlar hosil bo'lishi hali IBM tomonidan e'lon qilingan hujjatlar to'plamida yaxshi tavsiflanmagan.[iqtibos kerak ]

Amalda, EIB-ning samarali o'tkazuvchanligi, shuningdek, ishtirok etgan ring ishtirokchilari tomonidan cheklanishi mumkin. To'qqizta ishlov berish yadrosining har biri bir vaqtning o'zida 25,6 Gb / s o'qish va yozishni qo'llab-quvvatlasa-da, xotira interfeysi boshqaruvchisi (MIC) o'qish va yozish uchun maksimal 25,6 Gb / s oqimga ruxsat beruvchi bir juft XDR xotira kanaliga bog'langan. birlashtirilgan va ikkita IO tekshirgichi yig'ilishning eng yuqori tezligini 25,6 Gb / s ni va eng yuqori qo'shma chiqish tezligini 35 Gb / s ni qo'llab-quvvatlovchi sifatida hujjatlashtirilgan.

Chalkashliklarni yanada kuchaytirish uchun ba'zi eski nashrlar 4 gigagertsli tizim soatiga ega bo'lgan EIB o'tkazuvchanligini keltiradi. Ushbu mos yozuvlar tizimi bir zumda EIB o'tkazuvchanlik ko'rsatkichini 384 GB / s va hakamlik bilan cheklangan o'tkazuvchanlik ko'rsatkichini 256 GB / s ni tashkil qiladi.

Nazariy nazarda tutilgan barcha narsalar, ko'pincha 204,8 GB / s raqamni esga olish kerak bo'lgan eng yaxshisidir. The IBM tizimlarining ishlashi guruh 3,2 gigagertsli chastotada ishlaydigan uyali protsessorda 197 Gb / s tezlikda ishlaydigan SPU-markazlashtirilgan ma'lumotlar oqimlarini namoyish etdi, shuning uchun bu raqam amaliyotda ham adolatli aks etadi.[45]

Xotira va I / U tekshirgichlari

Hujayrada ikkita kanal mavjud Rambus Rambus bilan bog'langan XIO makrosi XDR xotirasi. Xotira interfeysi boshqaruvchisi (MIC) XIO makrosidan ajralib turadi va IBM tomonidan ishlab chiqilgan. XIO-XDR havolasi har bir pin uchun 3,2 Gbit / s tezlikda ishlaydi. Ikki 32-bitli kanallar nazariy jihatdan maksimal 25,6 Gb / s ni ta'minlashi mumkin.

Kirish-chiqarish interfeysi, shuningdek, Rambus dizayni sifatida tanilgan FlexIO. FlexIO interfeysi 12 ta qatorga birlashtirilgan bo'lib, ularning har bir yo'nalishi bir tomonlama 8-bitlik keng nuqta-nuqta yo'li hisoblanadi. Beshta 8-bitli kenglikdan-nuqtagacha yo'llar Hujayra tomon yo'llar, qolgan ettita esa chiqish yo'llari. Bu 2,6 gigagertsli tezlikda 62,4 Gb / s (36,4 Gb / s ga, 26 Gb / s ga teng) tezlikni o'tkazish qobiliyatini ta'minlaydi. FlexIO interfeysi mustaqil ravishda, soatiga qarab sozlanishi mumkin. 3.2 gigagertsli. 4 ta kiruvchi + 4 ta yo'lak xotira izchilligini qo'llab-quvvatlamoqda.

Mumkin bo'lgan ilovalar

Video ishlash kartasi

Kabi ba'zi kompaniyalar Leadtek, ozod qildilar PCI-E "real vaqtdan tezroq" transkodlashni amalga oshirish uchun Cell-ga asoslangan kartalar H.264, MPEG-2 va MPEG-4 video.[46]

Blade-server

2007 yil 29 avgustda IBM BladeCenter QS21. Vatt uchun sekundiga 1,05 gigacha suzuvchi nuqta operatsiyalari yaratish (gigaFLOPS), eng yuqori ko'rsatkichi taxminan 460 GFLOPS bu hozirgi kungacha energiya tejaydigan hisoblash platformalaridan biri hisoblanadi. Bitta BladeCenter shassisi soniyasiga 6,4 tera-suzuvchi nuqta operatsiyalarini bajarishi mumkin (teraFLOPS) va standart 42U raftida 25,8 teraFLOPS dan ortiq.[47]

2008 yil 13-may kuni IBM kompaniyasi BladeCenter QS22. QS22 PowerXCell 8i protsessorini QS21 ning suzuvchi nuqta ko'rsatkichidan besh baravar yuqori va 32 Gbaytgacha bo'lgan DDR2 xotira hajmiga ega.[48]

IBM 2012 yil 12 yanvardan boshlab Uyali protsessorlarga asoslangan Blade server liniyasini to'xtatdi.[49]

PCI Express kartasi

Bir nechta kompaniyalar IBM PowerXCell 8i-dan foydalangan holda PCI-e platalarini taqdim etadi. Ishlash 2,8 gigagertsli chastotada 179,2 GFlops (SP), 89,6 GFlops (DP) deb e'lon qilingan.[50][51]

Konsol video o'yinlari

Sony "s PlayStation 3 video o'yin konsol 3.2 da ishlaydigan Cell protsessorining birinchi ishlab chiqarish dasturi ediGigagertsli va sakkizta ishlaydigan SPE-dan ettitasini o'z ichiga olgan holda, Sony-ga oshirish imkoniyatini beradi Yo'l bering protsessor ishlab chiqarish bo'yicha. Ettita SPE-ning faqat oltitasiga ishlab chiquvchilar kirishlari mumkin, chunki bittasi OS tomonidan himoyalangan.[20]

Uy kinoteatri

Toshiba ishlab chiqargan HDTVlar Hujayra yordamida. Ular 48 kodini ochish uchun tizimni taqdim etdilar standart ta'rif MPEG-2 bir vaqtning o'zida a 1920×1080 ekran.[52][53] Bu tomoshabinga ekranda bir vaqtning o'zida namoyish etiladigan o'nlab eskiz videolari asosida kanal tanlash imkoniyatini beradi.

Superkompyuter

IBM superkompyuteri, IBM Roadrunner, umumiy maqsadli x86-64 gibrid edi Opteron shuningdek, uyali protsessorlar. Ushbu tizim 2008 yil iyun oyida Top 500 ro'yxatida birinchi ishlaydigan superkompyuter sifatida birinchi o'rinni egalladi petaFLOPS standartdan foydalangan holda barqaror 1.026 petaFLOPS tezligini qo'lga kiritib, tezlikni oshirdi Linpack benchmark. IBM Roadrunner Cell protsessorining PowerXCell 8i versiyasidan foydalangan, 65 nm texnologiyasi va 128 bitli registrlarda ikki marta aniq hisob-kitoblarni amalga oshira oladigan kengaytirilgan SPU-lar yordamida ishlab chiqarilgan va chip uchun 102 GFLOP ga teng.[54][55]

Klasterli hisoblash

Klasterlar PlayStation 3 konsollar - bu hujayra pichoqlariga asoslangan yuqori darajadagi tizimlarga jozibali alternativ. Innovatsion hisoblash laboratoriyasi, boshchiligidagi guruh Jek Dongarra, Tennessi Universitetining kompyuter fanlari bo'limida bunday dasturni chuqur o'rganib chiqdi.[56] Terrasoft Solutions kompaniyasi 8 tugunli va 32 tugunli PS3 klasterlarini sotmoqda Yellow Dog Linux oldindan o'rnatilgan, Dongarraning tadqiqotlarini amalga oshirish.

Avval xabar qilinganidek Simli 2007 yil 17 oktyabrda,[57] Klaster konfiguratsiyasida PlayStation 3-dan foydalanishning qiziqarli dasturi Astrofizik Gaurav Xanna tomonidan amalga oshirildi. Massachusets Dartmut universiteti, superkompyuterlarda ishlatiladigan vaqtni sakkizta PlayStation 3-ning klasteriga almashtirgan. Keyinchalik, ushbu mashinaning keyingi avlodi, endi PlayStation 3 Gravitatsion tarmoq, 16 ta mashinadan iborat tarmoqdan foydalanadi va Cell protsessoridan ikkilik bo'lgan dastur uchun foydalanadi qora tuynuk birlashish bezovtalanish nazariyasi. Xususan, klaster katta hajmdagi astrofizik simulyatsiyalarni bajaradi supermassive qora tuynuklar kichikroq ixcham ob'ektlarni suratga olish va tegishli ilmiy tadqiqot adabiyotlarida bir necha bor nashr etilgan raqamli ma'lumotlarni yaratish.[58] PlayStation 3 tomonidan ishlatiladigan Cell protsessor versiyasida asosiy protsessor va foydalanuvchi foydalanishi mumkin bo'lgan 6 ta SPE mavjud bo'lib, Gravity Grid mashinasiga 16 ta umumiy maqsadli va 96 ta vektorli protsessorlar tarmog'i beriladi. Mashinani yaratish uchun bir martalik xarajat 9000 AQSh dollarini tashkil qiladi va oddiy superkompyuterda ishlash uchun 6000 dollar turadigan qora tuynukli simulyatsiyalar uchun etarli. Qora tuynuk hisob-kitoblari xotirani talab qilmaydi va mahalliylashtirilishi mumkin, shuning uchun ham ushbu me'morchilikka juda mos keladi. Xanna klasterning ishlashi uning simulyatsiyalarida 100+ Intel Xeon yadrosiga asoslangan an'anaviy Linux klasteridan yuqori ekanligini ta'kidlamoqda. PS3 Gravity Grid 2007 yilgacha ommaviy axborot vositalarining e'tiborini tortdi,[59] 2008,[60][61] 2009,[62][63][64] va 2010 yil.[65][66]

Hisoblash biokimyosi va biofizika laboratoriyasi Universitat Pompeu Fabra, yilda "Barselona", 2007 yilda joylashtirilgan a BOINC tizim deb nomlangan PS3GRID[67] CellMD dasturiy ta'minotiga asoslangan hamkorlikda hisoblash uchun, birinchi bo'lib Cell protsessori uchun ishlab chiqilgan.

AQSH Havo kuchlari tadqiqot laboratoriyasi tahlil qilish uchun "Condor klaster" laqabli 1700 dan ortiq birlikdan iborat PlayStation 3 klasterini joylashtirdi. yuqori aniqlik sun'iy yo'ldosh tasvirlari. Havo kuchlarining ta'kidlashicha, Condor klasteri hajmi bo'yicha dunyodagi 33-eng katta superkompyuter bo'ladi.[68] Laboratoriya superkompyuterni universitetlar tomonidan tadqiqot uchun foydalanish uchun ochdi.[69]

Tarqatilgan hisoblash

Yarim milliondan ortiq PlayStation 3 konsollarining hisoblash quvvati yordamida tarqatilgan hisoblash loyihasi @ Home katlanmoqda tomonidan tan olingan Ginnesning rekordlar kitobi dunyodagi eng kuchli tarqatilgan tarmoq sifatida. Dastlabki rekord 2007 yil 16 sentyabrda qo'lga kiritildi, chunki loyiha bu ko'rsatkichdan oshib ketdi petaFLOPS, ilgari tarqatilgan hisoblash tarmog'i tomonidan ilgari erishilmagan. Bundan tashqari, jamoaviy sa'y-harakatlar PS3-ga 2007 yil 23 sentyabrda petaFLOPS belgisiga erishishga imkon berdi. Taqqoslash uchun, o'sha paytda dunyodagi ikkinchi eng kuchli superkompyuter IBM BlueGene / L, taxminan 478,2 teraFLOPS atrofida bajarilgan, ya'ni Folding @ home-ning hisoblash quvvati BlueGene / L-dan taxminan ikki baravar ko'p degan ma'noni anglatadi (garchi BlueGene / L-da CPU o'zaro aloqasi Folding @ home-da o'rtacha tarmoq tezligidan bir million baravar tezroq). 2011 yil 7-may holatiga ko'ra, Folding @ home taxminan 9,3 x86 petaFLOPS tezlikda ishlaydi, faqat 26,000 faol PS3 tomonidan 1,6 petaFLOPS hosil bo'ladi. 2008 yil oxirida 200 ta PlayStation 3 konsolidan iborat klaster yaramaslikni keltirib chiqarish uchun ishlatilgan SSL shifrlashni samarali ravishda buzadigan sertifikat.[70]

Asosiy kadrlar

IBM 2007 yil 25 aprelda o'z uyali keng polosali dvigatel arxitekturasi mikroprotsessorlarini birlashtira boshlashini e'lon qildi. kompaniyaning asosiy ramkalari.[71] Bu sabab bo'ldi O'yin doirasi.

Parolni buzish

Protsessor arxitekturasi uni qo'shimcha qurilmalar yordamida kriptografiyaga moslashtiradi qo'pol kuch hujumi an'anaviy protsessorlarga qaraganda dasturlar.[72]

Dasturiy ta'minot

Hujayraning egiluvchanligi tufayli uning resurslaridan foydalanishning turli xil hisoblash paradigmalari bilan cheklanib qolmasdan, bir nechta imkoniyatlari mavjud:[73]

Ish uchun navbat

PPE ish uchun navbatni saqlaydi, SPE-da ishlarni rejalashtiradi va rivojlanishni nazorat qiladi. Har bir SPE "mini yadro" ni boshqaradi, uning vazifasi ishni olish, uni bajarish va PPE bilan sinxronizatsiya qilishdir.

SPE-larni o'z-o'zini ko'paytirish

Kichik yadro va rejalashtirish SPElar bo'ylab taqsimlanadi. Vazifalar yordamida sinxronlashtiriladi mutekslar yoki semaforalar odatdagidek operatsion tizim. Tayyor vazifalar SPE tomonidan ularni bajarish uchun navbatda kutishadi. SPElar ushbu konfiguratsiyadagi barcha vazifalar uchun umumiy xotiradan foydalanadilar.

Oqimni qayta ishlash

Har bir SPE alohida dasturni ishlaydi. Ma'lumotlar kirish oqimidan kelib chiqadi va SPE-larga yuboriladi. SPE qayta ishlashni tugatgandan so'ng, chiqish ma'lumotlari chiqish oqimiga yuboriladi.

Bu moslashuvchan va kuchli arxitekturani ta'minlaydi oqimlarni qayta ishlash va har bir SPE uchun alohida rejalashtirishni alohida-alohida amalga oshirishga imkon beradi. Boshqa protsessorlar ham oqim vazifalarini bajarishga qodir, ammo yuklangan yadro bilan cheklangan.

Ochiq manbali dasturiy ta'minotni ishlab chiqish

2005 yilda Linux yadrosida Hujayrani qo'llab-quvvatlaydigan yamalar IBM ishlab chiquvchilari tomonidan kiritilishi uchun taqdim etildi.[74] Arnd Bergmann (yuqorida aytib o'tilgan yamoqlarni ishlab chiquvchilardan biri) Linux-da joylashgan hujayra arxitekturasini LinuxTag 2005.[75] 2.6.16 versiyasidan (2006 yil 20 mart) Linux yadrosi Hujayra protsessorini rasman qo'llab-quvvatlaydi.[76]

Ham PPE, ham SPE kutubxonalar tomonidan taqdim etilgan umumiy API yordamida C / C ++ da dasturlashtiriladi.

Fixstars echimlari beradi Yellow Dog Linux IBM va Mercury Cell-ga asoslangan tizimlar, shuningdek PlayStation 3 uchun.[77] Terra Soft kompaniyasi Mercury bilan strategik hamkorlikda Cell uchun Linux Board Support Package va boshqa turli xil Uyali platformalarda, shu jumladan IBM BladeCenter JS21 va Cell QS20 va Mercury Cell asosidagi echimlarni qo'llab-quvvatlash va dasturiy ta'minotni ishlab chiqishda yordam berdi.[78] Terra Soft shuningdek, Y-HPC (High Performance Computing) klasterini qurish va boshqarish to'plamini va Y-Bio genlarini tartiblash vositalarini saqlab qoladi. Y-Bio paketlarni boshqarish uchun RPM Linux standarti asosida yaratilgan va bioinformatika tadqiqotchilariga o'z ishlarini yuqori samaradorlik bilan olib borishda yordam beradigan vositalarni taklif etadi.[79] IBM Linux uchun SPE manbalariga kirish va ulardan foydalanishni soddalashtiradigan "Spufs" psevdo-fayl tizimini ishlab chiqdi. IBM hozirda Linuxni qo'llab-quvvatlamoqda yadro va GDB portlar, Sony esa GNU asboblar zanjiri (GCC, binutil ).[80]

2005 yil noyabr oyida IBM o'z veb-saytiga simulyator va turli xil vositalardan iborat "Cell Broadband Engine (CBE) Software Development Kit Version 1.0" ni chiqardi. Eng so'nggi yadro va uchun vositalarni ishlab chiqish versiyalari Fedora yadrosi 4 are maintained at the Barselona superkompyuter markazi veb-sayt.[81]

In August 2007, Mercury Computer Systems released a Software Development Kit for PLAYSTATION(R)3 for High-Performance Computing.[82]

In November 2007, Fixstars Corporation released the new "CVCell" module aiming to accelerate several important OpenCV APIs for Cell. In a series of software calculation tests, they recorded execution times on a 3.2 GHz Cell processor that were between 6x and 27x faster compared with the same software on a 2.4 GHz Intel Core 2 Duo.[83]

Galereya

Illustrations of the different generations of Cell/B.E. processors and the PowerXCell 8i. The images are not to scale; All Cell/B.E. packages measures 42.5×42.5 mm and the PowerXCell 8i measures 47.5×47.5 mm.

Shuningdek qarang

Adabiyotlar

  1. ^ a b Gschwind, Michael; Hofstee, H. Peter; Flachs, Brian; Hopkins, Martin; Watanabe, Yukio; Yamazaki, Takeshi (2006). "Synergistic Processing in Cell's Multicore Architecture". IEEE Micro. IEEE. 26 (2): 10–24. doi:10.1109/MM.2006.41. S2CID  17834015.
  2. ^ "Cell Designer talks about PS3 and IBM Cell Processors". Arxivlandi asl nusxasi 2006 yil 21 avgustda. Olingan 22 mart, 2007.
  3. ^ Gaudin, Sharon (June 9, 2008). "IBM Roadrunner 4 daqiqalik superkompyuterni sindirdi". Computerworld. Arxivlandi asl nusxasi 2008 yil 24 dekabrda. Olingan 10 iyun, 2008.
  4. ^ Fildes, Jonathan (June 9, 2008). "Superkompyuter petaflop tezligini o'rnatadi". BBC yangiliklari. Olingan 9 iyun, 2008.
  5. ^ Shankland, Stephen (February 22, 2006). "Octopiler seeks to arm Cell programmers". CNET. Olingan 22 mart, 2007.
  6. ^ "Cell Broadband Engine Software Development Kit Version 1.0". LWN. 2005 yil 10-noyabr. Olingan 22 mart, 2007.
  7. ^ Krewell, Kevin (February 14, 2005). "Cell Moves Into the Limelight". Mikroprotsessor hisoboti.
  8. ^ a b "Introduction to the Cell multiprocessor". IBM Journal of Research and Development. August 7, 2005. Archived from asl nusxasi on February 28, 2007. Olingan 22 mart, 2007.
  9. ^ a b v "IBM Produces Cell Processor Using New Fabrication Technology". X-bitli laboratoriyalar. Arxivlandi asl nusxasi 2007 yil 15 martda. Olingan 12 mart, 2007.
  10. ^ "65nm CELL processor production started". PlayStation Universe. 2007 yil 30-yanvar. Arxivlangan asl nusxasi 2007 yil 2 fevralda. Olingan 18 may, 2007.
  11. ^ Stokes, Jon (February 7, 2008). "IBM shrinks Cell to 45nm. Cheaper PS3s will follow". Arstechnica.com. Olingan 19 sentyabr, 2012.
  12. ^ "IBM Offers Higher Performance Computing Outside the Lab". IBM. Olingan 15 may, 2008.
  13. ^ "Sony answears our questions about the new PlayStation 3". Ars Technica. 2009 yil 18-avgust. Olingan 19 avgust, 2009.
  14. ^ "Will Roadrunner Be the Cell's Last Hurrah?". 2009 yil 27 oktyabr. Arxivlangan asl nusxasi 2009 yil 31 oktyabrda.
  15. ^ "SC09: IBM lässt Cell-Prozessor auslaufen". HeiseOnline. 2009 yil 20-noyabr. Olingan 21-noyabr, 2009.
  16. ^ "IBM have not stopped Cell processor development". DriverHeaven.net. 2009 yil 23-noyabr. Arxivlangan asl nusxasi 2009 yil 25-noyabrda. Olingan 24-noyabr, 2009.
  17. ^ Becker, David (February 7, 2005). "PlayStation 3 chip has split personality". CNET. Olingan 18 may, 2007.
  18. ^ a b Thurrott, Paul (May 17, 2005). "Sony Ups the Ante with PlayStation 3". WindowsITPro. Arxivlandi asl nusxasi 2007 yil 30 sentyabrda. Olingan 22 mart, 2007.
  19. ^ a b Roper, Chris (May 17, 2005). "E3 2005: Cell Processor Technology Demos". IGN. Olingan 22 mart, 2007.
  20. ^ a b Martin Linklater. "Optimizing Cell Core". Game Developer Magazine, April 2007. 15-18 betlar. To increase fabrication yields, Sony ships PlayStation 3 Cell processors with only seven working SPEs. And from those seven, one SPE will be used by the operating system for various tasks, This leaves six SPEs and 1 PPE for game programmers to use.
  21. ^ a b "Mercury Wins IBM PartnerWorld Beacon Award". Supercomputing Online. 2007 yil 12 aprel. Olingan 18 may, 2007.[o'lik havola ]
  22. ^ "Fixstars Releases Accelerator Board Featuring the PowerXCell 8i". Fixstars korporatsiyasi. 8-aprel, 2008 yil. Arxivlangan asl nusxasi 2009 yil 5-yanvarda. Olingan 18 avgust, 2008.
  23. ^ Koranne, Sandeep (2009). Practical Programming on the Cell Broadband Engine. Springer Science & Business Media. p. 17. ISBN  9781441903082.
  24. ^ Gschwind, Michael (2006). "Chip multiprocessing and the cell broadband engine". ACM. Olingan 29 iyun, 2008.
  25. ^ Cell Broadband Engine Programming Handbook Including the PowerXCell 8i Processor (PDF) (1.11 ed.). 2008 yil 12-may.
  26. ^ "IBM announces PowerXCell 8i, QS22 blade server". Beyond3D. May 2008. Arxivlangan asl nusxasi 2008 yil 16 iyunda. Olingan 10 iyun, 2008.
  27. ^ "The Green500 List - November 2009". Arxivlandi asl nusxasi 2011 yil 23 fevralda.
  28. ^ "Packaging the Cell Broadband Engine Microprocessor for Supercomputer Applications" (PDF). Arxivlandi asl nusxasi (PDF) 2014 yil 4-yanvarda. Olingan 4-yanvar, 2014.
  29. ^ "Cell Microprocessor Briefing". IBM, Sony Computer Entertainment Inc., Toshiba Corp. February 7, 2005.
  30. ^ a b http://www.cc.gatech.edu/~hyesoon/spr11/lec_cell.pdf
  31. ^ Practical Computing on the Cell Broadband Engine Sandeep Koranne, Springer Science+Business Media, 2009, p.19.
  32. ^ http://www.research.ibm.com/people/a/ashwini/E3%202005%20Cell%20Blade%20reports/All_About_Cell_Cool_Chips_Final.pdf
  33. ^ a b "Power Efficient Processor Design and the Cell Processor" (PDF). IBM. 2005 yil 16 fevral.
  34. ^ a b v "Cell Broadband Engine Architecture and its first implementation". IBM developerWorks. 2005 yil 29-noyabr. Olingan 6 aprel, 2006.
  35. ^ "Processing The Truth: An Interview With David Shippy ", Leigh Alexander, Gamasutra, 2009 yil 16-yanvar
  36. ^ "Ahmoqni o'ynash ", Jonathan V. Last, Wall Street Journal, 2008 yil 30-dekabr
  37. ^ "Arxivlangan nusxa" (PDF). Arxivlandi asl nusxasi (PDF) 2014 yil 18-noyabrda. Olingan 24 yanvar, 2015.CS1 maint: nom sifatida arxivlangan nusxa (havola)
  38. ^ "IBM Research - Cell". IBM. Olingan 11 iyun, 2005.
  39. ^ "Hujayraning ko'p yadroli arxitekturasida sinergik ishlov berish" (PDF). IEEE Micro. 2006 yil mart. Olingan 1-noyabr, 2006.
  40. ^ "A novel SIMD architecture for the Cell heterogeneous chip-multiprocessor" (PDF). Hot Chips 17. August 15, 2005. Archived from asl nusxasi (PDF) 2008 yil 9-iyulda. Olingan 1 yanvar, 2006.
  41. ^ "Cell successor with turbo mode - PowerXCell 8i". PPCNux. 2007 yil noyabr. Olingan 10 iyun, 2008.
  42. ^ Supporting OpenMP on Cell, IBM T. J Watson Research
  43. ^ a b "Meet the experts: David Krolak on the Cell Broadband Engine EIB bus". IBM. 2005 yil 6-dekabr. Olingan 18 mart, 2007.
  44. ^ "Cell Multiprocessor Communication Network: Built for Speed" (PDF). IEEE. Arxivlandi asl nusxasi (PDF) 2007 yil 7-yanvarda. Olingan 22 mart, 2007.
  45. ^ "Cell Broadband Engine Architecture and its first implementation". Ibm.com. 2005 yil 29-noyabr. Olingan 19 sentyabr, 2012.
  46. ^ "Leadtek PxVC1100 MPEG-2/H.264 Transcoding Card".
  47. ^ "IBM Doubles Down on Cell Blade" (Matbuot xabari). Armonk, Nyu-York: IBM. 2007 yil 29 avgust. Olingan 19 iyul, 2017.
  48. ^ "IBM Offers High Performance Computing Outside the Lab" (Matbuot xabari). Armonk, Nyu-York: IBM. 2008 yil 13-may. Olingan 19 iyul, 2017.
  49. ^ Morgan, Timothy Prickett (June 28, 2011). "IBM to snuff last Cell blade server". Ro'yxatdan o'tish. Olingan 19 iyul, 2017.
  50. ^ "Fixstars Press Release". Arxivlandi asl nusxasi 2009 yil 5-yanvarda. Olingan 18 avgust, 2008.
  51. ^ "Cell-based coprocessor card runs Linux". Arxivlandi asl nusxasi 2009 yil 2 mayda.
  52. ^ "Toshiba Demonstrates Cell Microprocessor Simultaneously Decoding 48 MPEG-2 Streams". Tech-On!. 2005 yil 25 aprel.
  53. ^ "Winner: Multimedia Monster". IEEE Spektri. 2006 yil 1-yanvar. Arxivlangan asl nusxasi 2006 yil 18-yanvarda. Olingan 22 yanvar, 2006.
  54. ^ "Beyond a Single Cell" (PDF). Los Alamos milliy laboratoriyasi. Arxivlandi asl nusxasi (PDF) on July 8, 2009. Olingan 6 aprel, 2017.
  55. ^ "The Potential of the Cell Processor for Scientific Computing". ACM Computing Frontiers. Olingan 6 aprel, 2017.
  56. ^ "SCOP3: A Rough Guide to Scientific Computing On the PlayStation 3" (PDF). Computer Science Department, University of Tennessee. Arxivlandi asl nusxasi (PDF) on October 15, 2008. Olingan 8 may, 2007.
  57. ^ Gardiner, Bryan (October 17, 2007). "Astrophysicist Replaces Supercomputer with Eight PlayStation 3s". Simli. Olingan 17 oktyabr, 2007.
  58. ^ "PS3 Gravity Grid". Gaurav Khanna, Associate Professor, College of Engineering, University of Massachusetts Dartmouth.
  59. ^ "PS3 cluster creates homemade, cheaper supercomputer".
  60. ^ Highfield, Roger (February 17, 2008). "Why scientists love games consoles". Daily Telegraph. London.
  61. ^ Peckham, Matt (December 23, 2008). "Nothing Escapes the Pull of a PlayStation 3, Not Even a Black Hole". Washington Post.
  62. ^ Malik, Tariq (January 28, 2009). "Playstation 3 Consoles Tackle Black Hole Vibrations". Space.com.
  63. ^ Lyden, Jacki (February 21, 2009). "Playstation 3: A Discount Supercomputer?". Milliy radio.
  64. ^ Wallich, Paul (April 1, 2009). "The Supercomputer Goes Personal". IEEE Spektri.
  65. ^ "The PlayStation powered super-computer". BBC yangiliklari. 2010 yil 4 sentyabr.
  66. ^ Farrell, John (November 12, 2010). "Black Holes and Quantum Loops: More Than Just a Game". Forbes.
  67. ^ "PS3GRID.net".
  68. ^ "Defense Department discusses new Sony PlayStation supercomputer".
  69. ^ "PlayStation 3 Clusters Providing Low-Cost Supercomputing to Universities". Arxivlandi asl nusxasi 2013 yil 14 mayda.
  70. ^ "PlayStation 3 used to hack SSL, Xbox used to play Boogie Bunnies". Engadget. Olingan 19 sentyabr, 2012.
  71. ^ "IBM Mainframes Go 3-D". eWeek. 2007 yil 26 aprel. Olingan 18 may, 2007.
  72. ^ "PlayStation speeds password probe". BBC yangiliklari. 2007 yil 30-noyabr. Olingan 17 yanvar, 2011.
  73. ^ "CELL: A New Platform for Digital Entertainment". Sony Computer Entertainment Inc. March 9, 2005. Archived from asl nusxasi 2005 yil 28 oktyabrda.
  74. ^ Bergmann, Arnd (June 21, 2005). "ppc64: Introduce Cell/BPA platform, v3". Olingan 22 mart, 2007.
  75. ^ "The Cell Processor Programming Model". LinuxTag 2005. Arxivlandi asl nusxasi 2005 yil 18-noyabrda. Olingan 11 iyun, 2005.
  76. ^ Shankland, Stephen (March 21, 2006). "Linux gets built-in Cell processor support". CNET. Olingan 22 mart, 2007.
  77. ^ "Terra Soft to Provide Linux for PLAYSTATION3". Arxivlandi asl nusxasi 2009 yil 30 martda.
  78. ^ Terra Soft - Linux for Cell, PlayStation PS3, QS20, QS21, QS22, IBM System p, Mercury Cell, and Apple PowerPC Arxivlandi 2007 yil 23 fevral, soat Orqaga qaytish mashinasi
  79. ^ "Y-Bio". 2007 yil 31-avgust. Arxivlangan asl nusxasi 2007 yil 2 sentyabrda.
  80. ^ "Arnd Bergmann on Cell". IBM developerWorks. June 25, 2005.
  81. ^ "Linux on Cell BE-based Systems". Barselona superkompyuter markazi. Arxivlandi asl nusxasi 2007 yil 8 martda. Olingan 22 mart, 2007.
  82. ^ "Mercury Computer Systems Releases Software Development Kit for PLAYSTATION(R)3 for High-Performance Computing". PRNewswire-FirstCall. 2007 yil 3-avgust.
  83. ^ ""CVCell" - Module developed by Fixstars that accelerates OpenCV Library for the Cell/B.E. processor". Fixstars korporatsiyasi. 2007 yil 28-noyabr. Arxivlangan asl nusxasi 2010 yil 17 iyulda. Olingan 12 dekabr, 2008.

Tashqi havolalar