LeNet - LeNet

LeNet a konvolyutsion asab tizimi tomonidan taklif qilingan tuzilma Yann LeCun va boshq. 1989 yilda. Umuman olganda, LeNet lenet-5 ga ishora qiladi va oddiy konvolyutsion asab tizimi. Konvolyutsion neyron tarmoqlar - bu o'ziga xos tur oldinga yo'naltirilgan neyron tarmoq uning sun'iy neyronlari qamrab olish doirasidagi atrofdagi hujayralarning bir qismiga javob berishi va tasvirni katta hajmda qayta ishlashda yaxshi natijalarga erishishi mumkin.

Rivojlanish tarixi

LeNet5 eng qadimgi biri edi konvolyutsion asab tarmoqlari va rivojlanishiga yordam berdi chuqur o'rganish. 1988 yildan beri ko'p yillik izlanishlar va ko'plab muvaffaqiyatli takrorlashlardan so'ng kashshoflik ishi LeNet5 deb nomlandi.

Yann LeCun 2018 yilda

1989 yilda, Yann LeCun va boshq. da Bell laboratoriyalari birinchi bo'lib backpropagation algoritmi amaliy dasturlarga va tarmoqning umumlashtirilishini o'rganish qobiliyatini vazifa domenidagi cheklovlar bilan ta'minlash orqali ancha oshirish mumkin deb hisoblar edi. U qo'lda yozilgan raqamlarni o'qish uchun backpropagation algoritmlari bo'yicha o'qitilgan konvolyutsion asab tarmog'ini birlashtirdi va uni qo'lda yozilgan pochta indeksi tomonidan taqdim etilgan pochta kodini aniqlashda muvaffaqiyatli qo'lladi AQSh pochta xizmati. Bu keyinchalik LeNet deb nomlangan narsaning prototipi edi.[1]Xuddi shu yili LeCun boshqa bir qog'ozda qo'lda yozilgan raqamlarni tanib olish muammosini tasvirlab berdi va muammo chiziqli ravishda ajratilishi mumkinligiga qaramay, bir qatlamli tarmoqlar zaif umumlashtirish qobiliyatlarini namoyish etganligini ko'rsatdi. Shift o'zgarmas xususiyat detektorlarini ko'p qatlamli, cheklangan tarmoqdan foydalanganda model juda yaxshi ishlashi mumkin edi. Uning fikricha, ushbu natijalar asab tarmog'idagi erkin parametrlar sonini minimallashtirish neyron tarmoqni umumlashtirish qobiliyatini oshirishi mumkinligini isbotladi.[2]

1990 yilda ularning maqolalarida yana qo'lda yozilgan raqamlarni aniqlashda backpropagation tarmoqlarini qo'llash tasvirlangan. Ular faqat ma'lumotlarga minimal ishlov berishni amalga oshirdilar va model ushbu vazifani sinchkovlik bilan ishlab chiqdi va u juda cheklangan edi. Kirish ma'lumotlari har birida raqamni o'z ichiga olgan rasmlardan tashkil topgan va AQSh pochta xizmati tomonidan taqdim etilgan pochta indeksining raqamli ma'lumotlari bo'yicha sinov natijalari shuni ko'rsatdiki, modelda xatolik darajasi atigi 1%, rad etish darajasi esa taxminan 9% bo'lgan.[3]

Ularning tadqiqotlari keyingi sakkiz yil davomida davom etdi va 1998 yilda Yan LeCun, Leon Bottu, Yoshua Bengio va Patrik Xaffner qog'ozda qo'lda yozilgan belgilarni tanib olishning turli usullarini ko'rib chiqdilar va etalon vazifalarni aniqlash uchun qo'lda yozilgan standart raqamlardan foydalandilar. Ushbu modellar taqqoslandi va natijalar shuni ko'rsatdiki, tarmoq boshqa barcha modellardan ustunroq. Shuningdek, ular neyron tarmoqlarning amaliy qo'llanmalariga misollar taqdim etishdi, masalan, qo'lda yozilgan belgilarni onlayn tanib olishning ikkita tizimi va kuniga millionlab cheklarni o'qiy oladigan modellar.[4]

Tadqiqot katta yutuqlarga erishdi va olimlarning neyron tarmoqlarini o'rganishga qiziqishini uyg'otdi. Bugungi kunda eng yaxshi ishlaydigan neyron tarmoqlarining arxitekturasi LeNetnikiga o'xshamasa-da, tarmoq ko'plab neyron tarmoqlari arxitekturalari uchun boshlang'ich nuqtasi bo'lib, maydonga ilhom baxsh etdi.

Xronologiya
1989Yann LeCun va boshq. LeNet-ning asl shaklini taklif qildiLeCun, Y .; Boser, B .; Denker, J. S .; Xenderson, D.; Xovard, R. E .; Hubbard, W. & Jackel, L. D. (1989). Backpropagation qo'lda yozilgan pochta kodini aniqlashda qo'llaniladi. Asabiy hisoblash, 1 (4): 541-551.[1]
1989Yann LeCun, neyron tarmoqlaridagi bo'sh parametrlar sonini minimallashtirish neyron tarmoqlarini umumlashtirish qobiliyatini oshirishi mumkinligini isbotlamoqda.LeCun, Y. (1989). Umumlashtirish va tarmoq dizayni strategiyalari. Texnik hisobot CRG-TR-89-4, Toronto universiteti, kompyuter fanlari bo'limi.[2]
1990Ularning maqolalarida backpropagation tarmoqlarini qo'lda yozilgan raqamlarni aniqlashda qo'llash yana bir bor tasvirlanganLeCun, Y .; Boser, B .; Denker, J. S .; Xenderson, D.; Xovard, R. E .; Hubbard, W. & Jackel, L. D. (1990). Orqaga tarqatish tarmog'i bilan qo'lda yozilgan raqamlarni aniqlash. 2-sonli asabiy axborotni qayta ishlash tizimidagi yutuqlar (NIPS * 89).[3]
1998Ular qo'lda yozilgan belgilarni aniqlashda qo'llaniladigan turli xil usullarni ko'rib chiqdilar va ularni qo'lda yozilgan raqamlarni aniqlashning etalon ko'rsatkichlari bilan taqqosladilar. Natijalar shuni ko'rsatadiki konvolyutsion asab tarmoqlari boshqa barcha modellardan ustunroq.LeCun, Y .; Bottu, L.; Bengio, Y. va Xaffner, P. (1998). Hujjatlarni tan olish uchun qo'llaniladigan gradiyentli ta'lim. IEEE protseduralari. 86 (11): 2278 - 2324.[4]

Tuzilishi[5] [6]

LeNet erta konvolyutsion asab tarmog'ining vakili sifatida konvolyutsion asab tizimining asosiy birliklariga ega, masalan konvolyutsion qatlam, birikuvchi qatlam va to'liq ulanish qatlami, konvolyutsion asab tizimining kelajakdagi rivojlanishiga zamin yaratmoqda. Rasmda ko'rsatilgandek (32 * 32 pikselli rasm ma'lumotlarini kiritish): lenet-5 etti qatlamdan iborat. Kiritishdan tashqari, har bir boshqa qatlam mumkin poezd parametrlari. Rasmda Cx konvolyutsiya qatlamini, Sx subampling qatlamini, Fx to'liq ulanish qatlamini va x qatlam indeksini aks ettiradi.[1]

C1 qatlami a konvolyutsiya qatlami 5x5 oltita konversiyali yadroli va xususiyat xaritasining o'lchami 28x28 ga teng, bu kirish tasviri ma'lumotining konvolyusiya yadrosi chegarasidan chiqib ketishini oldini oladi.

S2 qatlami 14x14 o'lchamdagi 6 ta grafik grafigini chiqaradigan subampling / pooling qatlamidir. Har bir xususiyat xaritasidagi har bir katak C1-dagi mos xususiyat xaritasidagi 2x2 mahallaga ulangan.

C3 qatlami - bu 16 5-5 konvolyutsiya yadrosi bo'lgan konvolyatsion qatlam. Dastlabki oltita C3 xususiyat xaritasining kiritilishi S2-dagi uchta xususiyat xaritasining har bir doimiy to'plamidir, keyingi olti xususiyat xaritasining kiritilishi to'rtta doimiy pastki to'plamning kiritilishidan va keyingi uchta xususiyat xaritasining kiritilishidan kelib chiqadi to'rtta to'xtovsiz ichki qism. Va nihoyat, so'nggi xususiyatlar grafigi uchun kirish S2 ning barcha xususiyatli grafikalaridan kelib chiqadi.

S4 qatlami S2 ga o'xshaydi, uning o'lchamlari 2x2 va 16 5x5 xususiyatli grafikalar.

C5 qatlami - bu 5x5 o'lchamdagi 120 ta konversiyali yadroli konvolyatsion qatlam. Har bir hujayra S4 ning barcha 16 grafikalaridagi 5 * 5 mahallasiga ulangan. Bu erda S4 ning grafik grafigi ham 5x5 bo'lganligi sababli, C5 ning chiqish hajmi 1 * 1 ga teng. Shunday qilib, S4 va C5 to'liq ulangan. C5 to'liq bog'langan qatlam o'rniga konvolyatsion qatlam sifatida belgilanadi, chunki lenet-5 usuli kattalashib, uning tuzilishi o'zgarishsiz qolsa, uning hajmi 1x1 dan katta bo'ladi, ya'ni to'liq bog'langan qatlam emas.

F6 qatlami to'liq C5-ga ulangan va 84 ta xususiyatli grafikalar chiqarilgan.

Xususiyatlari

  • Har bir konvolyutsion qatlam uch qismni o'z ichiga oladi: konvolyutsiya, to'plash va chiziqli bo'lmagan faollashtirish funktsiyalari
  • Kenglik xususiyatlarini ajratib olish uchun konvolyutsiyadan foydalanish (konvolyutsiya dastlab retseptiv maydon deb atalgan)
  • Subsampling o'rtacha hovuz qatlami
  • tanh faollashtirish funktsiyasi
  • MLP-ni oxirgi klassifikator sifatida ishlatish
  • Hisoblashning murakkabligini kamaytirish uchun qatlamlar orasidagi siyrak aloqa

Ilova

Oddiy raqamli tasvirlarni tanib olish - bu LeNet-ning eng klassik ilovasi, chunki u ko'tarilgan.

Qachon Yann LeCun, va boshqalar LeNet-ning boshlang'ich shaklini 1989 yilda ko'targan. Qog'oz Backpropagation qo'lda yozilgan pochta kodini aniqlashda qo'llaniladi[1] bunday cheklovlarni a-ga qanday qilib qo'shish mumkinligini namoyish etadi orqaga targ'ib qilish tarmoq arxitekturasi orqali tarmoq. Va bu AQSh pochta xizmati tomonidan taqdim etilgan qo'l yozuvi pochta indeksi raqamlarini tanib olish uchun muvaffaqiyatli qo'llanildi.[1]

Rivojlanishni tahlil qilish

LeNet5 paydo bo'lishini anglatadi CNN ning asosiy tarkibiy qismlarini belgilaydi CNN.[4] Ammo o'sha paytda u apparat uskunalari, xususan GPU (Grafika ishlov berish bo'limi, ixtisoslashgan) etishmasligi sababli mashhur emas edi elektron sxema tezda manipulyatsiya qilish va o'zgartirish uchun mo'ljallangan xotira yaratilishini tezlashtirish uchun tasvirlar a ramka buferi ga chiqarish uchun mo'ljallangan displey qurilmasi ) va boshqa algoritm, masalan SVM shunga o'xshash effektlarga erishishi yoki hatto LeNet-dan oshib ketishi mumkin.

2012 yilda AlexNet muvaffaqiyatiga qadar, CNN kompyuterni ko'rish dasturlari va turli xil turlari uchun eng yaxshi tanlovga aylandi CNN ko'tarilgan, masalan, R-CNN seriyali. Shu kunlarda, CNN modellar Lenetdan ancha farq qiladi, ammo ularning barchasi LeNet asosida ishlab chiqilgan.

Adabiyotlar

  1. ^ a b v d e LeCun, Y .; Boser, B .; Denker, J. S .; Xenderson, D.; Xovard, R. E .; Xabard, V.; Jackel, L. D. (1989 yil dekabr). "Backpropagation qo'lda yozilgan pochta kodini aniqlashda qo'llaniladi". Asabiy hisoblash. 1 (4): 541–551. doi:10.1162 / neco.1989.1.4.541. ISSN  0899-7667.
  2. ^ a b Lekun, Yann (iyun 1989). "Umumlashtirish va tarmoqni loyihalash strategiyasi" (PDF). Texnik hisobot CRG-TR-89-4. Toronto universiteti kompyuter fanlari kafedrasi.
  3. ^ a b LeCun, Y .; Boser, B .; Denker, J. S .; Xenderson, D.; Xovard, R. E .; Xabard, V.; Jacker, L. D. (iyun 1990). "Orqaga tarqatish tarmog'i bilan qo'lda yozilgan raqamlarni aniqlash" (PDF). Asabli axborotni qayta ishlash tizimidagi yutuqlar 2: 396–404.
  4. ^ a b v Lekun, Y .; Bottu, L.; Bengio, Y .; Xaffner, P. (1998). "Hujjatlarni tanib olish uchun qo'llaniladigan gradyan asosida o'qitish" (PDF). IEEE ish yuritish. 86 (11): 2278–2324. doi:10.1109/5.726791.
  5. ^ "卷积 神经 网络 之 LeNet - Brook_icv - 博客 园". www.cnblogs.com (xitoy tilida). Olingan 2019-11-16.
  6. ^ blog.csdn.net https://blog.csdn.net/happyorg/article/details/78274066. Olingan 2019-11-16. Yo'qolgan yoki bo'sh sarlavha = (Yordam bering)