Viola-Jons ob'ektlarini aniqlash doirasi - Viola–Jones object detection framework - Wikipedia

The Viola-Jons ob'ektlarini aniqlash doirasi bu ob'ektni aniqlash tomonidan 2001 yilda taklif qilingan ramka Pol Viola va Maykl Jons.[1][2] Garchi uni turli xil ob'ekt sinflarini aniqlashga o'rgatish mumkin bo'lsa-da, uni birinchi navbatda muammosi undagan yuzni aniqlash.

Muammoning tavsifi

Muammoni hal qilish - bu tasvirdagi yuzlarni aniqlash. Inson buni osonlikcha bajara oladi, ammo kompyuterga aniq ko'rsatmalar va cheklovlar kerak. Vazifani boshqarishni osonlashtirish uchun Viola-Jons old tomondan tik yuzlarni to'liq ko'rishni talab qiladi. Shunday qilib, aniqlanish uchun butun yuz kameraga yo'naltirilgan bo'lishi kerak va uni ikki tomonga o'girmaslik kerak. Aftidan, bu cheklovlar algoritmning yordam dasturini biroz pasaytirishi mumkin, chunki aniqlash bosqichi ko'pincha tanib olish bosqichi bilan amalga oshiriladi, amalda bu pozitsiya cheklovlari juda maqbuldir.

Ramkaning tarkibiy qismlari

Ilovani aniqlash oynasiga nisbatan ko'rsatilgan to'rtburchakning namunaviy xususiyatlari

Xususiyat turlari va baholash

Viola-Jons algoritmining xususiyatlari uni yaxshi aniqlash algoritmiga aylantiradi:

  • Sog'lom - juda yuqori aniqlanish darajasi (haqiqiy ijobiy ko'rsatkich) va har doim juda past noto'g'ri ijobiy ko'rsatkich.
  • Haqiqiy vaqt - Amaliy dasturlar uchun soniyada kamida 2 ta kadrni qayta ishlash kerak.
  • Faqatgina yuzni aniqlash (tanib bo'lmaslik) - Maqsad yuzlarni yuzdan ajratish (aniqlash - tanib olish jarayonidagi birinchi qadam).

Algoritm to'rt bosqichdan iborat:

  1. Haar xususiyatlarini tanlash
  2. Integral tasvirni yaratish
  3. Adaboost Training
  4. Kaskadli tasniflagichlar

Aniqlash doirasi tomonidan qidirilayotgan funktsiyalar universal ravishda to'rtburchaklar sohadagi tasvir piksellarining yig'indisini o'z ichiga oladi. Shunday qilib, ular bir oz o'xshashdir Haar asosidagi funktsiyalar, tasvirga asoslangan ob'ektni aniqlash sohasida ilgari ishlatilgan.[3] Biroq, Viola va Jons tomonidan ishlatiladigan xususiyatlarning barchasi bir nechta to'rtburchaklar maydonga asoslanganligi sababli, ular odatda ancha murakkab. O'ngdagi rasm ramkada ishlatiladigan to'rt xil xususiyatlarni aks ettiradi. Har qanday berilgan xususiyatning qiymati shaffof to'rtburchaklar ichidagi piksellarning yig'indisi bo'lib, soyali to'rtburchaklar ichidagi piksellar yig'indisidan olinadi. Kabi to'rtburchaklar xususiyatlar, masalan, alternativalar bilan taqqoslaganda ibtidoiy boshqariladigan filtrlar. Ular vertikal va gorizontal xususiyatlarga sezgir bo'lishiga qaramay, ularning mulohazalari ancha qo'polroq.

Burun ko'prigiga o'xshash Haar xususiyati yuzga surtiladi
Haar xususiyati ko'zning yuziga o'xshaydi, u yuqori yonoqlardan qorong'iroq, yuzga surtiladi
Haarning 3-chi va 4-chi turi

Haar xususiyatlari

Barcha inson yuzlari o'xshash xususiyatlarga ega. Ushbu qonuniyatlar yordamida mos kelishi mumkin Haar xususiyatlari.

Inson yuzlariga xos bo'lgan bir nechta xususiyatlar:

  • Ko'z mintaqasi yuqori yonoqlardan ko'ra quyuqroq.
  • Burun ko'prigi mintaqasi ko'zlarga qaraganda yorqinroq.

Mos keladigan yuz xususiyatlarini shakllantiruvchi xususiyatlarning tarkibi:

  • Joylashuvi va kattaligi: ko'zlar, og'iz, burun ko'prigi
  • Qiymat: piksel intensivligining yo'naltirilgan gradyanlari

Ushbu algoritmga mos keladigan to'rtta xususiyat keyin yuzning qiyofasida izlanadi (o'ngda ko'rsatilgan).

To'rtburchak xususiyatlari:

  • Qiymat = Σ (qora maydondagi piksellar) - Σ (oq rangli piksellar)
  • Uch xil: ikki, uch, to'rt to'rtburchaklar, Viola va Jons ikkita to'rtburchak xususiyatlaridan foydalangan
  • Masalan: ma'lum bir maydon bo'yicha oq va qora to'rtburchaklar orasidagi nashrida farqi
  • Har bir xususiyat pastki oynadagi maxsus joy bilan bog'liq

Umumiy maydon jadvali

Tasvirlangan tasvir ajralmas tasvir da to'rtburchaklar xususiyatlarini baholaydi doimiy vaqt, bu ularga zamonaviy alternativ xususiyatlarga nisbatan tezlikda katta ustunlik beradi. Har bir xususiyatning to'rtburchaklar maydoni har doim kamida bitta to'rtburchaklar bilan yonma-yon joylashganligi sababli, har qanday ikkita to'rtburchak xususiyatni oltita, uchta to'rtburchak funktsiyani sakkiztada va to'rtburchakning xususiyatlarini to'qqiztasida hisoblash mumkin.

Algoritmni o'rganish

Xususiyatlarni baholash tezligi ularning sonini etarli darajada qoplay olmaydi. Masalan, standart 24x24 pikselli pastki oynada jami M = 162,336[4] mumkin bo'lgan xususiyatlar va tasvirni sinovdan o'tkazishda ularning barchasini baholash juda qimmatga tushadi. Shunday qilib, ob'ektni aniqlash doirasi o'quv algoritmining bir variantidan foydalanadi AdaBoost ikkalasi ham eng yaxshi xususiyatlarni tanlash va ulardan foydalanadigan klassifikatorlarni tayyorlash. Ushbu algoritm "kuchli" klassifikatorni vaznli oddiy "zaif" tasniflagichlarning chiziqli birikmasi sifatida tuzadi.

Har bir zaif klassifikator - bu xususiyatga asoslangan chegara funktsiyasi .

Chegara qiymati va kutupluluk mashg'ulotlarda, shuningdek koeffitsientlarda aniqlanadi .

Bu erda o'quv algoritmining soddalashtirilgan versiyasi haqida xabar berilgan:[5]

Kiritish: To'plam N ularning yorliqlari bilan ijobiy va salbiy o'quv rasmlari . Agar rasm bo'lsa men bu yuz , Agar unday bo'lmasa .

  1. Initsializatsiya: og'irlikni tayinlang har bir rasmga men.
  2. Har bir xususiyat uchun bilan
    1. Og'irliklarni qayta tiklang, shunda ular bitta yig'indiga to'g'ri keladi.
    2. Mashg'ulot to'plamidagi har bir rasmga xususiyatni qo'llang, so'ngra eng yaxshi pol va kutupluluğu toping bu tortilgan tasnif xatosini minimallashtiradi. Anavi qayerda
    3. Og'irlikni tayinlang ga bu xato darajasi bilan teskari proportsionaldir. Shu tarzda eng yaxshi klassifikatorlar ko'proq hisoblanadi.
    4. Keyingi takrorlash uchun og'irliklar, ya'ni. , tasvirlar uchun qisqartirilgan men to'g'ri tasniflangan.
  3. Yakuniy tasniflagichni o'rnating

Kaskad me'morchiligi

  • O'rtacha barcha pastki oynalarning atigi 0,01% ijobiy (yuzlar)
  • Barcha pastki oynalarda teng hisoblash vaqti sarflanadi
  • Ko'p vaqtni faqat ijobiy bo'lishi mumkin bo'lgan pastki oynalarga sarflash kerak.
  • Oddiy 2 funktsiyali klassifikator 50% FP darajasi bilan deyarli 100% aniqlanish darajasiga erishishi mumkin.
  • Ushbu tasniflagich ko'pgina salbiy oynalarni filtrlash uchun ketma-ketlikning 1-qatlami vazifasini bajarishi mumkin
  • 10 ta xususiyatga ega bo'lgan 2-qavat, 1-qavatdan omon qolgan "qattiqroq" salbiy oynalar bilan kurashishi mumkin va hokazo ...
  • Asta-sekin murakkabroq klassifikatorlar kaskadi aniqlanish ko'rsatkichlarini yanada yaxshilaydi. O'quv jarayoni natijasida hosil bo'lgan kuchli tasniflagichlarni baholash tezda amalga oshirilishi mumkin, ammo bu real vaqtda ishlash uchun etarli emas. Shu sababli kuchli tasniflagichlar murakkablik tartibida kaskadga joylashtirilgan bo'lib, har bir ketma-ket klassifikator faqat oldingi klassifikatorlardan o'tgan tanlangan namunalar bo'yicha o'qitiladi. Agar kaskadning biron bir bosqichida klassifikator tekshirilayotgan pastki oynani rad etsa, qo'shimcha ishlov berilmaydi va keyingi pastki oynani qidirishda davom eting. Shuning uchun kaskad degenerat daraxtiga ega. Yuzlarga kelsak, kaskaddagi birinchi klassifikator - diqqat operatori deb ataladi - yolg'on manfiy stavka taxminan 0% va soxta ijobiy stavka 40% ga erishish uchun faqat ikkita xususiyatdan foydalaniladi.[6] Ushbu bitta klassifikatorning ta'siri butun kaskadni taxminan yarim marta kamaytirishni kamaytirishdan iborat.

Kaskadda har bir bosqich kuchli tasniflagichdan iborat. Shunday qilib, barcha xususiyatlar har bir bosqich ma'lum sonli xususiyatlarga ega bo'lgan bir necha bosqichlarga birlashtirilgan.

Har bir bosqichning vazifasi - berilgan pastki oynaning yuz emasligini yoki yuz bo'lishi mumkinligini aniqlash. Berilgan pastki oyna darhol biron bir bosqichda ishlamay qolsa, yuz emas deb tashlanadi.

Kaskadli mashg'ulotlar uchun oddiy asos quyida keltirilgan:

  • f = bir qatlam uchun maksimal qabul qilinadigan noto'g'ri ijobiy stavka.
  • d = bir qatlam uchun minimal qabul qilinadigan aniqlanish darajasi.
  • Ftarget = maqsadli umumiy noto'g'ri ijobiy ko'rsatkich.
  • P = ijobiy misollar to'plami.
  • N = salbiy misollar to'plami.
F (0) = 1.0; D (0) = 1,0; i = 0esa F (i)> Ftarget kattalashtirish; ko'paytirish i n (i) = 0; F (i) = F (i-1) esa F (i)> f × F (i-1) kattalashtirish; ko'paytirish n (i) yordamida n va (I) xususiyatlarga ega bo'lgan klassifikatorni o'rgatish uchun P va N dan foydalaning AdaBoost        F (i) va D (i) ni aniqlash uchun tasdiqlash to'plamidagi joriy kaskadli tasniflagichni baholang pasayish ith klassifikatori uchun chegara (ya'ni kuchli tasniflagichni qabul qilish uchun qancha kuchsiz tasniflagichni qabul qilishi kerak) qadar joriy kaskadli klassifikator kamida d × D (i-1) aniqlash tezligiga ega (bu F (i)) ta'sir qiladi N = ∅ agar F (i)> Ftarget keyin         yuzli bo'lmagan tasvirlar to'plamidagi hozirgi kaskadli detektorni baholang va N to'plamiga har qanday soxta detektorlarni qo'ying.

Kassad arxitekturasi individual tasniflagichlarning ishlashi uchun qiziqarli natijalarga ega. Har bir klassifikatorning faollashishi butunlay avvalgisining xatti-harakatiga bog'liq bo'lgani uchun, butun kaskad uchun noto'g'ri ijobiy stavka:

Xuddi shunday, aniqlash darajasi:

Shunday qilib, odatda boshqa detektorlar tomonidan erishilgan soxta ijobiy ko'rsatkichlarga mos kelish uchun har bir klassifikator hayratlanarli darajada past ko'rsatkichlarga ega bo'lishi mumkin. Masalan, 32 bosqichli kaskad uchun soxta ijobiy 10 ga erishish6, har bir tasniflagich atigi 65% ga teng bo'lgan ijobiy ijobiy ko'rsatkichga erishishi kerak. Shu bilan birga, shu bilan birga, har bir klassifikator etarli darajada aniqlash qobiliyatiga ega bo'lishi kerak. Masalan, aniqlanish tezligini taxminan 90% ga erishish uchun yuqorida aytib o'tilgan kaskaddagi har bir klassifikator taxminan 99,7% ni aniqlash darajasiga erishishi kerak.[7]

Ob'ektni kuzatish uchun Viola-Jonsdan foydalanish

Harakatlanayotgan narsalarning videoyozuvlarida har bir freymga ob'ektni aniqlash kerak emas. Buning o'rniga, kabi kuzatuv algoritmlaridan foydalanish mumkin KLT algoritmi aniqlash chegaralovchi qutilaridagi taniqli xususiyatlarni aniqlash va ularning ramkalar orasidagi harakatini kuzatish. Bu nafaqat har bir kadrdagi moslamalarni qayta aniqlash zaruratini olib tashlash orqali kuzatuv tezligini yaxshilaydi, balki mustahkamlikni ham yaxshilaydi, chunki taniqli xususiyatlar Viyola-Jonsni aniqlash doirasidan ko'ra aylanish va fotometrik o'zgarishlarga nisbatan ancha bardoshlidir.[8]

Adabiyotlar

  1. ^ Oddiy funktsiyalarning kuchaytirilgan kaskadi yordamida ob'ektni tezkor aniqlash
  2. ^ Viola, Jons: Ob'ektni real vaqtda ishonchli aniqlash, IJCV 2001 yil 1,3 sahifalarga qarang.
  3. ^ C. Papageorgiou, M. Oren va T. Poggio. Ob'ektlarni aniqlash uchun umumiy asos. Kompyuterni ko'rish bo'yicha xalqaro konferentsiya, 1998
  4. ^ "Viola-Jonsning yuzini aniqlash 180 k xususiyatlarini da'vo qilmoqda". stackoverflow.com. Olingan 2017-06-27.
  5. ^ R. Szeliski, Computer Vision, algoritmlari va ilovalari, Springer
  6. ^ Viola, Jons: Ob'ektni real vaqtda ishonchli aniqlash, IJCV 2001 yil 11-betga qarang.
  7. ^ Torbert, Sheyn (2016). Amaliy kompyuter fanlari (2-nashr). Springer. 122-131 betlar.
  8. ^ KLT algoritmi yordamida yuzni aniqlash va kuzatib borish

Tashqi havolalar

Amaliyotlar