Chalkashlik matritsasi - Confusion matrix

Terminologiya va hosilalar
dan chalkashlik matritsasi
holat ijobiy (P)
ma'lumotlardagi haqiqiy ijobiy holatlar soni
holat salbiy (N)
ma'lumotlardagi haqiqiy salbiy holatlar soni

haqiqiy ijobiy (TP)
ekv. urish bilan
haqiqiy salbiy (TN)
ekv. to'g'ri rad etish bilan
noto'g'ri ijobiy (FP)
ekv. bilan yolg'on signal, I toifa xatosi
noto'g'ri salbiy (FN)
ekv. sog'inib, II turdagi xato

sezgirlik, eslash, urish darajasi, yoki haqiqiy ijobiy stavka (TPR)
o'ziga xoslik, selektivlik yoki haqiqiy salbiy ko'rsatkich (TNR)
aniqlik yoki ijobiy bashorat qiluvchi qiymat (PPV)
salbiy taxminiy qiymat (NPV)
o'tkazib yuborish darajasi yoki noto'g'ri salbiy stavka (FNR)
qatordan chiqib ketish yoki noto'g'ri ijobiy stavka (FPR)
noto'g'ri kashfiyot darajasi (FDR)
noto'g'ri tashlab qo'yish darajasi (UCHUN)
Tarqalish chegarasi (PT)
Tahdid ballari (TS) yoki muhim muvaffaqiyat ko'rsatkichi (CSI)

aniqlik (ACC)
muvozanatli aniqlik (BA)
F1 bal
bo'ladi garmonik o'rtacha ning aniqlik va sezgirlik
Metyusning o'zaro bog'liqlik koeffitsienti (MCC)
Fowlkes-Mallows indeksi (FM)
xabardorlik yoki bukmeykerlarning xabardorligi (BM)
aniqlik (MK) yoki deltaP

Manbalar: Favett (2006),[1] Kuchlar (2011),[2] Ting (2011),[3], CAWCR[4] D. Chicco va G. Jurman (2020),[5] Tarvat (2018).[6]

Sohasida mashinada o'rganish va xususan muammo statistik tasnif, a chalkashlik matritsasi, xato matritsasi deb ham ataladi,[7] algoritmning ishlashini vizuallashtirishga imkon beradigan, odatda a nazorat ostida o'rganish bittasi nazoratsiz o'rganish u odatda a deb nomlanadi mos keladigan matritsa). Ning har bir qatori matritsa taxmin qilingan sinfdagi misollarni aks ettiradi, har bir ustun haqiqiy sinfdagi misollarni aks ettiradi (yoki aksincha).[8] Ism tizimning ikkita sinfni chalkashtirib yubormasligini (ya'ni, boshqasini boshqasiga noto'g'ri yozish) aniqlashni osonlashtirishi bilan bog'liq.

Bu alohida turdagi favqulodda vaziyatlar jadvali, ikkita o'lchovli ("haqiqiy" va "bashorat qilingan") va ikkala o'lchovdagi bir xil "sinflar" to'plamlari (o'lchov va sinfning har bir kombinatsiyasi kutilmagan holatlar jadvalidagi o'zgaruvchidir).

Misol

Mushuklar 1-sinfga va itlar 0-sinfga mansub 13 ta rasmdan, 8 ta mushuk va 5 ta itdan namunalar berilgan,

haqiqiy = [1,1,1,1,1,1,1,1,0,0,0,0,0],

mushuk va itlarni ajratib turuvchi klassifikator o'qitilgan deb taxmin qiling va biz 13 ta rasmni olib, ularni klassifikator orqali o'tkazamiz va tasniflagich 8 ta aniq bashorat qiladi va 5: 3 mushuklar itlar deb noto'g'ri prognoz qilingan (birinchi 3 ta bashorat) va 2 mushuklar deb noto'g'ri itlar bashorat qilgan (oxirgi 2 ta bashorat).

bashorat = [0,0,0,1,1,1,1,1,0,0,0,1,1,1]

Ushbu ikkita etiketli to'plamlar (haqiqiy va bashoratlar) yordamida biz tasniflagichni sinash natijalarini sarhisob qiladigan chalkashlik matritsasini yaratishimiz mumkin:

Haqiqiy sinf
MushukIt
Bashorat qilingan
sinf
Mushuk52
It33

Ushbu chalkashlik matritsasida, 8 ta mushuk rasmining 3 tasi it, 5 ta itning rasmining 2 tasi mushuk deb taxmin qilgan. Barcha to'g'ri bashoratlar jadvalning diagonalida joylashgan (qalin harflar bilan ajratilgan), shuning uchun jadvalni taxmin qilish xatolarini vizual tekshirish oson, chunki ular diagonali tashqarisidagi qiymatlar bilan ifodalanadi.

Abstrakt ma'noda chalkashlik matritsasi quyidagicha:

Haqiqiy sinf
PN
Bashorat qilingan
sinf
PTPFP
NFNTN

bu erda: P = ijobiy; N = salbiy; TP = Haqiqiy ijobiy; FP = Noto'g'ri ijobiy; TN = Haqiqiy salbiy; FN = Soxta Salbiy.

Chalkashliklar jadvali

Yilda bashoratli tahlil, a tartibsizlik jadvali (ba'zida a deb ham nomlanadi chalkashlik matritsasi) - bu ikki qatorli va ikkita sonli ustunlarni o'z ichiga olgan jadval yolg'on ijobiy, yolg'on salbiy, haqiqiy ijobiyva haqiqiy salbiy. Bu to'g'ri tasniflarning nisbati (aniqligi) dan ko'ra batafsilroq tahlil qilish imkonini beradi. Ma'lumotlar to'plami muvozanatsiz bo'lsa, aniqlik noto'g'ri natijalarga olib keladi; ya'ni turli sinflardagi kuzatuvlar soni katta farq qilganda. Misol uchun, agar ma'lumotlarda 95 ta mushuk va faqat 5 ta it bo'lsa, ma'lum bir klassifikator barcha kuzatuvlarni mushuk deb tasniflashi mumkin. Umumiy aniqlik 95% ni tashkil qiladi, ammo batafsilroq tasniflagich 100% tanib olish darajasiga ega bo'ladi (sezgirlik ) mushuklar sinfi uchun, lekin itlar sinfi uchun 0% tan olish darajasi. F1 bal Bunday holatlarda yanada ishonchsizroq va bu erda 97,4% dan ortiq hosil olinadi, holbuki xabardorlik har qanday taxmin shakli (bu erda har doim mushukni taxmin qilish) uchun asosli qarorni qabul qilish ehtimoli kabi bunday noto'g'ri va 0 ni beradi.

Davide Chikko va Juzeppe Yurmanning so'zlariga ko'ra, chalkashlik matritsasini baholash uchun eng ma'lumotli metrik Metyus korrelyatsiya koeffitsienti (MCC).[9]

Yuqoridagi chalkashlik matritsasini faraz qilsak, uning mushuklar sinfi uchun tegishli tartibsizlik jadvali quyidagicha bo'ladi:

Haqiqiy sinf
MushukMushuk emas
Bashorat qilingan
sinf
Mushuk5 Haqiqiy ijobiy2 yolg'on ijobiy
Mushuk emas3 yolg'on salbiy3 Haqiqiy salbiy

Chalkashlikning yakuniy jadvali birlashtirilgan barcha sinflar uchun o'rtacha qiymatlarni o'z ichiga oladi.

Keling, tajribani aniqlaymiz P ijobiy holatlar va N ba'zi holatlar uchun salbiy holatlar. To'rt natijani 2 × 2 shaklida shakllantirish mumkin chalkashlik matritsasi, quyidagicha:

Haqiqiy holat
Jami aholiVaziyat ijobiyVaziyat salbiyTarqalishi = Ition shart ijobiy/Σ Jami aholiAniqlik (ACC) = Σ Haqiqiy ijobiy + Σ Haqiqiy salbiy/Σ Jami aholi
Bashorat qilingan holat
Bashorat qilingan holat
ijobiy
Haqiqiy ijobiyNoto'g'ri ijobiy,
I toifa xatosi
Ijobiy taxminiy qiymat (PPV), Aniqlik = Σ Haqiqiy ijobiy/Σ Bashorat qilingan holat ijobiyNoto'g'ri kashfiyot darajasi (FDR) = Σ Noto'g'ri ijobiy/Σ Bashorat qilingan holat ijobiy
Bashorat qilingan holat
salbiy
Noto'g'ri salbiy,
II turdagi xato
Haqiqiy salbiyNoto'g'ri tashlab qo'yish darajasi (FOR) = Se Soxta salbiy/Condition Bashorat qilingan holat salbiySalbiy bashorat qiluvchi qiymat (NPV) = Σ Haqiqiy salbiy/Condition Bashorat qilingan holat salbiy
Haqiqiy ijobiy stavka (TPR), Eslatib o'tamiz, Ta'sirchanlik, aniqlash ehtimoli, Quvvat = Σ Haqiqiy ijobiy/Ition shart ijobiyNoto'g'ri ijobiy stavka (FPR), Qatordan chiqib ketish, yolg'on signal berish ehtimoli = Σ Noto'g'ri ijobiy/Ition Ahvol salbiyIjobiy ehtimollik darajasi (LR +) = TPR/FPRDiagnostik stavkalar nisbati (DOR) = LR +/LR−F1 Xol = 2 · Aniqlik · Eslatib o'tamiz/Aniqlik + qaytarib olish
Soxta salbiy ko'rsatkich (FNR), Miss stavkasi = Se Soxta salbiy/Ition shart ijobiyXususiyat (SPC), selektivlik, Haqiqiy salbiy ko'rsatkich (TNR) = Σ Haqiqiy salbiy/Ition Ahvol salbiySalbiy ehtimollik darajasi (LR−) = FNR/TNR

Adabiyotlar

  1. ^ Faset, Tom (2006). "ROC tahliliga kirish" (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016 / j.patrec.2005.10.010.
  2. ^ Pauers, Devid M V (2011). "Baholash: aniqlik, qaytarib olish va F-o'lchovidan tortib ROCgacha, ma'lumotlilik, aniqlik va o'zaro bog'liqlik". Mashinali o'qitish texnologiyalari jurnali. 2 (1): 37–63.
  3. ^ Ting, Kay Ming (2011). Sammut, Klod; Uebb, Jefri I (tahr.). Mashinali o'qitish ensiklopediyasi. Springer. doi:10.1007/978-0-387-30164-8. ISBN  978-0-387-30164-8.
  4. ^ Bruks, Garold; Jigarrang, Barb; Ebert, Bet; Ferro, Kris; Jolliff, Yan; Koh, Tie-Yong; Ribber, Pol; Stivenson, Devid (2015-01-26). "Prognozlarni tekshirish bo'yicha WWRP / WGNE qo'shma ishchi guruhi". Avstraliya ob-havo va iqlim tadqiqotlari bo'yicha hamkorlik. Jahon meteorologiya tashkiloti. Olingan 2019-07-17.
  5. ^ Chicco D, Jurman G (yanvar 2020). "Metyus korrelyatsiya koeffitsientining (MCC) F1 balidan ustunligi va ikkilik tasnifni baholashda aniqligi". BMC Genomics. 21 (1): 6-1–6-13. doi:10.1186 / s12864-019-6413-7. PMC  6941312. PMID  31898477.
  6. ^ Tarvat A (2018 yil avgust). "Tasniflashni baholash usullari". Amaliy hisoblash va informatika. doi:10.1016 / j.aci.2018.08.003.
  7. ^ Stemman, Stiven V. (1997). "Tematik tasniflash aniqligining o'lchovlarini tanlash va talqin qilish". Atrof muhitni masofadan turib aniqlash. 62 (1): 77–89. Bibcode:1997RSEnv..62 ... 77S. doi:10.1016 / S0034-4257 (97) 00083-7.
  8. ^ Pauers, Devid M V (2011). "Baholash: aniqlik, qaytarib olish va F-o'lchovidan tortib ROCgacha, ma'lumotlilik, aniqlik va o'zaro bog'liqlik". Mashinali o'qitish texnologiyalari jurnali. 2 (1): 37–63. S2CID  55767944.
  9. ^ Chicco D, Jurman G (yanvar 2020). "Metyus korrelyatsiya koeffitsientining (MCC) F1 balidan ustunligi va ikkilik tasnifni baholashda aniqligi". BMC Genomics. 21 (1): 6-1–6-13. doi:10.1186 / s12864-019-6413-7. PMC  6941312. PMID  31898477.