Bir-issiq - One-hot - Wikipedia

IkkilikKulrang kodBir-issiq
00000000000001
00100100000010
01001100000100
01101000001000
10011000010000
10111100100000
11010101000000
11110010000000

Yilda raqamli davrlar va mashinada o'rganish, a bitta issiq guruhidir bitlar ularning orasida qadriyatlar qonuniy kombinatsiyalari faqat bitta yuqori (1) bitga, qolganlari esa past (0) ga teng.[1] Bitta "0" dan tashqari barcha bitlar "1" bo'lgan shunga o'xshash dastur ba'zan chaqiriladi bir sovuq.[2] Yilda statistika, qo'g'irchoq o'zgaruvchilar vakillik qilish uchun o'xshash texnikani ifodalaydi to'liq ma'lumotlar.

Ilovalar

A holatini ko'rsatish uchun ko'pincha bitta issiq kodlash ishlatiladi davlat mashinasi. Foydalanishda ikkilik yoki Kulrang kod, a dekoder holatini aniqlash uchun kerak. Biroq, bitta issiq holatdagi mashinada dekoder kerak emas, chunki davlat mashinasi mavjud nth holati va agar bo'lsa nbit yuqori.

A halqa hisoblagichi ketma-ket tartiblangan 15 holati bilan davlat mashinasining namunasidir. "Bir martalik" dastur 15 ga teng bo'ladi sohil shippaklari ketma-ket zanjirlangan bo'lib, har bir flip flopning Q chiqishi keyingisining D kirishiga ulanadi va birinchi flip flopning D usuli bilan 15-flip flopining Q chiqishiga ulanadi. Zanjirdagi birinchi flip flop birinchi holatni, ikkinchisi ikkinchi holatni va shunga o'xshash oxirgi holatni ko'rsatadigan 15-flip flopni anglatadi. Vaziyat mashinasi tiklangandan so'ng, barcha flip-floplar "0" ga o'rnatiladi, zanjirning birinchisi "1" ga o'rnatiladi. Flip-floplarga kelgan navbatdagi soat chekkasi "issiq" bitni ikkinchi flip flopga o'tkazadi. "Issiq" bit shu tarzda 15-holatga qadar o'sib boradi, shundan so'ng holat mashinasi birinchi holatga qaytadi.

An manzil dekoderi ikkilik yoki Grey kodidan bir martalik vakolatxonaga o'zgartiradi.A ustuvor kodlovchi bir martalik vakolatxonadan ikkilik yoki Grey kodga o'zgartiradi.

Yilda tabiiy tilni qayta ishlash, bitta issiq vektor 1 ×N lug'at tarkibidagi har bir so'zni boshqa so'zlardan ajratish uchun ishlatiladigan matritsa (vektor). So'zni aniqlash uchun yagona ishlatiladigan katakchadagi bitta 1 bundan mustasno, vektor barcha hujayralardagi 0lardan iborat. Bitta issiq kodlash mashinani o'rganish yuqori raqamlar muhimroq deb o'ylamasligini ta'minlaydi. Masalan, "8" qiymati "1" qiymatidan kattaroq, ammo bu "8" ni "1" dan muhimroq qilmaydi. So'zlar uchun ham xuddi shunday: "Nyu-York" qiymati "York" dan muhim emas.

Mashinada o'qitishda bir martalik kodlash tez-tez ishlatiladigan, toifadagi ma'lumotlar bilan ishlash usulidir. Ko'pgina mashinasozlik modellari ularning kirish o'zgaruvchilarining raqamli bo'lishiga muhtoj bo'lgani uchun, kategoriyali o'zgaruvchilar oldindan ishlov berish qismida o'zgartirilishi kerak. [3]

Yorliqlarni kodlash
Ovqat nomiKategorik #Kaloriya
olma195
Tovuq2231
Brokkoli350
Bitta issiq kodlash
olmaTovuqBrokkoliKaloriya
10095
010231
00150

Kategorik ma'lumotlar nominal yoki tartibli bo'lishi mumkin [4]. Oddiy ma'lumotlar uning qiymatlari bo'yicha tartiblangan tartibga ega va shuning uchun tartibli kodlash orqali raqamli ma'lumotlarga aylantirilishi mumkin [5]. Tartibli ma'lumotlarning misoli A dan F gacha bo'lgan test natijalari bo'lib, ularni 6 dan 1 gacha bo'lgan raqamlar yordamida saralash mumkin edi, chunki nominal o'zgaruvchilarning individual qiymatlari o'rtasida miqdoriy bog'liqlik mavjud emas, tartibli kodlash yordamida xayoliy narsa yaratilishi mumkin. ma'lumotlardagi tartib munosabati [6]. Shuning uchun algoritmning ish faoliyatini yaxshilash uchun tez-tez nominal o'zgaruvchilarga bitta issiq kodlash qo'llaniladi.

Asl kategorik ustundagi har bir noyob qiymat uchun ushbu usulda yangi ustun yaratiladi. Keyinchalik, bu qo'pol o'zgaruvchilar nollar va bittalar bilan to'ldiriladi (1 HAQI, 0 YANGI degan ma'noni anglatadi) [7].

Ushbu jarayon bir nechta yangi o'zgaruvchilarni yaratganligi sababli, asl ustunda juda ko'p noyob qiymatlar mavjud bo'lsa, u katta p muammosini (juda ko'p taxminchilar) yaratishga moyil. Bitta issiq kodlashning yana bir salbiy tomoni shundaki, u individual o'zgaruvchilar o'rtasida multikollinerlikni keltirib chiqaradi, bu esa modelning aniqligini pasaytiradi. [8].

Bundan tashqari, agar kategorik o'zgaruvchi chiqish o'zgaruvchisi bo'lsa, siz ularni o'zingizning ilovangizda ko'rsatish uchun qiymatlarni kategorik shaklga qaytarishni xohlashingiz mumkin. [9].

Amaliy foydalanishda ushbu transformatsiya to'g'ridan-to'g'ri to'g'ridan-to'g'ri funktsiya tomonidan amalga oshiriladi, bu kategorik ma'lumotlarni kirish sifatida qabul qiladi va tegishli qo'g'irchoq o'zgaruvchilarni chiqaradi. Caret kutubxonasining dummyVars funktsiyasi bunga misol bo'lishi mumkin. [10].


Boshqa kodlash usullaridan farqlari

Afzalliklari

  • Shtatni aniqlash, unga kirish uchun past va doimiy xarajatlarga ega sohil shippaklari
  • Vaziyatni o'zgartirish ikkita flip-flopga kirish uchun doimiy xarajatlarga ega
  • Loyihalash va o'zgartirish oson
  • Noqonuniy davlatlarni aniqlash oson
  • Afzalliklaridan foydalanadi FPGA mo'l-ko'l flip-floplar

Bitta issiq dasturdan foydalanish, odatda, davlat mashinasiga ushbu davlat mashinasining boshqa har qanday kodlashiga qaraganda tezroq soat tezligida ishlashga imkon beradi.[11]

Kamchiliklari

  • Boshqa kodlashlarga qaraganda ko'proq flip-floplarni talab qiladi, buning uchun amaliy emas PAL qurilmalar
  • Ko'pgina shtatlar noqonuniy hisoblanadi[12]

Shuningdek qarang

Adabiyotlar

  1. ^ Xarris, Devid va Xarris, Sara (2012-08-07). Raqamli dizayn va kompyuter arxitekturasi (2-nashr). San-Frantsisko, Kalif.: Morgan Kaufmann. p. 129. ISBN  978-0-12-394424-5.
  2. ^ "Oziq-ovqat uchun xavfli bo'lgan arabcha matnlarni chuqur o'rganishga asoslangan tadbirlarni o'tkazish". arXiv:2008.05014. Iqtibos jurnali talab qiladi | jurnal = (Yordam bering)
  3. ^ Braunli, Jeyson. (2017). "Nima uchun kompyuterni o'qitishda ma'lumotlarni bir martalik kodlash kerak?". Mashinasozlik texnikasi. https://machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/
  4. ^ Stivens, S. S. (1946). "O'lchov o'lchovlari nazariyasi to'g'risida". Ilm-fan, yangi seriyalar, 103.2684, 677-680-betlar. http://www.jstor.org/stable/1671815.
  5. ^ Braunli, Jeyson. (2020). "Kategorik ma'lumotlar uchun oddiy va bir xil kodlash". Mashinasozlik texnikasi. https://machinelearningmastery.com/one-hot-encoding-for-categorical-data//
  6. ^ Braunli, Jeyson. (2020). "Kategorik ma'lumotlar uchun oddiy va bir xil kodlash". Mashinasozlik texnikasi. https://machinelearningmastery.com/one-hot-encoding-for-categorical-data//
  7. ^ Dinesh, Yadav. (2019). "Label-Encoding va One-Hot-Encoder yordamida kategorik kodlash". Ma'lumotlar faniga qarab. https://towardsdatascience.com/categorical-encoding-using-label-encoding-and-one-hot-encoder-911ef77fb5bd
  8. ^ Andre, Ye. (2020). "Kategorik o'zgaruvchilaringizni bir martalik kodlashni to'xtating.". Ma'lumotlar faniga qarab. https://towardsdatascience.com/stop-one-hot-encoding-your-categorical-variables-bbb0fba89809
  9. ^ Braunli, Jeyson. (2017). "Nima uchun kompyuterni o'qitishda ma'lumotlarni bir martalik kodlash kerak?". Mashinasozlik texnikasi. https://machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/
  10. ^ Kun, Maks. "Qo'g'irchoqlar". RD hujjatlari. https://www.rdocumentation.org/packages/caret/versions/6.0-86/topics/dummyVars
  11. ^ Xilinx."FPGA-lar uchun HDL sintezi dizayn qo'llanmasi".boshqa 3.13: "Davlat mashinalarini kodlash" .A ilova: "FPGA makroslarini bir martalik yondashuv bilan tezlashtirish" .1995.
  12. ^ Koen, Ben (2002). Haqiqiy chip dizayni va Verilog va VHDL yordamida tekshirish. Palos Verdes yarimoroli, Kaliforniya, AQSh: VhdlCohen nashriyoti. p. 48. ISBN  0-9705394-2-8.