Markov mukofot modeli - Markov reward model

Yilda ehtimollik nazariyasi, a Markov mukofot modeli yoki Markovni mukofotlash jarayoni yoki a ga cho'ziladigan stoxastik jarayon Markov zanjiri yoki doimiy Markov zanjiri har bir davlatga mukofot stavkasini qo'shish orqali. Qo'shimcha o'zgaruvchi joriy vaqtgacha to'plangan mukofotni qayd etadi.[1] Modelga qiziqishning o'ziga xos xususiyatlariga ma'lum bir vaqtda kutilgan mukofot va ushbu mukofotni to'plash uchun kutilgan vaqt kiradi.[2] Model paydo bo'ladi Ronald A. Xovard kitobi.[3] Modellar ko'pincha kontekstida o'rganiladi Markov qaror qabul qilish jarayonlari bu erda qaror strategiyasi olingan mukofotlarga ta'sir qilishi mumkin.

The Markov mukofotining namunaviy tekshiruvchisi Markov mukofot modellarining vaqtinchalik va statsionar xususiyatlarini raqamli hisoblash uchun ushbu vositadan foydalanish mumkin.

Markov zanjiri

Qarang Markov zanjiri

Qarang Monte Karlo Markov zanjiri

Doimiy Markov zanjiri

Bir vaqtning o'zida to'plangan mukofot t vaqt sohasi bo'yicha yoki konvertatsiya qilish usullari yoki cheklangan farq usullari yordamida to'plangan mukofotni tavsiflovchi chiziqli hiperbolik tenglamalar tizimini baholash orqali raqamli ravishda hisoblash mumkin.[4]

Adabiyotlar

  1. ^ Begain, K .; Bolch, G .; Herold, H. (2001). "Nazariy ma'lumot". Amaliy ishlashni modellashtirish. pp.9. doi:10.1007/978-1-4615-1387-2_2. ISBN  978-1-4613-5528-1.
  2. ^ Li, Q. L. (2010). "Markov mukofotlash jarayonlari". Ilovalar bilan stoxastik modellarda konstruktiv hisoblash. 526-573 betlar. doi:10.1007/978-3-642-11492-2_10. ISBN  978-3-642-11491-5.
  3. ^ Xovard, R.A. (1971). Dinamik ehtimol tizimlari, II jild: Yarim-Markov va qaror qabul qilish jarayonlari. Nyu-York: Vili. ISBN  0471416657.
  4. ^ Reybman, A .; Smit, R .; Trivedi, K. (1989). "Markov va Markov mukofot modelini vaqtincha tahlil qilish: raqamli yondashuvlarga umumiy nuqtai" (PDF). Evropa operatsion tadqiqotlar jurnali. 40 (2): 257. doi:10.1016/0377-2217(89)90335-4.