Drift va penalti - Drift plus penalty

Ehtimollarning matematik nazariyasida drift-plyus-penalti usuli optimallashtirish uchun ishlatiladi navbatdagi tarmoqlar va boshqalar stoxastik tizimlar.

Texnika navbatdagi tarmoqni barqarorlashtirish va shu bilan birga tarmoq jazosi funktsiyasining o'rtacha vaqtini minimallashtirish uchun mo'ljallangan. U o'rtacha vaqt quvvati, ishlash qobiliyati va ishlab chiqarish dasturi kabi ishlash maqsadlarini optimallashtirish uchun ishlatilishi mumkin.[1][2]Maxsus holatda minimallashtiriladigan jazo yo'q bo'lganda va maqsad ko'p hopli tarmoqdagi barqaror marshrutlash siyosatini ishlab chiqishda bo'lsa, bu usul kamayadi orqa bosimni yo'naltirish.[3][4]Drift-plus-penalti usuli o'rtacha vaqtni minimallashtirish uchun ham ishlatilishi mumkin stoxastik jarayon boshqa stoxastik jarayonlar to'plamidagi vaqt o'rtacha cheklovlariga bog'liq.[5]Bu tegishli to'plamni aniqlash orqali amalga oshiriladi virtual navbat. Bundan tashqari, vaqtni o'rtacha echimlarini ishlab chiqarish uchun foydalanish mumkin qavariq optimallashtirish muammolar. [6][7]

Metodika

Drift-plus-penalti usuli vaqt oralig'i bilan diskret vaqtda ishlaydigan navbat tizimlariga qo'llaniladi t {0, 1, 2, ...} da. Birinchidan, manfiy bo'lmagan funktsiya L(t) vaqtdagi barcha navbatlarning holatini skaler o'lchovi sifatida aniqlanadit. Funktsiya L(t) odatda barcha navbat o'lchamlari kvadratlarining yig'indisi sifatida aniqlanadi t, va deyiladi Lyapunov funktsiyasi. The Lyapunov drift belgilanadi:

Har bir bo'shliq t, joriy navbat holati kuzatiladi va quyidagilar bilan chegarani ochko'z minimallashtirish uchun nazorat choralari ko'riladi drift-plus-penalti ifodasi:

qayerda p(t) penya funktsiyasi, V esa manfiy bo'lmagan vazn. Vaqt o'rtacha qiymatini ta'minlash uchun V parametrini tanlash mumkin p(t) o'zboshimchalik bilan maqbul darajaga yaqin, o'rtacha navbat hajmi bo'yicha tegishli savdo-sotiq bilan. Yoqdi orqa bosimni yo'naltirish, bu usul, odatda, ish joyiga kelish va tarmoqning harakatchanligi uchun ehtimollik taqsimotini bilishni talab qilmaydi.[5]

Kelib chiqishi va qo'llanilishi

Qachon usul Lyapunov driftini ochko'zlik bilan minimallashtirishgacha kamaytiradi. Buning natijasi orqa bosimni yo'naltirish dastlab Tassiulas va Ephremides tomonidan ishlab chiqilgan algoritm (shuningdek, maksimal og'irlik algoritmi).[3][8] The muddat Nili tomonidan drift ifodasiga qo'shilgan[9] va Nili, Modiano, Li[2] tarmoqni barqarorlashtirish uchun, shuningdek, foydali dastur funktsiyasini maksimal darajaga ko'tarish uchun. Buning uchun penalti deb belgilangan edi marta mukofot uyasi Ushbu drift-plus-penalti texnikasi keyinchalik o'rtacha quvvatni minimallashtirish uchun ishlatilgan[1] va boshqa jazo va mukofot ko'rsatkichlarini optimallashtirish.[4][5]

Nazariya asosan aloqa tarmoqlarini, shu jumladan simsiz tarmoqlarni, uyali aloqa tarmoqlarini va boshqa kompyuter tarmoqlarini optimallashtirish uchun ishlab chiqilgan. Biroq, matematik metodlarni boshqa stoxastik tizimlar uchun optimallashtirish va boshqarish, shu jumladan qayta tiklanadigan energiyani taqsimlashda qo'llash mumkin. aqlli elektr tarmoqlari[10][11][12] va inventarizatsiyani nazorat qilish mahsulotni yig'ish tizimlari uchun.[13]

U qanday ishlaydi

Ushbu bo'limda boshqa funktsiyalar to'plamidagi vaqt o'rtacha cheklovlariga bog'liq holda p (t) funktsiyasining o'rtacha vaqtini minimallashtirish uchun drift-plus-penalti usuli qanday qo'llanilishi ko'rsatilgan. Quyidagi tahlil quyidagi materialga asoslangan.[5]

Stoxastik optimallashtirish muammosi

{0, 1, 2, ...} dagi normallashgan vaqt oralig'ida rivojlanayotgan diskret vaqt tizimini ko'rib chiqing. P (t) ni o'rtacha vaqt minimallashtirilishi kerak bo'lgan funktsiya sifatida aniqlang, a jarima funktsiyasi. $ P (t) $ o'rtacha vaqtini minimallashtirish $ K $ funktsiyalari to'plamidagi vaqt o'rtacha cheklovlari sharti bilan amalga oshirilishi kerak deylik:

Har bir uyasi t, tarmoq tekshiruvi yangi tasodifiy hodisani kuzatadi. Keyin ushbu voqea haqidagi bilimga asoslangan holda nazorat harakatini amalga oshiradi. P (t) va y_i (t) qiymatlari tasodifiy hodisaning funktsiyalari va t slotidagi boshqarish harakati sifatida aniqlanadi:

P (t), y_i (t) kichik harflar yozuvi va P (), Y_i () katta yozuvlar, jarima qiymatlarini tasodifiy hodisa va nazorat qilish harakati asosida ushbu qiymatlarni aniqlaydigan funktsiyadan ajratish uchun ishlatiladi. Tasodifiy hodisa ba'zi mavhum voqealar to'plamida qiymatlarni qabul qiladi deb taxmin qilinadi . Nazorat harakati ba'zi bir mavhum to'plam ichida tanlangan deb taxmin qilinadi boshqaruv parametrlarini o'z ichiga olgan. To'plamlar va ixtiyoriy va cheklangan yoki cheksiz bo'lishi mumkin. Masalan, mavhum elementlarning cheklangan ro'yxati, son-sanoqsiz cheksiz (va ehtimol qavariq bo'lmagan) haqiqiy qiymatlarni yig'uvchi va boshqalar bo'lishi mumkin. P (), Y_i () funktsiyalari ham o'zboshimchalikga ega va doimiylik va konveksiya taxminlarini talab qilmaydi.

Aloqa tarmoqlari kontekstida misol sifatida tasodifiy hodisa har bir tugun uchun slot t kelish ma'lumotlarini va har bir bog'lanish uchun slot t kanal holatini o'z ichiga olgan vektor bo'lishi mumkin. Nazorat harakati har bir tugun uchun marshrutlash va uzatish qarorlarini o'z ichiga olgan vektor bo'lishi mumkin. P () va Y_i () funktsiyalari t harakati uchun boshqaruv harakati va kanal holati bilan bog'liq bo'lgan energiya sarfini yoki sarfini aks ettirishi mumkin.

Ekspozitsiyaning soddaligi uchun P () va Y_i () funktsiyalari chegaralangan deb taxmin qiling. Keyinchalik tasodifiy voqea jarayonini nazarda tuting bu mustaqil va bir xil taqsimlangan (i.i.d.) Ehtimol, noma'lum ehtimollik taqsimotiga ega bo'lgan uyalar t. Maqsad quyidagi muammoni hal qilish uchun vaqt o'tishi bilan nazorat harakatlarini amalga oshirish siyosatini ishlab chiqishdir:

Ushbu muammo butun davomida taxmin qilinmoqda mumkin. Ya'ni, barchasini qondira oladigan algoritm mavjud deb taxmin qilinadi K kerakli cheklovlar.

Yuqoridagi muammo har bir cheklovni standart shakl y_i (t) mavhum jarayonning o'rtacha vaqt kutishining ijobiy bo'lmaganligi. Ushbu yondashuv bilan umumiylikni yo'qotish yo'q. Masalan, kimdir ba'zi bir a (t) jarayonining o'rtacha vaqt kutilishini berilgan c doimiydan kichik yoki unga teng bo'lishini xohlaydi deylik. Keyin yangi jazo funktsiyasi y(t) = a(t) − v belgilanishi mumkin va kerakli cheklash o'rtacha kutilgan vaqtga teng y(t) ijobiy bo'lmagan. Xuddi shunday, ikkita jarayon bor deylik a(t) va b(t) va kimdir o'rtacha kutishni xohlaydi a(t) dan kam yoki unga teng bo'lishb(t). Ushbu cheklash yangi jazo funktsiyasini belgilash orqali standart shaklda yozilgan y(t) = a(t) − b(t). Yuqoridagi muammo bunga intiladi minimallashtirish mavhum jazo funktsiyasining vaqt o'rtacha qiymatip '(t) ". Buning uchun ishlatilishi mumkin maksimal darajaga ko'tarish ba'zi kerakli vaqt o'rtacha mukofotlash funktsiyasir(t) belgilash orqali p(t) = −r('t).

Virtual navbat

Har bir cheklash uchun men {1, ..., ichida K}, a ni aniqlang virtual navbat uyalar ustidan dinamikasi bilan t {0, 1, 2, ...} da quyidagicha:

Boshlang Qmen(0) = 0 hamma uchun men {1, ..., ichida K}. Ushbu yangilanish tenglamasi a bilan bir xil virtual orqaga qarab Q_i (t) va y_i (t) bilan ajratilgan vaqt navbati yangi kelganlar va uyadagi yangi xizmat imkoniyatlari o'rtasidagi farq.t. Intuitiv ravishda ushbu virtual navbatlarni barqarorlashtirish cheklash funktsiyalarining o'rtacha vaqtlari noldan kam yoki teng bo'lishini ta'minlaydi, shuning uchun kerakli cheklovlar qondiriladi. Buni aniq ko'rish uchun (1-tenglama) quyidagilarni nazarda tutishini unutmang.

Shuning uchun:

Yuqoridagilarni birinchi t uyalar bo'yicha umumlashtirish va teleskopik yig'indilar qonunidan foydalanish quyidagilarni anglatadi:

Bo'linish t va umidlarni hisobga olish quyidagilarni nazarda tutadi:

Shuning uchun {1, ..., ichida barcha i uchun quyidagilar bajarilganda muammoning kerakli cheklovlari qondiriladi. K}:

Yuqoridagi chegara tenglamasini qondiradigan Q_i (t) navbati deyiladi o'rtacha stavka barqaror.[5]

Drift-plus-penalti ifodasi

Navbatlarni barqarorlashtirish uchun Lyapunov funktsiyasini aniqlang L (t) - bu uyadagi navbatning umumiy ortib ketishining o'lchovi.t:

Navbatdagi tenglamani kvadratga solish (1-tenglama) {1, ..., K} ning har bir navbati uchun quyidagi chegarani keltirib chiqaradi:

Shuning uchun,

Bundan kelib chiqadiki

Endi B ni yuqoridagi tengsizlikning o'ng tomonidagi birinchi hadni chegaralaydigan musbat doimiy sifatida aniqlang. Bunday doimiy mavjud, chunki y_i (t) qiymatlari chegaralangan. Keyin:

Ikkala tomonga Vp (t) qo'shilsa, drift-plus-penalti ifodasi quyidagicha bo'ladi:

Dreyf-plyus-jarima algoritmi (quyida keltirilgan) yuqoridagi tengsizlikning o'ng tomonini ochko'zlik bilan kamaytiradigan har bir bo'shliq t ni boshqarish harakatlarini amalga oshiradi. Intuitiv ravishda, faqatgina driftni kamaytiradigan harakatni bajarish navbatning barqarorligi nuqtai nazaridan foydali bo'ladi, ammo o'rtacha vaqt jazosini minimallashtirmaydi. Faqatgina jazoni engillashtiradigan harakatni bajarish navbatni barqarorlashtirishi shart emas. Shunday qilib, tortilgan summani minimallashtirish bo'yicha chora ko'rish navbatning barqarorligi va jarimani minimallashtirishning ikkala maqsadini o'z ichiga oladi. V vazn jarimani minimallashtirishga ozmi-ko'pmi ahamiyat berish uchun sozlanishi mumkin, bu esa natijaviy savdo o'zgarishiga olib keladi.[5]

Drift-plus-penalti algoritmi

Ruxsat bering barcha mumkin bo'lgan nazorat harakatlarining mavhum to'plami bo'lishi. Har bir teshik t, tasodifiy hodisani va joriy navbat qiymatlarini kuzatib boring:

T uyasi bo'yicha ushbu kuzatuvlarni hisobga olgan holda, ochko'zlik bilan boshqaruv amalini tanlang quyidagi ifodani minimallashtirish (o'zboshimchalik bilan aloqalarni uzish):

Keyin har bir i uchun navbatlarni {1, ..., K} da yangilang (1-tenglama). Ushbu protsedurani t + 1 uyasi uchun takrorlang.[5]

E'tibor bering, slotda kuzatilgan tasodifiy hodisa va navbatdagi zaxira t uyasi t minimallashtirish uchun boshqarish amalini tanlashda berilgan doimiylar kabi harakat qilish. Shunday qilib, har bir bo'shliq to'plam ustidan nazoratni minimallashtirish harakatining deterministik izlanishini o'z ichiga oladi A. Ushbu algoritmning asosiy xususiyati shundaki, u tasodifiy hodisa jarayonining ehtimollik taqsimotini bilishni talab qilmaydi.

Taxminan rejalashtirish

Yuqoridagi algoritm mavhum to'plam bo'yicha minimal funktsiyani topishni o'z ichiga oladi A. Odatda, minimal miqdor mavjud bo'lmasligi yoki topish qiyin bo'lishi mumkin. Shunday qilib, algoritm taxminiy tarzda quyidagi tarzda amalga oshirilishini taxmin qilish foydalidir: Aniqlang C manfiy bo'lmagan doimiy sifatida va barcha uyalar uchun shunday deb taxmin qiling t, boshqarish harakati to'plamda tanlanadi A qondirish uchun:

Bunday nazorat harakati a deb nomlanadi C-qo'shimchasini yaqinlashtirish.[5] Ish C = 0 har bir uyadagi kerakli ifodani aniq minimallashtirishga mos keladit.

Ish faoliyatini tahlil qilish

Ushbu bo'lim algoritm natijalarini o'rtacha darajadagi O (V / V) oralig'idagi o'rtacha jazoga olib keladi va o'rtacha navbat hajmida mos keladigan O (V) savdo-sotiqni ko'rsatadi.[5]

O'rtacha penalti tahlili

A ni aniqlang - faqat siyosat nazorat harakatini tanlash uchun statsionar va tasodifiy siyosat bo'lish kuzatilganlarga asoslanib faqat. Ya'ni - har qanday mumkin bo'lgan tasodifiy hodisa uchun faqat siyosat belgilaydi , boshqarish harakatini tanlash uchun shartli taqsimot sharti bilan; inobatga olgan holda . Bunday siyosat qarorlarni hozirgi navbatdagi yig'ilishlardan mustaqil ravishda qabul qiladi. Bor deb taxmin qiling - faqat siyosat quyidagilarni qondiradi:

Yuqoridagi taxminlar tasodifiy o'zgaruvchiga nisbatan uyasi uchun va tasodifiy boshqarish harakati uyada tanlangan kuzatgandan keyin . Bunday siyosat mavjud bo'lgan har qanday boshqarish muammosi va voqea maydoni uchun mavjud bo'lganda ko'rsatilishi mumkin va harakatlar maydoni cheklangan yoki yumshoq yopish xususiyatlari qondirilganda.[5]

Ruxsat bering oldingi qismning drift-plyus-penalti algoritmining C qo'shimchali yaqinlashuvi bilan amalga oshirilgan harakatni ifodalaydi, ba'zi bir salbiy bo'lmagan doimiy S uchun terminologiyani soddalashtirish uchun biz ushbu amalni drift-plus-penalti harakati, o'rniga C-additiv taxminiy drift-plus-penalti harakati. Ruxsat bering vakili - faqat qaror:

Drift-plus-penalti harakatini taxmin qiling har bir va har bir uyada ishlatiladi. (2-tenglama) ga binoan, uning ostidagi drift-plus-penalti ifodasi harakat har bir uyasi uchun quyidagilarni qondiradi

bu erda oxirgi tengsizlik amal qiladi, chunki qo'shimchali doimiy tarkibiga kiradi to'plamdagi barcha boshqa harakatlar ustidan oldingi ifodani minimallashtirish shu jumladan Yuqoridagi tengsizlikni kutish quyidagicha:

E'tibor bering amal hech qachon amalga oshirilmagan. Uning mavjudligi oxirgi tengsizlikka erishish uchun faqat taqqoslash maqsadida ishlatilgan. Yuqoridagi tengsizlikni birinchisiga nisbatan xulosa qilish uyalar beradi:

Yuqoridagilarni ikkiga bo'lish barcha naychalarga tegishli bo'lgan quyidagi natijani beradi

Shunday qilib, o'rtacha kutilgan penalti o'zboshimchalik bilan optimal qiymatga yaqinlashtirilishi mumkin tanlash orqali mos ravishda katta. Ko'rsatish mumkinki, barcha virtual navbatlar o'rtacha stavka barqaror va shuning uchun barcha kerakli cheklovlar qondiriladi.[5] Parametr navbatning kattaligiga ta'sir qiladi, bu o'rtacha cheklash funktsiyalari ijobiy bo'lmagan songa yaqinlashish tezligini belgilaydi. Navbatlarning kattaligi bo'yicha batafsil tahlil keyingi bo'limda keltirilgan.

O'rtacha navbat o'lchamlari tahlili

Hozir mavjud deb taxmin qiling - faqat siyosat , ehtimol (3-rasm) - (4-rasm) qoniqtiruvchidan farq qiladi, bu quyidagilarni qondiradi. :

Oldingi bobdagi argumentga o'xshash dalil quyidagilarni ko'rsatadi:

Oldingi qismdagi o'xshash teleskopli qator argumenti quyidagicha t> 0 uchun quyidagilarni ko'rsatish uchun ishlatilishi mumkin:[5]

Bu shuni ko'rsatadiki, navbatning o'rtacha kattaligi haqiqatan ham O (V).

1-ehtimollik yaqinlashishi

Yuqoridagi tahlil o'rtacha vaqt kutishlarini hisobga oladi. Tegishli ehtimollik cheksiz ufq vaqtining o'rtacha navbati va jarimasi uchun ishlash chegaralarini drift-plus-penaltilar usuli yordamida olish mumkin. martingale nazariyasi.[14]

Cheklangan quvvatga ega navbatlarga murojaat qilish

Ko'rsatilganidek, drift-plus-penalti navbatning o'rtacha hajmini ma'lum bir chegara ostida ushlab turishga imkon beradi, bu V parametrini tanlashga bog'liq, lekin umuman olganda, maksimal navbat uchun hech qanday kafolat bermaydi. Ammo, agar harakatlar to'plami ma'lum cheklovlarni hurmat qilsa, navbatning maksimal uzunligini ta'minlash uchun V ni tanlashga qo'shimcha shart qo'shish va shu bilan algoritmni cheklangan quvvatga ega navbatlarga ham qo'llash mumkin.[15]

Navbat tizimlarini davolash

Yuqoridagi tahlilda aniq navbatsiz stoxastik tizimdagi vaqt o'rtacha cheklovlarini optimallashtirish ko'rib chiqiladi. Har safar o'rtacha tengsizlikni cheklash (1-tenglama) ga binoan virtual navbatga tushirilgan. Navbat tarmog'ini optimallashtirish holatida (1-tenglama) dagi virtual navbat tenglamalari haqiqiy navbatdagi tenglamalar bilan almashtiriladi.

Vaqt o'rtacha ko'rsatkichlarining qavariq funktsiyalari

Bunga bog'liq muammo, cheklovlarga duchor bo'lgan vaqt o'rtacha konveks funktsiyasini minimallashtirishdir, masalan:

qayerda va bor qavariq funktsiyalar va bu erda o'rtacha vaqt o'rtacha aniqlanadi:

Vaqt o'rtacha ko'rsatkichlarining konveks funktsiyalarini optimallashtirishning bunday muammolari orqali funktsiyalarning vaqt o'rtacha qiymatlarini optimallashtirish muammolariga aylantirilishi mumkin. yordamchi o'zgaruvchilar (Neely darsligining 5-bobiga qarang).[2][5] So'nggi muammolarni oldingi qismlarda aytib o'tilganidek, drift-plus-penalti usuli bilan hal qilish mumkin. Shu bilan bir qatorda ibtidoiy-dual usul drift-plus-penal qarorlariga o'xshash qarorlarni qabul qiladi, ammo maqsad funktsiyasining qisman hosilalari bilan belgilangan jarimadan foydalanadi [5][16][17] Primal-dual yondashuv, shuningdek, qachon bo'lgan hollarda mahalliy optimani topish uchun ishlatilishi mumkin konveks emas.[5]

Savdo va shunga o'xshash ishlarni kechiktirish

Oldingi qismdagi matematik tahlil shuni ko'rsatadiki, drift-plus-penalti usuli O (1 /) oralig'ida o'rtacha vaqt jarimasini hosil qiladi.V) moslik bilan, tegmaslik O(V) navbatning o'rtacha hajmidagi savdo. Ushbu usul, bilan birgalikda O(1/V), O(V) savdo-sotiq, Neilida ishlab chiqilgan[9] va Nili, Modiano, Li[2] barqarorlikka bo'ysunadigan tarmoq yordam dasturini maksimal darajada oshirish sharoitida.

Tarmoq dasturini maksimal darajada oshirish uchun tegishli algoritm Eryilmaz va Srikant tomonidan ishlab chiqilgan.[18]Eryilmaz va Srikant ishi natijasida drift-plus-penalti algoritmiga juda o'xshash algoritm paydo bo'ldi, ammo boshqa analitik usul qo'llanildi. Ushbu texnikaga asoslangan edi Lagranj multiplikatorlari. Lagrange multiplikatori texnikasidan to'g'ridan-to'g'ri foydalanish, savdoning yomonlashishiga olib keladi O(1/V), O (V2). Ammo keyinchalik Lagranj multiplikatori tahlili asl nusxasini tiklash uchun Xuan va Nili tomonidan kuchaytirildi O(1/V), O(V) navbatdagi o'lchamlarni mos keladigan deterministik optimallashtirish muammosining Lagranj multiplikatori atrofida mahkam to'planganligini ko'rsatib, savdo-sotiq.[19]Ushbu klasterlash natijasi yaxshilanganlikni ta'minlash uchun drift-plus-penalt algoritmini o'zgartirish uchun ishlatilishi mumkin O(1/V), O(log2(V)) savdo-sotiq. O'zgartirishlar ikkalasini ham ishlatishi mumkin joy egalarining ortda qolishi[19] yoki Birinchi chiqadigan (LIFO) rejalashtirish.[20][21]

Stoxastik bo'lmagan funktsiyalar uchun amalga oshirilganda, drift-plus-penalti usuli o'xshashdir ikkilamchi subgradient usuli ning qavariq optimallashtirish nazariyasi, uning chiqishi o'rtacha vaqtni tashkil etishi bundan mustasno boshlang'ich o'zgaruvchilar, ibtidoiy o'zgaruvchilarning o'rniga.[4][6] A bog'liq ibtidoiy-dual texnika Stolyar navbatdagi tarmoqdagi yordam dasturini maksimal darajada oshirish uchun Stolyar tomonidan suyuq modellar tahlili yordamida ishlab chiqilgan.[16][17]Stolyar tahlili kommunal xizmatlar va navbatlar hajmi o'rtasidagi ishlash almashinuvi uchun analitik natijalarni bermaydi. Keyinchalik stoxastik tarmoqlar uchun ibtidoiy usulni tahlil qilish shunga o'xshash O (1 / V), O (V) yordam dasturini va navbatlar savdosini isbotlaydi va vaqt o'rtacha qiymatlarining konveks bo'lmagan funktsiyalarini minimallashtirish uchun mahalliy maqbul natijalarni ko'rsatadi. qo'shimcha yaqinlik taxmin.[5] Biroq, ushbu tahlilda o'rtacha vaqtlarning cheksiz ufq chegaralariga yaqinlashishi uchun qancha vaqt kerakligi aniqlanmagan. Yordamchi dasturlarni navbatsiz maksimallashtirishga oid primal-dual algoritmlar Agrawal va Subramanian tomonidan ishlab chiqilgan[22]va Kushner va Uayting.[23]

II-ga tegishli bo'lmagan kengaytmalar. voqea jarayonlari

Dreyf-plyus-jarima algoritmi ko'proq ergodik jarayonlar uchun o'xshash ishlash kafolatlarini ta'minlashi ma'lum , shuning uchun i.i.d. taxmin taxlil uchun hal qiluvchi ahamiyatga ega emas. Algoritm uchun ehtimoliy ergodik bo'lmagan o'zgarishlarga nisbatan mustahkamligini ko'rsatish mumkin . Muayyan stsenariylarda, kerakli tahliliy kafolatlar bilan ta'minlanishi mumkin rejalashtirishning universal kafolatlari, o'zboshimchalik uchun jarayonlar.[5]

O'zgaruvchan kvadrat uzunlikdagi tizimlarga kengaytmalar

Drift-plus-penalti usuli o'zgaruvchan kattalikdagi freymlarda ishlaydigan tizimlarni davolash uchun kengaytirilishi mumkin.[24][25] Bunday holda, ramkalar indekslar bilan etiketlanadi r {0, 1, 2, ...} da va ramka muddati {bilan belgilanadiT[0], T[1], T[2], ...}, qaerda T[r] har bir freym uchun manfiy bo'lmagan haqiqiy sonr. Ruxsat bering va ramka orasidagi siljish bo'ling r va r + 1 va ramka davomida jami jazornavbati bilan. Kengaytirilgan algoritm shartli kutishlarning quyidagi nisbati chegarasini minimallashtirish uchun har bir r ramka ustidan nazorat amalini bajaradi:

qayerda Q[r] - bu kadr boshidagi navbatdagi orqaga qaytishlarning vektorir. Barcha freymlar bir xil o'lchamda va 1 slot uzunligiga normallashtirilgan maxsus holatda, shunday qilib T[r] = 1 hamma uchun r, yuqoridagi minimallashtirish standart drift-plus-penalti texnikasini kamaytiradi. Ushbu ramkaga asoslangan usul cheklangan optimallashtirish uchun ishlatilishi mumkin Markovning qarorlari bilan bog'liq muammolar (MDPlar) va tajribaga ega bo'lgan tizimlar bilan bog'liq boshqa muammolar uchun yangilanishlar.[24][25]

Qavariq dasturlash uchun dastur

Ruxsat bering x = (x1, ..., xN) bo'lishi N- haqiqiy sonlarning o'lchovli vektori va giper to'rtburchakni aniqlang A tomonidan:

qayerda xmin, men, xmaksimal, men qondiradigan haqiqiy sonlar berilgan Barcha uchunmen. Ruxsat bering P(x) va men uchun {1, ..., K} doimiy bo'lishi va qavariq funktsiyalar ning x hamma uchun vektor x yildaA. Quyidagilarni ko'rib chiqing qavariq dasturlash muammo:

Buni drift-plus-penalti usuli bilan quyidagicha hal qilish mumkin: tasodifiy hodisa jarayoni bo'lmagan deterministik tizimning maxsus holatini ko'rib chiqing . Boshqaruv harakatini aniqlang kabi:

va harakat maydonini N- o'lchovli giper to'rtburchak A. Jarima va cheklash funktsiyalarini quyidagicha belgilang:

Quyidagi vaqt o'rtacha qiymatlarini aniqlang:

Endi quyidagi vaqtni o'rtacha optimallashtirish muammosini ko'rib chiqing:

By Jensen tengsizligi t> 0 barcha uyalar uchun quyidagilar mavjud:

Bundan shuni ko'rsatish mumkinki, o'rtacha vaqt muammosini (8-tenglama) - (9-tenglikni) optimal echimiga barcha uyalar t uchun x (t) = x * turidagi echimlar orqali erishish mumkin, bu erda x * - bu qavariq dasturni echadigan vektor (6-rasm) - (7-rasm). Bundan tashqari, har qanday vaqt bo'yicha o'rtacha vektor o'rtacha vaqt muammosining echimiga mos keladigan (8-tenglama) - (9-rasm) qavariq dasturni echishi kerak (6-tenglama) - (7-rasm). Shuning uchun asl qavariq dasturni (6-tenglama) - (7-tenglikni) dreyf-plyus-penalti algoritmi mos keladigan vaqtga tatbiq etilganda qabul qilingan qarorlarning vaqt o'rtacha qiymatini olish yo'li bilan (istalgan aniqlikda) echish mumkin. -boshqariladigan muammo (8-tenglama) - (9-rasm). Muammoning drift-plyus-jarima algoritmi (8-rasm) - (9-rasm) quyidagicha kamayadi:

Qavariq dasturlash uchun Drift-plus-penalti algoritmi

Har bir uyasi t, vektorni tanlang ifodani minimallashtirish uchun:

Keyin navbatlarni quyidagicha yangilang:

O'rtacha vaqt vektori qavariq dasturga O (1 / V) yaqinlashuviga yaqinlashadi.[6]

Ushbu algoritm standartga o'xshash er-xotin subgradient algoritmi 1 / V sobit qadam o'lchovidan foydalangan holda optimallashtirish nazariyasi.[26] Biroq, asosiy farq shundaki, ikkilangan subgradient algoritmi odatda cheklash uchun zarur bo'lgan cheklangan qat'iy konveksiya taxminlari ostida tahlil qilinadi. boshlang'ich o'zgaruvchilar x(t) yaqinlashish. Ushbu o'zgaruvchilar optimal echimga yaqinlashmaydigan va hatto hech qachon optimal echimga yaqinlashmaydigan ko'plab muhim holatlar mavjud (bu ko'pchilik uchun shundaydir chiziqli dasturlar, quyida ko'rsatilganidek). Boshqa tomondan, dreyf-plyus-jarima algoritmi qat'iy konveksiya taxminlarini talab qilmaydi. Bu kafolat beradi vaqt o'rtacha primallarning ichida bo'lgan eritmaga yaqinlashadi O(1/V) tegmaslik O(V) navbat o'lchamlari chegaralari (buni an ga aylantirilishini ko'rsatish mumkin O(V2) yaqinlashish vaqtiga bog'liq).[6]

Lineer dasturlash uchun Drift-plus-penalti algoritmi

A ning maxsus holatini ko'rib chiqing chiziqli dastur. Xususan, deylik:

berilgan haqiqiy qiymatlar uchun (v1, …, vN), (ayilda), (b1, …, bK). Keyin yuqoridagi algoritm quyidagicha kamayadi: Har bir slot t va har bir o'zgaruvchi uchun n {1,… ichida, N} ni tanlang xn(t) ichida [xmin,n, xmaksimal,n] ifodani minimallashtirish uchun:

Keyin navbatlarni yangilang Qmen(t) oldingi kabi. Bu har bir o'zgaruvchini tanlashga to'g'ri keladi xmen(t) oddiyga ko'ra paq-puq nazorat siyosati:

Dastlabki o'zgaruvchilar bo'lgani uchun xmen(t) har doim ham xmin,men yoki xmaksimal,men, agar ular optimal echim giper-to'rtburchakning tepa nuqtasi bo'lmasa, ular hech qachon optimal echimga yaqinlasha olmaydi A. Biroq, o'rtacha vaqt ushbu portlash qarorlarining haqiqatan ham an ga yaqinlashishi O(1/V) optimal echimning yaqinlashishi. Masalan, shunday deb taxmin qiling xmin, 1 = 0, xmaksimal, 1 = 1, va chiziqli dastur uchun barcha optimal echimlar mavjud deb taxmin qiling x1 = 3/4. Keyin taxminan 3/4 vaqt birinchi o'zgaruvchiga portlash-portlash qarori bo'ladi x1(t) = 1, va qolgan vaqt bo'ladi x1(t) = 0.[7]

Tegishli havolalar

Adabiyotlar

  1. ^ a b M. J. Nili "Simsiz tarmoqlarni vaqtini o'zgartirish uchun energiyani optimal boshqarish, "Axborot nazariyasi bo'yicha IEEE operatsiyalari, 52-jild, 7-son, 2915-2934-betlar, 2006 yil iyul.
  2. ^ a b v d M. J. Nili, E. Modiano va C. Li "Geterogen tarmoqlar uchun adolat va maqbul stoxastik boshqaruv, "Proc. IEEE INFOCOM, 2005 yil mart.
  3. ^ a b L. Tassiulas va A. Efremides, "cheklangan navbat tizimlarining barqarorlik xususiyatlari va MultihopRadio tarmoqlarida maksimal ishlash qobiliyatini belgilash siyosati," Avtomatik boshqaruv bo'yicha IEEE operatsiyalari, vol. 37, yo'q. 12, 1936–1948-betlar, 1992 yil dekabr.
  4. ^ a b v L. Georgiadis, M. J. Nili va L. Tassyulalar "Simsiz tarmoqlarda resurslarni taqsimlash va qatlamlararo boshqarish,"Tarmoqning asoslari va tendentsiyalari, vol. 1, yo'q. 1, 1-149 betlar, 2006 y.
  5. ^ a b v d e f g h men j k l m n o p q M. J. Nili.Aloqa va navbat tizimlariga qo'llanilishi bilan stoxastik tarmoqni optimallashtirish,Morgan & Claypool, 2010.
  6. ^ a b v d M. J. Neely, "[Distributed and Secure Computation of Convex Programs over a Network of Connected Processors Distributed and Secure Computation of Convex Programs over a Network of Connected Processors]," DCDIS Conf, Guelph, Ontario, July 2005
  7. ^ a b S. Supittayapornpong and M. J. Neely, "Quality of Information Maximization for Wireless Networks via a Fully Separable Quadratic Policy," arXiv:1211.6162v2, Nov. 2012.
  8. ^ L. Tassiulas and A. Ephremides, "Dynamic Server Allocation to Parallel Queues with Randomly Varying Connectivity," IEEE Transactions on Information Theory, vol. 39, yo'q. 2, pp. 466–478, March 1993.
  9. ^ a b M. J. Neely. Dynamic Power Allocation and Routing for Satellite and Wireless Networks with Time Varying Channels. Ph.D. Dissertation, Massachusetts Institute of Technology, LIDS. 2003 yil noyabr.
  10. ^ R. Urgaonkar, B. Urgaonkar, M. J. Neely, A. Sivasubramaniam, "Optimal Power Cost Management Using Stored Energy in Data Centers," Proc. SIGMETRICS 2011.
  11. ^ M. Baghaie, S. Moeller, B. Krishnamachari, "Energy Routing on the Future Grid: A Stochastic Network Optimization Approach," Proc. International Conf. on Power System Technology (POWERCON), Oct. 2010.
  12. ^ M. J. Neely, A. S. Tehrani, and A. G. Dimakis, "Efficient Algorithms for Renewable Energy Allocation to Delay Tolerant Consumers," 1st IEEE International Conf. on Smart Grid Communications, 2010.
  13. ^ M. J. Neely and L. Huang, "Dynamic Product Assembly and Inventory Control for Maximum Profit," Proc. IEEE Conf. on Decision and Control, Atlanta, GA, Dec. 2010.
  14. ^ M. J. Neely, "Queue Stability and Probability 1 Convergence via Lyapunov Optimization," Journal of Applied Mathematics, vol. 2012 yil, doi:10.1155/2012/831909.
  15. ^ L. Bracciale, P. Loreti "Lyapunov drift-plus-penalty optimization for queues with finite capacity" IEEE Communications Letters, doi:10.1109/LCOMM.2020.3013125.
  16. ^ a b A. Stolyar,"Maximizing Queueing Network Utility subject to Stability: Greedy Primal-Dual Algorithm," Navbat tizimlari, vol. 50, yo'q. 4, pp. 401–457, 2005.
  17. ^ a b A. Stolyar, "Greedy Primal-Dual Algorithm for Dynamic Resource Allocation in Complex Networks," Queueing Systems, vol. 54, no. 3, pp. 203–220, 2006.
  18. ^ A. Eryilmaz and R. Srikant, "Fair Resource Allocation in Wireless Networks using Queue-Length-Based Schedulingand Congestion Control," Proc. IEEE INFOCOM, March 2005.
  19. ^ a b L. Huang and M. J. Neely, "Delay Reduction via Lagrange Multipliers in Stochastic Network Optimization," IEEE Trans. on Automatic Control, vol. 56, no. 4, pp. 842–857, April 2011.
  20. ^ S. Moeller, A. Sridharan, B. Krishnamachari, and O. Gnawali, "Routing without Routes: The Backpressure Collection Protocol," Proc. IPSN 2010.
  21. ^ L. Huang, S. Moeller, M. J. Neely, and B. Krishnamachari, "LIFO-Backpressure Achieves Near Optimal Utility-Delay Tradeoff," IEEE/ACM Transactions on Networking, to appear.
  22. ^ R. Agrawal and V. Subramanian, "Optimality of certain channel aware scheduling policies," Proc. 40th Annual Allerton Conf. on Communication, Control, and Computing, Monticello, IL, Oct. 2002.
  23. ^ H. Kushner and P. Whiting, "Asymptotic Properties of Proportional-Fair Sharing Algorithms," Proc. 40th Annual Allerton Conf. on Communication, Control, and Computing, Monticello, IL, Oct. 2002.
  24. ^ a b C. Li and M. J. Neely, "Network utility maximization over partially observable Markovian channels," Performance Evaluation, https://dx.doi.org/10.1016/j.peva.2012.10.003.
  25. ^ a b M. J. Neely, "Dynamic Optimization and Learning for Renewal Systems," IEEE Transactions on Automatic Control, vol. 58, no. 1, pp. 32–46, Jan. 2013.
  26. ^ D. P. Bertsekas and A. Nedic and A. E. Ozdaglar. Convex Analysis and Optimization, Boston: Athena Scientific, 2003.

Birlamchi manbalar

  • M. J. Neely. Stochastic Network Optimization with Application to Communication and Queueing Systems, Morgan & Claypool, 2010.