Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статье описывается оптимизация по Ляпунову для динамических систем . Он дает пример приложения для оптимального управления в сетях массового обслуживания .

Введение [ править ]

Оптимизация Ляпунова относится к использованию функции Ляпунова для оптимального управления динамической системой. Функции Ляпунова широко используются в теории управления для обеспечения различных форм устойчивости системы. Состояние системы в конкретный момент времени часто описывается многомерным вектором. Функция Ляпунова является неотрицательной скалярной мерой этого многомерного состояния. Обычно функция увеличивается, когда система движется к нежелательным состояниям. Стабильность системы достигается за счет управляющих воздействий, которые заставляют функцию Ляпунова дрейфовать в отрицательном направлении к нулю.

Ляпуновский дрейф занимает центральное место в изучении оптимального управления в сетях массового обслуживания. Типичной целью является стабилизация всех сетевых очередей при оптимизации некоторых показателей производительности, таких как минимизация средней энергии или максимизация средней пропускной способности. Минимизация дрейфа квадратичной функции Ляпунова приводит к алгоритму маршрутизации противодавления для обеспечения стабильности сети, также называемому алгоритмом максимального веса . [1] [2] Добавление взвешенного штрафного члена к дрейфу Ляпунова и минимизация суммы приводит к алгоритму дрейфа плюс штраф для совместной устойчивости сети и минимизации штрафа. [3] [4] [5] Процедуру смещения плюс штраф также можно использовать для вычисления решенийвыпуклые программы и линейные программы . [6]

Ляпуновский дрифт для сетей массового обслуживания [ править ]

Рассмотрим сеть массового обслуживания, которая развивается в дискретном времени с нормализованными временными интервалами. Предположим, что в сети есть очереди, и определите вектор невыполненных очередей во времени следующим образом:

Квадратичные функции Ляпунова [ править ]

Для каждого слота определите:

Эта функция является скалярной мерой общего количества невыполненных очередей в сети. Она называется квадратичной функцией Ляпунова по состоянию очереди. Определим дрейф Ляпунова как изменение этой функции от одного слота к другому:

Граница Ляпуновского дрейфа [ править ]

Предположим, что объем невыполненной работы очереди изменяется с течением времени в соответствии со следующим уравнением:

где и - поступления и возможности обслуживания, соответственно, в очереди на слоте. Это уравнение можно использовать для вычисления границы дрейфа Ляпунова для любого слота t:

Переставив это неравенство, суммируя все и разделив на 2, получаем:

куда:

Предположим, что вторые моменты поступления и обслуживания в каждой очереди ограничены, так что существует конечная константа, такая, что для всех и всех возможных векторов очереди выполняется следующее свойство:

Принятие условных ожиданий (уравнение 1) приводит к следующей оценке условного ожидаемого сноса Ляпунова :

Основная теорема Ляпунова о сносе [ править ]

Во многих случаях сеть можно контролировать так, чтобы разница между поступлением и обслуживанием в каждой очереди удовлетворяла следующему свойству для некоторого действительного числа :

Если вышесказанное верно для одного и того же эпсилона для всех очередей, всех слотов и всех возможных векторов, то (уравнение 2) сводится к условию сноса, используемому в следующей теореме о сносе Ляпунова. Приведенную ниже теорему можно рассматривать как вариацию теоремы Фостера для цепей Маркова . Однако для этого не требуется структура цепи Маркова.

Теорема (дрейф Ляпунова). [5] [7] Предположим, что существуют такие константы , что для всех и всех возможных векторов условный снос Ляпунова удовлетворяет:
Тогда для всех слотов средний по времени размер очереди в сети удовлетворяет:

Доказательство. Принимая ожидания обеих сторон неравенства сноса и используя закон повторных ожиданий, получаем:

Суммируя приведенное выше выражение и используя закон телескопических сумм, получаем:

Использование неотрицательного факта и перестановка членов в приведенном выше выражении доказывает результат.

Оптимизация по Ляпунову для сетей массового обслуживания [ править ]

Рассмотрим ту же сеть очередей, что и в предыдущем разделе. Теперь определите как сетевой штраф, понесенный в слоте. Предположим, цель состоит в том, чтобы стабилизировать сеть массового обслуживания при минимизации среднего времени. Например, для стабилизации сети при минимизации средней мощности по времени, можно определить как общую мощность, понесенную сетью в слоте. т. [8] Для решения проблем максимизации среднего времени некоторого желаемого вознаграждения может быть определен штраф. Это полезно для максимизации полезности пропускной способности сети при условии стабильности. [3]

Для стабилизации сети при минимизации среднего времени штрафов алгоритмы сети могут быть разработаны для выполнения управляющих действий, которые жадно минимизируют ограничение на следующее выражение дрейфа плюс штраф в каждом слоте : [5]

где - неотрицательный вес, который выбирается по желанию, чтобы повлиять на компромисс производительности. Ключевой особенностью этого подхода является то, что он обычно не требует знания вероятностей случайных сетевых событий (таких как случайное поступление заданий или реализация каналов). Выбор сводится к минимизации ограничения на дрейф каждого слота, а для маршрутизации в многозвенных сетях очередей сводится к алгоритму маршрутизации противодавления , разработанному Тассиулас и Ефремидесом. [1] [2] Использование и определение в качестве использования мощности сети в слоте приводит к алгоритму смещения плюс штраф для минимизации средней мощности с учетом стабильности сети, разработанному Нили. [8] Использованиеа использование в качестве отрицательного показателя полезной метрики управления доступом приводит к алгоритму дрейфа плюс штраф для совместного управления потоком и сетевой маршрутизации, разработанного Нили, Модиано и Ли. [3]

В этом контексте важно обобщение теоремы Ляпунова о сносе из предыдущего раздела. Для простоты изложения предположим, что снизу ограничено:

Например, вышеперечисленное устраивает в случаях, когда штраф всегда неотрицательный. Позвольте представить желаемую цель для среднего значения времени Позвольте быть параметром, используемым для взвешивания важности достижения цели. Следующая теорема показывает, что если выполняется условие смещения плюс штраф, то среднее время штрафа не более чем на O (1 / V) превышает желаемую цель, в то время как средний размер очереди составляет O (V). Параметр может быть настроен , чтобы среднее время штрафа как можно ближе к (или ниже) мишень по желанию, с соответствующим размером очереди компромиссом.

Теорема (оптимизация Ляпунова). Предположим, что существуют константы и такие, что для всех и всех возможных векторов выполняется следующее условие смещения плюс штраф:
Тогда за все время средний размер штрафа и средний размер очереди удовлетворяют:

Доказательство. Взяв ожидания обеих сторон предполагаемого дрейфа плюс штраф и используя закон повторных ожиданий, мы имеем:

Суммируя вышеизложенное по первым слотам и используя закон телескопических сумм, получаем:

Разделение и перестановка членов доказывают среднюю временную границу штрафа. Аналогичный аргумент доказывает, что средний размер очереди по времени ограничен.

Ссылки по теме [ править ]

  • Дрифт плюс штраф
  • Маршрутизация противодавления
  • Функция Ляпунова
  • Теорема Фостера
  • Функция Control-Ляпунова

Ссылки [ править ]

  1. ^ a b Л. Тассиулас и А. Ефремидес, " Свойства стабильности систем массового обслуживания с ограничениями и политики планирования для максимальной пропускной способности в многопунктовых радиосетях , IEEE Transactions on Automatic Control" , том 37, № 12, стр. 1992 г.
  2. ^ a b Л. Тассиулас и А. Ефремидес, « Динамическое распределение сервера для параллельных очередей со случайно изменяющейся связностью », IEEE Transactions on Information Theory, vol. 39, нет. 2, стр. 466-478, март 1993 г.
  3. ^ a b c М. Дж. Нили, Э. Модиано и К. Ли, " Справедливость и оптимальное стохастическое управление для гетерогенных сетей ", Proc. IEEE INFOCOM, март 2005 г.
  4. ^ Л. Георгиадис, MJ Нили и Л. Тассиулас, « Распределение ресурсов и межуровневое управление в беспроводных сетях» , « Основы и тенденции в сетях », том. 1, вып. 1. С. 1-149, 2006.
  5. ^ а б в М. Дж. Нили. Стохастическая оптимизация сети с приложением к системам связи и массового обслуживания , Morgan & Claypool, 2010.
  6. ^ MJ Neely, " Распределенное и безопасное вычисление выпуклых программ через сеть подключенных процессоров ", DCDIS Conf, Гуэлф, Онтарио, июль 2005 г.
  7. ^ Э. Леонарди, М. Меллиа, Ф. Нери и М. Аджмоне Марсан, « Границы средних задержек и средних размеров очереди и отклонений в коммутаторах на основе ячеек с очередью ввода », Proc. IEEE INFOCOM, 2001.
  8. ^ a b М. Дж. Нили, " Энергетически оптимальное управление для изменяющихся во времени беспроводных сетей ", IEEE Transactions on Information Theory, vol. 52, нет. 7, pp. 2915-2934, июль 2006 г.

Первичные источники [ править ]

  • MJ Neely. Стохастическая оптимизация сети с приложением к системам связи и массового обслуживания , Morgan & Claypool, 2010.