НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ВТОРОГО ПОРЯДКА В ЗАДАЧЕ УПРАВЛЕНИЯ СТОХАСТИЧЕСКИМИ ДИФФЕРЕНЦИАЛЬНЫМИ УРАВНЕНИЯМИ С ЗАПАЗДЫВАЮЩИМ АРГУМЕНТОМ
- Авторы: Мансимов К.Б1,2, Масталиев Р.О1
- Учреждения:
- Институт систем управления НАН Азербайджана
- Бакинский государственный университет
- Выпуск: № 4 (2016)
- Страницы: 7-26
- Раздел: Статьи
- URL: https://ered.pstu.ru/index.php/amcs/article/view/2235
- DOI: https://doi.org/10.15593/прикладная%20математика%20и%20вопросы%20управления%20/%20applied%20mathematics%20and%20control%20sciences.v0i4.2235
- Цитировать
Аннотация
Исследуется задача оптимального управления нелинейными стохастическими системами, поведение которых задается стохастическим дифференциальным уравнением Ито с запаздывающим аргументом. Критерием оптимальности является терминальный функционал математического ожидания. При помощи первой и второй вариаций (в классическом смысле) функционала качества установлено необходимое условие оптимальности первого и второго порядков. В частном случае из установленного необходимого условия оптимальности второго порядка получены стохастический аналог условия Лежандра-Клебша, а также ряд других конструктивно проверяемых необходимых условий оптимальности. Рассмотрен случай вырождения условия Лежандра-Клебша, и получены различные необходимые условия оптимальности для особых в классическом смысле управлений.
Полный текст
Введение Известно, что стохастические дифференциальные уравнения с запаздывающим аргументом возникают во многих областях техники, биологии, экономики, физики (см., например, [1-5]). В связи с этим появляется необходимость исследования задач управления, описываемых стохастическими дифференциальными уравнениями с запаздывающим аргументом. В теории оптимального стохастического управления при описании стохастической управляемой модели широко используются стохастические дифференциальные уравнения Ито [6, 7]. Ранее в работах [8-11] получены различные необходимые условия оптимальности для задач управления, описываемые стохастическими дифференциальными уравнениями Ито с запаздывающим аргументом. Подобные задачи исследованы для случая детерминированных обыкновенных дифференциальных уравнений с запаздываниями в работах [12-16] и др. В настоящей статье при помощи стохастического аналога процедуры, описанной в работах К.Б. Мансимова (см., например, [13, 14]), получено необходимое условие оптимальности первого порядка (уравнение Эйлера) [17, 18]. Далее в силу неотрицательности второй вариации критерия качества вдоль оптимального процесса установлен ряд легко реализованных необходимых условий оптимальности второго порядка, в том числе аналог условия Лежандра-Клебша [18, 19]. Кроме этого, получены многоточечные необходимые условия оптимальности для особого в классическом смысле управления [18, 20]. 1. Постановка задачи Пусть - полное вероятностное пространство с определенным на нем неубывающим потоком s-алгебры где а - n-мерный стандартный винеровский процесс. - пространство измеримых по и согласованных процессов для которых - пространство функций с почти наверное (п.н.) непрерывными траекториями. Здесь и в дальнейшем E - математическое ожидание. Предположим, что закон управляемого движения на фиксированном отрезке времени описывается следующей системой стохастических дифференциальных уравнений с запаздыванием (1) с начальным условием (2) Здесь - фазовый вектор; - заданная n-мерная вектор-функция, непрерывная по совокупности переменных вместе с частными производными по до второго порядка включительно, где - матричная функция, непрерывная по совокупности переменных вместе с частными производными по до второго порядка включительно; - непрерывно дифференцируемая скалярная функция, причем - заданная непрерывная начальная вектор-функция; моменты и заданы; (3) где U - заданное непустое, ограниченное и открытое множество, а Ud - множество допустимых управлений. В дальнейших рассуждениях будем предполагать, что каждому допустимому управлению соответствует единственное решение системы (1)-(2). Целью управления является минимизация критерия качества (4) где - заданная дважды непрерывно дифференцируемая скалярная функция. Допустимое управление доставляющее минимум функционалу (4) при ограничениях (1)-(3), назовем оптимальным управлением, а соответствующий процесс - оптимальным процессом. Основной целью данной работы является вывод конструктивно проверяемых условий оптимальности второго порядка в рассматриваемой задаче. 2. Первая и вторая вариации критерия качества Пусть - фиксированный, а - произвольный допустимый процесс. Тогда ясно, что приращение траектории будет удовлетворять системе (5) (6) На основании формулы Тейлора приращение критерия качества (4) на этих управлениях будет в следующей форме: (7) Пусть - случайный процесс, стохастический дифференциал которого имеет вид Здесь - n-мерная измеримая и ограниченная функция, Тогда с помощью формулы Ито [6, 7] получим (8) С целью упрощения записи формул введем стохастический гамильтониан и ряд обозначений: Учитывая введенные обозначения, формулу (8) перепишем в виде (9) С учетом (6), (9) выражение (7) принимает следующий вид: Далее, используя формулу Тейлора, получим (10) где по определению (11) Здесь по определению величины и находятся соответственно из разложений Предположим, что случайные процессы являются решением следующей системы стохастических дифференциальных уравнений: (12) где - функция, обратная к Уравнение (12) назовем стохастической сопряженной системой к рассматриваемой задаче. Отсюда, принимая во внимание систему (12), приращение функционала качества (10), соответствующее управлениям и с помощью простых преобразований может быть представлено в виде (13) В силу открытости области управления U специальное приращение допустимого управления можно определить по формуле (14) где e - достаточное малое по абсолютной величине число; - произвольная вектор-функция (вариация управления). Обозначим через специальное приращение траектории отвечающее приращению (14) допустимого управления Из выражения (5), используя формулу Тейлора, по схеме, приведенной, например, в работах [15, 18], получаем справедливость утверждения. Лемма 1. Для специального приращения траектории системы (1)-(2) имеет место следующее разложение: (15) где (вариация траектории) является решением задачи (16) Стохастические дифференциальные уравнения (16) назовем аналогом уравнения в вариациях [17] для рассматриваемой задачи. В дальнейшем нам понадобится еще одна лемма. Лемма 2. Решение уравнения (16) можно представить в виде (17) где по определению Здесь фундаментальная матрица является решением однородного уравнения: (18) где I - единичная матрица, Замечание. Формула (17) представляет собой стохастический аналог известной формулы Коши из работы [21] для уравнения (16). Отметим, что представление (17) в случае приведено в работе [22]. Подставляя в уравнение (16) выражение (17) для и учитывая уравнение (18), после несложных преобразований можно убедиться в справедливости леммы 2. Учитывая выражения (11), (14) и (15) в формуле приращения (13), следуя обычной схеме [18, 19], можно доказать, что первая и вторая (в классическом смысле) вариации функционала качества соответственно имеют вид (19) (20) 3. Необходимые условия оптимальности Пусть - оптимальный процесс. Тогда для всех согласно результатам вариационного исчисления (см., например, [17-19]), первая вариация функционала (4) равняется нулю, а вторая - неотрицательна, т.е. Таким образом, вдоль оптимального процесса для всех (21) (22) Из выражения (22) по схеме, приведенной, например, в работах [18, 19], получаем, что вдоль оптимального процесса соотношение (23) выполняется при почти всех Здесь и в дальнейшем - произвольная точка Лебега (правильная точка [23]) управления Сформулируем полученный результат в виде следующей теоремы. Теорема 1. Для оптимальности допустимого управления в задаче (1)-(4) необходимо, чтобы почти для всех выполнялось равенство (23). Условие оптимальности (23) является стохастическим аналогом уравнения Эйлера для рассматриваемой задачи и представляет собой необходимое условие оптимальности первого порядка. Допустимое управление удовлетворяющее уравнению Эйлера (23), следуя, например, работе [18], назовем классической экстремалью в задаче (1)-(4). Следовательно, справедлива следующая теорема. Теорема 2. Для оптимальности классической экстремали в задаче (1)-(4) необходимо, чтобы неравенство (22) выполнялось для всех Как видно, неравенство (22) есть неявное необходимое условие оптимальности второго порядка, но, используя неравенство (22), можно получить конструктивно проверяемые необходимые условия оптимальности второго порядка. Представление (17) позволяет доказать по схеме, приведенной в работе [13], следующие тождества: (24) (25) (26) (27) (28) (29) (30) Полагая, что (31) и учитывая тождества (24)-(31) в (22), получаем неравенство вида (32) Теорема 3 (необходимое условие оптимальности второго порядка). Для оптимальности классической экстремали в задаче (1)-(4) необходимо, чтобы неравенство (32) выполнялось для всех Отметим, что детерминированный аналог матричной функции впервые введен в работах К.Б. Мансимова (см., например, [13, 14]). Ясно, что условие оптимальности (32) является общим интегральным необходимым условием оптимальности для классической экстремали. Однако, используя различные специальные вариации управления, из него можно получить ряд более легкопроверяемых необходимых условий оптимальности, в частности стохастический аналог условия Лежандра-Клебша для рассматриваемой задачи. Теорема 4 (стохастический аналог условия Лежандра-Клебша). Для оптимальности классической экстремали в задаче (1)-(4) необходимо, чтобы неравенство (33) выполнялось для почти всех и Для доказательства неравенства (33) достаточно в формуле (32) определить по формуле (34) где а - достаточно малое число. Теорема 5. Для оптимальности классической экстремали в задаче (1)-(4) необходимо, чтобы выполнялось неравенство для всех Отметим, что также не исключена возможность вырождения аналога условия Лежандра-Клебша, т.е. его выполнение тривиальным образом. Определение [18]. Если вдоль классической экстремали выполняются при почти всех то назовем особым в классическом смысле управлением. Необходимое условие оптимальности (32) позволяет получить также необходимые условия оптимальности особых в классическом смысле управлений. Из теоремы 5 следует следующая теорема. Теорема 6. Для оптимальности особого в классическом смысле управления в задаче (1)-(4) необходимо, чтобы неравенство (35) выполнялось для всех Неравенство (35) является интегральным необходимым условием оптимальности для особых в классическом смысле управлений. Перейдем к получению поточечных необходимых условий оптимальности для особых в классическом смысле управлений. С этой целью специальную вариацию управления определим по формуле (36) Здесь m - произвольное натуральное число; e > 0 - достаточно малое число, - точка Лебега управления причем а определяется по формуле (37) Суммирование специальных вариаций (37) понимается в обычном смысле [24, 25]. Принимая во внимание формулу (37) в выражении (35), приходим к теореме 7. Теорема 7. Для оптимальности особого в классическом смысле управления в задаче (1)-(4) необходимо, чтобы для любого натурального числа m неравенство (38) выполнялось почти для всех Из неравенства (38) можно получить ряд более легкопроверяемых необходимых условий оптимальности особых в классическом смысле управлений. Например, полагая, что в формуле (38) m = 1, приходим к следствию. Следствие. Для оптимальности особого в классическом смысле управления в задаче (1)-(4) необходимо, чтобы неравенство выполнялось для почти всех и Заключение С применением стохастического аналога метода приращений вычислены первая и вторая вариации функционала качества в задаче стохастического оптимального управления системой с переменным запаздыванием. С их помощью сформулированы и доказаны необходимые условия оптимальности первого и второго порядков, в том числе многоточечные необходимые условия оптимальности для особых в классическом смысле управлений. Полученные результаты являются новыми и носят теоретический характер. Они могут быть эффективно применены в конкретных задачах стохастического управления, описываемых системой стохастических дифференциальных уравнений с запаздывающим аргументом.Об авторах
К. Б Мансимов
Институт систем управления НАН Азербайджана; Бакинский государственный университет
Email: kamilbmansimov@gmail.com
Р. О Масталиев
Институт систем управления НАН Азербайджана
Email: mastaliyevrashad@gmail.com
Список литературы
- Царьков Е.Ф. Случайные возмущения дифференциально-функциональных уравнений. - Рига, 1989. - 421 с.
- Эльсгольц Д.Э. Введение в теорию дифференциальных уравнений с отклоняющимся аргументом. - М.: Наука, 1964. - 128 с.
- Kolmanovskii V.В., Nosov V.R. Stability of functional differential equations. - N.Y.: Academic Press, 1986.
- Kolmanovskii V.B., Myshkis A.D. Applied theory of functional differential equations. - Dordrecht: Kluwer Academic Publishers, 1992.
- Kolmanovskii V.В., Shaikhet L.E. Control of systems with aftereffect. Translations of mathematical monographs // American Mathematical Society. - 1996. - Vol. 157.
- Гихман И.И., Скороход А.В. Введение в теорию случайных процессов. - М.: Наука, 1977. - 568 с.
- Леваков А.А. Стохастические дифференциальные уравнения. - Минск: Изд-во Белорус. гос. ун-та, 2009. - 231 с.
- Агаева Ч.А. Принцип максимума для выпуклой стохастической задачи оптимального управления с запаздыванием // Изв. АН Азербайджана. Физ.-мат. науки. - 1994. - № 1-3.
- Агаева Ч.А. Необходимые условия оптимальности особых управлений в стохастических системах с запаздывающим аргументом. - Баку, 1990. - 20 с.
- Махмудов Н.И., Агаева Ч.А. Необходимые условия оптимальности для стохастических систем управления с запаздывающим аргументом. - Баку, 1990. - 19 с.
- Аюкасов Р.А. Оптимизация управления стохастических систем с запаздыванием: автореф. дис. … канд. физ.-мат. наук. - Казань, 2011. - 18 с.
- Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. - М.: Наука, 1971. - 507 с.
- Мансимов К.Б. Особые управления в системах с запаздыванием. - Баку: ЭЛМ, 1999. - 176 с.
- Марданов М.Д., Мансимов К.Б., Меликов Т.К. Исследование особых управлений и необходимые условия оптимальности второго порядка в системах с запаздыванием. - Баку: ЭЛМ, 2013. - 356 с.
- Харатишвили Г.Л., Тадумадзе Т.А. Нелинейные оптимальные системы управления с переменными запаздываниями // Мат. сб. - 1978. - Т. 107, № 4 (12). - 613-633.
- Милюткин В.П. Принцип максимума для задач с запаздыванием с фиксированным временем и свободным правым концом траектории // Автоматика и телемеханика. - 1968. - Вып. 6. - С. 37-45.
- Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. - Минск: Наука и техника, 1974. - 274 с.
- Габасов Р., Кириллова Ф.М. Особые оптимальные управления. - М.: Наука, 1973. - 256 с.
- Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. - М.: Наука, 1979. - 432 с.
- Габасов Р., Кириллова Ф.М., Мансимов К.Б. Необходимые условия оптимальности высокого порядка (обзор) / Препринт. Ин-т математики АН БССР. - Минск, 1982. - 48 с.
- Габасов Р., Кириллова Ф.М. Оптимизация линейных систем. - Минск: Изд-во Белорус. гос. ун-та, 1973. - 246 с.
- Agayeva Ch.A. Second order necessary conditions of optimality for stochastic systems with variable delay // Teor. Imovir. Matem. Statist. - 2010. - № 83. - Р. 2-11.
- Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мишенко. - М.: Наука, 1983. - 392 с.
- Гороховик С.Я. Необходимые условия оптимальности в задаче с подвижным правым концом траектории // Дифференциальные уравнения. - 1975. - № 10. - С. 1765-1773.
- Габасов Р., Кириллова Ф.М. Методы оптимизации. - Минск: Изд-во Белорус. гос. ун-та, 1981. - 400 с.
Статистика
Просмотры
Аннотация - 72
PDF (Russian) - 32
Ссылки
- Ссылки не определены.