Чтобы решать оптимизационные задачи с помощью математических методов, нужно сформулировать на математическом языке рассматриваемые процессы, ограничения, накладываемые на состояние системы и управляющие воздействия, а так же записать математические модели, описывающие эти процессы.
Введем некоторые понятия и обозначения. Рассмотрим множество М с элементами v, где v - пары вида v=(x, у), , , - некоторые заданные множества. Проекцией множества М на множество Х назовем подмножество Мx, обладающее тем свойством, что для каждого существует такой элемент , что пара содержится в множестве М.
Введем понятие сечения Мx множества М при данном x. Сечением Мx будем называть множество всех y, при которых пара принадлежит множеству М.
Введем понятие функционала, являющегося одним из главных в задачах оптимального управления. Будем говорить, что на множестве М задан функционал F , если известно правило, которое каждому элементу ставит в соответствие определенное действительное число F(v).
В общем виде задача оптимизации формулируется как задача отыскания минимального (или максимального) значения функционала F(v) на множестве М.
Предположим, что требуется минимизировать функционал F(v) на множестве М. Если решение этой задачи существует (обозначим его через ), то называется оптимальным элементом множества M, а величина - оптимальным значением функционала. Решения поставленной задачи F и будем записывать следующим образом:
.
Аналогично формулируется задача о нахождении максимального значения функционала.
Введем понятия точной нижней и верхней границы функционала. Точной нижней границей функционала на множестве М назовем такое число т, если:
1) для любого ;
2) существует последовательность , на которой .
Точная нижняя граница функционала обозначается
.
Последовательность {vs} называется минимизирующей последовательностью.
Точно так же определяется точная верхняя граница n функционала :
Назовем функционал ограниченным снизу (сверху) на множестве М, если существует такое число A, что при всех (). Если функционал является ограниченным снизу (сверху), то решение задачи о нахождении его точной нижней (верхней) границы существует, т. е. имеет место следующая теорема (приведем без доказательства): Пусть на множестве М задан ограниченный снизу функционал . Тогда реализуется одна из двух возможностей:
1) Существуют элемент и число , при которых и при всех .
2) Существуют последовательность элементов множества М и число , удовлетворяющее условиям , и при всех .
Данная теорема имеет важное значение для понимания сущности задачи оптимизации по двум причинам. Во-первых, она говорит о том, что постановка задачи об отыскании наименьшего (наибольшего) значения ограниченного снизу (сверху) функционала имеет смысл. Во-вторых, она объясняет природу решения такой задачи. А именно: решением будет либо определенный элемент множества М, минимизирующий (максимизирующий) функционал , либо последовательность элементов множества М, являющаяся минимизирующей (максимизирующей) последовательностью. В первом случае можно говорить о точном решении задачи, а во втором - о приближенном.
Задачи оптимизации управляемых процессов (оптимального управления) являются частными по отношению к сформулированной выше общей задаче оптимизации. Рассмотрим постанову задач оптимального управления.
Введем некоторые понятия.
Важнейшими из них являются понятия состояния системы и управления. Будем рассматривать системы, состояние которых может быть в любой момент времени определено вектором х n-мерного пространства с координатами . Пространство Х будем называть пространством состояний системы.
Так как система изменяется во времени, то ее поведение можно описать последовательностью состояний. Такую последовательность системы называют ее траекторией.
Переменная t (называется аргументом процесса) может быть некоторым отрезком числовой прямой () или отрезком натурального ряда (). В первом случае процесс, происходящий в системе, называется непрерывным, во втором случае - многошаговым, а системы - соответственно непрерывными и дискретными.
Изменение состояния системы, т. е. процесс в ней, может происходить в результате управляющих воздействий. Будем рассматривать системы, управляющие воздействия в которых моделируются с помощью элементов r-мерного пространства U:
, .
Управляющие воздействия могут задаваться в виде функций от t, т.е. .
На допустимые состояния системы и управления могут быть наложены ограничения. Рассмотрим множество троек - совокупность - мерных векторов в пространстве . Тогда ограничения на состояние системы и управление в самом общем случае могут быть записаны в виде
,
где - некоторая область (подмножество) рассматриваемого - мерного пространства. Ограничения на величины , в каждый фиксированный момент времени t могут быть заданы и в виде
,
где Vt - сечение множества V при заданном значении t.
Пару функций назовем процессом. Между функциями имеется связь: как только задано управление системой, последовательность ее состояний (траектория системы) определяется однозначно. Связь между и моделируется по-разному в зависимости от того, является система непрерывной или дискретной.
Для непрерывных систем модели процессов задаются системой дифференциальных уравнений вида
,
или в векторной форме
. (4.2.1)
Пусть задано состояние, в котором система находилась в начальный момент . Для простоты этот момент примем равным нулю, а момент окончания процесса - равным Т. Тогда аргумент процесса t изменяется в пределах , а начальным состоянием системы будет вектор
, (4.2.2)
где - начальное значение i-й координаты вектора состояния системы.
Проанализируем, каким образом модель отражает связь между управлениями и состоянием системы, изменяющимся под их воздействием. Пусть на промежутке задано управление . Подставляя его в правую часть системы (4.2.3), получим
(4.2.3)
Имеем систему дифференциальных уравнений относительно неизвестной функции . Решая ее с учетом начальных условий (4.2.2), получим . Это решение и есть траектория, отвечающая заданному управлению .
Модель дискретной управляемой системы имеет вид системы рекуррентных уравнений:
, .
В векторной форме эту модель можно записать в виде
, (4.2.4)
Здесь t принимает значение . Начальное значение будем считать известным.
В дискретной системе, как и в непрерывной, задание управляющих воздействий при позволяет однозначно определить отвечающую им траекторию системы. При подстановке значения u(t) в правую часть (4.2.4) получаем систему уравнений, которая позволяет при известном значении состояния в момент времени t определить состояние в следующий момент времени. Так как в начальный момент состояние известно, то, подставив его в правую часть (4.2.4), получим
.
Подставляя затем найденное значение и в (4.2.4), так же найдем значение . Продолжая этот процесс, через Т шагов получим последнее искомое значение .
Таким образом, и в дискретном случае уравнения модели (4.2.4) позволяют однозначно определить траекторию системы , если задано управление .
Следовательно, процесс должен удовлетворять следующим ограничениям:
1) при всех ;
2) Пара удовлетворяет системе уравнений процесса:
а) системе (4.2.1) в непрерывном случае при ;
б) системе (4.2.4) в дискретном случае при ;
3) Заданы начальные условия (4.2.2);
4) В непрерывном случае на функции , накладываются некоторые дополнительные ограничения, связанные с применимостью употребляемых здесь математических записей. Функцию будем считать кусочно-непрерывной, а вектор-функцию - непрерывной и кусочно-дифференцируемой.
Процессы , удовлетворяющие условиям 1) – 4), будем называть допустимыми. Таким образом, допустимый процесс - это управляющие воздействия и соответствующая им траектория системы , удовлетворяющие перечисленным ограничениям.
Для постановки оптимизационной задачи необходимо ввести в рассмотрение функционал F, заданный на множестве М. Задача оптимального управления будет состоять в выборе элемента множества M, на котором функционал F достигает минимального значения. Такой процесс называют оптимальным процессом, управление - оптимальным управлением, а траекторию оптимальной траекторией.
Функционал F, заданный на множестве допустимых процессов, описывает цель, согласно которой оптимизируется процесс.
В задачах оптимального управления для непрерывных систем будем рассматривать функционалы следующего вида:
, (4.2.5)
где ; - заданные функции. Выражение (4.2.5) позволяет вычислить для каждого допустимого процесса определенное значение и тем самым задать функционал на множестве допустимых процессов. Для этого необходимо подставить x(t), вместо аргументов функции , которая становится функцией времени, после чего вычислить ее интеграл. Затем к значению интеграла прибавляем значение функции при .
Функционал состоит из двух частей: и . Первое из этих слагаемых оценивает качество процесса на на всем промежутке , второе слагаемое - качество конечного состояния системы. Иногда в задачах оптимального управления конечное состояние системы задается. В этом случае второе слагаемое функционала (4.2.5) есть величина постоянная и, следовательно, не влияет на его минимизацию. Такие задачи называются задачами с фиксированным правым концом траектории.
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17