Классификация оптимальных систем автоматического управления. Системы оптимального управления
В широком значении слово «оптимальный» означает наилучший в смысле некоторого критерия эффективности. При таком толковании любая научно обоснованная система является оптимальной, так как при выборе какой-либо системы подразумевается, что она в каком-либо отношении лучше других систем. Критерии, с помощью которых осуществляется выбор (критерии оптимальности), могут быть различными. Этими критериями могут являться качество динамики процессов управления, надежность системы, энергопотребление, ее вес и габариты, стоимость и т. п., либо совокупность этих критериев с некоторыми весовыми коэффициентами.
Ниже термин «оптимальный» используется в узком смысле, когда система автоматического управления оценивается лишь качеством динамических процессов и при этом критерием (мерой) этого качества выступает интегральный показатель качества. Такое описание критериев качества позволяет использовать для нахождения оптимального управления хорошо разработанный в математике аппарат вариационного исчисления.
Далее рассматривается два класса систем: системы программного управления, управляющее воздействие в которых не использует информацию о текущем состоянии объекта, и системы автоматического регулирования (системы стабилизации программного движения), действующие по принципу обратной связи.
Вариационные задачи, возникающие при построении оптимальных систем программного и стабилизирующего управления, формулируются в первой главе. Во второй главе излагается математическая теория оптимального управления (принцип максимума Л. С. Понтрягина и метод динамического программирования Р. Веллмана). Эта теория является фундаментом для построения оптимальных систем. Она доставляет большой объем информации о структуре оптимального управления. Свидетельством последнего являются оптимальные по быстродействию управления, которым посвящена третья глава. Вместе с тем практическое применение теории сталкивается с трудностями вычислительного характера. Дело в том, что математическая теория оптимального управления позволяет свести процесс построения оптимального управления к решению краевой задачи для дифференциальных уравнений (обыкновенных либо в частных производных).
Трудности численного решения краевых задач приводят к тому, что построение оптимальных управлений для каждого класса объектов управления является самостоятельной творческой задачей, решение которой требует учета специфических особенностей объекта, опыта и интуиции разработчика.
Эти обстоятельства побудили к отысканию классов объектов, для которых при построении оптимального управления краевая задача легко решается численно. Такими объектами управления оказались объекты, описываемые линейными дифференциальными уравнениями . Эти результаты, полученные А. М. Летовым и Р. Калманом, явились основой нового направления синтеза систем оптимальной стабилизации, называемого аналитическим конструированием регуляторов.
Аналитическому конструированию регуляторов, широко используемому при проектировании современных сложных систем стабилизации, посвящены четвертая и пятая главы.
Определение и необходимость построения оптимальных систем автоматического управления
Системы автоматического управления обычно проектируют, исходя из требований обеспечения тех или иных показателей качества. Во многих случаях необходимое повышение динамической точности и улучшение переходных процессов систем автоматического управления достигается с помощью корректирующих устройств.
Особенно широкие возможности повышения показателей качества дает введение в САУ разомкнутых компенсационных каналов и дифференциальных связей, синтезированных из того или иного условия инвариантности ошибки относительно задающего или возмущающих воздействий . Однако эффект влияния корректирующих устройств, разомкнутых компенсационных каналов и эквивалентных им дифференциальных связей на показатели качества САУ зависит от уровня ограничения сигналов нелинейными элементами системы. Выходные сигналы дифференцирующих устройств, обычно кратковременные по длительности и значительные по амплитуде, ограничиваются элементами системы и не приводят к улучшению показателей качества системы, в частности ее быстродействия. Лучшие результаты решения задачи повышения показателей качества САУ при наличии ограничений сигнала дает так называемое оптимальное управление.
Задача синтеза оптимальных систем строго сформулирована сравнительно недавно, когда было дано определение понятия критерия оптимальности. В качестве критерия оптимальности в зависимости от цели управления могут быть выбраны различные технические или экономические показатели управляемого процесса. В оптимальных системах обеспечивается не просто некоторое повышение того или иного технико-экономического показателя качества, а достижение минимально или максимально возможного его значения.
Если критерий оптимальности выражает технико-экономические потери (ошибки системы, время переходного процесса, расход энергии, средств, стоимость и т. п), то оптимальным будет такое управление, которое обеспечивает минимум критерия оптимальности. Если Же он выражает рентабельность (к. п. д., производительность, прибыль, дальность полета ракеты и т. д.), то оптимальное управление должно обеспечить максимум критерия оптимальности.
Задача определения оптимальной САУ, в частности синтез оптимальных параметров системы при поступлении на ее вход задающего
воздействия и помехи, являющихся стационарными случайными сигналами, рассматривалась в гл. 7. Напомним, что в данном случае в качестве критерия оптимальности принято среднеквадратическое значение ошибки (СКО). Условия повышения точности воспроизведения полезного сигнала (задающего воздействия) и подавления помехи носят противоречивый характер , и поэтому возникает задача выбора таких (оптимальных) параметров системы, при которых СКО принимает наименьшее значение.
Синтез оптимальной системы при среднеквадратическом критерии оптимальности является частной задачей. Общие методы синтеза оптимальных систем основываются на вариационном исчислении. Однако классические методы вариационного исчисления для решения современных практических задач, требующих учета ограничений, во многих случаях оказываются непригодными. Наиболее удобными методами синтеза оптимальных систем автоматического управления являются метод динамического программирования Беллмана и принцип максимума Понтрягина.
Таким образом, наряду с проблемой улучшения различных показателей качества САУ возникает задача построения оптимальных систем, в которых достигается экстремальное значение того или иного технико-экономического показателя качества.
Разработка и внедрение оптимальных систем автоматического управления способствует повышению эффективности использования производственных агрегатов, увеличению производительности труда, улучшению качества продукции, экономии электроэнергии, топлива, сырья и т.
Понятия о фазовом состоянии и фазовой траектории объекта
В технике часто возникает задача перевода управляемого объекта (процесса) из одного состояния в другое. Например, при целеуказании необходимо антенну радиолокационной станции повернуть из начального положения с начальным азимутом в заданное положение с азимутом Для этого на электродвигатель, связанный с антенной через редуктор, подают управляющее напряжение и. В каждый момент времени состояние антенны характеризуется текущим значением угла поворота и угловой скоростью Эти две величины изменяются в зависимости от управляющего напряжения и. Таким образом, существуют три связанных между собой параметра и (рис. 11.1).
Величины характеризующие состояние антенны, называются фазовыми координатами, и - управляющим воздействием. При целеуказании РЛС типа станции орудийной наводки возникает задача поворота антенны по азимуту и углу места. В этом случае будем иметь четыре фазовые координаты объекта и два управляющих воздействия. У летящего самолета можно рассматривать шесть фазовых координат (три пространственные координаты и три компоненты скорости ) и несколько управляющих воздействий (тяга двигателя, величины, характеризующие положение рулей
Рис. 11.1. Схема объекта с одним, управляющим воздействием и двумя фазовыми координатами.
Рис. 11.2. Схема объекта с управляющими воздействиями и фазовыми координатами.
Рис. 11.3. Схема объекта с векторным изображением управляющего воздействия и и фазового состояния объекта
высоты и направления, элеронов). В общем случае в каждый момент времени состояние объекта характеризуется фазовыми координатами а к объекту может быть приложено управляющих воздействий (рис. 11.2).
Под переводом управляемого объекта (процесса) из одного состояния в другое следует понимать не только механическое перемещение (например, антенны РЛС, самолета), но также требуемое изменение различных физических величин : температуры, давления, влажности кабины, химического состава того или иного сырья при соответствующем управляемом технологическом процессе.
Управляющие воздействия удобно считать координатами некоторого вектора называемого вектором управляющего воздействия. Фазовые координаты (переменные состояния) объекта также можно рассматривать, как координаты некоторого вектора или точки в -мерном пространстве с координатами Эту точку называют фазовым состоянием (вектором состояния) объекта, а -мерное пространство, в котором в виде точек изображаются фазовые состояния, называется фазовым пространством (пространством состояний) рассматриваемого объекта. При использовании векторных изображений управляемый объект можно изобразить, как показано на рис. 11.3, где и - вектор управляющего воздействия и представляет собой точку в фазовом пространстве, характеризующую фазовое состояние объекта. Под влиянием управляющего воздействия и фазовая точка перемещается, описывая в фазовом пространстве некоторую линию, называемую фазовой траекторией рассматриваемого движения объекта.
ОПТИМАЛЬНЫЕ И АДАПТИВНЫЕ СИСТЕМЫ
(лекции, заочный факультет, 5 курс)
Лекция 1.
Введение.
В классической теории автоматического управления (ТАУ) задачи оптимизации и адаптации ставились в основном применительно к управлению «в малом». Это означает, что оптимальная программа изменения режимов технологического процесса, выраженная в задающих воздействиях регуляторов, считалась известной, определенной на стадии проектирования. Задача управления заключалась в выполнении этой программы, стабилизации программного движения. При этом допускались лишь малые отклонения от заданного движения, и переходные процессы «в малом» оптимизировались по тем или иным критериям.
В конце 50-х - начале 60-х гг. XX столетия появились работы Л.С. Понтрягина (принцип максимума), Р. Беллмана (динамическое программирование), Р. Калмана (оптимальная фильтрация, управляемость и наблюдаемость), которые заложили основы современной теории автоматического управления, общепринятого определения понятия которой пока не существует.
Наиболее точно современную теорию автоматического управления можно отделить от классической ТАУ, учитывая требования научно-технического прогресса, современной и перспективной автоматизации. Важнейшим из таких требований является оптимальное использование всех располагаемых ресурсов (энергетических, информационных, вычислительных) для достижения главной обобщенной конечной цели при соблюдении ограничений.
Прежде всего указанная оптимизация требует полного использования имеющейся априорной информации в виде математической модели управляемого процесса или объекта. Использование таких моделей не только на стадии проектирования, но и в процессе функционирования систем, является одной из характерных черт современной теории автоматического управления.
Оптимальное управление возможно лишь при оптимальной обработке информации. Поэтому теория оптимального (и субоптимального) оценивания (фильтрации) динамических процессов является составной частью современной теории автоматического управления. Особо важной является параметрическая идентификация (оценивание параметров и характеристик по экспериментальным данным), выполняемая в реальном масштабе времени в эксплуатационных режимах ОУ.
Подлинная оптимизация автоматического управления в условиях неполной априорной информации возможна только в процессе функционирования системы в текущей обстановке и возникшей ситуации. Следовательно, современная теория автоматического управления должна рассматривать адаптивное оптимальное (субоптимальное) управление «в большом». Кроме того, современная теория автоматического управления должна рассматривать методы резервирования и структурного обеспечения надежности (особенно принципы автоматической реконфигурации системы при отказах).
Определение, особенности и общая характеристика оптимальных систем.
Оптимальной называется наилучшая в некотором технико-экономическом смысле система. Основной ее особенностью является наличие двух целей управления, которые эти системы решают автоматически.
Основная цель управления - поддержание управляемой величины на заданном значении и устранение возникающих отклонений этой величины.
Цель оптимизации - обеспечение наилучшего качества управления, определяемое по достижению экстремума некоторого технико-экономического показателя, называемого критерием оптимальности (КО).
Оптимальные системы разделяют в зависимости от вида КО на два класса: оптимальные в статике системы и оптимальные в динамике системы.
У оптимальных в статике систем КО является функцией параметров или управляющих воздействий. Этот критерий имеет экстремум в статическом режиме работы системы, причем статическая характеристика, выражающая зависимость КО от управляющих воздействий оптимизации, может непредвиденным образом смещаться под действием возмущений. Оптимальная система должна этот экстремум находить и поддерживать. Такие системы применимы, если возмущения, смещающие указанную характеристику, изменяются сравнительно медленно по сравнению с длительностью переходных процессов в системе. Тогда система будет успевать отслеживать экстремум практически в статическом режиме. Такие условия обычно выполняются на верхней ступени иерархии управления.
Оптимальные в динамике системы отличаются тем, что их критерий оптимальности представляет собой функционал, т. е. функцию от функций времени. Это значит, что, задав функции времени, от которых данный функционал зависит, получим числовое значение функционала. Эти системы могут применяться при сравнительно быстро меняющихся внешних воздействиях, не выходящих, однако, за допустимые пределы. Поэтому они используются на нижних уровнях управления.
1.2. Критерии оптимальности оптимальных в динамике систем
Обычно эти функционалы имеют вид определенных интегралов по времени
где x(t), u(t) - векторы состояния и управления данной системы;
Т - длительность процесса (в частности, может быть Т = ).
В зависимости от подынтегральной функции f 0 эти критерии имеют следующие основные виды.
1. Линейные функционалы, у которых f 0 - линейная функция переменных:
Критерий максимального быстродействия при f 0 1, т.е.
который равен длительности процесса, а соответствующие системы называют оптимальными по быстродействию;
Линейные интегральные оценки
Критерий максимальной производительности
,
где q(t) - количество произведенной продукции.
2. Квадратичные функционалы, у которых f 0 - квадратичная форма от входящих в нее переменных:
Квадратичные интегральные оценки качества переходного процесса
;
Критерий энергозатрат на управление, у которого
,
где u - управляющее воздействие, а и 2 - мощность, затрачиваемая на управление;
Обобщенный квадратичный критерий, равный сумме двух предшествующих, взятых с некоторыми весовыми коэффициентами. Он компромиссно характеризует качество переходного процесса и энергозатраты на него, т. е.
,
где Q и R - положительно определенные квадратные матрицы . Функционалы, не содержащие интегралов:
Критерий минимакса, при оптимизации по которому надо обеспечить минимальное значение максимума модуля (нормы) вектора отклонения управляемого процесса от его эталонного закона изменения, т. е.
, где
x
э – эталонный закон изменения.
Простейшим примером этого критерия для скалярного случая является известное максимальное перерегулирование переходного процесса;
Функция от конечного состояния
которая является функционалом потому, что конечное состояние объекта х (Т) является функцией от управляющего воздействия u (t). Этот критерий оптимальности может применяться в сумме с одним из рассмотренных выше критериев, имеющих вид определенного интеграла.
Выбор того или иного критерия оптимальности для конкретного объекта или системы производится на основании соответствующего изучения работы объекта и предъявляемых к нему требований технико-экономического характера. Этот вопрос не может быть решен в рамках только теории автоматического управления. В зависимости от физического смысла критерия оптимальности его требуется либо минимизировать, либо максимизировать. В первом случае он выражает потери, во втором случае технико-экономическую выгоду. Формально, поменяв знак перед функционалом, можно задачу по максимизации свести к задаче по минимизации.
Лекция 2.
1.3. Краевые условия и ограничения
для оптимальных в динамике систем
Основная цель управления в таких системах обычно формулируется как задача перевода изображающей точки из некоторого начального состояния х(О) в некоторое конечное х(Т) состояние. Начальное состояние принято называть левым концом оптимальной траектории, а конечное - правым. Вместе взятые эти данные и образуют краевые условия. Задачи управления могут отличаться видом краевых условий.
1. Задача с закрепленными концами траектории имеет место, когда х (0) и х (Т) фиксированные точки пространства.
2. Задача с подвижными концами траектории получается, когда х (0) и х (Т) принадлежат некоторым известным линиям или поверхностям пространства.
3. Задача со свободными концами траектории возникает, когда указанные точки занимают произвольные положения. На практике встречаются и смешанные задачи, например х (0) - фиксирован, а х (Т) подвижен. Такая задача будет иметь место, если объект из заданного фиксированного состояния должен «догнать» некоторую эталонную траекторию (рис. 1).
Ограничениями называются дополнительные условия, которым должны удовлетворять управляющие воздействия и управляемые величины. Встречаются два вида ограничений.
1. Безусловные (естественные) ограничения, которые выполняются в силу физических законов для процессов в объекте управления (ОУ). Эти ограничения показывают, что некоторые величины и их функции не могут выйти за границы, определяемые равенствами или неравенствами. Например, уравнение двигателя постоянного тока (ДПТ):
,
ограничение на скорость асинхронного двигателя , где - синхронная скорость.
2. Условные (искусственные) ограничения, выражающие такие требования к величинам или функциям от них, согласно которым они не должны превосходить границ, определенных равенствами или неравенствами по условиям долговечной и безопасной эксплуатации объектов. Например, ограничение на питающее напряжение , ограничения на допустимую скорость, ускорение и т. п.
Для обеспечения условных ограничений необходимо принимать меры схемного или программного характера при реализации соответствующего управляющего устройства.
Ограничения, независимо от их вида, выражаемые равенствами, называются классическими, а неравенствами - неклассическими.
Похожая информация.
ОПТИМАЛЬНАЯ СИСТЕМА
ОПТИМАЛЬНАЯ СИСТЕМА, система автоматического управления, обеспечивающая наилучшее (оптимальное) с нек-рой точки зрения функционирование управляемого объекта. Его характеристики и внешние возмущающие воздействия могут изменяться непредвиденным образом, но, как правило, при определенных ограничениях. Наилучшее функционирование системы управления характеризуется т. н. критерием оптимального управления (критерием оптимальности, целевой функцией), к-рый представляет собой величину, определяющую эффективность достижения цели управления и зависящую от изменения во времени или в пространстве координат и параметров системы. Критерием оптимальности могут быть различные технич. и экономич. показатели функционирования объекта: кпд, быстродействие, среднее или максимальное отклонение параметров системы от заданных значений, себестоимость продукции, отд. показатели качества продукции либо обобщённый показатель качества и т. п. Критерий оптимальности может относиться как к переходному, так и к установившемуся процессу, либо и к тому и к др. Различают регулярный и статистич. критерии оптимальности. Первый зависит от регулярных параметров и от координат управляемой и управляющей систем. Второй применяется тогда, когда входные сигналы - случайные функции или (и) нужно учесть случайные возмущения, порождённые отдельными элементами системы. По матем. описанию критерий оптимальности может быть либо функцией конечного числа параметров и координат управляемого процесса, к-рая принимает экстремальное значение при оптимальном функционировании системы, либо функционалом от функции, описывающей закон управления; при этом определяется такой вид этой функции, при к-ром функционал принимает экстремальное значение. Для расчёта О. с. пользуются принципом максимума Понтрягина либо теорией динамич. программирования.
Оптимальное функционирование сложных объектов достигается при использовании самоприспосабливающихся (адаптивных) систем управления, к-рые обладают способностью автоматически изменять в процессе функционирования алгоритм управления, свои характеристики или структуру для сохранения неизменным критерия оптимальности при произвольно изменяющихся параметрах системы и условиях её работы. Поэтому в общем случае О. с. состоит из двух частей: постоянной (неизменной), включающей объект управления и нек-рые элементы управляющей системы, и переменной (изменяемой), объединяющей остальные элементы. См. также Оптимальное управление. М. М. Майзель.
Для проектирования оптимальной САУ необходима полная информация об ОУ, возмущающих и задающих воздействиях, начальном и конечном состояниях ОУ. Далее требуется выбрать критерий оптимальности. В качестве такого критерия можно использовать один из показателей качества системы. Однако требования к отдельным показателям качества, как правило, противоречивы (например, повышение точности системы достигается уменьшением запаса устойчивости). Кроме того, оптимальная система должна иметь минимально возможную ошибку не только при отработке какого-то конкретного управляющего воздействия, но в течение всего времени работы системы. Следует также учитывать, что решение задачи оптимального управления зависит не только от структуры системы, но и от параметров составляющих ее элементов.
Достижение оптимального функционирования САУ во многом определяется тем, как осуществляется управление во времени, какова программа, или алгоритм управления. В связи с этим для оценки оптимальности систем используют интегральные критерии, вычисляемые как сумма значений интересующего проектировщиков параметра качества системы за все время процесса управления.
В зависимости от принятого критерия оптимальности рассматривают следующие виды оптимальных систем.
1. Системы , оптимальные по быстродействию , которые обеспечивают минимальное время перевода ОУ из одного состояния в другое. В этом случае критерий оптимальности выглядит следующим образом:
где / н и / к - моменты начала и окончания процесса управления.
В таких системах длительность процесса управления минимальна. Простейший пример - система управления двигателем, обеспечивающая минимальное время разгона его до заданной частоты вращения с учетом всех имеющихся ограничений.
2. Системы , оптимальные по расходу ресурсов , которые гарантируют минимум критерия

где к - коэффициент пропорциональности; U(t) - управляющее воздействие.
Такая система управления двигателем обеспечивает, например, минимальный расход топлива за все время управления.
3. Системы , оптимальные по потерям управления (или по точности), которые обеспечивают минимальные ошибки управления на основании критерия где e(f) - динамическая ошибка.

В принципе задача проектирования оптимальной САУ может быть решена простейшим методом перебора всех возможных вариантов . Конечно, такой метод требует больших затрат времени, но современные ЭВМ позволяют в некоторых случаях им воспользоваться. Для решения задач оптимизации разработаны специальные методы вариационного исчисления (метод максимума, метод динамического программирования и др.), позволяющие учесть все ограничения реальных систем.
В качестве примера рассмотрим, каким должно быть оптимальное по быстродействию управление электродвигателем постоянного тока, если подаваемое на него напряжение ограничено предельной величиной {/ лр, а сам двигатель можно представить в виде апериодического звена 2-го порядка (рис. 13.9, а).
Метод максимума позволяет рассчитать закон изменения и(г), обеспечивающий минимальное время разгона двигателя до частоты вращения (рис. 13.9, б). Процесс управления данным двигателем должен состоять из двух интервалов, в каждом из которых напряжение u(t) принимает свое предельное допустимое значение (в интервале 0 - /,: u(t) = +?/ пр, в интервале /| - / 2: u(t) = -?/ пр)* Для обеспечения такого управления в состав системы должен быть включен релейный элемент.
Как и обычные системы, оптимальные системы бывают разомкнутыми, замкнутыми и комбинированными. Если оптимальное управление, переводящее ОУ из начального состояния в конечное и не зависящее или слабо зависящее от возмущающих воздействий, может быть задано как функция времени U = (/(/), то строится разомкнутая система программного управления (рис. 13.10, а).
В программное устройство ПУ закладывается оптимальная программа П, рассчитанная на достижение экстремума принятого критерия оптимальности. По такой схеме осуществляется управ-

Рис. 13.9.
а - с обшим управляющим устройством; б - с двухуровневым управляющим
устройством
Рис. 13.10. Схемы оптимальных систем: а - разомкнутой; б - комбинированной
ление станками с числовым программным управлением и простейшими роботами, производится вывод ракет на орбиту и т.д.
Наиболее совершенными, хотя и наиболее сложными, являются комбинированные оптимальные системы (рис. 13.10, б). В таких системах разомкнутый контур осуществляет оптимальное управление по заданной программе, а замкнутый контур, оптимизированный по минимуму ошибки, отрабатывает отклонение выходных параметров. Используя канат измерения возмущений /*, система становится инвариантной относительно всего множества задающих и возмущающих воздействий.
Для того чтобы реализовать столь совершенную систему управления, необходимо точно и быстро измерять все возмущаюшие воздействия. Однако такая возможность имеется далеко не всегда. Гораздо чаще о возмущающих воздействиях известны только усредненные статистические данные. Во многих случаях, особенно в системах телеуправления, даже задающее воздействие поступает в систему вместе с помехами. А так как помеха представляет собой в общем случае случайный процесс, то удается синтезировать только статистически оптимальную систему. Такая система не будет оптимальной для каждой конкретной реализации процесса управления, но она будет в среднем наилучшей для всего множества его реализаций.
Для статистически оптимальных систем в качестве критериев оптимальности используют усредненные вероятностные оценки. Например, для следящей системы, оптимизированной по минимуму ошибки, в качестве статистического критерия оптимальности используют математическое ожидание квадрата отклонения выходного воздействия от заданного значения, т.е. дисперсию:
Используются и другие вероятностные критерии. Например, в системе обнаружения целей, где важно только наличие или отсутствие цели, в качестве критерия оптимальности применяют вероятность ошибочного решения Р ош:
где Р п ц - вероятность пропуска цели; Р ЛО - вероятность ложного обнаружения.
Во многих случаях рассчитанные оптимальные САУ оказываются практически не реализуемыми ввиду их сложности. Как правило, требуется получение точных значений производных высоких порядков от входных воздействий, что технически очень трудно осуществимо. Зачастую даже теоретический точный синтез оптимальной системы оказывается невозможен. Однако методы оптимального проектирования позволяют строить квазиоптимальные системы, хотя и упрощенные в той или иной степени, но все- гаки позволяющие достичь значений принятых критериев оптимальности, близких к экстремальным.