Теория оптимального управления. Оптимальные системы автоматического управления Суть управления состоит в оптимальном

Оптимальное управление

Андрей Александрович Аграчёв

Человеку свойственно стремление к совершенству. В математике оно проявляется в поиске наилучших (оптимальных) решений, включая все задачи на максимум и минимум. К теории оптимального управления относятся те из них, где решение имеет некоторую протяженность во времени или в пространстве. Подходящий образ — прокладывание наилучшего пути при движении по сильно пересечённой местности.

Вообще, математики, как и все люди, очень любят зрительные образы, но в действительности речь идёт о любой системе, которую можно непрерывно менять в определённых пределах, как мы меняем направление движения при прокладывании пути. Другие подходящие примеры: управление автомобилем, летательным аппаратом, технологическим процессом, своим телом, в конце концов.

Требуется наилучшим образом перевести систему из заданного состояния в желаемое: как можно быстрее, или наиболее экономным образом, или с наибольшей выгодой, или в соответствии с каким‐то более сложным критерием; мы сами решаем, что важнее. Если мгновенная реакция системы на наши действия хорошо известна, то теория оптимального управления призвана помочь нам найти наилучшую долговременную стратегию. Вот простой пример: нужно как можно быстрее остановить колебания (скажем, остановить «качели»), прикладывая свою невеликую силу то с одной стороны, то с другой. Переходить с одной стороны на другую придётся многократно. По какому правилу это делать? Понятно, что «качели» могут быть и финансовыми, и экономическими, и физико‐техническими…

Стоит заметить, что такой очевидно прикладной предмет, как теория оптимального управления, был создан в Математическом институте имени Стеклова чистыми математиками, Львом Семёновичем Понтрягиным и его учениками, профессиональными топологами. Первые впечатляющие применения этой теории, принесшие ей славу, относятся к советской космической программе и американской программе «Аполлон». В этих программах всё делалось на пределе возможностей, и без умной оптимизации было не справиться. Среди популярных тогда задач можно отметить наиболее экономный перевод космического аппарата с одной эллиптической орбиты на другую и мягкое прилунение. Главное достижение того периода — принцип максимума Понтрягина — мощное универсальное средство, позволяющее отобрать достаточно узкий класс управляющих стратегий, среди которых только и может быть оптимальная.

Принцип максимума Понтрягина особенно хорош в применении к простым «линейным» моделям, но теряет свою эффективность и должен быть дополнен другими средствами при исследовании систем с более сложной нелинейной структурой. Вернёмся к примеру с качелями. Если амплитуда колебаний небольшая, то система почти линейна и период колебаний почти не зависит от амплитуды. Принцип максимума даёт простой и однозначный закон оптимального поведения для линейного приближения: надо переходить с одной стороны на другую ровно через полпериода и всякий раз применять максимально возможную силу. В то же время при большой амплитуде, когда система существенно нелинейна, рекомендации принципа максимума сильно усложняются и перестают быть однозначными.

Новые правила оптимального поведения, дополняющие принцип максимума, даёт активно развиваемая в настоящее время геометрическая теория управления. Дело в том, что современная геометрия позволяет очень сильно расширять возможности управления, играя порядком и длительностью применения нескольких простых манёвров, отбирая оптимальные «гармоничные» сочетания манёвров, результат каждого из которых хорошо известен и вполне банален. Похоже на то, как из нескольких нот составляется симфония, только в математике всё точнее, строже и симметричней, хотя и не столь эмоционально.

Геометрическая теория управления применяется в космической навигации, робототехнике и многих других областях, но наиболее популярные современные приложения относятся, пожалуй, к квантовым системам (от медицинских аппаратов ядерного магнитного резонанса до химических манипуляций с отдельными молекулами). Обаяние геометрической теории управления состоит, среди прочего, в редкой возможности материализовать, увидеть и «пощупать» красивые и глубокие абстрактные математические концепции, ну и, конечно, создавать новые!

Литература

Тихомиров В. М. Рассказы о максимумах и минимумах. — М.: Наука, 1986. — (Библиотечка «Квант»; Вып. 56). — [Переиздания: М.: МЦНМО, 2006, 2017].

Протасов В. Ю. Максимумы и минимумы в геометрии. — М.: МЦНМО, 2012. — (Библиотека «Математическое просвещение»; Вып. 31).

Оптимальное управление в последние годы начали применять как в технических системах для повышения эффективности производственных процессов, так и в системах организационного управления для совершенствования деятельности предприятий, организаций, отраслей народного хозяйства.

В организационных системах обычно интересуются конечным, установившимся результатом команды, не исследуя

эффективность во время переходного процесса между отдачей команды и получением окончательного результата Объясняется это тем, что обычно в таких системах потери в переходном процессе достаточно малы и влияют несущественно на общую величину выигрыша в установившемся режиме, поскольку сам установившийся режим значительно более длителен, чем переходный процесс. Но иногда динамика не исследуется из-за математических трудностей. Методам оптимизации конечных состояний в организационных и экономических системах посвящены курсы методов. оптимизации и исследования операций.

В управлении динамическими техническими системами оптимизация часто существенна именно для переходных процессов, в которых показатель эффективности зависит не только от текущих значений координат (как в экстремальном управлении), но и от характера изменения в прошлом, настоящем и будущем, и выражается некоторым функционалом от координат, их производных и, может быть, времени.

В качестве примера можно привести управление бегом спортсмена на дистанции. Так как его запас энергии ограничен физиологическими факторами, а расходование запаса зависит от характера бега, спортсмен уже не может в каждый момент отдавать максимум возможной мощности, чтобы не израсходовать запас энергии преждевременно и не выдохнуться на дистанции, а должен искать оптимальный для своих особенностей режим бега.

Нахождение оптимального управления в подобных динамических задачах требует решения в процессе управления достаточно сложной математической задачи методами вариационного исчисления или математического программирования в зависимости от вида математического описания (математической модели) системы. Таким образом, органической составной частью системы оптимального управления становится счетно-решающее устройство или вычислительная машина. Принцип поясняется на рис. 1.10. На вход вычислительного устройства (машины) ВМ поступает информация о текущих значениях координат х с выхода объекта О, об управлениях и с его входа, о внешних воздействиях z на объект, а также задание извне различных условий: значение критерия оптимальности граничных условий информация о допустимых значениях Вычислительное

Для проектирования оптимальной САУ необходима полная информация об ОУ, возмущающих и задающих воздействиях, начальном и конечном состояниях ОУ. Далее требуется выбрать критерий оптимальности. В качестве такого критерия можно использовать один из показателей качества системы. Однако требования к отдельным показателям качества, как правило, противоречивы (например, повышение точности системы достигается уменьшением запаса устойчивости). Кроме того, оптимальная система должна иметь минимально возможную ошибку не только при отработке какого-то конкретного управляющего воздействия, но в течение всего времени работы системы. Следует также учитывать, что решение задачи оптимального управления зависит не только от структуры системы, но и от параметров составляющих ее элементов.

Достижение оптимального функционирования САУ во многом определяется тем, как осуществляется управление во времени, какова программа, или алгоритм управления. В связи с этим для оценки оптимальности систем используют интегральные критерии, вычисляемые как сумма значений интересующего проектировщиков параметра качества системы за все время процесса управления.

В зависимости от принятого критерия оптимальности рассматривают следующие виды оптимальных систем.

1. Системы , оптимальные по быстродействию , которые обеспечивают минимальное время перевода ОУ из одного состояния в другое. В этом случае критерий оптимальности выглядит следующим образом:

где / н и / к - моменты начала и окончания процесса управления.

В таких системах длительность процесса управления минимальна. Простейший пример - система управления двигателем, обеспечивающая минимальное время разгона его до заданной частоты вращения с учетом всех имеющихся ограничений.

2. Системы , оптимальные по расходу ресурсов , которые гарантируют минимум критерия

где к - коэффициент пропорциональности; U(t) - управляющее воздействие.

Такая система управления двигателем обеспечивает, например, минимальный расход топлива за все время управления.

3. Системы , оптимальные по потерям управления (или по точности), которые обеспечивают минимальные ошибки управления на основании критерия где e(f) - динамическая ошибка.

В принципе задача проектирования оптимальной САУ может быть решена простейшим методом перебора всех возможных вариантов. Конечно, такой метод требует больших затрат времени, но современные ЭВМ позволяют в некоторых случаях им воспользоваться. Для решения задач оптимизации разработаны специальные методы вариационного исчисления (метод максимума, метод динамического программирования и др.), позволяющие учесть все ограничения реальных систем.

В качестве примера рассмотрим, каким должно быть оптимальное по быстродействию управление электродвигателем постоянного тока, если подаваемое на него напряжение ограничено предельной величиной {/ лр, а сам двигатель можно представить в виде апериодического звена 2-го порядка (рис. 13.9, а).

Метод максимума позволяет рассчитать закон изменения и(г), обеспечивающий минимальное время разгона двигателя до частоты вращения (рис. 13.9, б). Процесс управления данным двигателем должен состоять из двух интервалов, в каждом из которых напряжение u(t) принимает свое предельное допустимое значение (в интервале 0 - /,: u(t) = +?/ пр, в интервале /| - / 2: u(t) = -?/ пр)* Для обеспечения такого управления в состав системы должен быть включен релейный элемент.

Как и обычные системы, оптимальные системы бывают разомкнутыми, замкнутыми и комбинированными. Если оптимальное управление, переводящее ОУ из начального состояния в конечное и не зависящее или слабо зависящее от возмущающих воздействий, может быть задано как функция времени U = (/(/), то строится разомкнутая система программного управления (рис. 13.10, а).

В программное устройство ПУ закладывается оптимальная программа П, рассчитанная на достижение экстремума принятого критерия оптимальности. По такой схеме осуществляется управ-

Рис. 13.9.

а - с обшим управляющим устройством; б - с двухуровневым управляющим

устройством

Рис. 13.10. Схемы оптимальных систем: а - разомкнутой; б - комбинированной

ление станками с числовым программным управлением и простейшими роботами, производится вывод ракет на орбиту и т.д.

Наиболее совершенными, хотя и наиболее сложными, являются комбинированные оптимальные системы (рис. 13.10, б). В таких системах разомкнутый контур осуществляет оптимальное управление по заданной программе, а замкнутый контур, оптимизированный по минимуму ошибки, отрабатывает отклонение выходных параметров. Используя канат измерения возмущений /*, система становится инвариантной относительно всего множества задающих и возмущающих воздействий.

Для того чтобы реализовать столь совершенную систему управления, необходимо точно и быстро измерять все возмущаюшие воздействия. Однако такая возможность имеется далеко не всегда. Гораздо чаще о возмущающих воздействиях известны только усредненные статистические данные. Во многих случаях, особенно в системах телеуправления, даже задающее воздействие поступает в систему вместе с помехами. А так как помеха представляет собой в общем случае случайный процесс, то удается синтезировать только статистически оптимальную систему. Такая система не будет оптимальной для каждой конкретной реализации процесса управления, но она будет в среднем наилучшей для всего множества его реализаций.

Для статистически оптимальных систем в качестве критериев оптимальности используют усредненные вероятностные оценки. Например, для следящей системы, оптимизированной по минимуму ошибки, в качестве статистического критерия оптимальности используют математическое ожидание квадрата отклонения выходного воздействия от заданного значения, т.е. дисперсию:

Используются и другие вероятностные критерии. Например, в системе обнаружения целей, где важно только наличие или отсутствие цели, в качестве критерия оптимальности применяют вероятность ошибочного решения Р ош:

где Р п ц - вероятность пропуска цели; Р ЛО - вероятность ложного обнаружения.

Во многих случаях рассчитанные оптимальные САУ оказываются практически не реализуемыми ввиду их сложности. Как правило, требуется получение точных значений производных высоких порядков от входных воздействий, что технически очень трудно осуществимо. Зачастую даже теоретический точный синтез оптимальной системы оказывается невозможен. Однако методы оптимального проектирования позволяют строить квазиоптимальные системы, хотя и упрощенные в той или иной степени, но все- гаки позволяющие достичь значений принятых критериев оптимальности, близких к экстремальным.

Материал об оптимальном управлении, который здесь представлен, объединяет теорию и практику оптимального управления. Прежде чем он был написан и представлен, создавались реальные оптимальные системы, результаты которых послужили основой для создания управляемых систем в конструкторе EFFLY. Как показали исследования, работа оптимальных систем созданных в программном конструкторе, принципиально не отличается от работы систем, реальных условиях.

Это хорошее известие, поскольку теперь вы можете практиковаться, наблюдать работу оптимальных систем и исследовать принципы оптимального управления, сидя у экрана монитора. С этой целью здесь размещены ссылки на файлы действующих оптимальных систем. Все что нужно, для того чтобы получить доступ к практике, это среда Excel.

Буду очень признателен, если вы напишете несколько слов о том, чем необходимо дополнить, по Вашему мнению, чтобы материал стал доступней и полезней, то есть, оптимальней :-). Ссылки для связи есть дальше по тексту.

1. Введение

Для достижения своих целей мы осуществляем самые разнообразные операции. Тем не менее, в повседневной жизни мы редко задумываемся над тем, что создается для проведения операции и насколько эффективно ее осуществляют. Иное дело, когда однотипные операции осуществляются на регулярной основе в виде технологического процесса, и от эффективности таких операций зависят темпы развития и конкурентоспособность бизнеса. В этом случае мы стремимся к тому, чтобы осуществляемые операции были максимально эффективными, самыми лучшими или, что тоже, оптимальными .

Оптимизация и оптимальное управление – очень модные и популярные понятия. Но, наверное, я вас очень удивлю, если скажу что об оптимальном управлении, несмотря, на несметное количество публикаций в самых разнообразных источниках, действительно качественной информации содержится очень мало. Обычно пересказываются некоторые образные фразы о «рулях», базовые понятия об ограничениях на процесс управления и безграничности управлений в рамках наложенных ограничений. Также обычно много говорится о критериях оптимального управления (как будто их может быть много). И даже приводятся конкретные выражения критериев оптимизации, которые на предмет адекватности никто не проверял.

Если говорить коротко, оптимальное управление это технологический процесс, состоящий из множества операций с такими параметрами, которые к определенному моменту времени обеспечат получение максимального по величине целевого продукта.

Для того чтобы понимать о каком целевом продукте идет речь, нужно получить представление о физике процесса и его кибернетике , а затем разобраться с процессом оптимизации.

2. Физика общих процессов производственных систем

Для того чтобы разобраться с принципами оптимального управления , не обойтись без понимания физики процессов, которые лежат в основе любой технологической операции. Принципы эти общие, поэтому разобравшись с ними на примере одного конкретного процесса, можно смело использовать полученные знания, опираясь на обобщенную кибернетическую модель исполнительного механизма операции.

В качестве примера мы с вами подробно рассмотрим операцию нагрева жидкости. При этом вы можете параллельно проводить собственные исследования, если у вас есть необходимое несложное оборудование и некоторый опыт. Также можно воспользоваться наблюдением за процессами управляемой системы нагрева собранной в среде EFFLY. Или же вы можете просто осваивать материал, анализируя готовые данные, отображенные на диаграммах.

Итак, нам нужно в цикле осуществлять операции нагрева жидкости, с выходом в оптимальный режим нагрева. Для осуществления операции нагрева будем использовать электрический нагреватель – тэн, с регулятором мощности. Тэн опускается в емкость с жидкость, а скорость нагрева зависит от мощности передаваемой электроприбору.

В чем состоит суть управления в данном случае? Все очень просто. Мы устанавливаем определенную величину подачи электроэнергии и проводим операцию нагрева. Установка регулятора мощности в одно из возможных положений это и есть управление. Поэтому, в зависимости от управления будет изменяться скорость нагрева, величина расхода электроэнергии и износ механизма нагрева тэна (рис.1-3).

Из графика (рис.1) следует, что увеличение подачи электроэнергии приводит к снижению расхода электроэнергии на проведение операции. Как это можно объяснить?

Рис.1 Изменение энергопотребления операции нагрева от управления

Все дело в том, что при низкой скорости нагрева, нагреваемая жидкость успевает отдавать большое количество тепла в окружающую среду. Чем выше скорость нагрева, тем меньше тепловые потери. Для процессов с высоким КПД технологического механизма это типичная картина. Почему у тэна высокий КПД? Потому что он погружен в жидкость и практически полностью отдает ей свою энергию (небольшая часть энергии теряется в проводах).

Также из графика изменения износа от управления (рис.2) следует, что чем выше производительность процесса, тем выше износ технологического механизма.

Рис.2 Изменение износа механизма операции нагрева от управления

Причем, при повышении производительности износ возрастает непропорционально, а в степенной зависимости. Коэффициент степенной функции износа механизма от производительности определяется экспериментально. В общем случае необходимо говорить об износе каждого механизма системы .

Ну и, конечно, чем больше величина подаваемой энергии, тем выше скорость процесса, а, соответственно, меньше время операции (рис.3). Это понятно. А реальная зависимость тоже нелинейная, как видно из графика.

Рис.3 Изменение времени операции нагрева от управления

Таким образом, каждому управлению соответствует свой расход энергетического продукта, свой износ механизмов операции и свое время операции. Характер изменений нам теперь доступен.

Вот собственно и все, что необходимо знать о физике процесса нагрева жидкости с погруженным в нее тэном, для того чтобы понимать суть природных механизмов лежащих в основе технологии оптимального управления .

Написать автору.

3. Кибернетика процессов производственных систем

Мы живем в мире, который подчиняется вполне определенным законам. Эти законы делятся на два класса. Знание законов первого класса позволяет нам ответить на вопрос: «Почему так происходит?». К классу таких наук относятся: физика, химия, астрономия.

Ко второму классу относятся науки, которые дают ответ на вопрос: «Зачем, или с какой целью?». Ярким представителем этого класса наук является кибернетика.

3.1 Миссия и цель управления производственных систем

В процессе оптимального управления решаются две достаточно независимые задачи, за решение которых отвечают две самостоятельные структуры производственной системы.

Первая задача, это создание продукта имеющего заданные потребительские качества. В нашем случае потребительским продуктом операции является нагретая жидкость. В общем случае можно говорить о том, что миссией системы является создание полезного продукта с заданными потребительскими качествами. Полезный продукт создается технической подсистемой под управлением технологической подсистемы. Эту технологическую подсистему часто называют системой управления.

Но, полезный продукт никто не будет создавать любой ценой. Поэтому параметры входных продуктов операции, а, следовательно, и параметры процесса, необходимо выбирать такими, чтобы экспертная оценка входных продуктов операции была меньше экспертной оценки выходных продуктов операции. В экономических системах оперируют не экспертными оценками, а стоимостными.

К примеру, нам нужно перевезти груз из точки А в точку Б. Для этого необходимо транспортное средство и энергетический продукт. Операцию осознанно мы будем проводить только в том случае, если стоимость более изношенного транспортного средства, остаток топлива и продукт в точке Б ценится нами выше, чем менее изношенный транспорт, неизрасходованное топливо и груз в точке А. То есть, мы боремся за повышение разности стоимостных оценок на входе и выходе.

Максимизация разности экспертных оценок выходных и входных продуктов цикла управляемых операций и является целью управления (это вторая задача управления), а сама разность является целевым продуктом . За максимизацию величины целевого продукта производственной системы отвечает подсистема оптимизации .

Обратите внимание на то, что речь идет о цикле операций (процессе), а не об отдельной операции . К этому моменту мы вернемся чуть позже, а пока поговорим о том, как перейти от натуральных показателей входных и выходных продуктов, к сопоставимым показателям.

3.2 Приведение количественных параметров продуктов операции к сопоставимым величинам

Проведение любой операции требует от нас определенных вложений. Для операции нагрева жидкости нам необходима сама порция холодной жидкости, определенное количеством энергии, и частью ресурса механизма, которая в процессе операции будет изношена. Мы по-разному оцениваем вклад каждого из этих продуктов в операцию. Эта оценка связана с понятием экспертная оценка продукта операции, которая выражается через экспертную оценку единицы продукта и его количественную оценку. Поскольку систему нагрева можно считать технико-экономической системой, будем использовать более привычное экономическое понятие «стоимостная оценка», вместо кибернетического понятия – «экспертная оценка».

В общем случае стоимостная оценка любого входного продукта операции определяется из выражения RE i =RS i ·RQ i , где RQ i – количество i-го продукта операции; RS i - стоимость единицы i-го продукта продукта операции; RE i – стоимостная оценка i-го продукта продукта операции.

Так, для проведения операции мы используем 1 кубический метр жидкости. Примем, что стоимостная оценка кубического метра жидкости составляет 0.8 ден. ед. Тогда стоимостная оценка кубометра жидкости будет равна RE cw =RQ cw ·RS cw =1·0,8=0,8 ден.ед., где RQ cw – объем жидкости необходимый для проведения операции; RS cw - стоимостная оценка куба жидкости; RE cw – стоимостная оценка объема жидкости операции.

Поскольку объем холодной жидкости необходимый для проведения очередной операции от управления не изменяется, график стоимостной оценки жидкости в зависимости от управления RE cw (U) будет иметь вид горизонтальной прямой линии (рис.4).

Расход энергетического продукта от операции к операции изменяется, поэтому стоимостная оценка расхода электроэнергии также будет изменяться от операции к операции. Приняв, что один кВт.ч. электроэнергии стоит 0.3 ден. ед., можно получить зависимость изменения энергетических затрат RE e от управления U, где RE e (U) - стоимостная оценка потребляемой электроэнергии операции от управления (рис.4).

Осталось определить изменение потерь ресурса механизма операции от управления в сопоставимых стоимостных величинах (RE w (U)), учитывая, что единица потери ресурса оценивается в 3 ден.ед. (рис.4).

Рис.4 Изменение стоимостных оценок необходимого объема электроэнергии, жидкости и степени износа тэна операции нагрева от управления

Теперь, поскольку все входные продукты операции выражены в сопоставимых стоимостных величинах, для каждого управления можно определить одно значение совокупных стоимостных затрат RE=RE cw +RE e +RE w (рис.5).

На этой же диаграмме удобно представить зависимость стоимостной оценки нагретой жидкости от управления PE(U) и время операции от управления T op (U) на дополнительной оси.

Рис.5 Изменение стоимостных оценок входных, выходных продуктов операции нагрева и времени операции от управления

Энергетический продукт, сама холодная жидкость и механизм нагрева представляют для нас вполне определенную ценность. Поэтому операции нагрева жидкости мы будем проводить только в том случае, если экспертная оценка входных продуктов операции меньше экспертной оценки результативного продукта операции. В данном случае мы примем, что стоимость куба нагретой жидкости оценивается на уровне PS=55 ден.ед.

Обратите внимание, базовые показатели RE, PE и T op являются кибернетическими, поскольку могут быть получены для любой операции, независимо от природы процессов и вида управляемой системы. Построив функции RE(U), PE(U) и Top(U) мы сделали еще один шаг к раскрытию сущности оптимального управления .

Какие для вас были сложности в восприятии материала? Написать автору.

3.3 Критерий оптимального управления производственных систем

Теперь, когда мы понимаем, что за процесс преобразования входных продуктов отвечает техническая подсистема, за качество результативного продукта – технологическая подсистема, а за максимизацию целевого продукта подсистема оптимизации, можно подойти к вопросу выбора оптимального варианта.

Примем, что у нас есть два варианта выбора параметров управления. Предположим, что устанавливая первый набор параметров управления, мы получаем циклически повторяющиеся операции с такими базовыми показателями: RE=4 ден. ед., PE=7 ден.ед., T op =7 час (рис.6).

Рис.6 Процесс формирования целевого продукта для первого управления

Как происходит процесс достижения цели? Верхний левый прямоугольник, это стоимостная оценка ресурсов операции. Таких ресурсов у нас 10 ден.ед. Поскольку для проведения операции необходимы ресурсы величиной 4 ден.ед., этот объем ресурсов передается для проведения первой операции, которая обозначена стрелочкой под номером 1.

Выполнение операции занимает 7 часов, и мы приняли, что стоимостная оценка продуктов операции составляет 7 единиц. Так как для проведения второй операции снова необходимо четыре единицы ресурса, оставшиеся три, мы передаем в склад целевого продукта.

В цикле у нас выполняется три операции, после чего можно определить величину абсолютного значения целевого продукта операции. Это 16 ден.ед. через 21 час работы.

Теперь изменяем управление, и получаем цикл операций с новыми базовыми показателями: RE=5 ден. ед., PE=7 ден.ед., Top=3 час (рис.7).

Рис.7 Процесс формирования целевого продукта для второго управления

Прирост целевого продукта за время проведения одной операции здесь меньше – 2 ден.ед. Однако, и время операции короче. Как вы можете видеть, к концу последней операции, через 21 час, мы получим 19 ден.ед. целевого продукта.

То есть, если у нас есть только два варианта проведения операций, то второй вариант предпочтительней. Поэтому управление по второму варианту и является оптимальным управлением.

Возникает вопрос: «Как, не осуществляя выполнения операций в цикле, сразу определить, какая операция выгоднее, а, соответственно, определить параметры оптимального управления?».

Для этого необходим показатель эффективности, который можно использовать в качестве критерия оптимизации.

В данном случае можно использовать простую формулу эффективности, которая представляет собой аналитическое выражение для расчета простых операций. Именно она связывает между собой три базовых показателя: стоимостную оценку входных продуктов операции (RE), стоимостную оценку выходных продуктов операции (PE) и время операции (T op). Если обозначить эффективность символом «Е», то формула для расчета показателя эффективности будет иметь вид

где Т p – единичный интервал времени, необходимость использования которого рассматривается в теории эффективности.

Подставив значения базовых показателей операций в формулу эффективности, получим значение Е=0.00656 для первой операции и Е=0.0127 для второй операции.

Как видим, показатель эффективности сразу указал на то, что второй тип операций предпочтительней операций первого типа. Следовательно, приведенный показатель является критерием оптимизации.

На рис.8 показано, как меняется эффективность при изменении управления. Красным цветом выделены параметры соответствующие максимальной эффективности.

Рис.8 Процесс формирования целевого продукта для второго управления

Вот собственно теперь можно ответить на вопрос, что такое оптимальное управление.
Оптимальное управление это процесс, который обеспечивает максимизацию целевого продукта при циклическом выполнении системных операций.
Выбор такого управления обеспечивает критерий оптимизации .

Как видно, в производственных системах выйти в оптимальный режим можно опираясь на абсолютный показатель – максимум приращения финансового потенциала, но этот процесс занимает очень много времени.

Может показаться, что решить вопрос выхода в оптимум можно и без критерия оптимизации – путем математического моделирования, используя результаты одной операции. Однако, влияние погрешностей датчиков приводит к очень большим отклонениям от точки оптимума.

Какие для вас были сложности в восприятии материала? Написать автору.

Для того чтобы посмотреть на работу оптимальной системы, нужно загрузить саму оптимальную систему собранную в конструкторе EFFLY . О том, как замустить работу системы, можно узнать .

После нажатия кнопки "Пуск" открывается лист, на котором будут отображены графики поиска оптимума системы. Первая точка появляется через пару минут, посколько для выхода на нее проходит несколько операций. Нужно немного подождать.

Оптимальные САУ это системы в которых управление осуществляется таким образом что требуемый критерий оптимальности имеет экстремальное значение. Граничные условия определяющие начальное и требуемое конечное состояния системы технологическая цель системы. tн Её ставят в тех случаях когда особый интерес представляет среднее отклонение в течение определённого интервала времени и задача системы управления обеспечить минимум этого интеграла...

Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск

Оптимальное управление

Воронов А.А., Титов В.К., Новогранов Б.Н. Основы теории автоматического регулирования и управления. М.: Высшая школа, 1977. 519с. С. 477 491.

Оптимальные САУ это системы, в которых управление осуществляется таким образом, что требуемый критерий оптимальности имеет экстремальное значение.

Примеры оптимального управления объектами:

Управление движением ракеты с целью достижения ею заданной высоты или дальности при минимальном расходе горючего;
Управление перемещением приводимого двигателем механизма, при котором минимизировались бы затраты энергии;
Управление атомным реактором, при котором максимальна производительность.

Задача оптимального управления формулируется следующим образом:

“Найти такой закон изменения во времени управления u (t ), при котором система при заданных ограничениях перейдёт из одного заданного состояния в другое оптимальным образом в том смысле,что функционал I , выражающий качество процесса, получит при найденном управлении экстремальное значение “.

Чтобы решить задачу оптимального управления, необходимо знать:

1.Математическое описание объекта и среды, связывающее значения всех координат исследуемого процесса,управляющих и возмущающих воздействий;

2.Ограничения физического характера на координаты и закон управления, выраженные математически;

3. Граничные условия, определяющие начальное и требуемое конечное состояния системы

(технологическая цель системы);

4.Целевую функцию (функционал качества

математическая цель).

Математически критерий оптимальности чаще всего представляют в виде:

t к

I =∫ f o [ y (t ), u (t ), f (t ), t ] dt + φ [ y (t к ), t к ], (1)

t н

где первое слагаемое характеризует качество управления на всём интервале (t н , t н ) и называется

интегральной составляющей, второе слагаемое

характеризует точность в конечный (терминальный) момент времени t к .

Выражение (1) называется функционалом, так как I зависит от выбора функции u (t ) и получающегося при этом y (t ).

Задача Лагранжа. В ней минимизируется функционал

t к

I=∫f o dt.

t н

Её ставят в тех случаях, когда особый интерес представляет среднее отклонение в течение

определённого интервала времени, и задача системы управления обеспечить минимум этого интеграла (ухудшение качества продукции, убыток и т.п.).

Примеры функционалов:

I =∫ (t ) dt критерий минимальной ошибки в установившемся режиме, где x (t )

отклонение управляемого параметра от заданного значения;

I =∫ dt = t 2 - t 1 = > min критерий максимального быстродействия САУ;

I =∫ dt = > min критерий оптимальной экономичности.

Задача Майера. В этом случае минимизируемым является функционал, определяемый только терминальной частью, т.е.

I = φ =>min.

Например, для системы управления ЛА, описываемым уравнением

F o (x , u , t ),

можно поставить следующую задачу: определить управление u (t ), t н ≤ t ≤ t к так, чтобы за

заданное время полёта достичь максимальной дальности при условии, что в конечный момент времени t к ЛА совершит посадку, т.е. x (t к ) =0.

Задача Больца сводится к задаче минимизации критерия (1).

Базовыми методами решения задач оптимального управления являются:

1.Классическое вариационное исчисление теорема и уравнение Эйлера;

2.Принцип максимума Л.С. Понтрягина;

3.Динамическое программирование Р. Беллмана.

УРАВНЕНИЕ И ТЕОРЕМА ЭЙЛЕРА

Пусть задан функционал:

t к

I =∫ f o dt ,

t н

где некоторые дважды дифференцируемые функции, среди которых необходимо найти такие функции (t ) или экстремали , которые удовлетворяют заданным граничным условиям x i (t н ), x i (t к ) и минимизируют функционал.

Экстремали отыскиваются среди решений уравнения Эйлера

I = .

Для установления факта минимизации функционала необходимо удостовериться, что вдоль экстремалей выполняются условия Лагранжа:

аналогичные требованиям положительности второй производной в точке минимума функции.

Теорема Эйлера: “Если экстремум функционала I существует и достигается среди гладких кривых, то он может достигаться только на экстремалях”.

ПРИНЦИП МАКСИМУМА Л.С.ПОНТРЯГИНА

Школа Л.С.Понтрягина сформулировала теорему о необходимом условии оптимальности, сущность которой в следующем.

Допустим, что дифференциальное уравнение объекта вместе с неизменяемой частью управляющего устройства заданы в общей форме:

На управление u j могут накладываться ограничения, например, в виде неравенств:

, .

Цель управления состоит в переводе объекта из начального состояния (t н ) в конечное состояние (t к ). Момент окончания процесса t к может быть фиксированным или свободным.

Критерием оптимальности пусть будет минимум функционала

I = dt .

Введём вспомогательные переменные и образуем функцию

Fo ()+ f () f ()+

Принцип максимума гласит, что для оптимальности системы, т.е. для получения минимума функционала, необходимо существование таких ненулевых непрерывных функций, удовлетворяющих уравнению

Что при любом t , находящемся в заданном диапазоне t н≤ t ≤ t к , величина Н, как функция допустимого управления, достигает максимума.

Максимум функции Н определяется из условий:

если не достигает границ области, и как точная верхняя грань функции Н по в противном случае.

Динамическое программирование Р.Беллмана

Принцип оптимальности Р.Беллмана:

“ Оптимальное поведение обладает тем свойством, что, каковы бы ни были первоначальное состояние и решение в начальный момент, последующие решения должны составлять оптимальное поведение относительно состояния, получающегося в результате первого решения.”

Под “поведением” системы следует понимать движение этих систем, а термин “решение” относится к выбору закона изменения во времени управляющих сил.

В динамическом программировании процесс поиска экстремалей разбивается на n шагов, в то время как в классическом вариационном исчислении ведётся поиск экстремали целиком.

Процесс поиска экстремали базируется на следующих предпосылках принципа оптимальности Р.Беллмана:

Каждый отрезок оптимальной траектории является сам по себе оптимальной траекторией;
Оптимальный процесс на каждом участке не зависит от его предыстории;
Оптимальное управление (оптимальная траектория) ищется с помощью попятного движения [от y (T ) к y (T -∆) , где ∆ = Т/ N , N число участков разбиения траектории, и т.д.].

Эвристически уравнения Беллмана для требуемых постановок задач выведены применительно к непрерывным и дискретным системам.

Адаптивное управление

Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического управления с примерами на языке MATLAB . СПб.: Наука, 1999. 467с. Глава 12.

Воронов А.А., Титов В.К., Новогранов Б.Н. Основы теории автоматического регулирования и управления. М.: Высшая школа, 1977. 519с. С. 491 499.

Анхимюк В.Л., Опейко О.Ф., Михеев Н.Н. Теория автоматического управления. Мн.: Дизайн ПРО, 2000. 352с. С. 328 340.

Необходимость в адаптивных системах управления возникает в связи со значительным усложнением решаемых задач управления, причем специфическая особенность такого усложнения заключается в отсутствии практической возможности для подробного изучения и описания процессов, протекающих в управляемом объекте.

Например, современные высокоскоростные летательные аппараты, точные априорные данные о характеристиках которых во всех условиях функционирования не могут быть получены из-за значительных разбросов параметров атмосферы, больших диапазонов изменения скоростей полета, дальностей и высот, а также из-за наличия широкого спектра параметрических и внешних возмущений.

Некоторые объекты управления (самолеты и ракеты, технологические процессы и энергетические установки) отличаются тем, что их статические и динамические характеристики изменяются в широких пределах непредвиденным заранее образом. Оптимальное управление такими объектами возможно с помощью систем, в которых недостающая информация автоматически пополняется самой системой в процессе работы.

Адаптивными (лат.” adaptio ” приспособление) называются такие системы, которые при изменении параметров объектов или характеристик внешних воздействий в процессе эксплуатации самостоятельно, без участия человека изменяют параметры регулятора, его структуру, настройку или регулирующие воздействия для поддержания оптимального режима работы объекта.

Создание адаптивных систем управления осуществляется в принципиально иных условиях, т.е. адаптивные методы должны способствовать достижению высокого качества управления при отсутствии достаточной полноты априорной информации о характеристиках управляемого процесса или в условиях неопределенности.

Классификация адаптивных систем :

Самоприспосабливающиеся

(адаптивные)

Системы управления

Самонастраивающиеся Самообучающиеся Системы с адаптацией

Системы системы в особых фазовых

Состояниях

Поисковые Беспоиско- Обучающие- Обучающие- Релейные Адаптивные

(экстремаль- вые (анали- ся с поощре- ся без автоколеба- системы с

Ные) тические) нием поощрения тельные переменной

Системы системы системы структурой

Структурная схема классификации АС (по характеру процесса адаптации)

Самонастраивающиеся системы (СНС) представляют собой системы, в которых адаптация при изменении условий работы осуществляется путем изменения параметров и управляющих воздействий.

Самоорганизующимися называются системы, в которых адаптация осуществляется за счет изменения не только параметров и управляющих воздействий, но и структуры.

Самообучающаяся это система автоматического управления, в которой оптимальный режим работы управляемого объекта определяется с помощью управляющего устройства, алгоритм которого автоматически целенаправленно совершенствуется в процессе обучения путем автоматического поиска. Поиск производится с помощью второго управляющего устройства, являющегося органической частью самообучающейся системы.

В поисковых системах изменение параметров управляющего устройства или управляющего воздействия осуществляется в результате поиска условий экстремума показателей качества. Поиск условий экстремума в системах этого типа осуществляется с помощью пробных воздействий и оценки полученных результатов.

В беспоисковых системах определение параметров управляющего устройства или управляющих воздействий производится на основе аналитического определения условий, обеспечивающих заданное качество управления без применения специальных поисковых сигналов.

Системы с адаптацией в особых фазовых состояниях используют особые режимы или свойства нелинейных систем (режимы автоколебаний, скользящие режимы) для организации контролируемых изменений динамических свойств системы управления. Специально организованные особые режимы в таких системах либо служат дополнительным источником рабочей информации об изменяющихся условиях функционирования системы, либо наделяют системы управления новыми свойствами, за счет которых динамические характеристики управляемого процесса поддерживаются в желаемых пределах независимо от характера возникающих при функционировании изменений.

При применении адаптивных систем решаются следующие основные задачи:

1 . В процессе функционирования системы управления при изменении параметров, структуры и внешних воздействий обеспечивают такое управление, при котором сохраняются заданные динамические и статические свойства системы;

2 . В процессе проектирования и наладки при начальном отсутствии полной информации о параметрах, структуре объекта управления и внешних воздействиях производят автоматическую настройку системы в соответствии с заданными динамическими и статическими свойствами.

Пример 1 . Адаптивная система стабилизации углового положения ЛА.

f 1 (t ) f 2 (t ) f 3 (t )

Д1 Д2 Д3

ВУ1 ВУ2 ВУ3 f (t ) f 1 (t ) f 2 (t ) f 3 (t )

u (t ) W 1 (p ) W 0 (p ) y (t )

+ -

Рис. 1.

Приспосабливающаяся система стабилизации ЛА

При изменении условий полета меняется передаточная функция W 0 (p ) ЛА, а, следовательно, и динамическая характеристика всей системы стабилизации:

. (1)

Возмущения со стороны внешней среды f 1 (t ), f 2 (t ), f 3 (t ) , приводящие к контролируемым изменениям параметров системы, приложены к различным точкам объекта.

Возмущающее воздействие f (t ) , приложенное непосредственно к входу объекта управления, в отличие от f 1 (t ), f 2 (t ), f 3 (t ) не меняет его параметров. Поэтому в процессе работы системы измеряют только f 1 (t ), f 2 (t ), f 3 (t ).

В соответствии с принципом обратной связи и выражением (1) неконтролируемые изменения характеристики W 0 (p ) из-за возмущений и помех вызывают сравнительно небольшие изменения параметров Ф(p ) .

Если поставить задачу более полной компенсации контролируемых изменений, чтобы передаточная функция Ф(р) системы стабилизации ЛА оставалась практически неизменной, то следует надлежащим образом изменить характеристику регулятора W 1 (p ). Это и осуществляется в приспосабливающейся САУ, выполненной по схеме рис.1. Параметры внешней среды, характеризуемые сигналами f 1 (t ), f 2 (t ), f 3 (t ), например давление скоростного напора P H (t ) , температура окружающего воздуха T 0 (t ) и скорость полёта υ(t ) , непрерывно измеряются датчиками Д 1 , Д 2 , Д 3 , и текущие значения параметров поступают в вычислительные устройства В 1, В 2 ,В 3 , вырабатывающие сигналы, с помощью которых подстраивается характеристика W 1 (p ), чтобы компенсировать изменения характеристики W 0 (p ).

Однако, в АСАУ данного типа (с разомкнутым циклом настройки) отсутствует самоанализ эффективности осуществляемых ею контролируемых изменений.

Пример 2. Экстремальная система управления скоростью полета ЛА.

Z Возмущающее

Воздействие

X 3 = X 0 - X 2

Устройство авто- X 0 Усилительно- X 4 Исполнительное X 5 Регулируемый X 1

Матического по- преобразователь- устройство объект

Иска экстремума + - ное устройство

Измерительное

Устройство

Рис.2.Функциональная схема экстремальной системы управления скоростью полета ЛА

Экстремальная система определяет наивыгоднейшую программу, т.е. то значение X 1 (требуемая скорость движения ЛА), которое нужно в данный момент выдерживать, чтобы производился минимум расхода горючего на единицу длины пути.

Z - характеристика объекта; X 0 - управляющее воздействие на систему.

(величина расхода горючего)

y(0)

y(T)

Самоорганизующиеся системы

В этих нормах отдельно нормируется каждый компонент микроклимата в рабочей зоне производственного помещения: температура относительная влажность скорость движения воздуха в зависимости от способности организма человека к акклиматизации в разное время года характера одежды интенсивности производимой работы и характера тепловыделений в рабочем помещении. Перепады температуры воздуха по высоте и по горизонтали а также изменения температуры воздуха в течение смены при обеспечении оптимальных величин микроклимата на рабочих местах не должны... Управление: понятие признаки система и принципы Органы государственного управления: понятие виды и функции. По содержанию административное право является государственно-управленческим правом реализующим правовой интерес большинства граждан для чего субъекты управления наделяются юридически властными полномочиями представительскими функциями государства. Следовательно объектом действия юридических норм являются специфические управленческие общественные отношения возникающие между субъектом управления управляющим и объектами... Государственное регулирование социально-экономического развития регионов. Местные бюджеты как финансовая основа социально-экономического развития региона. Разные территории Украины имеют свои особенности и отличия как относительно экономического развития так и в социальном историческом языковом и ментальном аспектах. Из таких проблем нужно прежде всего назвать несовершенство отраслевой структуры большинства региональных хозяйственных комплексов их низкую экономическую эффективность; значительные отличия между регионами в уровнях...