Оптимизация управления технологическим процессом

Динамическое программирование (ДП) — метод поэтапной оптимизации управления процессом, когда на каждом шаге принимается решение, от которого зависит успех на данном шаге, но с учетом последующих шагов.

Основу метода ДП составляет принцип оптимизации Р. Веллмана: «Каково бы ни было состояние оптимизируемой системы в результате какого-то числа шагов, управление на ближайшем шаге должно быть выбрано так, чтобы оно обеспечивало максимальный выигрыш на всех оставшихся шагах, включая данный» [5]. Это значит, что поиск оптимума не зависит от предыдущего состояния системы и определяется лишь ее состоянием в рассматриваемый момент времени.

Оптимизация управления «-шагового процесса состоит в определении последовательности управлений U0, Un_]5 при которых

функционал достигает минимума:

т

Jn( U) = min J Q[x(t),U(t)]dt9

о

где Q [х(0, U(t)] — мгновенные потери (затраты) в момент t при состоянии системы x(t) и управлении U(t).

Выбор управления на отдельном шаге производится как из условия минимизации потерь на данном шаге Q (xh Uj), так и из условия минимизации потерь на всех последующих шагах Q:

{ +/я_(/+1)/+1),

где 0 (х/, и,) — мгновенные потери на шаге /;

/„_(/+ )(х/+) — суммарные потери на всех последующих шагах (рис. 4.10).

п

/ п-1

-Зк

і_л_

/+1>М7+1)

Рис. 4.10. Пояснение к уравнению Веллмана: п — число шагов

Рекуррентное соотношение (п - /) — шагового процесса, начиная с шага / имеет вид (уравнение Веллмана):

/„-/(*/) = min|Q(x„ Щ +f„_(M)(xM).

Оптимальное управление на каждом шаге определяется последовательным прохождением траектории управления от конечной точки хк до начальной хн. На любом шаге выбор делается из / вариантов вместо 1п~ где п — число шагов. Только последний шаг планируется без учета на будущее (рис. 4.11).

Поиск оптимальной траектории управления методом ДП

Рис. 4.11. Поиск оптимальной траектории управления методом ДП

Метод ДП снимает проблему абсолютного и относительного экстремума, так как позволяет сразу находить абсолютный экстремум (в данном случае min).

Процесс определения оптимальной траектории управления изображается на плоскости. Для этого проводится дискретизация переменных, т. е. диапазон изменения параметра разбивается на интервалы. Дискретные состояния представляются узлами сети потерь (или затрат). Затраты Q (х, U) на переход из данного узла к следующему обозначаются числами на ребрах сети. Для записи цифр минимальных потерь в узлах сети составляются специальные таблицы значений: Xjj, Qk(x, U) и min Qk (x, U) на каждом шаге (где min0?:(x, U) -=fk(x) k — номер шага). Например, таблица для управления на последнем шаге (? = 1) имеет следующий вид (табл. 4.16).

Таблица 4.16. Управление на последнем шаге

хи

01 (X, и)

тт 01 (х, Ц)

У О ПТ

*10

  • 0
  • 1

а

а

0

*01

0

ь

1

1

ь

Значения переменных: х10 — координата на первом шаге управления параметром по горизонтали (код управления и - 0); х01 — координата на первом шаге управления параметром по вертикали (код управления 11= 1); а, Ь — соответственно числа над ребрами сети потерь по горизонтали и по вертикали. Числам а и Ь соответствует код ?/опт.

В качестве примера рассмотрим задачу на определение оптимальной траектории управления с целью перехода на новый технологический процесс. Пусть параметры существующего технологического процесса: К0 — качество продукции (например, точность), П0 — производительность. Требуется перейти на новый технологический процесс с параметрами: > К0 и П, > П0 при условии минимизации за

трат. Разобьем диапазоны изменения параметров К и П на 4 интервала от 0 до 4, начиная с конечного значения хк. Затраты (2(х, и) на переход из данного узла до следующего обозначены на ребрах сети затрат К—П (рис. 4.12).

Вначале проставим нарастающую сумму затрат в узлах нулевой вертикали (управление процессом по координате П) и нулевой горизонтали (управление процессом по координате К). В обоих случаях других вариантов управления нет. Сумма затрат в узлах нулевой вертикали составит: 8, 14, 17, 18 единиц, а в узлах нулевой горизонтали: 9, 18, 24, 32 единицы (рис. 4.13).

Затем находим суммарные затраты в узлах первой вертикали. В первом узле остается цифра 9. Во втором узле минимальная сумма составит 16 = 9 + 7, так как в другом случае сумма больше и равна 17 = 9 + 8. То же в третьем узле: минимальная сумма 22 = 16 + 6 (большая сумма 23 = 14 + 9) и т. д. Аналогично поступаем с вертикалью 2 и другими вертикалями. Пути, по которым получены минимальные суммы, отмечают стрелками.

Закончив заполнение узлов четырех вертикалей, по стрелкам проходим по сети затрат в прямом направлении отхн дохк и вычисляем суммарные затраты на оптимальной траектории управления.

п

П

П,

о

0 j

, 8 j

6 к

к 9

9 j

Л

1

85

97

8 8

7 9

8

2

,5з ,

62

7 5

6 9

6

3

25

4 7

59

48

3

4

/

34

/

4б

к /

5 7

е

2 8

к /

1

X

}

4

t

3

t К

2

f 1

1

т

0

К

К] к

Рис. 4.12. Сеть затрат к примеру применения метода ДП

Сеть затрат с оптимальной траекторией управления

Рис. 4.13. Сеть затрат с оптимальной траекторией управления

К

Для нашего примера min Q(x, U) = 37 единиц, а код оптимальной траектории управления ?/опт(11000110), где UK = 0 — управление по параметру К, а Un - 1 — управление по параметру П. Приведем электронные таблицы управления с минимальными затратами для нескольких шагов к (табл. 4.17—4.19).

Таблица 4.17. Управление для шага к - 1

хи

Щ

Q (X, U)

min Q(x, U)

Uq пт

х10

  • 0
  • 1

9

9

0

Х01

  • 0
  • 1

8

8

1

Таблица 4.18. Управление для шага к =2

x?

U>j

?2(*k 0)

min ?2(x, tO

Ц)пт

x20

  • 0
  • 1

18

18

0

xu

0

17

16

1

1

16

x02

0

14

1

1

14

Таблица 4.19. Управление для шага к = 3

хч

щ

(?з(*> О

тт(х, Ц)

У О ПТ

*30

  • 0
  • 1

24

24

0

Х2

0

24

24

0

1

26

*12

0

23

22

1

1

22

*03

0

17

1

1

17

Недостаток метода ДП заключается в том, что при рассмотрении на каждом шаге оптимального управления для всех возможных состояний объекта остается неясным, какое оптимальное управление будет для заданного начального положения. Обычно оказывается, что результаты значительной части вычислений не будут использованы. В этом отношении более эффективным является метод оптимизации, известный как «принцип максимума» академика Л.С. Понтрягина 115, 16, 22].

 
< Пред   СОДЕРЖАНИЕ     След >