Гипотеза 1. Какова бы ни была отличная от

допустимая точка фазового пространства, существует оптимальная (в смысле быстродействия) траектория перехода динамической системы из точки

в точку

(см. рис. 1)

Рис. 1. К гипотезе 1. (n = 2).
Время, в течение которого осуществляется оптимальный переход из точки

в точку

, обозначим

.
В этих терминах гипотеза 1 может быть сформулирована следующим образом. Для любой точки

существует такое управление

, под действием которого динамическая система (1) переходит за время, равное

, из точки

в точку

, но за время, меньшее, чем

, перейти из точки

в точку

невозможно.
Гипотеза 2. Функция

непрерывна и всюду, кроме, быть может, точки

, имеет непрерывные частные производные
Пусть теперь (

— оптимальный процесс перехода системы (1) из состояния

в состояние

и

— отрезок времени, в течение которого этот переход происходит;

. Другими словами, положим, что
Доказательство (см. рис. 2). Движение по рассматриваемой оптимальной траектории от точки

до точки

осуществляется за время

, а движение из точки

до точки

— в течение времени

. Быстрее, чем за это время из точки

попасть в точку

невозможно.
Рис. 2. К утверждению 1. (n = 2).
Действительно, если бы такое движение существовало (пунктир на рис. 2), то переместившись из точки

в точку

за время

, а затем из точки

в точку

быстрее, чем за время

, мы осуществили бы переход из

в

за время, меньшее, чем

, что противоречит предположению об оптимальности процесса


Утверждение 2. Если процесс

оптимален, то справедливо уравнение
где

называется функцией Беллмана.
Доказательство. Из
принципа оптимальности следует, что

есть время оптимального движения из точки

в точку

, т.е.
 | (3) |
Заменив в формуле (3)

на

, получим
или
 | (4) |
Переходя в формуле (4) к пределу при

, получим, что на оптимальной траектории выполняется равенство
 | (5) |
По правилам дифференцирования сложной функции с учетом уравнения (1) из равенства (5) имеем
 | (6) |
Аналогично утверждению 2 можно доказать справедливость следующего утверждения.
Подчеркнем следующие обстоятельства:
- уравнение динамического программирования Беллмана дает необходимое условие минимума;
- уравнение динамического программирования Беллмана требует выполнения гипотезы 12.6.2 относительно неизвестной функции Беллмана
. Однако, даже в простейших задачах оптимального управления функция
оказывается не всюду дифференцируемой. По этой причине при решении задач оптимального управления методом динамического программирования уравнение (7) в явном виде не используется — используется принцип оптимальности.