Метод разработан в ИПМ АН СССР Федоренко Р.П.
Обратим внимание на то, что данная постановка
задачи оптимального управления не содержит граничного условия

и ограничений на вектор фазовых координат

. Заметим также, что поскольку вектор фазовых координат

при фиксированных начальных условиях

определятся только управлением

, в число аргументов
критерия качества управления 
можно не включать вектор

.
Положим, что известно некоторое управление

, которое мы будем называть невозмущенным управлением.
В рассматриваемом методе существенно используется производная функционала

. Если для любых достаточно малых возмущений

невозмущенного управления

справедливо соотношение
то

называется функциональной производной в смысле Фреше функционала

на невозмущенной траектории

и обозначается
 | (3) |
Здесь

—

-вектор-столбец,

—

-вектор-строка (транспонированный вектор

),

— некоторая векторная норма.
Техника дифференцирования функционалов, определенных на траекториях динамической системы, достаточно сложна и ее рассмотрение выходит за рамки данного курса. Будем полагать, однако, что мы умеем вычислять функциональные производные (3).
По существу, при этом изменяется лишь техника вычисления функциональных производных.
Здесь

— некоторая малая окрестность невозмущенного управления

.
Окрестность

имеет важное технологическое значение – удачное построение этой окрестности может значительно повысить вычислительную эффективность метода. Однако задача построения этой окрестности однозначного решения не имеет.
При построении множества

следует учитывать следующие требования:
- Из того факта, что
, должно следовать, что
;
- Множество
должно быть достаточно малой окрестностью траектории
, чтобы линейная часть
приращения функционала
достаточно точно описывала это приращение;
- Множество
должно быть достаточно большой окрестностью траектории
, чтобы сходимость управления к оптимальному управлению не была слишком медленной;
- Множество
должно быть полной окрестностью невозмущенного управления
. Окрестность
траектории
называется полной, если для любой допустимой вариации управления
(т.е. такой вариации, что
) существует такое число
, что
для всех
и для всех
. Понятие полной окрестности формализует требование полноты допустимых вариаций – окрестность
должна содержать вариации невозмущенного управления во всех допустимых направлениях.
Общая схема метода вариаций в пространстве управлений.
- Из каких либо соображений задаем начальное приближение к оптимальному управлению
и полагаем счетчик числа итераций равным .
- С управлением
решаем задачу Коши для системы ОДУ (1) – получаем фазовую траекторию
.
- Вычисляем
— значение критерия качества управления (2) на невозмущенной траектории
.
- В окрестности невозмущенной траектории
выполняем линеаризацию задачи – вычисляем функциональную производную

и определяем окрестность
невозмущенной траектории.
- Из условия
 | (5) |
находим приращение
управления
.
- Полагаем
.
- Если условие окончания итераций выполнено (см. ниже), то в качестве приближения к оптимальному управлению принимаем управление
и заканчиваем вычисления. Иначе – полагаем
и переходим к п.2
В качестве условия окончания итераций естественно принять условие
где

— некоторая функциональная норма,

заданная константа.