Метод разработан в ИПМ АН СССР Федоренко Р.П.
Рассмотрим задачу оптимального управления
 (1)

 (2)

Обратим внимание на то, что данная постановка задачи оптимального управления не содержит граничного условия и ограничений на вектор фазовых координат . Заметим также, что поскольку вектор фазовых координат при фиксированных начальных условиях определятся только управлением , в число аргументов критерия качества управления можно не включать вектор .
Положим, что известно некоторое управление , которое мы будем называть невозмущенным управлением.
В рассматриваемом методе существенно используется производная функционала . Если для любых достаточно малых возмущений невозмущенного управления справедливо соотношение
то называется функциональной производной в смысле Фреше функционала на невозмущенной траектории и обозначается
 (3)

Здесь -вектор-столбец, -вектор-строка (транспонированный вектор ), — некоторая векторная норма.
Техника дифференцирования функционалов, определенных на траекториях динамической системы, достаточно сложна и ее рассмотрение выходит за рамки данного курса. Будем полагать, однако, что мы умеем вычислять функциональные производные (3).
Заметим, что метод вариаций в пространстве управлений применим и к функционалам, отличным от функционала (2), например, к функционалу вида
По существу, при этом изменяется лишь техника вычисления функциональных производных.
В методе вариаций в пространстве управлений на каждой итерации вариация управления определяется путем минимизации линейной части приращения функционала , вызванного этой вариаций:
 (4)

Здесь — некоторая малая окрестность невозмущенного управления .
Окрестность имеет важное технологическое значение – удачное построение этой окрестности может значительно повысить вычислительную эффективность метода. Однако задача построения этой окрестности однозначного решения не имеет.
При построении множества следует учитывать следующие требования:
  1. Из того факта, что , должно следовать, что ;
  2. Множество должно быть достаточно малой окрестностью траектории , чтобы линейная часть приращения функционала достаточно точно описывала это приращение;
  3. Множество должно быть достаточно большой окрестностью траектории , чтобы сходимость управления к оптимальному управлению не была слишком медленной;
  4. Множество должно быть полной окрестностью невозмущенного управления . Окрестность траектории называется полной, если для любой допустимой вариации управления (т.е. такой вариации, что ) существует такое число , что для всех и для всех . Понятие полной окрестности формализует требование полноты допустимых вариаций – окрестность должна содержать вариации невозмущенного управления во всех допустимых направлениях.
Общая схема метода вариаций в пространстве управлений.
  1. Из каких либо соображений задаем начальное приближение к оптимальному управлению и полагаем счетчик числа итераций равным .
  2. С управлением решаем задачу Коши для системы ОДУ (1) – получаем фазовую траекторию .
  3. Вычисляем — значение критерия качества управления (2) на невозмущенной траектории .
  4. В окрестности невозмущенной траектории выполняем линеаризацию задачи – вычисляем функциональную производную

    и определяем окрестность невозмущенной траектории.
  5. Из условия
     (5)

    находим приращение управления .
  6. Полагаем .
  7. Если условие окончания итераций выполнено (см. ниже), то в качестве приближения к оптимальному управлению принимаем управление и заканчиваем вычисления. Иначе – полагаем и переходим к п.2
В качестве условия окончания итераций естественно принять условие
где — некоторая функциональная норма, заданная константа.
Заметим, что задача (5) может быть сведена к задаче линейного программирования, что является значительным достоинством метода.