В заключение изучения приближенных методов поиска экстремума ФМП без ограничений рассмотрим метод сопряженных направлений, который завоевывает на практике все большую популярность.

Сначала дадим понятие сопряженности. Пусть имеем два направления, которые характеризуются векторами и. Направленияиназывают сопряженными по отношению к некоторой положительно определенной матрице Н, если выполняется соотношение

, (7)

Сопряженность связана с ортогональностью. Если Н – единичная матрица, то при
имеем два взаимно перпендикулярных вектора. Соотношение (7) можно трактовать таким образом: матрица Н, примененная к вектору, изменяет его длину и поворачивает на некоторый угол так, что новый вектор
должен быть ортогонален вектору.

С помощью метода сопряженных направлений отыщем экстремум сепарабельной функции с начальной точкой
.

1) Производится выбор и в этом направлении отыскивается экстремум.

Возьмем вектор с направлениямии. Векторможно выбирать произвольно, поэтому возьмем==1. Вектордает направлениеL 1 .

Проведем через L 1 плоскость перпендикулярную плоскости {x 1 ,x 2 }. Плоскость пересечет экстремальную поверхность у(х 1 , х 2) и выделит на ней экстремальную линию. Определим координаты минимума на этой линии (параболе), для чего вычислим проекции градиента в точке х 0:

,

и по формуле (6) найдем :

Естественно, линия L 1 касается в точке х (1) линии равного уровня функции у.

2) Отыскивается из условия сопряженности
.

Получим сопряженный вектор с проекциями
и
, воспользовавшись формулой (7):

П
олучили одно уравнение с двумя неизвестными. Т.к. нам требуется только направление вектора, а не его длина, то одним из неизвестных можно задаться произвольно. Пусть
=1, тогда
= –4.

3) Из точки х (1) в направлении ищется экстремум.

Сопряженный вектор должен проходить через х (1) . Сделаем шаг в сопряженном направлении:

Величина шага  (1) в х (1) :

,

Итак, за две итерации было найдено точное значение экстремума функции у. В качестве первого вектора можно было выбрать градиент в исходной точке, процедура поиска остается при этом прежней.

В математике доказывается, что метод сопряженных направлений сходится для квадратичных функций не более чем за n итераций, где n – число переменных. Данное обстоятельство особенно ценно для практики, поэтому данный метод находит все большее применение.

Для функций более общего вида метод сопряженных направлений пока еще только разрабатывается. Основное затруднение тут состоит в том, что матрица Гессе получается функциональной, т.е. содержит переменную.

Классическая задача Лагранжа на условный экстремум (ограничения-равенства).

П
усть задана целевая функция
и ограничение-равенство (уравнение связи)
. Требуется найти минимум
на множестве
. Считаем, что функции
и
имеют непрерывные первые производные и являются выпуклыми или вогнутыми.

Рассмотрим геометрическую интерпретацию классической задачи. На плоскости {x 1 ,x 2 } построим функцию
, а также линии равного уровня функции
со значениямиN 1 , линияN 3 имеет 2 общих точки с
и они не могут быть решением задачи, т.к.N 3 >N 2 . Остается линия уровняN 2 , которая имеет единственную точку касания с
. Абсолютный минимумN 0 может не принадлежать ограничению
и поэтому не может быть решением задачи. Отсюда ясно и название «условный экстремум», т.е. такой экстремум, который достигается только на заданных ограничениях.

В точке касания
с функцией
проведем касательную линиюL. Поострим градиенты функций
и
в точке касания, они будут лежать на одной линии, т.к. оба перпендикулярныLи направлены в разные стороны. Определим проекции градиентов на оси х 1 и х 2 в точке касания:

Из подобия треугольников можно записать:

–множитель Лагранжа.

или

Составим теперь функцию
следующим образом:

–функция Лагранжа.

Запишем соотношения для нахождения экстремума функции F.

Как видно, получили те же соотношения, что были получены исходя из геометрической интерпретации задачи. Постоянная называется множителем Лагранжа. С помощью этого множителя задача на условный экстремум сводится к задаче на безусловный экстремум.

В общем случае, число переменных примем за n, а число ограничений заm. Тогда функция Лагранжа запишется в виде:

или в векторной форме

Для решения задачи записывается система уравнений:

, (8)

т.е. для n+mпеременных будем иметьn+mуравнений. Если система совместна, то задача Лагранжа имеет единственное решение.

Т.к. для определения экстремума использовались только первые производные, то полученные условия будут являться только необходимыми. Если функции
и
выпуклые или вогнутые, то условный экстремум единственный. Если одна из функций невыпуклая, то экстремум может быть и не единственным. Кроме того, открыт вопрос о том, что найдено – минимум или максимум, хотя в инженерной практике обычно из физических соображений это бывает ясно.

Пример: Покажем технику решения задачи методом Лагранжа.

Д
ля рассмотренного выше примера с двумя насосами, задан объем перекачиваемой жидкости:

При этом ограничении требуется найти потребляемую мощность насосов
. Пусть коэффициенты равны 1 = 2 =1, К 1 =1, К 2 =1,5. Тогда целевая функция, найти минимум при ограничении:.

Процедура решения:

    Составляем функцию Лагранжа

    Составляется система уравнений (8):


    Записываются Q i черези подставляются в третье выражение:

,
,
,

Тогда координаты экстремума:

,

Пример 2:

Пусть дано последовательное соединение компрессоров.
Задана требуемая степень сжатия:, которую требуется обеспечить при минимуме расхода мощности:

2.

3.
,
, подставляем в выражение для:

,
,
. Из физических соображений положительный корень отбрасываем, поэтому= –0,98.

Тогда координаты экстремума:

,

Как видно из приведенных примеров при решении задачи Лагранжа получаем в общем случае систему нелинейных уравнений, которую подчас трудно решить аналитически. Поэтому целесообразно применять приближенные методы решения задачи Лагранжа.

Методы наискорейшего спуска или спуска по координатам даже для квадратичной функции требуют бесконечного числа итераций. Однако можно построить такие направления спуска, что для квадратичной функции

(где есть -мерный вектор) с симметричной положительно определенной матрицей А процесс спуска сойдется точно к минимуму за конечное число шагов.

Положительно определенная матрица позволяет ввести норму вектора следующим образом:

Нетрудно проверить, что все аксиомы нормы при этом выполнены. Определение (31) означает, что под скалярным произведением двух векторов х и у теперь подразумевается величина Векторы, ортогональные в смысле этого скалярного произведения

называют сопряженными (по отношению к данной матрице А). Ниже мы увидим, что поочередный спуск по сопряженным направлениям особенно выгоден при поиске минимума.

На этом основана большая группа методов: сопряженных градиентов, сопряженных направлений, параллельных касательных и другие. Для квадратичной функции они применяются с одинаковым успехом. На произвольные функции наиболее хорошо обобщается метод сопряженных направлений, у которого детали алгоритма тщательно отработаны; этот метод излагается в данном пункте.

а) Сначала рассмотрим, как применяется этот метод к квадратичной форме (30). Для этого нам потребуются некоторые свойства сопряженных векторов. Пусть имеется некоторая система попарно сопряженных векторов . Нормируем каждый из этих векторов в смысле нормы (31); тогда соотношения между ними примут вид

Докажем, что взаимно сопряженные векторы линейно-независимы.

Из равенства следует , что противоречит положительной определенности матрицы.

Это противоречие доказывает наше утверждение. Значит, система сопряженных векторов является базисом в -мерном пространстве. Для данной матрицы имеется бесчисленное множество базисов, состоящих из взаимно сопряженных векторов.

Пусть мы нашли некоторый сопряженный базис Выберем произвольную точку . Любое движение из этой точки можно разложить по сопряженному базису

Подставляя это выражение в правую часть формулы (30), преобразуем ее с учетом сопряженности базиса (33) к следующему виду:

Последняя сумма состоит из членов, каждый из которых соответствует только одной компоненте суммы (34). Это означает, что движение по одному из сопряженных направлений меняет только один член суммы (35), не затрагивая остальных.

Совершим из точки поочередные спуски до минимума по каждому из сопряженных направлений Каждый спуск минимизирует свой член суммы (35), так что минимум квадратичной функции точно достигается после выполнения одного цикла спусков, то есть за конечное число действий.

Поясним геометрический смысл сопряженного базиса. Если осями координат сделать главные оси эллипсоидов уровня квадратичной функции, то один цикл спусков по этим координатам приводит точно в минимум. Если перейти к некоторым аффинным координатам, то функция останется квадратичной, но коэффициенты квадратичной формы изменятся. Можно формально рассмотреть нашу квадратичную функцию с измененными коэффициентами как некоторую новую квадратичную форму в декартовых координатах и найти главные оси ее эллипсоидов. Положение этих главных осей в исходных аффинных координатах будет некоторой системой сопряженных направлений. Разный выбор аффинных координат естественно приводит к разным сопряженным базисам.

б) Сопряженный базис можно построить способом параллельных касательных плоскостей.

Пусть некоторая прямая параллельна вектору а квадратичная функция достигает на этой прямой минимального значения в точке . Подставим уравнение этой прямой в выражение (30) и потребуем выполнения условия минимума функции в точке т. е. при

Для этого воспользуемся выражением (35), где в сумме оставим только один член:

и положим . Отсюда следует уравнение, которому удовлетворяет точка минимума:

Пусть на какой-нибудь другой прямой, параллельной первой, функция принимает минимальное значение в точке гг; тогда аналогично найдем Вычитая это равенство из (36), получим

Следовательно, направление, соединяющее точки минимума на двух параллельных прямых, сопряжено направлению этих прямых.

Таким образом, всегда можно построить вектор, сопряженный произвольному заданному вектору . Для этого достаточно провести две прямые, параллельные и найти на каждой прямой минимум квадратичной формы (30). Вектор соединяющий эти минимумы, сопряжен Заметим, что прямая касается линии уровня в той точке, где функция на данной прямой принимает минимальное значение; с этим связано название способа.

Пусть имеются две параллельные -мерные плоскости, порожденные системой сопряженных векторов . Пусть квадратичная функция достигает своего минимального значения на этих плоскостях соответственно в точках . Аналогичными рассуждениями можно доказать, что вектор соединяющий точки минимума, сопряжен всем векторам . Следовательно, задана неполная система сопряженных векторов то этим способом всегда можно построить вектор сопряженный всем векторам этой системы.

Рассмотрим один цикл процесса построения сопряженного базиса. Пусть уже построен базис, в котором последние векторов взаимно сопряжены, а первые векторов не сопряжены последним. Найдем минимум квадратичной функции (30) в какой-нибудь -мерной плоскости, порожденной последними векторами базиса. Поскольку эти векторы взаимно сопряжены, то для этого достаточно произвольно выбрать точку и сделать из нее спуск поочередно по каждому из этих направлений (до минимума!). Точку минимума в этой плоскости обозначим через .

Теперь из точки сделаем поочередный спуск по первым векторам базиса. Этот спуск выведет траекторию из первой плоскости и приведет ее в некоторую точку

Из точки снова совершим по последним направлениям спуск, который приведет в точку Этот спуск означает точное нахождение минимума во второй плоскости, параллельной первой плоскости. Следовательно, направление сопряжено последним векторам базиса.

Если одно из несопряженных направлений в базисе заменить направлением то в новом базисе уже направление будет взаимно сопряжено.

Начнем расчет циклов с произвольного базиса; для него можно считать, что . Описанный процесс за один цикл увеличивает на единицу число сопряженных векторов в базисе. Значит, за цикл все векторы базиса станут сопряженными, и следующий цикл приведет траекторию в точку минимума квадратичной функции (30).

в) Хотя понятие сопряженного базиса определено только для квадратичной функции, описанный выше процесс построен так, что его можно формально применять для произвольной функции. Разумеется, что при этом находить минимум вдоль направления надо методом парабол, не используя нигде формул, связанных с конкретным видом квадратичной функции (30).

В малой окрестности минимума приращение достаточно гладкой функции обычно представимо в виде симметричной положительно определенной квадратичной формы типа (18). Если бы это представление было точным, то метод сопряженных направлений сходился бы за конечное число шагов. Но представление приближенно, поэтому число шагов будет бесконечным; зато сходимость этого метода вблизи минимума будет квадратичной.

Благодаря квадратичной сходимости метод сопряженных направлений позволяет находить минимум с высокой точностью. Методы с линейной сходимостью обычно определяют экстремальные значения координат менее точно.

Замечание 1. Реально даже для квадратичной функции процесс не всегда укладывается в циклов. Построение сопряженного базиса означает ортогонализацию в метрике, порожденной матрицей А. Ранее отмечалось, что в процессе ортогонализации теряется точность; при большом числе переменных погрешность настолько возрастает, что процесс приходится повторять.

Замечание 2. Теоретически безразлично, какое из несопряженных направлений выкинуть из базиса в конце цикла. Обычно выкидывают то направление, при спуске по которому на данном цикле функция изменилась менее всего. Поскольку для произвольной функции понятие сопряженности ввести нельзя, то направление наиболее слабого убывания выкидывают независимо от того, под каким номером оно стоит в базисе. Любопытно, что это оказывается выгодным даже для квадратичной функции, хотя на основании этого критерия иногда можно выкинуть сопряженное направление, оставив несопряженные; зато уменьшается потеря точности при ортогонализации.

Замечание 3. Описанный выше цикл метода включает два спуска по сопряженным направлениям и один - по несопряженным. Более выгоден цикл, при котором сразу после нахождения нового сопряженного направления по нему делают спуск из точки приходя в некоторую точку Тогда спуск из будет спуском в плоскости всех новых сопряженных направлений, т. е. его можно считать первой группой нового цикла спусков. Поэтому из точки сразу можно спускаться по несопряженным направлениям.

При этом новое направление ставят в базис на последнее место и выкидывают то направление, на котором функция слабее всего уменьшилась при спусках от точки до точки Наименее выгодным может оказаться и новое направление; тогда следующий цикл спусков будет сделан со старым базисом.

Метод сопряженных направлений является, по-видимому, наиболее эффективным методом спуска. Он неплохо работает и при вырожденном минимуме, и при разрешимых оврагах, и при наличии слабо наклонных участков рельефа - «плато»-, и при большом числе переменных - до двух десятков.


Определение . Направление, определяемое ненулевым вектором называется асимптотическимнаправлением относительно линии второго порядка, если любая прямая этого направления (то есть параллельная вектору ) либо имеет с линией не более одной общей точки, либо содержится в этой линии.

? Сколько общих точек может быть у линии второго порядка и прямой асимптотического направления относительно этой линии?

В общей теории линий второго порядка доказывается, что если

То ненулевой вектор ( задаёт асимптотическое направление относительно линии

(общий критерий асимптотического направления ).

Для линий второго порядка

если , то нет асимптотических направлений,

если то существует два асимптотических направления,

если то существует только одно асимптотическое направление.

Полезной оказывается следующая лемма (критерий асимптотического направления линии параболического типа ).

Лемма . Пусть - линия параболического типа.

Ненулевой вектор имеет асимптотическое направление

относительно . (5)

(Задача. Доказать лемму.)

Определение . Прямая асимптотического направления называется асимптотой линии второго порядка, если эта прямая либо не пересекается с , либо содержится в ней.

Теорема . Если имеет асимптотическое направление относительно , то асимптота, параллельная вектору , определяется уравнением

Заполняем таблицу.

ЗАДАЧИ .

1. Найти векторы асимптотических направлений для следующих линий второго поря дка:

4 - гиперболического типа два асимптотических направления.

Воспользуемся критерием асимптотического направления:

Имеет асимптотическое направление относительно данной линии 4 .

Если =0, то =0, то есть - нулевой. Тогда Поделим на Получаем квадратное уравнение: , где t = . Решаем это квадратное уравнение и находим два решения: t = 4 и t = 1. Тогда асимптотические направления линии .

(Можно рассмотреть два способа, так как линия – параболического типа.)

2. Выясните, имеют ли оси координат асимптотические направления относительно линий второго порядка:

3. Напишите общее уравнение линии второго порядка, для которой

а) ось абсцисс имеет асимптотическое направление;

б) Обе оси координат имеют асимптотические направления;

в) оси координат имеют асимптотические направления и О – центр линии.

4. Напишите уравнения асимптот для линий:

а) ng w:val="EN-US"/>y=0"> ;

5. Докажите, что если линия второго порядка имеет две непараллельные асимптоты, то их точка пересечения является центром данной линии.

Указание: Так как есть две непараллельные асимптоты, то существует два асимптотических направления, тогда , а, значит, линия – центральная.

Запишите уравнения асимптот в общем виде и систему для нахождения центра. Всё очевидно.

6.(№920) Напишите уравнение гиперболы, проходящей через точку А(0, -5) и имеющей асимптоты х – 1 = 0 и 2х – y + 1 = 0.

Указание . Воспользуйтесь утверждением предыдущей задачи.

Домашнее задание . , №915(в,д,е), №916 (в,г,д), №920 (если не успели);

Шпаргалки;

Силаев, Тимошенко. Практические задания по геометрии,

1 семестр. С.67, вопросы 1-8, с.70, вопросы 1-3 (устно).

ДИАМЕТРЫ ЛИНИИ ВТОРОГО ПОРЯДКА.

СОПРЯЖЕННЫЕ ДИАМЕТРЫ.

Дана аффинная система координат .

Определение. Диаметром линии второго порядка, сопряженным вектору не асимптотического направления относительно , называется множество середин всех хорд линии , параллельных вектору .

На лекции доказано, что диаметр – это прямая и получено её уравнение

Рекомендации : Показать (на эллипсе), как строится (задаём не асимптотическое направление; проводим [две] прямые этого направления, пересекающие линию; находим середины отсекаемых хорд; проводим через середины прямую – это и есть диаметр).

Обсудить:

1. Почему в определении диаметра берётся вектор не асимптотического направления. Если не могут ответить, то попросите построить диаметр, например, для параболы.

2. Любая ли линия второго порядка имеет хотя бы один диаметр? Почему?

3. На лекции доказано, что диаметр – это прямая. Серединой какой хорды является точка М на рисунке?


4. Посмотрите на скобки в уравнении (7). Что они напоминают?

Вывод: 1) каждый центр принадлежит каждому диаметру;

2) если существует прямая центров, то существует единственный диаметр.

5. Какое направление имеют диаметры линии параболического типа? (Асимптотическое)

Доказательство (наверно, на лекции).

Пусть диаметр d, заданный уравнением (7`) сопряжен вектору не асимптотического направления. Тогда его направляющий вектор

(-(), ). Покажем, что этот вектор имеет асимптотическое направление. Воспользуемся критерием вектора асимптотического направления для линии параболического типа (см.(5)). Подставляем и убеждаемся (не забываем, что .

6. Сколько диаметров у параболы? Их взаимное расположение? Сколько диаметров у остальных линий параболического типа? Почему?

7. Как построить общий диаметр некоторых пар линий второго порядка (см. вопросы 30, 31 далее).

8. Заполняем таблицу, обязательно делаем рисунки.

1. . Напишите уравнение множества середин всех хорд, параллельных вектору

2. Напишите уравнение диаметра d, проходящего через точку К(1,-2) для линии .

Этапы решения :

1-й способ .

1. Определяем тип (чтобы знать, как ведут себя диаметры этой линии).

В данном случае линия центральная, тогда все диаметры проходят через центр С.

2. Составляем уравнение прямой, проходящей через две точки К и С. Это и есть искомый диаметр.

2-й способ .

1. Записываем уравнение диаметра d в виде (7`).

2. Подставив в это уравнение координаты точки К, находим зависимость между координатами вектора, сопряженного диаметру d.

3. Задаём этот вектор, учитывая найденную зависимость, и составляем уравнение диаметра d.

В данной задаче вычислять проще вторым способом.

3. . Напишите уравнение диаметра, параллельного оси абсцисс.

4. Найдите середину хорды, отсекаемой линией

на прямой x + 3y – 12 =0.

Указание к решению : Конечно, можно найти точки пересечения данных прямой и линии , а затем – середину полученного отрезка. Желание сделать так отпадает, если взять, к примеру, прямую с уравнением х +3у – 2009 =0.

Назначение сервиса . Онлайн-калькулятор предназначен для нахождения минимума функции методом Пауэлла . Решение оформляется в формате Word .

Правила ввода функций:

  1. Все переменные выражаются через x 1 ,x 2
  2. Все математические операции выражаются через общепринятые символы (+,-,*,/,^). Например, x 1 2 +x 1 x 2 , записываем как x1^2+x1*x2 .

Метод Пауэлла относится к прямым методам (методам нулевого порядка). Этим методом наиболее эффективно осуществляется минимизация функций, близких к квадратичным. На каждой итерации алгоритма поиск осуществляется вдоль системы сопряженных направлений.
Два направления поиска S i , S j называются сопряженными , если S j T ·H·S j =0, i≠j, S i T ·H·S i =0, i=j.
где H - положительно определенная квадратная матрица.
Обоснование применения сопряженных направлений в алгоритмах оптимизации . В методе Пауэлла H=▽²f(x k) - матрица вторых частных производных. Идеи метода Пауэлла относятся к квадратичной функции f(x ).
Основная идея заключается в том, что если на каждом этапе поиска определяется минимум квадратичной функции f(x ) вдоль каждого из p (p < n) - сопряженных направлений и если затем в каждом из направлений делается шаг до минимальной точки, то полное перемещение от начала до шага с номером p сопряжено ко всем поднаправлениям поиска.
Идея использования сопряженных направлений лежит в основе ряда алгоритмов.
Пусть f(x ) - квадратичная функция и процесс минимизации начинается в точке x 0 с начальным направлением S 1 . Для удобства возьмем этот вектор единичным, т.е. (S 1) T ·S 1 =1. Тогда вектор x 1 =x 0 +λ 1 ·S 1 и длина шага λ 1 определяется из условия минимальности функции в данном направлении т.е.
.
Для квадратичной функции
, (1)
и, таким образом, оптимальное значение λ на первом шаге определяется в соответствии с соотношением
, (2)
где H=▽²f(x k).
Из точки x 1 процесс минимизации должен осуществляться в другом сопряженном направлении S 2 и при этом
(S 2) T ·H·).
В общем случае система n линейно независимых направлений поиска S 1 , S 2 ,..., S n называется сопряженной по отношению к некоторой положительно определенной матрице H , если (S i) T ·H·S j =0, 0 ≤ i ≠ j ≤ n.
Так как сопряженные направления линейно независимы, то любой вектор в пространстве E n можно выразить через S 1 , S 2 ,..., S n следующим образом:
где . (3)
Для некоторой матрицы H всегда существует, по крайней мере, одна система из n взаимно сопряженных направлений, так как сами собственные векторы матрицы H представляют собой такую систему.
Отметим, что для квадратичной функции справедливо следующее соотношение, которое потребуется в дальнейшем:
. (4)
Чтобы убедиться в его справедливости, рассмотрим матрицу . Умножение ее справа на H·S k дает
,
если положить .
Вообще говоря, справедливо общее правило, заключающееся в том, что если используются сопряженные направления для поиска минимума квадратичной функции f(x ), то эта функция может быть минимизирована за n шагов по одному в каждом из сопряженных направлений. Более того, порядок использования сопряженных направлений несущественен.
Покажем, что это действительно так. Пусть f()=b +H·x .
В точке минимума ▽f(x *), и эта точка x *=-H T ·b .
Заметим, что ▽ T f(x k)·S k =(S k) T ·▽f(x k).
Так как x 1 =x 0 +λ 1 ·S 1 , (5)
где λ 1 определяется в соответствии с соотношением (2):
,
затем минимум находится в следующем сопряженном направлении по аналогичным формулам i-1 +λ i ·S i) в направлении S i , чтобы получить λ i , что приводит к следующему выражению (на основании (2))
. (7)
Кроме того,
и (S i) T ·▽f(x i-1)=(S i) T ·,
так как все (S i) T ·H·S k =0, ∀i≠k, 0 и H -1 ·b через систему сопряженных векторов S i следующим образом (по аналогии с (3)):
,
.
Подставив эти выражения в (7), получим
x n =x 0 -x 0 +H -1 ·b =H -1 ·b . (9)
Таким образом, точка x n , полученная в результате минимизации квад­ратичной функции на n -м шаге, совпадает с точкой минимума квадратичной функции f(x ).
Покажем, что для сопряженных направлений, если f(x ) каждый раз минимизируется в сопряженном направлении S j в соответствии с формулой (2), то при этом выполняется следующее равенство:
(x j) T ·▽f(x l), 1 ≤ j ≤ l-1 ,
при использовании не более чем n направлений, то есть ▽f(x l) ортогонален использованным сопряженным направлениям.
Для квадратичной функции ▽f( k - произвольная точка, из которой начинается поиск по сопряженным направлениям. Поскольку ▽f( k-1) T дает
.
Первый член в правой части (S k-1) T ·▽f(x k)=0, так как градиент в точке x k ортогонален направлению предыдущего спуска, если точка получена в результате минимизации функции в этом направлении. Кроме того, все остальные слагаемые под знаком суммы исчезают вследствие сопряженности направлений S k-1 и S j , и таким образом
(S j) T ·▽f(x l)=0, 1≤j≤l-1 . (10)

Алгоритм Пауэлла

Переход из точки x k 0 в точку x k n на k -м шаге алгоритма Пауэлла осуществляется в соответствии с формулой:
.
При этом последовательно осуществляется минимизация исходной функции по сопряженным направлениям S k 1 , ... ,S k n . Результатом минимизации по каждому из сопряженных направлений является система параметров λ 1 k ,...,λ n k , при которых функция минимальна в каждом из сопряженных направлений:
, .
Начальную систему сопряженных направлений можно выбрать параллельной осям системы координат. В конце каждой итерации алгоритма Пауэлла необходимо выбрать новую систему сопряженных направлений, так как если этого не сделать, то получим простой покоординатный поиск. В основе построения новой системы лежит следующая теорема.

Теорема: Если при начальной точке x 0 поиска в направлении вектора S минимум функции f(x ) находится к точке x a , а при начальной точке x 1 ≠x 0 поиск минимума функции f(x ) в том же направлении S приводит к точке x b , то при f(x b)

Доказательство . Используя ранее полученные результаты (10), можно записать, что в первом случае
S T ·▽f(x a)=S T ·(H·x a +b )=0,
аналогично, во втором случае можно записать
S T ·▽f(x b)=S T ·(H·x b +b )=0,
Вычитая из первого выражения второе получим, что
S T ·H·(x b -x a)=0,
Следовательно, векторы S и (x b -x a) являются сопряженными.
Эта теорема непосредственно может быть распространена на случай нескольких сопряженных направлений следующим образом. Если, начиная из точки x 0 , точка x a определяется после использования при минимизации нескольких сопряженных направлений p (pСледующий рисунок служит иллюстрацией теоремы.




Рисунок.
Пусть в начальный момент для двумерной задачи поиск осуществляется из точки x 0 вдоль направлений, параллельных осям координат: S 0 1 и S 0 2 . Последовательно были найдены точки x 0 1 , x 0 2 , x 0 3 (см. рис.).
Таким образом, определили 2 сопряженных направления, в которых следует вести поиск: S 0 2 и (x 0 3 -x 0 1). В системе исходных направлений S 0 1 должно быть заменено на (x 0 3 -x 0 1), представляющее собой полное перемещение из первого минимума. Направления поиска на следующем этапе:
S 1 1 =S 0 2 ,
S 1 2 =x 0 3 -x 0 1 .

Второй этап начинается с минимизации вдоль направления S 1 2 , затем, если необходимо, перемещение в направлении S 1 1 . Но в случае квадратичной функции двух переменных после минимизации по двум сопряженным направлениям будет достигнута точка минимума.
В общем случае, на k -м шаге алгоритма Пауэлла используется n линейно независимых направлений поиска. Поиск начинается с точки x k 0 и осуществляется по следующему алгоритму:
1. Начиная с точки , в направлениях S k 1 , ... , S k n . При этом находятся точки x k 1 , ... , x k n , которые минимизируют исходную функцию в заданных направлениях, причем x k 1 =x k 0 +λ 1 ·S k 1 = x k 1 +λ 2 ·S k 2 , ..., x k n =x k n-1 +λ n ·S k n .
2. Поиск, осуществляемый на первом этапе, может привести к линейно зависимым направлениям, если, например, в одном из направлений S i не удается найти меньшего значения функции. Поэтому 2 направления могут стать коллинеарными. Поэтому в системе сопряженных направлений не следует заменять старое направление на новое, если после такой замены направления нового набора становятся линейно зависимыми.
На примере квадратичной функции Пауэллом было показано, что при нормировании направлений поиска в соответствии с соотношением:
(S k i)·H·S k i =1, i=1,n ,
определитель матрицы, столбцы которой представляют собой направления поиска, принимает максимальное значение тогда и только тогда, когда S k i взаимно сопряжены относительно матрицы H . Он пришел к выводу, что направление полного перемещения на k -м шаге должно заменять предыдущее направление только в том случае, когда заменяющий вектор увеличивает определитель матрицы направлений поиска. Так как только тогда новый набор направлений будет более эффективным.
Для такой проверки из точки x k n делается дополнительный шаг в направлении (x k n -x k 0), соответствующий полному перемещению на k -м этапе и получают точку (2x k n -x k 0). Для проверки того, что определитель матрицы направлений поиска увеличивается при включении нового направления, делается шаг 3.
3. Обозначим наибольшее уменьшение f( k m .
Обозначим:
f 1 =f(x k 0), f 2 =f(x k n), f 3 =f(2x k n -f 1 =f(x k 0),
где x k 0 =x k-1 n , .
Тогда, если f 3 ≥f 1 и (или) (f 1 -2f 2 +f 3)(f 1 -f 2 -Δ k) 2 ≥0.5*Δ k (f 1 -f 3) 2 , то следует использовать на (k+1) -м этапе те же направления S k 1 , ... , S k n , что и на k -м этапе, то есть S k+1 i =S k i , i=1,n , и начать поиск из точки x k+1 0 =x k n или из точки x k+1 0 =2x k n -x k 0 =x k n+1 , в зависимости от того, в какой точке функция принимает минимальное значение.
4. Если тест на шаге 3 не прошел, то ищется минимум f(x ) в направлении вектора S k n+1 , проведенного из x k 0 в x k n: S k n+1 =(x k n -x k 0). Точка этого минимума берется в качестве начальной точки на (k+1) -м этапе. А в системе сопряженных направлений сохраняются все, кроме направления S k m , которое заменяется на новое направление S k n+1 , но новое направление помещается в последний столбец матрицы направлений. На (k+1) -м этапе будут использоваться направления
= .
5. Критерий останова. Алгоритм прерывается, если изменение по каждой переменной оказывается меньше заданной точности по соответствующей переменной или ||x k n -x k 0 ||≤ε.

Пример №1 . Методом Пауэлла найти точку минимума функции 4(x 1 -5) 2 +(x 2 -6) 2 , если задана начальная точка х (0) = (8, 9) Т.
Решение :
Градиент функции:

Итерация №0 .

Проверим критерий остановки: |▽f(X 0)| < ε

Вычислим значение функции в начальной точке f(X 0) = 45.
Направление поиска:
p 1 = T
p 2 = T

Шаг №1. Сделаем шаг вдоль направления поиска p 2 = T

f(X 1) = 4(8-5) 2 +((h+9)-6) 2 → min
f(X 1) = h 2 +6h+45 → min
Найдем такой шаг h, чтобы целевая функция достигала минимума вдоль этого направления. Из необходимого условия существования экстремума функции (f"(x 1)=0):
2h+6 = 0. Получим шаг: h = -3

Шаг №2. Сделаем шаг вдоль другого направления поиска p 1 = T

f(X 2) = 4((h+8)-5) 2 +((6)-6) 2 → min
f(X 2) = 4h 2 +24h+36 → min
Найдем такой шаг h, чтобы целевая функция достигала минимума вдоль этого направления. Из необходимого условия существования экстремума функции (f"(x 2)=0):
8h+24 = 0. Получим шаг: h = -3
Выполнение этого шага приведет в точку:

Шаг №3. Повторно сделаем шаг вдоль направления поиска p 2 = T

f(X 3) = 4(5-5) 2 +((h+6)-6) 2 → min
f(X 3) = h 2 → min
Найдем такой шаг h, чтобы целевая функция достигала минимума вдоль этого направления. Из необходимого условия существования экстремума функции (f"(x 3)=0):
2h = 0. Получим шаг: h = 0
Выполнение этого шага приведет в точку:

Шаг №4. Выбираем сопряженное направление: p 2 = x 3 - x 1
p 2 = T - T = [-3;0] T

Итерация №1 .

Проверим критерий остановки:
|▽f(X 3)| < ε

Вычислим значение функции в начальной точке f(X 3) = 0.
Ответ: X = T

Пример №2 . Минимизировать функцию f(x) методом сопряженных направлений, заканчивая вычисления при |d(x)/dx| < 10 -3 , i=1,2,..,n.
x 1 4 +2*x 2 4 +x 1 2 *x 2 2 +2*x 1 +x 2
Градиент функции

+ h -0.5 + h -0.7413 + h + 0.09038 + h + 0.02394 + h + 0.000178 + h + 0.000243
-0.741
0.0904
=
-0.759
-0.4074

Ответ: X = [-0.759;-0.4074] T

Итерация №2 .

▽ f(X 6) =
-0.00093
-0.0103

Проверим критерий остановки:
|▽f(X 6)|
Вычислим значение функции в новой точке f(X 6) = -1.443.
Направление поиска: p 1 = T , p 2 = T
Одно из направлений поиска p 2 = T . Заканчиваем процесс итераций.
Ответ: X = [-0.759;-0.4074] T

Метод ориентирован на решение задач с квадратичными целевыми функциями и основывается на фундаментальных теоретических результатах. Хотя используемые в реальных ситуациях алгоритмы, являющиеся эффективными для квадратичных целевых функций, могут плохо работать при более сложных целевых функциях, тем не менее этот подход представляется вполне разумным.

Определение . Пусть - симметрическая матрица порядка
. Векторы
называются
- сопряженными, если они линейно независимы и выполняется условие
при
.

Пример. Рассмотрим функцию

В качестве матрицы
можно взять матрицу Гессе

.

В качестве одного из направлений выберем
. Тогда направление
должно удовлетворять равенству

.

Следует заметить, что сопряженные направления выбираются неоднозначно. Однако если добавить условие нормировки, то их можно определить однозначно:

Утверждение. Любая квадратичная функция переменных, имеющая минимум, может быть минимизирована зашагов, при условии, что поиск ведется вдоль сопряженных относительно матрицы Гессе направлений .

Произвольная функция может быть достаточно хорошо представлена в окрестности оптимальной точки ее квадратичной аппроксимацией. Поэтому сопряженные направления могут быть полезны для ее оптимизации. Однако потребуется более чем шагов. Для определения сопряженных направлений применяется способ, основанный на следующем утверждении.

Утверждение. Пусть задана квадратичная функция
, две произвольные точки
и направление
S ..Если точка является точкой минимума функции
вдоль направления
S из точки , а- точкой минимума функции вдоль направления S из точки
, то направление
сопряжено с направлением
S .

Алгоритм.

Шаг 1. Задать начальную точку и систему линейно независимых направлений
(они первоначально могут совпадать с направлениями координатных осей). Минимизировать функцию
при последовательном движении по направлениям; используя какой-либо одномерный поиск; и полученную ранее точку минимума взять в качестве исходной.

Шаг 2. Выполнить дополнительный шаг
, соответствующий полному перемещению на шаге 1. Вычислить точку
(рис 12). Проверить критерий (*) включения нового направления в систему сопряженных направлений.

Шаг 3. Пусть – наибольшее уменьшение целевой функции в одном из направлений
:

и является направлением, соответствующим.

Если выполняются условия

(*)

то поиск продолжить вдоль первоначальных направлений
из точки
или
(из той точки, где меньше значение функции).

Шаг 4. Если условия не выполняются, то минимизировать функцию
вдоль направления
. Точку этого минимума взять в качестве начальной на следующем этапе. На этом этапе использовать систему направлений

т.е. направление заменить на, которое поместить в последний столбец матрицы направлений.

Шаг 5. Если
, то минимум найден. В противном случае выполнить шаг 1.

Пример. Щелкнув по значку, откроется Mathcad документ метода сопряженных направлений, в котором можно выполнить вычисления.

Минимизация функции

методом сопряженных направлений

Может показаться нерациональным отбрасывать самое удачное направление текущей итерации и устанавливать новое перспективное направление на последнее место вместо первого. Однако же нетрудно видеть, что самое удачное направление скорее всего исчерпало себя, а новое перспективное направление только что было использовано для одномерной оптимизации и применять его сразу же нет никакого смысла, так как продвижения просто на будет.

Пауэлл доказал, что определитель матрицы направлений принимает максимальное значение тогда и только тогда, когда направления ,
сопряжены относительно матрицы Гессе. Он пришел к выводу, что направление полного перемещения должно заменять предыдущее только в том случае, когда это направление увеличивает определитель матрицы направлений, так как только тогда новый набор направлений будет эффективным.

Доказано, что процедура Пауэлла сходится к точке, в которой градиент равен нулю, если целевая функция строго выпукла. Эта точка является локальным минимумом. Метод очень чувствителен к способу построения сопряженных направлений и поэтому зависит от точности используемого одномерного поиска. Пауэлл предложил использовать последовательность квадратичных интерполяций со специальной процедурой настройки параметров этого линейного поиска. Тем не менее численные исследования показали, что метод сопряженных направлений Пауэлла не следует использовать при размерности свыше 20.

Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png