Как найти канонический вид квадратичной формы

Содержание

Квадратичная форма

$ mathbb A_{} $ означает одно из множеств: $ mathbb Q_{} $ рациональных, или $ mathbb R_{} $ вещественных, или $ mathbb C_{} $ комплексных чисел.

Определение

Квадратичной формой над множеством $ mathbb A_{} $ называют однородный полином второй степени с коэффициентами из $ mathbb A_{} $; если переменные обозначить
$ x_1,dots,x_{n} $, то общий вид квадратичной формы от этих переменных:
$$
f(x_1,dots,x_{n} )= sum_{1le j le k le n} f_{jk}x_jx_k=
$$
$$begin{array}{llll}
displaystyle=
f_{11}x_1^2&+f_{12}x_1x_2&+ dots & +f_{1n}x_1x_n+ \
&+f_{22}x_2^2 &+ dots & +f_{2n}x_2x_n+ \
&+dots & & +dots + \
& & +f_{jk}x_jx_k & + dots+ \
& & &+f_{nn}x_n^2.
end{array}
$$

П

Пример. Функции

$$x_1^2-x_1x_2+x_3^2 , , quad sqrt{3}, x_2^2 — pi, x_3^2
, , quad -x_1x_2 , , quad mathbf i , x_1^2$$
являются квадратичными формами. Функции
$$x_1^2-3, x_1+1 , , quad 5, x_1^2x_2^2 , , quad frac{x_1x_3^2}{x_2}
, , quad sqrt{x_1x_2x_3x_4} $$
не являются квадратичными формами.

Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,dots,x_{n} ) $ имеет канонический вид если
$$f(x_1,dots,x_{n} )equiv f_{11}x_1^2+f_{22}x_2^2+dots+f_{nn}x_n^2 quad npu quad left{f_{jj}right}_{j=1}^n subset mathbb A , $$
т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является «суммой квадратов»1).

Оказывается, что в любой квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.

П

Пример.

$$ 2, x_1^2+4, x_1x_2 +x_2^2 equiv 2, (x_1+x_2)^2-x_2^2 equiv -2,x_1^2 + (2,x_1+x_2)^2 ; $$
$$ x_1^2+2 mathbf i x_1x_2 — x_2^2 equiv (x_1+ mathbf i x_2)^2 ; $$
$$-x_1^2+6,x_1x_2+6,x_1x_3+2,x_2^2+4,x_2x_3+2,x_3^2equiv $$
$$
equiv (x_1+x_2+x_3)^2-2,(x_1-x_2-x_3)^2+3,(x_2+x_3)^2 equiv
$$
$$equiv -(x_1+3,x_2+3,x_3)^2+11,(x_2+x_3)^2 ; $$
$$ x_1x_2 equiv frac{1}{4} (x_1+x_2)^2- frac{1}{4} (x_1-x_2)^2 . $$

А в общем случае:
$$ f(x_1,dots,x_{n} )equiv $$
$$
begin{array}{l}
equiv a_1(c_{11}x_1+c_{12}x_2+dots+c_{1n}x_n)^2 +\
+a_2(c_{21}x_1+c_{22}x_2+dots+c_{2n}x_n)^2+ \
+dots+ \
+a_n(c_{n1}x_1+c_{n2}x_2+dots+c_{nn}x_n)^2
end{array}
$$
при $ {a_j}_{j=1}^n,{c_{jk}}_{j,k=1}^n $ — константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы — например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,dots,x_{n} ) ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы
$$ c_{11}x_1+c_{12}x_2+dots+c_{1n}x_n, c_{21}x_1+c_{22}x_2+dots+c_{2n}x_n,dots, c_{n1}x_1+c_{n2}x_2+dots+c_{nn}x_n $$
были линейно независимыми. При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется каноническим видом квадратичной формы.

Задача. Для произвольной квадратичной формы $ f(x_1,dots,x_{n} ) $ построить (хотя бы один) ее канонический вид.

Поставленная задача имеет существенное значение для анализа

  • геометрии линий второго порядка на плоскости и поверхностей второго порядка в пространстве; например, по набору коэффициентов уравнения, задающего кривую

$$ x^2 -2,xy+3,y^2+x-4,y-15=0 $$
определить к какому типу (эллипс, гипербола, парабола,…) она относится.

Метод Лагранжа приведения квадратичной формы к каноническому виду

Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.



Метод Лагранжа


1.

Пусть $ f_{11}ne 0 $. Выделим в $ f(x_1,dots, x_n)_{} $ все слагаемые, содержащие $ x_{1} $:
$$
f_{11}x_1^2+f_{12}x_1x_2+ dots +f_{1n}x_1x_n+ sum_{2le jle k le n} f_{jk}x_jx_k
=
$$
$$
= f_{11}left(x_1^2+frac{f_{12}}{f_{11}}x_1x_2+dots+
frac{f_{1n}}{f_{11}}x_1x_n right)+dots=
$$
$$
=f_{11}left[ left(x_1+frac{f_{12}}{2f_{11}}x_2+dots+
frac{f_{1n}}{2f_{11}}x_n right)^2-left(frac{f_{12}}{2f_{11}}x_2+dots+
frac{f_{1n}}{2f_{11}}x_n right)^2 right]+dots=
$$
$$
=f_{11} left(x_1+frac{f_{12}}{2f_{11}}x_2+dots+ frac{f_{1n}}{2f_{11}}x_n
right)^2 —
f_{11}left(frac{f_{12}}{2f_{11}}x_2+dots+
frac{f_{1n}}{2f_{11}}x_n right)^2 +dots
$$
В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_{1},x_2,dots,x_n $; все оставшиеся слагаемые не зависят от $ x_{1} $, т.е. составляют квадратичную форму от переменных $ x_{2},dots,x_n $. Таким образом, исходная задача для формы $ n_{} $ переменных оказывается сведенной к случаю формы $ (n-1)_{} $-й переменной; последняя преобразуется по аналогичному принципу.


2.

Если $ f_{11}=0 $, но $ exists k: f_{kk}ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, что выделение полного квадрата начинается с переменной $ x_{k} $ вместо $ x_{1} $ — первая ничем не лучше (и не хуже) $ k_{} $-й!


3.

Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_{11}=dots=f_{nn}=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_{jk}ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_{k} $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_{j} $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к «старой» переменной $ x_{k} $.


П

Пример. Привести форму

$$ f=4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4 $$
к каноническому виду.

Решение.
$$
begin{array}{ccl}
f&=&4left(x_1^2-x_1x_2-x_1x_3+x_1x_4right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\
&=&4bigg[
left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2-
left(-frac{1}{2}, x_2-frac{1}{2}, x_3+frac{1}{2}, x_4right)^2 bigg] + \
&+&2,x_2^2+x_3^2+x_4^2+4,x_2x_3-4,x_3x_4= \
&=&4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+\
& & + Big[left(x_2+x_3+x_4, right)^2- left(x_3+x_4 right)^2Big]-2,x_3x_4 = \
&=&4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2- \
&&-x_3^2-4,x_3x_4-x_4^2= \
&& 4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2- \
&&-Big[
left(x_3+ 2, x_4, right)^2-4, x_4^2Big] -x_4^2 = \
&=&4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2-left(x_3+ 2, x_4, right)^2+3,x_4^2
end{array}
$$

Ответ. $ fequiv 4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2-left(x_3+ 2, x_4, right)^2+3,x_4^2 $.

П

Пример. Привести форму

$$ f=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 $$
к каноническому виду.

Решение.
$$
fequiv (x_1+x_2+3,x_3)^2-(x_2+3,x_3)^2+x_2^2-4,x_3^2+4,x_2x_3 equiv
$$
$$
equiv (x_1+x_2+3,x_3)^2-2,x_2x_3 -13,x_3^2 equiv
$$
В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_{2} $, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому — в соответствии с пунктом

2

метода —
приходится выделять квадрат на основе переменной $ x_{3} $:
$$ (x_1+x_2+3,x_3)^2-13, left(x_3-frac{1}{13}x_2right)^2+13cdot frac{1}{13^2}x_2^2 . $$

Ответ. $ (x_1+x_2+3,x_3)^2-13, left(x_3-frac{1}{13}x_2right)^2+ frac{1}{13}x_2^2 $.

П

Пример. Привести форму

$$ f=x_1x_2-3,x_1x_3+2,x_2x_3 $$
к каноническому виду.

Решение. Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом

3

метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $:
$$ fequiv -x_1^2+x_1X_2-5,x_1x_3+2,X_2x_3 . $$
Дальнейший ход решения — в соответствии с пунктом

1

метода Лагранжа:
$$
-left(x_1-frac{1}{2}X_2+frac{5}{2}x_3right)^2+left(-frac{1}{2}X_2+frac{5}{2}x_3right)^2+2,X_2x_3 equiv
$$
$$
equiv -left(x_1-frac{1}{2}X_2+frac{5}{2}x_3right)^2+frac{1}{4}X_2^2-frac{1}{2}X_2x_3+frac{25}{4}x_3^2 equiv
$$
$$
equiv -left(x_1-frac{1}{2}X_2+frac{5}{2}x_3right)^2+frac{1}{4}left(X_2-x_3 right)^2+6,x_3^2
$$
Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_{2} $:

Ответ. $ -(frac{1}{2}x_1-frac{1}{2}x_2+frac{5}{2}x_3)^2+frac{1}{4}(x_1+x_2-x_3)^2+6,x_3^2 $.

Метод Лагранжа позволяет получить канонический вид квадратичной формы над тем же множеством $ mathbb A_{} $, над которым рассматривается исходная форма — например, если коэффициенты формы $ f_{} $ являются рациональными, то и коэффициенты ее канонического вида (т.е. числа $ {a_j}_{j=1}^n,{c_{jk}}_{j,k=1}^n $) будут также рациональными.

Матричная форма записи квадратичной формы

В этом и последующих пунктах существенно потребуется знание ключевых понятий ТЕОРИИ МАТРИЦ и ОПРЕДЕЛИТЕЛЕЙ.

Задача. Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением метода Лагранжа.

Прежде всего, соберем все переменные в один вектор, а вернее — в два вектора:
$$
{}_{.} mbox{ столбец переменных } X=
left(begin{array}{l} x_1 \ vdots \ x_n end{array} right) quad mbox{ и строку переменных }
X^{top} = (x_1,dots,x_n) ;
$$
здесь $ {}^{top} $ означает транспонирование. Не очень принципиально, что обозначать через $ X_{} $ — столбец или строку; и хотя сокращение $ f(x_1,dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные
значки…

Если определить верхнетреугольную матрицу $ mathbf F $ равенством:
$$
{mathbf F}= left(
begin{array}{cccc}
f_{11}&f_{12}&dots &f_{1n} \
&f_{22}& dots & f_{2n} \
mathbb O & &ddots & vdots \
& & & f_{nn}
end{array} right),
$$
то квадратичную форму можно записать в виде произведения трех матриц
$$ {}_{.} mbox{ строка переменных } times mbox{ матрица } times mbox{ столбец переменных } $$
$$ f(X)=X^{top} {mathbf F}X .$$
Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_{} $, подбирая разные матрицы

П

Пример. $ f=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 equiv $

$$
equiv (x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 2 & 6 \
0 & 1 & 4 \
0 & 0 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)
equiv (x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 0 & 3 \
2 & 1 & 4 \
3 & 0 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)equiv
$$
$$
equiv (x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 1 & 3 \
1 & 1 & 2 \
3 & 2 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)equiv dots
$$

Из всего этого бесконечного множества представлений выделим одно. Рассмотрим матрицу
$${mathbf A}=frac{{mathbf F}+{mathbf F}^{top}}{2}=
left(
begin{array}{cccc}
f_{11}& 1/2 f_{12}&dots & 1/2 f_{1n} \
1/2 f_{12} &f_{22}& dots & 1/2 f_{2n} \
dots & & & dots \
1/2 f_{1n} & 1/2 f_{2n} & dots & f_{nn}
end{array} right),
$$
которая, очевидно, симметрична: $ {mathbf A}^{top}={mathbf A} $. Тогда
$$
f(X)=sum_{1le j,k le n} a_{jk}x_jx_k=X^{top}{mathbf A}X .
$$
Это представление называют правильной записью квадратичной формы; матрицу $ {mathbf A} $ называют матрицей квадратичной формы $ f_{} $, а $ det mathbf A $ — дискриминантом квадратичной формы:
$$ det A = {mathcal D} (f) . $$
В случае, когда дискриминант равен нулю квадратичная форма называется вырожденной, в противном случае — невырожденной.

П

Пример. Для приведенной выше квадратичной формы

$$ f=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 $$
ее правильной записью будет именно последняя:

$$
fequiv
(x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 1 & 3 \
1 & 1 & 2 \
3 & 2 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)
$$
Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.

$ x_{1} $ $ x_{2} $ $ x_{3} $
$ x_{1} $ $ f_{11} $ $ frac{1}{2}f_{12} $ $ frac{1}{2}f_{13} $
$ x_{2} $ $ frac{1}{2}f_{12} $ $ f_{22} $ $ frac{1}{2}f_{23} $
$ x_{3} $ $ frac{1}{2}f_{13} $ $ frac{1}{2}f_{23} $ $ f_{33} $

П

Пример. Для

$$ f(x_1,x_2)=a_{11}x_1^2+2, a_{12}x_1x_2+a_{22}x_2^2 $$
имеем:
$$ {mathbf A} =
left(
begin{array}{ll}
a_{11} & a_{12} \
a_{12} & a_{22}
end{array}
right) ; {mathcal D} (f)=a_{11}a_{22}-a_{12}^2 ; $$
последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_{11}x^2+2, a_{12}x+a_{22} $ и это обстоятельство оправдывает использование слова дискриминант для нового объекта…

Матрица квадратичной формы совпадает с половиной матрицы Гессе этой формы: $ mathbf A = 1/2 H(f) $.

Причина, по которой из бесконечного многообразия матричных представлений квадратичной формы выделяется именно то, что использует симметричную матрицу, остается пока непонятной. Отложив ненадолго обсуждение этой причины, попробуем переписать в матричных терминах приведение квадратичной формы к каноническому виду.

Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_{1},dots,x_{n} $ к новым переменным $ y_{1},dots,y_{n} $. Ограничимся только линейными заменами вида
$$
left{ begin{array}{ccc}
x_1&=&c_{11}y_1+c_{12}y_2+dots+c_{1n}y_n, \
x_2&=&c_{21}y_1+c_{22}y_2+dots+c_{2n}y_n, \
dots & & dots \
x_n&=&c_{n1}y_1+c_{n2}y_2+dots+c_{nn}y_n.
end{array}
right.
$$
Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных
$$
C=
left( begin{array}{llcl}
c_{11} & c_{12} & dots & c_{1n} \
c_{21} & c_{22} & dots & c_{2n} \
dots & & & dots \
c_{n1} & c_{n2} & dots & c_{nn} \
end{array}
right) ;
$$
которая позволяет переписать саму замену переменных в матричном виде
$$
left(begin{array}{l} x_1 \ x_2 \ vdots \ x_n end{array} right)=
left( begin{array}{llcl}
c_{11} & c_{12} & dots & c_{1n} \
c_{21} & c_{22} & dots & c_{2n} \
dots & & & dots \
c_{n1} & c_{n2} & dots & c_{nn} \
end{array}
right)
left(begin{array}{l} y_1 \ y_2 \ vdots \ y_n end{array} right) qquad iff qquad
X=CY .
$$
Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке
$$
f(X)=X^{top}{mathbf A}X= (CY)^{top}{mathbf A} (CY)=Y^{top} C^{top}{mathbf A}C Y=tilde f (Y) ,
$$
(здесь использовались некоторые свойства операции транспонирования ) и, если обозначить матрицу
$$
mathbf B =C^{top}{mathbf A}C ,
$$
то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции произведения матриц. Обратим внимание на еще один факт — матрица $ mathbf B $ является симметричной:
$$
mathbf B^{top} =(C^{top}{mathbf A}C)^{top}= C^{top}{mathbf A}^{top}left(C^{top} right)^{top} =
C^{top}{mathbf A}C= mathbf B ,
$$
т.е. выбор в качестве матричной записи квадратичной формы именно того варианта, что основан на симметричной матрице, позволяет сохранить это свойство при любой линейной замене переменных.

Задача о нахождении канонического вида квадратичной формы $ X^{top}{mathbf A}X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_{} $, чтобы матрица
$ mathbf B= C^{top}{mathbf A}C $ оказалась диагональной:
$$
mathbf B=
left(
begin{array}{cccc}
a_{1} & & & \
& a_{2} & & {mathbb O} \
{mathbb O} & & ddots & \
& & & a_{n}
end{array}
right) ;
$$
при этом дополнительным условием ставится невырожденность (неособенность) матрицы $ C_{} $:
$$ det C ne 0 . $$

Пока не вполне понятна существенность последнего условия: почему оно накладывается? С одной стороны, оно обеспечивает обратимость замены переменных $ (x_1,dots,x_n) leftrightarrow
(y_1,dots,y_n) $ — не происходит «потери информации». В самом деле, наличие какого-то ограничения на все возможные замены переменных, довольно очевидно: если бы разрешалось использовать, например, нулевую матрицу $ C = {mathbb O}_{n} $, то канонический вид у любой квадратичной формы был бы нулевым.. . Геометрический смысл условия $ det C ne 0 $ обсудим



НИЖЕ.

Т

Теорема. Для любой квадратичной формы над $ mathbb A $ существует невырожденная линейная замена
переменных
$ X=CY $ такая, что преобразованная квадратичная форма $ widetilde f(Y) $ имеет канонический вид.

Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.

П

Пример. Для формы

$$ f(x_1,x_2,x_3,x_4)= $$
$$=4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4 $$
замена переменных осуществляется формулами

$$
begin{array}{crrrr}
y_1=& x_1 &-frac{1}{2}, x_2&-frac{1}{2},x_3&+ frac{1}{2},x_4, \
y_2=& & x_2&+x_3&+x_4, \
y_3=& & & x_3 &+ 2, x_4,\
y_4=& &&& x_4,
end{array}
$$
т.е. матрица замены переменных
$$
C=
left(
begin{array}{cccc}
1 & -frac{1}{2} & -frac{1}{2} & frac{1}{2} \
0 & 1 & 1 & 1 \
0 & 0 & 1 & 2 \
0 & 0 & 0 & 1
end{array}
right)
$$
имеет верхнетреугольный вид. Канонический вид в новых переменных записывается
$$ f(x_1,x_2,x_3,x_4) equiv 4,y_1^2+y_2^2-y_3^2+3,y_4^2 . $$

Для формы
$$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 $$
замена переменных уже не имеет треугольного вида:
$$
begin{array}{crrr}
y_1=& x_1 &+ x_2&+3,x_3 \
y_2=& & -frac{1}{13}x_2&+x_3 \
y_3=& & frac{1}{13}x_2 &
end{array}
qquad iff qquad
C=
left(
begin{array}{rrr}
1 & 1 & 3 \
0 & -frac{1}{13} & 1 \
0 & frac{1}{13} & 0
end{array}
right) .
$$
Для формы
$$ f(x_1,x_2,x_3)=x_1x_2-3,x_1x_3+2,x_2x_3 $$
получили:
$$
begin{array}{crrr}
y_1=& frac{1}{2}x_1 &-frac{1}{2}x_2&+frac{5}{2}x_3 \
y_2=& x_1&+x_2&-x_3 \
y_3=& & & x_3
end{array}
qquad iff qquad
C=
left(
begin{array}{rrr}
frac{1}{2} & -frac{1}{2} & frac{5}{2} \
1 & 1 & -1 \
0 & 1 & 1
end{array}
right) ,
$$
т.е. замена переменных также не имеет треугольного вида.



Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.

Метод Лагранжа и метод Гаусса

В этом и последующих пунктах существенно потребуется знание МЕТОДА ГАУССА преобразования систем линейных уравнений.

П

Пример. Рассмотрим матрицу квадратичной формы

$$ f(x_1,x_2,x_3,x_4)=$$
$$ =4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4 $$

из предыдущих пунктов, и, временно выходя из
круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса
приведения к треугольному виду:
$$
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
-2 & 2 & 2 & 0 \
-2 & 2 & 1 & -2 \
2 & 0 & -2 & 1
end{array}
right)
rightarrow
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
0 & 1 & 1 & 1 \
0 & 1 & 0 & -1 \
0 & 1 & -1 & 0
end{array}
right)
rightarrow
$$
$$
rightarrow
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
0 & 1 & 1 & 1 \
0 & 0 & -1 & -2 \
0 & 0 & -2 & -1
end{array}
right)
rightarrow
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
0 & 1 & 1 & 1 \
0 & 0 & -1 & -2 \
0 & 0 & 0 & 3
end{array}
right) .
$$
Обратим внимание на два обстоятельства: диагональные элементы последней матрицы
совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты
замены переменных, приводящей к этому каноническому виду, совпадают с
элементами строк этой матрицы, если их разделить на соответствующие диагональные
элементы. Возникает подозрение :-?, что метод Лагранжа является «замаскированной»
версией метода Гаусса.


Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем
правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду.
Пусть исходная квадратичная форма записана в виде
$$
f(x_1,dots,x_{n} )=sum_{1le j,k le n} a_{jk}x_jx_k=
$$
$$
begin{array}{llll}
=
a_{11}x_1^2&+2a_{12}x_1x_2&+ dots & +2a_{1n}x_1x_n+ \
&+a_{22}x_2^2 &+ dots & +2a_{2n}x_2x_n+ \
& & +dots & + \
& & &+a_{nn}x_n^2,
end{array}
$$
т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_{} $.
После выделения полного квадрата, содержащего переменные $ x_1,x_2,dots,x_n $:
$$ f(x_1,x_2,dots,x_n)equiv a_{11}
left(x_1+frac{a_{12}}{a_{11}}x_2+dots+ frac{a_{1n}}{a_{11}}x_n
right)^2 + f_2(x_2,dots,x_n)
$$
в правой части тождества образовалась квадратичная форма $ f_{2} $, не содержащая $ x_{1} $. Она равна
$$
f_2 =sum_{2le j,k le n} a_{jk}x_jx_k-
a_{11}left(frac{a_{12}}{a_{11}}x_2+dots+
frac{a_{1n}}{a_{11}}x_n right)^2=
$$
$$
=sum_{2le j,k le n} a_{jk}x_jx_k-a_{11}sum_{2le j,k le n}
frac{a_{1j}a_{1k}}{a_{11}^2}x_jx_k=
sum_{2le j,k le n}left( a_{jk}-frac{a_{1j}}{a_{11}}a_{1k} right)
x_jx_k .
$$
Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_{}-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ mathbf A_{} $ в результате первого шага метода Гаусса.

Т

Теорема. Метод Лагранжа приведения квадратичной формы $ X^{top}{mathbf A}X $ к каноническому виду эквивалентен методу Гаусса приведения матрицы $ {mathbf A} $ к треугольному виду.

Доказательство. Действительно, первый шаг прямого хода метода исключения переменных
Гаусса преобразует матрицу $ mathbf A $ следующим образом:
$$
left( begin{array}{ccccc}
a_{11}& a_{12}& a_{13}& dots & a_{1n} \
a_{12}& a_{22}& a_{23}& dots & a_{2n} \
& dots & & dots & \
a_{1n}& a_{2n}& a_{3n}& dots & a_{nn}
end{array}
right)
rightarrow
left(begin{array}{llll}
a_{11}&a_{12}&dots&a_{1n}\
0&a_{22}^{[1]}& dots &a_{2n}^{[1]}\
&dots & & dots \
0&a_{n2}^{[1]}&dots &a_{nn}^{[1]}
end{array} right) ;
$$
здесь
$$a_{jk}^{[1]} = a_{jk} — frac{a_{j1}a_{1k}}{a_{11}} ,$$
и предполагается, что $ a_{11}ne 0 $. Видим, что формула формирования
элементов матрицы
$$
left(begin{array}{llll}
a_{22}^{[1]}& dots&a_{2n}^{[1]}\
dots & & dots & \
a_{n2}^{[1]}&dots &a_{nn}^{[1]}
end{array} right)_{(n-1)times (n-1)}
$$
точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того,
поскольку матрица $ {mathbf A} $ симметрична ($ a_{jk}=a_{kj} $), то
и только что полученная матрица оказывается симметричной.
Если $ a_{22}^{[1]} ne 0 $, то к этой новой матрице можно снова применить
ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка.
Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном
виде
$$
left(begin{array}{lllll}
a_{11}&a_{12}&dots&a_{1,n-1} &a_{1n}\
0&a_{22}^{[1]}& dots&a_{2,n-1}^{[1]} &a_{2n}^{[1]}\
& & ddots & & dots \
0 &0 & &a_{n-1,n-1}^{[n-2]}&a_{n-1,n}^{[n-2]} \
0 &0 &dots & 0 &a_{nn}^{[n-1]}
end{array} right)
$$
при условии, что ни одно из чисел на диагонали не обратилось в нуль:
$$a_{11} ne 0, a_{22}^{[1]} ne 0, dots, a_{n-1,n-1}^{[n-2]} ne 0, a_{nn}^{[n-1]} ne 0
.$$
Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет
замену переменных
$$
left{begin{array}{lrrrrr}
y_1=&displaystyle x_1+&frac{a_{12}}{a_{11}}x_2+&dots+&frac{a_{1,n-1}}{a_{11}}x_{n-1}+&
frac{a_{1n}}{a_{11}}x_n \
y_2=&displaystyle &x_2+&dots + &frac{a_{2,n-1}^{[1]}}{a_{22}^{[1]}}x_{n-1}+&
frac{a_{2n}^{[1]}}{a_{22}^{[1]}}x_{n} \
vdots & & & ddots & dots & \
y_{n-1}=&displaystyle & & &x_{n-1}+ &frac{a_{n-1,n}^{[n-2]}}{a_{n-1,n-1}^{[n-2]}}x_n \
y_n=&&&&&x_n
end{array} right. ,
$$
приводящую квадратичную форму к каноническому виду:
$$
a_{11}y_1^2 + a_{22}^{[1]} y_2^2 + dots +a_{n-1,n-1}^{[n-2]} y_{n-1}^2 +
a_{nn}^{[n-1]} y_n^2 .
$$



Именно выбор представления квадратичной формы посредством симметричной матрицы позволил установить взаимосвязь между двумя такими разными задачами как решение системы линейных уравнений и представление квадратичной формы в каноническом виде. Фактически весь дальнейший анализ квадратичной формы сведется к исследованию свойств ее матрицы $ mathbf A $. В теории линейных пространств для подобных соответствий, устанавливаемых между объектами разной природы, вводится понятие изоморфизма.

Явное выражение коэффициентов из последних формул, а также необходимые и достаточные условия существования такой
замены — в терминах миноров матрицы $ mathbf A $ — даются в следующем



ПУНКТЕ

Формула Якоби

Т

Теорема [Якоби]. Квадратичная форма $ f(X)=X^{top}{mathbf A}X $ с симметричной матрицей $ {mathbf A} $, ранг которой равен $ mathfrak r_{} $, а главные миноры $ {det mathbf A_j }_{j=1}^{mathfrak r} $ отличны от нуля, приводится к следующему каноническому виду (формула Якоби3)):

$$
frac{z_1^2}{1 cdot det mathbf A_1} +frac{z_2^2}{det mathbf A_1 cdot det mathbf A_2}
+frac{z_3^2}{det mathbf A_2 cdot det mathbf A_3} +dots+frac{z_{mathfrak r}^2}{det mathbf A_{{mathfrak r}-1} cdot det mathbf A_{mathfrak r}}
$$
Здесь
$$
z_1 =frac{1}{2} partial f / partial x_1, z_2=
frac{1}{2}
left|
begin{array}{ll}
a_{11} & partial f / partial x_1 \
a_{12} & partial f / partial x_2
end{array}
right|,
z_3=
frac{1}{2}
left|
begin{array}{lll}
a_{11} & a_{12} & partial f / partial x_1 \
a_{12} & a_{22} & partial f / partial x_2 \
a_{13} & a_{23} & partial f / partial x_3
end{array}
right|, dots ,
$$
$$
qquad qquad
z_{mathfrak r}=
frac{1}{2}
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,mathfrak r-1} & partial f / partial x_1 \
a_{12} & a_{22} & dots & a_{2,mathfrak r-1} & partial f / partial x_2 \
dots & & & dots & dots \
a_{1,mathfrak r } & a_{2,mathfrak r } & dots & a_{mathfrak r-1,mathfrak r } & partial f / partial x_{mathfrak r}
end{array}
right|
$$

Доказательство



ЗДЕСЬ.

П

Пример. Для квадратичной формы
$$ f(x_1,x_2,x_3,x_4)=
$$

$$
=4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4
$$
имеем:
$$
mathbf A=
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
-2 & 2 & 2 & 0 \
-2 & 2 & 1 & -2 \
2 & 0 & -2 & 1
end{array}
right) quad , left{det mathbf A_jright}_{j=1}^4=left{4,4,-4,-12right}
$$
и
$$z_1=frac{1}{2} (8,x_1-4,x_2-4,x_3+4,x_4)=4,x_1-2,x_2-2,x_3+2,x_4 ; $$
$$z_2=frac{1}{2}
left|
begin{array}{rl}
4 & 8,x_1-4,x_2-4,x_3+4,x_4 \
-2 & -4,x_1+4,x_2+4,x_3
end{array}
right|=4,x_2+4,x_3+4,x_4 ;
$$
$$
z_3=
frac{1}{2} left|
begin{array}{rrl}
4 & -2 & 8,x_1-4,x_2-4,x_3+4,x_4 \
-2 & 2 & -4,x_1+4,x_2+4,x_3
\
-2 & 2 & -4,x_1+4,x_2+2,x_3-4,x_4
end{array}
right|=-4,x_3-8,x_4 ;
$$
$$
z_4=
frac{1}{2}
left|
begin{array}{rrrl}
4 & -2 & -2 & 8,x_1-4,x_2-4,x_3+4,x_4 \
-2 & 2 & 2 & -4,x_1+4,x_2+4,x_3 \
-2 & 2 & 1 & -4,x_1+4,x_2+2,x_3-4,x_4
\
2 & 0 & -2 & 4,x_1-4,x_3+2,x_4
end{array}
right|= -12,x_4 .
$$
$$ fequiv frac{(4,x_1-2,x_2-2,x_3+2,x_4)^2 }{1cdot 4}+frac{(4,x_2+4,x_3+4,x_4)^2 }{4cdot 4}+frac{(-4,x_3-8,x_4)^2 }{4cdot (-4)}+
$$
$$
+frac{(-12,x_4 )^2 }{(-4)cdot (-12)} .
$$
Обратим внимание, что замена переменных в настоящем примере имеет треугольный вид:
$$
left(
begin{array}{l}
z_1 \ z_2 \ z_3 \ z_4
end{array}
right)
=
left(begin{array}{rrrr}
4 & -2 & -2 & 2 \
& 4 & 4 & 4 \
& & -4 & -8 \
& & & -12
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3 \ x_4
end{array}
right) , .
$$



Легко убедиться, что это — проявление общего правила. Выражение для
$$
z_{k}=
frac{1}{2}
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & partial f / partial x_1 \
a_{12} & a_{22} & dots & a_{2,k-1} & partial f / partial x_2 \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & partial f / partial x_{k}
end{array}
right|
$$
при $ k in {1,dots, mathfrak r} $ преобразуем следующим образом: из последнего столбца определителя
$$
=
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{11}x_1+a_{12}x_2+dots+ a_{1,k-1} x_{k-1}+a_{1k}x_k+dots+a_{1n}x_n \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{21}x_1+a_{22}x_2+dots+ a_{2,k-1} x_{k-1}+a_{2k}x_k+dots+a_{2n}x_n \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{k1}x_1+a_{k2}x_2+dots+ a_{k,k-1} x_{k-1}+a_{kk}x_k+dots+a_{kn}x_n
end{array}
right|
$$
вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_{k-1} $. В результате получим линейную форму
$$
z_k=
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{1k} \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{2k} \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{kk}
end{array}
right|x_k + dots +
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{1n} \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{2n} \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{kn}
end{array}
right|x_n , ,
$$
не зависящую от $ x_1,dots, x_{k-1} $. Коэффициент же при $ x_k $ равен $ det mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.

=>

Квадратичная форма $ f(X)=X^{top}{mathbf A}X $ с симметричной матрицей $ {mathbf A} $, ранг которой равен $ mathfrak r_{} $, а главные миноры $ {det mathbf A_j }_{j=1}^{mathfrak r} $ отличны от нуля, приводится к следующему каноническому виду:

$$
y_1^2 det mathbf A_1 + y_2^2frac{det mathbf A_2}{ det mathbf A_1}
+y_3^2frac{det mathbf A_3}{det mathbf A_2} +dots+y_{mathfrak r}^2 frac{det mathbf A_{mathfrak r}}{det mathbf A_{mathfrak r-1}} ;
$$
при этом линейные относительно переменных $ x_1,dots,x_n $ формы $ {y_j }_{j=1}^{mathfrak r} $ выражаются по формулам
$$
left{
begin{array}{lrrrrrr}
y_1=&displaystyle x_1+&tilde c_{12}x_2& &+dots+&tilde c_{1,n-1}x_{n-1}+&tilde c_{1n}x_n \
y_2=&displaystyle &x_2+& & dots + &tilde c_{2,n-1}x_{n-1}+&tilde c_{2n}x_{n} \
vdots & & & ddots & & dots & \
y_{mathfrak r}=&displaystyle & & &x_{mathfrak r}+ & dots + & tilde c_{mathfrak r n}x_n
end{array}
right.
$$
Здесь
$$
tilde c_{1j}=a_{1j}/a_{11}, tilde c_{kj}=left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{1j} \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{2j} \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{kj}
end{array}
right| Bigg/ det mathbf A_j , .
$$

При $ mathfrak r = n $ матрица $ tilde C_{} $ из предыдущей формулы становится верхнетреугольной:
$$
Y=tilde C X , ;
$$
при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру — и матрица $ C=tilde C^{-1} $ является матрицей, которая встретилась нам в предыдущем ПУНКТЕ.

T

Теорема. Квадратичная форма $ f(X)=X^{top}{mathbf A}X $ при симметричной неособенной матрице $ {mathbf A} $ приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей

$$
X=CY quad npu C=
left(
begin{array}{llll}
1& c_{12}& dots & c_{1n} \
& 1& dots & c_{2n} \
mathbb O & & ddots & vdots \
& & & 1
end{array}
right)
$$
тогда и только тогда, когда все главные миноры матрицы $ {mathbf A} $ отличны от нуля. Этот канонический вид представлен формулой Якоби
$$
y_1^2 det mathbf A_1 + y_2^2frac{det mathbf A_2}{ det mathbf A_1}
+dots+y_{n}^2 frac{det mathbf A_{n}}{det mathbf A_{n-1}} .
$$

Доказательство
достаточности условия теоремы уже произведено, необходимость доказывается в пункте



LDU-разложение матрицы.

Закон инерции для квадратичных форм

Для заданной квадратичной формы канонические виды, т.е. представления
в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.

Ранг квадратичной формы

Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду:
$$widetilde f(Y)=alpha_1y_1^2+dots+alpha_n y_n^2 .$$
Может так случиться, что часть коэффициентов $ {alpha_j }_{j=1}^n $ обратится в нуль.

Рангом квадратичной формы называется ранг ее матрицы:
$$operatorname{rank} ( f ) = operatorname{rank} ( {mathbf A} ) .$$

Т

Теорема. Ранг квадратичной формы не меняется при невырожденных заменах переменных:

$$ operatorname{rank} (f) = operatorname{rank}( C^{top}{mathbf A}C ) quad npu quad forall C,
det C ne 0 .$$

Доказательство основано на следствии к теореме $ 2 $, приведенной



ЗДЕСЬ: ранг матрицы не меняется при домножении ее на произвольную неособенную.

=>

Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.

Закон инерции

Начиная с этого момента рассматриваем только вещественные квадратичные формы.

Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_{}(X) $ называется ее положительным (соответственно, отрицательным) индексом инерции. Буду обозначать эти индексы4)
$$n_{+}(f) quad mbox{ и } quad n_{-}(f) . $$
Разность5)
$$sigma (f) = n_{+}(f)-n_{-}(f)$$
называется сигнатурой квадратичной формы (а также сигнатурой соответствующей ей симметричной матрицы).

Т

Теорема [закон инерции]. Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.

Эта теорема часто формулируется в виде: «ранг и сигнатура квадратичной формы не зависят…». Эквивалентность этой формулировки исходной очевидно следует из формул
$$ operatorname{rank} (f) = n_{+}(f)+n_{-}(f), sigma (f) = n_{+}(f)-n_{-}(f) . $$

Доказательство



ЗДЕСЬ.

П

Пример. Найти ранг и сигнатуру квадратичной формы $ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 $.

Решение. Приводим квадратичную форму к каноническому виду по методу Лагранжа:
$$f=frac{1}{4} ,(x_1+x_2-x_3)^2 — frac{1}{4} ,(x_1-x_2-x_3)^2 .$$

Ответ. $ operatorname{rank} (f) = 2,, sigma (f)=0 $.

=>

В предположении, что ранг матрицы $ mathbf A_{} $ равен $ mathfrak r_{} $, а ее главные миноры $ { det {mathbf A}_j }_{j=1}^{mathfrak r} $ отличны от нуля, имеем:

$$
n_{+}(f)={mathcal P}(1,det {mathbf A}_1,dots, det {mathbf A}_{mathfrak r}),
n_{-}(f)={mathcal V}(1,det {mathbf A}_1,dots, det {mathbf A}_{mathfrak r}) .
$$
Здесь $ {mathcal P}_{} $ — число знакопостоянств, а $ {mathcal V}_{} $ — число число знакоперемен в последовательности.
Для сигнатуры квадратичой формы также справедлива и формула
$$ sigma (f)= sum_{j=1}^{mathfrak r} operatorname{sign} (det (mathbf A_{j-1}) cdot det (mathbf A_{j}) ) quad npu quad det (mathbf A_{0})=1 $$
и операции $ operatorname{sign} $ определения знака, введенной



ЗДЕСЬ.

Доказательство следует из формулы Якоби.

§

Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ { det {mathbf A}_j }_{j=1}^{mathfrak r} $ имеются нулевые, но не подряд идущие, и $ det {mathbf A}_{mathfrak r} ne 0 $. Если, например,

$$ det (mathbf A_{j}) = 0, det (mathbf A_{j-1}) ne 0, det (mathbf A_{j+1}) ne 0 quad npu quad jin{1,dots, {mathfrak r}-1} ,$$
то сумма
$$ operatorname{sign} (det (mathbf A_{j-1}) cdot det (mathbf A_{j}) )+ operatorname{sign} (det (mathbf A_{j}) cdot det (mathbf A_{j+1}) ) $$
считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ det (mathbf A_{j-1}) $ и $ det (mathbf A_{j+1}) $ имеют противоположные знаки.)

П

Пример. Найти ранг и сигнатуру квадратичной формы

$$f_{{color{Red} alpha }}(x_1,x_2,x_3)=3,x_1^2 -4,x_1x_2-2,x_1x_3 + {color{Red} alpha } , x_2^2 +6, x_2x_3 $$
в зависимости от значений параметра $ {color{Red} alpha } $.

Решение. Сначала пробуем применить формулу из последнего следствия:
$$det {mathbf A}_1=3, det {mathbf A}_2=3, {color{Red} alpha } -4, det {mathbf A}_3=
det {mathbf A}=- {color{Red} alpha } -15 .$$
При $ {color{Red} alpha } notin {4/3,, -15 } $ формула применима при
$ {mathfrak r}=3 $:
$$n_{+}(f)=left{ begin{array}{llr}
2 & npu & {color{Red} alpha } >4/3 ;\
2 & npu & -15<{color{Red} alpha } <4/3 ;\
1 & npu & {color{Red} alpha } < -15 .
end{array} right.
$$
При $ {color{Red} alpha }=4/3 $, по-прежнему, $ {mathfrak r}=3 $, но формула следствия к закону инерции
неприменима. В этом случае приходится действовать по методу Лагранжа:
$$f_{4/3}(x_1,x_2,x_3)=3, left(x_1-frac{2}{3}, x_2 -frac{1}{3}, x_3right)^2-
frac{1}{3}, (x_3-7, x_2)^2+frac{49}{3}x_2^2 .$$
Следовательно, $ n_{+}(f)=2 $. Осталось рассмотреть случай $ {color{Red} alpha } =-15 $,
когда $ {mathfrak r}=2 $. Поскольку условия следствия выполняются, то формула из него применима: $ n_{+}(f)=1 $.

Во всех случаях отрицательный индекс инерции вычисляется по формуле $ n_{-}(f)={mathfrak r}-n_{+}(f) $.

Ответ.
$$
begin{array}{c|c|c}
{color{Red} alpha } & operatorname{rank} (f) & sigma (f) \
hline
< -15 & 3 & -1 \
hline
=-15 & 2 & 0 \
hline
> -15 & 3 & 1
end{array}
$$

Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:


Как меняются ранг и сигнатура при непрерывном изменении параметров?

Пусть квадратичная форма зависит от параметров $ alpha, beta, dots $, причем эта зависимость — полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде
$$ G_1(alpha,beta,dots) > 0, dots, G_n(alpha,beta,dots) > 0 . $$
Здесь $ G_1,dots, G_n $ — полиномы от $ alpha,beta,dots $. Если при некотором наборе значений $ alpha=alpha_0, beta=beta_0, dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ alpha_0+delta_{alpha}, beta_0 + delta_{beta},dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: какое из неравенств системы самое важное? — Оказывается, последнее.

Т

Теорема[2]. Пусть $ f_{{color{Red} alpha }}(x_1,dots,x_n) $ — квадратичная форма, зависящая от параметра $ {color{Red} alpha } $ линейным образом:

$$ f_{{color{Red} alpha }}(x_1,dots,x_n) equiv (1-{color{Red} alpha }) f_{0}(x_1,dots,x_n)+ {color{Red} alpha } f_{1}(x_1,dots,x_n) . $$
Если $ operatorname{rank} (f_{{color{Red} alpha }})=n $ при $ 0 le {color{Red} alpha } le 1 $, то $ n_{+} (f_{0})= n_{+} (f_{1}) $.

Справедливо и более общее утверждение.

Т

Теорема[1,5]. Если при непрерывном изменении коэффициентов формы $ f_{} $ ее ранг $ {mathfrak r}_{} $ остается неизменным, то не изменяется и ее сигнатура $ sigma_{}(f) $.

В случае, когда главные миноры матрицы $ mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать «тяжелую артиллерию» в виде ведущих миноров. Но, по крайней мере, один теоретический результат можно сформулировать немедленно.

Т

Теорема. В произвольной квадратичной форме $ f(X) $ ранга $ mathfrak rge 1 $ можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы $ tilde f(Y) $ в последовательности главных миноров

$$ det widetilde{mathbf A}_1, dots, det widetilde{mathbf A}_{ mathfrak r} $$
не было двух подряд идущих нулевых и $ det widetilde{mathbf A}_{ mathfrak r} ne 0 $.

Конгруэнтность квадратичных форм

Матрицы $ {mathbf A} $ и $ {mathbf B} $, связанные соотношением
$ {mathbf B}=C^{top}{mathbf A}C $ при некоторой неособенной матрице $ C $, называются
конгруэнтными: $ {mathbf A} cong {mathbf B} $. Если, вдобавок, матрицы
$ {mathbf A} $ и $ {mathbf B} $ симметричны, то конгруэнтными называются
и соответствующие им квадратичные формы $ X^{top}{mathbf A}X $ и $ X^{top}{mathbf B}X $.

Т

Теорема. Квадратичные формы $ X^{top}{mathbf A}X $ и $ X^{top}{mathbf B}X $
конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.

Из всего разнообразия канонических видов квадратичной формы
выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду
$$widetilde f(Y)=alpha_1y_1^2+dots+alpha_{mathfrak r} y_{mathfrak r}^2 .$$
то преобразование
$$y_j=frac{z_j}{sqrt{alpha_j}} npu jin {1,dots, {mathfrak r}} ,
y_j=z_j npu jin {{mathfrak r}+1,dots, n }
$$
приводит эту форму к виду
$$
z_1^2+dots + z_{n_{+}(A)}^2 -z_{n_{+}(A)+1}^2 — dots — z_{{mathfrak r}}^2
,
$$
который называется нормальным видом квадратичной формы.

Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности,
в каждом из которых будут находиться только конгруэнтные между собой формы.
Каждый из классов полностью описывается каким-то из своих представителей. Таким
представителем можно взять нормальный вид.

Какое преобразование квадратичной формы оставляет ее инвариантной?

Т

Теорема [Эрмит]. Квадратичная форма $ X^{top}{mathbf A}X $ переходит в себя при преобразовании

$$ X= ({mathbf A}+S)^{-1}({mathbf A}-S) Y $$
где $ S $ означает произвольную кососимметричную матрицу порядка $ n $.

Доказательство. Обозначим
$$ R=({mathbf A}+S)^{-1}({mathbf A}-S) $$
и докажем, что $ R^{top}{mathbf A}R= {mathbf A} $. Используя равенства $ {mathbf A}^{top}={mathbf A} $ ,
$ S^{top}=-S $, получим:
$$ R^{top}{mathbf A}R=({mathbf A}-S)^{top} left(({mathbf A}+S)^{-1}right)^{top}{mathbf A} ({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=({mathbf A}+S)left(({mathbf A}+S)^{top}right)^{-1} {mathbf A}
({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=({mathbf A}+S)({mathbf A}-S)^{-1}left[frac{1}{2}({mathbf A}-S)+ frac{1}{2}({mathbf A}+S)right]({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=frac{1}{2}({mathbf A}+S)({mathbf A}-S)^{-1}({mathbf A}-S)({mathbf A}+S)^{-1}({mathbf A}-S)+frac{1}{2}({mathbf A}+S)({mathbf A}-S)^{-1}({mathbf A}+S)({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=frac{1}{2}({mathbf A}-S)+
frac{1}{2}({mathbf A}+S)={mathbf A} , .
$$



Знакоопределенность

Здесь рассматриваются только вещественные квадратичные формы.

Квадратичная форма $ f_{}(X) $ называется

а) неотрицательной если $ f(X)ge 0 $ для любого $ Xin mathbb R^n $;

б) положительно определенной, если она неотрицательна и $ f(X)= 0 $ только при $ X=mathbb O_{} $;

в) неопределенной или знакопеременной, если существуют $ {X_1,X_2} subset mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2)<0 $.

По аналогии с пунктами а) и б) определяются неположительные и отрицательно определенные квадратичные формы. Иногда неотрицательные или неположительные формы называют полуопределенными.

П

Пример. При $ n_{}=3 $ квадратичная форма

а) $ x_1^2+3x_2^2+4x_3^2 $ является положительно определенной;

б) $ x_1^2+x_3^{2} $ (или $ (x_1+{sqrt 2} x_2-x_3)^{2} $) является неотрицательной, но не положительно определенной;

в) $ -x_1^2 $ является неположительной, но не отрицательно определенной;

г) $ -x_1^2-2,x_2^2-4,x_3^{2} $ является отрицательно определенной;

д) $ x_1x_{2}+x_2x_3 $ является неопределенной.

Какой смысл имеет свойство неотрицательности и положительной определенности с точки зрения математического анализа? — Неотрицательность формы $ f_{}(X) $ означает, что в точке $ X=mathbb O $ эта функция достигает своего минимального значения: $ f(X)ge 0 = f(mathbb O) $; подчеркнем, что этот минимум будет глобальным. В случае положительной определенности точка $ X=mathbb O $ будет единственной точкой пространства $ mathbb R^{n} $, в которой $ f_{}(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 ne mathbb O $, то вследствие однородности формы $ f_{}(X) $ будет выполнено
$$ f(tX_1)=t^2f(X_1)= 0 quad npu quad forall t in mathbb R . $$
Иными словами, свое минимальное значение $ 0_{} $ неотрицательная, но не положительно определенная, форма $ f_{} (X) $ будет принимать на всей прямой, проходящей через точки $ mathbb O $ и $ mathbb X_1 $. Точка $ X=mathbb O $ перестает быть изолированной точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_{} $.
Событие теоретически возможно, но практически немыслимо.

Какой смысл имеет свойство положительной определенности с точки зрения геометрии? — Рассмотрим вещественную квадратичную форму от трех переменных: $ f(x,y,z) $. Поставим задачу определения типа поверхности второго порядка
$$ f(x,y,z)=C $$
при произвольной константе $ Cin mathbb R $. Если $ f $ положительно определена, то это уравнение не имеет вещественных решений при $ C<0 $. При $ C=0 $ уравнение определяет единственную точку в $ mathbb R^3 $, а именно — начало координат. При $ C>0 $
уравнение определяет эллипсоид с центром в начале координат. От всех остальных поверхностей второго порядка эллипсоид отличает его замкнутость (и, как следствие, ограниченность).

Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для однородного полинома (формы) произвольного порядка.

§

Задача об условных экстремумах квадратичной формы $ f_{}(X) $ на сфере $ x_1^2+dots+x_n^2 =1 $ решается



ЗДЕСЬ.

П

Пример. В произвольном евклидовом пространстве $ mathbb E $ квадратичная форма с матрицей Грама произвольной системы векторов $ {X_1,dots,X_m} subset mathbb E $

$$ G(X_1,dots,X_m)=
left(
begin{array}{cccc}
langle X_1,X_1 rangle & langle X_1,X_2 rangle & dots & langle X_1,X_m rangle \
langle X_2,X_1 rangle & langle X_2,X_2 rangle & dots & langle X_2,X_m rangle \
dots & & & dots \
langle X_m,X_1 rangle & langle X_m,X_2 rangle & dots & langle X_m,X_m rangle
end{array}
right)
$$
будет неотрицательной; эта квадратичная форма будет положительно определенной тогда и только тогда, когда система $ {X_1,dots,X_m} $ линейно независима.


Задача.


Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.

Очевидны необходимые условия неотрицательности квадратичной формы
$$ f(X)=displaystyle sum_{1le j le k le n} f_{jk}x_jx_k : $$
все коэффициенты при квадратах переменных должны быть неотрицательными:
$$ f_{11}ge 0, dots , f_{nn}ge 0 . $$
Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_{jk}^{} $ при $ jne k $
равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е.
исследовать ее канонический вид.

Т

Теорема. Ненулевая квадратичная форма, представленная в правильном виде

$$ f(X)=X^{top}{mathbf A}X , , $$
будет неотрицательной тогда и только тогда, когда ее отрицательный индекс инерции равен нулю:
$$ n_{-} ({mathbf A})=0 qquad iff qquad qquad sigma (
{mathbf A})=operatorname{rank} {mathbf A} .$$
Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена: $ det {mathbf A} ne 0 $.

Доказательство



ЗДЕСЬ.

К счастью, явное представление канонического вида квадратичной формы уже имеется — как правило, он задается формулой Якоби. Индексы инерции
вычисляются через знаки главных миноров матрицы квадратичной формы.

Т

Теорема [Сильвестр]. Квадратичная форма

$$
f(X)=X^{top}{mathbf A}X
$$
будет положительно определенной тогда и только тогда, когда все главные миноры ее матрицы положительны:
$$
a_{11}>0, left| begin{array}{cc}
a_{11} & a_{12} \
a_{12} & a_{22}
end{array} right| >0, left| begin{array}{ccc}
a_{11} & a_{12} & a_{13} \
a_{12} & a_{22} & a_{23} \
a_{13} & a_{23} & a_{33}
end{array} right| >0, dots, det {mathbf A} >0 .
$$

Доказательство



ЗДЕСЬ.

=>

Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:

$$
a_{11}<0, left| begin{array}{cc}
a_{11} & a_{12} \
a_{12} & a_{22}
end{array} right| >0, left| begin{array}{ccc}
a_{11} & a_{12} & a_{13} \
a_{12} & a_{22} & a_{23} \
a_{13} & a_{23} & a_{33}
end{array} right| <0, dots, (-1)^ndet {mathbf A} >0 .
$$

В настоящем ресурсе я буду часто говорить об определенности или неопределенности вещественной симметричной матрицы, имея в виду соответствующее свойство порождаемой ею квадратичной формы. Имеется одна особенность в определении симметричной матрицы, задающей неотрицательную квадратичную форму, не являющуюся положительно определенной. Такую матрицу НЕ называют неотрицательной (этот термин закреплен за другим понятием теории матриц); такую матрицу называют положительно полуопределенной6).

П

Пример. Найти все значения параметра $ {color{Red} alpha } $, при которых
квадратичная форма

$$2, x_1^2+2, x_2^2+x_3^2+ 2, {color{Red}{ alpha} } , x_1x_2+6, x_1x_3 +2,x_2x_3 $$
будет положительно определенной.

Решение. Значения главных миноров:
$$det {mathbf A}_1=2, det {mathbf A}_2=4- {color{Red} alpha }^2, det {mathbf A}_3=-{color{Red} alpha }^2+
6, {color{Red} alpha } -16 . $$
Последнее выражение будет отрицательно при любых $ {color{Red} alpha } in mathbb R $.

Ответ. Таких значений нет: $ {color{Red} alpha } in varnothing $.

Можно ли получить условия неотрицательности квадратичной формы:
$$ f(X) ge 0 npu forall X in {mathbb R}^n $$
превращением всех неравенств из критерия Сильвестра в нестрогие: $ > to {color{Red}{ to} } ge $

?

— Вообще говоря, нет.

П

Пример.
Квадратичная форма

$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2=
X^{top} left(
begin{array}{cccc}
1&0&1 &0 \
0&0&0&1 \
1&0&0&0 \
0&1&0&1
end{array} right)X
$$
— неопределенная, т.к. $ f(1,0,-1,0)=-1_{}<0 $, а $ f(1,0,0,0)=1_{}>0 $. Тем не менее, все главные миноры ее матрицы неотрицательны.


Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?

Т

Теорема. Для неотрицательности квадратичной формы $ X^{top} mathbf A X $ необходимо и достаточно, чтобы все ведущие миноры матрицы $ mathbf A $, т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами

$$
Aleft(
begin{array}{lll}
j_1 & dots & j_k \
j_1 & dots & j_k
end{array}
right) , j_1<j_2<dots < j_k
$$
были неотрицательны.

П

Пример. При любой матрице $ A in mathbb R^{mtimes n} $ матрицы

$$ A^{top} A quad mbox{ и } quad A A^{top} $$
являются положительно полуопределенными.

Знакоопределенность на подпространстве

Будем говорить, что квадратичная форма $ f(X) $ положительно определена на подпространстве $ mathbb V_1 $ пространства $ mathbb R^{n} $ если $ f(X)>0 $ при всех $ Xin mathbb V_1, X ne mathbb O $.

Т

Теорема. Пусть линейное подпространство задано системой линейных однородных уравнений

$$
left{ begin{array}{cccc}
h_{11}x_1 & + dots & + h_{1n}x_n&=0, \
dots & & & dots \
h_{k1}x_1 & + dots & + h_{kn}x_n&=0, \
end{array}
right. qquad iff qquad
underbrace{left(
begin{array}{lll}
h_{11} & dots & h_{1n} \
dots & & dots \
h_{k1} & dots & h_{kn}
end{array}
right)}_{=H}X=mathbb O
$$
Здесь $ k<n $ и предполагается, что минор, образованный первыми $ k_{} $ столбцами матрицы $ H_{} $ отличен от нуля, (т.е. $ operatorname{rank} (H)=k $). Тогда необходимым и достаточным условием положительной определенности квадратичной формы $ X^{top} mathbf A X $ на этом подпространстве является то, что все главные миноры матрицы
$$
(-1)^k
left( begin{array}{cc}
mathbb O_{ktimes k} & H \
H^{top} & mathbf A
end{array}
right)_{(n+k)times (n+k)}
$$
порядков $ 2k+1, 2k+2, dots, n+k $ положительны.

Результат приведен в [3] со ссылкой на статью [4], однако у меня есть основания считать, что он был известен еще Борхардту.

Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных

В этом пункте рассматриваются только вещественные квадратичные формы.
Существенно используются материалы из раздела СИММЕТРИЧНАЯ МАТРИЦА и начальный пункт раздела ОРТОГОНАЛЬНАЯ МАТРИЦА.

Т

Теорема. Cуществует замена переменных

$$ X=PY , $$
c ортогональной матрицей $ P_{} $, приводящая квадратичную форму $ f(X)=X^{top} mathbf A X $ к каноническому виду
$$ lambda_1 y_1^2 + lambda_2 y_2^2+ dots + lambda_n y_n^2 ; $$
при этом коэффициентами канонического вида являются собственные числа матрицы $ mathbf A $ (более точно: набор $ { lambda_1,dots, lambda_n } $ составляет спектр матрицы $ mathbf A $).

Доказательство



ЗДЕСЬ.

П

Пример. Найти ортогональную замену переменных, приводящую квадратичную форму

$$ X^{top} mathbf A X quad
npu quad
{mathbf A}=left(begin{array}{rrr}
2 & 2 & -1 \
2 & -1 & 2 \
-1& 2 & 2
end{array}
right)
$$
к каноническому виду.

Решение. Характеристический полином $ det (mathbf A- lambda E)=-(lambda-3)^2(lambda+3) $.
Простому собственному числу $ lambda=-3 $ соответствует собственный вектор
$ {mathfrak X}_1=[1,-2,1]^{^{top}} $, а собственному числу $ lambda=3 $ второй кратности соответствуют
два линейно-независимых собственных вектора $ {mathfrak X}_2=[2,1,0]^{^{top}} $ и
$ {mathfrak X}_3=[-1,0,1]^{^{top}} $. Очевидно, что
$ langle {mathfrak X}_1, {mathfrak X}_2rangle=0 , langle {mathfrak X}_1, {mathfrak X}_3 rangle =0 $, но
$ langle {mathfrak X}_2, {mathfrak X}_3 rangle ne 0 $. Ортогонализуем систему
векторов $ left{{mathfrak X}_2,{mathfrak X}_3right} $:
$${mathfrak Y}_2={mathfrak X}_2, {mathfrak Y}_3={mathfrak X}_3+ {color{Red} alpha } {mathfrak Y}_2
quad mbox{ и } langle {mathfrak Y}_2,{mathfrak Y}_3rangle =0
Longrightarrow {color{Red} alpha }=-frac{langle {mathfrak X}_2,{mathfrak X}_3rangle}
{langle {mathfrak X}_2,{mathfrak X}_2rangle}=frac{2}{5}
$$
и $ {mathfrak Y}_3=left[-1/5, 2/5, 1 right]^{^{top}} $.
После нормирования, получаем ортогональную матрицу
$$
P=left(begin{array}{rrr}
1/sqrt{6} & 2/sqrt{5} & -1/sqrt{30} \
-2/sqrt{6} & 1/sqrt{5} & 2/sqrt{30} \
1/sqrt{6} & 0 & 5/sqrt{30}
end{array}
right) .
$$
Замена переменных $ X=PY $ приводит квадратичную форму $ X^{top} mathbf A X $ к каноническому виду
$$
(y_1,y_2,y_3)
left(begin{array}{rrr}
-3 & 0 & 0 \
0 & 3 & 0 \
0& 0 & 3
end{array}
right)
left(
begin{array}{c}
y_1 \ y_2 \ y_3
end{array}
right)=-3,y_1^2+3,y_2^2+3,y_3^2 .
$$

Поскольку фундаментальную систему решений системы уравнений $ (mathbf A — lambda_j E)X= mathbb O $ для кратного собственного числа $ lambda_j $ можно строить разными способами, то у последней задачи имеется бесконечное
множество ответов. Так, например, в качестве еще одной ортогональной
матрицы можно взять
$$P=left(begin{array}{rrr}
1/sqrt{6} & -1/sqrt{2} & 1/sqrt{3} \
-2/sqrt{6} & 0 & 1/sqrt{3} \
1/sqrt{6}& 1/{sqrt 2} & 1/sqrt{3}
end{array}
right).
$$

Т

Теорема. Если известны коэффициенты характеристического полинома матрицы квадратичной формы $ f(X)=X^{top}mathbf A X $:

$$ det (mathbf A- lambda E) equiv (-1)^n left(lambda^n+a_{1}lambda^{n-1}+ dots + a_n right) , ,$$
то
$$ operatorname{rank} (f(X))={mathfrak r} iff
a_{n}=a_{n-1}=dots=a_{{mathfrak r}+1}=0,a_{{mathfrak r}}ne 0 , . $$
В этом случае будет также выполнено
$$ n_{+} (f(X))={mathcal V}(1,a_1,dots,a_{{mathfrak r}}),quad
n_{-} (f(X))={mathcal P}(1,a_1,dots,a_{mathfrak r}) , , $$
$$ sigma(f(X))=sum_{j=1}^{mathfrak r} operatorname{sign} (a_{j-1}a_j) quad npu quad a_0=1 , . $$

Доказательство основано на правиле знаков Декарта.

Геометрия замен переменных

В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ det (mathbf A — lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде «хорошей» комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.

П

Пример. Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:


Преобразование
$$
y_1=x_1-3/2x_2, y_2=x_2
$$
приводит уравнение к виду
$$ 1/3 y_1^2+1/4 y_2^2=1 ; $$
в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование
$$
begin{array}{ll}
z_1&= sqrt{1/2+1/sqrt{13}},x_1+sqrt{1/2-1/sqrt{13}},x_2,\
z_2&= sqrt{-1/2-1/sqrt{13}},x_1+sqrt{1/2+1/sqrt{13}}x_2
end{array}
$$
приводит уравнение к виду
$$frac{4-sqrt{13}}{6}z_1^2+frac{4+sqrt{13}}{6}z_2^2=1 . $$
В этих координатах кривая имеет вид на рисунке справа.

Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.

Вывод. Метод Лагранжа «дешевле» метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^{top} mathbf A X=1 $. Иными словами, он позволяет «дешевле» определить тип поверхности с точностью до ее формы: например, в $ mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно — однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^{top} mathbf A X=1 $, можно было бы поместить — то здесь без собственных векторов и чисел матрицы $ mathbf A $ не обойтись!

Здесь уместно вспомнить замечание о невырожденности замены переменных, приводящей квадратичную форму к каноническому виду.
В чем заключается его геометрический смыcл? Для ответа на вопрос обратимся к приведенному выше примеру.
Сделаем в квадратичной форме замену переменных зависящей от параметра:
$$ x_1=t_1+alpha t_2, x_2=t_1+t_2 , . $$

На рисунке изображены получаемые в результате такой замены кривые при различных значениях параметра. И если при значениях $ alpha=0.4 $ и $ alpha=0.7 $ мы еще можем визуально распознать эллипс, то значение $ alpha=0.9 $ заставляет подозревать, что соответствующая кривая при сильном растяжении разрывается на два куска, близкие к прямым. Именно это и происходит при $ alpha=1 $. Вместо двух существенных переменных $ x_1 $ и $ x_2 $, у нас остается, фактически, одна, а именно $ t_1 + t_2 $, а нелинейная кривая выродилась в две прямые линии.

Билинейные формы

Задачи

Источники

[1]. Гантмахер Ф.Р. Теория матриц. 4-е изд. М.Наука. 1988.

[2]. Knuth D.E. A permanent inequality. American Math. Monthly, v. 88, N 10, 1981, p.731–740

[3]. Шилов Г.Е. Математический анализ. Конечномерные линейные пространства. М.Наука.1969, с.243

[4]. Шостак Р.Я. О признаке условной определённости квадратичной формы n переменных, подчинённых линейным связям, и о достаточном признаке условного экстремума функций n переменных, УМН, 9:2(60) (1954), 199–206

[5]. Иохвидов И.С. Ганкелевы и теплицевы матрицы и формы. М. Наука. 1974.

[6]. Turnbull H.W. The Theory of Determinants, Matrices and Invariants. Blackie & Sons Ltd. 1929.

Мы
уже говорили о том, что в каждом базисе
линейного пространства

квадратичная форма задается однородным
многочленом второй степени, который
называется видом данной квадратичной
формы.

Каноническим
видом

квадратичной формы называется такой
ее вид, в котором коэффициенты при
произведениях разноименных переменных
равны 0, т. е.

при

.

Нормальным
видом

действительной квадратичной формы
называется такой ее канонический вид,
в котором отличные от нуля коэффициенты
при квадратах равны 1 или –1. Все отличные
от нуля коэффициенты при квадратах
нормального
вида

комплексной квадратичной формы равны
1.

Теорема
5.6.
Для любой
квадратичной формы, заданной на линейном
пространстве

в

существует базис, в котором эта
квадратичная форма имеет канонический
вид, и существует базис, в котором она
имеет нормальный вид.

Или
другая формулировка этой же теоремы:

Для
любой квадратичной формы от n
переменных существует линейное
невырожденное преобразование переменных,
приводящее ее к каноническому виду, и
существует линейное невырожденное
преобразование переменных, приводящее
ее к нормальному виду.

Теорему
5.6 мы докажем позже, а сейчас на примере
покажем, как привести квадратичную
форму к каноническому виду методом,
который называется методом Лагранжа
или выделения полных квадратов. Он
заключается в следующем: выбираем
переменную, коэффициент при квадрате
которой отличен от 0, и выделяем полный
квадрат, включающий в себя все слагаемые
с этой переменной. С этой целью записываем
перед скобкой число, обратное выбранному
коэффициенту, а в скобках – половину
производной по выбранной переменной.
За скобками остается квадратичная
форма, количество переменных которой
уже на единицу меньше, с которой поступаем
также. После конечного числа шагов
получаем канонический вид.

Пример. ▼







где

.
Матрица этого линейного преобразования
запишется так:


.

Как видим,
она невырождена, значит, и преобразование
переменных является невырожденным.
Вводя обозначения


,

получаем
нормальный вид квадратичной формы:

.▲

Замечания.
1.
На самом деле при применении метода
Лагранжа получаем не прямое преобразование,
приводящее квадратичную форму к
каноническому виду, а обратное, т. е.
преобразование, которое выражает не
старые переменные через новые, а наоборот.

2.
Если все коэффициенты при квадратах
исходной квадратичной формы равны нулю,
а отличен от нуля, например, коэффициент
при произведении

,
применим вначале следующее преобразование:

Матрица этого преобразования выглядит
так:


.

Очевидно, она невырождена,
и поэтому, соответствующее преобразование
переменных также будет невырожденным.

Заметим,
что канонический вид квадратичной формы
определяется неоднозначно, тем не менее,
имеет место

Теорема
5.
7
(закон
инерции
).
Все канонические виды одной квадратичной
формы на действительном линейном
пространстве имеют одинаковое число
положительных коэффициентов и одинаковое
число отрицательных коэффициентов.
Нормальный вид квадратичной формы
определяется однозначно с точностью
до порядка следования коэффициентов.

►Доказательство
достаточно провести для нормального
вида.

Пусть
в базисе

линейного пространства

квадратичная форма

имеет вид


,
(5.21)

а
в базисе

– вид


.
(5.22)

Так
как

,
то достаточно показать, что

.
Предположим, что это не так. Пусть,
например,

.
Обозначим


,


.

Так
как

а

,
то сумма

не прямая, поэтому

,
следовательно,


.
Так как

,
то из (5.21) видно, что

Но так как

,
то из (5.22) видно, видно, что

Итак,
мы пришли к противоречию. Таким образом,


.
Аналогично доказывается, что

,
значит,

.◄

Замечание.
Для квадратичных форм на комплексном
линейном пространстве нормальный вид,
очевидно, определяется однозначно, так
как количество отличных от нуля
коэффициентов совпадает с рангом
квадратичной формы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Приведение квадратичной формы к каноническому виду

Говорят, что квадратичная форма имеет канонический вид, если ее матрица диагональная, другими словами, в квадратичной форме имеются только члены с квадратами переменных, а все попарные произведения различных переменных отсутствуют (соответствующие коэффициенты равны нулю):

widetilde{q}(y)= lambda_1y_1^2+ lambda_2y_2^2+ldots+lambda_ny_n^2= y^TLambda y,

(6.11)

где Lambda=operatorname{diag}(lambda_1,lambda_2,ldots,lambda_n) — диагональная матрица, для которой условие симметричности (a_{ij}=a_{ji}) матрицы квадратичной формы, разумеется, выполняется.

Задача приведения квадратичной формы к каноническому виду формулируется следующим образом. Для данной квадратичной формы (6.5) требуется найти такую линейную невырожденную замену переменных (6.8), при которой квадратичная форма принимает канонический вид (6.11). Как показывает следующая теорема, эта задача всегда разрешима. Заметим, что на практике нередко бывает достаточно определить только канонический вид квадратичной формы, не указывая замены переменных.

Теорема 6.1 о приведении квадратичной формы к каноническому виду. Любая квадратичная форма может быть приведена к каноническому виду при помощи некоторой линейной невырожденной замены переменных.

Конструктивное доказательство этой теоремы составляет содержание метода Лагранжа приведения квадратичной формы к каноническому виду.


Метод Лагранжа приведения квадратичной формы к каноническому виду

Для приведения квадратичной формы n переменных

q(x)=a_{11}x_1^2+2a_{12}x_1x_2+ldots+2a_{1n}x_1x_n+a_{22}x_2^2+2a_{23}x_2x_3+ldots+a_{nn}x_n^2

к каноническому виду нужно выполнить следующие действия.

1. Выбрать такую переменную (ведущую), которая входит в квадратичную форму во второй и в первой степени одновременно (если в квадратичной форме есть член с квадратом переменной и с произведением этой переменной на другую переменную), и перейти к пункту 2.

Если в квадратичной форме нет ведущих переменных, то выбрать пару переменных, произведение которых входит в квадратичную форму с отличным от нуля коэффициентом, и перейти к п.3.

Если в квадратичной форме отсутствуют произведения различных переменных, то никаких преобразований делать не надо, так как она уже имеет канонический вид.

2. По ведущей переменной выделить полный квадрат: собрать в квадратичной форме все члены с ведущей переменной, дополнить сумму этих членов до полного квадрата (разумеется, добавленные члены нужно также и вычесть, чтобы не изменилась сумма). Получим сумму полного квадрата некоторой линейной формы (в которую входит ведущая переменная) и квадратичной формы, в которую ведущая переменная не входит. Сделать замену переменных: линейную форму, содержащую ведущую переменную, принять за одну из новых переменных, а все старые переменные, за исключением ведущей, принять за соответствующие новые. Продолжить преобразования с пункта 1.

3. Выбранную пару переменных заменить на разность и сумму двух новых переменных, а остальные старые переменные принять за соответствующие новые переменные. При этом произведение пары выбранных переменных преобразуется к разности квадратов двух новых переменных, т.е. в новой квадратичной форме q(y) будут квадраты переменных с отличными от нуля коэффициентами. Продолжить преобразования новой квадратичной формы с пункта 1.

Идея метода Лагранжа состоит в том, что прием, используемый в п.2 (выделение полного квадрата), исключает одну переменную из числа ведущих. Например, если переменная x_1 — ведущая (т.е. a_{11}ne0 и хотя бы один из коэффициентов a_{12},a_{13},ldots, a_{1n} отличен от нуля), то выделяем полный квадрат по переменной x_1 (собираем все члены с x_1 и дополняем их сумму до полного квадрата):

begin{gathered}q(x)= a_{11}cdot!left[x_1^2+2x_1cdot! left(frac{a_{12}}{a_{11}},x_2+ ldots+frac{a_{1n}}{a_{11}},x_nright)+ left(frac{a_{12}}{a_{11}},x_2+ldots+frac{a_{1n}}{a_{11}},x_nright)^2right]-\ -a_{11}cdot!left(frac{a_{12}}{a_{11}},x_2+ldots+frac{a_{1n}}{a_{11}},x_nright)^2+ a_{22}x_2^2+2a_{23}x_2x_3+ldots+a_{nn}x_n^2. end{gathered}

Выражение, стоящее в квадратных скобках, есть полный квадрат. Поэтому

q(x_1,x_2,ldots,x_n)= a_{11}cdot! left(x_1+frac{a_{12}}{a_{11}},x_2+ldots+ frac{a_{1n}}{a_{11}},x_n right)^2+q_1(x_2,ldots,x_n),

где q_1(x_2,ldots,x_n)= a_{22}x_2^2+2a_{23}x_2x_3+ldots+a_{nn}x_n^2- a_{11}cdot!left(frac{a_{12}}{a_{11}},x_2+ldots+frac{a_{1n}}{a_{11}},x_nright)^2 — квадратичная форма, в которую не входит ведущая переменная x_1+frac{a_{12}}{a_{11}}, x_2+ldots+ frac{a_{1n}}{a_{11}},x_n — линейная форма, содержащая ведущую переменную x_1. Обозначим y_1= x_1+frac{a_{12}}{a_{11}},x_2+ldots+ frac{a_{1n}}{a_{11}},x_n, y_2=x_2,ldots,y_n=x_n, или, что то же самое, сделаем линейную замену переменных:

begin{cases}x_1=y_1-dfrac{a_{12}}{a_{11}},y_2-ldots-dfrac{a_{1n}}{a_{11}},y_n,\ x_2=y_2,\ vdots,\ x_n=y_n.end{cases}

(6.12)

Тогда данная квадратичная форма преобразуется к виду widetilde{q}(y_1,y_2,ldots,y_n)= a_{11}y_1^2+q_1(y_2,ldots,y_n).

Заметим, что в результате этого преобразования все члены, содержащие ведущую переменную x_1 в первой и второй степени, заменены квадратом одной новой переменной y_1. В дальнейших преобразованиях переменная ух уже никогда не будет ведущей.

Многократно применяя этот прием, исключаем одну за другой все ведущие переменные, получая тем самым канонический вид квадратичной формы. Однако выделение полного квадрата невозможно, если в квадратичной форме вообще отсутствуют члены с квадратами переменных. В этом случае применяется способ, описанный в п.3, который порождает члены с квадратами переменных.

Например, в п. 1 выделена пара переменных x_1 и x_2, произведение которых входит в квадратичную форму с отличным от нуля коэффициентом (a_{12}ne0). Тогда нужно сделать замену переменных

begin{cases}x_1=y_1-y_2,\ x_2=y_1+y_2,\x_3=y_3,\vdots,\x_n=y_n.end{cases}

(6.13)

При этом получим новую квадратичную форму widetilde{q}(y), в которой появятся квадраты новых переменных с отличными от нуля коэффициентами, так как в результате замены член 2a_{12}x_1x_2 преобразуется к виду

2a_{12}x_1x_2= 2a_{12}(y_1-y_2)(y_1+y_2)= 2a_{12}y_1^2-2a_{12}y_2^2,

а других членов с y_1^2 в новой квадратичной форме не будет.

Заметим, что при помощи метода Лагранжа не только находится канонический вид, но и определяется искомая невырожденная замена переменных. В самом деле, замены переменных (6.12), (6.13), которые производятся в п.2, 3 алгоритма, это линейные замены с матрицами

S_1=begin{pmatrix}1&-dfrac{a_{12}}{a_{11}}&cdots&-dfrac{a_{1n}}{a_{11}}\ 0&1&cdots&0\ vdots&vdots&ddots&vdots\ 0&0&cdots&1 end{pmatrix}!,quad S_2=begin{pmatrix}1&-1&0&cdots&0\ 1&1&0&cdots&0\ 0&0&1&cdots&0\ vdots&vdots&vdots&ddots&vdots\ 0&0&0&cdots&1 end{pmatrix}!.

(6.14)

Определители матриц отличны от нуля (det{S_1}=1,~det{S_2}=2). Следовательно, эти замены переменных невырожденные. Выполняя п.2, 3 алгоритма, можно определить матрицы используемых замен переменных. В результате их перемножения (в порядке нахождения) получается матрица искомой замены (согласно свойству 2 линейных замен переменных).

Пример 6.8. Привести квадратичную форму q(x)=x_1^2+2x_1x_2-2x_1x_3+x_2^2-x_2x_3+x_3^2 к каноническому виду.

Решение

1(1). В данную квадратичную форму переменная x_1 входит в первой и второй степенях одновременно. Выбираем ее в качестве ведущей.

2(1). По ведущей переменной (x_1) выделяем полный квадрат:

begin{gathered}q(x)=x_1^2+2x_1x_2-2x_1x_3+x_2^2-x_2x_3+x_3^2= Bigl[x_1^2+ 2x_1(x_2-x_3)+(x_2-x_3)^2Bigr]-\ -(x_2-x_3)^2+x_2^2-x_2x_3+x_3^2= (x_1+x_2-x_3)^2+x_2x_3. end{gathered}

Обозначим y_1=x_1+x_2-x_3,~y_2=x_2,~y_3=x_3, тогда получим новую квадратичную форму widetilde{q}(y_1,y_2,y_3)=y_1^2+y_2y_3. Продолжим преобразования, переходя к п. 1 алгоритма.

1(2). В квадратичной форме widetilde{q}(y_1,y_2,y_3)=y_1^2+y_2y_3 нет ведущих переменных, поскольку каждая переменная входит в форму либо во второй степени, либо в первой, но не в первой и второй степенях одновременно. Однако имеется произведение y_2y_3 разных переменных. Переходим к п.3 алгоритма.

3(1). Заменяем выбранную пару переменных y_2=z_2-z_3,~y_3=z_2+z_3. Оставшуюся старую переменную y_1 принимаем за соответствующую новую y_1=z_1. Получаем квадратичную форму

widetilde{widetilde{q}}(z_1,z_2,z_3)= z_1^2+(z_2-z_3)(z_2+z_3)=z_1^2+z_2^2-z_3^2.

Переходим к пункту 1 алгоритма.

1(3). В квадратичной форме widetilde{widetilde{q}}(z_1,z_2,z_3)= z_1^2+z_2^2-z_3^2 нет ведущих переменных (все переменные входят в форму во второй степени), кроме того, нет произведений различных переменных. Следовательно, квадратичная форма имеет канонический вид диагональной матрицей Lambda= operatorname{diag}(1,1,-1)..

Найдем теперь невырожденную линейную замену переменных, приводящую данную форму к каноническому виду. В пунктах 2(1) и 3(1) решения выполнялись замены x=S_1y и y=S_2z с матрицами

S_1=begin{pmatrix}1&-1&1\0&1&0\0&0&1end{pmatrix}!,qquad S_2=begin{pmatrix}1&0&0\0&1&-1\0&1&1end{pmatrix}!.

Следовательно, матрица S искомой замены x=Sz находится как произведение

S=S_1cdot S_2= begin{pmatrix}1&-1&1\0&1&0\0&0&1end{pmatrix}!cdot! begin{pmatrix}1&0&0\0&1&-1\0&1&1end{pmatrix}= begin{pmatrix}1&0&2\ 0&1&-1\ 0&1&1 end{pmatrix}!.

Получим матрицу Lambda квадратичной формы, приведенной к каноническому виду по формуле (6.10): Lambda=S^TAS, где A — матрица заданной квадратичной формы (см. примеры 6.4, 6.5). Имеем

Lambda=S^TAS= begin{pmatrix}1&0&0\0&1&1\2&-1&1end{pmatrix}!cdot! begin{pmatrix}1&1&-1\1&1&-1/2\ -1&-1/2&1end{pmatrix}!cdot! begin{pmatrix}1&0&2\ 0&1&-1\ 0&1&1end{pmatrix}= begin{pmatrix}1&0&0\0&1&0\0&0&-1end{pmatrix}!,

то есть Lambda=operatorname{diag}(1,1,-1) что соответствует найденному каноническому виду.

Замечания 6.4

1. Канонический вид квадратичной формы определен неоднозначно, так как зависит от последовательности выбора ведущих переменных. Сделав, например, замену переменных y_i=alpha_iz_i~(i=1,ldots,n) в (6.11), получим другую квадратичную форму, которая тоже имеет канонический вид.

2. Элементы матрицы невырожденной линейной замены переменных, приводящей квадратичную форму к каноническому виду, вычисляются при помощи арифметических операций по коэффициентам квадратичной формы. Поэтому, если коэффициенты квадратичной формы рациональные, действительные, комплексные, то и коэффициенты линейной замены рациональные, действительные, комплексные соответственно.


Метод Якоби приведения квадратичной формы к каноническому виду

Рассмотрим еще один метод приведения квадратичной формы к каноническому виду, который учитывает особенности преобразования (6.10) матрицы квадратичной формы при линейной замене переменных.

Две квадратные матрицы A и A' одного и того же порядка называются конгруэнтными, если существует такая невырожденная матрица S, что A'=S^TAS. Конгруэнтными, например, являются матрицы квадратичных форм, получающиеся при невырожденной замене переменных (6.8), так как они связаны равенством (6.10).

Напомним, что главными минорами квадратной матрицы называются миноры, составленные из ее элементов, стоящих на пересечении строк и столбцов с одинаковыми номерами. Например, M_{i_1i_2ldots i_k}^{i_1i_2ldots i_k} — главный минор k-го порядка (1leqslant i_1&lt;i_2&lt;ldots&lt;i_kleqslant n,~1leqslant kleqslant n) квадратной матрицы n-го порядка. Угловыми минорами квадратной матрицы A (n-го порядка) называются следующие главные миноры

Delta_1=M_1^1=a_{11},~ Delta_2= M_{1,2}^{1,2}= begin{vmatrix}a_{11}&a_{12}\ a_{21}&a_{22} end{vmatrix},~ldots,~ Delta_k=M_{1,2,ldots,k}^{1,2,ldots,k},~ ldots,~ Delta_n= M_{1,2,ldots,n}^{1,2,ldots,n}=det{A},,

где угловой минор Delta_k= M_{1,2,ldots,k}^{1,2,ldots,k} k-го порядка составлен из элементов матрицы A, стоящих на пересечении первых k строк и первых k столбцов матрицы A, т.е.

begin{pmatrix}a_{11}&a_{12}&cdots&a_{1n}\ a_{21}&a_{22}&cdots&a_{2n}\ vdots&vdots&ddots&vdots\ a_{n1}&a_{n2}&cdots&a_{nn}end{pmatrix}!.


Свойства конгруэнтных матриц

1. Конгруэнтные матрицы имеют равные ранги. В самом деле, ранг произведения матрицы A на невырожденную матрицу S и S^T равен рангу матрицы A (см. следствие теоремы 3.5).

2. Матрица, конгруэнтная симметрической матрице, также является симметрической. Действительно, если A=A^T и A'=S^TAS, то

(A')^T= (S^Tcdot Acdot S)^T= S^Tcdot A^Tcdot (S^T)^T= S^Tcdot Acdot S=A'.

3. Определители действительных конгруэнтных матриц имеют одинаковые знаки. В частности, если A'=S^TAS и det{S}=1, то det{A'}=det{A}. В самом деле, из равенства A'=S^TAS и свойства 1 определителя следует, что det{A'}=det{S^T}det{A}det{S}= det{A}(det{S})^2, т.е. знаки величин det{A'} и det{A} совпадают. Если же det{S}=1, тo det{A'}=det{A}.

4. Если квадратные матрицы A и A' связаны соотношением A'=S^TAS, где матрица S — верхняя треугольная с единицами на главной диагонали

S=begin{pmatrix}1&ast&cdots&ast\ 0&1&cdots&ast\ vdots&vdots&ddots&vdots\ 0&0&cdots&1end{pmatrix}!,

(6.15)

то все угловые миноры матриц A и A' равны, где в (6.15) звездочкой (ast) обозначаются любые числа.

Действительно, разобьем квадратные матрицы A,,S и A' на блоки, выделив в каждой квадратный блок в первых k строках и первых k столбцах:

A'=S^TAS= begin{pmatrix}S_k^T!!&vline!!&O\hline ast!!&vline!!&astend{pmatrix}!cdot! begin{pmatrix}A_k!!&vline!!&ast\hline ast!!&vline!!&ast end{pmatrix}!cdot! begin{pmatrix} S_k!!&vline!!&ast\hline ast!!&vline!!&ast end{pmatrix}= begin{pmatrix} S_k^TA_kS_k!!&vline!!&ast\hline ast!!&vline!!&ast end{pmatrix}= begin{pmatrix}A'_k!!&vline!!&ast\hline ast!!&vline!!&ast end{pmatrix}!.

Здесь O — нулевые матрицы соответствующих размеров, а звездочкой (ast) обозначаются блоки соответствующих размеров, значения элементов которых для доказательства не существенны и могут быть любыми. Получили, что A'_k=S_k^TA_kS_k. Учитывая, что det{S_k}=1 для любого k=1,ldots,n, по свойству 3 имеем

Delta'_k=det{A'_k}= det{S_k^T}cdotdet{A_k}cdotdet{S_k}= det{A_k}=Delta_k

т.е. угловые миноры Delta'_k и Delta_k матриц A' и A равны для любого k=1,2,ldots,n.

Замечания 6.5

1. Линейная невырожденная замена переменных не изменяет ранга квадратичной формы. Это следует из свойства 1 конгруэнтных матриц.

2. Ранг квадратичной формы равен количеству отличных от нуля коэффициентов lambda_1,lambda_2,ldots,lambda_n в ее каноническом виде (6.11). Действительно, согласно предыдущему пункту operatorname{rg}A=operatorname{rg}Lambda, но ранг диагональной матрицы Lambda=operatorname{diag}(lambda_1, lambda_2,ldots, lambda_n) равен количеству ненулевых ее элементов.


Теорема 6.2 Якоби о каноническом виде квадратичной формы. Если квадратичная форма q(x)=sum_{i=1}^{n}sum_{j=1}^{n}a_{ij}x_ix_j=x^TAx имеет ранг r=operatorname{rg}A и ее угловые миноры отличны от нуля:

Delta_1=a_{11}ne0,quad Delta_2=begin{vmatrix}a_{11}&a_{12}\ a_{21}&a_{22}end{vmatrix}ne0,quad ldots,quad Delta_r=M_{1,2ldots r}^{1,2ldots r}ne0,

(6.16)

то ее можно привести к каноническому виду

widetilde{q}(y)= lambda_1y_1^2+lambda_2y_2^2+ldots+lambda_ry_r^2quad left(lambda_i= frac{Delta_i}{Delta_{i-1}},~i=1,ldots,r,~ Delta_0=1right)

(6.17)

при помощи линейной замены переменных x=Sy с верхней треугольной матрицей S вида (6.15).

Действительно, применяя метод Лагранжа, выбираем первую переменную x_1 в качестве ведущей (Delta_1=a_{11}ne0) и выделяем по ней полный квадрат. Другими словами, делаем линейную замену переменных (6.12). Этой замене соответствует матрица S_1 в (6.14), которая является верхней треугольной вида (6.15). Получим квадратичную форму с матрицей

A'=S_1^TAS_1= begin{pmatrix}a_{11}!!&vline!!&0&0&cdots\ 0!!& vline!!&a'_{22}&ast&cdots\ 0!!&vline!!&ast&ast&cdots\ vdots!!&vline!!& vdots&vdots&ddots end{pmatrix}!,

где звездочкой (ast) обозначены некоторые элементы матрицы A'. Заметим, что матрица S_1 — верхняя треугольная с единицами на главной диагонали. Тогда по свойству 4 конгруэнтных матриц, получаем Delta_2=Delta'_2, следовательно Delta_2=a_{11}a'_{22}=Delta_1a'_{22}. Отсюда a'_{22}= frac{Delta_2}{Delta_1} ne0. Значит, вторую переменную можно взять в качестве ведущей и выделить по ней полный квадрат. Для этого делаем линейную замену переменных с матрицей вида (6.15) и т.д. Условия (6.16) обеспечивают возможность применения пункта 2 метода Лагранжа r раз. В результате описанных действий получается канонический вид (6.17). Формулы (6.17) для вычисления Lambda_i следуют из свойства 4 конгруэнтных матриц. Так как угловые миноры матриц A и Lambda= operatorname{diag}(lambda_1,lambda_2,ldots,lambda_n) соответственно равны (по свойству 4 конгруэнтных матриц), то

Delta_1=lambda_1,~Delta_2=lambda_1lambda_2,~ ldots,~ Delta_r=lambda_1cdotldotscdotlambda_r. Отсюда lambda_1=Delta_1,~ lambda_2=frac{Delta_2}{Delta_1},~ldots~ lambda_r= frac{Delta_r}{Delta_{r-1}}.

Остальные угловые миноры равны нулю Delta_{r+1}=ldots=Delta_n, так как operatorname{rg}A=r.

Таким образом, для нахождения канонического вида квадратичной формы методом Якоби необходимо выполнить следующие действия.

1. Составить матрицу A (n-го порядка) квадратичной формы.

2. Найти первые r отличных от нуля угловых миноров матрицы квадратичной формы. Если Delta_1ne0,Delta_2ne0,ldots,Delta_nne0, то перейти к пункту 3, положив r=n. Если Delta_{11}=a_{11}=0, то процесс закончить, так как метод Якоби неприменим. Если Delta_1ne0,Delta_2ne0,ldots,Delta_rne0 и Delta_{r+1}=0, где 0leqslant rleqslant n-1, то найти отличный от нуля минор (r+l)-порядка, окаймляющий минор Delta_rne0. Если такого минора нет, то перейти к пункту 3, иначе процесс закончить, так как метод Якоби неприменим.

3. Записать искомый канонический вид (6.17) квадратичной формы

widetilde{q}(y_1,y_2,ldots,y_r)= frac{Delta_1}{Delta_0},y_1^2+ frac{Delta_2}{Delta_1},y_2^2+ ldots+ frac{Delta_r}{Delta_{r-1}},y_r^2quad(Delta_0=1).


Замечания 6.6

1. Алгоритм метода Якоби можно модифицировать, дополнив его перенумерацией переменных. Например, замена x_i на x_j и, одновременно, x_j на x_i (короче, перенумерация x_ileftrightarrow x_j) приводит к перестановке i-й и j-й строк, а также i-го и j-го столбцов матрицы квадратичной формы. Такая замена является линейной невырожденной и не нарушает симметричности матрицы квадратичной формы. При помощи таких двойных перестановок можно любой главный минор симметрической матрицы переместить в левый верхний угол, т.е. сделать его угловым. Например, для матрицы A=begin{pmatrix}0&1\1&1end{pmatrix} квадратичной формы метод Якоби неприменим, так как Delta_1=a_{11}=0. Перенумеровав переменные x_1leftrightarrow x_2, получаем матрицу A'=begin{pmatrix}1&1\1&0 end{pmatrix}, для которой условия (6.16) применимости метода Якоби выполняются.

2. При выполнении условий теоремы 6.2 метод Лагранжа (последовательного выделения полных квадратов) соответствует методу Гаусса приведения матрицы A к ступенчатому виду.

3. При выполнении условий теоремы 6.2 для нахождения матрицы S линейной замены переменных, приводящей квадратичную форму к каноническому виду, нужно выполнить следующие действия:

1) Составить блочную матрицу (Amid E), приписав к матрице A квадратичной формы единичную матрицу тех же размеров.

2) Привести левый блок A к ступенчатому виду A' при помощи элементарных преобразований III типа строк блочной матрицы (Amid E). В результате получить блочную матрицу (A'mid S^T), где S — искомая матрица замены переменных. Элементы главной диагонали матрицы A' равны коэффициентам в квадратичной форме (6.17):

lambda_1=a'_{11},quad lambda_2=a'_{22},quad ldots,quad lambda_r=a'_{rr}.

Пример 6.9. Привести квадратичную форму к каноническому виду методом Якоби

q(x)=x_1^2+2x_1x_2-2x_1x_3+x_2^2-x_2x_3+x_3^2.

Решение

1. Составляем матрицу квадратичной формы (см. пример 6.8): A=begin{pmatrix}1&1&-1\ 1&1&-1/2\-1&-1/2&1end{pmatrix}.

2. Вычисляем угловые миноры Delta_1=1ne0,~Delta_2=begin{vmatrix}1&1\1&1 end{vmatrix}=0. Получили r=1&lt;n. Ищем отличный от нуля минор 2-го порядка, окаймляющий минор Delta_1. Например, M_{{}_{1,2}}^{{}^{1,3}}= begin{pmatrix}1&1\-1&-1/2end{pmatrix}=frac{1}{2}ne0. Следовательно, метод Якоби для рассматриваемой формы применить нельзя.

Воспользуемся перенумерацией переменных (см. пункт 1 замечаний 6.6). Сделаем замену x_1leftrightarrow x_3, т.е. меняем местами 1-ю и 3-ю строки и 1-й и 3-й столбцы матрицы A. Получим матрицу A'=begin{pmatrix}1&-1/2&-1\ -1/2&1&1\ -1&1&1end{pmatrix}. Применяем для нее метод Якоби.

2(1). Вычисляем угловые миноры Delta'_1=1ne0,~ Delta'_2=begin{vmatrix}1&-1/2\ -1/2&1 end{vmatrix}=frac{3}{4}ne0,~ Delta'_3=det{A'}=-frac{1}{4}ne0. Найдено r=3=n отличных от нуля угловых миноров.

3(1). Записываем искомый канонический вид

widetilde{q}(y)=y_1^2+frac{3}{4}y_2^2-frac{1}{3}y_3^2, так как lambda_1=frac{Delta'_1}{Delta'_0}=1,~ Lambda'_2=frac{Delta'_2}{Delta'_1}=frac{3}{4},~ lambda_3=frac{Delta'_3}{Delta'_2}=-frac{1}{3}.

Этот вид отличается от полученного в примере 6.8, что соответствует п.1 замечаний 6.4.

Пример 6.10. Найти матрицу линейной замены переменных, приводящей квадратичную форму к каноническому виду

q(x)=x_1^2-x_1x_2-2x_1x_3+x_2^2+2x_2x_3+x_3^2.

Решение

Составим матрицу квадратичной формы A=begin{pmatrix} 1&-1/2&-1\ -1/2&1&1\ -1&1&1end{pmatrix} (см. пример 6.9 после перенумерации переменных x_1leftrightarrow x_3). Применяем к этой матрице алгоритм, описанный в пункте 3 замечаний 6.6.

1. Составляем блочную матрицу (Amid E)= begin{pmatrix}1&-1/2&-1!!&vline!!&1&0&0\ -1/2&1&1!!&vline!!&0&1&0\ -1&1&1!!&vline!!&0&0&1 end{pmatrix}.

2. Элементарными преобразованиями III типа, выполняемыми над строками блочной матрицы, приводим ее левый блок к ступенчатому виду:

(Amid E)sim begin{pmatrix}1&-1/2&-1!!&vline!!&1&0&0\ 0&3/4&1/2!!& vline!!&1/2&1&0\ 0&1/2&0!!&vline!!&1&0&1 end{pmatrix}sim begin{pmatrix}1&-1/2&-1!!&vline!!&1&0&0\ 0&3/4&1/2!!&vline!!&1/2&1&0\ 0&0&-1/3!!&vline!!&2/3&-2/3&1 end{pmatrix}= begin{pmatrix}A'mid S^Tend{pmatrix}!.

Следовательно, искомая матрица S=begin{pmatrix}1&1/2&2/3\ 0&1&-2/3\ 0&0&1 end{pmatrix}, а коэффициенты квадратичной формы widetilde{q}(y)=y_1^2+ frac{3}{4}y_2^2-frac{1}{3}y_3^2 имеющей канонический вид, являются элементами главной диагонали матрицы A'=begin{pmatrix}1&-1/2&-1\ 0&3/4&1/2\ 0&0&-1/3end{pmatrix}, что совпадает с результатом примера 6.9. Нетрудно проверить равенство S^TAS=Lambda=operatorname{diag}!left(1,,frac{3}{4},-frac{1}{3}right).

Математический форум (помощь с решением задач, обсуждение вопросов по математике).

Кнопка "Поделиться"

Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.

Приведение квадратичной формы к каноническому виду.

Литература: Сборник задач по математике. Часть 1. Под ред А. В. Ефимова, Б. П. Демидовича.

Метод собственных векторов:

Рассмотрим квадратичную форму $A(x,x) =sumlimits_{i,j=1}^na_{i,j}x_ix_j$ в евклидовом пространстве $R^n.$ Так как ее матрица $A=(a_ij)$ симметрична, то она может быть представлена в виде $A=UDU^{T},$ где $D -$ диагональная матрица, на диагонали которой стоят собственные числа матрицы, а $U -$ ортогональная матрица. Столбцы матрицы $U$ являются координатами некоторого ортонормированного базиса $B’=(e_1, …, e_n),$ в котором матрица $A$ имеет диагональный вид $D,$ и, следовательно, квадратичная форма — искомый канонический вид. Соответствующие преобразования координат определяются соотношением $$begin{pmatrix}x_1\vdots\x_nend{pmatrix}=Ubegin{pmatrix}x_1’\vdots\x_n’end{pmatrix}.$$

Пример.

Найти ортогональное преобразование, приводящее следующие формы к каноническому виду, и написать этот канонический вид:

4.213. $11x_1^2+5x_2^2+2x_3^2+16x_1x_2+4x_1x_3-20x_2x_3.$

Решение.

Матрица квадратичной формы имеет вид $$begin{pmatrix}11&8&2\8&5&-10\2&-10&2end{pmatrix}.$$

Найдем собственные числа этой матрицы. Для этого запишем характеристическое уравнение:

$$A-lambda E=begin{pmatrix}11&8&2\8&5&-10\2&-10&2end{pmatrix}-lambdabegin{pmatrix}1&0&0\0&1&0\0&0&1end{pmatrix}=$$ $$=begin{pmatrix}11-lambda&8&2\8&5-lambda&-10\2&-10&2-lambdaend{pmatrix}.$$

$$det(A-lambda E)=begin{vmatrix}11-lambda&8&2\8&5-lambda&-10\2&-10&2-lambdaend{vmatrix}=$$  $$=(11-lambda)(5-lambda)(2-lambda)+2cdot 8cdot (-10)+2cdot 8cdot (-10)-$$ $$-2cdot(5-lambda)cdot 2-(11-lambda)cdot(-10)cdot(-10)-8cdot 8cdot(2-lambda)=$$ $$=-lambda^3+lambda^2(2+5+11)-lambda(10+22+55)+110-160-160-20+$$ $$+4lambda-1100+100lambda-128+64lambda=$$ $$=-lambda^3+18lambda^2+81lambda-1458=-lambda(lambda^2-81)+18(lambda^2-81)=$$ $$=(lambda-9)(lambda+9)(-lambda+18)=0.$$

Отсюда находим собственные числа:

$$lambda_1=9,quad lambda_2=-9, quadlambda_3=18.$$

Далее находим собственные вектора:

 {jumi[*5]}

Собственный вектор для собственного числа $lambda_1=9$ найдем из системы $$(A-lambda E)X=0, Xneq 0, Rightarrow (A-9E)X=0, Xneq 0$$

$$(A-9E)X=begin{pmatrix}11-9&8&2\8&5-9&-10\2&-10&2-9end{pmatrix}begin{pmatrix}x_1\x_2\x_3end{pmatrix}=$$ $$=begin{pmatrix}2x_1+8x_2+2x_3\8x_1-4x_2-10x_3\2x_1-10x_2-7x_3end{pmatrix}=0.$$

Решим однородную систему уравнений:

$$left{begin{array}{lcl}2x_1+8x_2+2x_3=0\ 8x_1-4x_2-10x_3=0\2x_1-10x_2-7x_3=0end{array}right.$$ 

Вычислим ранг матрицы коэффициентов $A=begin{pmatrix}2&8&2\8&-4&-10\2&-10&-7end{pmatrix}$ методом окаймляющих миноров:    

Фиксируем минор отличный от нуля второго порядка $M_2=begin{vmatrix}2&8\8&-4end{vmatrix}=-8-64=-72neq 0.$

Рассмотрим окаймляющий минор третьего порядка:  $begin{vmatrix}2&8&2\8&-4&-10\2&-10&-7end{vmatrix}=56-160-160+16-200+448=0;$

Таким образом ранг матрицы $A$ равен двум.

Выберем в качестве базисного минор $M=begin{vmatrix}2&8\8&-4end{vmatrix}=-72neq 0.$ Тогда, полагая $x_3=c,$ получаем: $$left{begin{array}{lcl}2x_1+8x_2+2c=0\ 8x_1-4x_2-10c=0end{array}right.Rightarrowleft{begin{array}{lcl}2x_1+8x_2=-2c\8x_1-4x_2=10cend{array}right.$$ 

 По правилу Крамера находим $x_1$ и $x_2:$

 $Delta=begin{vmatrix}2&8\8&-4end{vmatrix}=-8-64=-72;$

 $Delta_1=begin{vmatrix}-2c&8\10c&-4end{vmatrix}=8c-80c=-72c;$

 $Delta_2=begin{vmatrix}2&-2c\8&10cend{vmatrix}=20c+16c=36c;$

 $x_1=frac{Delta_1}{Delta}=frac{-72c}{-72}=c;$ $x_2=frac{Delta_2}{Delta}=frac{36c}{-72}=-c/2.$

 Таким образом, общее решение системы $X(c)=begin{pmatrix}c\-c/2\cend{pmatrix}.$

 Из общего решения находим фундаментальную систему решений: $E=X(1)=begin{pmatrix}1\-1/2\1end{pmatrix}.$ 

Соответсвующий ортонормированный собственный вектор: $$e_1’=left(frac{2}{sqrt{4+1+4}},frac{-1}{sqrt{4+1+4}},frac{2}{sqrt{4+1+4}}right)=left(frac{2}{3},frac{-1}{3},frac{2}{3}right).$$

Собственный вектор для собственного числа $lambda_2=-9$ найдем из системы $$(A-lambda E)X=0, Xneq 0, Rightarrow (A+9E)X=0, Xneq 0$$

$$(A+9E)X=begin{pmatrix}11+9&8&2\8&5+9&-10\2&-10&2+9end{pmatrix}begin{pmatrix}x_1\x_2\x_3end{pmatrix}=$$ $$=begin{pmatrix}20x_1+8x_2+2x_3\8x_1+14x_2-10x_3\2x_1-10x_2+11x_3end{pmatrix}=0.$$

Решим однородную систему уравнений:

$$left{begin{array}{lcl}20x_1+8x_2+2x_3=0\ 8x_1+14x_2-10x_3=0\2x_1-10x_2+11x_3=0end{array}right.$$ 

Вычислим ранг матрицы коэффициентов $A=begin{pmatrix}20&8&2\8&14&-10\2&-10&11end{pmatrix}$ методом окаймляющих миноров:    

Фиксируем минор отличный от нуля второго порядка $M_2=begin{vmatrix}20&8\8&14end{vmatrix}=280-64=216neq 0.$

Рассмотрим окаймляющий минор третьего порядка:  $begin{vmatrix}20&8&2\8&14&-10\2&-10&11end{vmatrix}=3080-160-160-56-2000-704=0;$

Таким образом ранг матрицы $A$ равен двум.

Выберем в качестве базисного минор $M=begin{vmatrix}20&8\8&14end{vmatrix}=216neq 0.$ Тогда, полагая $x_3=c,$ получаем: $$left{begin{array}{lcl}20x_1+8x_2+2c=0\ 8x_1+14x_2-10c=0end{array}right.Rightarrowleft{begin{array}{lcl}20x_1+8x_2=-2c\8x_1+14x_2=10cend{array}right.$$ 

 По правилу Крамера находим $x_1$ и $x_2:$

 $Delta=begin{vmatrix}20&8\8&14end{vmatrix}=280-64=216;$

 $Delta_1=begin{vmatrix}-2c&8\10c&14end{vmatrix}=-28c-80c=-108c;$

 $Delta_2=begin{vmatrix}20&-2c\8&10cend{vmatrix}=200c+16c=216c;$

 $x_1=frac{Delta_1}{Delta}=frac{-108c}{216}=-c/2;$ $x_2=frac{Delta_2}{Delta}=frac{216c}{216}=c.$

 Таким образом, общее решение системы $X(c)=begin{pmatrix}-c/2\c\cend{pmatrix}.$

 Из общего решения находим фундаментальную систему решений: $E=X(1)=begin{pmatrix}-1/2\1\1end{pmatrix}.$ 

Соответсвующий ортонормированный собственный вектор: $$e’_2=left(frac{-1}{sqrt{4+1+4}},frac{2}{sqrt{4+1+4}},frac{2}{sqrt{4+1+4}}right)=left(frac{-1}{3},frac{2}{3},frac{2}{3}right).$$

Собственный вектор для собственного числа $lambda=18$ найдем из системы $$(A-lambda E)X=0, Xneq 0, Rightarrow (A-18E)X=0, Xneq 0$$

$$(A-18E)X=begin{pmatrix}11-18&8&2\8&5-18&-10\2&-10&2-18end{pmatrix}begin{pmatrix}x_1\x_2\x_3end{pmatrix}=$$ $$=begin{pmatrix}-7x_1+8x_2+2x_3\8x_1-13x_2-10x_3\2x_1-10x_2-16x_3end{pmatrix}=0.$$

Решим однородную систему уравнений:

$$left{begin{array}{lcl}-7x_1+8x_2+2x_3=0\ 8x_1-13x_2-10x_3=0\2x_1-10x_2-16x_3=0end{array}right.$$ 

Вычислим ранг матрицы коэффициентов $A=begin{pmatrix}-7&8&2\8&-13&-10\2&-10&-16end{pmatrix}$ методом окаймляющих миноров:    

Фиксируем минор отличный от нуля второго порядка $M_2=begin{vmatrix}-7&8\8&-13end{vmatrix}=91-64=27neq 0.$

Рассмотрим окаймляющий минор третьего порядка:  $begin{vmatrix}-7&8&2\8&-13&-10\2&-10&-16end{vmatrix}=-1456-160-160+52+700+1024=0;$

Таким образом ранг матрицы $A$ равен двум.

Выберем в качестве базисного минор $M=begin{vmatrix}-7&8\8&-13end{vmatrix}=27neq 0.$ Тогда, полагая $x_3=c,$ получаем: $$left{begin{array}{lcl}-7x_1+8x_2+2c=0\ 8x_1-13x_2-10c=0end{array}right.Rightarrowleft{begin{array}{lcl}-7x_1+8x_2=-2c\8x_1-13x_2=10cend{array}right.$$ 

 {jumi[*4]}

По правилу Крамера находим $x_1$ и $x_2:$

$Delta=begin{vmatrix}-7&8\8&-13end{vmatrix}=91-64=27;$

$Delta_1=begin{vmatrix}-2c&8\10c&-13end{vmatrix}=26c-80c=-54c;$

$Delta_2=begin{vmatrix}-7&-2c\8&10cend{vmatrix}=-70c+16c=-54c;$

$x_1=frac{Delta_1}{Delta}=frac{-54c}{27}=-2c;$ $x_2=frac{Delta_2}{Delta}=frac{-54c}{27}=-2c.$

Таким образом, общее решение системы $X(c)=begin{pmatrix}-2c\-2c\cend{pmatrix}.$

Из общего решения находим фундаментальную систему решений: $E=X(1)=begin{pmatrix}-2\-2\1end{pmatrix}.$ 

Соответсвующий ортонормированный собственный вектор: $$e’_3=left(frac{-2}{sqrt{4+4+1}},frac{-2}{sqrt{4+4+1}},frac{1}{sqrt{4+4+1}}right)=left(frac{-2}{3},frac{-2}{3},frac{1}{3}right).$$

Таким образом, мы нашли вектора 

$$e_1’=left(frac{2}{3},frac{-1}{3},frac{2}{3}right);$$

$$e_2’=left(frac{-1}{3},frac{2}{3},frac{2}{3}right);$$

$$e_3’=left(frac{-2}{3},frac{-2}{3},frac{1}{3}right).$$ И следовательно, 

$$U=frac{1}{3}begin{pmatrix}2&-1&-2\-1&2&-2\2&2&1end{pmatrix}, quad U^T=frac{1}{3}begin{pmatrix}2&-1&2\-1&2&2\-2&-2&1end{pmatrix}.$$

В базисе $B’=(e_1′, e_2′, e_3′)$ заданная квадратичная форма имеет вид $$A(x, x)=9x_1^2-9x_2^2+18x_3^2,$$ а соответствующее преобразование координат: 

$$x_1=2x_1 ‘-x_2’-2x_3’$$

$$x_2=-x_1 ‘+2x_2’-2x_3’$$

$$x_3=2x_1 ‘+2x_2’+x_3’$$

Ответ: $A(x, x)=9x_1^2-9x_2^2+18x_3^2;$

$$x_1=2x_1 ‘-x_2′-2x_3’;$$

$$x_2=-x_1 ‘+2x_2′-2x_3’;$$

$$x_3=2x_1 ‘+2x_2’+x_3’.$$

Понравилась статья? Поделить с друзьями:
  • Как найти пирамиды в китае
  • Как найти ширину прямоугольника зная его площадь
  • Как найти трех фей в игре винкс
  • Как найти червоточину eve online
  • Как найти свои фото в нете