Как найти индексы инерции квадратичной формы

Закон инерции и знакоопределенность квадратичных форм

Закон инерции вещественных квадратичных форм

Рассмотрим вещественные (действительные) квадратичные формы, коэффициенты которых являются действительными числами, а переменные принимают действительные значения. Любую вещественную форму q(x)=x^TAx можно привести к каноническому виду

widetilde{q}(y)=lambda_1y_1^2+lambda_2y_2^2+ldots+lambda_ny_n^2

(6.18)

при помощи линейной невырожденной замены переменных x=Sy с действительной матрицей S (см. теорему 6.1 и п.2 замечаний 6.4). Коэффициенты lambda_1,lambda_2,ldots,lambda_n квадратичной формы являются действительными числами.

Количество положительных (отрицательных) коэффициентов в каноническом виде (6.18) называется положительным (отрицательным) индексом квадратичной формы, а разность положительного и отрицательного индексов называется сигнатурой квадратичной формы. В примере 6.10 квадратичная форма была приведена к каноническому виду widetilde{q}(y)=y_1^2+frac{3}{4}y_2^2-frac{1}{3}y_3^2. Её положительный индекс p=2, отрицательный индекс равен 1, а сигнатура sigma=2-1=1.

Замечания 6.7

1. Согласно пункту 2 замечаний 6.5 количество ненулевых коэффициентов в (6.18) равно рангу r=operatorname{rg}A квадратичной формы. Перенумеруем переменные так, чтобы в сумме (6.18) первыми были p слагаемых с положительными коэффициентами, затем (r-p) слагаемых с отрицательными коэффициентами, а остальные слагаемые с нулевыми коэффициентами. Всего будет r отличных от нуля слагаемых (lambda_ine0,~i=1,ldots,r). Если сделать невырожденную замену переменных

y_i=begin{cases}dfrac{z_i}{sqrt{|lambda_i|}},&ileqslant r,\ z_i,&i>r.end{cases}

то получим нормальный вид квадратичной формы

widetilde{widetilde{q}}(z)=z_1^2+z_2^2+ldots+z_p^2-z_{p+1}^2-z_{p+2}^2-ldots-z_r^2,

(6.19)

в котором коэффициенты равны либо единице, либо минус единице (переменные z_{r+1},ldots,z_n входят с нулевыми коэффициентами).

2. Из четырех величин: ранта, положительного и отрицательного индексов и сигнатуры, достаточно знать любые две, чтобы вычислить остальные. Например, если известны ранг r и положительный индекс p (см. форму (6.19)), то отрицательный индекс равен (r-p), а сигнатура sigma=p-(r-p)=2p-r.


Теорема 6.3 о законе инерции квадратичных форм. Ранг, положительный и отрицательный индексы, а также сигнатура вещественной квадратичной формы не зависят от действительной невырожденной линейной замены переменных, приводящей квадратичную форму к каноническому виду.

Из теоремы 6.3 следует, что два канонических вида одной и той же квадратичной формы имеют:

а) одинаковое количество ненулевых слагаемых (которое определяется рангом квадратичной формы);

б) одинаковое количество слагаемых одного знака.

В самом деле, пусть квадратичная форма q(x)=x^TAx ранга r приведена к нормальному виду (6.19)

widetilde{q}=y_1^2+y_2^2+ldots+y_m^2-y_{m+1}^2-y_{m+2}^2-ldots-y_{r}^2,

невырожденной заменой переменных x=Ty, а невырожденной заменой переменных x=Sz — к другому нормальному виду:

widetilde{widetilde{q}}(z)=z_1^2+z_2^2+ldots+z_p^2-z_{p+1}^2-z_{p+2}^2-ldots-z_r^2,

причем число r=operatorname{rg}A в этих формулах одно и то же (см. пункт 1 замечаний 6.5). Докажем, что положительные индексы m и p равны. Предположим противное. Пусть p>m. Поскольку замены переменных невырожденные, то T^{-1}x=y и S^{-1}x=z. Рассматривая последние равенства как неоднородные системы уравнений относительно неизвестных x_1,x_2,ldots,x_n, подберем такое ее решение x^O, чтобы выполнялись условия y_1=0,ldots,y_m=0 z_{p+1}=0,ldots,z_n=0. Для этого составим однородную систему, выбрав первые m уравнений из системы T^{-1}x=y и последние (n-p) уравнений системы S^{-1}x=zcolon

begin{cases}(E_mmid O)T^{-1}x=o,\ (Omid E_{n-p})S^{-1}x=o. end{cases}

Получили однородную систему (m+n-p) уравнений с n неизвестными. Так как p>m, то число уравнений меньше количества неизвестных. Поэтому система имеет нетривиальное решение x^One o. Вычислим значение квадратичной формы для этого столбца x^O значений переменных. Для ненулевых столбцов

begin{gathered}y^O=T^{-1}cdot x^O= begin{pmatrix}underbrace{0~,cdots~,0}_{m}& y_{m+1}&cdots&y_n end{pmatrix}^T,\[5pt] z^O=S^{-1}cdot x^O= begin{pmatrix}z_1&cdots&z_p& underbrace{0~,cdots~,0}_{n-p}end{pmatrix}^T,end{gathered}

получаем

q(x^O)=widetilde{q}(y^O)=-y_{m+1}^2-ldots-y_r^2leqslant0 и q(x^O)=widetilde{widetilde{q}}(z^O)=z_1^2+ldots+z_p^2>0,

т.е. q(x^0)leqslant0 и q(x^O)>0 одновременно, чего не может быть. Заметим, что при m=0 и p=n оба неравенства выполняются для любого ненулевого вектора x^O. Следовательно, предположение p>m приводит к противоречию. К аналогичному противоречию приводит предположение p<m. Значит, p=m. Другими словами, положительный индекс квадратичной формы не зависит от способа ее приведения к каноническому виду. Ранг формы также не зависит от выбора невырожденной замены переменных. В силу пункта 2 замечаний 6.7 делаем аналогичный вывод для отрицательного индекса и сигнатуры.


Знакоопределенность вещественных квадратичных форм

Вещественная квадратичная форма q(x)=x^TAx называется положительно (отрицательно) определенной, если q(x)>0 (q(x)<0) для любых xne o. Положительно и отрицательно определенные квадратичные формы называются определенными (знакоопределенными). Если неравенство q(x)geqslant0 (q(x)leqslant0) выполняется для любых значений x, то квадратичная форма называется неотрицательно (неположительно) определенной. В этом случае говорят, что квадратичная форма полуопределенная. Если же квадратичная форма принимает как положительные, так и отрицательные значения, то она называется неопределенной (знакопеременной). Определенность, полуопределенность и неопределенность квадратичных форм обозначается неравенствами

q(x)>0,~~q(x)<0,~~ q(x)geqslant0,~~ q(x)leqslant0,~~ q(x)gtrless0 соответственно.

Поскольку каждой вещественной квадратичной форме соответствует ее матрица, то эта терминология переносится на действительные симметрические матрицы. Например, симметрическая матрица A называется положительно определенной, если такой является квадратичная форма x^TAx. Определенность, полуопределенность и неопределенность симметрической матрицы обозначаются неравенствами

A>0,~~A<0,~~Ageqslant0,~~Aleqslant0,~~Agtrless0 соответственно.


Пример 6.11. Исследовать знакоопределенность квадратичных форм

mathsf{1)}~q(x_1,x_2)=x_1^2-2x_1x_2+2x_2^2;quad mathsf{2)}~q(x_1,x_2)=x_2^2;quad mathsf{3)}~2x_1x_2.

Решение. 1) Выделим полный квадрат по переменной x_1:

q(x_1,x_2)=(x_1-x_2)^2+x_2^2>0 для любого xne o.

Следовательно, данная форма положительно определенная.

2) Квадратичная форма q(x_1,x_2)=x_2^2 не является положительно определенной, так как q(1;0)=0 для x=(1~,0)^Tne o. В силу неравенства q(x_1,x_2)=x_2^2geqslant0 эта форма неотрицательно определенная.

3) Квадратичная форма q(x_1,x_2)=2x_1x_2 неопределенная, так как она может принимать как положительные, так и отрицательные значения. Например, q(1;1)=2>0,~ q(1;-1)=-2<0.


Замечания 6.8

1. Положительно определенная квадратичная форма приводится к нормальному виду (6.19) widetilde{widetilde{q}}(z)=z_1^2+z_2^2+ldots+z_n^2, т.е. p=r=sigma=n — положительный индекс (p), ранг (r) и сигнатура (sigma) равны количеству (n) ее переменных. Отрицательный индекс равен нулю. Согласно теореме 6.3, они не изменяются при невырожденной замене переменных.

2. Дискриминант положительно определенной квадратичной формы больше нуля, т.е. det{A}>0.

Действительно, матрица нормального вида положительно определенной квадратичной формы — единичная (см. пункт 1). Следовательно, матрица A положительно определенной квадратичной формы конгруэнтна единичной матрице E=S^TAS. Следовательно, det{A}cdotdet!^{2}S=1, т.е. det{A}>0.

3. Неотрицательно определенная квадратичная форма приводится к нормальному виду (6.19) widetilde{widetilde{q}}(z)=z_1^2+z_2^2+ldots+z_r^2, то есть p=r=sigma<n — положительный индекс (p), ранг (r) и сигнатура (sigma) равны, но меньше количества переменных. Отрицательный индекс равен нулю.

4. Для отрицательно (неположительно) определенных квадратичных форм справедливы утверждения аналогичные пунктам 1-3, так как знаки форм q(x) и [-q(x)] противоположные.


Критерий Сильвестра

Теорема 6.4 (критерий Сильвестра). Для того чтобы вещественная квадратичная форма q(x)=x^TAx была положительно определенной, необходимо и достаточно, чтобы все угловые миноры ее матрицы были положительны:

Delta_1=a_{11}>0,quad Delta_2=begin{vmatrix}a_{11}&a_{12}\ a_{21}&a_{22} end{vmatrix}>0,quad ldots,quad Delta_n=det{A}>0.

(6.20)

Для отрицательной определенности квадратичной формы необходимо и достаточно, чтобы знаки угловых миноров ее матрицы чередовались, начиная с отрицательного:

Delta_1=a_{11}<0,quad Delta_2=begin{vmatrix}a_{11}&a_{12}\ a_{21}&a_{22} end{vmatrix}>0,quad ldots,quad (-1)^nDelta_n=(-1)^ndet{A}>0.

(6.20)

В самом деле, рассмотрим первое утверждение теоремы (о положительной определенности). Достаточность условий (6.20) следует из теоремы 6.3 (теоремы Якоби), так как при выполнении этих неравенств квадратичная форма приводится к каноническому виду

widetilde{q}(y)= frac{Delta_1}{Delta_0},y_1^2+ frac{Delta_2}{Delta_1},y_2^2+ldots+ frac{Delta_n}{Delta_{n-1}},y_n^2

с положительными коэффициентами при квадратах переменных (Delta_0=1). Ясно, что widetilde{q}(y)>0 для всех yne o, т.е. q(x)=widetilde{q}(S^{-1}x) >0 для всех xne o.

Для доказательства необходимости рассмотрим квадратичную форму q_k(x_1,ldots,x_k)=q(x_1,ldots,x_k,0,ldots,0) переменных x_1,ldots,x_k (1leqslant kleqslant n). Матрица A_k этой формы представляет собой левый верхний блок матрицы A=begin{pmatrix}A_k!!&vline!!&ast\hline ast!!&vline!!&astend{pmatrix} данной квадратичной формы (звездочкой (ast), как обычно, обозначены блоки, не существенные для рассуждений). Из положительной определенности q(x) следует положительная определенность формы q_k(x_1,ldots,x_k). Тогда из пункта 2 замечаний 6.8 следует, что det{A_k}>0, но Delta_k=det{A_k} — угловой минор k-го порядка матрицы A. Таким образом, Delta_k>0 для 1leqslant kleqslant n, что и требовалось доказать. Второе утверждение сводится к первому, если рассмотреть квадратичную форму [-q(x)] (см. пункт 4 замечаний 6.8).


Критерий полуопределенности квадратичной формы

Теорема 6.5 (критерий полуопределенности квадратичной формы). Для того чтобы квадратичная форма q(x)=x^TAx была неотрицательно определенной, необходимо и достаточно, чтобы все главные миноры ее матрицы были неотрицательны.

Для неположительной определенности квадратичной формы необходимо и достаточно, чтобы все главные миноры ее матрицы удовлетворяли условиям:

(-1)^kM_{j_1,j_2,ldots,j_k}^{i_1,i_2,ldots,i_k}geqslant 0

(6.22)

для 1leqslant i_1<i_2<leqslant i_kleqslant n,~ 1leqslant j_1<j_2<leqslant j_kleqslant n,~ 1leqslant kleqslant n.

Условия (6.22) означают, что главные миноры четного порядка должны быть неотрицательны, а нечетного порядка — неположительны. Для доказательства теоремы используется критерий Сильвестра.


Пример 6.12. Выяснить знакоопределенность квадратичных форм с матрицами

A=begin{pmatrix}1&1\1&2end{pmatrix}!,quad B=begin{pmatrix}-1&1\ 1&-1 end{pmatrix}!,quad C=begin{pmatrix}0&1&0\1&0&0\0&0&-1end{pmatrix}!.

Решение. Матрица A — положительно определенная (A>0), так как ее угловые миноры положительны Delta_1=Delta_2=1>0. Следовательно, квадратичная форма q(x)=x^TAx=x_1^2+2x_1x_2+2x_2^2 положительно определенная (см. теорему 6.4). Этот вывод подтверждается выделением полных квадратов: q(x)=(x_1+x_2)^2+x_2^2, т.е. квадратичная форма знакоопределенная.

Матрица B не является положительно или отрицательно определенной, так как ее угловые миноры не удовлетворяют критерию Сильвестра: Delta_1=-1<9,~Delta_2=0. Проверим условия (6.22):

(-1)^1M_{{}_1}^{{}^1}=(-1)^1Delta_1=1geqslant0,quad (-1)^1M_{{}_2}^{{}^2}= (-1)^1cdot(-1)=1geqslant0,quad (-1)^2M_{{}_{1,2}}^{{}^{1,2}}=(-1)^2Delta_2=0.

Условия выполняются, значит, матрица В является неположительно определенной (Bleqslant0). Следовательно, квадратичная форма q(x)=x^TBx неположительно определенная. Этот вывод подтверждается выделением полного квадрата:

q(x)=x^Tcdot Bcdot x=-x_1^2+2x_1x_2-x_2^2= -(x_1-x_2)^2,

т.е. для всех x,,y которых x_1=x_2, справедливо равенство q(x)=0, а для остальных x выполняется неравенство q(x)<0.

Матрица C не является положительно или отрицательно определенной, так как ее угловые миноры не удовлетворяют критерию Сильвестра: Delta_1=0, Delta_2=-1<0, Delta_2=1>0. Кроме того, эти миноры не удовлетворяют критерию полуопределенности (см. теорему 6.5). Следовательно, матрица C неопределенная (Cgtrless0). Тогда и квадратичная форма q(x)=x^TCx=2x_1x_2-x_3^2 неопределенная. Действительно, выпишем

главные миноры первого порядка: M_{1}^{1}=0,~ M_{2}^{2}=0,~ M_{3}^{3}=-1;

главные миноры второго порядка: M_{1,2}^{1,2}=-1,~ M_{1,3}^{1,3}=0,~ M_{2,3}^{2,3}=0;

главный минор третьего порядка: M_{1,2,3}^{1,2,3}=1.

Так как среди них есть хотя бы один отрицательный, то квадратичная форма не является неотрицательно определенной. Поскольку среди главных миноров четного порядка есть отрицательный (среди главных миноров нечетного порядка есть положительный), то квадратичная форма не является неположительно определенной. Нетрудно заметить, что при x_1=x_2=0, x_3=1 q(x)=-1<0, а при x_1=x_2=1, x_3=0 q(x)=2>0, т.е. квадратичная форма принимает как положительные, так и отрицательные значения, следовательно, является знакопеременной (неопределенной).

Математический форум (помощь с решением задач, обсуждение вопросов по математике).

Кнопка "Поделиться"

Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.

Как
было показано ранее, число отличных от
нуля коэффициентов в каноническом виде
квадратичной формы не зависит от вида
преобразования, с помощью которого

приводится к каноническому виду. В
действительности, не меняется число
положительных и отрицательных
коэффициентов. Это свойство называется
законом инерции квадратичных форм. А
именно справедливо:

Теорема
4
(закон
инерции квадратичных форм): Число
слагаемых с положительными (отрицательными)
коэффициентами в каноническом виде
квадратичной формы не зависит от способа
приведения формы к этому виду.

Доказательство:
Пусть форма

с помощью некоторого преобразования
координат

приводится к виду
,
а с помощью другого преобразования того
же вида – к
,
для доказательства теоремы на показать,
что
.

От
противного. Предположим, что
.
Убедимся, что есть ненулевой вектор
:
в новых координатах

и
,
координаты

и

равны нулю, т.е.

Каждое
из этих уравнений имеет вид:

=,

=.

с
известными
.
Так как

уравнений меньше, чем

эти уравнения имеют ненулевое решение


в силу равенства


в новых переменных

,
т.е.

– нулевой вектор, что противоречит
тому, что

– ненулевой

предположение

– неверно

.
В силу симметричности законов приведения


– неверно

.
Что и требовалось доказать. ■

5°. Классификация квадратичных форм.

Определение
6.
Индексом
инерции

квадратичной формы называется число
отличных от нуля коэффициентов
канонического вида (т.е. ранг формы),
положительным (отрицательным) индексом
– число положительных (отрицательных)
коэффициентов.

Очевидно,
что сумма положительных и отрицательных
индексов инерции равна индексу инерции.

Обозначим

– индекс инерции, положительный и
отрицательный индексы соответственно,

.
Тогда квадратичная форма может быть
приведена к виду

в некотором базисе
.

Утверждение
3:
Для того,
чтобы квадратичная форма
,
заданная в
–мерном
пространстве
,
была знакоопределенной, необходимо и
достаточно, чтобы, либо
,
либо
.
Если
,
то форма положительно определена, если


– отрицательно определена.

Доказательство:
приведем для положительно определенной.



– положительно
определена

приводится к виду
,
если
,
то 
,
.


Пусть


и

для


– положительно
определена.

Утверждение
4:
Форма

– знакопеременная

и положительный и отрицательный индексы
отличны от нуля.

Доказательство:

квадратичная форма принимает и
положительные и отрицательные значения

в каноническом виде должны быть как
положительные, так и отрицательные
выражения

.

(10)


Если
справедливо (10), то для
,
,
а для
,


(10) – канонический вид знакопеременной
формы.

Утверждение
5:
Для того,
чтобы

была
квазизнакоопределенной, необходимо и
достаточно, чтобы выполнялись соотношения
либо
,
,
либо
,
.

Доказательство:
Аналогично п. 4

6°. Критерий Сильвестра знакоопределенности квадратичной формы.

(позволяет
исследовать без приведения к каноническому
виду)

Пусть

– квадратичная форма и

– угловые миноры.

Теорема
5
(критерий
Сильвестра): Для того, чтобы квадратичная
форма

была положительно
определена, необходимо и достаточно,
чтобы были выполнены неравенства
.

Для
того чтобы, форма была отрицательно
определенной, необходимо и достаточно,
чтобы знаки угловых миноров чередовались,
причем 1<0

Доказательство:

Докажем в начале, что из условия
знакоопределенности следует, что

 пусть
.
Рассмотрим систему ЛОУ


,
то определитель


система имеет нетривиальное решение.
Пусть

– такое решение. Умножая первое уравнение
на

–е
на

и складывая, получим :
=0,
т.е. получили, что квадратичная форма
на ненулевом векторе

обращается в нуль. Это противоречит
знакоопределенности

,
.
Поэтому можно применить теорему Якоби
(теорема 3) и воспользоваться формулой
для коэффициентов
.
Если

положительно определена, то все
,
так как
,
.

Если


– отрицательно
определенная форма, то



,
т.е. знаки угловых миноров чередуются.


Пусть
выполнены условия, что
,


можно воспользоваться методом Якоби



форма положительно определена.

Если
знаки чередуются и
,
то


форма отрицательно определена. Что и
требовалось доказать. ■

Замечание:
Отрицательный
индекс инерции равен числу перемен
знаков в последовательности определителей
.

53

Соседние файлы в предмете Алгебра и геометрия

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Содержание

Квадратичная форма

$ mathbb A_{} $ означает одно из множеств: $ mathbb Q_{} $ рациональных, или $ mathbb R_{} $ вещественных, или $ mathbb C_{} $ комплексных чисел.

Определение

Квадратичной формой над множеством $ mathbb A_{} $ называют однородный полином второй степени с коэффициентами из $ mathbb A_{} $; если переменные обозначить
$ x_1,dots,x_{n} $, то общий вид квадратичной формы от этих переменных:
$$
f(x_1,dots,x_{n} )= sum_{1le j le k le n} f_{jk}x_jx_k=
$$
$$begin{array}{llll}
displaystyle=
f_{11}x_1^2&+f_{12}x_1x_2&+ dots & +f_{1n}x_1x_n+ \
&+f_{22}x_2^2 &+ dots & +f_{2n}x_2x_n+ \
&+dots & & +dots + \
& & +f_{jk}x_jx_k & + dots+ \
& & &+f_{nn}x_n^2.
end{array}
$$

П

Пример. Функции

$$x_1^2-x_1x_2+x_3^2 , , quad sqrt{3}, x_2^2 — pi, x_3^2
, , quad -x_1x_2 , , quad mathbf i , x_1^2$$
являются квадратичными формами. Функции
$$x_1^2-3, x_1+1 , , quad 5, x_1^2x_2^2 , , quad frac{x_1x_3^2}{x_2}
, , quad sqrt{x_1x_2x_3x_4} $$
не являются квадратичными формами.

Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,dots,x_{n} ) $ имеет канонический вид если
$$f(x_1,dots,x_{n} )equiv f_{11}x_1^2+f_{22}x_2^2+dots+f_{nn}x_n^2 quad npu quad left{f_{jj}right}_{j=1}^n subset mathbb A , $$
т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является «суммой квадратов»1).

Оказывается, что в любой квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.

П

Пример.

$$ 2, x_1^2+4, x_1x_2 +x_2^2 equiv 2, (x_1+x_2)^2-x_2^2 equiv -2,x_1^2 + (2,x_1+x_2)^2 ; $$
$$ x_1^2+2 mathbf i x_1x_2 — x_2^2 equiv (x_1+ mathbf i x_2)^2 ; $$
$$-x_1^2+6,x_1x_2+6,x_1x_3+2,x_2^2+4,x_2x_3+2,x_3^2equiv $$
$$
equiv (x_1+x_2+x_3)^2-2,(x_1-x_2-x_3)^2+3,(x_2+x_3)^2 equiv
$$
$$equiv -(x_1+3,x_2+3,x_3)^2+11,(x_2+x_3)^2 ; $$
$$ x_1x_2 equiv frac{1}{4} (x_1+x_2)^2- frac{1}{4} (x_1-x_2)^2 . $$

А в общем случае:
$$ f(x_1,dots,x_{n} )equiv $$
$$
begin{array}{l}
equiv a_1(c_{11}x_1+c_{12}x_2+dots+c_{1n}x_n)^2 +\
+a_2(c_{21}x_1+c_{22}x_2+dots+c_{2n}x_n)^2+ \
+dots+ \
+a_n(c_{n1}x_1+c_{n2}x_2+dots+c_{nn}x_n)^2
end{array}
$$
при $ {a_j}_{j=1}^n,{c_{jk}}_{j,k=1}^n $ — константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы — например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,dots,x_{n} ) ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы
$$ c_{11}x_1+c_{12}x_2+dots+c_{1n}x_n, c_{21}x_1+c_{22}x_2+dots+c_{2n}x_n,dots, c_{n1}x_1+c_{n2}x_2+dots+c_{nn}x_n $$
были линейно независимыми. При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется каноническим видом квадратичной формы.

Задача. Для произвольной квадратичной формы $ f(x_1,dots,x_{n} ) $ построить (хотя бы один) ее канонический вид.

Поставленная задача имеет существенное значение для анализа

  • геометрии линий второго порядка на плоскости и поверхностей второго порядка в пространстве; например, по набору коэффициентов уравнения, задающего кривую

$$ x^2 -2,xy+3,y^2+x-4,y-15=0 $$
определить к какому типу (эллипс, гипербола, парабола,…) она относится.

Метод Лагранжа приведения квадратичной формы к каноническому виду

Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.



Метод Лагранжа


1.

Пусть $ f_{11}ne 0 $. Выделим в $ f(x_1,dots, x_n)_{} $ все слагаемые, содержащие $ x_{1} $:
$$
f_{11}x_1^2+f_{12}x_1x_2+ dots +f_{1n}x_1x_n+ sum_{2le jle k le n} f_{jk}x_jx_k
=
$$
$$
= f_{11}left(x_1^2+frac{f_{12}}{f_{11}}x_1x_2+dots+
frac{f_{1n}}{f_{11}}x_1x_n right)+dots=
$$
$$
=f_{11}left[ left(x_1+frac{f_{12}}{2f_{11}}x_2+dots+
frac{f_{1n}}{2f_{11}}x_n right)^2-left(frac{f_{12}}{2f_{11}}x_2+dots+
frac{f_{1n}}{2f_{11}}x_n right)^2 right]+dots=
$$
$$
=f_{11} left(x_1+frac{f_{12}}{2f_{11}}x_2+dots+ frac{f_{1n}}{2f_{11}}x_n
right)^2 —
f_{11}left(frac{f_{12}}{2f_{11}}x_2+dots+
frac{f_{1n}}{2f_{11}}x_n right)^2 +dots
$$
В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_{1},x_2,dots,x_n $; все оставшиеся слагаемые не зависят от $ x_{1} $, т.е. составляют квадратичную форму от переменных $ x_{2},dots,x_n $. Таким образом, исходная задача для формы $ n_{} $ переменных оказывается сведенной к случаю формы $ (n-1)_{} $-й переменной; последняя преобразуется по аналогичному принципу.


2.

Если $ f_{11}=0 $, но $ exists k: f_{kk}ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, что выделение полного квадрата начинается с переменной $ x_{k} $ вместо $ x_{1} $ — первая ничем не лучше (и не хуже) $ k_{} $-й!


3.

Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_{11}=dots=f_{nn}=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_{jk}ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_{k} $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_{j} $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к «старой» переменной $ x_{k} $.


П

Пример. Привести форму

$$ f=4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4 $$
к каноническому виду.

Решение.
$$
begin{array}{ccl}
f&=&4left(x_1^2-x_1x_2-x_1x_3+x_1x_4right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\
&=&4bigg[
left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2-
left(-frac{1}{2}, x_2-frac{1}{2}, x_3+frac{1}{2}, x_4right)^2 bigg] + \
&+&2,x_2^2+x_3^2+x_4^2+4,x_2x_3-4,x_3x_4= \
&=&4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+\
& & + Big[left(x_2+x_3+x_4, right)^2- left(x_3+x_4 right)^2Big]-2,x_3x_4 = \
&=&4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2- \
&&-x_3^2-4,x_3x_4-x_4^2= \
&& 4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2- \
&&-Big[
left(x_3+ 2, x_4, right)^2-4, x_4^2Big] -x_4^2 = \
&=&4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2-left(x_3+ 2, x_4, right)^2+3,x_4^2
end{array}
$$

Ответ. $ fequiv 4,left(x_1-frac{1}{2}, x_2-frac{1}{2},x_3+ frac{1}{2},x_4, right)^2+
left(x_2+x_3+x_4, right)^2-left(x_3+ 2, x_4, right)^2+3,x_4^2 $.

П

Пример. Привести форму

$$ f=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 $$
к каноническому виду.

Решение.
$$
fequiv (x_1+x_2+3,x_3)^2-(x_2+3,x_3)^2+x_2^2-4,x_3^2+4,x_2x_3 equiv
$$
$$
equiv (x_1+x_2+3,x_3)^2-2,x_2x_3 -13,x_3^2 equiv
$$
В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_{2} $, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому — в соответствии с пунктом

2

метода —
приходится выделять квадрат на основе переменной $ x_{3} $:
$$ (x_1+x_2+3,x_3)^2-13, left(x_3-frac{1}{13}x_2right)^2+13cdot frac{1}{13^2}x_2^2 . $$

Ответ. $ (x_1+x_2+3,x_3)^2-13, left(x_3-frac{1}{13}x_2right)^2+ frac{1}{13}x_2^2 $.

П

Пример. Привести форму

$$ f=x_1x_2-3,x_1x_3+2,x_2x_3 $$
к каноническому виду.

Решение. Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом

3

метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $:
$$ fequiv -x_1^2+x_1X_2-5,x_1x_3+2,X_2x_3 . $$
Дальнейший ход решения — в соответствии с пунктом

1

метода Лагранжа:
$$
-left(x_1-frac{1}{2}X_2+frac{5}{2}x_3right)^2+left(-frac{1}{2}X_2+frac{5}{2}x_3right)^2+2,X_2x_3 equiv
$$
$$
equiv -left(x_1-frac{1}{2}X_2+frac{5}{2}x_3right)^2+frac{1}{4}X_2^2-frac{1}{2}X_2x_3+frac{25}{4}x_3^2 equiv
$$
$$
equiv -left(x_1-frac{1}{2}X_2+frac{5}{2}x_3right)^2+frac{1}{4}left(X_2-x_3 right)^2+6,x_3^2
$$
Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_{2} $:

Ответ. $ -(frac{1}{2}x_1-frac{1}{2}x_2+frac{5}{2}x_3)^2+frac{1}{4}(x_1+x_2-x_3)^2+6,x_3^2 $.

Метод Лагранжа позволяет получить канонический вид квадратичной формы над тем же множеством $ mathbb A_{} $, над которым рассматривается исходная форма — например, если коэффициенты формы $ f_{} $ являются рациональными, то и коэффициенты ее канонического вида (т.е. числа $ {a_j}_{j=1}^n,{c_{jk}}_{j,k=1}^n $) будут также рациональными.

Матричная форма записи квадратичной формы

В этом и последующих пунктах существенно потребуется знание ключевых понятий ТЕОРИИ МАТРИЦ и ОПРЕДЕЛИТЕЛЕЙ.

Задача. Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением метода Лагранжа.

Прежде всего, соберем все переменные в один вектор, а вернее — в два вектора:
$$
{}_{.} mbox{ столбец переменных } X=
left(begin{array}{l} x_1 \ vdots \ x_n end{array} right) quad mbox{ и строку переменных }
X^{top} = (x_1,dots,x_n) ;
$$
здесь $ {}^{top} $ означает транспонирование. Не очень принципиально, что обозначать через $ X_{} $ — столбец или строку; и хотя сокращение $ f(x_1,dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные
значки…

Если определить верхнетреугольную матрицу $ mathbf F $ равенством:
$$
{mathbf F}= left(
begin{array}{cccc}
f_{11}&f_{12}&dots &f_{1n} \
&f_{22}& dots & f_{2n} \
mathbb O & &ddots & vdots \
& & & f_{nn}
end{array} right),
$$
то квадратичную форму можно записать в виде произведения трех матриц
$$ {}_{.} mbox{ строка переменных } times mbox{ матрица } times mbox{ столбец переменных } $$
$$ f(X)=X^{top} {mathbf F}X .$$
Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_{} $, подбирая разные матрицы

П

Пример. $ f=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 equiv $

$$
equiv (x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 2 & 6 \
0 & 1 & 4 \
0 & 0 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)
equiv (x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 0 & 3 \
2 & 1 & 4 \
3 & 0 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)equiv
$$
$$
equiv (x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 1 & 3 \
1 & 1 & 2 \
3 & 2 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)equiv dots
$$

Из всего этого бесконечного множества представлений выделим одно. Рассмотрим матрицу
$${mathbf A}=frac{{mathbf F}+{mathbf F}^{top}}{2}=
left(
begin{array}{cccc}
f_{11}& 1/2 f_{12}&dots & 1/2 f_{1n} \
1/2 f_{12} &f_{22}& dots & 1/2 f_{2n} \
dots & & & dots \
1/2 f_{1n} & 1/2 f_{2n} & dots & f_{nn}
end{array} right),
$$
которая, очевидно, симметрична: $ {mathbf A}^{top}={mathbf A} $. Тогда
$$
f(X)=sum_{1le j,k le n} a_{jk}x_jx_k=X^{top}{mathbf A}X .
$$
Это представление называют правильной записью квадратичной формы; матрицу $ {mathbf A} $ называют матрицей квадратичной формы $ f_{} $, а $ det mathbf A $ — дискриминантом квадратичной формы:
$$ det A = {mathcal D} (f) . $$
В случае, когда дискриминант равен нулю квадратичная форма называется вырожденной, в противном случае — невырожденной.

П

Пример. Для приведенной выше квадратичной формы

$$ f=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 $$
ее правильной записью будет именно последняя:

$$
fequiv
(x_1,x_2,x_3)
left(
begin{array}{rrr}
1 & 1 & 3 \
1 & 1 & 2 \
3 & 2 & -4
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3
end{array}
right)
$$
Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.

$ x_{1} $ $ x_{2} $ $ x_{3} $
$ x_{1} $ $ f_{11} $ $ frac{1}{2}f_{12} $ $ frac{1}{2}f_{13} $
$ x_{2} $ $ frac{1}{2}f_{12} $ $ f_{22} $ $ frac{1}{2}f_{23} $
$ x_{3} $ $ frac{1}{2}f_{13} $ $ frac{1}{2}f_{23} $ $ f_{33} $

П

Пример. Для

$$ f(x_1,x_2)=a_{11}x_1^2+2, a_{12}x_1x_2+a_{22}x_2^2 $$
имеем:
$$ {mathbf A} =
left(
begin{array}{ll}
a_{11} & a_{12} \
a_{12} & a_{22}
end{array}
right) ; {mathcal D} (f)=a_{11}a_{22}-a_{12}^2 ; $$
последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_{11}x^2+2, a_{12}x+a_{22} $ и это обстоятельство оправдывает использование слова дискриминант для нового объекта…

Матрица квадратичной формы совпадает с половиной матрицы Гессе этой формы: $ mathbf A = 1/2 H(f) $.

Причина, по которой из бесконечного многообразия матричных представлений квадратичной формы выделяется именно то, что использует симметричную матрицу, остается пока непонятной. Отложив ненадолго обсуждение этой причины, попробуем переписать в матричных терминах приведение квадратичной формы к каноническому виду.

Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_{1},dots,x_{n} $ к новым переменным $ y_{1},dots,y_{n} $. Ограничимся только линейными заменами вида
$$
left{ begin{array}{ccc}
x_1&=&c_{11}y_1+c_{12}y_2+dots+c_{1n}y_n, \
x_2&=&c_{21}y_1+c_{22}y_2+dots+c_{2n}y_n, \
dots & & dots \
x_n&=&c_{n1}y_1+c_{n2}y_2+dots+c_{nn}y_n.
end{array}
right.
$$
Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных
$$
C=
left( begin{array}{llcl}
c_{11} & c_{12} & dots & c_{1n} \
c_{21} & c_{22} & dots & c_{2n} \
dots & & & dots \
c_{n1} & c_{n2} & dots & c_{nn} \
end{array}
right) ;
$$
которая позволяет переписать саму замену переменных в матричном виде
$$
left(begin{array}{l} x_1 \ x_2 \ vdots \ x_n end{array} right)=
left( begin{array}{llcl}
c_{11} & c_{12} & dots & c_{1n} \
c_{21} & c_{22} & dots & c_{2n} \
dots & & & dots \
c_{n1} & c_{n2} & dots & c_{nn} \
end{array}
right)
left(begin{array}{l} y_1 \ y_2 \ vdots \ y_n end{array} right) qquad iff qquad
X=CY .
$$
Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке
$$
f(X)=X^{top}{mathbf A}X= (CY)^{top}{mathbf A} (CY)=Y^{top} C^{top}{mathbf A}C Y=tilde f (Y) ,
$$
(здесь использовались некоторые свойства операции транспонирования ) и, если обозначить матрицу
$$
mathbf B =C^{top}{mathbf A}C ,
$$
то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции произведения матриц. Обратим внимание на еще один факт — матрица $ mathbf B $ является симметричной:
$$
mathbf B^{top} =(C^{top}{mathbf A}C)^{top}= C^{top}{mathbf A}^{top}left(C^{top} right)^{top} =
C^{top}{mathbf A}C= mathbf B ,
$$
т.е. выбор в качестве матричной записи квадратичной формы именно того варианта, что основан на симметричной матрице, позволяет сохранить это свойство при любой линейной замене переменных.

Задача о нахождении канонического вида квадратичной формы $ X^{top}{mathbf A}X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_{} $, чтобы матрица
$ mathbf B= C^{top}{mathbf A}C $ оказалась диагональной:
$$
mathbf B=
left(
begin{array}{cccc}
a_{1} & & & \
& a_{2} & & {mathbb O} \
{mathbb O} & & ddots & \
& & & a_{n}
end{array}
right) ;
$$
при этом дополнительным условием ставится невырожденность (неособенность) матрицы $ C_{} $:
$$ det C ne 0 . $$

Пока не вполне понятна существенность последнего условия: почему оно накладывается? С одной стороны, оно обеспечивает обратимость замены переменных $ (x_1,dots,x_n) leftrightarrow
(y_1,dots,y_n) $ — не происходит «потери информации». В самом деле, наличие какого-то ограничения на все возможные замены переменных, довольно очевидно: если бы разрешалось использовать, например, нулевую матрицу $ C = {mathbb O}_{n} $, то канонический вид у любой квадратичной формы был бы нулевым.. . Геометрический смысл условия $ det C ne 0 $ обсудим



НИЖЕ.

Т

Теорема. Для любой квадратичной формы над $ mathbb A $ существует невырожденная линейная замена
переменных
$ X=CY $ такая, что преобразованная квадратичная форма $ widetilde f(Y) $ имеет канонический вид.

Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.

П

Пример. Для формы

$$ f(x_1,x_2,x_3,x_4)= $$
$$=4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4 $$
замена переменных осуществляется формулами

$$
begin{array}{crrrr}
y_1=& x_1 &-frac{1}{2}, x_2&-frac{1}{2},x_3&+ frac{1}{2},x_4, \
y_2=& & x_2&+x_3&+x_4, \
y_3=& & & x_3 &+ 2, x_4,\
y_4=& &&& x_4,
end{array}
$$
т.е. матрица замены переменных
$$
C=
left(
begin{array}{cccc}
1 & -frac{1}{2} & -frac{1}{2} & frac{1}{2} \
0 & 1 & 1 & 1 \
0 & 0 & 1 & 2 \
0 & 0 & 0 & 1
end{array}
right)
$$
имеет верхнетреугольный вид. Канонический вид в новых переменных записывается
$$ f(x_1,x_2,x_3,x_4) equiv 4,y_1^2+y_2^2-y_3^2+3,y_4^2 . $$

Для формы
$$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4,x_3^2+2,x_1x_2+6,x_1x_3+4,x_2x_3 $$
замена переменных уже не имеет треугольного вида:
$$
begin{array}{crrr}
y_1=& x_1 &+ x_2&+3,x_3 \
y_2=& & -frac{1}{13}x_2&+x_3 \
y_3=& & frac{1}{13}x_2 &
end{array}
qquad iff qquad
C=
left(
begin{array}{rrr}
1 & 1 & 3 \
0 & -frac{1}{13} & 1 \
0 & frac{1}{13} & 0
end{array}
right) .
$$
Для формы
$$ f(x_1,x_2,x_3)=x_1x_2-3,x_1x_3+2,x_2x_3 $$
получили:
$$
begin{array}{crrr}
y_1=& frac{1}{2}x_1 &-frac{1}{2}x_2&+frac{5}{2}x_3 \
y_2=& x_1&+x_2&-x_3 \
y_3=& & & x_3
end{array}
qquad iff qquad
C=
left(
begin{array}{rrr}
frac{1}{2} & -frac{1}{2} & frac{5}{2} \
1 & 1 & -1 \
0 & 1 & 1
end{array}
right) ,
$$
т.е. замена переменных также не имеет треугольного вида.



Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.

Метод Лагранжа и метод Гаусса

В этом и последующих пунктах существенно потребуется знание МЕТОДА ГАУССА преобразования систем линейных уравнений.

П

Пример. Рассмотрим матрицу квадратичной формы

$$ f(x_1,x_2,x_3,x_4)=$$
$$ =4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4 $$

из предыдущих пунктов, и, временно выходя из
круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса
приведения к треугольному виду:
$$
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
-2 & 2 & 2 & 0 \
-2 & 2 & 1 & -2 \
2 & 0 & -2 & 1
end{array}
right)
rightarrow
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
0 & 1 & 1 & 1 \
0 & 1 & 0 & -1 \
0 & 1 & -1 & 0
end{array}
right)
rightarrow
$$
$$
rightarrow
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
0 & 1 & 1 & 1 \
0 & 0 & -1 & -2 \
0 & 0 & -2 & -1
end{array}
right)
rightarrow
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
0 & 1 & 1 & 1 \
0 & 0 & -1 & -2 \
0 & 0 & 0 & 3
end{array}
right) .
$$
Обратим внимание на два обстоятельства: диагональные элементы последней матрицы
совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты
замены переменных, приводящей к этому каноническому виду, совпадают с
элементами строк этой матрицы, если их разделить на соответствующие диагональные
элементы. Возникает подозрение :-?, что метод Лагранжа является «замаскированной»
версией метода Гаусса.


Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем
правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду.
Пусть исходная квадратичная форма записана в виде
$$
f(x_1,dots,x_{n} )=sum_{1le j,k le n} a_{jk}x_jx_k=
$$
$$
begin{array}{llll}
=
a_{11}x_1^2&+2a_{12}x_1x_2&+ dots & +2a_{1n}x_1x_n+ \
&+a_{22}x_2^2 &+ dots & +2a_{2n}x_2x_n+ \
& & +dots & + \
& & &+a_{nn}x_n^2,
end{array}
$$
т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_{} $.
После выделения полного квадрата, содержащего переменные $ x_1,x_2,dots,x_n $:
$$ f(x_1,x_2,dots,x_n)equiv a_{11}
left(x_1+frac{a_{12}}{a_{11}}x_2+dots+ frac{a_{1n}}{a_{11}}x_n
right)^2 + f_2(x_2,dots,x_n)
$$
в правой части тождества образовалась квадратичная форма $ f_{2} $, не содержащая $ x_{1} $. Она равна
$$
f_2 =sum_{2le j,k le n} a_{jk}x_jx_k-
a_{11}left(frac{a_{12}}{a_{11}}x_2+dots+
frac{a_{1n}}{a_{11}}x_n right)^2=
$$
$$
=sum_{2le j,k le n} a_{jk}x_jx_k-a_{11}sum_{2le j,k le n}
frac{a_{1j}a_{1k}}{a_{11}^2}x_jx_k=
sum_{2le j,k le n}left( a_{jk}-frac{a_{1j}}{a_{11}}a_{1k} right)
x_jx_k .
$$
Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_{}-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ mathbf A_{} $ в результате первого шага метода Гаусса.

Т

Теорема. Метод Лагранжа приведения квадратичной формы $ X^{top}{mathbf A}X $ к каноническому виду эквивалентен методу Гаусса приведения матрицы $ {mathbf A} $ к треугольному виду.

Доказательство. Действительно, первый шаг прямого хода метода исключения переменных
Гаусса преобразует матрицу $ mathbf A $ следующим образом:
$$
left( begin{array}{ccccc}
a_{11}& a_{12}& a_{13}& dots & a_{1n} \
a_{12}& a_{22}& a_{23}& dots & a_{2n} \
& dots & & dots & \
a_{1n}& a_{2n}& a_{3n}& dots & a_{nn}
end{array}
right)
rightarrow
left(begin{array}{llll}
a_{11}&a_{12}&dots&a_{1n}\
0&a_{22}^{[1]}& dots &a_{2n}^{[1]}\
&dots & & dots \
0&a_{n2}^{[1]}&dots &a_{nn}^{[1]}
end{array} right) ;
$$
здесь
$$a_{jk}^{[1]} = a_{jk} — frac{a_{j1}a_{1k}}{a_{11}} ,$$
и предполагается, что $ a_{11}ne 0 $. Видим, что формула формирования
элементов матрицы
$$
left(begin{array}{llll}
a_{22}^{[1]}& dots&a_{2n}^{[1]}\
dots & & dots & \
a_{n2}^{[1]}&dots &a_{nn}^{[1]}
end{array} right)_{(n-1)times (n-1)}
$$
точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того,
поскольку матрица $ {mathbf A} $ симметрична ($ a_{jk}=a_{kj} $), то
и только что полученная матрица оказывается симметричной.
Если $ a_{22}^{[1]} ne 0 $, то к этой новой матрице можно снова применить
ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка.
Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном
виде
$$
left(begin{array}{lllll}
a_{11}&a_{12}&dots&a_{1,n-1} &a_{1n}\
0&a_{22}^{[1]}& dots&a_{2,n-1}^{[1]} &a_{2n}^{[1]}\
& & ddots & & dots \
0 &0 & &a_{n-1,n-1}^{[n-2]}&a_{n-1,n}^{[n-2]} \
0 &0 &dots & 0 &a_{nn}^{[n-1]}
end{array} right)
$$
при условии, что ни одно из чисел на диагонали не обратилось в нуль:
$$a_{11} ne 0, a_{22}^{[1]} ne 0, dots, a_{n-1,n-1}^{[n-2]} ne 0, a_{nn}^{[n-1]} ne 0
.$$
Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет
замену переменных
$$
left{begin{array}{lrrrrr}
y_1=&displaystyle x_1+&frac{a_{12}}{a_{11}}x_2+&dots+&frac{a_{1,n-1}}{a_{11}}x_{n-1}+&
frac{a_{1n}}{a_{11}}x_n \
y_2=&displaystyle &x_2+&dots + &frac{a_{2,n-1}^{[1]}}{a_{22}^{[1]}}x_{n-1}+&
frac{a_{2n}^{[1]}}{a_{22}^{[1]}}x_{n} \
vdots & & & ddots & dots & \
y_{n-1}=&displaystyle & & &x_{n-1}+ &frac{a_{n-1,n}^{[n-2]}}{a_{n-1,n-1}^{[n-2]}}x_n \
y_n=&&&&&x_n
end{array} right. ,
$$
приводящую квадратичную форму к каноническому виду:
$$
a_{11}y_1^2 + a_{22}^{[1]} y_2^2 + dots +a_{n-1,n-1}^{[n-2]} y_{n-1}^2 +
a_{nn}^{[n-1]} y_n^2 .
$$



Именно выбор представления квадратичной формы посредством симметричной матрицы позволил установить взаимосвязь между двумя такими разными задачами как решение системы линейных уравнений и представление квадратичной формы в каноническом виде. Фактически весь дальнейший анализ квадратичной формы сведется к исследованию свойств ее матрицы $ mathbf A $. В теории линейных пространств для подобных соответствий, устанавливаемых между объектами разной природы, вводится понятие изоморфизма.

Явное выражение коэффициентов из последних формул, а также необходимые и достаточные условия существования такой
замены — в терминах миноров матрицы $ mathbf A $ — даются в следующем



ПУНКТЕ

Формула Якоби

Т

Теорема [Якоби]. Квадратичная форма $ f(X)=X^{top}{mathbf A}X $ с симметричной матрицей $ {mathbf A} $, ранг которой равен $ mathfrak r_{} $, а главные миноры $ {det mathbf A_j }_{j=1}^{mathfrak r} $ отличны от нуля, приводится к следующему каноническому виду (формула Якоби3)):

$$
frac{z_1^2}{1 cdot det mathbf A_1} +frac{z_2^2}{det mathbf A_1 cdot det mathbf A_2}
+frac{z_3^2}{det mathbf A_2 cdot det mathbf A_3} +dots+frac{z_{mathfrak r}^2}{det mathbf A_{{mathfrak r}-1} cdot det mathbf A_{mathfrak r}}
$$
Здесь
$$
z_1 =frac{1}{2} partial f / partial x_1, z_2=
frac{1}{2}
left|
begin{array}{ll}
a_{11} & partial f / partial x_1 \
a_{12} & partial f / partial x_2
end{array}
right|,
z_3=
frac{1}{2}
left|
begin{array}{lll}
a_{11} & a_{12} & partial f / partial x_1 \
a_{12} & a_{22} & partial f / partial x_2 \
a_{13} & a_{23} & partial f / partial x_3
end{array}
right|, dots ,
$$
$$
qquad qquad
z_{mathfrak r}=
frac{1}{2}
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,mathfrak r-1} & partial f / partial x_1 \
a_{12} & a_{22} & dots & a_{2,mathfrak r-1} & partial f / partial x_2 \
dots & & & dots & dots \
a_{1,mathfrak r } & a_{2,mathfrak r } & dots & a_{mathfrak r-1,mathfrak r } & partial f / partial x_{mathfrak r}
end{array}
right|
$$

Доказательство



ЗДЕСЬ.

П

Пример. Для квадратичной формы
$$ f(x_1,x_2,x_3,x_4)=
$$

$$
=4,x_1^2+2,x_2^2+x_3^2+x_4^2-4,x_1x_2-4,x_1x_3+4,x_1x_4+4,x_2x_3-4,x_3x_4
$$
имеем:
$$
mathbf A=
left(
begin{array}{rrrr}
4 & -2 & -2 & 2 \
-2 & 2 & 2 & 0 \
-2 & 2 & 1 & -2 \
2 & 0 & -2 & 1
end{array}
right) quad , left{det mathbf A_jright}_{j=1}^4=left{4,4,-4,-12right}
$$
и
$$z_1=frac{1}{2} (8,x_1-4,x_2-4,x_3+4,x_4)=4,x_1-2,x_2-2,x_3+2,x_4 ; $$
$$z_2=frac{1}{2}
left|
begin{array}{rl}
4 & 8,x_1-4,x_2-4,x_3+4,x_4 \
-2 & -4,x_1+4,x_2+4,x_3
end{array}
right|=4,x_2+4,x_3+4,x_4 ;
$$
$$
z_3=
frac{1}{2} left|
begin{array}{rrl}
4 & -2 & 8,x_1-4,x_2-4,x_3+4,x_4 \
-2 & 2 & -4,x_1+4,x_2+4,x_3
\
-2 & 2 & -4,x_1+4,x_2+2,x_3-4,x_4
end{array}
right|=-4,x_3-8,x_4 ;
$$
$$
z_4=
frac{1}{2}
left|
begin{array}{rrrl}
4 & -2 & -2 & 8,x_1-4,x_2-4,x_3+4,x_4 \
-2 & 2 & 2 & -4,x_1+4,x_2+4,x_3 \
-2 & 2 & 1 & -4,x_1+4,x_2+2,x_3-4,x_4
\
2 & 0 & -2 & 4,x_1-4,x_3+2,x_4
end{array}
right|= -12,x_4 .
$$
$$ fequiv frac{(4,x_1-2,x_2-2,x_3+2,x_4)^2 }{1cdot 4}+frac{(4,x_2+4,x_3+4,x_4)^2 }{4cdot 4}+frac{(-4,x_3-8,x_4)^2 }{4cdot (-4)}+
$$
$$
+frac{(-12,x_4 )^2 }{(-4)cdot (-12)} .
$$
Обратим внимание, что замена переменных в настоящем примере имеет треугольный вид:
$$
left(
begin{array}{l}
z_1 \ z_2 \ z_3 \ z_4
end{array}
right)
=
left(begin{array}{rrrr}
4 & -2 & -2 & 2 \
& 4 & 4 & 4 \
& & -4 & -8 \
& & & -12
end{array}
right)
left(
begin{array}{l}
x_1 \ x_2 \ x_3 \ x_4
end{array}
right) , .
$$



Легко убедиться, что это — проявление общего правила. Выражение для
$$
z_{k}=
frac{1}{2}
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & partial f / partial x_1 \
a_{12} & a_{22} & dots & a_{2,k-1} & partial f / partial x_2 \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & partial f / partial x_{k}
end{array}
right|
$$
при $ k in {1,dots, mathfrak r} $ преобразуем следующим образом: из последнего столбца определителя
$$
=
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{11}x_1+a_{12}x_2+dots+ a_{1,k-1} x_{k-1}+a_{1k}x_k+dots+a_{1n}x_n \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{21}x_1+a_{22}x_2+dots+ a_{2,k-1} x_{k-1}+a_{2k}x_k+dots+a_{2n}x_n \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{k1}x_1+a_{k2}x_2+dots+ a_{k,k-1} x_{k-1}+a_{kk}x_k+dots+a_{kn}x_n
end{array}
right|
$$
вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_{k-1} $. В результате получим линейную форму
$$
z_k=
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{1k} \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{2k} \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{kk}
end{array}
right|x_k + dots +
left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{1n} \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{2n} \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{kn}
end{array}
right|x_n , ,
$$
не зависящую от $ x_1,dots, x_{k-1} $. Коэффициент же при $ x_k $ равен $ det mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.

=>

Квадратичная форма $ f(X)=X^{top}{mathbf A}X $ с симметричной матрицей $ {mathbf A} $, ранг которой равен $ mathfrak r_{} $, а главные миноры $ {det mathbf A_j }_{j=1}^{mathfrak r} $ отличны от нуля, приводится к следующему каноническому виду:

$$
y_1^2 det mathbf A_1 + y_2^2frac{det mathbf A_2}{ det mathbf A_1}
+y_3^2frac{det mathbf A_3}{det mathbf A_2} +dots+y_{mathfrak r}^2 frac{det mathbf A_{mathfrak r}}{det mathbf A_{mathfrak r-1}} ;
$$
при этом линейные относительно переменных $ x_1,dots,x_n $ формы $ {y_j }_{j=1}^{mathfrak r} $ выражаются по формулам
$$
left{
begin{array}{lrrrrrr}
y_1=&displaystyle x_1+&tilde c_{12}x_2& &+dots+&tilde c_{1,n-1}x_{n-1}+&tilde c_{1n}x_n \
y_2=&displaystyle &x_2+& & dots + &tilde c_{2,n-1}x_{n-1}+&tilde c_{2n}x_{n} \
vdots & & & ddots & & dots & \
y_{mathfrak r}=&displaystyle & & &x_{mathfrak r}+ & dots + & tilde c_{mathfrak r n}x_n
end{array}
right.
$$
Здесь
$$
tilde c_{1j}=a_{1j}/a_{11}, tilde c_{kj}=left|
begin{array}{lllll}
a_{11} & a_{12} & dots & a_{1,k-1} & a_{1j} \
a_{12} & a_{22} & dots & a_{2,k-1} & a_{2j} \
dots & & & dots & dots \
a_{k1 } & a_{k2 } & dots & a_{k,k-1 } & a_{kj}
end{array}
right| Bigg/ det mathbf A_j , .
$$

При $ mathfrak r = n $ матрица $ tilde C_{} $ из предыдущей формулы становится верхнетреугольной:
$$
Y=tilde C X , ;
$$
при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру — и матрица $ C=tilde C^{-1} $ является матрицей, которая встретилась нам в предыдущем ПУНКТЕ.

T

Теорема. Квадратичная форма $ f(X)=X^{top}{mathbf A}X $ при симметричной неособенной матрице $ {mathbf A} $ приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей

$$
X=CY quad npu C=
left(
begin{array}{llll}
1& c_{12}& dots & c_{1n} \
& 1& dots & c_{2n} \
mathbb O & & ddots & vdots \
& & & 1
end{array}
right)
$$
тогда и только тогда, когда все главные миноры матрицы $ {mathbf A} $ отличны от нуля. Этот канонический вид представлен формулой Якоби
$$
y_1^2 det mathbf A_1 + y_2^2frac{det mathbf A_2}{ det mathbf A_1}
+dots+y_{n}^2 frac{det mathbf A_{n}}{det mathbf A_{n-1}} .
$$

Доказательство
достаточности условия теоремы уже произведено, необходимость доказывается в пункте



LDU-разложение матрицы.

Закон инерции для квадратичных форм

Для заданной квадратичной формы канонические виды, т.е. представления
в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.

Ранг квадратичной формы

Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду:
$$widetilde f(Y)=alpha_1y_1^2+dots+alpha_n y_n^2 .$$
Может так случиться, что часть коэффициентов $ {alpha_j }_{j=1}^n $ обратится в нуль.

Рангом квадратичной формы называется ранг ее матрицы:
$$operatorname{rank} ( f ) = operatorname{rank} ( {mathbf A} ) .$$

Т

Теорема. Ранг квадратичной формы не меняется при невырожденных заменах переменных:

$$ operatorname{rank} (f) = operatorname{rank}( C^{top}{mathbf A}C ) quad npu quad forall C,
det C ne 0 .$$

Доказательство основано на следствии к теореме $ 2 $, приведенной



ЗДЕСЬ: ранг матрицы не меняется при домножении ее на произвольную неособенную.

=>

Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.

Закон инерции

Начиная с этого момента рассматриваем только вещественные квадратичные формы.

Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_{}(X) $ называется ее положительным (соответственно, отрицательным) индексом инерции. Буду обозначать эти индексы4)
$$n_{+}(f) quad mbox{ и } quad n_{-}(f) . $$
Разность5)
$$sigma (f) = n_{+}(f)-n_{-}(f)$$
называется сигнатурой квадратичной формы (а также сигнатурой соответствующей ей симметричной матрицы).

Т

Теорема [закон инерции]. Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.

Эта теорема часто формулируется в виде: «ранг и сигнатура квадратичной формы не зависят…». Эквивалентность этой формулировки исходной очевидно следует из формул
$$ operatorname{rank} (f) = n_{+}(f)+n_{-}(f), sigma (f) = n_{+}(f)-n_{-}(f) . $$

Доказательство



ЗДЕСЬ.

П

Пример. Найти ранг и сигнатуру квадратичной формы $ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 $.

Решение. Приводим квадратичную форму к каноническому виду по методу Лагранжа:
$$f=frac{1}{4} ,(x_1+x_2-x_3)^2 — frac{1}{4} ,(x_1-x_2-x_3)^2 .$$

Ответ. $ operatorname{rank} (f) = 2,, sigma (f)=0 $.

=>

В предположении, что ранг матрицы $ mathbf A_{} $ равен $ mathfrak r_{} $, а ее главные миноры $ { det {mathbf A}_j }_{j=1}^{mathfrak r} $ отличны от нуля, имеем:

$$
n_{+}(f)={mathcal P}(1,det {mathbf A}_1,dots, det {mathbf A}_{mathfrak r}),
n_{-}(f)={mathcal V}(1,det {mathbf A}_1,dots, det {mathbf A}_{mathfrak r}) .
$$
Здесь $ {mathcal P}_{} $ — число знакопостоянств, а $ {mathcal V}_{} $ — число число знакоперемен в последовательности.
Для сигнатуры квадратичой формы также справедлива и формула
$$ sigma (f)= sum_{j=1}^{mathfrak r} operatorname{sign} (det (mathbf A_{j-1}) cdot det (mathbf A_{j}) ) quad npu quad det (mathbf A_{0})=1 $$
и операции $ operatorname{sign} $ определения знака, введенной



ЗДЕСЬ.

Доказательство следует из формулы Якоби.

§

Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ { det {mathbf A}_j }_{j=1}^{mathfrak r} $ имеются нулевые, но не подряд идущие, и $ det {mathbf A}_{mathfrak r} ne 0 $. Если, например,

$$ det (mathbf A_{j}) = 0, det (mathbf A_{j-1}) ne 0, det (mathbf A_{j+1}) ne 0 quad npu quad jin{1,dots, {mathfrak r}-1} ,$$
то сумма
$$ operatorname{sign} (det (mathbf A_{j-1}) cdot det (mathbf A_{j}) )+ operatorname{sign} (det (mathbf A_{j}) cdot det (mathbf A_{j+1}) ) $$
считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ det (mathbf A_{j-1}) $ и $ det (mathbf A_{j+1}) $ имеют противоположные знаки.)

П

Пример. Найти ранг и сигнатуру квадратичной формы

$$f_{{color{Red} alpha }}(x_1,x_2,x_3)=3,x_1^2 -4,x_1x_2-2,x_1x_3 + {color{Red} alpha } , x_2^2 +6, x_2x_3 $$
в зависимости от значений параметра $ {color{Red} alpha } $.

Решение. Сначала пробуем применить формулу из последнего следствия:
$$det {mathbf A}_1=3, det {mathbf A}_2=3, {color{Red} alpha } -4, det {mathbf A}_3=
det {mathbf A}=- {color{Red} alpha } -15 .$$
При $ {color{Red} alpha } notin {4/3,, -15 } $ формула применима при
$ {mathfrak r}=3 $:
$$n_{+}(f)=left{ begin{array}{llr}
2 & npu & {color{Red} alpha } >4/3 ;\
2 & npu & -15<{color{Red} alpha } <4/3 ;\
1 & npu & {color{Red} alpha } < -15 .
end{array} right.
$$
При $ {color{Red} alpha }=4/3 $, по-прежнему, $ {mathfrak r}=3 $, но формула следствия к закону инерции
неприменима. В этом случае приходится действовать по методу Лагранжа:
$$f_{4/3}(x_1,x_2,x_3)=3, left(x_1-frac{2}{3}, x_2 -frac{1}{3}, x_3right)^2-
frac{1}{3}, (x_3-7, x_2)^2+frac{49}{3}x_2^2 .$$
Следовательно, $ n_{+}(f)=2 $. Осталось рассмотреть случай $ {color{Red} alpha } =-15 $,
когда $ {mathfrak r}=2 $. Поскольку условия следствия выполняются, то формула из него применима: $ n_{+}(f)=1 $.

Во всех случаях отрицательный индекс инерции вычисляется по формуле $ n_{-}(f)={mathfrak r}-n_{+}(f) $.

Ответ.
$$
begin{array}{c|c|c}
{color{Red} alpha } & operatorname{rank} (f) & sigma (f) \
hline
< -15 & 3 & -1 \
hline
=-15 & 2 & 0 \
hline
> -15 & 3 & 1
end{array}
$$

Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:


Как меняются ранг и сигнатура при непрерывном изменении параметров?

Пусть квадратичная форма зависит от параметров $ alpha, beta, dots $, причем эта зависимость — полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде
$$ G_1(alpha,beta,dots) > 0, dots, G_n(alpha,beta,dots) > 0 . $$
Здесь $ G_1,dots, G_n $ — полиномы от $ alpha,beta,dots $. Если при некотором наборе значений $ alpha=alpha_0, beta=beta_0, dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ alpha_0+delta_{alpha}, beta_0 + delta_{beta},dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: какое из неравенств системы самое важное? — Оказывается, последнее.

Т

Теорема[2]. Пусть $ f_{{color{Red} alpha }}(x_1,dots,x_n) $ — квадратичная форма, зависящая от параметра $ {color{Red} alpha } $ линейным образом:

$$ f_{{color{Red} alpha }}(x_1,dots,x_n) equiv (1-{color{Red} alpha }) f_{0}(x_1,dots,x_n)+ {color{Red} alpha } f_{1}(x_1,dots,x_n) . $$
Если $ operatorname{rank} (f_{{color{Red} alpha }})=n $ при $ 0 le {color{Red} alpha } le 1 $, то $ n_{+} (f_{0})= n_{+} (f_{1}) $.

Справедливо и более общее утверждение.

Т

Теорема[1,5]. Если при непрерывном изменении коэффициентов формы $ f_{} $ ее ранг $ {mathfrak r}_{} $ остается неизменным, то не изменяется и ее сигнатура $ sigma_{}(f) $.

В случае, когда главные миноры матрицы $ mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать «тяжелую артиллерию» в виде ведущих миноров. Но, по крайней мере, один теоретический результат можно сформулировать немедленно.

Т

Теорема. В произвольной квадратичной форме $ f(X) $ ранга $ mathfrak rge 1 $ можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы $ tilde f(Y) $ в последовательности главных миноров

$$ det widetilde{mathbf A}_1, dots, det widetilde{mathbf A}_{ mathfrak r} $$
не было двух подряд идущих нулевых и $ det widetilde{mathbf A}_{ mathfrak r} ne 0 $.

Конгруэнтность квадратичных форм

Матрицы $ {mathbf A} $ и $ {mathbf B} $, связанные соотношением
$ {mathbf B}=C^{top}{mathbf A}C $ при некоторой неособенной матрице $ C $, называются
конгруэнтными: $ {mathbf A} cong {mathbf B} $. Если, вдобавок, матрицы
$ {mathbf A} $ и $ {mathbf B} $ симметричны, то конгруэнтными называются
и соответствующие им квадратичные формы $ X^{top}{mathbf A}X $ и $ X^{top}{mathbf B}X $.

Т

Теорема. Квадратичные формы $ X^{top}{mathbf A}X $ и $ X^{top}{mathbf B}X $
конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.

Из всего разнообразия канонических видов квадратичной формы
выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду
$$widetilde f(Y)=alpha_1y_1^2+dots+alpha_{mathfrak r} y_{mathfrak r}^2 .$$
то преобразование
$$y_j=frac{z_j}{sqrt{alpha_j}} npu jin {1,dots, {mathfrak r}} ,
y_j=z_j npu jin {{mathfrak r}+1,dots, n }
$$
приводит эту форму к виду
$$
z_1^2+dots + z_{n_{+}(A)}^2 -z_{n_{+}(A)+1}^2 — dots — z_{{mathfrak r}}^2
,
$$
который называется нормальным видом квадратичной формы.

Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности,
в каждом из которых будут находиться только конгруэнтные между собой формы.
Каждый из классов полностью описывается каким-то из своих представителей. Таким
представителем можно взять нормальный вид.

Какое преобразование квадратичной формы оставляет ее инвариантной?

Т

Теорема [Эрмит]. Квадратичная форма $ X^{top}{mathbf A}X $ переходит в себя при преобразовании

$$ X= ({mathbf A}+S)^{-1}({mathbf A}-S) Y $$
где $ S $ означает произвольную кососимметричную матрицу порядка $ n $.

Доказательство. Обозначим
$$ R=({mathbf A}+S)^{-1}({mathbf A}-S) $$
и докажем, что $ R^{top}{mathbf A}R= {mathbf A} $. Используя равенства $ {mathbf A}^{top}={mathbf A} $ ,
$ S^{top}=-S $, получим:
$$ R^{top}{mathbf A}R=({mathbf A}-S)^{top} left(({mathbf A}+S)^{-1}right)^{top}{mathbf A} ({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=({mathbf A}+S)left(({mathbf A}+S)^{top}right)^{-1} {mathbf A}
({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=({mathbf A}+S)({mathbf A}-S)^{-1}left[frac{1}{2}({mathbf A}-S)+ frac{1}{2}({mathbf A}+S)right]({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=frac{1}{2}({mathbf A}+S)({mathbf A}-S)^{-1}({mathbf A}-S)({mathbf A}+S)^{-1}({mathbf A}-S)+frac{1}{2}({mathbf A}+S)({mathbf A}-S)^{-1}({mathbf A}+S)({mathbf A}+S)^{-1}({mathbf A}-S)=
$$
$$
=frac{1}{2}({mathbf A}-S)+
frac{1}{2}({mathbf A}+S)={mathbf A} , .
$$



Знакоопределенность

Здесь рассматриваются только вещественные квадратичные формы.

Квадратичная форма $ f_{}(X) $ называется

а) неотрицательной если $ f(X)ge 0 $ для любого $ Xin mathbb R^n $;

б) положительно определенной, если она неотрицательна и $ f(X)= 0 $ только при $ X=mathbb O_{} $;

в) неопределенной или знакопеременной, если существуют $ {X_1,X_2} subset mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2)<0 $.

По аналогии с пунктами а) и б) определяются неположительные и отрицательно определенные квадратичные формы. Иногда неотрицательные или неположительные формы называют полуопределенными.

П

Пример. При $ n_{}=3 $ квадратичная форма

а) $ x_1^2+3x_2^2+4x_3^2 $ является положительно определенной;

б) $ x_1^2+x_3^{2} $ (или $ (x_1+{sqrt 2} x_2-x_3)^{2} $) является неотрицательной, но не положительно определенной;

в) $ -x_1^2 $ является неположительной, но не отрицательно определенной;

г) $ -x_1^2-2,x_2^2-4,x_3^{2} $ является отрицательно определенной;

д) $ x_1x_{2}+x_2x_3 $ является неопределенной.

Какой смысл имеет свойство неотрицательности и положительной определенности с точки зрения математического анализа? — Неотрицательность формы $ f_{}(X) $ означает, что в точке $ X=mathbb O $ эта функция достигает своего минимального значения: $ f(X)ge 0 = f(mathbb O) $; подчеркнем, что этот минимум будет глобальным. В случае положительной определенности точка $ X=mathbb O $ будет единственной точкой пространства $ mathbb R^{n} $, в которой $ f_{}(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 ne mathbb O $, то вследствие однородности формы $ f_{}(X) $ будет выполнено
$$ f(tX_1)=t^2f(X_1)= 0 quad npu quad forall t in mathbb R . $$
Иными словами, свое минимальное значение $ 0_{} $ неотрицательная, но не положительно определенная, форма $ f_{} (X) $ будет принимать на всей прямой, проходящей через точки $ mathbb O $ и $ mathbb X_1 $. Точка $ X=mathbb O $ перестает быть изолированной точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_{} $.
Событие теоретически возможно, но практически немыслимо.

Какой смысл имеет свойство положительной определенности с точки зрения геометрии? — Рассмотрим вещественную квадратичную форму от трех переменных: $ f(x,y,z) $. Поставим задачу определения типа поверхности второго порядка
$$ f(x,y,z)=C $$
при произвольной константе $ Cin mathbb R $. Если $ f $ положительно определена, то это уравнение не имеет вещественных решений при $ C<0 $. При $ C=0 $ уравнение определяет единственную точку в $ mathbb R^3 $, а именно — начало координат. При $ C>0 $
уравнение определяет эллипсоид с центром в начале координат. От всех остальных поверхностей второго порядка эллипсоид отличает его замкнутость (и, как следствие, ограниченность).

Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для однородного полинома (формы) произвольного порядка.

§

Задача об условных экстремумах квадратичной формы $ f_{}(X) $ на сфере $ x_1^2+dots+x_n^2 =1 $ решается



ЗДЕСЬ.

П

Пример. В произвольном евклидовом пространстве $ mathbb E $ квадратичная форма с матрицей Грама произвольной системы векторов $ {X_1,dots,X_m} subset mathbb E $

$$ G(X_1,dots,X_m)=
left(
begin{array}{cccc}
langle X_1,X_1 rangle & langle X_1,X_2 rangle & dots & langle X_1,X_m rangle \
langle X_2,X_1 rangle & langle X_2,X_2 rangle & dots & langle X_2,X_m rangle \
dots & & & dots \
langle X_m,X_1 rangle & langle X_m,X_2 rangle & dots & langle X_m,X_m rangle
end{array}
right)
$$
будет неотрицательной; эта квадратичная форма будет положительно определенной тогда и только тогда, когда система $ {X_1,dots,X_m} $ линейно независима.


Задача.


Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.

Очевидны необходимые условия неотрицательности квадратичной формы
$$ f(X)=displaystyle sum_{1le j le k le n} f_{jk}x_jx_k : $$
все коэффициенты при квадратах переменных должны быть неотрицательными:
$$ f_{11}ge 0, dots , f_{nn}ge 0 . $$
Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_{jk}^{} $ при $ jne k $
равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е.
исследовать ее канонический вид.

Т

Теорема. Ненулевая квадратичная форма, представленная в правильном виде

$$ f(X)=X^{top}{mathbf A}X , , $$
будет неотрицательной тогда и только тогда, когда ее отрицательный индекс инерции равен нулю:
$$ n_{-} ({mathbf A})=0 qquad iff qquad qquad sigma (
{mathbf A})=operatorname{rank} {mathbf A} .$$
Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена: $ det {mathbf A} ne 0 $.

Доказательство



ЗДЕСЬ.

К счастью, явное представление канонического вида квадратичной формы уже имеется — как правило, он задается формулой Якоби. Индексы инерции
вычисляются через знаки главных миноров матрицы квадратичной формы.

Т

Теорема [Сильвестр]. Квадратичная форма

$$
f(X)=X^{top}{mathbf A}X
$$
будет положительно определенной тогда и только тогда, когда все главные миноры ее матрицы положительны:
$$
a_{11}>0, left| begin{array}{cc}
a_{11} & a_{12} \
a_{12} & a_{22}
end{array} right| >0, left| begin{array}{ccc}
a_{11} & a_{12} & a_{13} \
a_{12} & a_{22} & a_{23} \
a_{13} & a_{23} & a_{33}
end{array} right| >0, dots, det {mathbf A} >0 .
$$

Доказательство



ЗДЕСЬ.

=>

Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:

$$
a_{11}<0, left| begin{array}{cc}
a_{11} & a_{12} \
a_{12} & a_{22}
end{array} right| >0, left| begin{array}{ccc}
a_{11} & a_{12} & a_{13} \
a_{12} & a_{22} & a_{23} \
a_{13} & a_{23} & a_{33}
end{array} right| <0, dots, (-1)^ndet {mathbf A} >0 .
$$

В настоящем ресурсе я буду часто говорить об определенности или неопределенности вещественной симметричной матрицы, имея в виду соответствующее свойство порождаемой ею квадратичной формы. Имеется одна особенность в определении симметричной матрицы, задающей неотрицательную квадратичную форму, не являющуюся положительно определенной. Такую матрицу НЕ называют неотрицательной (этот термин закреплен за другим понятием теории матриц); такую матрицу называют положительно полуопределенной6).

П

Пример. Найти все значения параметра $ {color{Red} alpha } $, при которых
квадратичная форма

$$2, x_1^2+2, x_2^2+x_3^2+ 2, {color{Red}{ alpha} } , x_1x_2+6, x_1x_3 +2,x_2x_3 $$
будет положительно определенной.

Решение. Значения главных миноров:
$$det {mathbf A}_1=2, det {mathbf A}_2=4- {color{Red} alpha }^2, det {mathbf A}_3=-{color{Red} alpha }^2+
6, {color{Red} alpha } -16 . $$
Последнее выражение будет отрицательно при любых $ {color{Red} alpha } in mathbb R $.

Ответ. Таких значений нет: $ {color{Red} alpha } in varnothing $.

Можно ли получить условия неотрицательности квадратичной формы:
$$ f(X) ge 0 npu forall X in {mathbb R}^n $$
превращением всех неравенств из критерия Сильвестра в нестрогие: $ > to {color{Red}{ to} } ge $

?

— Вообще говоря, нет.

П

Пример.
Квадратичная форма

$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2=
X^{top} left(
begin{array}{cccc}
1&0&1 &0 \
0&0&0&1 \
1&0&0&0 \
0&1&0&1
end{array} right)X
$$
— неопределенная, т.к. $ f(1,0,-1,0)=-1_{}<0 $, а $ f(1,0,0,0)=1_{}>0 $. Тем не менее, все главные миноры ее матрицы неотрицательны.


Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?

Т

Теорема. Для неотрицательности квадратичной формы $ X^{top} mathbf A X $ необходимо и достаточно, чтобы все ведущие миноры матрицы $ mathbf A $, т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами

$$
Aleft(
begin{array}{lll}
j_1 & dots & j_k \
j_1 & dots & j_k
end{array}
right) , j_1<j_2<dots < j_k
$$
были неотрицательны.

П

Пример. При любой матрице $ A in mathbb R^{mtimes n} $ матрицы

$$ A^{top} A quad mbox{ и } quad A A^{top} $$
являются положительно полуопределенными.

Знакоопределенность на подпространстве

Будем говорить, что квадратичная форма $ f(X) $ положительно определена на подпространстве $ mathbb V_1 $ пространства $ mathbb R^{n} $ если $ f(X)>0 $ при всех $ Xin mathbb V_1, X ne mathbb O $.

Т

Теорема. Пусть линейное подпространство задано системой линейных однородных уравнений

$$
left{ begin{array}{cccc}
h_{11}x_1 & + dots & + h_{1n}x_n&=0, \
dots & & & dots \
h_{k1}x_1 & + dots & + h_{kn}x_n&=0, \
end{array}
right. qquad iff qquad
underbrace{left(
begin{array}{lll}
h_{11} & dots & h_{1n} \
dots & & dots \
h_{k1} & dots & h_{kn}
end{array}
right)}_{=H}X=mathbb O
$$
Здесь $ k<n $ и предполагается, что минор, образованный первыми $ k_{} $ столбцами матрицы $ H_{} $ отличен от нуля, (т.е. $ operatorname{rank} (H)=k $). Тогда необходимым и достаточным условием положительной определенности квадратичной формы $ X^{top} mathbf A X $ на этом подпространстве является то, что все главные миноры матрицы
$$
(-1)^k
left( begin{array}{cc}
mathbb O_{ktimes k} & H \
H^{top} & mathbf A
end{array}
right)_{(n+k)times (n+k)}
$$
порядков $ 2k+1, 2k+2, dots, n+k $ положительны.

Результат приведен в [3] со ссылкой на статью [4], однако у меня есть основания считать, что он был известен еще Борхардту.

Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных

В этом пункте рассматриваются только вещественные квадратичные формы.
Существенно используются материалы из раздела СИММЕТРИЧНАЯ МАТРИЦА и начальный пункт раздела ОРТОГОНАЛЬНАЯ МАТРИЦА.

Т

Теорема. Cуществует замена переменных

$$ X=PY , $$
c ортогональной матрицей $ P_{} $, приводящая квадратичную форму $ f(X)=X^{top} mathbf A X $ к каноническому виду
$$ lambda_1 y_1^2 + lambda_2 y_2^2+ dots + lambda_n y_n^2 ; $$
при этом коэффициентами канонического вида являются собственные числа матрицы $ mathbf A $ (более точно: набор $ { lambda_1,dots, lambda_n } $ составляет спектр матрицы $ mathbf A $).

Доказательство



ЗДЕСЬ.

П

Пример. Найти ортогональную замену переменных, приводящую квадратичную форму

$$ X^{top} mathbf A X quad
npu quad
{mathbf A}=left(begin{array}{rrr}
2 & 2 & -1 \
2 & -1 & 2 \
-1& 2 & 2
end{array}
right)
$$
к каноническому виду.

Решение. Характеристический полином $ det (mathbf A- lambda E)=-(lambda-3)^2(lambda+3) $.
Простому собственному числу $ lambda=-3 $ соответствует собственный вектор
$ {mathfrak X}_1=[1,-2,1]^{^{top}} $, а собственному числу $ lambda=3 $ второй кратности соответствуют
два линейно-независимых собственных вектора $ {mathfrak X}_2=[2,1,0]^{^{top}} $ и
$ {mathfrak X}_3=[-1,0,1]^{^{top}} $. Очевидно, что
$ langle {mathfrak X}_1, {mathfrak X}_2rangle=0 , langle {mathfrak X}_1, {mathfrak X}_3 rangle =0 $, но
$ langle {mathfrak X}_2, {mathfrak X}_3 rangle ne 0 $. Ортогонализуем систему
векторов $ left{{mathfrak X}_2,{mathfrak X}_3right} $:
$${mathfrak Y}_2={mathfrak X}_2, {mathfrak Y}_3={mathfrak X}_3+ {color{Red} alpha } {mathfrak Y}_2
quad mbox{ и } langle {mathfrak Y}_2,{mathfrak Y}_3rangle =0
Longrightarrow {color{Red} alpha }=-frac{langle {mathfrak X}_2,{mathfrak X}_3rangle}
{langle {mathfrak X}_2,{mathfrak X}_2rangle}=frac{2}{5}
$$
и $ {mathfrak Y}_3=left[-1/5, 2/5, 1 right]^{^{top}} $.
После нормирования, получаем ортогональную матрицу
$$
P=left(begin{array}{rrr}
1/sqrt{6} & 2/sqrt{5} & -1/sqrt{30} \
-2/sqrt{6} & 1/sqrt{5} & 2/sqrt{30} \
1/sqrt{6} & 0 & 5/sqrt{30}
end{array}
right) .
$$
Замена переменных $ X=PY $ приводит квадратичную форму $ X^{top} mathbf A X $ к каноническому виду
$$
(y_1,y_2,y_3)
left(begin{array}{rrr}
-3 & 0 & 0 \
0 & 3 & 0 \
0& 0 & 3
end{array}
right)
left(
begin{array}{c}
y_1 \ y_2 \ y_3
end{array}
right)=-3,y_1^2+3,y_2^2+3,y_3^2 .
$$

Поскольку фундаментальную систему решений системы уравнений $ (mathbf A — lambda_j E)X= mathbb O $ для кратного собственного числа $ lambda_j $ можно строить разными способами, то у последней задачи имеется бесконечное
множество ответов. Так, например, в качестве еще одной ортогональной
матрицы можно взять
$$P=left(begin{array}{rrr}
1/sqrt{6} & -1/sqrt{2} & 1/sqrt{3} \
-2/sqrt{6} & 0 & 1/sqrt{3} \
1/sqrt{6}& 1/{sqrt 2} & 1/sqrt{3}
end{array}
right).
$$

Т

Теорема. Если известны коэффициенты характеристического полинома матрицы квадратичной формы $ f(X)=X^{top}mathbf A X $:

$$ det (mathbf A- lambda E) equiv (-1)^n left(lambda^n+a_{1}lambda^{n-1}+ dots + a_n right) , ,$$
то
$$ operatorname{rank} (f(X))={mathfrak r} iff
a_{n}=a_{n-1}=dots=a_{{mathfrak r}+1}=0,a_{{mathfrak r}}ne 0 , . $$
В этом случае будет также выполнено
$$ n_{+} (f(X))={mathcal V}(1,a_1,dots,a_{{mathfrak r}}),quad
n_{-} (f(X))={mathcal P}(1,a_1,dots,a_{mathfrak r}) , , $$
$$ sigma(f(X))=sum_{j=1}^{mathfrak r} operatorname{sign} (a_{j-1}a_j) quad npu quad a_0=1 , . $$

Доказательство основано на правиле знаков Декарта.

Геометрия замен переменных

В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ det (mathbf A — lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде «хорошей» комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.

П

Пример. Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:


Преобразование
$$
y_1=x_1-3/2x_2, y_2=x_2
$$
приводит уравнение к виду
$$ 1/3 y_1^2+1/4 y_2^2=1 ; $$
в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование
$$
begin{array}{ll}
z_1&= sqrt{1/2+1/sqrt{13}},x_1+sqrt{1/2-1/sqrt{13}},x_2,\
z_2&= sqrt{-1/2-1/sqrt{13}},x_1+sqrt{1/2+1/sqrt{13}}x_2
end{array}
$$
приводит уравнение к виду
$$frac{4-sqrt{13}}{6}z_1^2+frac{4+sqrt{13}}{6}z_2^2=1 . $$
В этих координатах кривая имеет вид на рисунке справа.

Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.

Вывод. Метод Лагранжа «дешевле» метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^{top} mathbf A X=1 $. Иными словами, он позволяет «дешевле» определить тип поверхности с точностью до ее формы: например, в $ mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно — однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^{top} mathbf A X=1 $, можно было бы поместить — то здесь без собственных векторов и чисел матрицы $ mathbf A $ не обойтись!

Здесь уместно вспомнить замечание о невырожденности замены переменных, приводящей квадратичную форму к каноническому виду.
В чем заключается его геометрический смыcл? Для ответа на вопрос обратимся к приведенному выше примеру.
Сделаем в квадратичной форме замену переменных зависящей от параметра:
$$ x_1=t_1+alpha t_2, x_2=t_1+t_2 , . $$

На рисунке изображены получаемые в результате такой замены кривые при различных значениях параметра. И если при значениях $ alpha=0.4 $ и $ alpha=0.7 $ мы еще можем визуально распознать эллипс, то значение $ alpha=0.9 $ заставляет подозревать, что соответствующая кривая при сильном растяжении разрывается на два куска, близкие к прямым. Именно это и происходит при $ alpha=1 $. Вместо двух существенных переменных $ x_1 $ и $ x_2 $, у нас остается, фактически, одна, а именно $ t_1 + t_2 $, а нелинейная кривая выродилась в две прямые линии.

Билинейные формы

Задачи

Источники

[1]. Гантмахер Ф.Р. Теория матриц. 4-е изд. М.Наука. 1988.

[2]. Knuth D.E. A permanent inequality. American Math. Monthly, v. 88, N 10, 1981, p.731–740

[3]. Шилов Г.Е. Математический анализ. Конечномерные линейные пространства. М.Наука.1969, с.243

[4]. Шостак Р.Я. О признаке условной определённости квадратичной формы n переменных, подчинённых линейным связям, и о достаточном признаке условного экстремума функций n переменных, УМН, 9:2(60) (1954), 199–206

[5]. Иохвидов И.С. Ганкелевы и теплицевы матрицы и формы. М. Наука. 1974.

[6]. Turnbull H.W. The Theory of Determinants, Matrices and Invariants. Blackie & Sons Ltd. 1929.

Если после приведения квадратичной формы A(X,X) к каноническому виду совершить еще одно невырожденное преобразование координат, определяемое формулой , то получим, так называемый нормальный вид квадратичной формы , где принимает одно из трех значений: -1, 0 или 1.

Как отмечалось в Замечании 2 предыдущего параграфа, приведение квадратичной формы к каноническому виду можно осуществить различными преобразованиями координат (канонический вид квадратичной формы неоднозначен), однако, с точностью до нумерации переменных получается один и тот же нормальный вид квадратичной формы. Это подтверждает следующая теорема.

Теорема (закон инерции квадратичной формы):

Число положительных коэффициентов в нормальном виде квадратичной формы называемое положительным индексом инерции; число отрицательных коэффициентов называемое отрицательным индексом инерции и число нулевых коэффициентов называемое дефектом квадратичной формы являются инвариантами, т. е. не зависят от базиса, в котором данная квадратичная форма принимает нормальный вид.

Доказательство: Пусть имеются 2-а базиса, в которых квадратичная форма A(X,X) принимает нормальный вид: в базисе

в базисе .

Здесь полагаем, что т. е. в этих 2-х базисах (и во всех остальных!) нулевые коэффициенты в нормальном виде квадратичной формы отсутствуют. Очевидно, что для доказательства этой теоремы достаточно предположить, что .

Будем доказывать методом от противного, т. е. предполагаем, что ; пусть, например, .

Рассмотрим следующие пространства: и . Очевидно, что . Применим формулу Грассмана: , т. е. пространство — непустое, следовательно, существует хотя бы один ненулевой элемент , т. к. , то .

Точно также , поэтому . Т. к. , то с одной стороны , с другой стороны . Полученное противоречие доказывает, что .

Аналогично доказываются другие 3-и случая: .

Знакоопределенные квадратичные формы. Критерий Сильвестра.

Определение: Квадратичная форма A(X,X) в вещественном линейном пространстве V называется положительно определенной, если , причем .

Квадратичная форма A(X,X) называется отрицательно определенной, если ; причем

Пусть — базис в V, , тогда , при этом .

Рассмотрим матрицу Ae данной формы

Главными минорами матрицы Ae назовем определители (окаймляющие левый верхний угол матрицы) .

Теорема (критерий Сильвестра знакоопределенности квадратичной формы):

Квадратичная форма A(X,X) является положительно определенной тогда и только тогда, когда все числовые миноры положительны, т. е.

Квадратичная форма A(X,X) является отрицательно определенной тогда и только тогда, когда знаки главных миноров чередуются, т. е.

При любой другой комбинации знаков главных миноров знак квадратичной формы не определен.

Доказательство: (Без доказательства).

< Предыдущая   Следующая >

Квадратичные формы

Закон инерции квадратичных форм

Итак, согласно теореме о приведении квадратичной формы, для любой квдратичной формы (A(x,x)) существует канонический базис ({f_1, , f_2, …, f_n}), так что для любого вектора (x),
[
x=sum _{k=1}^neta _kf_k,quad A(x,x)=sum _{k=1}^n lambda _keta _k^2.
]

Так как (A(x,x)) вещественно-значна, и наши замены базиса также включают только вещественные числа, приходим к выводу, что числа ( lambda _k) вещественны. Среди этих чисел есть положительные, отрицательные и равные нулю.

Определение. Число (n_+) положительных чисел ( lambda _k) называется положительным индексом квадратичной формы (A(x,x)) , число (n_-) отрицательных чисел (lambda _k) называется отрицательным индексом квадратичной формы , число ((n_++n_-)) называется рангом квадратичной формы . Если (n_+=n), квадратичная форма называется положительной.

Вообще говоря, приведение квадратичной формы к диагональному виду реализуется не единственным образом. Возникает вопрос: зависят ли числа (n_+), (n_-) от выбора базиса, в котором квдратичная форма диагональна?

Теорема (Закон инерции квадратичных форм).
Положительный и отрицательный индексы квадратичной формы не зависят от способа приведения ее к каноническому виду.

Пусть имеется два канонических базиса, ({f}), ({g}), так что любой вектор (x) представляется в виде:
[
x=sum_{k=1}^neta _kf_k=sum _{m=1}^nzeta _mg_m,
]
причем
[
A(x,x)=sum_{k=1}^nlambda _keta _k^2=sum _{m=1}^nmu _mzeta _m^2. quad quad(71)
]
Пусть среди (lambda _k) первые (p) положительны, остальные либо отрицательны, либо нули, среди (mu_m) первые (s) положительны, остальные либо отрицательны, либо нулевые. Нам необходимо доказать, что (p=s). Перепишем (71):
[
sum_{k=1}^plambda _keta _k^2-sum _{m=s+1}^nmu _mzeta _m^2=-sum_{k=p+1}^nlambda _keta _k^2+sum _{m=1}^smu _mzeta _m^2, quad quad(72)
]
так что все слагаемые в обеих частях равенства неотрицательны. Предположим, что (p) и (s) не равны, например, (p < s). Поставим такую задачу: найти такой (x), что (eta _k=0, , k=1,2,..,p), ( zeta _m=0, m=s+1,, s+2, …, n). При этом левая часть последнего равенства обращается в 0. Наши условия означают (p+n-s) условий на вектор (x), причем каждое условие выражается в линейном уравнении на координаты вектора (x), в правой части которого 0. Итого имеем (p+n-s < n) уравнений на вектор в (n)- мерном пространстве. Однородная система уравнений, которую мы получили, имеет (n) неизвестных (координат вектора (x)) и (p+n-s) уравнений, так что согласно общим теоремам о системах уравнений имеется ненулевое решение, которому соответствует ненулевой вектор (x). В левой части (72) имеем 0, в правой части присутствуют (zeta _m, m=1,,2,…,s) с ненулевыми положительными коэффицентами, остальные слагаемые в правой части тоже неотрицательны. Таким образом, получаем: (zeta _m=0, m=1,,2,…,s). В итоге все (zeta _m=0, m=1,,2,…,n), координаты вектора (x) в базисе ({g}),
равны нулю, так что (x) — нулевой вектор. Пришли к противоречию.

Мы доказали, что совпадают положительные индексы. Аналогично можно доказать, что совпадают и отрицательные индексы.
ч.т.д.

1. Преобразовать к сумме квадратов квадратичные формы:

а) (x_1^2+2x_1x_2+2x_2^2+4x_2x_3+5x_3^2);

б) (x_1x_2+x_2x_3+x_3x_1);

в) (2x_1^2+x_2^2-4x_1x_2-4x_2x_3);

г) (8x^2+5y^2+2z^2-6yz+4xz-2xy).

2. Найти те значения параметра (lambda), при котором следующие квадратичные формы являются положительными:

а) (5x_1^2+x_2^2+lambda x_3^2+4x_1x_2-2x_1x_3-2x_2x_3);

б) ( 2x_1^2+x_2^2+3x_3^2+2lambda x_1x_2+2x_1x_3).

Понравилась статья? Поделить с друзьями:
  • Ростелеком плохая скорость интернета как исправить
  • Найти как стелить линолеум
  • Прыщи на лбу как исправить
  • Как найти синус 422
  • Как склоняется слово составить