Как найти минимальный многочлен матрицы

Теорема Гамильтона-Кэли. Минимальный многочлен матрицы

Многочлен p(lambda) переменной lambda называется аннулирующим для квадратной матрицы A, если при подстановке в многочлен матрицы A вместо переменной lambda получаем нулевую матрицу, т.е. p(A)=O.

Напомним, что для любой квадратной матрицы A многочлен Delta_{A}(lambda)=det(A-lambda E) называется характеристическим.

Теорема 7.7 Гамильтона–Кэли. Характеристический многочлен матрицы является аннулирующим для нее, т.е. Delta_{A}(A)=O.

В самом деле, обозначим через (A-lambda E)^{+} матрицу, присоединенную к характеристической матрице (A-lambda E). Тогда из (7.7) следует

(A-lambda E)cdot(A-lambda E)^{+}=Delta_{A}(lambda)cdot E,quad (A-lambda E)^{+}cdot(A-lambda E)=Delta_{A}(lambda)cdot E.

(7.27)

Правые части этих равенств можно рассматривать как многочлены с матричными коэффициентами (каждый коэффициент характеристического многочлена умножается на единичную матрицу). Из (7.27) следует, что λ-матрица Delta_{A}(lambda)E делится на (A-lambda E) слева и справа без остатка, т.е. остаток равен нулевой матрице. По обобщенной теореме Безу остаток равен левому и правому значениям многочлена Delta_{A}(lambda)E при подстановке матрицы A вместо A. Отсюда получаем Delta_{A}(lambda)E=O, т.е. Delta_{A}(lambda)=O, что и требовалось доказать.


Пример 7.11. Показать, что характеристический многочлен матрицы A=begin{pmatrix} 1&1&1\ 1&1&1\ 1&1&1 end{pmatrix} является для нее аннулирующим.

Решение. Находим характеристический многочлен матрицы (см. пример 7.8)

Delta_{A}(lambda)=det(A-lambda E)= begin{vmatrix}1-lambda&1&1\1&1-lambda&1\1&1&1-lambdaend{vmatrix}= (1-lambda)^3+2-3(1-lambda)=3 lambda^2-lambda^3.

Подставляя вместо переменной lambda матрицу A, получаем

Delta_{A}=3A^2-A^3= 3! begin{pmatrix} 1&1&1\ 1&1&1\ 1&1&1end{pmatrix}^2-begin{pmatrix} 1&1&1\ 1&1&1\ 1&1&1 end{pmatrix}^3= 3! begin{pmatrix}3&3&3\3&3&3\ 3&3&3 end{pmatrix}- begin{pmatrix}9&9&9\9&9&9\9&9&9end{pmatrix}=O.

что и требовалось показать.


Теорема Гамильтона-Кэли говорит о том, что для квадратной матрицы A n-го порядка всегда найдется аннулирующий многочлен n-й степени (характеристический многочлен имеет n-ю степень). Возникает вопрос о существовании аннулирующего многочлена меньшей степени.

Минимальным многочленом матрицы A называется ее аннулирующий многочлен наименьшей степени (со старшим коэффициентом, равным единице). Минимальный многочлен будем обозначать mu_{A}(lambda).


Свойства минимального многочлена матрицы

1. Любой аннулирующий многочлен матрицы делится на минимальный многочлен (без остатка). В частности, характеристический многочлен делится на минимальный многочлен.

Действительно, предположим противное, пусть аннулирующий многочлен p(lambda) делится на минимальный многочлен mu_{A}(lambda) с остатком:

p(lambda)=q(lambda)cdotmu_{A}(lambda)+r(lambda),

причем степень остатка r(lambda) меньше степени делителя mu_{A}(lambda). Тогда, подставляя вместо lambda матрицу A, получаем r(A)=O, так как p(A)=O и mu_{A}(lambda)=O. Следовательно, r(lambda) — аннулирующий многочлен, степень которого меньше, чем степень минимального многочлена, что противоречит определению минимального многочлена. Таким образом, предположение оказалось ложным, т.е. любой аннулирующий многочлен делится на минимальный (без остатка). Поскольку по теореме Гамильтона-Кэли характеристический многочлен является аннулирующим, то он также делится на минимальный многочлен.

2. Для каждой квадратной матрицы A минимальный многочлен единственный.

В самом деле, если бы существовали два минимальных многочлена, то они имели бы одну и ту же степень и делились бы друг на друга, т.е. отличались бы только постоянным множителем. Однако, старшие коэффициенты этих многочленов равны единице, поэтому такие многочлены совпадают.

3. Все собственные значения матрицы являются корнями минимального многочлена.

Действительно, из равенства mu_{A}(lambda)=O следует, что λ-матрица mu_{A}(lambda)cdot E делится (например, слева) на характеристическую матрицу (A-lambda E), то есть mu_{A}(lambda)cdot E=(A-lambda E)cdot S(lambda), где S(lambda) — некоторая λ-матрица (левое частное). Найдем определитель левой и правой частей последнего равенства с учетом теоремы 2.2 и пункт З замечаний 2.2:

[mu_{A}(lambda)]^n=Delta_{A}(lambda)cdotdet{S(lambda)}.

(7.28)

Подставляя в равенство (7.28) любой корень lambda_i,~i=1,ldots,n характеристического многочлена, получаем [mu_{A}(lambda_i)]^n=0, т.е. mu_{A}(lambda_i)=0, что и требовалось показать.

4. Если характеристический многочлен имеет вид (7.24), то минимальный многочлен этой матрицы можно представить в форме

mu_{A}(lambda)= (lambda-lambda_1)^{m_1}cdot (lambda-lambda_2)^{m_2}cdotldotscdot(lambda-lambda_k)^{m_k},

(7.29)

где 1leqslant m_1leqslant n_1,~1leqslant m_2leqslant n_2 и т.д., причем m_1+m_2+ldots+m_k=mleqslant n.

Это утверждение следует из свойства 3.

5. Минимальный многочлен матрицы A находится по формуле

mu_{A}(lambda)=frac{(-1)^nDelta_A(lambda)}{d_{n-1}(lambda)},,

(7.30)

где d_{n-1}(lambda) — наибольший общий делитель миноров (n-1)-го порядка характеристической матрицы (A-lambda E).

Действительно, по свойству 1 характеристический многочлен Delta_{A}(lambda) делится на минимальный многочлен, т.е. Delta_{A}(lambda)=(-1)^n p(lambda)mu_{A}(lambda), где p(lambda) — некоторый многочлен со старшим коэффициентом, равным единице. Умножив обе части равенства mu_{A}(lambda)cdot E=(A-lambda E)cdot S(lambda) (см. свойство 3) на (-1)^n p(lambda), получим в левой части характеристический многочлен, умноженный на единичную матрицу:

Delta_{A}(lambda)cdot E=(-1)^ncdot(A-lambda E)cdot p(lambda)cdot S(lambda).

Сравним это равенство с (7.27):

Delta_A(lambda)cdot E=(A-lambda E)cdot(A-lambda E)^{+}.

(7.31)

При делении λ-матрицы Delta_A(lambda)cdot E слева на характеристическую матрицу (A-lambda E) частные (левые) должны совпадать в силу единственности деления. Поэтому

(-1)^ncdot p(lambda)cdot S(lambda)=(A-lambda E)^{+},

т.е. многочлен p(lambda) — делитель всех элементов присоединенной матрицы. Заметим, что степень многочлена p(lambda) должна быть максимальной, так как минимальный многочлен mu_A(lambda) имеет наименьшую возможную степень, а сумма степеней этих двух многочленов в силу равенства Delta_A(lambda)=(-1)^n p(lambda) mu_A(lambda) фиксирована и равна n. Поэтому многочлен p(lambda) — это наибольший общий делитель элементов присоединенной матрицы (A-lambda E)^{+}. Так как элементы присоединенной матрицы пропорциональны минорам (n-1)-го порядка характеристической матрицы, то p(lambda)=d_{n-1}(lambda).

Таким образом, Delta_A(lambda)=(-1)^ncdot d_{n-1}(lambda)cdotmu_A(lambda), откуда следует формула (7.30).

6. Минимальный многочлен матрицы A совпадает с последним инвариантным множителем e_n(lambda) характеристической матрицы (A-lambda E).

В самом деле, наибольший общий делитель d_{n}(lambda) единственного минора n-го порядка характеристической матрицы (A-lambda E) отличается от определителя этой матрицы множителем (-1)^n, т.е. Delta_A(lambda)=(-1)^n d_{n}(lambda). Подставляя это выражение в (7.30), получаем

mu_A(lambda)=frac{(-1)^ncdot(-1)^ncdot d_n(lambda)}{d_{n-1}(lambda)}=frac{d_n(lambda)}{d_{n-1}(lambda)}=e_n(lambda).


Способы нахождения минимального многочлена матрицы

Пусть A — квадратная матрица n-го порядка. Требуется найти ее минимальный многочлен.

Первый способ.

1. Составить характеристическую матрицу (A-lambda E).

2. Привести ее к нормальному диагональному виду (A-lambda E)sim operatorname{diag} Bigl(e_1(lambda),e_2(lambda), ldots,e_n(lambda)Bigr).

Последний инвариантный множитель e_n(lambda) является минимальным многочленом матрицы A (по свойству 6).

Второй способ.

1. Составить характеристическую матрицу (A-lambda E).

2. Найти характеристический многочлен Delta_A(lambda)=det(A-lambda E).

3. Найти наибольший общий делитель d_{n-1}(lambda) миноров (n-l)-ro порядка λ-матрицы (A-lambda E).

4. По формуле (7.30) получить минимальный многочлен.


Пример 7.12. Найти минимальный многочлен матрицы A=begin{pmatrix}1&1&1\1&1&1\1&1&1end{pmatrix}, используя минимальный многочлен, найти степень A^m с натуральным показателем minmathbb{N}.

Решение. Первый способ. 1. Составляем характеристическую матрицу

A-lambda E=begin{pmatrix}1-lambda &1&1\1&1-lambda&1\1&1&1-lambda end{pmatrix}!.

(7.30)

2. Приводим эту λ-матрицу к нормальному диагональному виду. Поменяем местами первую и третью строки. Выберем в качестве ведущего элемента единицу, оказавшуюся в левом верхнем углу матрицы. При помощи ведущего элемента делаем равными нулю остальные элементы первой строки и первого столбца:

A-lambda E=begin{pmatrix}1-lambda &1&1\1&1-lambda&1\1&1&1-lambda end{pmatrix}sim begin{pmatrix}1&1&1-lambda\1&1-lambda&1\1-lambda&1&1end{pmatrix}sim begin{pmatrix}1&0&0\0&-lambda&lambda\0&lambda&2 lambda-lambda^2 end{pmatrix}!.

Берем в качестве ведущего элемент (-lambda) и делаем равными нулю все остальные элементы второй строки и второго столбца. Затем умножаем вторую и третью строки на (-1), чтобы старшие коэффициенты диагональных элементов оказались равными единице. Получим нормальный диагональный вид:

A-lambda Esimbegin{pmatrix}1&0&0\0&-lambda&lambda\0&lambda&2 lambda-lambda^2 end{pmatrix}sim begin{pmatrix}1&0&0\ 0&-lambda&0\0&0&3 lambda-lambda^2 end{pmatrix}sim begin{pmatrix}1&0&0\ 0&lambda&0\ 0&0&lambda^2-3 lambda end{pmatrix}!.

Минимальный многочлен матрицы mu_A(lambda)=e_3(lambda)=lambda^2-3 lambda.

Второй способ. 1. Составляем характеристическую матрицу (7.32).

2. Находим характеристический многочлен Delta_A(lambda)=3 lambda^2-lambda^3 (см. пример 7.11).

3. Находим миноры второго порядка характеристической матрицы (A-lambda E). Ограничимся минорами, расположенными в первых двух строках:

M_{{}_{1,2}}^{{}^{1,2}}=begin{vmatrix}1-lambda&1\ 1&1-lambda end{vmatrix}=lambda^2-2 lambda,quad M_{{}_{1,3}}^{{}^{1,2}}=begin{vmatrix}1-lambda&1\ 1&1end{vmatrix}=-lambda,quad M_{{}_{2,3}}^{{}^{1,2}}=begin{vmatrix}1&1\ 1-lambda&1 end{vmatrix}=lambda.

Выражения для остальных миноров совпадают с найденными. Наибольший общий делитель многочленов lambda^2-2 lambda,,(-lambda),, lambda равен lambda, т.е. d_2(lambda)=lambda.

4. По формуле (7.30) получаем: mu_A(lambda)=frac{(-1)^3(3 lambda^2-lambda^3)}{lambda}= lambda^2-3 lambda.

Для проверки вычислим

mu_A(A)=A^2-3A= begin{pmatrix}1&1&1\1&1&1\1&1&1end{pmatrix}^2-3! begin{pmatrix}1&1&1\1&1&1\1&1&1end{pmatrix}= begin{pmatrix}3&3&3\3&3&3\ 3&3&3 end{pmatrix}-3! begin{pmatrix}1&1&1\1&1&1\1&1&1end{pmatrix}=O.

Действительно, минимальный многочлен mu_A(lambda) является аннулирующим, т.е. mu_A(A)=O. Заметим, что для матрицы A минимальный и характеристический многочлены отличаются только множителем (-lambda).

Найдем теперь степень A^m матрицы A. Для этого рассмотрим многочлен lambda^m. Разделим его на минимальный многочлен mu_A(lambda). Остаток от деления (многочлен степени не выше первой) представим в виде alpha,lambda+beta. Получим

lambda^m=p(lambda)(lambda^2-3 lambda)+alphacdot lambda+beta,

где p(lambda) — частное, а (alphacdotlambda+beta) — остаток. Найдем коэффициенты alpha и beta, подставляя в равенство корни минимального многочлена:

– при lambda=0 имеем: 0^m=p(lambda) cdot0+alphacdot0+beta;

– при lambda=3 имеем: 3^m=p(lambda) cdot0+alphacdot3+beta;

Следовательно, alpha=3^{m-1},~beta=0. Поэтому lambda^m=p(lambda) (lambda^2-3 lambda)+3^{m-1}lambda. Теперь подставим вместо переменной lambda матрицу A:

A^m=p(A)cdot(A^2-3cdot A)+3^{m-1}cdot A=p(A)cdot O+3^{m-1}cdot A= 3^{m-1}cdot! begin{pmatrix}1&1&1\ 1&1&1\ 1&1&1 end{pmatrix}!.

Результат совпадает с полученным в примере 7.10.

Математический форум (помощь с решением задач, обсуждение вопросов по математике).

Кнопка "Поделиться"

Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.

From Wikipedia, the free encyclopedia

In linear algebra, the minimal polynomial μA of an n × n matrix A over a field F is the monic polynomial P over F of least degree such that P(A) = 0. Any other polynomial Q with Q(A) = 0 is a (polynomial) multiple of μA.

The following three statements are equivalent:

  1. λ is a root of μA,
  2. λ is a root of the characteristic polynomial χA of A,
  3. λ is an eigenvalue of matrix A.

The multiplicity of a root λ of μA is the largest power m such that ker((AλIn)m) strictly contains ker((AλIn)m−1). In other words, increasing the exponent up to m will give ever larger kernels, but further increasing the exponent beyond m will just give the same kernel. Formally, m is the nilpotent index of AλIn.

If the field F is not algebraically closed, then the minimal and characteristic polynomials need not factor according to their roots (in F) alone, in other words they may have irreducible polynomial factors of degree greater than 1. For irreducible polynomials P one has similar equivalences:

  1. P divides μA,
  2. P divides χA,
  3. the kernel of P(A) has dimension at least 1.
  4. the kernel of P(A) has dimension at least deg(P).

Like the characteristic polynomial, the minimal polynomial does not depend on the base field. In other words, considering the matrix as one with coefficients in a larger field does not change the minimal polynomial. The reason for this differs from the case with the characteristic polynomial (where it is immediate from the definition of determinants), namely by the fact that the minimal polynomial is determined by the relations of linear dependence between the powers of A: extending the base field will not introduce any new such relations (nor of course will it remove existing ones).

The minimal polynomial is often the same as the characteristic polynomial, but not always. For example, if A is a multiple aIn of the identity matrix, then its minimal polynomial is Xa since the kernel of aInA = 0 is already the entire space; on the other hand its characteristic polynomial is (Xa)n (the only eigenvalue is a, and the degree of the characteristic polynomial is always equal to the dimension of the space). The minimal polynomial always divides the characteristic polynomial, which is one way of formulating the Cayley–Hamilton theorem (for the case of matrices over a field).

Formal definition[edit]

Given an endomorphism T on a finite-dimensional vector space V over a field F, let IT be the set defined as

{displaystyle {mathit {I}}_{T}={pin mathbf {F} [t]mid p(T)=0}}

where F[t ] is the space of all polynomials over the field F. IT is a proper ideal of F[t ]. Since F is a field, F[t ] is a principal ideal domain, thus any ideal is generated by a single polynomial, which is unique up to units in F. A particular choice among the generators can be made, since precisely one of the generators is monic. The minimal polynomial is thus defined to be the monic polynomial which generates IT. It is the monic polynomial of least degree in IT.

Applications[edit]

An endomorphism φ of a finite-dimensional vector space over a field F is diagonalizable if and only if its minimal polynomial factors completely over F into distinct linear factors. The fact that there is only one factor Xλ for every eigenvalue λ means that the generalized eigenspace for λ is the same as the eigenspace for λ: every Jordan block has size 1. More generally, if φ satisfies a polynomial equation P(φ) = 0 where P factors into distinct linear factors over F, then it will be diagonalizable: its minimal polynomial is a divisor of P and therefore also factors into distinct linear factors. In particular one has:

  • P = X k − 1: finite order endomorphisms of complex vector spaces are diagonalizable. For the special case k = 2 of involutions, this is even true for endomorphisms of vector spaces over any field of characteristic other than 2, since X 2 − 1 = (X − 1)(X + 1) is a factorization into distinct factors over such a field. This is a part of representation theory of cyclic groups.
  • P = X 2X = X(X − 1): endomorphisms satisfying φ2 = φ are called projections, and are always diagonalizable (moreover their only eigenvalues are 0 and 1).
  • By contrast if μφ = X k with k ≥ 2 then φ (a nilpotent endomorphism) is not necessarily diagonalizable, since X k has a repeated root 0.

These cases can also be proved directly, but the minimal polynomial gives a unified perspective and proof.

Computation[edit]

For a nonzero vector v in V define:

{mathit  {I}}_{{T,v}}={pin {mathbf  {F}}[t];|;p(T)(v)=0}.

This definition satisfies the properties of a proper ideal. Let μT,v be the monic polynomial which generates it.

Properties[edit]

  • Since IT,v contains the minimal polynomial μT, the latter is divisible by μT,v.
  • If d is the least natural number such that v, T(v), …, Td(v) are linearly dependent, then there exist unique a0, a1, …, ad−1 in F, not all zero, such that
    {displaystyle a_{0}v+a_{1}T(v)+cdots +a_{d-1}T^{d-1}(v)+T^{d}(v)=0}

    and for these coefficients one has

    {displaystyle mu _{T,v}(t)=a_{0}+a_{1}t+ldots +a_{d-1}t^{d-1}+t^{d}.}
  • Let the subspace W be the image of μT,v(T ), which is T-stable. Since μT,v(T ) annihilates at least the vectors v, T(v), …, Td−1(v), the codimension of W is at least d.
  • The minimal polynomial μT is the product of μT,v and the minimal polynomial Q of the restriction of T to W. In the (likely) case that W has dimension 0 one has Q = 1 and therefore μT = μT,v ; otherwise a recursive computation of Q suffices to find μT .

Example[edit]

Define T to be the endomorphism of R3 with matrix, on the canonical basis,

{begin{pmatrix}1&-1&-1\1&-2&1\0&1&-3end{pmatrix}}.

Taking the first canonical basis vector e1 and its repeated images by T one obtains

{displaystyle e_{1}={begin{bmatrix}1\0\0end{bmatrix}},quad Tcdot e_{1}={begin{bmatrix}1\1\0end{bmatrix}}.quad T^{2}!cdot e_{1}={begin{bmatrix}0\-1\1end{bmatrix}}{mbox{ and}}quad T^{3}!cdot e_{1}={begin{bmatrix}0\3\-4end{bmatrix}}}

of which the first three are easily seen to be linearly independent, and therefore span all of R3. The last one then necessarily is a linear combination of the first three, in fact

T 3 ⋅ e1 = −4T 2 ⋅ e1Te1 + e1,

so that:

μT, e1 = X 3 + 4X 2 + XI.

This is in fact also the minimal polynomial μT and the characteristic polynomial χT : indeed μT, e1 divides μT which divides χT, and since the first and last are of degree 3 and all are monic, they must all be the same. Another reason is that in general if any polynomial in T annihilates a vector v, then it also annihilates T ⋅v (just apply T to the equation that says that it annihilates v), and therefore by iteration it annihilates the entire space generated by the iterated images by T of v; in the current case we have seen that for v = e1 that space is all of R3, so μT, e1(T ) = 0. Indeed one verifies for the full matrix that T 3 + 4T 2 + TI3 is the zero matrix:

{displaystyle {begin{bmatrix}0&1&-3\3&-13&23\-4&19&-36end{bmatrix}}+4{begin{bmatrix}0&0&1\-1&4&-6\1&-5&10end{bmatrix}}+{begin{bmatrix}1&-1&-1\1&-2&1\0&1&-3end{bmatrix}}+{begin{bmatrix}-1&0&0\0&-1&0\0&0&-1end{bmatrix}}={begin{bmatrix}0&0&0\0&0&0\0&0&0end{bmatrix}}}

References[edit]

  • Lang, Serge (2002), Algebra, Graduate Texts in Mathematics, vol. 211 (Revised third ed.), New York: Springer-Verlag, ISBN 978-0-387-95385-4, MR 1878556

Многочленом

от матрицы

над полем

называется результат последовательности
операций, записанной в форме многочлена
с

коэффициентами из поля
,
при
.

Определение.
Аннулирующим многочленом матрицы

называется многочлен
,
такой, что
.

Определение.
Минимальным многочленом матрицы

над полем

называется нормированный многочлен

наименьшей степени, для которого
.

Теорема. Минимальный
многочлен матрицы делит любой аннулирующий
многочлен той же матрицы.

Теорема. Степень
минимального многочлена матрицы не
превосходит ее порядка.

Рассмотрим
последовательность
,,,

мерных векторов.

На каждом шаге

будем проверять, является ли система
полученных векторов зависимой, либо
нет. На некотором шаге
,
векторы впервые окажутся линейно
зависимыми, т.е. при некоторых коэффициентах
выполнится соотношение
.

Многочлен

называется минимальным многочленом
матрицы

относительно вектора
.
Минимальный многочлен единственен.

Теорема. Минимальный
многочлен суммы векторов является
наименьшим общим кратным минимальных
многочленов векторов – слагаемых.

Теорема. Минимальный
многочлен матрицы

относительно любого вектора

делит минимальный многочлен матрицы.

Замечание. Пусть


— квадратная матрица над конечным полем


и
.
Последовательность
,,
является периодической. Длина периода
зависит от свойств минимального
многочлена матрицы

относительно вектора
.

Очевидно, наименьшее
общее кратное минимальных многочленов
базисных векторов относительно матрицы

является минимальным многочленом этой
матрицы.

Замечание. Можно
рассматривать матрицы, элементами
которых являются функции, скажем, от
переменной
.
В этом случае определитель матрицы
также является функцией от
.

Стандартным
является детерминант вида
.
Здесь матрица под знаком детерминанта
отличается от матрицы

тем, что вместо элементов

на главной диагонали находятся элементы

.

Многочлен

называется характеристическим многочленом
матрицы
.

Теорема
Гамильтона-Кэли. Каждая матрица является
корнем своего характеристического
многочлена.

Соседние файлы в папке Лекции по криптологии

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Матричный анализ

. Функции от матриц.

  1. Определение функции.
  2. Df. Пусть – функция скалярного аргумента. Требуется определить, что понимать под f(A), т.е. нужно распространить функцию f(x) на матричное значение аргумента.

    Решение этой задачи известно, когда f(x) – многочлен: , тогда .

    Определение f(A) в общем случае.

    Пусть m(x) – минимальный многочлен А и он имеет такое каноническое разложение , , – собственные значения А. Пусть многочлены g(x) и h(x) принимают одинаковые значения.

    Пусть g(A)=h(A) (1), тогда многочлен d(x)=g(x)-h(x) – аннулирующий многочлен для А, так как d(A)=0, следовательно, d(x) делится на линейный многочлен, т.е. d(x)=m(x)*q(x) (2).

    Тогда , т.е. (3), , , .

    Условимся m чисел для f(x) таких называть значениями функции f(x) на спектре матрицы А, а множество этих значений будем обозначать .

    Если множество f(Sp A) определено для f(x), то функция определена на спектре матрицы А.

    Из (3) следует, что многочлены h(x) и g(x) имеют одинаковые значения на спектре матрицы А.

    Наши рассуждения обратимы, т.е. из (3) Ю (3) Ю (1). Таким образом, если задана матрица А, то значение многочлена f(x) вполне определяется значениями этого многочлена на спектре матрицы А, т.е. все многочлены gi(x), принимающие одинаковые значения на спектре матрицы имеют одинаковые матричные значения gi(A). Потребуем, чтобы определение значения f(A) в общем случае подчинялось такому же принципу.

    Значения функции f(x) на спектре матрицы А должны полносильно определить f(A), т.е. функции, имеющие одни и те же значения на спектре должны иметь одно и то же матричное значение f(A). Очевидно, что для определения f(A) в общем случае, достаточно найти многочлен g(x), который бы принимал те же значения на спектре А, что и функция f(A)=g(A).

    Df. Если f(x) определена на спектре матрицы А, то f(A)=g(A), где g(A) – многочлен, принимающий на спектре те же значения, что и f(A),

    Df.Значением функции от матрицы А назовем значение многочлена от этой матрицы при .

    Среди многочленов из С[x], принимающих одинаковые значения на спектре матрицы А, что и f(x), степени не выше (m-1), принимающий одинаковые значения на спектре А, что и f(x) – это остаток от деления любого многочлена g(x), имеющего те же значения на спектре матрицы А, что и f(x), на минимальный многочлен m(x)=g(x)=m(x)*g(x)+r(x).

    Этот многочлен r(x) называют интерполяционным многочленом Лагранжа-Сильвестра для функции f(x) на спектре матрицы А.

    Замечание. Если минимальный многочлен m(x) матрицы А не имеет кратных корней, т.е. , то значение функции на спектре .

    Пример:

    Найти r(x) для произвольной f(x), если матрица

    . Построим f(H1). Найдем минимальный многочлен H1 – последний инвариантный множитель [xE-H1]:

    , dn-1=x2; dn-1=1;

    mx=fn(x)=dn(x)/dn-1(x)=x0 – n –кратный корень m(x), т.е. n-кратные собственные значения H1.

    , r(0)=f(0), r’(0)=f’(0),…,r(n-1)(0)=f(n-1)(0) Ю.

  3. Свойства функций от матриц.

Свойство № 1. Если матрица имеет собственные значения (среди них могут быть и кратные), а , то собственными значениями матрицы f(A) являются собственные значения многочлена f(x): .

Доказательство:

Пусть характеристический многочлен матрицы А имеет вид:

, , . Посчитаем . Перейдем от равенства к определителям:

Сделаем замену в равенстве:

(*)

Равенство (*) справедливо для любого множества f(x), поэтому заменим многочлен f(x) на , получим:

.

Слева мы получили характеристический многочлен для матрицы f(A), разложенный справа на линейные множители, откуда следует, что – собственные значения матрицы f(A).

ЧТД.

Свойство № 2. Пусть матрица и – собственные значения матрицы А, f(x) – произвольная функция, определенная на спектре матрицы А, тогда собственные значения матрицы f(A) равны .

Доказательство:

Т.к. функция f(x) определена на спектре матрицы А, то существует интерполяционный многочлен матрицы r(x) такой, что , а тогда f(A)=r(A), а у матрицы r(A) собственными значениями по свойству № 1 будут которым соответственно равны .

ЧТД.

Свойство № 3. Если А и В подобные матрицы, , т.е. , и f(x) – произвольная функция, определенная на спектре матрицы А, тогда

Доказательство:

Т.к. А и В подобны, то их характеристические многочлены одинаковы Ю одинаковы и их собственные значения, поэтому значение f(x) на спектре матрицы А совпадает со значение функции f(x) на спектре матрицы В, при чем существует интерполяционный многочлен r(x) такой, что f(A)=r(A), , Ю.

ЧТД.

Свойство № 4. Если А – блочно-диагональная матрица , то

Следствие: Если , то , где f(x) – функция, определенная на спектре матрицы А.

  1. Интерполяционный многочлен Лагранжа-Сильвестра.

Случай № 1.

Пусть дана . Рассмотрим первый случай: характеристический многочлен имеет ровно n корней, среди которых нет кратных, т.е. все собственные значения матрицы А различны, т.е. , Sp A – простой. В этом случае построим базисные многочлены lk(x):

.

Пусть f(x) – функция, определенная на спектре матрицы А и значениями этой функции на спектре будут . Надо построить .

Построим:

.

Обратим внимание, что .

Пример: Построить интерполяционный многочлен Лагранжа-Сильвестра для матрицы .

Построим базисные многочлены:

Тогда для функции f(x), определенной на спектре матрицы А, мы получим:

.

Возьмем , тогда интерполяционный многочлен

.

Случай № 2.

Характеристический многочлен матрицы А имеет кратные корни, но минимальный многочлен этой матрицы является делителем характеристического многочлена и имеет только простые корни, т.е. . В этом случае интерполяционный многочлен строится так же как и в предыдущем случае.

Случай № 3.

Рассмотрим общий случай. Пусть минимальный многочлен имеет вид:

,

где m1+m2+…+ms=m, deg r(x)<m.

Составим дробно-рациональную функцию:

и разложим ее на простейшие дроби.

Обозначим: . Умножим (*) на и получим

где – некоторая функция, не обращающаяся в бесконечность при .

Если в (**) положить , получим:

Для того, чтобы найти ak3 надо (**) продифференцировать дважды и т.д. Таким образом, коэффициент aki определяется однозначно.

После нахождения всех коэффициентов вернемся к (*), умножим на m(x) и получим интерполяционный многочлен r(x), т.е.

.

Пример: Найти f(A), если , где t – некоторый параметр,

.

Найдем минимальный многочлен матрицы А:

.

Проверим, определена ли функция на спектре матрицы А

Умножим (*) на (х-3)

при х=3

Ю

Умножим (*) на (х-5)

.

Таким образом, — интерполяционный многочлен.

Пример 2.

Если , то доказать, что

Найдем минимальный многочлен матрицы А:

— характеристический многочлен.

d2(x)=1, тогда минимальный многочлен

.

Рассмотрим f(x)=sin x на спектре матрицы:

Ю функция является определенной на спектре.

Умножим (*) на

Ю.

Умножим (*) на :

.

Вычислим g , взяв производную (**):

. Полагая ,

, т.е. .

Итак, ,

,

,

.

ЧТД.

Пример 3.

Пусть f(x) определена на спектре матрицы, минимальный многочлен которой имеет вид . Найти интерполяционный многочлен r(x) для функции f(x).

Решение: По условию f(x) определена на спектре матрицы А Ю f(1), f’(1), f(2), f ‘(2), f ‘’ (2) определены.

.

.

Используем метод неопределенных коэффициентов:

Если f(x)=ln x

f(1)=0 f’(1)=1

f(2)=ln 2 f’(2)=0.5 f’’(2)=-0.25

4. Простые матрицы.

Пусть матрица , так как С алгебраически замкнутое поле, то характеристический многочлен , где , ki – алгебраическая кратность корня .

Обозначим множество векторов удовлетворяющих собственному значению — подпространство, , где r – ранг матрицы .

Теорема. Если квадратная матрица А имеет собственное значение , а матрица имеет , то имеет кратность .

DF. Размерность называется геометрической кратностью собственного значения .

В свете этого определения теорема переформулируется следующим образом:

Теорема. Алгебраическая кратность собственного значения не меньше его геометрической кратности.

DF. Матрица называется простой, если аглебраическая кратность каждого ее собственного значения совпадает с его геометрической кратностью.

Из линейной алгебры следует, что матрица простая тогда и только тогда, когда .

Если матрица А простая, тогда существует n линейно независимых собственных векторов x1, x2, …,xn таких, что , для . Запишем это равенство в матричном виде:

, т.е. А – простая тогда и только тогда, когда и .

Замечание. Обратим внимание на то, что собственные значения А и А’ совпадают. Действительно, собственные значения для А’ это значения . Таким образом характеристические многочлены матриц совпадают. Размерность , тогда . Поэтому, если — собственное значение матрицы А, то и является собственным значением матрицы А’, т.е. существует , что (*) или . Транспонируем (*) и получим (транспонируем это равенство). В этом случае называют левым собственным вектором матрицы А. Соответственно, — называют правым собственным подпространством, — называют левым собственным подпространством.

Рассмотрим следующую конструкцию: если матрица А простая, то существует n линейно независимых собственных векторов x1, x2, …, xn и существует n линейно независимых собственных векторов y1, y2,…,yn, где x1, x2, …, xn такие, что , (1); y1, y2,…,yn такие, что (2), .

Запишем равенство (1) в виде (3) Ю что, если А – простая, то существуют матрицы X и Y, что или (**).

DF. Множества векторов x1, x2, …, xn и y1, y2,…,yn удовлетворяющие условию , т.е. называются квазиортогональными.

Учитывая равенство (**) и определение делаем вывод: множества левых и правых собственных векторов простой матрицы А квазиортогональны и .

Очень важной для матриц является следующая теорема:

СПЕКТРАЛЬНАЯ ТЕОРЕМА. Если А – простая матрица порядка n над полем С и p(x) многочлен из кольца C[x], и x1, x2, …, xn и y1, y2,…,yn – множества правых и левых собственных векторов матрицы А, то , а сопутствующая матрица , где .

Следствие. Сопутствующие матрицы обладают следующими свойства:

Пример. Показать, что матрица простая. Найти сопутствующие матрицы для матрицы А и использовать их для А20, p(x)=x20.

Решение:

Ю

существуют 2 линейно независимые правые и левые системы собственных векторов.

Найдем правые собственные векторы:

Найдем левые собственные векторы:

Найдем сопутствующие матрицы:

.

5.Спектральное разложение функции f(A).

Спектральное разложение для f(A) имеет важное значение и очевидно тесно примыкает к спектральной теореме для простых матриц.

Пусть дана матрица и пусть , .

Теорема. Если , а функция f(x) определена на спектре матрицы А и — значение j-й производной от f(x) в собственном значении , где , , то существуют такие независимые от f(x) матрицы , что (1) , при чем коммутирует с матрицей А и образуют линейно независимую систему в пространстве

Доказательство:заметим, что и , где — базисные многочлены, принимающие одинаковые значения на спектре матрицы А, (3). Сравнивая (1) и (2) и учитывая (3) получим, что . Матрицы называются компонентами матрицы А или компонентными матрицами.

ЧТД.

Опишем следующие свойств компонентных матриц, которые в некоторой степени обобщают свойства сопровождающих матриц.

Теорема. Компонентные матрицы обладают следующими свойствами:

.

Замечание. Для того, чтобы найти компонентные матрицы для f(x) определенной на спектре матрицы А необходимо и достаточно знать базисные многочлены, входящие в интерполяционный многочлен, однако нахождение интерполяционного многочлена f(x) связано с некоторыми трудностями, а поэтому будем вычислять компонентные матрицы подбирая соответствующим образом системы функций.

Пример: Найти компоненты для матрицы .

.

Пусть f(x) определена на спектре А, тогда согласно спектральной теореме .

  1. f(x)=1
  2. E=1Z11+0Z12+1Z21=Z11+Z21

  3. f(x)=x-4
  4. A-4E=0Z11+1Z12+(-2)Z21=Z12-2Z21

  5. f(x)=(x-4)2

(A-4E)2=4Z21

.

Таким образом, для любой функции f(x), определенное на спектре матрицы А

.

Пример 2.

Найти компоненты для матрицы

.

Найдем минимальный многочлен матрицы А.

  1. f(x)=1
  2. E=Z11+Z21+Z31

  3. f(x)=x+1
  4. (A+E)=2Z21+Z31+Z12

  5. f(x)=(x+1)2
  6. (A+E)2=4Z21+Z31

  7. f(x)=x-1

A-E=-2Z11+Z12-Z31

1. f(x)=1 E=Z11+Z21+Z31

2. f(x)=x+1 A+E=Z11Z22+2Z31

3. f(x)=(x+1)2 (A+E)2=Z11+4Z31

4. f(x)=x-1 (A-E)=-Z11-2Z21+Z22

Z31=A

-Z22=(A+E)2-E-3A

Z12=Z22

Z11=(E-A)-Z22

6.Определенные матрицы.

Эрмитовы и квадратичные матрицы.

Пусть А – эрмитова матрица (А*=А).

Рассмотрим функцию h(x) – действительная функция комплексного аргумента.

Рассмотрим:

DF. Функция , где А – эрмитова матрица, называется эрмитовой формой от n переменных x1, …, xn, где А – матрица эрмитовой формы.

Очевидно, что если А – действительная симметрическая матрица, то в этом случае получаем квадратичную форму .

Для каждой эрмитовой (квадратичной) формы инвариантами являются: ранг (число не нулевых коэффициентов в квадратичной форме нормального вида совпадающих с рангом матрицы А), p (индекс) – число положительных коэффициентов в квадратичной форме нормального вида, оно совпадает с числом положительных собственных значений, сигнатура. Эти числа r, p, гр-r не зависят от тех преобразований, которые совершаются над данными формами.

В дальнейшем ограничимся рассмотрением только квадратичных форм. Нас интересуют 2 семейства матриц.

DF. Действительная симметрическая матрица А называется положительно определенной, если для .

DF. Действительная симметрическая матрица А называется неотрицательно определенной, если для .

Оба типа матриц относятся к классу определенных матриц. Заметим, что положительно определенная матрица невырожденная, т.е. если предположить, что она вырожденная, то , , что противоречит условию.

Теорема № 1. Действительная симметрическая матрица n-го порядка будет определенной ранга тогда и только тогда , когда она имеет r положительных собственных значений, а остальные (n-r) – собственные значения равны 0.

Теорема № 2. Действительная симметрическая матрица положительна определена тогда и только тогда, когда все ее главные миноры положительны.

Теорема № 3. Действительная симметрическая матрица положительно определена тогда и только тогда, когда все ее главные миноры положительны.

7.Неотрицательные матрицы.

DF. Матрица называется неотрицательной, если каждый ее элемент положителен.

Квадратные матрицы такого типа возникают во множестве задач и это определяющее свойство приводит к сильным результатам об их строении. Теорема Фробениуса-Перона является основным результатом для неотрицательных матриц.

Пусть матрицы . Будем говорить, что , если б в частности A>B, если .

Вспомним матрицу перестановки , т.е. матрицы перестановки обязательно ортогональны. Произведение приводит к перестановке столбцов матрицы А.

DF. При матрица называется приводимой матрицей, если существует такая матрица перестановки Р, что совподает с матрицей , где А11, А12, А22 – квадратные матрицы меньшего чем n порядка. Если матрица Р не существует, то матрица А называется неприводимой.

Понятие приводимости имеет значение при решении матричных уравнений , ибо если Ф – приводима, то осуществив замену переменных, которую подсказывают равенства , получаем

, где , .

и решаем матричное уравнение с матрицей более низкого порядка. Затем, и решаем матричное уравнение. Таким образом, если А – приводима, то решение уравнения высокого порядка сводится к решению уравнений более низкого порядка, при чем собственные значения матриц А11 и А22 в своей совокупности составляет множество значений матрицы А.

Интересно, что явление приводимости не связано с величиной матрицы, а зависит лишь от расположения нулевых элементов в матрице.

В связи с этим, используют идею направленного графа матрицы, которую можно взять в качестве характеризации неприводимости матрицы. Наметим первые шаги тоерии и получим вторую характеризацию неприводимости матриц.

DF. Пусть р1, р2, …, рn – n различных точек комплексной плоскости и . Для каждого нулевого элемента матрицы А составим направленную линию от рi к рj. Получающаяся в результате фигура на комплексной плоскости называется направленным графом матрицы.

Например:

DF. Говорят, что любой направленный граф связен, если для каждой пары точек существует направленный путь .

Легко доказать, что квадратная матрица неприводима тогда и только тогда, когда ее граф является связным.

8.Теорема Фробениуса-Перона.

Очевидно, что если , то для . Более того, мы покажем, что для достаточно больших p .

Лемма № 1. Если матрица неотрицательна и неприводима, то .

Доказательство:

Если взять произвольный вектор и , то . И пусть вектор имеет место, очевидно, что Z имеет по крайней мере столько же нулевых положительных элементов, что и y. В самом деле, если предположить, что Z имеет меньше нулевых компонент, то обозначим , тогда и разбив матрицу А на блоки следующим образом

мы будем иметь .

Учитывая, что , то , тогда получаем, что , что противоречит неприводимости матрицы.

Для следующего вектора повторим рассуждения и т.д. В итоге получим, что для некоторого ненулевого вектора y .

ЧТД.

Для ненулевой неприводимой матрицы А рассмотрим действительную функцию r(x), определенную для ненулевых векторов следующим образом: , (Ax)i – i-я координата вектора Ах.

. Из определения следует, что и кроме того, r(x) –такое наименьшее значение , что .

Очевидно, что r(x) инвариантна относительна замены x на , поэтому в дальнейшем можно рассматривать замкнутое множество , такое .

Однако, r(x) может иметь разрывы в точках, где координата x обращается в 0, поэтому рассмотрим множество векторов и обозначим . По лемме № 1 каждый вектор из N будет положительным, а поэтому т.е. для .

Обозначим через наибольшее число, для которого , . спектральный радиус матрицы А. Если Можно показать, что существует вектор y, что .

Замечание. Могут существовать и другие векторы в L для которых r(x) принимает значение r, поэтому любой такой вектор называется экстремальным для матрицы А (Az=rz).

Интерес к числу r объясняется следующим результатом.

Лемма № 2. Если матрица неотрицательна и неприводима, то число является собственным значением матрицы А, кроме того каждый экстремальный вектор для А положителен и является правым собственным вектором для А, отвечающим собственному значению r.

Основным результатом является теорема Фробениуса-Перона для непрерывных матриц.

Теорема Фробениуса-Перона. Если матрица неотрицательна и неприводима, то:

    1. А имеет положительное собственное значение, равное спектральному радиусу матрицы А;
    2. существует положительный правый собственный вектор, соответствующий собственному значению r.
    3. собственное значение имеет алгебраическую кратность равную 1.

Эта теорема была опубликована в 1912 году Фробениусом и явилась обобщением теоремы Перона, которая является следствием.

Теорме Перона (следствие). Положительная квадратная матрица А имеет положительное и действительное собственное значение r, имеющее алгебраическую кратность 1 и превосходит модули всех других собственных значений матрицы А. Этому r соответствует положительный собственный вектор.

Используя теорему Фробениуса-Перона, можно найти максимальное действительное значение матрицы, не используя характеристического многочлена матрицы.

Понравилась статья? Поделить с друзьями:
  • Как найти родителей в узбекистане
  • Дедлайн в гта 5 онлайн как найти
  • Как составить смету для получения гранта
  • Как составить словарную статью для толкового словаря
  • Как найти будущий спрос