Діагоналізація матриці

Концепція
Структура статті показана на концептуальній карті, де кожна гілка представляє основний компонент, а підвузли виділяють конкретні поняття, що розглядаються.
Середній
3
Потребує
0
Дозволяє
Наступні концепції, Власні значення та власні вектори, Матриці, Векторні простори, є необхідними попередніми вимогами для цієї статті.

Умова діагоналізації

Квадратна матриця називається діагональною, якщо можливо знайти базис відповідного векторного простору, що складається повністю з власних векторів цієї матриці. Коли такий базис існує, матрицю можна представити в особливо простому вигляді: як діагональну матрицю, елементами якої є саме власні значення. Це представлення є не просто нотаційним зручністю; воно розкриває внутрішню геометричну структуру лінійного перетворення, пов'язаного з матрицею, і істотно спрощує обчислення степенів, експонент та розв'язання лінійних диференціальних рівнянь.

Нехай \(A\) — квадратна матриця порядку \(n\) з елементами в \(\mathbb{R}\) або \(\mathbb{C}\). Матриця \(A\) є діагональною тоді і тільки тоді, коли існує обернена матриця \(P\) та діагональна матриця \(D\), такі що виконується наступний зв'язок:

\[ A = P D P^{-1} \]

Стовпці \(P\) є власними векторами \(A\), а діагональні елементи \(D\) — відповідними власними значеннями. Еквівалентно, наведений вище зв'язок можна переписати наступним чином:

\[ P^{-1} A P = D \]

Це формулювання чітко вказує на те, що \(P\) є матрицею переходу від одного базису до іншого: вона перетворює стандартне представлення \(A\) на діагональне представлення \(D\), виражене в базисі власних векторів.

Матриця \(D\) є єдиною з точністю до порядку власних значень уздовж діагоналі, тоді як \(P\) не є єдиною, оскільки кожен власний вектор може бути замінений будь-яким його ненульовим скалярним кратним.

Власні значення та власні вектори

Побудова діагоналізації повністю покладається на власну структуру \(A\). Нагадаємо, що скаляр \(\lambda\) є власним значенням \(A\), якщо існує ненульовий вектор \(\mathbf{v}\), що задовольняє наступне рівняння:

\[ A \mathbf{v} = \lambda \mathbf{v} \]

Такий вектор \(\mathbf{v}\) називається власним вектором \(A\), пов'язаним з \(\lambda\). Власні значення визначаються шляхом розв'язання характеристичного рівняння, яке отримують, вимагаючи, щоб матриця \(A – \lambda I\) була виродженою:

\[ \det(A – \lambda I) = 0 \]

Ліва частина цього рівняння є поліномом степеня \(n\) відносно \(\lambda\), який називається характеристичним поліномом \(A\). Його корені, враховуючи кратність, є власними значеннями \(A\). Після того, як власне значення \(\lambda_k\) визначено, відповідні власні вектори є ненульовими розв'язками однорідної лінійної системи:

\[ (A - \lambda_k I)\,\mathbf{v} = \mathbf{0} \]

Множина всіх розв'язків, включаючи нульовий вектор, утворює підпростір \(\mathbb{R}^n\) (або \(\mathbb{C}^n\)), який називається власним простором, пов'язаним з \(\lambda_k\).

Алгебраїчна та геометрична кратність

Кожне власне значення \(\lambda_k\) має два різні поняття кратності, які відіграють центральну роль у визначенні того, чи є \(A\) діагональною. Алгебраїчна кратність \(\lambda_k\), що позначається \(m_a(\lambda_k)\), — це кратність \(\lambda_k\) як кореня характеристичного полінома. Геометрична кратність \(\lambda_k\), що позначається \(m_g(\lambda_k)\), — це розмірність відповідного власного простору, тобто:

\[ m_g(\lambda_k) = \dim \ker(A - \lambda_k I) \]

Можна показати, що для кожного власного значення геометрична кратність не перевищує алгебраїчну кратність:

\[ 1 \leq m_g(\lambda_k) \leq m_a(\lambda_k) \]

Матриця \(A\) є діагональною тоді і тільки тоді, коли для кожного власного значення \(\lambda_k\) геометрична кратність дорівнює алгебраїчній кратності. Зокрема, матриця з \(n\) різними власними значеннями завжди є діагональною, оскільки в такому випадку обидві кратності для кожного власного значення дорівнюють одиниці.

Процедура діагоналізації

Практична побудова матриць \(P\) та \(D\) здійснюється за чітко визначеною послідовністю кроків.

  • Перший крок полягає в обчисленні характеристичного полінома \(\det(A – \lambda I)\) та пошуку всіх його коренів. Ці корені є власними значеннями \(\lambda_1, \lambda_2, \ldots, \lambda_k\) матриці \(A\).

  • Другий крок полягає у визначенні для кожного власного значення базису відповідного власного простору шляхом розв'язання однорідної системи \((A - \lambda_j I)\,\mathbf{v} = \mathbf{0}\). Об'єднання всіх цих базисів повинно містити рівно \(n\) лінійно незалежних векторів, щоб матриця була діагональною.

  • Третій крок полягає у формуванні матриці \(P\) шляхом розміщення власних векторів у стовпцях у порядку, що відповідає розташуванню власних значень у \(D\). Діагональна матриця \(D\) потім будується шляхом розміщення власного значення \(\lambda_j\) в позиції \((j,j)\).

Після того, як матриця \(P\) сформована, перевіряють, чи є вона обернею, і обчислюють \(P^{-1}\), завершуючи таким чином розклад \(A = P D P^{-1}\).

Приклад 1

Розглянемо наступну матрицю:

\[ A = \begin{pmatrix} 3 & 1 \\ 0 & 2 \end{pmatrix} \]

Щоб знайти власні значення, обчислюють визначник \(A – \lambda I\):

\[ \det(A – \lambda I) = \det \begin{pmatrix} 3 - \lambda & 1 \\ 0 & 2 – \lambda \end{pmatrix} = (3 – \lambda)(2 - \lambda) \]

Отже, характеристичне рівняння має наступний вигляд:

\[ (3 – \lambda)(2 - \lambda) = 0 \]

Два корені: \(\lambda_1 = 2\) та \(\lambda_2 = 3\), обидва прості, тому матриця є діагонізуемою. Для \(\lambda_1 = 2\) розв'язують систему \((A - 2I)\,\mathbf{v} = \mathbf{0}\):

\[ \begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix} \]

Перший рядок дає \(v_1 + v_2 = 0\), звідси \(v_1 = -v_2\). Вибравши \(v_2 = 1\), отримаємо власний вектор \(\mathbf{v}_1 = (-1,\, 1)^T\). Для \(\lambda_2 = 3\) розв'язують \((A - 3I)\,\mathbf{v} = \mathbf{0}\):

\[ \begin{pmatrix} 0 & 1 \\ 0 & -1 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix} \]

Обидва рядки дають \(v_2 = 0\), при цьому \(v_1\) залишається довільним. Вибравши \(v_1 = 1\), отримаємо власний вектор \(\mathbf{v}_2 = (1,\, 0)^T\). Матриця \(P\) формується шляхом розміщення цих власних векторів як стовпців:

\[ P = \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix} \]

Її обернена матриця обчислюється безпосередньо:

\[ P^{-1} = \begin{pmatrix} 0 & 1 \\ 1 & 1 \end{pmatrix} \]

Діагональна матриця містить власні значення у відповідному порядку:

\[ D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} \]

Можна перевірити, що рівність \(A = P D P^{-1}\) виконується шляхом прямого множення. Таким чином, матриця \(A\) є діагонізуемою, і її діагонізація задається наведеним вище розкладом із побудованими \(P\) та \(D\).

Приклад 2

Розглянемо матрицю з кратним власним значенням. Нехай \(A\) буде наступною матрицею розміром \(3 \times 3\):

\[ A = \begin{pmatrix} 4 & 1 & 0 \\ 0 & 4 & 0 \\ 0 & 0 & 2 \end{pmatrix} \]

Характеристичний поліном отримують, розкривши визначник \(A - \lambda I\):

\[ \det(A - \lambda I) = \det \begin{pmatrix} 4 – \lambda & 1 & 0 \\ 0 & 4 - \lambda & 0 \\ 0 & 0 & 2 – \lambda \end{pmatrix} = (4 – \lambda)^2 (2 - \lambda) \]

Отже, власними значеннями є \(\lambda_1 = 4\) з алгебраїчною кратністю два та \(\lambda_2 = 2\) з алгебраїчною кратністю один. Просте власне значення \(\lambda_2 = 2\) не викликає труднощів. Розв'язання \((A - 2I)\,\mathbf{v} = \mathbf{0}\) дає систему:

\[ \begin{pmatrix} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 0 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \\ v_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix} \]

Другий рядок дає \(v_2 = 0\), і підстановка в перший рядок дає \(v_1 = 0\), тоді як \(v_3\) залишається довільним. Таким чином, власний підпростір є одновимірним і породжується вектором \(\mathbf{v}_3 = (0,\, 0,\, 1)^T\). Кратне власне значення \(\lambda_1 = 4\) є критичним випадком. Розв'язання \((A – 4I)\,\mathbf{v} = \mathbf{0}\) дає систему:

\[ \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & -2 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \\ v_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix} \]

Перший рядок дає \(v_2 = 0\), а третій рядок дає \(v_3 = 0\), тоді як \(v_1\) залишається довільним. Отже, власний підпростір, пов'язаний з \(\lambda_1 = 4\), є одновимірним і породжується вектором \(\mathbf{v}_1 = (1,\, 0,\, 0)^T\). Оскільки геометрична кратність \(\lambda_1 = 4\) дорівнює одному, що строго менше за її алгебраїчну кратність (два), трьох знайдених власних векторів недостатньо для формування базису \(\mathbb{R}^3\), і матриця \(A\) не є діагонізуемою.

Цей приклад ілюструє, що наявність кратного власного значення сама по собі не перешкоджає діагонізації: важливо, чи має відповідний власний підпростір розмірність, що дорівнює алгебраїчній кратності. Матриця з кратним власним значенням може бути або не бути діагонізуемою залежно від рангу \(A - \lambda I\).

Коли діагоналізування неможливе

Не кожна квадратна матриця є діагоналізуемою. Матриця не є діагоналізуемою саме тоді, коли принаймні для одного власного значення геометрична кратність є строго меншою за алгебраїчну кратність. У таких випадках власний підпростір, пов'язаний із цим власним значенням, є занадто малим, щоб забезпечити достатню кількість лінійно незалежних власних векторів. Стандартним прикладом є матриця:

\[ B = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix} \]

Її характеристичний поліном дорівнює \((2 – \lambda)^2\), отже \(\lambda = 2\) є єдиним власним значенням з алгебраїчною кратністю два. Розв'язання \((B – 2I)\,\mathbf{v} = \mathbf{0}\) дає:

\[ \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix} \]

Єдиною умовою є \(v_2 = 0\), тому власний підпростір є одновимірним і породжується вектором \((1,, 0)^T\). Оскільки геометрична кратність дорівнює одному, тоді як алгебраїчна кратність дорівнює двом, неможливо скласти базис із власних векторів для \(\mathbb{R}^2\), і матриця \(B\) не є діагоналізуемою.

Матриці такого типу вивчаються в рамках жорданової нормальної форми, яка забезпечує канонічне представлення для недаігоналізуємих матриць шляхом введення жорданових блоків.

Степені діагоналізуемої матриці

Одним із найбезпосередніших застосувань діагоналізування є обчислення цілих степенів матриці. Для діагоналізуемої матриці \(A = P D P^{-1}\) \(k\)-й степінь має наступний компактний вираз:

\[ A^k = P D^k P^{-1} \]

Ця тотожність випливає з того, що \(A^2 = (PDP^{-1})(PDP^{-1}) = PD^2P^{-1}\), і за допомогою індукції ця закономірність поширюється на будь-яке додатне ціле число \(k\). Оскільки \(D\) є діагональною, її \(k\)-й степінь просто отримують, підносячи кожен діагональний елемент до степеня \(k\):

\[ D^k = \begin{pmatrix} \lambda_1^k & & \ & \ddots & \ & & \lambda_n^k \end{pmatrix} \]

Це спостереження перетворює інакше трудомістке множення матриць на просте скалярне обчислення.