Яка різниця між дисперсією та коваріацією випадкових величин?

Дисперсія випадкової величини вимірює, наскільки її можливі значення відхиляються від середнього, тоді як коваріація описує, як дві випадкові величини змінюються разом. Позитивна коваріація означає, що величини мають тенденцію до одночасного збільшення або зменшення, тоді як негативна коваріація означає, що вони рухаються в протилежних напрямках.

Як коефіцієнт кореляції між випадковими величинами пов'язаний із коваріацією?

Коефіцієнт кореляції між двома випадковими величинами отримують шляхом ділення їхньої коваріації на добуток їхніх стандартних відхилень. Це дає значення від −1 до +1, що виражає як силу, так і напрямок лінійного зв'язку між змінними.

Дисперсія та коваріація випадкової величини

2025-05-01

Що таке дисперсія випадкової змінної?

У описовій статистиці дисперсія виражає, наскільки множина значень у середньому відрізняється від свого середнього значення. Вона отримується шляхом піднесення до квадрата кожного відхилення від середнього та обчислення їхнього середнього арифметичного і зазвичай виражається як:

\[ \sigma^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i – M)^2 \]

Еквівалентна форма підкреслює, що дисперсію також можна отримати через співвідношення:

\[ \sigma^2 = M(x^2) - [M(x)]^2 \]

Це друге формулювання пов'язує середнє значення квадратів значень із квадратом середнього значення, пропонуючи простіший спосіб обчислити дисперсію, коли обидві величини відомі.

Переходячи до випадкових змінних, концепція дисперсії випадкової змінної \(X\) природно випливає із загального означення, наведеного вище, з кількома важливими уточненнями. Загалом, дисперсія випадкової змінної \(X\) виражає, наскільки можливі значення \(X\) за очікуванням відхиляються від свого середнього, тобто від їхнього математичного сподівання \(E[X]\). Вона кількісно визначає загальний розсіювання розподілу, надаючи міру того, на якій відстані результати змінної зазвичай лежать від цього теоретичного центру.

У випадку дискретних випадкових змінних дисперсія виражається як:

\[ \sigma^2 = E[(X – \mu)^2] = \sum_x (x – \mu)^2 f(x) \]

\(x\) представляє кожне можливе значення, яке може набувати випадкова змінна \(X\)
\(\mu = E[X]\) — це математичне сподівання або теоретичне середнє значення змінної
\(f(x)\) — це функція ймовірності, яка присвоює ймовірність кожному можливому результату \(X\).

У випадку неперервних випадкових змінних дисперсія задається наступним інтегралом:

\[ \sigma^2 = E[(X - \mu)^2] = \int_{-\infty}^{+\infty} (x - \mu)^2 f(x)\,dx \]

Тут \(f(x)\) — це функція щільності ймовірності, яка описує, як ймовірність розподілена по можливих значеннях \(X\).

Слід пам'ятати, що при переході від змінних, які набувають дискретних значень, до тих, що визначені на неперервному проміжку, підсумовування замінюється інтегралом.

Відхилення та стандартне відхилення

Вираз \(x - \mu\) називається відхиленням спостереження від його середнього значення. Він вказує, на якій відстані конкретне значення \(x\) лежить від центральної точки відліку \(\mu = E[X]\), показуючи, чи є це значення вищим або нижчим за середнє і на скільки.

Додатний квадратний корінь із дисперсії, що позначається \(\sigma\), відомий як стандартне відхилення. Воно представляє типову величину, на яку значення випадкової змінної зазвичай відрізняються від свого середнього, забезпечуючи більш інтуїтивну міру розсіювання, виражену в тих самих одиницях, що й дані.

Приклад 1

Розглянемо випадкову змінну \(X\), що представляє кількість дефектних деталей, знайдених у партії з десяти компонентів, виготовлених на виробничій лінії. На основі попередніх спостережень розподіл ймовірностей \(X\) задано наступним чином:

\(x\)	\(0\)	\(1\)	\(2\)	\(3\)	\(4\)
\(f(x)\)	\(0.1\)	\(0.3\)	\(0.4\)	\(0.1\)	\(0.1\)

Тепер спробуємо обчислити дисперсію та стандартне відхилення цієї випадкової змінної.

Почнемо зі знаходження математичного сподівання, яке представляє теоретичне середнє значення розподілу. Для дискретної випадкової змінної математичне сподівання визначається як:

\[ E[X] = \sum_x x f(x) \]

Підставивши числові значення, отримаємо:

\[ \begin{align} E[X] &= (0)(0.1) + (1)(0.3) + (2)(0.4) + (3)(0.1) + (4)(0.1) \\[6pt] &= 0 + 0.3 + 0.8 + 0.3 + 0.4 = 1.8 \end{align} \]

Отже, середнє значення (X) дорівнює \(mu = 1.8\). Це означає, що в середньому в кожній виробничій партії очікується близько 1.8 дефектних деталей.

Тепер ми можемо обчислити дисперсію, яка для дискретної випадкової змінної визначається як:

\[ \mathrm{Var}(X) = \sum_x (x - \mu)^2 f(x) \]

Підстановка значень із таблиці дає:

\[ \begin{align} \mathrm{Var}(X) &= (0 – 1.8)^2(0.1) + (1 – 1.8)^2(0.3) + (2 – 1.8)^2(0.4) + (3 – 1.8)^2(0.1) + (4 – 1.8)^2(0.1) \\[6pt] &= (3.24)(0.1) + (0.64)(0.3) + (0.04)(0.4) + (1.44)(0.1) + (4.84)(0.1)\\[6pt] &= 0.324 + 0.192 + 0.016 + 0.144 + 0.484 = 1.16 \end{align} \]

Нарешті, стандартне відхилення — це додатний квадратний корінь із дисперсії:

\[ \sigma = \sqrt{\mathrm{Var}(X)} = \sqrt{1.16} \approx 1.08 \]

На завершення, дисперсія \(X\) становить \( \sigma^2 = 1.16 \), а стандартне відхилення \( \sigma \approx 1.08 \).

Цей результат показує, що кількість дефектних деталей у партії зазвичай відхиляється приблизно на одну одиницю від середнього значення 1.8, що вказує на помірний рівень мінливості у виробничому процесі.

Коваріація випадкової величини

Коли ми хочемо дослідити, як пов'язані дві випадкові величини, ми використовуємо коваріацію. Вона кількісно визначає ступінь, в якій дві змінні, \(X\) та \(Y\), змінюються разом. У випадку дискретних випадкових величин коваріація задається формулою:

\[ \sigma_{XY} = E[(X – \mu_X)(Y - \mu_Y)] = \sum_x \sum_y (x – \mu_X)(y - \mu_Y) f(x, y) \]

\((x – \mu_X)\) представляє відхилення кожного значення \(X\) від його середнього.
\((y - \mu_Y)\) представляє відхилення кожного значення \(Y\) від його середнього.
\(f(x, y)\) позначає сукупний розподіл ймовірностей двох змінних, який присвоює ймовірність кожній можливій парі результатів \((x, y)\).

У випадку неперервних випадкових величин коваріація визначається як:

\[ \sigma_{XY} = E[(X - \mu_X)(Y – \mu_Y)] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x - \mu_X)(y – \mu_Y) f(x, y), dx, dy \]

У цьому виразі \(f(x, y)\) позначає сукупну функцію щільності ймовірності двох змінних.

Коефіцієнт кореляції

Щоб зрозуміти, наскільки сильно дві випадкові величини \(X\) та \(Y\) лінійно пов'язані, ми використовуємо міру, відому як коефіцієнт кореляції. На відміну від коваріації, яка лише вказує, чи рухаються дві величини в одному чи в протилежних напрямках, коефіцієнт кореляції забезпечує стандартизовану міру, яка не залежить від масштабу змінних.

Його отримують, поділивши коваріацію на добуток стандартних відхилень \(X\) та \(Y\). Цей крок нормалізації усуває вплив одиниць вимірювання та дозволяє виразити зв'язок між двома змінними на фіксованій чисельній шкалі.

Формально, коефіцієнт кореляції, що позначається як \(\rho_{XY}\), визначається як:

\[ \rho_{XY} = \frac{\sigma_{XY}}{\sigma_X \sigma_Y} = \frac{\mathrm{Cov}(X, Y)}{\sqrt{\mathrm{Var}(X)} \sqrt{\mathrm{Var}(Y)}} \]

\(\sigma_{XY}\) представляє коваріацію між \(X\) та \(Y\)
\(\sigma_X\), \(\sigma_Y\) — відповідні стандартні відхилення двох змінних.
Значення \(\rho_{XY}\) завжди лежить у проміжку від \(−1\) до \(+1\).

Значення, близьке до \(1\), вказує на сильний позитивний лінійний зв'язок, і обидві змінні мають тенденцію до спільного зростання. Значення, близьке до \(−1\), вказує на сильний негативний зв'язок, отже, коли одна змінна зростає, інша має тенденцію до зменшення. Значення біля \(0\) свідчить про відсутність лінійного зв'язку між ними.

Приклад 2

Розглянемо ситуацію, в якій дві випадкові величини сильно, але не ідеально, пов'язані. Змінна \(X\) може представляти кількість годин, витрачених на навчання протягом тижня, а \(Y\) — відповідний результат, отриманий у короткому тесті. Їхній сукупний розподіл ймовірностей визначено наступним чином:

\(X\)	\(Y\)	\(f(x, y)\)
1	2	0.2
2	3	0.3
3	5	0.3
4	6	0.2

Обчислимо коефіцієнт кореляції.

Таблиця показує чіткий позитивний зв'язок: більші значення \(X\), як правило, пов'язані з вищими значеннями \(Y\), хоча й не ідеально пропорційно.

Почнемо з обчислення математичних сподівань двох змінних, які отримуємо наступним чином:

\[ \begin{align} E[X] &= (1)(0.2) + (2)(0.3) + (3)(0.3) + (4)(0.2) = 2.5 \\[6pt] E[Y] &= (2)(0.2) + (3)(0.3) + (5)(0.3) + (6)(0.2)\ = 4.0 \end{align} \]

Математичне сподівання добутку \(XY\) дорівнює: \[ \begin{align} E[XY] &= (1 \cdot 2)(0.2) + (2 \cdot 3)(0.3) + (3 \cdot 5)(0.3) + (4 \cdot 6)(0.2) \\[6pt] &= 0.4 + 1.8 + 4.5 + 4.8 = 11.5 \end{align} \]

Тепер ми можемо обчислити коваріацію:

\[ \begin{align} \mathrm{Cov}(X, Y) &= E[XY] – E[X]E[Y] \\[6pt] &= 11.5 – (2.5)(4.0) = 11.5 – 10 = 1.5 \end{align} \]

Дисперсія \(X\) становить: \[ \mathrm{Var}(X) = E[X^2] – [E[X]]^2 = 7.3 – (2.5)^2 = 7.3 – 6.25 = 1.05 \]

Дисперсія \(Y\) становить: \[ \mathrm{Var}(Y) = E[Y^2] - [E[Y]]^2 = 18.2 - (4.0)^2 = 18.2 - 16 = 2.2 \]

Коефіцієнт кореляції отримуємо як: \[ \begin{align} \rho_{XY} &= \frac{\mathrm{Cov}(X, Y)}{\sqrt{\mathrm{Var}(X)} \sqrt{\mathrm{Var}(Y)}} \\[6pt] &= \frac{1.5}{\sqrt{1.05}\sqrt{2.2}} \\[6pt] &= \frac{1.5}{1.075 \times 1.483} = \frac{1.5}{1.594} \approx 0.94 \end{align} \]

Кореляція між \(X\) та \(Y\) становить приблизно \(0.94\). Це значення вказує на дуже сильний позитивний лінійний зв'язок: коли \(X\) збільшується, \(Y\) також має тенденцію до збільшення майже пропорційно, хоча й не абсолютно точно.