Вступ до середніх величин

Центральна тенденція розподілу даних

Середнє значення є одним із найфундаментальніших інструментів у статистиці для опису центральної тенденції розподілу даних. Воно конденсує сукупність спостережень у єдине інформативне значення, що відображає типовий рівень, навколо якого розподілені дані. Узагальнюючи точку балансу набору даних, середнє значення допомагає виявити його загальну тенденцію та підтримує багато методів описового та вибіркового аналізу.


Загальне формулювання середнього значення було запропоноване Оскаром Чізіні в 1929 році. Відповідно до його означення, середнім значенням множини числових значень є таке число \( M \), яке при підстановці замість кожного спостереження в симетричну функцію \( F \) залишає загальний результат незмінним:

\[ F(x_1, x_2, \dots, x_n) = F(M, M, \dots, M) \]

Функція є симетричною, якщо порядок даних не має значення; функція залежить лише від самих значень, а не від того, як вони розташовані.

Це абстрактне означення об'єднує різні типи середніх значень, такі як арифметичне, геометричне та гармонійне середнє в межах єдиної концептуальної структури. Кожне конкретне середнє значення можна отримати, обравши певну функцію \( F \), що представляє зв'язок між значеннями даних. Якщо функція \( F \) обрана як сума всіх значень даних, тобто:

\[ F(x_1, x_2, \dots, x_n) = x_1 + x_2 + \dots + x_n \]

тоді загальний вираз набуває вигляду:

\[ x_1 + x_2 + \dots + x_n = nM \]

З цього співвідношення ми отримаємо формулу арифметичного середнього:

\[ M = \frac{x_1 + x_2 + \dots + x_n}{n} = \frac{1}{n} \sum_{i=1}^{n} x_i \]

Середнє як мінімум помилки заміни

Інше впливове означення середнього значення було впроваджене Абрахамом Вальдом, який пов'язав концепцію середнього з ідеєю помилки заміни. Згідно з цим підходом, середнє значення — це значення, яке мінімізує загальну помилку, що виникає, коли всі точки даних у множині замінюються одним репрезентативним числом. По суті, воно визначає точку, яка забезпечує найменшу можливу розбіжність між спостережуваними значеннями та їхнім спільним замінником. Математично це можна виразити як:

\[ M = \arg\min_{\mu} \sum_{i=1}^{n} (x_i – \mu)^2 \]

Значення \( \mu \), яке мінімізує цей вираз, відповідає арифметичному середньому, яке балансує квадрати відхилень даних.

Середнє Гільдлера

Середнє Гільдлера, також відоме як степеневе середнє або узагальнене середнє, визначає сімейство середніх, що включає арифметичне, геометричне та гармонійне середнє як окремі випадки. Воно визначається для додатних значень \( x_1, x_2, \dots, x_n \) як:

\[ M_s = \left( \frac{1}{n} \sum_{i=1}^{n} x_i^s \right)^{\frac{1}{s}} \]

Для різних значень \( s \) середнє Гільдлера відтворює основні класичні середні.

  • При \( s = 1 \) воно відповідає арифметичному середньому.
  • При \( s = 0 \) воно стає геометричним середнім.
  • При \( s = -1 \) воно дає гармонійне середнє.
  • При \( s = 2 \) воно представляє квадратичне середнє.

Список основних середніх

Кожна формула представляє конкретний спосіб узагальнення набору даних, залежно від того, як окремі значення впливають на кінцевий результат. Хоча всі середні описують центральну тенденцію, їхня інтерпретація змінюється залежно від математичної операції, що їх визначає.

Коли використовувати кожне середнє

  • Арифметичне середнє (\(M_1\)): використовується, коли значення комбінуються адитивно, наприклад, підсумовуючи такі величини, як дохід, довжина або температура. Воно виражає точку балансу набору даних, де кожне спостереження однаково впливає на результат.

  • Зважене арифметичне середнє (\(M_1\) зважене): застосовується, коли деякі точки даних мають більшу значущість або зустрічаються частіше за інші. Кожне спостереження множиться на вагу, що відображає його важливість, перед обчисленням середнього значення.

  • Геометричне середнє (\(M_0\)): підходить для величин, що комбінуються мультиплікативно, таких як коефіцієнти зростання, прибутковість або індекси. Воно описує репрезентативну швидкість зміни з часом, показуючи, як значення масштабуються пропорційно.

  • Зважене геометричне середнє (\(M_0\) зважене): використовується, коли мультиплікативні дані мають різні рівні важливості. Часто зустрічається у фінансах або аналізі ефективності, де певні елементи впливають на результат сильніше за інші.

  • Гармонічне середнє (\(M_{-1}\)): доречне для усереднення темпів, швидкостей або відношень, де менші значення повинні мати більшу вагу. Воно відображає істинну середню швидкість, коли загальна відстань, кількість або обсяг роботи залишаються сталими.

  • Квадратичне середнє (\(M_2\)): обирається, коли значення комбінуються квадратично, як у випадку з напругою, прискоренням або потужністю. Воно підкреслює ефективну величину даних, надаючи більшого впливу більшим відхиленням.

Середнє або математичне сподівання випадкової змінної

У випадку дискретних випадкових змінних, середнє або математичне сподівання обчислюється як сума всіх можливих значень \(X\), зважених на їхні ймовірності:

\[ \mu = E(X) = \sum_x x f(x) \]

У випадку неперервних випадкових змінних, середнє значення отримують шляхом інтегрування кожного можливого значення \(X\), зваженого на його щільність ймовірності по всій області визначення:

\[ \mu = E(X) = \int_{-\infty}^{+\infty} x f(x)dx \]

Обидві форми виражають одну й ту саму базову ідею: середнє відображає те, де значення випадкової змінної мають тенденцію групуватися. У дискретному випадку воно знаходиться шляхом підсумовування всіх можливих результатів, тоді як у неперервному випадку той самий принцип плавно поширюється через інтегрування.

Середнє значення вибіркового розподілу

Вибіркове середнє представляє середнє значення спостережень у вибірці, отриманій із генеральної сукупності, і слугує оцінкою середнього значення генеральної сукупності. Воно визначається як

\[ \overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i \]

де \( \overline{X} \) — вибіркове середнє, \( n \) — обсяг вибірки, а \( X_i \) представляє значення \( I \)-го спостереження у вибірці.