Геометричний розподіл

2025-05-01

Вступ до геометричного розподілу

Геометричний розподіл описує кількість незалежних випробувань, необхідних для спостереження першого успіху в повторюваному експерименті. Умови передбачають послідовність ідентичних випробувань Бернульлі, кожне з яких має однакову ймовірність успіху, тому цей розподіл моделює час очікування, а не фіксовану кількість успіхів. На відміну від розподілів, заснованих на вибірці без повернення, наприклад, гіпергеометричного розподілу, де ймовірність успіху змінюється після кожного вилучення, геометричний розподіл передбачає, що ймовірність успіху залишається сталою для всіх випробувань.

Щоб формалізувати цей контекст, розглянемо послідовність випробувань, де кожен результат може бути класифікований як успіх або невдача. Ймовірність успіху позначається як \( p \), і припускається, що випробування є незалежними. Випадкова змінна \( X \) представляє випробування, під час якого стається перший успіх. Ця структура ґрунтується на наступних припущеннях:

Кожне випробування дає один із двох результатів: успіх або невдачу.
Ймовірність успіху \( p \) є сталою для всіх випробувань.
Випробування є взаємно незалежними.
Змінна \( X \) підраховує, скільки випробувань необхідно, перш ніж з'явиться перший успіх.

Формально геометричний розподіл визначається функцією ймовірності:

\[ P(X = k) = (1 - p)^{\,k – 1}\, p \]

де:

\( p \) — ймовірність успіху в одному випробуванні.
\( 1 - p \) представляє ймовірність невдачі.
\( k \) позначає індекс випробування, під час якого стається перший успіх, \(k = 1, 2, 3, \dots\)
Член \( (1 – p)^{k – 1} \) відповідає спостереженню \( k – 1 \) послідовних невдач.

Цей розподіл є доречним щоразу, коли цікавить час очікування до першого успіху за сталих і незалежних імовірнісних умов. Його часто використовують у дослідженнях надійності, процесах комунікації та сценаріях, що передбачають повторні спроби до досягнення сприятливого результату.

Ключові особливості

\[ \text{1. } \quad P(X = k) = (1 – p)^{\,k - 1}\, p \qquad k = 1, 2, 3, \dots \]
\[ \text{2. } \quad \mu = E(X) = \frac{1}{p} \]
\[ \text{3. } \quad \sigma^{2} = \mathrm{Var}(X) = \frac{1 - p}{p^{2}} \]
\[ \text{4. } \quad \sigma = \sqrt{\frac{1 – p}{p^{2}}} \]

Кожен вираз підкреслює основний аспект геометричного розподілу: ймовірність спостереження першого успіху на \(k\)-му випробуванні, середній час очікування та міри variability (мінливості), пов'язані з повторними незалежними експериментами Бернульлі, де ймовірність успіху залишається сталою.

Виведення геометричного розподілу

Щоб зрозуміти закон ймовірності геометричного розподілу, розглянемо послідовність незалежних випробувань Бернульлі \( Y_1, Y_2, \dots \), кожне з яких має ймовірність успіху \( p \). Випадкова змінна \( X \) представляє індекс першого випробування, в якому стається успіх. Щоб визначити її розподіл, ми дослідимо, що означає набуття змінною \( X \) конкретного значення.

Якщо \( X = 1 \), перше випробування вже має бути успішним, що стається з ймовірністю \( p. \)
Якщо \( X = 2 \), перше випробування має бути невдачею, а друге — успіхом, що дає ймовірність \( (1 - p)p. \)
Аналогічно, \( X = 3 \) потребує двох початкових невдач, за якими слідує успіх: \( (1 - p)^{2}p \).
Загалом, подія \( X = k \) означає, що перші \( k - 1 \) випробувань не дають успіху, а \( k \)-те випробування дає. Оскільки випробування незалежні, ймовірність спостереження такої моделі становить:

\[ P(X = k) = (1 - p)^{\,k – 1} p \]

Це обґрунтування показує, що геометричний розподіл природно виникає при повторенні ідентичних експериментів Бернульлі до моменту появи першого успіху. Множник \( (1 – p)^{k-1} \) враховує послідовність послідовних невдач, тоді як останній \( p \) відповідає успіху, що завершує час очікування.

Оскільки спостереження першого успіху на пізнішому випробуванні потребує довшої послідовності послідовних невдач, ймовірність \(P(X = k)\) зменшується зі збільшенням \(k\).

Середнє значення геометричного розподілу

Середнє значення або математичне сподівання геометричного розподілу представляє середню кількість незалежних випробувань, необхідних для спостереження першого успіху. Оскільки кожне випробування є експериментом Бернульлі з однаковою ймовірністю успіху \( p \), геометричний розподіл моделює час очікування за ідентичних та незалежних імовірнісних умов. Щоб формально обчислити середнє значення, почнемо з означення математичного сподівання для дискретних випадкових величин:

\[ \mu = E(X) = \sum_{k=1}^{\infty} k\, P(X = k) \]

Підставляючи функцію ймовірності геометричного розподілу, отримаємо:

\[ E(X) = \sum_{k=1}^{\infty} k\, (1 - p)^{\,k – 1} p \]

Щоб спростити цей вираз, згадаємо стандартну тотожність для ряду, що містить суму зваженої геометричної прогресії:

\[ \sum_{k=1}^{\infty} k\, r^{\,k – 1} = \frac{1}{(1 - r)^{2}} \qquad |r| < 1 \]

Поклавши \( r = 1 – p \), отримаємо:

\[ \sum_{k=1}^{\infty} k\, (1 - p)^{\,k – 1} = \frac{1}{p^{2}} \]

Множачи цей результат на \( p \), отримаємо математичне сподівання геометричного розподілу:

\[ E(X) = p \cdot \frac{1}{p^{2}} = \frac{1}{p} \]

Цей результат показує, що середнє значення геометричного розподілу залежить тільки від ймовірності успіху \( p \). У середньому очікується проведення \( 1/p \) незалежних випробувань до появи першого успіху, що відображає сталий характер ймовірності для всіх повторень.

Дисперсія геометричного розподілу

Дисперсія геометричного розподілу визначає, наскільки кількість випробувань, необхідних для отримання першого успіху, за очікуванням коливається навколо середнього значення \( \mu = 1/p \). У той час як середнє значення представляє середній час очікування, дисперсія описує, наскільки широко розсіяні часи очікування, коли кожне випробування є незалежним експериментом Бернульлі з однаковою ймовірністю успіху. Формально дисперсія для дискретної випадкової величини визначається як:

\[ \sigma^{2} = \mathrm{Var}(X) = E(X^{2}) - [E(X)]^{2} \]

Щоб обчислити її, почнемо з того, що згадаємо функцію ймовірності геометричного розподілу:

\[ P(X = k) = (1 - p)^{\,k – 1} p \]

Другий момент \(E(X^2)\) можна отримати, використовуючи відому тотожність для ряду зважених геометричних сум:

\[ \sum_{k=1}^{\infty} k^{2}\, r^{\,k – 1} = \frac{1 + r}{(1 - r)^{3}} \qquad |r| < 1 \]

Поклавши \( r = 1 – p \), маємо:

\[ E(X^{2}) = p \sum_{k=1}^{\infty} k^{2} (1 – p)^{,k – 1} = p \cdot \frac{1 + (1 – p)}{p^{3}} = \frac{2 - p}{p^{3}} \]

Використовуючи цей результат разом із виразом для середнього значення \( E(X) = 1/p \), дисперсія набуває вигляду:

\[ \mathrm{Var}(X) = \frac{2 - p}{p^{3}} - \left(\frac{1}{p}\right)^{2} \]

Спрощення виразу дає стандартну формулу в замкненому вигляді для геометричного розподілу:

\[ \sigma^{2} = \frac{1 – p}{p^{2}} \]

Ця формула показує, що мінливість геометричного розподілу залежить тільки від ймовірності успіху ( p ). Коли ( p ) мала, успіхи трапляються рідко і час очікування стає більш розсіяним; коли ( p ) велика, результати концентруються навколо меншої кількості випробувань.

Приклад 1

Технік тестує цифровий датчик, який іноді не виявляє сигнал. Кожна спроба виявлення є незалежною, і ймовірність того, що датчик правильно зареєструє сигнал за одну спробу, становить \( p = 0.2 \). Нехай \( X \) — це кількість спроб, необхідних до першого успішного виявлення.

Запишіть функцію ймовірності \( X \). Оскільки \( X \) підраховує кількість незалежних випробувань до першого успіху, вона має геометричний розподіл з параметром \( p = 0.2 \). Отже, \[ P(X = k) = (1 – p)^{k – 1} p = (0.8)^{k – 1}(0.2), \qquad k = 1, 2, 3, \dots \]

Обчисліть математичне сподівання \( E(X) \). Середнє значення геометричного розподілу дорівнює \[ E(X) = \frac{1}{p} = \frac{1}{0.2} = 5 \]

Обчисліть дисперсію \( \mathrm{Var}(X) \). Використовуючи вираз для дисперсії в замкненому вигляді, маємо: \[ \mathrm{Var}(X) = \frac{1 - p}{p^{2}} = \frac{0.8}{(0.2)^{2}} = \frac{0.8}{0.04} = 20 \]

Для геометричного розподілу з \(p = 0.2\) середнє значення \(E(X) = 5\), а дисперсія \(\mathrm{Var}(X) = 20\).

Зв'язок між геометричним та експоненціальним розподілами

Геометричний розподіл зазвичай розглядають як дискретний аналог експоненціального розподілу, оскільки обидва описують, скільки потрібно чекати, перш ніж подія відбудеться вперше. Різниця полягає в тому, як представлено час. У геометричному випадку час progresses дискретними кроками, кожен з яких відповідає випробуванню Бернуллі з постійною ймовірністю успіху \( p \). Випадкова змінна \( X \) підраховує, скільки таких випробувань відбулося до першого успіху.

У безперервному часі цю роль відіграє експоненціальний розподіл, де події відбуваються з постійною інтенсивністю \( \lambda \). Час очікування \( T \) до першої події є безперервною випадковою змінною з густиною \[ f(t;\lambda) = \begin{cases} \lambda e^{-\lambda t} & t > 0 \\ 0 & t \le 0 \end{cases} \]

Незважаючи на те, що один розподіл є дискретним, а інший — безперервним, вони мають спільну характерну структурну властивість: відсутність пам'яті. Для геометричного розподілу \[ P(X > m + n \mid X > m) = P(X > n) \] і експоненціальний розподіл задовольняє відповідну тотожність, \[ P(T > s + t \mid T > s) = P(T > t) \]

Ця властивість показує, що ймовірність очікування додаткового часу не залежить від того, скільки часу вже було очікувано. Серед стандартних розподілів геометричний є єдиним дискретним законом з такою особливістю, а експоненціальний — єдиним безперервним.