Розподіл Бернуллі
Вступ до розподілу Бернульлі
Розподіл Бернульлі моделює результат одного експерименту, який може мати лише два взаємовиключні результати: успіх або невдачу. Такий експеримент відомий як випробування Бернульлі. Кажуть, що дискретна випадкова величина має розподіл Бернульлі, якщо вона набуває значення \(1\), якщо випробування завершилося успіхом, і значення \(0\), якщо воно завершилося невдачею. Невизначеність експерименту повністю визначається одним параметром \( p \), який представляє ймовірність успіху в цьому випробуванні. Випробування Бернульлі має задовольняти кільком основним умовам:
- Можливі лише два результати: успіх з ймовірністю \( p \) та невдача з ймовірністю \( 1 - p = q\).
- Структура ймовірностей випробування є фіксованою та визначається виключно значенням \( p \).
- Результат представлений випадковою величиною \( X \), що набуває значень у множині \( {0,1} \).
- Результат випробування є єдиним і взаємовиключним: або успіх, або невдача.
Формально розподіл Бернульлі визначається функцією ймовірності:
\[ P(X = x) = b(x;p) = p^{x}\,(1-p)^{\,1-x} \]
де:
- \( x \in {0,1} \) — спостережуваний результат випробування.
- \( p \) — ймовірність успіху.
- \( 1 – p = q \) — ймовірність невдачі.
Ця проста модель становить основу для більш складних дискретних розподілів, включаючи біноміальний розподіл, який поширює ту саму структуру на фіксовану кількість незалежних випробувань Бернульлі.
Ключові особливості
-
\[\text{1. } \quad P(X = x) = b(x;p) = p^{x}(1-p)^{\,1-x} \quad x \in {0,1} \]
-
\[\text{2. } \quad \mu = E(X) = p \]
-
\[\text{3. } \quad \sigma^{2} = \mathrm{Var}(X) = p(1 – p) \]
-
\[\text{4. } \quad \sigma = \sqrt{\,p(1 - p)\,} \]
Кожен вираз підкреслює ключову властивість розподілу Бернульлі, надаючи швидкий огляд того, як він призначає ймовірності, де знаходиться його середній результат і як визначається його мінливість.
Середнє значення розподілу Бернульлі
Середнє значення, або математичне сподівання розподілу Бернульлі, представляє довгостроковий середній результат послідовності ідентичних випробувань Бернульлі. Оскільки випадкова величина може набувати лише значень \(0\) та \(1\), середнє значення виражає частку успіхів, які були б спостережені за багато повторень одного й того самого експерименту. Щоб обчислити середнє значення формально, ми почнемо з означення математичного сподівання дискретної випадкової величини:
\[ \mu = E(X) = \sum_{x \in {0,1}} x \, b(x;p) \]
Для розподілу Бернульлі функція ймовірності, тобто правило, що призначає ймовірність кожному можливому значенню випадкової величини, задається як:
\[ b(x;p) = p^{x}(1-p)^{\,1-x} \]
отже, сподівання набуває вигляду:
\[ E(X) = 0 \cdot (1-p) \;+\; 1 \cdot p \]
Отримаємо:
\[ \mu = E(X) = p \]
Параметр \( p \) розподілу Бернульлі сам по собі є очікуваною часткою успіхів. Якби експеримент повторювався велику кількість разів, середнє значення спостережень наблизилося б до \( p \).
Дисперсія розподілу Бернульлі
Дисперсія розподілу Бернульлі кількісно визначає, наскільки результати одного випробування Бернульлі, як очікується, будуть коливатися навколо середнього значення \( \mu = p \). У той час як середнє значення описує довгострокову частку успіхів, дисперсія вимірює, наскільки розсіяні результати при повторних відтвореннях того самого експерименту. Формально дисперсія визначається як:
\[ \sigma^{2} = \mathrm{Var}(X) = E(X^{2}) - [E(X)]^{2} \]
Для випадкової величини Бернульлі \( X \) можливі лише два результати:
\[
X = 0 \quad \text{або} \quad X = 1
\]
Оскільки піднесення до квадрата не змінює цих значень, маємо \( X^{2} = X \). Використовуючи цю властивість, ми можемо обчислити сподівання:
\[ E(X^{2}) = 0^{2}(1-p) + 1^{2}p = p \]
Ми вже знаємо, що:
\[
E(X) = p
\]
отже, підстановка у формулу дисперсії дає:
\[ \mathrm{Var}(X) = p - p^{2} = p(1-p) \]
Таким чином, дисперсія розподілу Бернульлі дорівнює:
\[ \sigma^{2} = p(1-p) \]
У міру того як \( p \) наближається до \(0\) або \(1\), дисперсія зменшується, оскільки експеримент стає все більш передбачуваним, а результат має тенденцію повторюватися з незначними коливаннями.
Приклад 1
Розглянемо тест контролю якості, що проводиться для одного електронного компонента. Під час перевірки компонент підключають до живлення, і він має досягти певного рівня напруги, щоб вважатися функціональним. Нехай \( X \) буде випадковою змінною, що представляє результат тесту, де:
- \( X = 1 \), якщо компонент відповідає необхідному стандарту (успіх).
- \( X = 0 \), якщо він не проходить тест (невдача).
Припустимо, що на основі історичних даних імовірність того, що випадково обраний компонент працює правильно, становить \( p = 0.85 \), отже, випадкова змінна \( X \) має розподіл Бернульлі з параметром \( p \). Оскільки розподіл є розподілом Бернульлі, функція ймовірності, тобто правило, що присвоює ймовірність кожному можливому значенню випадкової змінної, задається наступним чином:
\[ P(X = x) = p^{x}(1-p)^{\,1-x} \]
Щоб обчислити ймовірність успіху (\( X = 1 \)):
\[ P(X = 1) = p^{1}(1-p)^{0} = 0.85 \]
Аналогічно, ймовірність невдачі становить:
\[ P(X = 0) = p^{0}(1-p)^{1} = 0.15 \]
Отже, ймовірність того, що компонент пройде тест, становить ( 0.85 ), або 85%.
Цей приклад показує, як попередні спостереження та структура тесту взаємодіють при виборі моделі. Історичний показник успіху вказує на значення \( p \), а той факт, що тест має лише два можливі результати, робить розподіл Бернульлі природним способом опису невизначеності експерименту.
Роль розподілу Бернульлі в біноміальній моделі
Розподіл Бернульлі є основою біноміального розподілу. Біноміальна випадкова змінна підраховує кількість успіхів, що відбуваються у \( n \) незалежних випробуваннях Бернульлі, кожне з імовірністю \( p \). З цієї точки зору, біноміальна модель просто узагальнює комбіновані результати повторених експериментів Бернульлі. Її функція ймовірності,
\[ P(X = k) = \binom{n}{k} p^{k} (1-p)^{\,n-k} \]
описує всі можливі способи, за яких \( k \) успіхів можуть виникнути з \( n \) випробувань. З цієї структури випливають основні властивості біноміального розподілу, включаючи його математичне сподівання \( np \) та дисперсію \( np(1-p) \), які безпосередньо походять від моделі Бернульлі.
У наступній таблиці наведено стисле порівняння розподілів Бернульлі та біноміального розподілу. Хоча ці дві моделі тісно пов'язані, вони відрізняються за охопленням та інтерпретацією: як зауважено вище, розподіл Бернульлі описує один експеримент «успіх–невдача», тоді як біноміальний розподіл поширює цю ідею на фіксовану кількість незалежних та ідентичних випробувань.
| Ознака | Бернульлі | Біноміальний |
|---|---|---|
| Кількість випробувань | 1 | \( n \) |
| Параметри | \( p \) | \( n, p \) |
| Носій | \( {0,1} \) | \( {0, \dots, n} \) |
| Математичне сподівання | \( p \) | \( np \) |
| Дисперсія | \( p(1-p) \) | \( np(1-p) \) |