Випадкова величина розподіляється по нормальному закону. Нормальний розподіл безперервних випадкових величин. Нормальний розподіл: теоретичні основи

У багатьох задачах, пов'язаних з нормально розподіленими випадковими величинами, доводиться визначати ймовірність попадання випадкової величини, підпорядкованої нормальному закону з параметрами, на ділянку від до. Для обчислення цієї ймовірності скористаємося загальною формулою

де - функція розподілу величини.

Знайдемо функцію розподілу випадкової величини, розподіленої за нормальним законом з параметрами. Щільність розподілу величини дорівнює:

. (6.3.2)

Звідси знаходимо функцію розподілу

. (6.3.3)

Зробимо в інтегралі (6.3.3) заміну змінної

і наведемо його до виду:

(6.3.4)

Інтеграл (6.3.4) не виражає через елементарні функції, але його можна обчислити через спеціальну функцію, яка має певний інтеграл від виразу або (так званий інтеграл ймовірностей), для якого складені таблиці. Існує багато різновидів таких функцій, наприклад:

;

і т.д. Який з цих функцій користуватися - питання смаку. Ми виберемо в якості такої функції

. (6.3.5)

Неважко бачити, що ця функція є не що інше, як функцію розподілу для нормально розподіленої випадкової величини з параметрами.

Домовимося називати функцію нормальною функцією розподілу. У додатку (табл. 1) наведені таблиці значень функції.

Висловимо функцію розподілу (6.3.3) величини з параметрами і через нормальну функцію розподілу. очевидно,

. (6.3.6)

Тепер знайдемо ймовірність попадання випадкової величини на ділянку від до. Відповідно до формули (6.3.1)

Таким чином, ми висловили ймовірність попадання на ділянку випадкової величини, розподіленої за нормальним законом з будь-якими параметрами, через стандартну функцію розподілу, відповідну найпростішого нормальному закону з параметрами 0,1. Зауважимо, що аргументи функції в формулі (6.3.7) мають дуже простий сенс: є відстань від правого кінця ділянки до центру розсіювання, виражене в середніх квадратичних відхиленнях; - таке ж відстань для лівого кінця ділянки, причому це відстань вважається позитивним, якщо кінець розташований праворуч від центру розсіювання, і негативним, якщо зліва.

Як і будь-яка функція розподілу, функція має властивості:

3. - неубутна функція.

Крім того, з симетричності нормального розподілу з параметрами щодо початку координат слід, що

Користуючись цією властивістю, власне кажучи, можна було б обмежити таблиці функції тільки позитивними значеннями аргументу, але, щоб уникнути зайвої операції (віднімання з одиниці), в таблиці 1 додатка наводяться значення як для позитивних, так і для негативних аргументів.

На практиці часто зустрічається завдання обчислення ймовірності потрапляння нормально розподіленої випадкової величини на ділянку, симетричний щодо центру розсіювання. Розглянемо таку ділянку довжини (рис. 6.3.1). Обчислимо ймовірність попадання на цю ділянку за формулою (6.3.7):

З огляду на властивість (6.3.8) функції і надаючи лівій частині формули (6.3.9) більш компактний вид, отримаємо формулу для ймовірності потрапляння випадкової величини, розподіленої за нормальним законом на ділянку, симетричний щодо центру розсіювання:

. (6.3.10)

Вирішимо наступне завдання. Відкладемо від центру розсіювання послідовні відрізки довжиною (рис. 6.3.2) і обчислимо ймовірність попадання випадкової величини в кожен з них. Так як крива нормального закону симетрична, досить відкласти такі відрізки тільки в одну сторону.

За формулою (6.3.7) знаходимо:

(6.3.11)

Як видно з цих даних, ймовірності попадання на кожен з наступних відрізків (п'ятий, шостий і т.д.) з точністю до 0,001 дорівнюють нулю.

Округляючи ймовірності попадання в відрізки до 0,01 (до 1%), отримаємо три числа, які легко запам'ятати:

0,34; 0,14; 0,02.

Сума цих трьох значень дорівнює 0,5. Це означає, що для нормально розподіленої випадкової величини все розсіювання (з точністю до часток відсотка) укладається на ділянці.

Це дозволяє, знаючи середньоквадратичне відхилення і математичне сподівання випадкової величини, орієнтовно з певними інтервалами її практично можливих значень. Такий спосіб оцінки діапазону можливих значень випадкової величини відомий в математичній статистиці під назвою «правило трьох сигма». З правила трьох сигма випливає також орієнтовний спосіб визначення середнього квадратичного відхилення випадкової величини: беруть максимальне практично можливе відхилення від середнього і ділять його на три. Зрозуміло, цей грубий прийом може бути рекомендований, тільки якщо немає інших, більш точних способів визначення.

Приклад 1. Випадкова величина, розподілена за нормальним законом, є помилку вимірювання деякої відстані. При вимірі допускається систематична помилка в бік завищення на 1,2 (м); середньоквадратичне відхилення помилки виміру дорівнює 0,8 (м). Знайти ймовірність того, що відхилення виміряного значення від істинного не перевищить по абсолютній величині 1,6 (м).

Рішення. Помилка вимірювання є випадкова величина, підпорядкована нормальному закону з параметрами і. Потрібно знайти ймовірність попадання цієї величини на ділянку від до. За формулою (6.3.7) маємо:

Користуючись таблицями функції (додаток, табл. 1), знайдемо:

; ,

Приклад 2. Знайти ту ж ймовірність, що і в попередньому прикладі, але за умови, що систематичної помилки немає.

Рішення. За формулою (6.3.10), вважаючи, знайдемо:

.

Приклад 3. За метою, що має вигляд смуги (автострада), ширина якої дорівнює 20 м, ведеться стрілянина в напрямку, перпендикулярному автостраді. Прицілювання ведеться по середній лінії автостради. Середнє квадратичне відхилення в напрямку стрільби одно м. Є систематична помилка в напрямку стрільби: недоліт 3 м. Знайти ймовірність попадання в автостраду при одному пострілі.

Нормальний закон розподілу найбільш часто зустрічається на практиці. Головна особливість, що виділяє його серед інших законів, полягає в тому, що він є граничним законом, до якого наближаються інші закони розподілу при досить часто зустрічаються типових умовах.

Визначення. Безперервна випадкова величина Х має нормальний закон розподілу(закон Гаусса ) з параметрами а і σ 2, якщо її щільність ймовірності f(x) має вид:

. (6.19)

Криву нормального закону розподілу називають нормальної або кривою Гаусса. На рис. 6.5 а), б) показана нормальна крива з параметрами а і σ 2 і графік функції розподілу.

Звернемо увагу на те, що нормальна крива симетрична відносно прямої х = а, Має максимум в точці х = а, Рівний, і дві точки перегину х = а σ з координатами.

Можна помітити, що в вираженні щільності нормального закону параметри розподілу позначені буквами а і σ 2, Якими ми позначали математичне сподівання і дисперсію. Такий збіг не випадково. Розглянемо теорему, яка встановлює теоретико-імовірнісний сенс параметрів нормального закону.

Теорема. Математичне сподівання випадкової величини Х, розподіленої за нормальним законом, так само параметру a цього розподілу, Тобто

М(Х) = а, (6.20)

а її дисперсія - параметру σ 2, Тобто

D(X) = σ 2. (6.21)

З'ясуємо, як буде змінюватися нормальна крива при зміні параметрів а і σ .

якщо σ \u003d Const, і змінюється параметр a (а 1 < а 2 < а 3), тобто центр симетрії розподілу, то нормальна крива буде зміщуватись уздовж осі абсцис, не змінюючи форми (рис. 6.6).

Мал. 6.6

Мал. 6.7

якщо а \u003d Const і змінюється параметр σ , То змінюється ордината максимуму кривої f max(a) \u003d. при збільшенні σ ордината максимуму зменшується, але так як площа під будь-якій кривій розподілу повинна залишатися рівною одиниці, то крива стає більш плоскою, розтягуючись уздовж осі абсцис. при зменшенні σ , Навпаки, нормальна крива витягується вгору, одночасно стискаючи з боків (рис. 6.7).

Таким чином, параметр a характеризує стан, а параметр σ - форму нормальної кривої.

Нормальний закон розподілу випадкової величини з параметрами a \u003d 0 і σ \u003d 1 називається стандартним або нормованим, А відповідна нормальна крива - стандартної або нормованої.

Складність безпосереднього знаходження функції розподілу випадкової величини, розподіленої за нормальним законом, пов'язана з тим, що інтеграл від функції нормального розподілу не виражає через елементарні функції. Однак його можна обчислити через спеціальну функцію, яка має певний інтеграл від виразу або. Таку функцію називають функцією Лапласа, Для неї складені таблиці. Існує багато різновидів такої функції, наприклад:

, .

Ми будемо використовувати функцію

Розглянемо властивості випадкової величини, розподіленої за нормальним законом.

1. Ймовірність влучення випадкової величини Х, розподіленої за нормальним законом, в інтервал [α , β ] дорівнює

Обчислимо за цією формулою ймовірності при різних значеннях δ (Використовуючи таблицю значень функції Лапласа):

при δ = σ \u003d 2Ф (1) \u003d 0,6827;

при δ = 2σ \u003d 2Ф (2) \u003d 0,9545;

при δ = 3σ \u003d 2Ф (3) \u003d 0,9973.

Звідси випливає так зване « правило трьох сигм»:

Якщо випадкова величина Х має нормальний закон розподілу з параметрами a і σ, то практично достовірно, що її значення укладені в інтервалі(a – 3σ ; a + 3σ ).

Приклад 6.3. Вважаючи, що зростання чоловіків певної вікової групи є нормально розподілена випадкова величина Х з параметрами а\u003d 173 і σ 2 \u003d 36, знайти:

1. Вираз щільності ймовірності та функції розподілу випадкової величини Х;

2. Частку костюмів 4-го зростання (176 - 183 см) і частку костюмів 3-го зростання (170 - 176 см), які потрібно передбачити в загальному обсязі виробництва для даної вікової групи;

3. Сформулювати «правило трьох сигм» для випадкової величини Х.

1. Знаходимо щільність ймовірності

і функцію розподілу випадкової величини Х

= .

2. Частку костюмів 4-го зростання (176 - 182 см) знаходимо як ймовірність

Р(176 ≤ Х ≤ 182) = \u003d Ф (1,5) - Ф (0,5).

По таблиці значень функції Лапласа ( Додаток 2) Знаходимо:

Ф (1,5) \u003d 0,4332, Ф (0,5) \u003d 0,1915.

остаточно отримуємо

Р(176 ≤ Х ≤ 182) = 0,4332 – 0,1915 = 0,2417.

Частку костюмів 3-го зростання (170 - 176 см) можна знайти аналогічно. Однак простіше це зробити, якщо врахувати, що даний інтервал симетричний щодо математичного очікування а \u003d 173, тобто нерівність 170 ≤ Х≤ 176 рівносильна нерівності │ Х - 173│≤ 3. Тоді

Р(170 ≤Х ≤176) = Р(│Х - 173│≤ 3) \u003d 2Ф (3/6) \u003d 2Ф (0,5) \u003d 2 · 0,1915 \u003d 0,3830.

3. Сформулюємо «правило трьох сигм» для випадкової величини Х:

Практично достовірно, що зростання чоловіків даної вікової групи укладений в межах від а – 3σ \u003d 173 - 3 · 6 \u003d 155 до а + 3σ \u003d 173 + 3 · 6 \u003d 191, тобто 155 ≤ Х ≤ 191. ◄


7. Граничні теореми теорії ІМОВІРНОСТЕЙ

Як вже говорилося при вивченні випадкових величин, неможливо заздалегідь передбачити, яке значення прийме випадкова величина в результаті одиничного випробування - це залежить від багатьох причин, врахувати які неможливо.

Однак при багаторазовому повторенні випробувань характер поведінки суми випадкових величин майже втрачає випадковий характер і стає закономірним. Наявність закономірностей пов'язане саме з масовістю явищ, що породжують у своїй сукупності випадкову величину, підпорядковану цілком певним законом. Суть стійкості масових явищ зводиться до наступного: конкретні особливості кожного окремого випадкового явища майже не позначаються на середньому результаті маси таких явищ; випадкові відхилення від середнього, неминучі в кожному окремому явищі, в масі взаємно погашаються, нівелюються, вирівнюються.

Саме ця стійкість середніх і являє собою фізичний зміст «закону великих чисел», що розуміється в широкому сенсі слова: при дуже великому числі випадкових явищ їх результат практично перестає бути випадковим і може бути передбачений з великим ступенем визначеності.

У вузькому сенсі слова під «законом великих чисел» в теорії ймовірностей розуміється ряд математичних теорем, в кожній з яких для тих чи інших умов встановлюється факт наближення середніх характеристик великої кількості дослідів до деяких певним постійним.

Закон великих чисел відіграє важливу роль в практичних застосуваннях теорії ймовірностей. Властивість випадкових величин при певних умовах вести себе практично як невипадкові дозволяє впевнено оперувати цими величинами, передбачати результати масових випадкових явищ майже з повною визначеністю.

Можливості таких передбачень в області масових випадкових явищ ще більше розширюються наявністю іншої групи граничних теорем, що стосуються вже не граничних значень випадкових величин, а граничних законів розподілу. Йдеться про групу теорем, відомих під назвою «центральної граничної теореми». Різні форми центральної граничної теореми розрізняються між собою тими умовами, для яких встановлюється це граничне властивість суми випадкових величин.

Різні форми закону великих чисел з різними формами центральної граничної теореми утворюють сукупність так званих граничних теорем теорії ймовірностей. Граничні теореми дають можливість не тільки здійснювати наукові прогнози в області випадкових явищ, а й оцінювати точність цих прогнозів.

) Грає осо-бо важливу роль в теорії ймовірностей і частіше за інших застосовується у вирішенні практичних завдань. Його головна особливість в тому, що він є граничним законом, до якого наближаються дру-Гії закони розподілу при досить часто зустрічаються типич-них умовах. Наприклад, сума досить великого числа неза-висимо (або слабо залежних) випадкових величин наближено підпорядковується нормальному закону, і це виконується тим точніше, чим більше випадкових величин підсумовується.

Експериментально доведено, що нормальним законом під-чиняться похибки вимірювань, відхилення геометричних розмірів і положення елементів будівельних конструкцій при їх виготовленні і монтажі, мінливість фізико-механічних характеристик матеріалів і нагрів-зок, що діють на будівельні конструкції.

Розподілу Гаусса підпорядкованих-ються майже всі випадкові вели-чини, відхилення яких від середовищ-них значень викликається великою сукупністю випадкових факто-рів, кожен з яких окремо незначний (Центральна гранична теорема).

нормальним розподіломназивається розподіл випадкової безперервної величини, Для яких щільність вероят-ностей має вигляд (рис. 18.1).

Мал. 18.1. Нормальний закон розподілу при а 1< a 2 .

(18.1)

де а і - параметри розподілу.

Імовірнісні характеристики випадкової величини, розбраті-поділеній за нормальним законом, рівні:

Математичне сподівання (18.2)

Дисперсія (18.3)

Середньоквадратичне відхилення (18.4)

коефіцієнт асиметрії А \u003d 0(18.5)

ексцес Е= 0. (18.6)

Параметр σ, що входить в розподіл Гаусса дорівнює середовищ-неквадратічному відношенню слу-чайної величини. величина аоп-ределяет положення центру рас-пределеніе (див. рис. 18.1), а величина а- ширину Розподіливши-ня (рис. 18.2), тобто статистичний розкид навколо середньої величини.

Мал. 18.2. Нормальний закон розподілу при σ 1< σ 2 < σ 3

Ймовірність влучення в заданий інтервал (від x 1 до x 2) для нормального розподілу, як і у всіх випадках, визначається інтегралом від щільності ймовірності (18.1), який не виражений-ється через елементарні функції і представляється спеціальний пристрій, який називається функцією Лапласа (Інтеграл ймовірностей).

Одне з подань інтеграла ймовірностей:

величина іназивається квантиль.

Видно, що Ф (х) - непарна функція, т. Е. Ф (х) \u003d-Ф (х) . Значення цієї функції обчислені і представлені у вигляді таблиць в технічної та навчальної літератури.


Функція розподілу нормального закону (рис. 18.3) може бути виражена через ін-теграл ймовірностей:

Мал. 18.2. Функція нормального закону розподілу.

Ймовірність влучення випадкової величини, розподіленої за нормальним законом, в інтервал від х.до х, визначається Вира-ням:

Слід зауважити, що

Ф (0) \u003d 0; Ф (∞) \u003d 0,5; Ф (-∞) \u003d -0,5.

При вирішенні практичних завдань, пов'язаних з Розподіливши-ням, часто доводиться розглядати ймовірність попадання в інтервал, симетричний щодо математичного очікування, якщо довжина цього інтервалу тобто якщо сам інтервал має межі-цу від до, маємо:

При вирішенні практичних завдань кордону відхилень слу-чайних величин виражаються через стандарт, середньоквадратичне відхилення, помножене на деякий множник, що визначає межі області відхилень випадкової величини.

Беручи і а також використовуючи формулу (18.10) і таблицю Ф (х) (додаток № 1), отримаємо

Ці формули показують, Що якщо випадкова величина име-ет нормальний розподіл, то ймовірність її відхилення від сво-його середнього значення не більше ніж на σ становить 68,27%, не більше ніж на 2σ - 95,45% і не більше ніж на Зσ - 99,73%.

Оскільки величина 0,9973 близька до одиниці, практично вважається неможливим відхилення нормального розподілу випадкової величини від математичного очікування більш ніж на Зσ. Це правило, справедливе тільки для нормального розподілу, називається правилом трьох сигм. Порушення його має ймовірність Р \u003d1 - 0,9973 \u003d 0,0027. Цим правилом користуються при встановлен-ванні кордонів допустимих відхилень допусків геометричних ха-рактерістік виробів і конструкцій.

Нормальний закон розподілу (часто званий законом Гауса) грає виключно важливу роль в теорії ймовірностей і займає серед інших законів розподілу особливе становище. Це - найбільш часто зустрічається на практиці закон розподілу. Головна особливість, що виділяє нормальний закон серед інших законів, полягає в тому, що він є граничним законом, до якого наближаються інші закони розподілу при досить часто зустрічаються типових умовах.

Можна довести, що сума досить великого числа незалежних (або слабо залежних) випадкових величин, підпорядкованих яким завгодно законам розподілу (при дотриманні деяких вельми нежорстких обмежень), наближено підпорядковується нормальному закону, і це виконується тим точніше, чим більша кількість випадкових величин підсумовується. Більшість зустрічаються на практиці випадкових величин, таких, наприклад, як помилки вимірювань, помилки стрільби і т.д., можуть бути представлені як суми досить великого числа порівняно малих доданків - елементарних помилок, кожна з яких викликана дією окремої причини, що не залежить від інших . Яким би законам розподілу не були підпорядковані окремі елементарні помилки, особливості цих розподілів в сумі великого числа доданків нівелюються, і сума виявляється підлеглою закону, близькому до нормального. Основне обмеження, що накладається на підсумовувані помилки, полягає в тому, щоб вони все рівномірно грали в загальній сумі відносно малу роль. Якщо ця умова не виконується і, наприклад, одна з випадкових помилок виявиться за своїм впливом на суму різко переважаючою над усіма іншими, то закон розподілу цієї переважаючою помилки накладе свій вплив на суму і визначить в основних рисах її закон розподілу.

Теореми, що встановлюють нормальний закон як граничний для суми незалежних рівномірно малих випадкових доданків, будуть докладніше розглянуті в главі 13.

Нормальний закон розподілу характеризується щільністю ймовірності виду:

Крива розподілу за нормальним законом має симетричний холмообразние вид (рис. 6.1.1). Максимальна ордината кривої, рівна, відповідає точці; в міру віддалення від точки щільність розподілу падає, і при крива асимптотично наближається до осі абсцис.

З'ясуємо зміст численних параметрів і, що входять у вираз нормального закону (6.1.1); доведемо, що величина є не що інше, як математичне очікування, а величина - середнє відхилення величини. Для цього обчислимо основні числові характеристики величини - математичне очікування і дисперсію.

Застосовуючи заміну змінної

Неважко переконатися, що перший з двох інтервалів у формулі (6.1.2) дорівнює нулю; другий являє собою відомий інтеграл Ейлера:

. (6.1.3)

отже,

тобто параметр являє собою математичне очікування величини. Цей параметр, особливо в задачах стрільби, часто називають центром розсіювання (скорочено - ц. Р.).

Обчислимо дисперсію величини:

.

Застосувавши знову заміну змінної

.

Інтегруючи по частинах, отримаємо:

Перший доданок в фігурних дужках дорівнює нулю (так як при убуває швидше, ніж зростає будь-яка ступінь), другий доданок за формулою (6.1.3) дорівнює, звідки

Отже, параметр у формулі (6.1.1) є не що інше, як середнє відхилення величини.

З'ясуємо зміст параметрів і нормального розподілу. Безпосередньо з формули (6.1.1) видно, що центром симетрії розподілу є центр розсіювання. Це ясно з того, що при зміні знака різниці на зворотний вираз (6.1.1) не змінюється. Якщо змінювати центр розсіювання, крива розподілу буде зміщуватися вздовж осі абсцис, не змінюючи своєї форми (рис. 6.1.2). Центр розсіювання характеризує стан розподілу на осі абсцис.

Розмірність центру розсіювання - та ж, що розмірність випадкової величини.

Параметр характеризує не стан, а саму форму кривої розподілу. Це є характеристика розсіювання. Найбільша ордината кривої розподілу обернено пропорційна; при збільшенні максимальна ордината зменшується. Так як площа кривої розподілу завжди повинна залишатися рівною одиниці, то при збільшенні крива розподілу стає більш плоскою, розтягуючись уздовж осі абсцис; навпаки, при зменшенні крива розподілу витягується вгору, одночасно стискаючи з боків, і стає більш голкоподібний. На рис. 6.1.3 показані три нормальні криві (I, II, III) при; з них крива I відповідає найбільшому, а крива III - самому малому значенню. Зміна параметра рівносильне зміни масштабу кривої розподілу - збільшення масштабу по одній осі і такого ж зменшення за іншою.

У статті докладно показано, що таке нормальний закон розподілу випадкової величини і як ним користуватися при вирішенні практично завдань.

Нормальний розподіл в статистиці

Історія закону налічує 300 років. Першим відкривачем став Абрахам де Муавр, який придумав апроксимацію ще 1733 році. Через багато років Карл Фрідріх Гаус (1809 г.) і П'єр-Симон Лаплас (1812 г.) вивели математичні функції.

Лаплас також виявив чудову закономірність і сформулював центральну граничну теорему (ЦПТ), Згідно з якою сума великої кількості малих і незалежних величин має нормальний розподіл.

Нормальний закон не є фіксованим рівнянням залежності однієї змінної від іншої. Фіксується тільки характер цієї залежності. Конкретна форма розподілу задається спеціальними параметрами. наприклад, у \u003d ах + b - це рівняння прямої. Однак де саме вона проходить і під яким нахилом, визначається параметрами а і b. Також і з нормальним розподілом. Ясно, що це функція, яка описує тенденцію високої концентрації значень біля центру, але її точна форма задається спеціальними параметрами.

Крива нормального розподілу Гаусса має такий вигляд.

Графік нормального розподілу нагадує дзвін, тому можна зустріти назву колоколообразная крива. У графіку є «горб» в середині і різке зниження щільності по краях. У цьому полягає суть нормального розподілу. Імовірність того, що випадкова величина виявиться біля центру набагато вище, ніж те, що вона сильно відхилиться від середини.

На малюнку вище зображено дві ділянки під кривою Гаусса: синій і зелений. Підстави, тобто інтервали, в обох ділянок рівні. Але помітно відрізняються висоти. Синій ділянку віддалений від центру, і має істотно меншу висоту, ніж зелений, який знаходиться в самому центрі розподілу. Отже, відрізняються і площі, чи то пак ймовірності попадання в позначені інтервали.

Формула нормального розподілу (щільності) наступна.

Формула складається з двох математичних констант:

π - число пі 3,142;

е - підстава натурального логарифма 2,718;

двох змінних параметрів, які задають форму конкретної кривої:

m - математичне очікування (в різних джерелах можуть використовуватися інші позначення, наприклад, µ або a);

σ 2 - дисперсія;

ну і сама змінна x, Для якої вираховується щільність ймовірності.

Конкретна форма нормального розподілу залежить від 2-х параметрів: ( m) І ( σ 2). коротко позначається N (m, σ 2) або N (m, σ). параметр m (Матожіданіє) визначає центр розподілу, якому відповідає максимальна висота графіка. дисперсія σ 2 характеризує розмах варіації, тобто «размазанность» даних.

Параметр математичного очікування зміщує центр розподілу вправо або вліво, не впливаючи на саму форму кривої щільності.

А ось дисперсія визначає загостреними кривої. Коли дані мають малий розкид, то вся їх маса концентрується у центру. Якщо ж у даних великий розкид, то вони «розмазуються» по широкому діапазону.

Щільність розподілу не має прямого практичного застосування. Для розрахунку ймовірностей потрібно проінтегрувати функцію щільності.

Імовірність того, що випадкова величина виявиться менше деякого значення x, визначається функцією нормального розподілу:

Використовуючи математичні властивості будь-якого безперервного розподілу, нескладно розрахувати і будь-які інші ймовірності, так як

P (a ≤ X< b) = Ф(b) – Ф(a)

Стандартний нормальний розподіл

Нормальний розподіл залежить від параметрів середньої і дисперсії, через що погано видно його властивості. Добре б мати певний еталон розподілу, що не залежить від масштабу даних. І він існує. називається стандартним нормальним розподілом. Насправді це звичайне нормальне нормальний розподіл, тільки з параметрами математичного очікування 0, а дисперсією - 1, коротко записується N (0, 1).

Будь-яке нормальне розподіл легко перетворюється в стандартне шляхом нормування:

де z - нова змінна, яка використовується замість x;
m - математичне очікування;
σ - стандартне відхилення.

Для вибіркових даних беруться оцінки:

Середнє арифметичне і дисперсія нової змінної z тепер є рівними 0 і 1 відповідно. У цьому легко переконатися за допомогою елементарних алгебраїчних перетворень.

В літературі зустрічається назва z-оцінка. Це воно саме - нормовані дані. Z-оцінку можна прямо порівнювати з теоретичними можливостями, тому що її масштаб збігається з еталоном.

Подивимося тепер, як виглядає щільність стандартного нормального розподілу (для z-оцінок). Нагадаю, що функція Гаусса має вигляд:

підставами замість (X-m) / σ букву z, А замість σ - одиницю, отримаємо функцію щільності стандартного нормального розподілу:

Графік щільності:

Центр, як і очікувалося, знаходиться в точці 0. У цій же точці функція Гаусса досягає свого максимуму, що відповідає прийняттю випадковою величиною свого середнього значення (тобто x-m \u003d 0). Щільність в цій точці дорівнює 0,3989, що можна порахувати навіть в думці, тому що e 0 \u003d 1 і залишається розрахувати тільки співвідношення 1 на корінь з 2 пі.

Таким чином, за графіком добре видно, що значення, що мають маленькі відхилення від середньої, випадають частіше за інших, а ті, які сильно віддалені від центру, зустрічаються значно рідше. Шкала осі абсцис вимірюється в стандартних відхиленнях, що дозволяє відв'язатися від одиниць вимірювання і отримати універсальну структуру нормального розподілу. Крива Гауса для нормованих даних відмінно демонструє і інші властивості нормального розподілу. Наприклад, що воно є симетричним щодо осі ординат. В межах ± 1σ від середньої арифметичної сконцентрована велика частина всіх значень (прикидаємо поки на око). В межах ± 2σ знаходяться більшість даних. В межах ± 3σ знаходяться майже всі дані. Остання властивість широко відомо під назвою правило трьох сигмдля нормального розподілу.

Функція стандартного нормального розподілу дозволяє розраховувати ймовірності.

Ясна річ, вручну ніхто не вважає. Всі підраховано і розміщено в спеціальних таблицях, які є в кінці будь-якого підручника по статистиці.

Таблиця нормального розподілу

Таблиці нормального розподілу зустрічаються двох типів:

- таблиця щільності;

- таблиця функції (Інтеграла від щільності).

Таблиця щільності використовується рідко. Проте, подивимося, як вона виглядає. Припустимо, потрібно отримати щільність для z \u003d 1, Тобто щільність значення, віддаленого від матожіданія на 1 сигму. Нижче показаний шматок таблиці.

Залежно від організації даних шукаємо потрібне значення за назвою стовпця і рядка. У нашому прикладі беремо рядок 1,0 і стовпець 0 , Тому що сотої частки немає. Шукане значення дорівнює 0,2420 (0 перед 2420 опущений).

Функція Гаусса симетрична щодо осі ординат. Тому φ (z) \u003d φ (-z), Тобто щільність для 1 тотожна щільності для -1 , Що чітко видно на малюнку.

Щоб не витрачати даремно папір, таблиці друкують тільки для позитивних значень.

На практиці частіше використовують значення функції стандартного нормального розподілу, тобто ймовірності для різних z.

У таких таблицях також містяться тільки позитивні значення. Тому для розуміння і знаходження будь-яких потрібних ймовірностей слід знати властивості стандартного нормального розподілу.

функція Ф (z) симетрична щодо свого значення 0,5 (а не осі ординат, як щільність). Звідси справедливо рівність:

Це факт показаний на зображенні:

значення функції Ф (-z) і Ф (z) ділять графік на 3 частини. Причому верхня і нижня частини рівні (позначені галочками). Для того, щоб доповнити ймовірність Ф (z) до 1, досить додати відсутню величину Ф (-z). Вийде рівність, вказане трохи вище.

Якщо потрібно відшукати ймовірність попадання в інтервал (0; z), Тобто ймовірність відхилення від нуля в позитивну сторону до деякої кількості стандартних відхилень, досить від значення функції стандартного нормального розподілу відняти 0,5:

Для наочності можна поглянути на малюнок.

На кривій Гаусса, ця ж ситуація виглядає як площа від центру вправо до z.

Досить часто аналітика цікавить ймовірність відхилення в обидві сторони від нуля. А так як функція симетрична щодо центру, попередню формулу потрібно помножити на 2:

Малюнок нижче.

Під кривою Гаусса це центральна частина, обмежена обраним значенням -z зліва і z праворуч.

Зазначені властивості слід взяти до уваги, тому що табличні значення рідко відповідають цікавить інтервалу.

Для полегшення завдання в підручниках зазвичай публікують таблиці для функції виду:

Якщо потрібна ймовірність відхилення в обидві сторони від нуля, то, як ми тільки що переконалися, табличне значення для даної функції просто множиться на 2.

Тепер подивимося на конкретні приклади. Нижче показана таблиця стандартного нормального розподілу. Знайдемо табличні значення для трьох z: 1,64, 1,96 і 3.

Як зрозуміти сенс цих чисел? Почнемо з z \u003d 1,64, Для якого табличне значення становить 0,4495 . Найпростіше пояснити сенс на малюнку.

Тобто ймовірність того, що стандартизована нормально розподілена випадкова величина потрапить в інтервал від 0 до 1,64 , дорівнює 0,4495 . При вирішенні завдань зазвичай потрібно розрахувати ймовірність відхилення в обидві сторони, тому помножимо величину 0,4495 на 2 і отримаємо приблизно 0,9. Займана площа під кривою Гаусса показана нижче.

Таким чином, 90% всіх нормально розподілених значень потрапляє в інтервал ± 1,64σ від середньої арифметичної. Я не випадково вибрав значення z \u003d 1,64, Тому що околиця навколо середньої арифметичної, що займає 90% всієї площі, іноді використовується для і розрахунку довірчих інтервалів. Якщо перевіряється значення не влучає у позначену область, то його наступ малоймовірно (всього 10%).

Для перевірки гіпотез, однак, частіше використовується інтервал, що накриває 95% всіх значень. Половина ймовірності від 0,95 - це 0,4750 (См. Другий виділене в таблиці значення).

Для цієї ймовірності z \u003d 1,96. Тобто в межах майже ± 2σ від середньої знаходиться 95% значень. Тільки 5% випадають за ці межі.

Ще одне цікаве і часто використовується табличне значення відповідає z \u003d 3, Воно дорівнює по нашій таблиці 0,4986 . Помножимо на 2 і отримаємо 0,997 . Значить, в рамках ± 3σ від середньої арифметичної укладені майже всі значення.

Так виглядає правило 3 сигм для нормального розподілу на діаграмі.

За допомогою статистичних таблиць можна отримати будь-яку ймовірність. Однак цей метод дуже повільний, незручний і сильно застарів. Сьогодні все робиться на комп'ютері. Далі переходимо до практики розрахунків в Excel.

Нормальний розподіл в Excel

В Excel є кілька функцій для підрахунку ймовірностей або зворотних значень нормального розподілу.

функція НОРМ.СТ.РАСП

функція НОРМ.СТ.РАСП призначена для розрахунку щільності φ (z) або ймовірності Φ (z) по нормованим даними ( z).

\u003d НОРМ.СТ.РАСП (z; інтегральна)

z - значення стандартизованої змінної

інтегральна - якщо 0, то розраховується щільністьφ (z) , Якщо 1 - значення функції Ф (z), тобто ймовірність P (Z

Розрахуємо щільність і значення функції для різних z: -3, -2, -1, 0, 1, 2, 3 (Їх вкажемо в осередку А2).

Для розрахунку щільності потрібно формула \u003d НОРМ.СТ.РАСП (A2; 0). На діаграмі нижче - це червона точка.

Для розрахунку значення функції \u003d НОРМ.СТ.РАСП (A2; 1). На діаграмі - зафарбована площа під нормальною кривою.

В реальності частіше доводиться розраховувати ймовірність того, що випадкова величина не вийде за деякі межі від середньої (в середньоквадратичних відхиленнях, відповідних змінної z), Тобто P (| Z | .

Визначимо, чому дорівнює ймовірність потрапляння випадкової величини в межі ± 1z, ± 2z і ± 3z від нуля. Буде потрібно формула 2Ф (z) -1, В Excel \u003d 2 * НОРМ.СТ.РАСП (A2; 1) -1.

На діаграмі добре видно основні основні властивості нормального розподілу, включаючи правило трьох сигм. функція НОРМ.СТ.РАСП - це автоматична таблиця значень функції нормального розподілу в Excel.

Може стояти і зворотна задача: за наявною ймовірності P (Z знайти стандартизовану величину z , Тобто квантиль стандартного нормального розподілу.

функція НОРМ.СТ.ОБР

НОРМ.СТ.ОБР розраховує зворотне значення функції стандартного нормального розподілу. Синтаксис складається з одного параметра:

\u003d НОРМ.СТ.ОБР (ймовірність)

ймовірність - це ймовірність.

Дана формула використовується так само часто, як і попередня, адже за тими ж таблицями шукати доводиться не тільки ймовірності, але і квантилі.

Наприклад, при розрахунку довірчих інтервалів задається довірча ймовірність, по якій потрібно розрахувати величину z.

З огляду на те, що довірчий інтервал складається з верхньої та нижньої межі і те, що нормальний розподіл симетрично відносно нуля, достатньо отримати верхню межу (позитивне відхилення). Нижня межа береться з негативним знаком. Позначимо довірчу ймовірність як γ (Гамма), тоді верхня межа довірчого інтервалу розраховується за наступною формулою.

Розрахуємо в Excel значення z (Що відповідає відхиленню від середньої в сигмах) для декількох ймовірностей, включаючи ті, які напам'ять знає будь-який статистик: 90%, 95% і 99%. В осередку B2 вкажемо формулу: \u003d НОРМ.СТ.ОБР ((1 + A2) / 2). Змінюючи значення змінної (ймовірності в осередку А2) отримаємо різні межі інтервалів.

Довірчий інтервал для 95% дорівнює 1,96, тобто майже 2 середньоквадратичних відхилення. Звідси легко навіть в розумі оцінити можливий розкид нормальної випадкової величини. Загалом, довірчим можливостям 90%, 95% і 99% відповідають довірчі інтервали ± 1,64, ± 1,96 і ± 2,58 σ.

В цілому функції НОРМ.СТ.РАСП і НОРМ.СТ.ОБР дозволяють зробити будь-який розрахунок, пов'язаний з нормальним розподілом. Але, щоб полегшити і зменшити кількість дій, в Excel є кілька інших функцій. Наприклад, для розрахунку довірчих інтервалів середньої можна використовувати ДОВЕРІТ.НОРМ. Для перевірки про середньої арифметичної є формула Z.ТЕСТ.

Розглянемо ще пару корисних формул з прикладами.

функція НОРМ.РАСП

функція НОРМ.РАСП відрізняється від НОРМ.СТ.РАСП лише тим, що її використовують для обробки даних будь-якого масштабу, а не тільки нормованих. Параметри нормального розподілу вказуються в синтаксисі.

\u003d НОРМ.РАСП (x; середнє; стандартное_откл; інтегральна)

середнє - математичне очікування, що використовується в якості першого параметра моделі нормального розподілу

стандартное_откл - середньоквадратичне відхилення - другий параметр моделі

інтегральна - якщо 0, то розраховується щільність, якщо 1 - то значення функції, тобто P (X

Наприклад, щільність для значення 15, яке витягли з нормальною вибірки з матожиданием 10, стандартним відхиленням 3, розраховується так:

Якщо останній параметр поставити 1, то отримаємо ймовірність того, що нормальна випадкова величина виявиться менше 15 при заданих параметрах розподілу. Таким чином, ймовірності можна розраховувати безпосередньо за вихідними даними.

функція НОРМ.ОБР

Це квантиль нормального розподілу, тобто значення зворотної функції. Синтаксис наступний.

\u003d НОРМ.ОБР (ймовірність; середнє; стандартное_откл)

ймовірність - ймовірність

середнє - матожидание

стандартное_откл - середньоквадратичне відхилення

Призначення той же, що і у НОРМ.СТ.ОБР, Тільки функція працює з даними будь-якого масштабу.

Приклад показаний в ролику в кінці статті.

Моделювання нормального розподілу

Для деяких завдань потрібно генерація нормальних випадкових чисел. Готової функції для цього немає. Однак В Excel є дві функції, які повертають випадкові числа: СЛУЧМЕЖДУі СЛЧИС.Перша видає випадкові рівномірно розподілені цілі числа в зазначених межах. Друга функція генерує рівномірно розподілені випадкові числа між 0 і 1. Щоб зробити штучну вибірку з будь-яким заданим розподілом, потрібна функція СЛЧИС.

Припустимо, для проведення експерименту необхідно отримати вибірку з нормально розподіленої генеральної сукупності з матожиданием 10 і стандартним відхиленням 3. Для одного випадкового значення напишемо формулу в Excel.

НОРМ.ОБР (СЛЧИС (); 10; 3)

Протягнемо її на необхідну кількість осередків і нормальна вибірка готова.

Для моделювання стандартизованих даних слід скористатися НОРМ.СТ.ОБР.

Процес перетворення рівномірних чисел в нормальні можна показати на наступній діаграмі. Від рівномірних ймовірностей, які генеруються формулою СЛЧИС, проведені горизонтальні лінії до графіка функції нормального розподілу. Потім від точок перетину ймовірностей з графіком опущені проекції на горизонтальну вісь.

електроінструмент