В статистике случайная выборка данных из популяции часто приводит к получению колоколообразной кривой со средним по центру на пике колокола. Это известно как нормальное распределение. Центральная предельная теорема гласит, что по мере увеличения числа выборок измеренное среднее обычно имеет тенденцию нормально распределяться вокруг среднего значения популяции, а стандартное отклонение становится уже. Центральная предельная теорема может быть использована для оценки вероятности нахождения определенного значения в популяции.
Соберите образцы и затем определите среднее. Например, предположим, что вы хотите вычислить вероятность того, что у мужчины в Соединенных Штатах уровень холестерина составляет 230 миллиграмм на децилитр или выше. Мы начнем с сбора образцов у 25 человек и измерения их уровня холестерина. После сбора данных рассчитайте среднее значение выборки. Среднее значение получается путем суммирования каждого измеренного значения и деления на общее количество образцов. В этом примере предположим, что среднее значение составляет 211 миллиграммов на децилитр.
Рассчитайте стандартное отклонение, которое является мерой «разброса» данных. Это можно сделать за несколько простых шагов:
В этом примере предположим, что стандартное отклонение составляет 46 миллиграммов на децилитр.
Рассчитайте стандартную ошибку, разделив стандартное отклонение на квадратный корень из общего числа выборок:
Стандартная ошибка = 46 / sqrt25 = 9,2
Нарисуйте эскиз нормального распределения и заштрихуйте в соответствующей вероятности. Следуя примеру, вы хотите узнать вероятность того, что у мужчины уровень холестерина составляет 230 миллиграмм на децилитр или выше. Чтобы найти вероятность, выясните, сколько стандартных ошибок от среднего значения 230 миллиграмм на децилитр составляет (Z-значение):
Z = 230 - 211 / 9,2 = 2,07
Посмотрите вероятность получения значения 2.07 стандартных ошибок выше среднего. Если вам нужно найти вероятность нахождения значения в пределах 2,07 стандартных отклонений от среднего, то z положительно. Если вам нужно найти вероятность нахождения значения, превышающего 2,07 стандартного отклонения от среднего, тогда z отрицательно.
Найдите значение z в стандартной таблице нормальных вероятностей. Первый столбец слева показывает целое число и первое десятичное место z-значения. Ряд вдоль вершины показывает третье десятичное место z-значения. В соответствии с примером, поскольку наше z-значение равно -2,07, сначала найдите -2,0 в левом столбце, а затем отсканируйте верхнюю строку для записи 0,07. Точка, в которой эти столбцы и строки пересекаются, является вероятностью. В этом случае значение, считанное из таблицы, составляет 0,0192, и, таким образом, вероятность обнаружения мужчины с уровнем холестерина в 230 миллиграмм на децилитр или выше составляет 1,92 процента.