Содержание
- TL; DR (слишком долго; не читал)
- Разница между уровнем достоверности и доверительным интервалом
- Расчет доверительных интервалов или уровней для больших выборок
- Расчет доверительных интервалов для малых выборок
Статистика - все о том, чтобы делать выводы перед лицом неопределенности. Всякий раз, когда вы берете образец, вы не можете быть полностью уверены, что ваш образец действительно отражает популяцию, из которой он взят. Статистики справляются с этой неопределенностью, принимая во внимание факторы, которые могут повлиять на оценку, количественно оценивая их неопределенность и выполняя статистические тесты, чтобы сделать выводы из этих неопределенных данных.
Статистики используют доверительные интервалы для указания диапазона значений, которые могут содержать «истинное» среднее значение популяции на основе выборки, и выражают свой уровень достоверности в этом через уровни достоверности. Хотя вычисление уровней достоверности не часто полезно, расчет доверительных интервалов для данного уровня достоверности является очень полезным навыком.
TL; DR (слишком долго; не читал)
Рассчитайте доверительный интервал для данного уровня достоверности, умножив стандартную ошибку на Z оценка для выбранного вами уровня доверия. Вычтите этот результат из вашего среднего значения, чтобы получить нижнюю границу, и добавьте его к среднему значению, чтобы найти верхнюю границу. (См. Ресурсы)
Повторите тот же процесс, но с T оценка вместо Z оценка для небольших образцов (N < 30).
Найдите уровень достоверности для набора данных, взяв половину размера доверительного интервала, умножив его на квадратный корень размера выборки, а затем разделив на стандартное отклонение выборки. Посмотрите на результат Z или же T Оценка в таблице, чтобы найти уровень.
Разница между уровнем достоверности и доверительным интервалом
Когда вы видите цитируемую статистику, иногда за ней указывается диапазон с аббревиатурой «CI» (для «доверительного интервала») или просто символом плюс-минус, за которым следует цифра. Например, «средний вес взрослого мужчины составляет 180 фунтов (ДИ: 178,14–181,86)» или «средний вес взрослого мужчины составляет 180 ± 1,86 фунта». Обе они сообщают вам одну и ту же информацию: на основе выборки используется, средний вес человека, вероятно, попадает в определенный диапазон. Сам диапазон называется доверительным интервалом.
Если вы хотите быть максимально уверенным в том, что диапазон содержит истинное значение, вы можете расширить диапазон. Это увеличит ваш «уровень достоверности» в оценке, но диапазон будет охватывать больше потенциальных весов. Большинство статистических данных (включая приведенную выше) представлены в виде 95-процентных доверительных интервалов, что означает, что существует 95-процентная вероятность того, что истинное среднее значение находится в пределах диапазона. Вы также можете использовать уровень доверия 99% или уровень доверия 90%, в зависимости от ваших потребностей.
Расчет доверительных интервалов или уровней для больших выборок
Когда вы используете доверительный уровень в статистике, он обычно нужен для вычисления доверительного интервала. Это немного проще сделать, если у вас большая выборка, например, более 30 человек, потому что вы можете использовать Z оценка для вашей оценки, а не сложнее T баллы.
Возьмите ваши необработанные данные и вычислите среднее значение по выборке (просто сложите отдельные результаты и разделите на число результатов). Рассчитайте стандартное отклонение, вычтя среднее значение из каждого отдельного результата, чтобы найти разницу, а затем возведите ее в квадрат. Сложите все эти различия и затем разделите результат на размер выборки минус 1. Возьмите квадратный корень этого результата, чтобы найти стандартное отклонение выборки (см. Ресурсы).
Определите доверительный интервал, сначала найдя стандартную ошибку:
SE = s / √N
где s ваше стандартное отклонение образца и N ваш размер выборки. Например, если вы взяли выборку из 1000 мужчин, чтобы измерить средний вес человека, и получили стандартное отклонение выборки 30, это дало бы:
SE = 30 / √1000 = 30 / 31.62 = 0.95
Чтобы найти доверительный интервал из этого, найдите уровень достоверности, для которого вы хотите рассчитать интервал, в Z-счетную таблицу и умножьте это значение на Z Гол. Для уровня достоверности 95 процентов Zрезультат равен 1,96. Используя пример, это означает:
Среднее ± Z × SE= 180 фунтов ± 1,96 × 0,95 = 180 ± 1,86 фунтов
Здесь ± 1,86 фунта - это 95-процентный доверительный интервал.
Если у вас есть этот бит информации, а также размер выборки и стандартное отклонение, вы можете рассчитать уровень достоверности, используя следующую формулу:
Z = 0,5 × размер доверительного интервала × √N / s
Размер доверительного интервала всего в два раза больше значения ±, поэтому в приведенном выше примере мы знаем, что в 0,5 раза это 1,86. Это дает:
Z = 1.86 × √1000 / 30 = 1.96
Это дает нам значение для Z, который вы можете посмотреть в Z-счетная таблица, чтобы найти соответствующий уровень доверия.
Расчет доверительных интервалов для малых выборок
Для небольших выборок существует аналогичный процесс для вычисления доверительного интервала. Сначала вычтите 1 из размера вашей выборки, чтобы найти свои «степени свободы». В символах:
Д.Ф. = N −1
Для образца N = 10, это дает Д.Ф. = 9.
Найдите свое альфа-значение, вычтя десятичную версию уровня достоверности (т. Е. Ваш процентный уровень достоверности, деленный на 100) из 1 и разделив результат на 2 или в символах:
α = (1 - десятичный уровень достоверности) / 2
Таким образом, для уровня достоверности 95 процентов (0,95):
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Посмотрите ваше альфа-значение и степени свободы в (один хвост) T распределите таблицу и запишите результат. В качестве альтернативы, опустите деление на 2 выше и используйте двухсторонний T стоимость. В этом примере результат равен 2,262.
Как и на предыдущем шаге, рассчитайте доверительный интервал, умножив это число на стандартную ошибку, которая определяется с использованием стандартного отклонения и размера выборки таким же образом. Единственное отличие состоит в том, что вместо Z оценка, вы используете T Гол.