Как определить размер выборки со средним и стандартным отклонением

Posted on
Автор: Peter Berry
Дата создания: 13 Август 2021
Дата обновления: 13 Ноябрь 2024
Anonim
Как и зачем оценивать размер выборки для A/B теста?
Видео: Как и зачем оценивать размер выборки для A/B теста?

Правильный размер выборки является важным фактором для тех, кто проводит опросы. Если размер выборки слишком мал, полученные данные выборки не будут точным отражением данных, представляющих совокупность. Если размер выборки слишком велик, опрос будет слишком дорогим и длительным для завершения. Например, если ваша цель опроса состояла в том, чтобы определить средний возраст женщин в Соединенных Штатах, было бы нецелесообразно спрашивать каждую женщину ее возраста.

Определение размера выборки требует, чтобы вы определили уровень достоверности, который вы хотите, и уровень ошибки, который вы допустите, и что вы либо знаете, либо имеете оценку стандартного отклонения параметра совокупности, который вы пытаетесь определить.

    Определите уровень ошибки, которую вы будете терпеть. Выберите значение, которое даст результат, который составляет менее 5 процентов от параметра совокупности, который вы пытаетесь оценить. Учтите, что чем выше допустимый уровень ошибок, тем менее значимы результаты вашего опроса.

    Рассмотрим ситуацию, когда вам нужно будет определить средний возраст женщин (популяционный параметр) в Соединенных Штатах. Сначала сделайте оценку среднего возраста женщин. Для этой оценки используйте предыдущее исследование, а затем умножьте это число на 0,05, чтобы найти ошибку.

    Если исследование недоступно, приблизительно оцените средний возраст женщин самостоятельно. Для этой оценки получите данные из 10 собственных опросов, каждый из которых имеет размер выборки 31 женщина. Для каждого опроса рассчитайте средний возраст для 31 женщины. Затем рассчитайте среднее значение для всех опросов. Используйте это число в качестве оценки среднего возраста для женщин. Затем умножьте это число на 0,05, чтобы получить ошибку. Если среднее значение, полученное для ваших опросов, составляло 40, умножьте 0,05 (5 процентов) на 40, чтобы получить 2.Итак, выберите ошибку, которую вы допустите в течение двух лет.

    Запишите этот номер; Вы будете использовать его для расчета размера выборки. Если вы используете 2 в качестве ошибки для расчета выборки, ваш опрос даст точный результат в течение двух лет от фактического среднего возраста женщин в популяции. Помните, что чем меньше ошибка, тем больше будет размер выборки.

    Определите уровень достоверности, который вы хотите использовать. Выберите уровень достоверности 90, 95 или 99 процентов. Используйте более высокий уровень достоверности, если вы хотите увеличить вероятность того, что результаты вашего выборочного опроса будут в пределах погрешности, которую вы рассчитали на предыдущем шаге. Помните, что чем выше выбранный вами уровень достоверности, тем больше будет размер выборки.

    Определить критическое значение для данного доверительного интервала. Для уровня достоверности 90 процентов используйте критическое значение 1,645. Для доверительного интервала 90 процентов используйте критическое значение 1,960, а для доверительного уровня 99 процентов используйте критическое значение 2,575. Запишите этот номер; Вы будете использовать его для расчета размера выборки.

    Затем выясните стандартное отклонение для параметра совокупности, который вы пытаетесь оценить с помощью своего обследования. Используйте стандартное отклонение параметра совокупности, приведенное в задаче, или оцените стандартное отклонение. Если это не дано, используйте стандартное отклонение от аналогичного исследования. Если ни того, ни другого нет, приблизительно оцените стандартное отклонение, чтобы оно составляло приблизительно 34 процента населения.

    Для примера, указанного в шаге 1, предположим, что 20 лет - это одно стандартное отклонение. Для среднего возраста 40 лет это будет означать, что 68 процентов женщин в населении составляют от 20 до 60 лет.

    Рассчитайте размер выборки. Сначала умножьте критическое значение на стандартное отклонение. Затем разделите этот результат на ошибку из шага 1. Теперь возведите в квадрат этот результат. Этот результат - размер выборки.

    Для задачи, которая использует доверительный интервал 90 процентов (критическое значение 1,645), указывает ошибку в течение двух лет и дает стандартное отклонение для населения 20 лет, сначала умножьте 1,645 на 20, чтобы получить 32,9. Разделите 32,9 на 2, чтобы получить 16,45. Квадрат 16,45 для получения 270,6. Округлите до следующего наибольшего целого числа, чтобы получить размер выборки 271.

    Укажите условия для результатов вашего опроса. Например, на шаге 1, с размером выборки 271, вы можете быть на 90 процентов уверены, что среднее значение выборки из 271 женщины будет в течение двух лет фактического среднего значения общей численности женщин. Таким образом, если ваш опрос показал, что средний возраст составляет 43 года, вы можете убедиться, что существует 90-процентная вероятность того, что средний возраст женщин в Соединенных Штатах будет между 42 и 44 годами.