Характеристики хорошего размера выборки

Posted on
Автор: Judy Howell
Дата создания: 2 Июль 2021
Дата обновления: 12 Май 2024
Anonim
Как и зачем оценивать размер выборки для A/B теста?
Видео: Как и зачем оценивать размер выборки для A/B теста?

Содержание

Размер выборки - это небольшой процент населения, который используется для статистического анализа. Например, когда выясняется, сколько людей проголосовало бы за определенного человека на выборах, невозможно (ни в финансовом, ни в материально-техническом отношении) спросить каждого человека в Соединенных Штатах об их предпочтении при голосовании. Вместо этого берется небольшая выборка населения. Размер выборки может равняться нескольким сотням или нескольким тысячам. Все зависит от того, какие характеристики вы хотите, чтобы эта выборка населения имела, и насколько точными вы хотите, чтобы ваши результаты были.

Низкая ошибка выборки

Каждый раз, когда вы проводите опрос выборки населения (в отличие от опроса всех), вы будете получать некоторую статистику, которая немного отличается от «истинной» статистики. Это называется ошибкой выборки и часто выражается в процентах. Например, опрос может быть плюс или минус «десять баллов». Другими словами, если социолог находит, что за определенного кандидата проголосует 55 процентов людей, плюс-минус десять, они действительно говорят, что за этого кандидата проголосуют где-то от 45 до 65 процентов. У хорошего образца будет низкая ошибка выборки (точка или два).

Высокий уровень доверия

Уровень достоверности основан на теории, что чем чаще вы выбираете популяцию, тем больше данные напоминают кривую колокола. Уровни достоверности выражаются в процентах, например, «уровень достоверности 90 процентов». Чем выше уровень достоверности, тем увереннее исследователь в том, что его данные выглядят как кривая колокольчика: уровень достоверности 99 процентов желателен и, вероятно, будет иметь лучшие результаты, чем уровень достоверности 90 процентов (или ниже).

Степень изменчивости

Степень изменчивости относится к тому, насколько разнообразна популяция. Например, опрос всех политических партий о здравоохранении, скорее всего, приведет к более широкому расхождению в ответах, чем простой опрос одной партии. Чем выше заявленная пропорция, тем выше уровень изменчивости, причем .5 является самым высоким (и, возможно, наименее желательным) значением. Для небольших выборок вы хотели бы видеть низкую степень изменчивости (например, .2).