Содержание
- TL; DR (слишком долго; не читал)
- Размер образца
- Среднее значение и выбросы
- Опасность малых образцов
- Граница ошибки
Когда дело доходит до научных исследований, размер выборки является решающим фактором для качественных исследований. Размер выборки, иногда представлен как N, это количество отдельных частей данных, используемых для расчета набора статистики. Большие размеры выборки позволяют исследователям лучше определять средние значения их данных и избегать ошибок при тестировании небольшого числа возможно нетипичных выборок.
TL; DR (слишком долго; не читал)
Размер выборки является важным фактором для исследования. Большие размеры выборки обеспечивают более точные средние значения, определяют выбросы, которые могут исказить данные в меньшей выборке, и обеспечивают меньшую погрешность.
Размер образца
Размер выборки - это количество информации, проверенной в ходе опроса или эксперимента. Например, если вы протестируете 100 образцов морской воды на наличие нефтяных остатков, ваш объем выборки будет равен 100. Если вы обследуете 20 000 человек на предмет признаков тревоги, ваш объем выборки составит 20 000. Большие размеры выборок имеют очевидное преимущество - они предоставляют исследователям больше данных для работы; но большие эксперименты с размером выборки требуют больших финансовых и временных затрат.
Среднее значение и выбросы
Большие размеры образцов помогают определить среднее значение качества среди протестированных образцов - это среднее значение значит, Чем больше размер выборки, тем точнее среднее значение. Например, если вы обнаружите, что среди 40 человек средняя высота составляет 5 футов 4 дюйма, а среди 100 человек средняя высота составляет 5 футов 3 дюйма, второе измерение является лучшей оценкой средней высоты индивидуальный, так как вы тестируете значительно больше предметов. Определение среднего также позволяет исследователям более легко определить останцы, Выделение - это фрагмент данных, который сильно отличается от среднего значения и может представлять интерес для исследования. Таким образом, исходя из средней высоты, кто-то с ростом 6 футов и 8 дюймов будет удаленной точкой данных.
Опасность малых образцов
Возможность выбросов является частью того, что делает большой размер выборки важным. Например, скажем, вы опросили 4 человек об их политической принадлежности, а один принадлежит Независимой партии. Поскольку это один человек в выборке размером 4, ваша статистика покажет, что 25 процентов населения принадлежит Независимой партии, что, вероятно, является неточной экстраполяцией. Увеличение размера выборки позволит избежать вводящей в заблуждение статистики, если в выборке присутствует выброс.
Граница ошибки
Размер выборки напрямую связан со статистикой предел погрешностиили насколько точной может быть статистика. Для вопроса «да» или «нет», например, владеет ли автомобиль автомобилем, вы можете определить предел погрешности для статистики, поделив 1 на квадратный корень размера выборки и умножив на 100. Итоговое значение представляет собой процент , Например, размер выборки 100 будет иметь погрешность 10%. При измерении числовых качеств со средним значением, таким как рост или вес, умножьте эту сумму в два раза среднеквадратичное отклонение данных, который измеряет, насколько разброс значений данных от среднего. В обоих случаях, чем больше размер выборки, тем меньше погрешность.