Содержание
- Ошибка типа I: ошибочно отвергнуть нулевую гипотезу
- Ошибка типа II: ошибочное отклонение альтернативной гипотезы
- Определение уровня значимости
- Выбор теста значимости
Статистическая значимость является объективным показателем того, являются ли результаты исследования математически «реальными» и статистически оправданными, а не случайным явлением. Обычно используемые тесты значимости ищут различия в средствах наборов данных или различия в дисперсиях наборов данных. Тип применяемого теста зависит от типа анализируемых данных. Исследователи должны определить, насколько значительными они требуют результатов, иными словами, насколько они готовы пойти на ошибку. Как правило, исследователи готовы принять уровень риска 5 процентов.
Ошибка типа I: ошибочно отвергнуть нулевую гипотезу
••• Скотт Ротштейн / iStock / Getty ImagesЭксперименты проводятся для проверки конкретных гипотез или экспериментальных вопросов с ожидаемым результатом. Нулевая гипотеза - это та, которая не обнаруживает различий между двумя наборами сравниваемых данных. Например, в медицинском исследовании нулевая гипотеза может заключаться в том, что нет различий в улучшении между пациентами, получающими исследуемый препарат, и пациентами, получающими плацебо. Если исследователь ошибочно отвергает эту нулевую гипотезу, когда она действительно верна, другими словами, если они «обнаруживают» разницу между двумя наборами пациентов, когда на самом деле не было никакой разницы, то они допустили ошибку типа I.Исследователи заранее определяют, какой риск совершения ошибки I типа они готовы принять. Этот риск основан на максимальном p-значении, которое они примут, прежде чем отвергнуть нулевую гипотезу, и называется альфа.
Ошибка типа II: ошибочное отклонение альтернативной гипотезы
Альтернативной гипотезой является та, которая обнаруживает разницу между двумя наборами сравниваемых данных. В случае медицинского испытания вы ожидаете увидеть различные уровни улучшения у пациентов, получающих исследуемый препарат, и пациентов, получающих плацебо. Если исследователи не могут отвергнуть нулевую гипотезу, когда они должны, другими словами, если они «не обнаружат» никакой разницы между двумя группами пациентов, когда действительно есть разница, то они допустят ошибку типа II.
Определение уровня значимости
Когда исследователи проводят тест статистической значимости, а полученное значение p меньше уровня риска, который считается приемлемым, тогда результат теста считается статистически значимым. В этом случае нулевая гипотеза - гипотеза об отсутствии различий между двумя группами - отвергается. Другими словами, результаты показывают, что существует разница в улучшении между пациентами, получающими исследуемое лекарственное средство, и пациентами, получающими плацебо.
Выбор теста значимости
Есть несколько различных статистических тестов на выбор. Стандартный t-тест сравнивает средние значения из двух наборов данных, таких как данные нашего исследуемого препарата и данные плацебо. Парный t-критерий используется для обнаружения различий в одном и том же наборе данных, например, до и после исследования. Односторонний дисперсионный анализ (ANOVA) может сравнивать средние значения из трех или более наборов данных, а двухсторонний ANOVA сравнивает средние значения двух или более наборов данных в ответ на две разные независимые переменные, такие как разные сильные стороны изучать препарат. Линейная регрессия сравнивает средства наборов данных по градиенту обработок или времени. Каждый статистический тест приведет к мерам значимости или альфа, которые могут быть использованы для интерпретации результатов теста.