Как рассчитать статистическую разницу

Ноябрь 2024

Автор: Robert Simon

Дата создания: 24 Июнь 2021

Дата обновления: 17 Ноябрь 2024

Видео: Расчет коэффициента корреляции в Excel

Содержание

Метод хи-квадрат
Метод Т-теста

Статистическая разница относится к значительным различиям между группами объектов или людей. Ученые рассчитывают эту разницу, чтобы определить, являются ли данные эксперимента надежными, прежде чем делать выводы и публиковать результаты. При изучении взаимосвязи между двумя переменными ученые используют метод вычисления хи-квадрат. При сравнении двух групп ученые используют метод t-распределения.

Метод хи-квадрат

Создайте таблицу данных со строкой для каждого возможного результата и столбцом для каждой группы, участвующей в эксперименте.

Например, если вы пытаетесь ответить на вопрос о том, могут ли карточки с изображениями или карточки с надписью лучше помочь детям пройти словарный тест, вы должны создать таблицу с тремя столбцами и двумя строками. Первый столбец будет помечен как "Пройденный тест?" и два ряда под заголовком будут отмечены «Да» и «Нет». Следующий столбец будет помечен «Карточки с картинками», а последний столбец будет помечен «Карточки с надписями».

Заполните таблицу данных данными вашего эксперимента. Суммируйте каждый столбец и строку и поместите итоги под соответствующие столбцы / строки. Эти данные называют наблюдаемой частотой.

Рассчитайте ожидаемую частоту для каждого результата и запишите его. Ожидаемая частота - это количество людей или объектов, которые вы ожидаете получить случайно. Чтобы вычислить эту статистику, умножьте общее количество столбцов на общее количество строк и разделите на общее количество наблюдений. Например, если 200 детей использовали карточки с картинками, 300 детей сдали тест на словарный запас и 450 детей прошли тестирование, ожидаемая частота прохождения теста с использованием карточек с картинками составила бы (200 * 300) / 450 или 133,3. Если какой-либо результат имеет ожидаемую частоту менее 5,0, данные не являются надежными.

Вычтите каждую наблюдаемую частоту из каждой ожидаемой частоты. Квадратный результат. Разделите это значение на ожидаемую частоту. В приведенном выше примере вычтите 200 из 133,3. Возведите в квадрат результат и разделите на 133,3 для результата 13,04.

Суммируйте результаты расчета на шаге 4. Это значение хи-квадрат.

Вычислите степень свободы для таблицы, умножив количество строк - 1 на количество столбцов - 1. Эта статистика показывает, насколько велик размер выборки.

Определите допустимый предел погрешности. Чем меньше таблица, тем меньше должна быть погрешность. Это значение называется альфа-значением.

Посмотрите нормальное распределение в статистической таблице. Таблицы статистики можно найти в Интернете или в книгах статистики. Найдите значение для пересечения правильных степеней свободы и альфа. Если это значение меньше или равно значению хи-квадрат, данные являются статистически значимыми.

Метод Т-теста

Составьте таблицу данных, показывающую количество наблюдений для каждой из двух групп, среднее значение результатов для каждой группы, стандартное отклонение от каждого среднего значения и дисперсию для каждого среднего значения.

Вычтите среднее значение группы два из среднего значения группы один.

Разделите каждую дисперсию на количество наблюдений минус 1. Например, если одна группа имела дисперсию 2186753 и 425 наблюдений, вы бы поделили 2186753 на 424. Возьмите квадратный корень каждого результата.

Разделите каждый результат на соответствующий результат из шага 2.

Вычислите степени свободы, суммируя количество наблюдений для обеих групп и деля на 2. Определите свой альфа-уровень и найдите пересечение степеней свободы и альфа в статистической таблице. Если значение меньше или равно вашему расчетному t-критерию, результат является статистически значимым.