Содержание
Упростите сравнения наборов чисел, особенно больших наборов чисел, вычисляя значения центра, используя среднее значение, режим и медиану. Используйте диапазоны и стандартные отклонения наборов для проверки изменчивости данных.
Расчет среднего
Среднее значение определяет среднее значение набора чисел. Например, рассмотрим набор данных, содержащий значения 20, 24, 25, 36, 25, 22, 23.
Чтобы найти среднее значение, используйте формулу: Среднее равно сумме чисел в наборе данных, деленной на количество значений в наборе данных. В математических терминах: Среднее = (сумма всех терминов) ÷ (сколько терминов или значений в наборе).
Добавьте числа в примере набора данных: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Разделите на количество точек данных в наборе. Этот набор имеет семь значений, поэтому разделите на 7.
Вставьте значения в формулу для расчета среднего значения. Среднее значение равно сумме значений (175), деленной на количество точек данных (7). Поскольку 175 ÷ 7 = 25, среднее значение этого набора данных равно 25. Не все средние значения будут равны целому числу.
Расчет медианы
Медиана определяет середину или среднее значение набора чисел.
Поместите числа в порядке от наименьшего к наибольшему. Используйте пример набора значений: 20, 24, 25, 36, 25, 22, 23. Размещенные по порядку, набор становится: 20, 22, 23, 24, 25, 25, 36.
Поскольку этот набор чисел имеет семь значений, медиана или значение в центре - 24.
Если набор чисел имеет четное число значений, вычислите среднее значение двух центральных значений. Например, предположим, что набор чисел содержит значения 22, 23, 25, 26. Середина находится между 23 и 25. Добавление 23 и 25 приводит к получению 48. Деление 48 на два дает среднее значение 24.
Режим расчета
Режим определяет наиболее распространенное значение или значения в наборе данных. В зависимости от данных, может быть один или несколько режимов или вообще нет режимов.
Подобно нахождению медианы, упорядочите набор данных от наименьшего к наибольшему. В наборе примеров упорядоченные значения становятся: 20, 22, 23, 24, 25, 25, 36.
Режим возникает, когда значения повторяются. В наборе примеров значение 25 встречается дважды. Другие номера не повторяются. Следовательно, режимом является значение 25.
В некоторых наборах данных используется более одного режима. Набор данных 22, 23, 23, 24, 27, 27, 29 содержит два режима, по одному в 23 и 27. Другие наборы данных могут иметь более двух режимов, могут иметь режимы с более чем двумя числами (как 23, 23 , 24, 24, 24, 28, 29: режим равен 24) или может вообще не иметь никаких режимов (как 21, 23, 24, 25, 26, 27, 29). Режим может происходить где угодно в наборе данных, а не только в середине.
Расчет диапазона
Диапазон показывает математическое расстояние между самым низким и самым высоким значениями в наборе данных. Диапазон измеряет изменчивость набора данных. Широкий диапазон указывает на большую изменчивость данных или, возможно, на единичный выброс, далекий от остальных данных. Выбросы могут искажать или сдвигать среднее значение, достаточное для воздействия на анализ данных.
В группе образцов самое низкое значение - 20, а самое высокое - 36.
Чтобы вычислить диапазон, вычтите самое низкое значение из наибольшего значения. Поскольку 36-20 = 16, диапазон равен 16.
В наборе выборок высокое значение данных 36 превышает предыдущее значение 25 на 11. Это значение кажется экстремальным, учитывая другие значения в наборе. Значение 36 может быть точкой данных выброса.
Расчет стандартного отклонения
Стандартное отклонение измеряет изменчивость набора данных. Как и диапазон, меньшее стандартное отклонение указывает на меньшую изменчивость.
Чтобы найти стандартное отклонение, необходимо сложить квадратную разницу между каждой точкой данных и средним значением, сложить все квадраты, разделить эту сумму на единицу меньше количества значений (N-1) и, наконец, вычислить квадратный корень из дивиденда. Математически, начните с вычисления среднего.
Вычислите среднее значение, сложив все значения точек данных, а затем разделив их на количество точек данных. В наборе данных выборки 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Разделите сумму 175 на количество точек данных 7 или 175 ÷ 7 = 25. Среднее значение равно 25.
Затем вычтите среднее значение из каждой точки данных, а затем возведите в квадрат каждую разницу. Формула выглядит так: ∑ (x-µ)2где ∑ означает сумму, x представляет каждое значение набора данных, а µ представляет среднее значение. Продолжая с примером набора, значения становятся: 20-25 = -5 и -52= 25; 24-25 = -1 и -12= 1; 25-25 = 0 и 02= 0; 36-25 = 11 и 112= 121; 25-25 = 0 и 02= 0; 22-25 = -3 и -32= 9; и 23-25 = -2 и -22=4.
Добавление квадратов разностей дает: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Разделите сумму квадратов разностей на единицу меньше, чем количество точек данных. Примерный набор данных имеет 7 значений, поэтому N-1 равно 7-1 = 6. Сумма квадратов разностей 160, деленная на 6, равна приблизительно 26,6667.
Рассчитайте стандартное отклонение, найдя квадратный корень деления на N-1. В этом примере квадратный корень из 26.6667 равен примерно 5.164. Следовательно, стандартное отклонение составляет примерно 5,164.
Стандартное отклонение помогает оценить данные. Числа в наборе данных, которые попадают в одно стандартное отклонение от среднего, являются частью набора данных. Числа, которые выходят за пределы двух стандартных отклонений, являются крайними значениями или выбросами. В наборе примеров значение 36 лежит более чем на два стандартных отклонения от среднего значения, поэтому 36 является выбросом. Выбросы могут представлять ошибочные данные или могут предлагать непредвиденные обстоятельства, и их следует тщательно учитывать при интерпретации данных.