Содержание
В математических терминах «среднее» - это среднее. Средние значения рассчитываются для осмысленного представления набора данных. Например, метеоролог может сказать вам, что средняя температура на 22 января в Чикаго составляет 25 градусов по Фаренгейту на основе прошлых данных. Это число не может предсказать точную температуру на 22 января следующего года в Чикаго, но оно говорит вам достаточно, чтобы знать, что вы должны взять с собой куртку, если вы собираетесь в Чикаго в этот день. Два обычно используемых средства - среднее арифметическое и среднее геометрическое. Знание того, что использовать для ваших данных, означает понимание их различий.
Формулы для расчета
Наиболее очевидная разница между средним арифметическим и средним геометрическим значением для набора данных заключается в том, как они рассчитываются. Среднее арифметическое рассчитывается путем сложения всех чисел в наборе данных и деления результата на общее количество точек данных.
Пример: среднее арифметическое 11, 13, 17 и 1000 = (11 + 13 + 17 + 1000) / 4 = 260,25
Среднее геометрическое значение набора данных рассчитывается путем умножения чисел в наборе данных и получения n-го корня результата, где «n» - общее количество точек данных в наборе.
Пример: среднее геометрическое из 11, 13, 17 и 1000 = 4-й корень из (11 x 13 x 17 x 1000) = 39,5
Влияние выбросов
Когда вы смотрите на результаты вычислений среднего арифметического и среднего геометрического, вы замечаете, что влияние выбросов значительно уменьшается в среднем геометрическом значении. Что это значит? В наборе данных 11, 13, 17 и 1000 число 1000 называется «выбросом», потому что его значение намного выше, чем все остальные. Когда вычисляется среднее арифметическое, результат составляет 260,25. Обратите внимание, что ни одно число в наборе данных не близко даже к 260,25, поэтому среднее арифметическое в этом случае не является репрезентативным. Эффект выброса был преувеличен. Среднее геометрическое значение 39,5 лучше показывает, что большинство чисел из набора данных находятся в диапазоне от 0 до 50.
Пользы
Статистики используют арифметические средства для представления данных без значительных выбросов. Этот тип среднего подходит для представления средних температур, потому что все температуры на 22 января в Чикаго будут между -50 и 50 градусами по Фаренгейту. Температура в 10000 градусов по Фаренгейту просто не произойдет. Такие вещи, как средние значения ватина и средние скорости гоночных автомобилей, также хорошо представлены с использованием арифметических средств.
Геометрические средние используются в тех случаях, когда различия между точками данных являются логарифмическими или отличаются от кратных 10. Биологи используют геометрические средства для описания размеров популяций бактерий, которые могут составлять 20 организмов в один день и 20 000 в следующий. Экономисты могут использовать геометрические средства для описания распределения доходов. Вы и большинство ваших соседей могли бы зарабатывать около 65 000 долларов в год, но что, если парень на холме зарабатывает 65 миллионов долларов в год? Среднее арифметическое значение дохода в вашем районе будет вводить в заблуждение, поэтому геометрическое среднее будет более подходящим.