Как рассчитать MSE

Posted on
Автор: Lewis Jackson
Дата создания: 14 Май 2021
Дата обновления: 17 Ноябрь 2024
Anonim
МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.
Видео: МЕТРИКИ РЕГРЕССИИ В МАШИННОМ ОБУЧЕНИИ | MAE, MSE, RMSE, R2, коэффициент детерминации.

Содержание

Когда ученые, экономисты или статистики делают прогнозы на основе теории, а затем собирают реальные данные, им нужен способ измерить разницу между прогнозируемыми и измеренными значениями. Они обычно полагаются на среднеквадратичную ошибку (MSE), которая является суммой вариаций отдельных точек данных в квадрате и делится на количество точек данных минус 2. Когда данные отображаются на графике, MSE определяется как суммирование изменений в точках данных вертикальной оси. На графике x-y это были бы значения y.

Почему квадрат вариаций?

Умножение разницы между прогнозируемыми и наблюдаемыми значениями имеет два желательных эффекта. Первый заключается в том, чтобы все значения были положительными. Если одно или несколько значений были отрицательными, сумма всех значений могла бы быть нереально малой и плохо отражать фактическое отклонение между прогнозируемыми и наблюдаемыми значениями. Второе преимущество возведения в квадрат заключается в придании большего веса большим различиям, что гарантирует, что большое значение для MSE означает большие изменения данных.

Пример расчета запаса Алгоритм

Предположим, у вас есть алгоритм, который прогнозирует цены конкретной акции на ежедневной основе. В понедельник прогнозируется, что цена акций составит 5,50 доллара, во вторник - 6,00, среда - 6,00, четверг - 7,50 и пятница - 8,00. Считая понедельник днем ​​1, у вас есть набор точек данных, который выглядит следующим образом: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) и (5, 8.00). Фактические цены следующие: понедельник $ 4,75 (1, 4,75); Вторник $ 5,35 (2, 5,35); Среда 6,25 долл. США (3,65 долл. США); Четверг 7,25 долл. США (4,75 долл. США); и в пятницу: 8,50 долл. США (5, 8,50 долл. США).

Различия между значениями y этих точек составляют 0,75, 0,65, -0,25, 0,25 и -0,50 соответственно, где отрицательный знак указывает прогнозируемое значение, меньшее наблюдаемого. Чтобы вычислить MSE, вы сначала возводите в квадрат каждое значение отклонения, которое исключает знаки минуса и дает 0,5625, 0,4225, 0,0625, 0,0625 и 0,25. Суммирование этих значений дает 1,36, а деление на число измерений минус 2, то есть 3, дает MSE, которое оказывается равным 0,45.

MSE и RMSE

Меньшие значения для MSE указывают на более тесное согласие между предсказанными и наблюдаемыми результатами, а MSE 0,0 указывает на полное согласие. Однако важно помнить, что значения вариаций возводятся в квадрат. Когда требуется измерение ошибки в тех же единицах, что и в точках данных, статистики принимают среднеквадратическую ошибку (RMSE). Они получают это, беря квадратный корень из среднеквадратичной ошибки. Для приведенного выше примера RSME будет 0,671 или около 67 центов.