Содержание
Когда вы проводите эксперимент, который дает серию наблюдаемых значений, которые вы хотите сравнить с теоретическими значениями, среднеквадратичное отклонение (RMSD) или среднеквадратичная ошибка (RMSE) позволяет количественно оценить это сравнение. Вы рассчитываете RMSD, находя квадратный корень среднеквадратичной ошибки.
Формула RMSD
Для серии наблюдений вы вычисляете среднеквадратичную ошибку, находя разницу между каждым экспериментальным или наблюдаемым значением и теоретическим или прогнозируемым значением, возводя в квадрат каждую разницу, суммируя их, и деля их на количество наблюдаемых значений или прогнозируемых значений. ,
Это делает формулу RMSD:
{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}за Иксе ожидаемые значения, Иксо наблюдаемые значения и N общее количество значений.
Этот метод нахождения разницы (или отклонения), возведения в квадрат каждой разности, суммирования их и деления на количество точек данных (как это было бы при нахождении среднего значения для набора данных), затем взятия квадратного корня из результата что дает количеству его имя, «среднеквадратичное отклонение». Вы можете использовать пошаговый подход для расчета RMSD в Excel, который отлично подходит для больших наборов данных.
Среднеквадратичное отклонение
Среднеквадратичное отклонение измеряет, насколько набор данных изменяется внутри себя. Вы можете рассчитать это используя (Σ (Икс - μ)2 / N)1/2 для каждого значения Икс за N значения с μ ("мю") средний. Обратите внимание, что это та же формула для RMSD, но вместо ожидаемых и наблюдаемых значений данных вы используете само значение данных и среднее значение из набора данных соответственно. Используя это описание, вы можете сравнить среднеквадратичную ошибку со стандартным отклонением.
Это означает, что, хотя он имеет формулу с аналогичной структурой с RMSD, стандартное отклонение измеряет конкретный гипотетический экспериментальный сценарий, в котором все ожидаемые значения являются средними значениями набора данных.
В этом гипотетическом сценарии количество внутри квадратного корня (Σ (Икс - μ)2 / N) называется дисперсияКак данные распределены вокруг среднего. Определение отклонения позволяет сравнить набор данных с конкретными распределениями, которые, как вы ожидаете, получат данные на основе предшествующих знаний.
Что RMSD говорит вам
RMSD дает конкретный, унифицированный способ определения того, как ошибки того, как прогнозируемые значения отличаются от наблюдаемых значений для экспериментов. Чем ниже RMSD, тем точнее экспериментальные результаты для теоретических прогнозов. Они позволяют количественно определить, как различные источники ошибок влияют на наблюдаемые экспериментальные результаты, такие как сопротивление воздуха, влияющее на колебания маятника или поверхностное натяжение между жидкостью и ее емкостью, препятствующие ее течению.
Кроме того, вы можете убедиться, что RMSD отражает диапазон набора данных, разделив его на разницу между максимальным наблюдаемым экспериментальным значением и минимальным, чтобы получить нормализованное среднеквадратичное отклонение или ошибка.
В области молекулярной стыковки, в которой исследователи сравнивают теоретическую компьютерную структуру биомолекул с таковой из экспериментальных результатов, RMSD может измерить, насколько близко экспериментальные результаты отражают теоретические модели. Чем больше экспериментальных результатов сможет воспроизвести то, что предсказывают теоретические модели, тем ниже RMSD.
RMSD в практических настройках
В дополнение к примеру молекулярной стыковки метеорологи используют RMSD, чтобы определить, насколько точно математические модели климата предсказывают атмосферные явления. Биоинформатики, ученые, которые изучают биологию с помощью компьютерных средств, определяют, как расстояния между атомными позициями белковых молекул варьируются от среднего расстояния между этими атомами в белках, используя RMSD в качестве меры точности.
Экономисты используют RMSD, чтобы выяснить, насколько тесно экономические модели соответствуют измеренным или наблюдаемым результатам экономической деятельности. Психологи используют RMSD для сравнения наблюдаемого поведения психологических или психологических явлений с вычислительными моделями.
Нейробиологи используют его, чтобы определить, как искусственные или биологические системы могут учиться по сравнению с моделями обучения. Компьютерные ученые, изучающие визуализацию и зрение, сравнивают эффективность того, насколько хорошо модель может реконструировать изображения в исходные изображения различными способами.