Содержание
Вероятность - это мера того, насколько вероятно что-то случится (или не случится). Измерение вероятности обычно основывается на соотношении того, как часто событие может происходить, и как много шансов на его совершение. Подумайте о том, как бросить кубик: у первого шанса есть шанс один на шесть при любом броске. Надежность, по статистике, просто означает последовательность. Если вы измеряете что-то пять раз и получаете довольно близкие оценки, ваша оценка может считаться достоверной. Надежность рассчитывается исходя из того, сколько измерений - и измерителей - есть.
Расчет вероятности
Определите «успех» для интересующего вас события. Скажем, мы заинтересованы в том, чтобы знать вероятность того, что выпадет четверка на кубике. Думайте о каждом броске кубика как об испытании, в котором мы либо «преуспеваем» (бросаем четыре), либо «проваливаемся» (бросаем любое другое число). На каждом кубике есть одно лицо "успеха" и пять лиц "неудачи". Это станет вашим числителем в окончательном расчете.
Определите общее количество возможных результатов для интересующего события. На примере броска кубика общее количество результатов равно шести, потому что на кубике шесть разных чисел. Это станет вашим знаменателем в окончательном расчете.
Разделите возможный успех на все возможные результаты. В нашем примере кубика вероятность была бы 1/6 (одна вероятность успеха для шести полных возможных результатов для каждого броска кубика).
Рассчитайте вероятность более одного события путем умножения индивидуальных вероятностей. В нашем примере, вероятность бросить четыре и шесть на последующем броске кратна отдельным вероятностям (1/6) x (1/6) = (1/36).
Рассчитайте вероятность более одного события, добавив индивидуальные вероятности. В нашем примере, вероятность бросить четверку или шестерку равна (1/6) + (1/6) = (2/6).
Расчет надежности нескольких измерений
Оцените изменение в среднем. Если у нас есть группа из пяти человек и мы взвешиваем каждого из них по два раза, мы получаем две групповые оценки веса (среднее или «среднее»). Сравните эти два средних значения, чтобы определить, является ли разница между ними разумно постоянной или измерения существенно отличаются. Это делается путем проведения статистического теста - так называемого t-теста - для сравнения двух средних.
Рассчитайте типичную ожидаемую ошибку, также известную как стандартное отклонение. Если бы мы измерили вес одного человека 100 раз, мы бы получили измерения, которые очень близки к истинному весу, а другие - еще дальше. Этот разброс измерений имеет определенную ожидаемую вариацию и может быть отнесен к случайной случайности, иногда называемой стандартным отклонением. Измерения, которые находятся за пределами стандартного отклонения, считаются вызванными чем-то отличным от случайной случайности.
Рассчитайте соотношение между двумя наборами измерений. В нашем весовом примере две группы измерений могут варьироваться от не имеющих общих значений (корреляция нуля) до абсолютно одинаковых (корреляция одного). Оценка того, насколько тесно коррелированы два набора измерений, важна для определения согласованности измерений. Высокая корреляция подразумевает высокую достоверность измерений. Подумайте об изменчивости, которую можно вносить, используя каждый раз разные весы или читая их разными людьми. В экспериментах и статистическом тестировании важно определить, какая изменчивость обусловлена случайным случайностью, а какая - чем-то, что мы сделали по-другому в наших измерениях.