Содержание
- Быстрая визуализация данных
- Визуализация относительного изобилия
- Сложные наборы данных могут нуждаться в интервалах
- Таблицы частот могут скрывать перекос и куртоз
Таблицы частот могут быть полезны для описания количества вхождений определенного типа данных в наборе данных. Таблицы частот, также называемые частотными распределениями, являются одним из самых основных инструментов для отображения описательной статистики. Таблицы частот широко используются в качестве краткого справочного материала при распределении данных; их легко интерпретировать, и они могут отображать большие наборы данных в довольно сжатой форме. Таблицы частот могут помочь идентифицировать очевидные тенденции в наборе данных и могут использоваться для сравнения данных между наборами данных одного типа. Однако таблицы частот не подходят для каждого приложения. Они могут скрывать экстремальные значения (больше, чем X или меньше, чем Y), и они не поддаются анализу искажений и эксцессов данных.
Быстрая визуализация данных
Таблицы частот могут быстро выявлять выбросы и даже существенные тенденции в наборе данных с помощью не более чем беглого осмотра. Например, учитель может отображать оценки учеников за среднесрочный период в таблице частот, чтобы быстро взглянуть на то, как в целом продвигается ее класс. Число в столбце частоты будет представлять количество студентов, получающих этот класс; для класса из 25 учеников частотное распределение полученных буквенных оценок может выглядеть примерно так: Оценка частоты A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Визуализация относительного изобилия
Таблицы частот могут помочь исследователям изучить относительную распространенность данных каждой конкретной цели в их выборке. Относительное изобилие показывает, какая часть набора данных состоит из целевых данных. Относительная численность часто представляется в виде частотной гистограммы, но ее можно легко отобразить в таблице частот. Рассмотрим такое же распределение частот среднесрочных оценок. Относительное изобилие - это просто процент студентов, набравших определенную оценку, и может быть полезно для концептуализации данных, не задумываясь над ними. Например, с добавленным столбцом, который отображает процент встречаемости каждой оценки, вы можете легко увидеть, что более половины класса получили оценку B, без необходимости тщательного изучения данных.
Относительная распространенность частоты (% частоты) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D .............. 2 .............. 8%
Сложные наборы данных могут нуждаться в интервалах
Один недостаток состоит в том, что трудно понять сложные наборы данных, которые отображаются в таблице частот. Большие наборы данных могут быть разделены на интервальные классы для простой визуализации с использованием таблицы частот. Например, если вы спросите следующих 100 человек, которых вы видите, каков их возраст, вы, вероятно, получите широкий диапазон ответов от трех до девяноста трех. Вместо того чтобы включать строки для каждого возраста в таблицу частот, вы можете классифицировать данные по интервалам, таким как 0–10 лет, 11–20 лет, 21–30 лет и т. Д. Это также может называться сгруппированным распределением частот.
Таблицы частот могут скрывать перекос и куртоз
Если не отображать на гистограмме, асимметрия и эксцесс данных могут быть неочевидными в таблице частот. Асимметрия говорит вам, в каком направлении стремятся ваши данные. Если бы оценки были отображены по оси X графика, показывающего частоту промежуточных оценок для наших 25 учеников выше, распределение было бы искажено в сторону As и Bs. Куртозис говорит вам о центральном пике ваших данных - будет ли он падать в соответствии с нормальным распределением, которое является хорошей гладкой кривой колокольчика, или быть высоким и резким. Если вы построите график среднесрочных оценок в нашем примере, вы увидите высокий пик в точке B с резким спадом в распределении более низких оценок.