Содержание
Кластерный анализ и факторный анализ являются двумя статистическими методами анализа данных. Эти две формы анализа широко используются в естественных науках и науках о поведении. Как кластерный анализ, так и факторный анализ позволяют пользователю группировать части данных в «кластеры» или в «факторы», в зависимости от типа анализа. Некоторые исследователи, плохо знакомые с методами кластерного и факторного анализа, могут чувствовать, что эти два типа анализа в целом похожи. Хотя кластерный анализ и факторный анализ на первый взгляд кажутся похожими, они различаются по многим параметрам, в том числе по общим целям и задачам.
Задача
Кластерный анализ и факторный анализ преследуют разные цели. Обычная цель факторного анализа состоит в том, чтобы объяснить корреляцию в наборе данных и связать переменные друг с другом, в то время как цель кластерного анализа заключается в рассмотрении неоднородности в каждом наборе данных. По сути, кластерный анализ является формой категоризации, тогда как факторный анализ является формой упрощения.
сложность
Сложность - это один вопрос, по которому факторный анализ и кластерный анализ различаются: размер данных по-разному влияет на каждый анализ. По мере роста набора данных кластерный анализ становится трудно поддающимся вычислению. Это верно, потому что количество точек данных в кластерном анализе напрямую связано с количеством возможных кластерных решений. Например, количество способов разделить двадцать объектов на 4 кластера одинакового размера превышает 488 миллионов. Это делает невозможными прямые вычислительные методы, включая категорию методов, к которым относится факторный анализ.
Решение
Хотя решения как проблем факторного, так и кластерного анализа в некоторой степени субъективны, факторный анализ позволяет исследователю находить «лучшее» решение в том смысле, что исследователь может оптимизировать определенный аспект решения (ортогональность, простота интерпретация и тд). Это не так для кластерного анализа, поскольку все алгоритмы, которые могли бы дать лучшее решение для кластерного анализа, вычислительно неэффективны. Следовательно, исследователи, использующие кластерный анализ, не могут гарантировать оптимальное решение.
Приложения
Факторный анализ и кластерный анализ отличаются тем, как они применяются к реальным данным. Поскольку факторный анализ имеет возможность уменьшить громоздкий набор переменных до гораздо меньшего набора факторов, он подходит для упрощения сложных моделей. Факторный анализ также имеет подтверждающее использование, в котором исследователь может разработать ряд гипотез о том, как переменные в данных связаны. Затем исследователь может выполнить факторный анализ набора данных, чтобы подтвердить или опровергнуть эти гипотезы. Кластерный анализ, с другой стороны, подходит для классификации объектов по определенным критериям. Например, исследователь может измерить определенные аспекты группы вновь открытых растений и распределить эти растения по категориям видов с помощью кластерного анализа.