Метод корреляционных плеяд

Метод корреляционных плеяд предназначен для нахождения таких групп объектов - "плеяд", когда корреляционная связь, т.е. сумма модулей коэффициентов корреляции между параметрами одной группы (внутриплеядная связь) достаточно велика, а связь между параметрами из разных групп (межплеядная) - мала. По определенному правилу по корреляционной матрице объектов образуют чертеж - граф, который затем с помощью различных приемов разбивают на подграфы. Элементы, соответствующие каждому из подграфов, и образуют плеяду. 

Рассмотрим корреляционную матрицу R=(rij), i,j=1,2,...,p, исходных объектов. В данном варианте корреляционных плеяд предполагается упорядочивать объекты и рассматривать только те коэффициенты корреляции, которые соответствуют связям между элементами в упорядоченной системе. Упорядочение производится на основании принципа максимального корреляционного пути: все p объектов связываются при помощи (p-1) линий (ребер) так, чтобы сумма модулей коэффициентов корреляции была максимальной. Это достигается следующим образом: в корреляционной матрице находят наибольший по абсолютной величине коэффициент корреляции, например |r(l,m)| = r(1) (коэффициенты на главной диагонали матрицы, равные единице, не рассматриваются). 

Рисуем кружки, соответствующие параметрам x(l) и x(m) и над связью между ними пишем значение r(1). Затем, исключив r(1), находим наибольший коэффициент в m-ом столбце матрицы (это соответствует нахождению признака, который наиболее сильно после x(l) "связан" с x(m) , и наибольший коэффициент в l-ой строке матрицы (это соответствует нахождению признака, наиболее сильно после x(m) "связанного" с x(l) )). Из найденных таким образом двух коэффициентов корреляции выбирается наибольший - пусть это будет |r(l,j)| = r(2). Рисуем кружок x(j), соединяем его с кружком x(l) и проставляем значение r(2). Затем находим объекты, наиболее связанные с x(l) , x(m) и x(j), и выбираем из найденных коэффициентов корреляции наибольший.;

Пусть это будет |r(j,q)| = r(3). Требуем, чтобы на каждом шаге появлялся новый объект, поэтому объекты, уже изображенные на чертеже, исключаются, следовательно, q не равно l, q не равно m, q не равно j.

Далее рисуем кружок, соответствующий x(q) , и соединяем его с x(j) и т.д. На каждом шаге находятся параметры, наиболее сильно связанные с двумя последними рассмотренными параметрами, а затем выбирается один из них, соответствующий большему коэффициенту корреляции. Процедура заканчивается после (p-1)-го шага; граф оказывается состоящим из p кружков, соединенных (p-1) ребром. Затем задается пороговое значение r, а все ребра, соответствующие меньшим, чем r, коэффициентам корреляции, исключаются из графа.

Незамкнутым графом называется такой граф, для которого для любых двух кружков существует единственная траектория, составленная из линий связи, соединяющая эти два кружка. Очевидно, что в данном варианте метода корреляционных плеяд допускается построение только незамкнутых графов.

На следующем рисунке представлены результаты использования метода корреляционных плеяд для наших данных:

Красным цветом отмечены кружки (статьи), которые не попали в основную группу объектов, выделившиеся в отдельные подгруппы, при пороговом значении коэффициента корреляции r = 0,87. При увеличении коэффициента корреляции r до 0,9 дополнительно исключаются из основной группы еще некоторые объекты (статьи) - они выделены зеленым цветом на рисунке.

Расшифровка нумерации объектов.