Полная версия

Главная arrow Психология arrow Математические методы в психологии

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Корреляционный анализ. Ранговая корреляция

Понятие корреляционной зависимости. Виды связи

Весьма часто при проведении психологических исследований требуется установить зависимость изучаемой случайной величины Y от одной или нескольких других величин. Две случайные величины Y и X могут быть связаны либо функциональной зависимостью (7=/(х)), либо статистической зависимостью, либо быть независимыми.

Статистической называют зависимость, при которой каждому значению одной случайной величины соответствует свое распределение другой. Частным случаем статистической зависимости является корреляционная (от лат. correlation - соотношение, взаимосвязь) зависимость, когда изменение одной из случайных величин влечет изменение среднего значения другой. Поговорим о связях. Выделяются следующие виды связи:

Корреляционный анализ - это проверка гипотез о связях между переменными с использованием коэффициентов корреляции.

Коэффициент корреляции

Коэффициент корреляции - это мера прямой или обратной пропорциональности между двумя переменными. Он чувствителен к связи только в том случае, если эта связь является монотонной, то есть не меняет направления по мере увеличения значений одной из переменных.

Обозначим коэффициент корреляции через г.

Свойства коэффициента корреляции:

1)

  • 2) если X и Y - независимые случайные величины, то г = 0;
  • 3) если r = 1 или г = -1, то данные равенства дают основание полагать, что между величинами имеет место быть зависимость;
  • 4) если г > 0, то связь прямая (увеличение одного из исследуемых признаков (факторного) ведет к увеличению другого (результативного)), если г < 0, то связь обратная (увеличение одного из исследуемых признаков (факторного) ведет к уменьшению другого (результативного));
  • 5) коэффициент корреляции г дает основания полагать, что:
    • -при г g (-0,3; 0)и(0; 0,3) связи практически нет;

-при связь слабая;

-при связь существенная;

-при связь тесная.

Все методы определения меры связи между случайными величинами делятся на параметрические и непараметрические. Параметрические включают в формулу расчета параметры распределения (коэффициент Пирсона, множественные коэффициенты корреляции), непараметрические - не включают в формулу для расчета параметры распределения и основаны на оперировании частотами и рангами (коэффициенты Фехнера, Спирмена, Кендалла).

Рассмотрим некоторые из перечисленных выше коэффициентов.

Числовой характеристикой тесноты линейной корреляционной связи двух переменных, измеренных в шкале интервалов или шкале отношений, является выборочный коэффициент корреляции Пирсона:

Формула для вычисления данного коэффициента корреляции содержит параметры м(х), м(у), ах, ау, поэтому данный метод определения меры связи является параметрическим. Также коэффициент Пирсона может быть вычислен в программе MS Excel с использованием стандартной функции «КОРРЕЛ». Подчеркнем еще раз, что коэффициент корреляции Пирсона есть мера прямолинейной взаимосвязи, он не чувствителен к криволинейным связям.

Рассмотрим непараметрические коэффициенты корреляции.

Ранжирование - расположение элементов по возрастанию (убыванию) признака.

Ранг - номер в упорядоченном списке.

Коэффициенты ранговой корреляции, как правило, используются, если объекты генеральной совокупности обладают двумя качественными признаками и данные об объектах представлены в порядковой шкале, шкале равных интервалов или шкале отношений. Под качественным подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, располагать их в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в порядке возрастания качества.

Пусть объекты обладают двумя качественными признаками А и В . Запишем полученные значения по данным признакам в два столбика и предположим, что все они различны.

Затем расположим объекты первого столбика в порядке возрастания качества по признаку А и справа припишем к ним соответствующие значения второго столбика. Присвоим объекту, стоящему на i -ом месте число - ранг х., равный порядковому номеру объекта, то есть ранг х{=1, х2 = 2 и т.д. В итоге получим последовательность рангов по признаку Л. По признаку В припишем каждому объекту ранг yt, следующим образом: если элемент, стоящий на к-м месте, является наименьшим элементом второго столбика, то ему присвоим ранг ук= 1, следующему по величине элементу присвоим ранг 2 и т.д.

В итоге получим две последовательности рангов: по признаку Л:х12,...,хп, по признаку В:у{2,...,уп.

Рассмотрим два коэффициента ранговой корреляции. Они могут быть использованы, в частности, когда связь между переменными не является линейной, но является монотонной.

1. Выборочный коэффициент ранговой корреляции Спирмена равен коэффициенту корреляции Пирсона, вычисленному для двух предварительно ранжированных переменных:

п

где: п - объем выборки, di = xt — уt.

Значения выборочного коэффициента ранговой корреляции принадлежат интервалу -1 < Рв < 1. Если выборка содержит объекты с одинаковым качеством, то каждому из них приписывается ранг, равный среднему арифметическому порядковых номеров объектов. Например, если объекты одинакового качества по первому признаку имеют порядковые номера 7 и 8, то их ранги соответственно равны:

Так как коэффициент корреляции получен по выборке, то всегда имеет место быть отклонение выборочного коэффициента рв корреляции от генерального рг. При этом может оказаться, что фактор в генеральной совокупности не влияет на результат, что равносильно гипотезе Я0: рг = 0, однако при этом рв * 0. Для того чтобы при уровне значимости а проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции рг Спирмена, необходимо вычислить величину Ткр:

где: tKp = tKp(a,k) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдейта1 или с помощью стандартной функции MS Excel «СТЬЮДРАСПОБР» по уровню значимости а и числу степеней свободы к = п-2.

Если рвкр, то нет оснований отвергнуть нулевую гипотезу. Ранговая связь между качественными признаками в генеральной совокупности не значима.

Если | рв | > Ткр, то нулевую гипотезу отвергают. Между качественными признаками в генеральной совокупности существует значимая ранговая корреляционная связь.

2. Выборочный коэффициент ранговой корреляции Кенделла.

Пусть Pi - число, равное количеству рангов больших yt и расположенных ниже yt, Qi - число, равное количеству рангов меньших yt и расположенных ниже yt. Тогда выборочный коэффициент ранговой корреляции Кендалла вычисляется по формуле:

Значения выборочного коэффициента ранговой корреляции принадлежат интервалу-1 ^ < 1.

Для того чтобы при уровне значимости а проверить нулевую гипотезу

о равенстве нулю генерального коэффициента ранговой корреляции Тг

Т

Кенделла, необходимо вычислить величину кр:

где: zKp - критическая точка двусторонней критической области, которую находят по таблице функции Лапласа[1] [2].

Справедливо соотношение:

Если | тв | < Ткр, то нет оснований отвергнуть нулевую гипотезу. Ранговая связь между качественными признаками в генеральной совокупности не значима.

Если твкр, то нулевую гипотезу отвергают. Между качественными признаками в генеральной совокупности существует значимая ранговая корреляционная связь.

При достаточно большом объеме выборки и при значениях коэффициентов ранговой корреляции, не близких к единице, имеет место приближенное равенство:

Пример. Из сотрудников крупного предприятия N сделана репрезентативная выборка. Пусть имеются два статистических ряда, характеризующих количество административных правонарушений (X) и преступлений (Y), совершенных сотрудниками предприятия, вошедшими в выборку, за 7 лет:

год

X

Y

2008

79

10

2009

75

7

2010

45

5

2011

38

3

2012

59

4

2013

93

12

2014

68

8

С помощью коэффициента ранговой корреляции Спирмена определим, существует ли взаимосвязь между количеством административных правонарушений и количеством преступлений на предприятии N.

Проранжируем данные таблицы, указанной в условии задачи, по столбцу административных правонарушений:

год

X

Y

2011

38

3

2010

45

5

2012

59

4

2014

68

8

2009

75

7

2008

79

10

2013

93

12

Убедимся в том, что мы имеем право использовать ранговый коэффициент корреляции для выявления связи между количеством административных правонарушений и количеством преступлений на предприятии N. Для этого построим диаграмму зависимости между переменной X и переменной 7:

Диаграмма зависимости между переменной X и переменной Y

Рис. 7. Диаграмма зависимости между переменной X и переменной Y.

Из данной диаграммы видно, что связь между количеством административных правонарушений и количеством преступлений на предприятии N является монотонной, а значит, мы имеем право выявлять наличие или отсутствие связи между рассматриваемыми переменными с помощью рангового коэффициента корреляции Спирмена. Для упрощения расчета выборочного коэффициента корреляции Спирмена составим таблицу следующего вида:

X

Y

Ранги

по признакам

Разность рангов

X

Y

di

df

I

II

III

IV

V

VI

38

3

1

1

0

0

45

5

2

3

-1

1

59

4

3

2

1

1

68

8

4

5

-1

1

75

7

5

4

1

1

79

10

6

6

0

0

93

12

7

7

0

0

4

Здесь в столбцах I и II расположены ряды административных правонарушений и преступлений, проранжированные по административным правонарушениям (см. предыдущую таблицу). В столбцах III и IV присвоены ранги соответствующим значениям столбцов I и И. Поскольку числа в ряду административных правонарушений (X) расположены по порядку, то и ранги в столбце III расположены по порядку от меньшего к большему. В столбце IV ранги присваиваются следующим образом: наименьшее число в столбце II - 3, значит ему присваивается ранг 1, следующее по величине число в столбце II - 4, ему присваивается ранг 2 и т.д. В столбце V записаны разности соответствующих значений в столбцах III и IV. В столбце VI содержатся значения столбца V, возведенные в квадрат, подсчитана итоговая сумма по данному столбцу

Рассчитаем выборочный коэффициент ранговой корреляции Спирмена (заметим, что ):

Согласно значению выборочного коэффициента корреляции Спирмена есть основание полагать, что между количеством административных правонарушений и количеством преступлений у сотрудников, отобранных нами на предприятии N, существует прямая тесная связь. Данный коэффициент посчитан для выборки сотрудников данного предприятия. Проверим, справедлив ли данный вывод для всех сотрудников предприятия N.

Выдвигаем гипотезу: Я0: рг= О (количество административных правонарушений на предприятии N не влияет на количество преступлений на данном предприятии).

Вычисляем , где для уровня

значимости а = 0,05 и числа степеней свободы (значение

вычислено по таблице[3]).

Получаем, что , значит, нулевую гипотезу отвергаем. Количество административных правонарушений на предприятии N влияет на количество преступлений на данном предприятии.

Замечание: одним из источников низкой эффективности корреляции является возможный нелинейный характер связи между переменными. К отклонениям от прямолинейной зависимости любого рода наиболее чувствителен коэффициент корреляции Пирсона. Однако если нелинейная связь оказывается монотонной, то возможен переход к рангам и применение ранговых корреляций. Если наблюдается немонотонная нелинейность связи, то можно найти точку перегиба по графику рассеивания и разделить выборку на две группы, различающиеся направлением связи между переменными. После этого можно вычислять корреляции отдельно для каждой группы.

Рекомендуемая литература

  • 1. Гмурман В.Е. Теория вероятностей и математическая статистика. М., 2011.
  • 2. Корячко А.В., Куличенко А.Г. Высшая математика и математические методы в психологии: руководство к практическим занятиям для слушателей психологического факультета. Рязань, 1994.
  • 3. Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных: Учеб, пособие. СПб., 2008.
  • 4. Сидоренко Е.В. Методы математической обработки в психологии. СПб., 2010.
  • 5. Суходольский Г.В. Математические методы в психологии. Харьков, 2004.

  • [1] См.: Гмурман В.Е. Теория вероятностей и математическая статистика. С. 466.
  • [2] См.: Там же. С. 462—463.
  • [3] См.: Гмурман В.Е. Теория вероятностей и математическая статистика. С. 466.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>