Рангово-бисериальный коэффициент г

Рангово-бисериалъный коэффициент г похож на точечно-бисе- риальный. Оба коэффициента предполагают, что одна переменная является дискретной дихотомической. Точечно-бисериальный коэффициент требует, чтобы другая переменная измерялась в интервальной или более мощной шкале (см. табл. 2), в то время как рангово-бисериальный коэффициент предполагает, что вторая переменная должна быть только ранговой.

Предположим, что исследователя интересует связь между временем х, которое человек и его предки прожили в стране, скажем в РФ, и его социально-экономическим статусом у. В этом примере время, в течение которого семья данного лица проживает в стране, измеряется с помощью числа поколений: «О» - меньше двух поколений, «1» - два поколения и более. Эту переменную можно рассматривать как дискретную дихотомическую, социально-экономический статус - как ранговую («1» - наивысший, «2» - следующий и т.д.). Данные приведены в табл. 14.

Таблица 14

Данные для вычисления

рангово-бисериального корреляционного коэффициента ггЬ

Поколение

иммигрантов

(*)

Ранг социально- экономического статуса

(у)

Параметры для вычисления ггЬ

1

1

1

2

1

2

3

1

3

4

0

4

5

0

5

6

1

6

7

1

7

8

0

8

9

1

9

10

0

10

11

0

11

12

0

12

Формула для вычисления рангово-бисериального коэффициента связана с вычислением коэффициента Кендалла т, так как используется степень несоответствия рангов.

Здесь мы опишем одну модификацию, при которой предполагается, что нет совпадающих рангов для ранговой переменной

где N - количество наблюдений; jll1 - среднее у, когда х = 1; ц0 - среднее у, когда х = 0.

Соответствующая формула вычисления рангово-бисериального коэффициента для выборки:

где п - число наблюдений в выборке;

уг - выборочное среднее у, когда х = 1; у0 - выборочное среднее у, когда х = 0.

Применительно к данным из табл. 14 при среднем значении

и среднем формула (17) дает

Этот коэффициент демонстрирует существование отрицательной связи между двумя переменными. Если интерпретировать эти данные с точки зрения их организации, то надо признать: полученное значение коэффициента ггЬ показывает, что для лиц, хотя бы одно поколение чьих предков жило в стране, характерна тенденция к более высокому социально-экономическому статусу и наоборот.

Формула (17) справедлива только в случае отсутствия совпадающих рангов для ранговой переменной. Когда такие ранги есть, должны быть использованы другие модификации формулы. Максимальное абсолютное значение рангово-бисериального коэффициента равно 1. Следовательно, он должен интерпретироваться аналогично коэффициенту смешанных моментов Пирсона.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >