Оценивание коэффициента корреляции

по опытным данным осуществляется следующим образом. Допустим, что проведено п испытаний, в каждом из которых отмечаются значения двух случайных величин. В результате получается п пар выборочных значений (jq, у), (х2, У2), (хп, уп). Для наглядности данные пары значений можно рассматривать как координаты точек на плоскости. Образовавшаяся совокупность точек сразу не дает представления о силе корреляции. На рис. 4.1 приведены примеры совокупностей точек, соответствующих сильной (а), слабой (б) корреляции и полному ее отсутствию (в).

Рис. 4.1

Выборочный коэффициент корреляции

г*у вычисляется по формуле:

где через а*2 и а*2 обозначены выборочные дисперсии

В связи со случайностью выборки выборочный коэффициент корреляции может быть отличен от нуля, даже если между наблюдаемыми величинами отсутствует корреляция. Следовательно, для проверки гипотезы об отсутствии корреляции необходимо проверить, значимо ли отличается г*у от нуля. А для этого нужно знать

распределение г*ху как случайной величины. Оно зависит от генерального коэффициента корреляции, который нам неизвестен. Но если мы в качестве нулевой гипотезы возьмем равенство гху = 0 (отсутствие корреляции), то нам потребуется лишь г*у -распределение, соответствующее = 0. Такое распределение оказывается уже зависящим только от объема выборки п. Легко видеть, что оно симметрично относительно нуля и сосредоточено на отрезке [—1; 1] (рис. 4.2). В сборниках статистических таблиц приведены квантили Г—q / 2 этого распределения для некоторых уровней значимости q и объемов выборки п.

Рис. 4.2

Зная г*у -распределение, можно заранее предсказать доверительные границы для выборочного коэффициента корреляции г*у в

предположении, что генеральная корреляция отсутствует. А именно, с вероятностью 1 - q должна быть справедлива оценка

Поэтому, если окажется, что найденный по выборке коэффициент корреляции удовлетворяет неравенству

то его можно признать значимым, т.е. нужно считать, что нулевая гипотеза неверна. А это значит, что г*у * 0 и между наблюдаемыми величинами есть корреляция. Корреляция эта будет тем сильнее, чем значительнее превышает rx_qjl и приближается к 1.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >