КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ МНОГОМЕРНОЙ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

Бросая в воду камешки, смотри на круги, ими образуемые; иначе такое бросание будет пустою забавою.

К. Прутков. Мысли и афоризмы

Большая часть информации о поведении случайной величины скрывается в оценках средних значений многомерного признака и попарных корреляций между признаками, которые образуют корреляционную матрицу.

Корреляционный анализ многомерной генеральной совокупности решает задачи:

  • а) выбор подходящего показателя статистической связи между признаками и оценка его значения по выборке;
  • б) построение интервала значений для выбранного показателя (проверка его статистической значимости);
  • в) определение структуры связи между компонентами исследуемого многомерного признака.

Регрессионный анализ применяется в случаях, когда изучаемый процесс или явление является результатом совместного действия нескольких факторов, а у исследователя возникает потребность в оценке влияния каждого фактора в отдельности.

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ

Рассмотрим случай трех признаков Х= (Х{, Х2, Х3), (р = 3). Будем предполагать что поведение многомерного вектора дописывается нормальным законом распределения, т.е. плотность совместного распределения одномерных случайных величин Ху, Х2, Хъ задается в виде:

где И — симметрическая положительно определенная матрица парных коэффициентов корреляции, а беДЛ) — определитель этой матрицы (обобщенная дисперсия случайной величины X), т.е.

и

Также в (3 Л) И-1—матрица, обратная к 7?, т.е.

В формуле (3.1) буквой обозначен вектор значений нормированных случайных величин Х{, Х2, Ху

Таким образом, имеется трехмерная нормально распределенная случайная величина, которая определяется девятью параметрами:

Распределения одномерных Х{, Х2, Ху двумерных 19Х2), (Х{, Х3), (Х2, Х2), условные распределения при фиксировании одной из переменных рХ2ух, Х32, (Х2, Х3х и двух Х2ХхХ3,

Х3Х2Хх являются нормальными.

Для многомерной корреляционной модели важную роль играют частные и множественные коэффициенты корреляции, детерминации (квадраты соответствующих коэффициентов корреляции).

Частный коэффициент корреляции между Хх и Х2 при фиксированном воздействии переменной Х3 может быть определен по следующей формуле

где К. — алгебраическое дополнение матрицы К к элементу г...

Частный коэффициент корреляции показывает тесноту линейной связи между двумя переменными случайными величинами независимо от влияния остальных случайных величин.

Обладает всеми свойствами парного коэффициента корреляции.

Если частный коэффициент корреляции (3.2) меньше парного, т.е. гхх3 )<гх хто взаимодействие между Хх и Х2 обусловлено частично (или полностью, если гххг3) = 0) воздействием фиксируемых прочих переменных, т.е. — Ху Если частный коэффициент корреляции гх х (Х3)>гхх , то фиксируемые прочие переменные ослабляют линейную связь.

Аналогично (3.2):

Множественный коэффициент корреляции между одной переменной и другими может быть рассчитан по формуле

Если гх^ = 1, то точки {, Х2, Х2) расположены в плоскости регрессии Х3 на х2), т.е. имеется линейная связь между переменными и двумерной переменной х2). Если гХз =0 , то линейной связи нет. Аналогично:

и

Множественный коэффициент детерминации (квадрат соответствующего множественного коэффициента корреляции) показывает долю дисперсии, например, случайной величины^, обусловленную изменением случайных величин Хх и Х2.

Проверка статистической значимости множественного коэффициента корреляции.

Нулевая гипотеза: отсутствует линейная связь между переменной х и остальными переменными образующими многомерный признак, Н'г =0, Н:.г *0.

Рассчитываем статистику

Если расчетное Е больше табличного значения распределения Фишера Ее(2, п — 3), то гипотеза #0 отвергается, следовательно, линейная связь есть и она статистически значима на е • 100% уровне значимости.

Интервальная оценка для частного коэффициента корреляции. Для получения интервальной оценки частного коэффициента

корреляции г используется I статистика Фишера: ,

причем , где иу является решением уравнения Ф(му) = у

и находится по таблице интегральной функции Лапласа для заданного у. Тогда ± Дг) — интервал для Е{1) и доверительный интервал для частного коэффициента корреляции получают по таблице обратного преобразования Фишера.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >