СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ ВЗАИМОСВЯЗЕЙ

Виды связей, методы моделирования связей

Все окружающие нас явления природы и общества связаны между собой. Нам желательно количественно измерить эти связи и записать уравнения, связывающие изучаемые нами процессы. Для этого надо применить некоторые математические методы, а они применяются не к конкретным явлениям природы и общества, а к их математическим моделям. Напомним, что математическая модель -— это абстрактная модель, которая основана на математических понятиях и математических символике, т. е. записанная с помощью некоторых уравнений, неравенств, их систем. При изучении различных природных и общественных процессов мы выделяем в них основные факторы, которые обуславливают их жизнедеятельность и развитие. В статистике факторы, которые обуславливают изменение других, связанных с ними факторов, называют факторными признаками. Факторы, которые меняются под влиянием факторных признаков, называются результативными, или признаками-следствиями.

Между различными явлениями природы и общества выделяют два вида связей: функциональную, или жестко детерминированную, и стохастическую, или стохастически-детермини- рованную. Функциональная связь подробно рассматривается в разделе математики, носящем название математический анализ. Напомним ее определение.

Функциональной называют такую связь, при которой каждому значению факторного признака или упорядоченному набору факторных признаков по какому-либо правилу поставлено в соответствие одно или несколько значений результативного признака. Математически это записывается следующим образом:

Формула (10.1) — это модель однофакторной функциональной зависимости, когда признак-следствие меняется в результате изменения одного признака-фактора х. Формула (10.2) — это модель многофакторной функциональной зависимости: здесь каждому упорядоченному набору (n-мерному вектору) (xv х2 ... хп) соответствует одно значение (или несколько значений) признака-следствия. При функциональной зависимости известен полный набор факторов, которые определяют значение зависимого результативного признака и механизм их влияния, записанный в виде конкретного уравнения. Детерминистскую модель можно уточнять, добавляя в нее новые признаки-факторы.

Примером функциональной связи является модель невозмущенного движения искусственного спутника Земли (ИСЗ). В этой модели пренебрегают действием на ИСЗ притяжения Солнца, Луны, планет; считают, что Земля имеет строго сферическую форму и равномерное распределение масс в своем теле. При соблюдении этих условий движение ИСЗ подчиняется законам Кеплера и его называют невозмущенным (Кеплеровым). Математическая модель этого движения имеет вид:

где х, у, z — координаты ИСЗ;

М — масса Земли; г — расстояние от Земли до ИСЗ; / — гравитационная постоянная.

Если учесть притяжение Солнца, Луны, планет, других факторов, то можно эту модель уточнить и получить более точное положение ИСЗ.

Влияние случая в детерминистских моделях пренебрежимо мало и не учитывается. Но во многих случаях (это касается и общественных, и природных явлений) мы не имеем полного набора факторов, влияющих на признак-следствие, а те, которые есть, известны с ошибками. В этом случае возникают неопределенность и модель изучаемого явления должна рассматриваться не как детерминистская, а как вероятностная.

Статистическая связь — это связь между факторами, при которой изменению факторного признака или упорядоченному набору факторных признаков соответствует изменение закона распределения результативного признака. Значения признака-следствия не могут быть указаны точно, а только с определенной вероятностью. Особенностью статистических связей является то, что они проявляются не в каждой отдельной единице, а во всей совокупности. Различные значения результативного признака (зависимой переменной) — это реализации некоторой случайной величины. Модель статистической связи в общем виде можно записать следующим образом:

где xv х2 ..., х — учтенные признаки факторы;

Axv Ах2, ..., Ахп — ошибки учетных факторных признаков;

zv z2 ..., 2 — неучтенные факторные признаки;

у — расчетное (теоретическое) значение результативного признака.

Частным случаем статистической связи является корреляционная связь, при ней взаимосвязанные факторы характеризуются только случайными величинами.

При корреляционной связи в зависимости от изменения факторного признака или упорядоченного набора факторных признаков изменяется среднее значение результативного признака (признака-следствия). Корреляционная связь проявляется во всей совокупности в целом, а не в каждом отдельном случае. При изучении корреляционных зависимостей надо решить следующие вопросы:

  • 1) предварительный анализ свойств моделируемого процесса;
  • 2) установление факта наличия связи, определение ее формы и направления;
  • 3) измерение степени тесноты связи между факторами;
  • 4) посторенние регрессионной модели (математической модели);
  • 5) оценка адекватности построенной модели и ее интерпретация.

В зависимости от направления действия функциональные и статистические связи бывают прямыми и обратными. При прямой связи при увеличении факторного признака (признаков) результативный признак также увеличивается, а при уменьшении факторного признака (признаков) признак следствия уменьшается. В противном случае связь между факторами будет обратной. В зависимости от вида аналитического выражения связи могут быть линейными и криволинейными. Линейная связь аналитически представляется уравнением прямой, а ее графическая иллюстрация (если она возможна) — прямая линия. Все остальные виды связей являются криволинейными.

По количеству факторов, которые действуют на результативный признак, различают однофакторные (один факторный признак) и многофакторные (два и большее количество факторных признаков) связи. Однофакторные связи часто называют парными. Если связь многофакторная, то все факторы действуют одновременно и во взаимосвязи.

Для изучения функциональных связей используют индексный и балансовый способы. При исследовании статистических связей применяются способ сопоставления двух параллельных рядов, метод аналитических группировок, корреляционный анализ, регрессионный анализ, непараметрические методы.

Простейшим методом обнаружения связи является сопоставление двух параллельных рядов — ряда значений признака фактора и соответствующих ему значений результативного признака. Значения факторного признака располагают по возрастанию и прослеживают направление изменения величины результативного признака. К недостатку данного способа можно отнести невозможность нахождения количественной меры связи между изучаемыми факторами. Статистическая связь будет проявляться более отчетливо, если для ее изучения применить аналитические группировки (о них говорилось в главе 4). Для выявления зависимости с помощью этого способа, надо провести группировку единиц изучаемой совокупности по факторному признаку и для каждой группы найти относительное или среднее значение результативного признака. Сопоставляя после этого изменения результативного признака по мере изменения факторного, можно выявить направление, тесноту, характер связи между ними, но данный способ не позволяет определить аналитическое выражение связи между факторным признаком (признаками) и признаком-следствием.

К задачам корреляционного анализа относят: количественное измерение тесноты связи между двумя факторами (при парной корреляции) и между результативным и несколькими факторными признаками (при множественной корреляции), так же решаются задачи об определении неизвестных причинных связей и об оценке факторов, которые оказывают наибольшее влияние на результативный признак.

Регрессионный анализ заключается в нахождении аналитического выражения связи (уравнения), в котором изменение результативного признака обусловлено влиянием одного или нескольких факторных признаков, а множество всех других факторов принимается за постоянные средние величины. Кроме этого, устанавливается степень влияния факторного признака (признаков) на зависимую переменную (результативный признак) и находятся расчетные значения признака следствия. С помощью непараметрических методов устанавливается связь между качественными (атрибутивными) признаками. Их сфера применения шире, чем параметрических, так как не требуется соблюдения условия нормальности распределения результативного признака, но при этом снижается глубина исследования связей.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >