Полная версия

Главная arrow Психология arrow Искусство решать сложные задачи. Системный подход

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Статистический анализ

  • 1. Область применения. Используется для исследования процессов и объектов по результатам массовых экспериментов со случайными величинами или событиями. Исследуемый процесс может быть по своей сущности случайным (стохастическим) либо сама случайность становится инструментом для его анализа. Примером стохастического характера процесса может служить появление неисправностей при работе технической системы, а использование случайности как инструмента исследования могут иллюстрировать вероятностные методы поиска экстремума некоторой функции (например, ниже даётся описание метода случайного поиска при анализе детерминированных функций).
  • 2. Сущность. В статистическом анализе производится обработка некоторой случайной выборки, под которой понимаются результаты N последовательных и независимых экспериментов со случайной величиной или событием. Поскольку сама выборка является случайной, а точность и надёжность (смотри материал предыдущей главы) статистических выводов определяются применительно ко всему возможному набору выборок, то очень важно, чтобы объем обрабатываемой информации был достаточен для получения результатов с требуемыми точностью и надёжностью. В этом случае говорят, что выборка является состоятельной (презентативной), то есть адекватно отражает генеральную совокупность случайных событий и (или) значений случайной величины. Иначе результаты статистического анализа не будут соответствовать действительности (правила и методы получения состоятельной выборки определены в математической статистике /27, 29, 31, 25/).
  • 3. Особенности применения. Статистический анализ включает целую группу методов, отличающихся друг от друга целями и приспособленностью к характеру исследуемого процесса.
  • 4. Наиболее употребительными являются: регрессионный анализ; корреляционный анализ; дисперсионный анализ; ковариационный анализ; анализ временных рядов; анализ главных компонент; факторный анализ.

Регрессионный анализ ставит своей задачей исследование зависимости одной случайной величины от ряда других случайных и не случайных величин (регрессия — зависимость математического ожидания случайной величины от значений других случайных величин). Например, после проведения N экспериментов на статистической модели получен набор реализаций случайных величин {Xj, Yj},j=l,2,3,...,N, где Хявляется независимой переменной, аУ- функцией. Обработка этого массива случайных величин позволяет их представить в виде детерминированной линейной регрессионной модели типа:

где коэффициенты АтлВ рассчитываются согласно методу наименьших квадратов /27/ таким образом, чтобы квадраты отклонений случайных величин Yj от значений функции (4.1) на множестве Xj были наименьшими, то есть

В случае нескольких независимых переменных регрессионная модель представляется линейным полиномом:

где соответствует “базовым” значениям всех к переменных, в окрестностях которых анализируется характер исследуемого процесса.

При анализе регрессионной модели (4.3) значения коэффициентов показывают степень влияния j-ой переменной на функцию Y, что позволяет разделить все переменные на “существенные” и “несущественные”. Однако наибольший интерес регрессионная модель представляет для прогноза поведения функции У. В практической деятельности регрессионный анализ часто используется для создания так называемой “эмпирической” модели, когда, обрабатывая результаты наблюдений (или характеристики существующих систем), получают регрессионную модель и используют её для оценки перспективных систем или поведения системы при гипотетических условиях. Точность и надёжность получаемых оценок зависят от числа наблюдений (реализаций, экспериментов) и расположения прогностических значений х. относительно базовых (то есть известных на некоторый момент времени) ? При этом чем больше разность Ах., тем меньше точность прогноза. Для практического применения регрессионного анализа можно предложить материал книг /11, 14, 29/.

Корреляционный анализ используется для определения степени линейной взаимосвязи между случайными величинами (корреляция — зависимость между случайными величинами, выражающая тенденцию одной величины возрастать (убывать) при возрастании (убывании) другой). Основными задачами корреляционного анализа являются оценка корреляционных характеристик (коэффициентов корреляции) и проверка статистических гипотез о степени (значимости) связи между случайными величинами. Оценки коэффициентов корреляции рассчитывают по значениям оценок математического ожидания и дисперсии (см. формулы (3.1); (3.2)), полученных путём статистической обработки результатов реализаций случайных величин. Для подробного изучения корреляционного анализа можно рекомендовать /4, 27/.

Дисперсионный анализ используется для проверки статистических гипотез о влиянии на показатель качественных факторов, то есть факторов, не поддающихся количественному измерению (например, качественный фактор — организация производства влияет на количественный показатель — прибыль от производства). В этом заключается его отличие от регрессионного анализа, где факторы выступают как параметры, имеющие количественную меру (например, количественный фактор — затраты на производство). В дисперсионном анализе качественный фактор представляется j-ми возможными состояниями (к примеру, возможными схемами организации производства), для оценки которых по каждому из них проводится п. экспериментов. Далее рассчитываются статистические оценки в каждой п. группе экспериментов и в общей выборке N, а затем анализируется соотношение между ними. По этому соотношению принимается или отвергается гипотеза о влиянии качественного фактора на показатель. Как видно из приведённого алгоритма, количество необходимых экспериментов существенно зависит от числа факторов и их возможных состояний, из-за чего при практической реализации дисперсионного анализа для числа факторов больше двух могут возникнуть вычислительные трудности. О дисперсионном анализе можно почитать в /10, 62/.

Ковариационный анализ используется для создания и изучения вероятностных моделей процессов, в которых присутствуют одновременно как количественные, так и качественные факторы, то есть он объединяет регрессионный и дисперсионный методы. Модель включает в себя регрессионные и дисперсионные факторы, первые из которых служат для проверки гипотез о значимости количественных факторов, а вторые — качественных. Методы ковариационного анализа отражены в /32/.

Анализ временных рядов используется при исследовании дискретного случайного процесса, протекающего на интервале времени Т. В этом случае результаты экспериментов или наблюдений, полученные на данном интервале, представляются в виде временного ряда, каждое значение Yt которого включает детерминированную f(t) и случайную Z(t) составляющие согласно зависимости:

Детерминированная составляющая описывает влияние детерминированных факторов в момент времени t, влияние же множества случайных факторов предписывается случайной составляющей. Детерминированную часть временного ряда называют трендом, поэтому временной ряд описывается так называемой трендовой моделью. Коэффициенты тренда и оценку дисперсии случайной составляющей определяют путём проведения статистической обработки результатов экспериментов или наблюдений.

С помощью представления случайного процесса в виде временных рядов можно, во-первых, исследовать динамику этого процесса, во-вторых, выделить факторы, существенным образом влияющие на показатели, и определить периодичность их максимального воздействия, в-третьих, провести интервальный или точечный прогноз показателя на некоторый промежуток времени. (Точечный прогноз указывает лишь точку, возле которой может находиться прогнозируемый показатель, интервальный — интервал нахождения этого показателя с некоторой наперёд заданной вероятностью.) Подробно теория анализа временных рядов изложена в /22/.

Метод главных компонент используется при анализе некоторого множества случайных значений показателей Yi, i=l, 2, 3,к с целью определения общих для них факторов (компонент), от которых все они зависят. Степень зависимости i-го показателя от j-ой компоненты отражается величиной а{., называемой нагрузкой i-го показателя на j-ую компоненту. Результатом анализа является модель главных компонент, в которой каждый показатель представлен суммой произведений компонент и их нагрузок. В итоге модель главных компонент показывает, что и в какой степени определяет исследуемые показатели, а также объясняет связи между ними. Метод главных компонент подробно изложен в /27, 16/.

Факторный анализ. В своей сути совпадает с методом главных компонент, однако позволяет представить показатели через меньшее количество факторов (компонент), поэтому используется при исследовании сложных систем с большим числом показателей и сложными связями между ними. Предполагается, что за множеством показателей системы стоит небольшое число независимых скрытых параметров, называемых факторами. Они определяют значения показателей и связь между ними. Степень связи между фактором и показателем описывается факторной нагрузкой, количественное значение которой равно коэффициенту корреляции между ними. Если фактор связан со всеми показателями, то он называется генеральным, если с некоторой группой — то групповым, и, наконец, если существует связь только с одним показателем, то фактор называется специфическим. Следовательно, показатели, имеющие высокую нагрузку на общий фактор, обладают общим свойством, которому можно дать название исходя из физического смысла данной группы показателей. Это наводит на мысль, что выделяемые факторы не просто формальные математические абстракции, а обобщённые сущностные свойства изучаемых объектов. Выделить факторы можно при помощи специальной процедуры, которая и называется факторным анализом. Для использования факторного анализа рекомендуется обратиться к /16/.

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>