Полная версия

Главная arrow Менеджмент arrow Введение в количественный риск-менеджмент

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Анализ зависимости при исследовании факторов риска

Для того чтобы избежать проблем с образованием «пустых» классов или классов с недостаточным объемом наблюдений, а также повысить практическую применимость результатов, полученных в ходе статистического исследования, па практике широко используются методы регрессионного анализа. Его популярности также способствуют всесторонняя разработка математического аппарата, простота интерпретации и широкое распространение программного обеспечения, реализующего соответствующие алгоритмы.

Как известно, математически регрессионный анализ сводится к построению оценки (прогноза) зависимой переменной, которую в нашем случае естественно интерпретировать как ущерб размера ж, представимый функцией g(wi,... ,wm) независимых переменных (рассматриваемых ковариат). Качество подбора

оценки функции регрессии (/(•,...,•) определяется на основе априорного критерия. На практике таким критерием чаще всего служит минимум квадратов отклонений (метод наименьших квадратов) или максимум функции правдоподобия[1] (метод максимального правдоподобия).

Наиболее простой подход состоит в построении линейной регрессии, т. е. выборе линейной функции

Популярность линейной регрессии определяется целым комплексом причин. Во- первых, для нее ряд технических процедур упрощается. В частности, минимизация квадратов отклонений сводится к решению системы п линейных уравнений с п неизвестными[2]. Во-вторых, линейную функцию легко интерпретировать: значение Pi представляет собой «вклад» каждой дополнительной единицы значения фактора риска в ожидаемый ущерб. Если используются индикаторные переменные (типа 0-1), связанные с тем или иным интервалом величин, который соответствует определенному тарифному классу, то коэффициент регрессии в зависимости от его знака будет означать увеличение или уменьшение среднего ущерба при переходе в данный класс по сравнению с «базовой» ситуацией.

К сожалению, линейная оценка не всегда адекватна структуре зависимости исследуемых статистических данных. Тогда перед специалистом по оценке риска встает дилемма:

  • 1) использовать нелинейную регрессию, которая будет лучше описывать зависимость, по более сложна с точки зрения техники расчетов и интерпретации;
  • 2) согласиться с применением более простого подхода па основе линейной регрессии несмотря па ее неадекватность и, следовательно, меньшую точность.

Во втором случае речь может идти как о получении наилучшего линейного прогноза (единственная регрессия на основе всех данных), так и об использовании кусочно-линейных аппроксимаций (несколько линейных регрессионных зависимостей на разных интервалах значений). Выбор, как правило, определяется особенностями практической ситуации и видом подходящей нелинейной функции.

Если все ковариаты представлены индикаторными переменными, то построение регрессии по существу сводится к схеме дисперсионного анализа. Особенно эффективно его применение при использовании комбинационной группировки и отсутствии пустых классов, так как в противном случае исходные данные нужно перегруппировать. При этом можно выявить как влияние отдельных факторов на средний ущерб по соответствующему классу, так и их совместное воздействие, отражающее системный (синергетический) эффект. Однако следует иметь в виду, что результаты дисперсионного анализа существенно зависят от качества разбиения па классы, так как если проверяемая в рамках данного метода гипотеза Но : Pi = 0, i € 1 -j- m, отвергается, то это вовсе не означает, что для любого г 6 1 тто имеет место Pi > 0.

Альтернативой выбора между линейной и нелинейной регрессией может служить использование обобщенных линейных моделей, которые в настоящее время очень популярны в прикладных исследованиях. Они позволяют сохранять линейную форму, по при этом оценки строятся па основе нелинейных функций. Кроме того, такой подход дает возможность рассматривать ситуации с остатками, не подчиняющимися нормальному распределению.

Так, для оценки распределения ущерба часто применяют гамма-регрессию, при использовании которой для упрощения интерпретации можно осуществить изменение параметров распределения, сделав замену /г = а/А. При этом новый параметр /х будет характеризовать математическое ожидание, которое удобно выразить в линейной форме. Другим параметром следует взять о, так как он будет характеризовать постоянные коэффициенты вариации, асимметрии и эксцесса, хотя вид функции плотности распределения будет сложнее (см. задачу 4.7). Тогда с учетом подобной репараметризации размер ущерба можно считать случайной величиной, подчиненной гамма-распределеиию с математическим ожиданием /ф + YlPjwj-

Еще одним преимуществом обобщенных линейных моделей является возможность моделирования числа неблагоприятных событий в зависимости от факторов риска. Примером может служить пуассоновская регрессия, когда число событий рассматривается как случайная величина, имеющая распределение пуассона с параметром /3q + wj-

Если ковариаты представляют собой индикаторные переменные, то обобщенные линейные модели хорошо согласуются с идеями дисперсионного анализа, позволяя учитывать влияние поминальных переменных как по отдельности, так и при сочетаниях. Кроме того, не возникает принципиальных трудностей при одновременном использовании номинальных и количественных переменных.

Более того, можно использовать более сложные (нелинейные) зависимости среднего ущерба от сочетаний ковариат. Для сохранения перечисленных выше преимуществ линейной формы ее часто «встраивают» в нелинейную функцию д(-), так что прогноз размера ущерба осуществляется по формуле вида /х = д (@о + Y2Pjwj)-

К основным недостаткам такого подхода следует отнести невозможность использования метода наименьших квадратов, качество которого тем хуже, чем сильнее распределение остатков отличается от нормального распределения. Поэтому на практике применяют более громоздкий метод максимального правдоподобия. Правда, указанный метод можно несколько упростить за счет сужения множества допустимых распределений остатков до класса экспоненциальных семейств (см. главу 1).

При организации расчетов необходимо решить три основных вопроса:

  • 1. Установление типа распределения остатков. С точки зрения практических приложений это принципиальный вопрос, так как он определяет дизайн модели. Как правило, имеются априорные предположения о характере ущерба и возможном разбросе количества случаев возникновения ущерба, которые уменьшают число альтернатив.
  • 2. Отбор ковариат, которые определяют специфику линейной формы. Данный вопрос решается в ходе последовательных расчетов, как это описано выше (п. 4.3.4).
  • 3. Выбор функции связи д(-). Он может осуществляться на основе различных принципов. Так, одним из возможных вариантов, популярным па практике, является экспоненциальная функция д(9) = ехр($). Иными словами, функция регрессии имеет вид

Ее преимущество состоит в том, что она переводит аддитивные поправки в мультипликативиые коэффициенты. Другой вариант состоит в использовании вспомогательной функции Ь(6), присутствующей в формуле (1.5):

так что д{-) = Ь~1(-). Такая функция связи называется канонической, поскольку хорошо согласуется с видом распределения.

Качество регрессии проверяется с помощью критерия отклонений [deviance test|, основанного па отношении правдоподобия. Тот факт, что при изменении количества ковариат тип модели не меняется, позволяет эффективно использовать данный критерий для сравнения разных вариантов модели.

  • [1] Для упрощения расчетов на практике, как правило, максимизируется логарифм функции правдоподобия, что не изменяет точку, в которой достигается экстремум.
  • [2] Строго говоря, это выполняется для любой аддитивной функции регрессии, линейной по (3{,но не обязательно линейной по гг*.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>