Проверка адекватности и работоспособности регрессионной модели

По уравнению регрессии (11.75) можно вычислить значения функции отклика у во всех точках спектра плана: Хъ Х2, ..., Хп. В результате будет получено N значений у: yi, У2,...» yN. Если регрессионная модель получена на основе ПФЭ и все коэффициенты регрессии признаны значимыми, то в формуле

(11.75) А^в = NB = N. Тогда значения yt должны совпадать со средними выборочными значениями yt, полученными в результате эксперимента для каждой точки спектра плана. Следовательно, поверхность отклика Y = (р(Х) проходит через все точки yt, i = 1, N, и полученная модель адекватна. Значения pi в этом случае используют для проверки правильности вычисления коэффициентов регрессии.

Если же незначимые коэффициенты bj исключены из регрессионной модели, то N* Тогда yt *yt. Это же характерно для моделей, полученных на основе ДФЭ. Разности {yt —у{) несут информацию об ошибках предсказания по уравнению регрессии и их можно использовать для последующего анализа свойств полученной модели — ее адекватности и работоспособности.

Для оценки рассеяния значений yt, вычисленных по уравнению регрессии, относительно результатов эксперимента^, используют дисперсию адекватности , оценивающую погрешность регрессионной модели:

где т — число параллельных опытов; N — число точек спектра плана; NB — количество значимых коэффициентов регрессии.

Если число параллельных опытов в различных точках спектра плана неодинаково, то для вычисления «S^ используют формулу

где mt — число параллельных опытов в i-й точке спектра плана.

При оценке регрессионной модели принимается нулевая гипотеза о том, что полученная модель обеспечивает адекватное описание результатов эксперимента. Проверка адекватности осуществляется путем сопоставления дисперсии адекватности Sy. У адекватной модели значение обусловлено в основном действием случайной помехи, поэтому различие между SAA и Sy должно быть небольшим, так как они оценивают одну и ту же дисперсию помехи с^;.

Проверку гипотезы об адекватности модели (гипотезы о равенстве дисперсий SAA и Sy) выполняют по критерию Фишера

В формулах (11.76) и (11.77) учтено, что чем больше число т параллельных опытов, тем с большей достоверностью оцениваются средние значения функции отклика у. Поэтому требования к различиям между экспериментальными yt и расчетными yt значениями становятся более жесткими, что отражается в увеличении ^-критерия.

Полученные значения статистики F сравнивают с табличным значением критерия Фишера FT, определяемым в зависимости от уровня значимости q и чисел степеней свободы /гх и /г2, с которыми определялись дисперсии S^A и Syi

Если F T, регрессионная модель считается адекватной.

Различие между дисперсиями S%A и Sy обусловлено систематической ошибкой при определении функции отклика по уравнению регрессии из-за его приближенности. Если модель описывает физические свойства исследуемого объекта неудовлетворительно, систематическая ошибка приводит к значительному возрастанию дисперсии адекватности и, следовательно, к увеличению статистики F.

При F >FT гипотеза адекватности модели отвергается. В таком случае нужно либо изменить структуру математической модели, либо уменьшить интервалы варьирования факторов и провести повторно эксперимент с моделью прежней структуры.

В первом варианте реализуется принцип постепенного усложнения структуры математической модели. Если использовалось упрощенное уравнение регрессии первого порядка, учитывающее влияние на функцию отклика только факторов или факторов и некоторого количества эффектов их взаимодействий низших порядков, что характерно для ДФЭ, то в модель можно дополнительно ввести новые члены, содержащие другие эффекты взаимодействия тех же или более высоких порядков. Однако во многих случаях такой путь оказывается неэффективным, так как, согласно выражению (11.76), при увеличении количества членов уравнения регрессии и неизменном числе точек спектра плана N дисперсия адекватности может возрасти, несмотря на снижение разности (& -Ш, поскольку при этом увеличивается iVB и, следовательно, уменьшается знаменатель выражения (11.76). Кроме того, следует иметь в виду, что с увеличением порядка эффекта взаимодействия возрастает вероятность незначимости коэффициента регрессии bj при этом эффекте. В этой связи наиболее целесообразно перейти к планированию второго порядка, используя регрессионное уравнение в виде полного квадратного полинома (см. параграф 11.14).

После обеспечения адекватности регрессионной модели осуществляют проверку ее работоспособности.

Адекватность регрессионной модели еще не гарантирует ее пригодность к практическому использованию в задачах прогнозирования и поиска оптимальных решений. Модель может оказаться неработоспособной из-за низкой ее точности. Для проверки работоспособности модели используют коэффициент детерминации, представляющий собой числовую интегральную характеристику точности уравнения регрессии. Его значение вычисляют по формуле

где у — среднее значение отклика:

Модель считается работоспособной при/?2 >0,75. В этом случае обеспечивается уменьшение ошибки предсказания, полученного по уравнению регрессии, по крайней мере, в 2 раза в сравнении с предсказанием по среднему значению отклика у без учета влияния факторов X на функцию отклика у.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >