Полная версия

Главная arrow Статистика arrow Критерии проверки отклонения распределения от равномерного закона. Руководство по применению

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

ОБЩИЕ СВЕДЕНИЯ О ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

С каждым из используемых для проверки гипотезы #0 критериев связана соответствующая статистика S , которая в соответствии с некоторой мерой измеряет расстояние между равномерным законом распределения вероятностей и эмпирическим законом, определяемым выборкой. В силу случайности извлекаемых выборок случайными оказываются и значения статистики S, вычисляемые в соответствии с этими выборками. При справедливости проверяемой гипотезы #0 статистика S подчиняется

некоторому распределению С(5'|Я0).

Схема проверки гипотезы заключается в следующем. Область определения статистики разбивается на два подмножества, одно из которых представляет собой критическую область, и попадание в которую при справедливости Н0 маловероятно. При попадании вычисленного по выборке значения S* статистики S в критическую область проверяемая гипотеза Н0 отклоняется (отвергается). В противном случае - нет оснований для отклонения гипотезы Н0.

Заметим, что не отклонение гипотезы #0 в процессе проверки не означает, что она справедлива. Истинный закон распределения реальных случайных величин остается всегда неизвестным. Результат проверки свидетельствует лишь о том, что этот закон, возможно, не очень сильно отличается, в данном случае, от равномерного.

С другой стороны, справедливая гипотеза Н0 может быть отклонена и эти самым совершена ошибка 1-го рода. При проверке гипотез вероятность ошибки 1-го рода а (уровень значимости), как правило, задают, допуская тем самым возможность отклонения Н0 и возможность такой ошибки.

При построении критериев стремятся к использованию одномерных статистик, что упрощает построение критической области. При этом критерии могут быть правосторонними, левосторонними и двусторонними, что определяет построение критической области.

Все критерии согласия являются правосторонними, и проверяемая гипотеза Н0 отклоняется при больших значениях статистики. Среди специальных критериев проверки равномерности присутствуют правосторонние и двусторонние.

В случае правостороннего критерия граница критической области (критическое значение) S{_a, определяется уравнением

где g(.s|#0) -условная плотность распределения статистики при справедливости Н0.

Для используемых на практике критериев в благоприятных случаях известны асимптотические (предельные) распределения G:(5'|//0) соответствующих статистик при условии справедливости гипотезы Н0. В тех ситуациях, когда распределения статистик существенно зависят от объёмов выборок п, информация о законе распределения статистики бывает представлена таблицей процентных точек (квантилей распределения G(Sl//0)). Критическое значение Sх_а вычисляют в соответствии с

G(S|#0) или берут из соответствующей таблицы процентных точек.

В случае правостороннего критерия в принятой практике статистического анализа обычно полученное значение статистики S* сравнивают с критическим значением S{_a при заданном уровне значимости а. Проверяемую гипотезу Н0 отклоняют, если S* > S{_a (см. рис. 1.1).

Плотность распределения статистики при справедливости гипотезы Н и критическое значение для правостороннего критерия

Рис. 1.1. Плотность распределения статистики при справедливости гипотезы Н0 и критическое значение для правостороннего критерия

Больше информации о степени соответствия выборки теоретическому закону можно почерпнуть из «достигнутого уровня значимости» (р- value): вероятности возможного превышения полученного значения статистики при справедливости Н0

Именно эта вероятность позволяет судить о том, насколько хорошо выборка согласуется с теоретическим распределением, так как по существу представляет собой вероятность истинности нулевой гипотезы (см. рис. 1.2). Проверяемую гипотезу Н0 не отвергают, если P{S > S*}> а.

Плотность распределения статистики при справедливости гипотезы Я и достигнутый уровень значимости

Рис. 1.2. Плотность распределения статистики при справедливости гипотезы Я0 и достигнутый уровень значимости

В случае двустороннего критерия критическая область состоит из двух частей. И проверяемая гипотеза Я0 отклоняется, если S* < Sa/2 или S* >1_a/2 (см. рис. 1.3). А достигнутый уровень значимости (p-value) в этом случае определяется соотношением

Задачи оценивания параметров и проверки гипотез опираются на выборки независимых случайных величин. Случайность самой выборки предопределяет, что возможны и ошибки в результатах статистических выводов. С результатами проверки гипотез связывают ошибки двух видов: ошибка первого рода состоит в том, что отклоняют гипотезу Я0, когда она верна; ошибка второго рода состоит в том, что принимают (не отклоняют) гипотезу Я0, в то время как справедлива конкурирующая гипотеза Я,. Уровень значимости а задает вероятность ошибки первого рода. Обычно, используя критерии проверки гипотез, не рассматривают конкретную конкурирующую гипотезу. В таком случае при проверке гипотез о виде закона можно считать, что конкурирующая гипотеза имеет вид Я,: F(x) Ф F(x, в0).

Если же гипотеза Я, задана и имеет, например, вид Я, : F(x) = F{ (х, в), то задание величины а для используемого критерия проверки гипотез определяет и вероятность ошибки второго рода (3. Ошибка второго рода заключается в том, что не отклоняется гипотеза Я0, когда на самом деле справедлива гипотеза Я,.

Плотность распределения статистики при справедливости гипотезы Я и критические значения для двустороннего критерия

Рис. 1.3. Плотность распределения статистики при справедливости гипотезы Я0 и критические значения для двустороннего критерия

Вероятность ошибки второго рода (3 для правостороннего критерия определяется выражением

а для двустороннего - соотношением

Для конкретной альтернативы Я0 и Я, задание вероятности ошибки 1-го рода определяет и вероятность ошибки 2-го рода. Рис. 1.4 поясняет это для правостороннего критерия. На рис. 1.4 g(s Я0) отображает плотность распределения статистики S при справедливости гипотезы Я0, a g(s | Я,) - плотность распределения при справедливости Я,.

Плотности распределения статистик при справедливости соответственно гипотез Я и Я, в случае правостороннего критерия

Рис. 1.4. Плотности распределения статистик при справедливости соответственно гипотез Я0 и Я, в случае правостороннего критерия

Мощность критерия представляет собой величину 1 - (4. Очевидно, что чем выше мощность используемого критерия при заданном значении а, тем лучше он различает гипотезы Я0 и Я,. Особенно важно, чтобы используемый критерий хорошо различал близкие конкурирующие гипотезы. Графически требование максимальной мощности критерия означает, что на рис. 1.4 плотности распределений статистики g(s|//0) и | //,)

должны быть максимально “раздвинуты”.

Аналогичным образом можно проиллюстрировать вероятности ошибок второго рода и мощности для двустороннего критериев (см. рис. 1.5).

Очевидно, что при проверке любой статистической гипотезы желательно использовать наиболее мощный критерий, который для заданной вероятности ошибки первого рода обеспечивает минимальную вероятность ошибки второго рода относительно любой конкурирующей гипотезы Н]. Ещё лучше использовать равномерно наиболее мощный критерий, который для любого заданного ос обеспечивает минимальное значение . Однако существование такого критерия для проверки конкретной гипотезы Н0 является редчайшим исключением. Нет такого и среди критериев, которые могут использоваться для проверки гипотезы о принадлежности наблюдаемой выборки равномерному закону.

Плотности распределения статистик при справедливости соответственно гипотез Н и Н в случае двустороннего критерия

Рис. 1.5. Плотности распределения статистик при справедливости соответственно гипотез Н0 и Н] в случае двустороннего критерия

В последние годы в публикациях, посвященных предлагаемым критериям или модификациям критериев проверки равномерности, как правило, пытаются сравнивать критерии по мощности, используя методы статистического моделирования. При этом перечень рассматриваемых критериев и рассматриваемых альтернатив бывает достаточно широк. Одним из таких примеров является работа [29].

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>