СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

Одной из задач математической статистики является оценка неизвестных параметров закона распределения генеральной совокупности X. Вид закона распределения X может быть известным или неизвестным, и задача сводится к нахождению приближенных значений искомых параметров распределения или числовых характеристик X с использованием выборки из генеральной совокупности.

Пусть 0 — неизвестный параметр распределения, а его приближенное значение находится по выборке х(л) = (х1? х2, ..., хп) с помощью функции ё(я)(,,)) = 0(й)(х, , х2, ..., хп) элементов выборки: 0 » 0(й)(л)).

Для изучения свойств функции 0(и) ее рассматривают и как функцию 0(л) = 0(л)(и)) случайной выборки Х(и) = ь Х2, ..., Хп). Напомним, что любую функцию случайной выборки называют статистикой.

Определение. Точечной оценкой параметра 0 распределения генеральной совокупности ^называется статистика 0(л)(л)), реализации которой 0(л)(и)) используются как приближенные значения этого параметра.

Наряду со статистикой 0(л)(л)) точечной оценкой параметра 0 называют и функцию п переменных 0(л)(л)).

Аналогичным образом можно ввести точечные оценки и для вектора неизвестных параметров 0 = (0j, 02, ..., 0да).

Качество оценки характеризуется следующими основными свойствами.

1. Несмещенность точечной оценки

Определение. Статистику 0(л)(и)) называют несмещенной оценкой параметра 0 распределения генеральной совокупности X, если ее математическое ожидание совпадает с 0 для любого п е N:

При выполнении этого требования в пределе, т.е. когда

оценку 0(/,) называют асимптотически несмещенной.

Замечания.

  • 1. Несмещенность оценки означает ее верность «в среднем», отсутствие систематической ошибки.
  • 2. Из несмещенности точечной оценки следует ее асимптотическая несмещенность, но не наоборот.

Пример 25.1. Доказать, что выборочные начальные моменты 1 п

аЛ(т)) = — Тх* (см- (24.3)) являются несмещенными оценками пы

соответствующих начальных моментов ак] = М[Хк] генеральной совокупности X, к - 1,2,....

? Найдем математическое ожидание статистики ак{п)) = 1 "

пм

Поскольку случайные величины Xt распределены по тому же закону, что и генеральная совокупность X, можно записать М[Хк = = М[Хк = ак[Х]. Поэтому

что означает несмещенность оценки ак(('п)) момента аЛ[X]. ? Пример 25.2. В п. 24.2 отмечалось, что если математическое ожидание тх генеральной совокупности X известно, то в формуле (24.6)

1 п

выборочной дисперсии 502('7)) = — УЧх, - J)2 разумно вместо

пы

оценки х величины тх подставить саму эту величину, т.е. положить

Убедитесь, что выборочная дисперсия (25.2) является несмещенной оценкой дисперсии о2х генеральной совокупности X.

Пример 25.3. Пусть статистика X = — Xt есть выборочное сред-

i=i

нее, см. (24.4). Покажите, что

где а < °° — дисперсия генеральной совокупности X.

Пример 25.4. Исследовать несмещенность выборочной дисперсии iSo(x(/l)) из (24.6) как оценки дисперсии о2х генеральной совокупности X.

< Наряду с х(я) = (xj, х2, ..., хп) рассмотрим смещенную на величину тхвыборку у(и) = { - тх, х2 - тх, ..., хп - тх).

Легко убедиться, что у = х - тх и Sq(x(n)) = 5о(у(и)). Поэтому из формулы (24.7) следует

1 И _

Аналогично для статистики Sq (X(w)) = — ^(Л') - X)2 имеем

п i=1

Отсюда с учетом (25.3) получаем

т.е. Sq (я)) — это смещенная оценка дисперсии о2х генеральной совокупности X. Однако lim mSq (X(w))1 = g2x, что означает асимптоти-

п—>°°

ческую несмещенность этой оценки. ?

Замечания.

1. Рассмотрим оценку iS’2(x(w)) = —— 5о(х(л)), т.е.

п -1

Как уже отмечалось в п. 24.2, ее называют исправленной выборочной дисперсией. Из примера 25.4 следует, что М[52(/г))] = 2х, т.е. 52(я)) есть несмещенная оценка дисперсии а2х генеральной совокупности X.

  • 2. Перечислим рассмотренные несмещенные оценки:
  • 1 п
  • • cL(x(/,)) = —Vxf, k eN (выборочный начальный момент) — оценка

пы

ak[X];

, «

• х = — Х.Х, (выборочное среднее) — оценка тх;

п /=1 1 п

= —УЧх; - тх)2 (выборочная дисперсия) — оценка о2х при из-

пы

вестном тх;

  • 1 п
  • S2 =-(х;-х)2 (исправленная выборочная дисперсия) —

ы

оценка 2х при неизвестном тх.

2. Состоятельность точечной оценки

Определение. Статистику 0('г)(/г)) называют состоятельной оценкой параметра 0 распределения генеральной совокупности X, если с ростом объема выборки п она сходится по вероятности к этому параметру:

Замечание. Напомним: соотношение (25.6) означает, что для любого е > О

Отсюда следует, что для состоятельной оценки 0(,,)(,,)) ее отклонение от 0 не менее чем на сколь угодно малую величину е становится при большом объеме выборки п событием, близким к невозможному. Иными словами, состоятельность оценки — это возможность определить с ее помощью искомый параметр с любой точностью и сколь угодно большой достоверностью за счет использования выборки достаточно большого объема п.

1 п

Пример 25.5. Выборочное среднее х = — У х,- — состоятельная

п i=

оценка математического ожидания тх генеральной совокупности X с конечной дисперсией 2х.

? Это непосредственно следует из закона больших чисел, см. (23.8). ?

Замечание. Состоятельность оценки х в конечном счете обеспе- о2

чивается тем, что D[X = ->0, см. (25.3). Несложно обосно-

п ян>

вать следующее обобщение результата примера 25.5: если статистика 0(«)(Х<Л)) является асимптотически несмещенной оценкой параметра 0 и lim Z)[0(,,)(X(W))] = 0, то эта статистика есть состоятельная оценка

И—>°о

параметра 0.

Пример 25.6. Докажем, что выборочные дисперсии Sq =

1 п п

= — Y (х,-- х)2 и S2 =-'V(xj-x)2 являются состоятельными

*5 »->Й

оценками дисперсии o;v генеральной совокупности X, имеющей ко- нечный центральный момент р4[Лф

? Воспользуемся равенством (25.4):

Из состоятельности выборочного среднего как оценки параметра тх(см. пример 25.5) следует, что

Согласно закону больших чисел (см. формулы (23.8)) для одинаково распределенных случайных величин (Xj - тх)2 с математическим ожиданием м{Х( - тх)2~ = а2х. = ах и конечной дисперсией

получаем

Из (25.4), (25.7) и (25.8) следует, что Sq—^ >ох при п —> ©о, т.е.

9 9 9^9

S0 состоятельная оценка дисперсии ах. Далее S =-^, причем

п -1

fl 2 P 2

--> 1. Поэтому и S ->о у, что означает состоятельность

п _ ] П—»°о J л 7

оценки S2. ?

Замечание. Можно доказать, что все выборочные начальные и центральные моменты (24.3), (24.5) являются состоятельными оценками соответствующих моментов генеральной совокупности, если последние существуют.

3. Эффективность точечной оценки

Пусть имеются две несмещенные оценки 0|л)(л)) и 0(2и)(я)) одного и того же параметра 0. Если для любого не N выполняется неравенство

то следует предпочесть оценку б{я)(я)), так как ее разброс относительно искомого значения 0 в среднем меньше и, следовательно, она при одном и том же п дает в среднем более точный результат. В таких случаях говорят, что оценка 0|")(/,)) эффективнее оценки 0(2w)(x(w)).

Определение. Если существует такая несмещенная оценка 0i'°(x(/,)) параметра 0, что для любой другой его несмещенной оценки 0(,,)(я)) при всех п е N выполняется неравенство

то 0(*'г)(я)) называют эффективной оценкой параметра 0.

Замечания.

1. В отличие от несмещенности и состоятельности эффективность оценки 0('°(х(,,)) зависит от закона распределения генеральной совокупности X: для одного закона 0(,,)(,г)) может оказаться эффективной, а для другого — нет.

2. При выполнении определенных требований кЛТи 0<)(,,)) (они выполняются для основных законов распределения и большинства оценок, используемых в приложениях), справедливо неравенство Крамера—Рао:

где

Это неравенство можно использовать для проверки эффективности оценок следующим образом. Пусть для некоторой несмещенной оценки 0(л)(л)) неравенство (25.9) превращается в равенство. Это означает, что дисперсия Z>[0(w)(X(/,))] достигла нижней границы для дисперсий всех несмещенных оценок параметра 0, т.е. оценка 0(/О(х(«))

является эффективной.

Пример 25.7. Пусть X ~ N(m, о). Исследуем эффективность не- 1 V

смещенной оценки х =паРаметРа т-

/=1

? Левая часть неравенства (25.9) уже найдена, см. (25.3): Подсчитаем выражение в правой части (25.9). В данном случае

^ (х-т)2

генеральная совокупность X непрерывна и fx(x, т) = ,— е 20 .

у/2пс

Поэтому

1 о2

Отсюда находим правую часть неравенства (25.9):-= —.

1п(т) п

Итак, левая и правая части неравенства (25.9) совпадают, т.е. оно превратилось в равенство. Это означает, что выборочное среднее . п

х = — ^Xj — это эффективная оценка математического ожидания т 1=1

нормальной генеральной совокупности X. ?

. п

Пример 25.8. Покажем, что выборочное среднее х = — яв-

/=1

ляется эффективной оценкой параметра X распределения Пуассона.

Xх

? В данном случае Рх {X, X) =итх = °х = см- п- 22.10.

_ 2 х

Левая часть неравенства (25.9) равна D[X] = = —.

п п

Найдем правую часть:

Итак, правая часть в (25.9) равна —, т.е. совпадает с левой частью.

п

. п

Поэтому выборочное среднее х = — является эффективной оценкой

i=1

параметра X для генеральной совокупности X ~ Ри{X). ?

Пример 25.9. Пусть генеральная совокупность — это число появлений события А (успеха), вероятность которого Р(А) = р е (0; 1), в п испытаниях, т.е. X ~ В(п, р).

X

Исследовать относительную частоту успеха р(х) = — как оценку

п

его вероятности р.

  • ? Рассмотрим свойства оценки р.
  • а) Несмещенность. Учитывая, что М[Х] = пр, см. п. 22.10, находим

т.е. р есть несмещенная оценка параметра р.

б) Состоятельность. Из теоремы 23.4 (закон больших чисел в формулировке Бернулли) непосредственно следует, что

а это означает состоятельность оценки р параметра р.

в) Эффективность. С учетом того что D[X] = npq (см. п. 22.10), вычислим левую часть неравенства (25.9):

Найдем теперь правую часть (25.9). Для X ~ В(п, р) имеем (см. п. 22.10):

т.е. правая часть в (25.9) равна — и совпадает с левой частью. Это

п

означает, что р есть эффективная оценка параметра р.

Итак, относительная частота события является несмещенной, состоятельной и эффективной оценкой вероятности этого события. Это является дополнительным обоснованием статистического подхода к вероятности, см. п. 21.5. ?

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >