ОЦЕНКА ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

При задании случайной величины выборкой ее значений параметры случайной величины заменяются их точечными или интервальными оценками. Методом максимального правдоподобия находятся оценки среднего, дисперсии и доли. Качество оценок проверяется с использованием распределений Стьюдента, хи-квад- рат и Фишера, построенных на основе нормального распределения.

Точечные оценки параметров

Пусть распределение случайной величины X (генеральной совокупности) задается вероятностями P(xi} 0) (для дискретной случайной величины) или плотностью вероятности Р(х, 0) (для непрерывной случайной величины), которые зависят от неизвестного параметра 0. Этим параметром может быть, например, параметр X закона Пуассона или параметры а и о нормального распределения. На практике о величине параметра а можно судить по выборке {jq, Х2,..., хп} объема п из генеральной совокупности.

Оценкой 0„ параметра 0 называется функция от значений выборки 0И = 0„(jq, х2, ..., хп). Связь оценки 0И с 0 уточняется после введения свойств оценки.

Заметим, что сам параметр 0 является некоторым постоянным (неслучайным) числом, которое представляет истинное значение параметра генеральной совокупности. Статистику 0И можно рассматривать как функцию от случайных величин Xh Х2, ..., Хп, таких, что Xj есть реализация случайной величины X]:

Таким образом, оценка 0„ является случайной величиной и ее реализации заменяют неизвестные значения параметра 0. Ясно, что оценку 0„ следует выбирать так, чтобы ее значения как можно точнее оценивали неизвестный параметр 0.

Качество оценки характеризуется тремя основными свойствами: несмещенностью, состоятельностью и эффективностью.

Оценка 0П называется несмещенной, если ее математичесое ожидание равно оцениваемому параметру

Однако па практике иногда приходится использовать оценки, которые не являются несмещенными.

Например, выборочная дисперсия S2, определяемая по стандартной формуле (7.10), не является несмещенной оценкой для дисперсии а2.

Если это требование не выполняется, то в среднем оценка 0И будет всегда давать значение 0 с некоторым отклонением. Для несмещенных оценок отсутствует систематическая ошибка при оценке параметра 0. Статистика 0„ зависит от объема выборки п, что отмечено в ее обозначении, и при удачном построении оценки естественно ожидать, что при больших п значение статистики приближается к истинному значению параметра 0. Это свойство оценки описывается с помощью понятия предела по вероятности.

Пределом по вероятности случайной величины 0„ назывется такое число 0, что для любого е > 0

Для этого предела применяется запись

Состоятельность оценки означает, что при больших п вероятность сколь угодно малого отклонения 0„ от 0 становится сколь угодно близкой к единице. Таким образом, практически достоверно, что состоятельная оценка 0„ для больших п сколь угодно мало отклоняется от самого параметра 0.

Оценкой качества несмещенной оценки является ее дисперсия. Несмещенная оценка 0 называется эффективной, если ее дисперсия

является наименьшей среди дисперсий всех возможных оценок параметра 0, вычисленных по одному и тому же объему выборки п.

При этом оценка 0„ предполагается выбранной из определенного класса функций (например, линейных).

Оценка 0„ называется точечной, так как она оценивает одно численное значение параметра 0 (точку). Таким образом, точечная оценка параметра — это случайная величина, построенная на основе выборок исходной случайной величины, значения которой служат для оценки величины параметра 0.

Одним из основных методов построения точечных оценок параметров является метод максимального правдоподобия, применение которого будет описано в задаче 8.3. Суть метода заключается в следующем. На основе известной (или предполагаемой) функции плотности распределения вероятностей р(х, 0) генеральной совокупности X и выборки ее значений (х, х2,..., хп) строится функция правдоподобия

В дискретном случае значения р(х, 0) задают вероятность принятия случайной величиной X возможного значения х. Значения функции правдоподобия при заданном 0 характеризуют вероятность (правдоподобность) появления выборки (х^, х2, ..., х„). Поэтому для нахождения оценки параметра 0 следует искать такие значения 0И, которые дают максимум функции правдоподобия. Нахождение 0„ упрощается, если искать максимум функции In L. Уравнение правдоподобия (или система уравнений, когда параметров несколько), которое является необходимым условием максимума, имеет вид

Таким образом, в качестве оценки 0„ выбирается такое решение 0„ = $пь ..., хп) уравнения правдоподобия, которое задает максимум функции lnl.

Рассмотрим повторную выборку {xh х2, ..., хп) значений генеральной совокупности X. Эта выборка может рассматриваться как реализация системы случайных величин {Xi, Х2, ..., Хп}, которые будут предполагаться независимыми в совокупности и имеющими такое распределение вероятности, как и сама X. Пусть MX = а, DX = а2 генеральные средняя и дисперсия случайной величины X. В качестве оценок для а и а2 рассмотрим среднюю арифметическую выборки

и выборочную дисперсию

где k — число вариант выборки; т{ частоты вариант.

Оценка ос для математического ожидания MX = а является несмещенной, состоятельной и эффективной. Ее дисперсия

Оценка 52 для дисперсии DX = а2 является состоятельной, но смещенной, так как ее математическое ожидание не равно а2. Поэтому па практике часто пользуются несмещенной оценкой

Исправленной выборочной дисперсией называется оценка S2 для дисперсии а2, определяемая формулой (8.7).

Для бесповторной выборки оценки (8.4), (8.7) также являются несмещенными и состоятельными, а дисперсия оценки х

где N — объем генеральной совокупности.

При N —> °° бесповторпая выборка неотличима от повторной и формула (8.8) переходит в формулу (8.6). В случае, когда дис- персия а2 неизвестна, она заменяется значением ее оценки S2.

Пусть генеральная совокупность содержит М элементов, обладающих некоторым признаком А.

Генеральной долей признака А называется величина

Для доли р несмещенной и состоятельной оценкой будет выборочная доля

где т — число элементов выборки, обладающих признаком А.

Дисперсия С7щ выборочной доли в случае бесповторной выборки равна

а в случае повторной выборки

где q = 1 - р.

Если п « N (п намного меньше N), то повторная выборка практически не отличается от бесповторной и формулы (8.11) и (8.12) дают приблизительно одинаковый результат. Если же п = N, то объем выборки равен объему генеральной совокупности и выборочная доля равна генеральной, тогда = 0.

В случае, когда р неизвестно, его заменяют выборочным значением со.

Для наглядности и удобства пользования сведем данные о точечных оценках параметров генеральной совокупности в таблицу (табл. 8.1).

Таблица 8.1

Параметр

Оценка

Дисперсия для повторной выборки

Дисперсия для бесповторной выборки

Средняя а

Дисперсия сг

Доля р

Пример 8.1. Из 1500 деталей отобрано 250, распределение которых по размеру задано в табл. 8.2. Найти оценки х, S2 для среднего и дисперсии, а также дисперсию а| оценки х для повторного и бесповторного отбора.

Таблица 8.2

Размер детали

7,8-8,0

8,0-8,2

8,2-8,4

8,4-8,6

8,6-8,8

8,8-9,0

Количество деталей

5

20

80

95

40

10

Для повторной выборки для бесповторной выборки

Пример 8.2. Выборочно обследовали партию кирпича, поступившего на стройку Из 100 проб в 12 случаях кирпич оказался бракованным. Найти оценку со доли бракованного кирпича и а2.

По формулам (8.10)—(8.12) для оценки доли и ее дисперсии имеем

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >