Оценка параметров генеральной совокупности по параметрам выборки

Напомним, что главная цель любого статистического исследования — установить закон распределения изучаемого признака в генеральной совокупности и определить основные характеристики этого распределения путем анализа выборки. Иначе говоря, надо определить генеральное среднее хг = М(Х), генеральные дисперсию Dr(X), среднее квадратичное отклонение стг, моду Мог, медиану Мег и другие характеристики генеральной совокупности, зная соответствующие параметры выборки.

  • 1. Точечная оценка характеристик генеральной совокупности заключается в использовании в качестве числовых характеристик генеральной совокупности соответствующих числовых характеристик выборки. Например, в качестве генерального среднего используется выборочное среднее, генеральной дисперсии — выборочная дисперсия и т.д. Такие оценки и называются точечными. Это наиболее простой, но не очень достоверный способ оценки характеристик генеральной совокупности. Его недостаток состоит в том, что не ясно, насколько они отличаются от истинных значений параметров генеральной совокупности. При малых выборках ошибка может быть особенно значительной.
  • 2. Интервальная оценка параметров генеральной совокупности является более достоверной. В этом случае определяется интервал, в который с заранее заданной вероятностью попадает истинное значение исследуемого признака. Этот интервал называется доверительным, а вероятность того, что истинное значение оцениваемой величины находится внутри этого интервала, — доверительной вероятностью у или

надежностью. В медицинской литературе для этой величины используется также термин «вероятность безошибочного прогноза». Величину а = 1 - у, характеризующую вероятность непопадания истинного значения исследуемого признака в выбранный доверительный интервал, т.е. вероятность ошибки, называют уровнем значимости. Значения у задаются заранее (обычно в медико-биологических исследованиях выбирают значения у = 0,95 = 95 % или у = 0,99 = 99 %), после чего вычисляют соответствующий доверительный интервал.

Для построения надежных интервальных оценок необходимо знать закон, по которому оцениваемый случайный признак распределен в генеральной совокупности.

Рассмотрим, как находится интервальная оценка генерального среднего МГ) в случае малых выборок (п < 30), если признак X распределен в генеральной совокупности по нормальному закону. Будем считать, что нам известны выборочная средняя хв и выборочное стандартное отклонение SB. В этом случае интервальной оценкой генерального среднего (математического ожидания) МТ{Х) этого признака является доверительный интервал

или

Полуширина доверительного интервала 5 (точность оценки) рассчитывается по формуле

где п — объем выборки; SB — выборочное стандартное отклонение; B/fn — стандартная ошибка выборочного среднего[1]; ty> п — коэффициент Стьюдента, значения которого зависят от заданной доверительной вероятности у и объема выборки п и определяются по соответствующим таблицам либо содержатся в программных статистических пакетах обработки данных.

Анализ формулы (4.10) показывает, что:

  • • чем больше доверительная вероятность у, тем больше коэффициент ty>n и шире доверительный интервал;
  • • чем больше объем выборки п, тем меньше доверительный интервал и выше точность результатов.

При больших объемах выборки (п > 30) коэффициент Стьюдента практически не зависит от п и определяется только значением доверительной вероятности у, поэтому полуширина доверительного интервала 5 при больших выборках определяется соотношениями:

или

Существует доверительный интервал и для среднего квадратичного отклонения стг генеральной совокупности.

Подобные интервальные оценки с заданной надежностью даются и в тех случаях, когда распределение случайного признака в генеральной совокупности отличается от нормального.

Пример. Исследуется состояние дыхательных путей курящих. В качестве характеристики используется показатель функции внешнего дыхания — максимальная объемная скорость середины выдоха в л/с. Предполагая, что в генеральной совокупности данный параметр распределен по нормальному закону, найдите 95%-ный и

  • 99%-ный доверительные интервалы для хг (т.е. МГ(Х)), характеризующие этих людей. Обследуемая группа — 20 курящих, хв = 2,20 л/с, 5 = 0,73 л/с.
  • 1. Для значений у = 95 % и п - 20 коэффициент Стьюдента (находим по таблицам критерия Стьюдента) равен tQ 95. 2о = 2,09. Вычисляем полуширину доверительного интервала 5:

Теперь можем сказать, что с доверительной вероятностью у = 95 % математическое ожидание МГ(Х) генеральной совокупности находится в интервале

т.е.

В более компактной форме записи: МГ(Х) = (2,20 ± 0,34) л/с.

  • 2. Для у = 99 % и п = 20 ?0 99; 2о= 2,86; тогда доверительный интервал для МТ(Х) определяется неравенством
  • (2,20 - 0,47) л/с < МГ(Х) < (2,20 + 0,47) л/с

или

1,73 л/с < МГ(Х) < 2,67 л/с, иначе МГ(Х) = (2,20 ± 0,47) л/с.

Полученные данные подтверждают сделанный ранее вывод: увеличение доверительной вероятности у расширяет границы доверительного интервала.

Таким образом, формула (4.10) позволяет по заданной доверительной вероятности и объему выборки дать точность оценки для математического ожидания MV(X) варианты X в генеральной совокупности.

  • [1] В медицинской и биологической литературе эта величина иногда обозначается буквой тп и называется ошибкой репрезентативности.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >