Полная версия

Главная arrow Социология arrow Математические методы в современных социальных науках

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

ВЕРОЯТНОСТНЫЕ ОСНОВЫ СТАТИСТИЧЕСКОЙ ТЕОРИИ

[1]

Математическая статистика и ее задачи

Напомним, что теория вероятностей занимается вычислением вероятностей случайных событий при условии, что вероятности элементарных исходов нам заданы, известны. Вопрос же, откуда взять значения вероятностей элементарных исходов, является вопросом не этой теории, а других наук. Неизвестные вероятности могут давать, например, специалисты из тех конкретных предметных областей, задачи которых решаются теорией вероятностей. Такие специалисты могут быть хорошими профессионалами в своих областях, например в медицине, социологии, экономике, физике, однако они могут и не владеть в полной мере методами оценивания указанных неизвестных вероятностей. Этими вопросами специально занимается наука о случайных явлениях — математическая статистика.

Прежде чем формулировать задачи, решаемые математической статистикой, рассмотрим некоторые примеры. Начнем с исторического примера.

«Однажды в Неаполе некто Галиани встретил человека из Базиликаты, который, встряхивая три игральные кости в чашке, держал пари, что выбросит три шестерки; и действительно он немедленно получил три шестерки. Галиани промолчал, но подумал, что такая удача возможна. Однако человеку из Базиликаты это удалось еще раз, и пари повторилось. Он положил кости назад в чашку и выкидывал их три, четыре, пять раз, и каждый раз выбрасывал три шестерки. «Кровь Вакха (итальянское ругательство), — вскричал Галиани, — кости налиты свинцом». Но почему Галиани так решил?

Галиани из Неаполя вывел правдоподобное заключение очень важного типа. Правильно будет к каждому относиться как к джентльмену, если нет каких-либо доказательств противного. Совершенно так же правильно будет участвовать в азартной игре при допущении, что она ведется честно. Галиани сначала допустил, что этот человек из Базиликаты имел честные кости. Такое допущение, правильно сформулированное в терминах вероятности, является статистической гипотезой. Статистическая гипотеза вводит (допускает, предполагает) значения некоторых вероятностей.

Так, Галиани сначала в более или менее явной форме принял, что на любой из трех костей шесть очков будет выпадать с вероятностью 1/6. На основании этой статистической гипотезы методами теории вероятностей нам не составит труда вычислить вероятность выпадения на трех костях трех шестерок: . Это довольно маленькая вероятность. Вероятность повторения этого события два раза, т. е. выпадения трех шестерок и в первом, и во втором случае, равна: Это очень маленькая вероятность.

Однако человек из Базиликаты повторил это необычайное событие пять раз. Запишем соответствующие вероятности:

Галиани принял свое первоначальное допущение, быть может, из простой вежливости, хотя мог, просто глядя на человека из Базиликаты, иметь сомнения в отношении четности костей. Галиани сохранял молчание, когда три шестерки выпали последовательно дважды — событие, которое при исходном допущении должно было бы произойти не намного чаше, чем один раз за 50 000 испытаний. Он сохранял молчание даже дольше. Однако, когда события становились все более невероятными, достигли и превзошли ту степень невероятности, которую люди рассматривают как сверхъестественную, Галиани потерял терпение, вывел свое умозаключение, отказался от первоначального допущения и энергично высказался.

Анекдот, который мы только что обсудили, интересен только в одном отношении: он типичен для многих ситуаций. Сначала мы допускаем некоторую статистическую гипотезу, т. е. предположение о неких простейших вероятностях. Затем, владея методами теории вероятностей, вычисляем (еще до всяких опытов) вероятности некоторых случайных событий. Затем мы наблюдаем результаты опыта. Если в результате опыта событие, несмотря на его вычисленную низкую вероятность, в действительности произошло, то оно дает сильный аргумент против предложенной статистической гипотезы. В самом деле, нам трудно поверить, что произошло нечто невероятное. Если это почти невероятное событие произошло, мы ясно осознаем, что любая вероятность вычисляется на основании статистической гипотезы. Мы осознаем также, что любая вычисленная вероятность имеет практический смысл, т. е. может использоваться в наших действиях, при принятии каких-то решений на основании этих вычисленных вероятностей, если только исходная статистическая гипотеза была верна, иначе занятия по вычислению вероятностей могут представлять интерес лишь для математиков, любящих теорию вероятностей как своего рода искусство.

Итак, теория вероятностей, если ее рассматривать не как чисто абстрактную математическую науку, а как раздел математики, обслуживающий практическую деятельность человека, нуждается в том, чтобы ей дали близкие к реальности вероятности элементарных исходов. Только при знании этих вероятностей она полезна практически.

Сама же теория вероятностей в ее статистическом подходе указывает путь получения этих необходимых ей вероятностей: опытные вероятности, относительные частоты, частости при увеличении числа опытов стремятся к истинным, идеальным вероятностям. Частость события в этом понимании является оценкой (по выборочным данным) для вероятности события. Теперь мы можем сформулировать узловой вопрос математической статистики: насколько далеко могут отклоняться величины, вычисленные по выборке, от соответствующих идеальных (предельных) значений?

Рассмотрим теперь некоторые примеры.

Пусть мы бросаем монету. В теории вероятностей мы принимаем некоторую статистическую гипотезу о вероятностях двух элементарных исходов опыта — Г (герб), Р (решка), состоящего в бросании монеты.

Например, мы приняли гипотезу о симметричности монеты:

А теперь пусть нас интересует вероятность того, что при п-т бросании монеты герб выпадает т раз. Мы рассчитываем эту вероятность

исходя из принятой гипотезы симметричности монеты /> = # = ^-и биноминального закона распределения случайной величины — числа гербов, причем рассчитываем эту вероятность еще до проведения

бросаний по формуле

Пусть, например, п = 100. Подсчитаем вероятность того, что в 100 бросаниях герб выпадет ровно 50 раз и 80 раз. Для этого используем формулу Стирлинга:

Получим

Из этих расчетов мы видим, что если в 100 бросаниях монеты герб выпал 80 раз, то произошло событие, которое выглядит крайне невероятным, если принять статистическую гипотезу, лежащую в основе нашего вычисления вероятности Р„(т), а именно гипотезу симметричности монеты Нам трудно поверить, что такое невероятное событие действительно произошло, и, таким образом, представляется крайне невероятной лежащая в основании гипотеза симметричности монеты.

Чтобы вести дополнительные рассуждения, обозначим как Р вероятность события Е, вычисленную на основании некоторой статистической гипотезы Я; тогда Р зависит от Е и от Я. Используя теорию вероятностей, мы на основании гипотезы Я предсказываем частоту события Е еще до проведения опытов. Теперь мы будем на это смотреть с другой стороны: понаблюдав за наступлением события Е в результате опытов и приняв во внимание вычисленные значения вероятности Р этого события Е, оценим надежность гипотезы Я. При этом открывается новая сторона вероятности Р. Чем меньше Р (чем менее вероятное событие Е наступило реально в результате опытов), тем больше аргументов, чтобы отказаться от гипотезы Я. Итак, Р, вычисленная до опытов, есть вероятность события А; если же событие Е уже появилось в результате опытов, то вероятность Р есть правдоподобие статистической гипотезы Я.

Теперь мы можем поставить такую задачу. Мы не знаем, симметрична монета или нет (на самом деле монета всегда хотя бы немного несимметрична, абсолютно симметричная монета является математической моделью, идеализацией), но можем выдвинуть две статистические гипотезы: Н1 — монета симметрична — монета

несимметрична и имеет повышенную вероятность герба, например р = 0,7; q = 0,3. В результате бросания п = 100 раз монета выпала 80 раз. Какая гипотеза более правдоподобна? При Я, правдоподобие этой гипотезы уже вычислено:

при Я2 эта вероятность Р(Н2) равна:

Мы видим, что правдоподобие гипотезы Я2 намного больше правдоподобия гипотезы Я,. Поэтому, если перед нами встает вопрос, какую из двух гипотез (Я, = 0,5) или Я2 = 0,7)) следует предпочесть, мы скажем, что если герб из 100 раз выпал 80 раз, то предпочтительнее гипотеза Я2.

Но теперь нас может заинтересовать вопрос о том, какая же из возможных гипотез о вероятности р герба наиболее правдоподобна.

Пусть, например, мы выдвинем еще одну гипотезу Я3: вероятность герба р = 0,8. Тогда q = 1 — р = 0,2. Правдоподобие этой гипотезы примерно равно:

В свою очередь, оно значительно больше правдоподобия гипотезы Я2.

Рассмотрев этот пример, мы можем сформулировать основные задачи математической статистики:

  • 1) оценивание вероятностей элементарных исходов случайного опыта;
  • 2) проверка статистических гипотез о вероятностях элементарных исходов.

Рассмотрим прикладную сторону указанных задач.

Пусть потребитель покупает у производителя изделие большими партиями. Это крупный потребитель, крупный торговец, промышленная фирма или правительственный агент. Производитель производит указанное изделие в большом масштабе. Это изделие может быть канцелярской кнопкой, гвоздем, снарядом для артиллерийских установок, электрической лампочкой и т. п. Любое изделие должно удовлетворять некоторым условиям, например, гвоздь должен быть не длиннее чем 7,04 см, не короче чем 6,96 см, обусловливается его толщина; обусловливается время горения лампочки и т. д. Изделие, не удовлетворяющее заданным условиям, рассматривается как дефектное. Даже тщательно изготовленная партия может содержать некоторую долю дефектных изделий. Поэтому, прежде чем переходить от производителя к потребителю, она должна быть проверена. Партия может быть проверена полностью, т. е. может быть испытано, удовлетворяет ли требуемым условиям каждое изделие в этой партии. Такая сплошная проверка была бы непрактичной для 1000 гвоздей и абсурдной для партии лампочек или снарядов, даже если бы эта партия была невелика: чтобы измерить время горения лампочки, вы должны были бы ее сжечь, а снарядом выстрелить, и не было бы большого смысла в том, чтобы при проверке уничтожать всю партию. Поэтому вместо проверки перед приемкой всей партии из этой партии делается небольшая выборка.

Процедура приемки, основанная на таком выборочном контроле, состоит в следующем правиле. Производится случайная выборка п изделий из представленной на рассмотрение партии, состоящей из N изделий, причем п < N. Испытаем каждое изделие из выборки объема п. Если число дефектных изделий в выборке не превышает некоторого назначенного числа с, так называемого приемочного числа, то потребитель принимает всю партию из N изделий, но отказывается от нее, если в выборке дефектных изделий больше, чем с.

Результаты, получаемые с помощью этого правила, зависят от случая. Доля дефектных изделий в выборке случайно может оказаться значительно ниже или значительно выше, чем во всей партии. Если выборка лучше, чем вся партия, то случай работает против потребителя, но если выборка хуже, чем вся партия, то случай работает против производителя.

Рассмотренная ситуация допускает несколько иную интерпретацию. Юрисконсульт производителя утверждает, что в партии имеется не более чем 2% дефектных изделий. Однако юрисконсульт потребителя настаивает на том, что в партии содержится 5% дефектных изделий. Полная проверка по ряду причин невозможна или нецелесообразна (например, для партии электролампочек, снарядов); поэтому решить, какое из этих двух утверждений верно, должна какая-то процедура, основанная на исследовании выборки. Для этой цели можно использовать число дефектных изделий в случайной выборке.

В результате мы приходим к следующей задаче. В очень большой партии доля дефектных изделий равна р, но она нам неизвестна. Мы берем случайную выборку из гораздо меньшего числа п изделий, среди которых оказывается т дефектных изделий. Какое значение мы должны приписать р на основании этого наблюдения?

На основании этой весьма распространенной, но все же частной задачи сформируем еще раз задачи математической статистики.

Будем называть генеральной совокупностью все подлежащие изучению по интересующему признаку данные. Выборочная совокупность, или просто выборка, — часть генеральной совокупности.

Задачи математической статистики состоят в том, чтобы, задав выборку, сделать выводы о свойствах генеральной совокупности. Эти задачи влекут либо проверку статистических гипотез о свойствах генеральной совокупности, либо оценивание свойств генеральной совокупности. Основой для решения данных задач является указанное выше свойство массовых явлений сближения свойств выборки и генеральной совокупности при увеличении объема выборки. Рассмотрим теперь количественные законы этого сближения.

  • [1] Авторы выражают благодарность профессору, доктору технических наукБ. И. Кругликову за предоставленные материалы.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>