Случайные величины

Понятие случайные величины является одним из важнейших в теории вероятностей. Под случайной величиной понимают величину, которая в результате опыта со случайным исходом принимает то или иное значение.

Случайные величины будем обозначать заглавными латинским буквами X, У, Z,..., а принимаемые ими значения — малыми буквами Все возможные значения

некоторой случайной величины образуют множество Е, которое назовем множеством возможных значений этой случайной величины.

Примерами случайных величин являются:

  • 1)Опыт — бросание игральной кости; случайная величинах — число выпавших очков; множество возможных значений Е = {1, 2, 3, 4, 5, 6}.
  • 2) Опыт — выборы; случайная величина Y — число голосов, которое набрал некоторый кандидат; множество Е — целые положительные числа, максимальное значение не превышает числа избирателей.
  • 3) Опыт — измерение длины линии светодальномером; случайная величина Z — результат измерения, выраженный в сантиметрах; множество возможных значений — некоторый участок действительной оси OZ, Z > 0.

Из приведенных примеров видно, что случайные величины бывают двух типов: у одних множество значений Е конечно или счетно (примеры 1 и 2), а у других оно занимает какой-то участок числовой оси, границы которого могут быть как фиксированными (теоретически это пример 3), так и нефиксированными, а множество Е является несчетным. Случайные величины первого типа называют дискретными, а второго — недискретными. Недискретные случайные величины подразделяются на непрерывные, у которых множество возможных значений несчетно, и смешанные, которые являются промежуточной разновидностью между дискретными и непрерывными случайными величинами. Их мы в дальнейшем рассматривать не будем, а желающие могут ознакомиться с ними, например, в книге [8].

В принятой в теории вероятностей теоретико-множественной трактовке случайная величина X является функцией элементарного случайного события, т. е. X = (pfcoj, где cosQ; Q — пространство элементарных событий. Множество Е возможных значений случайной величины X состоит из всех значений, которые принимает функция (pfcoj. Если множество Е конечно или счетно, то случайная величина X называется дискретной, а если несчетно — непрерывной.

Реально значения случайной величины, полученные в результате некоторого опыта, выражаются в определенных единицах: метрах, градусах, тоннах, амперах и измеряются с определенной точностью, поэтому в реальной действительности мы имеем дело с дискретными случайными величинами. Но в тех случаях, когда точность измерения высока, количество измерений велико и они расположены очень тесно на числовой

оси, проще рассматривать данную величину как непрерывную, а множество ее возможных значений — сплошной отрезок (несчетное множество) числовой оси.

Для полного описания случайной величины необходимо знать ее закон распределения. Законом распределения случайной величины называется любое правило (таблица, график, функция), которое позволяет находить вероятности всевозможных событий, связанных со случайной величиной. Закон распределения случайной величины имеет ряд форм. Рассмотрим эти формы.

Для дискретной случайной величины в качестве закона распределения можно использовать ряд распределения.

Рядом распределения дискретной случайной величины X называется таблица, в верхней строке которой расположены по возрастанию все возможные значения случайной величины X: xv х2, ху.., хп, а в нижней — соответствующие им вероятности: Pv Р2, Р3..., Рп, где Р. = Р{Х = х.} — вероятность того, что случайная величина X примет значение х..

Ряд распределения случайной величины X имеет вид

X:

Х2

хз

Хп

Рг

Р2

Р3

Рп

Так как события п попарно несовместны и

образуют полную группу событий, то

т. е. единица распределена между всеми возможными значениями случайной величины.

Графическим изображением ряда распределения является многоугольник распределения. На оси абсцисс откладываются все возможные значения случайной величины X, а на оси ординат — соответствующие им значения вероятностей (рис. 2.7).

Недостатком ряда распределения является то, что он может быть построен только для дискретных случайных величин.

Рис. 2.7

Наиболее универсальной формой закона распределения, которая может использоваться и для дискретных, и для непрерывных случайных величин, является функция распределения.

Определение. Функцией распределения случайной величины X называется вероятность того, что данная случайная величина примет значение меньшее, чем некоторое заданное х, т. е.

Функцию F(x) иногда называют интегральной функцией распределения. Геометрически формула (2.19), интерпретируемая как вероятность того, что случайная точка X попадет левее заданной точки х, показана на рис. 2.8.

Рис. 2.8

Из геометрической интерпретации можно получить основные свойства функции распределения:

  • 1 )F(x) является неубывающей функцией своего аргумента, т. е. при х2 > хх F(x2) > F(x:);
  • 2) F(-oo) = 0;
  • 3) F(+oo) = 1;
  • 4) вероятность попадания на промежуток [а,Ъ] равна приращению функции распределения на этом промежутке, т. е. P{a
  • 5) множество значений функции распределения располагается на отрезке [0;1], т. е. 0 < F(x) < 1.

Формула для вероятности отдельного значения случайной величины X через функцию распределения имеет вид:

Значение предела (2.20) зависит от того, непрерывна функция F(x) в точке а или разрывна. Если функция F(x) в некоторой точке а непрерывна, то предел (2.20) равен нулю. Если же функция распределения в точке а имеет разрыв первого рода, то предел (2.20) равен величине этого скачка. Но в любом случае вероятность события (X = а} равна величине скачка функции распределения в точке а (равен этот скачок нулю или нет). В этом случае, если функция распределения на своей области определения непрерывна, вероятность каждого отдельного значения случайной величины X равна нулю.

Заметим, что отрезок [а, Ь] содержит несчетное количество элементов, а аксиомы Колмогорова вводились для счетного количества событий. Поэтому из того, что событие {X = а} имеет вероятность, равную нулю, не следует, что это событие не появится, оно при неоднократном воспроизведении опыта будет появляться, но достаточно редко.

Если известен ряд распределения случайной величины X, можно получить ее функцию распределения, и наоборот. Для этого можно использовать формулу

Пример 2.4

Дан ряд распределения случайной величины X

X:

X

1

2

3

4

5

Р

0,2

од

0,4

0,1

0,2

Используя формулу (2.21) найдем функцию распределения и изобразим ее на рис. 2.9.

Рис. 2.9

Можно сделать вывод, что функция распределения любой дискретной случайной величины — это разрывная ступенчатая функция, скачки которой находятся в точках, которые соответствуют возможным значениям случайной величины X, и равны вероятностям этих значений.

Если число возможных значений дискретной случайности величины X велико, а интервалы между этими значениями малы, то число скачков функции распределения увеличивается, а сами эти скачки уменьшаются. Ступенчатая функция распределения будет приближаться к плавной кривой. Поэтому естественно аппроксимировать функцию распределения непрерывной кривой. Условимся также считать функцию распределения F(X) не только непрерывной в каждой точке своей области определения, но и дифференцируемой везде, кроме отдельных точек. График непрерывной функции распределения показан на рис. 2.10.

Рис. 2.10

Так как непрерывная функция F(X) не имеет скачков, то вероятность любого значения непрерывной случайной величины равна нулю, т. е. Р{Х = а} = 0 для Va. Поэтому для непрерывной случайной величины вводится специальная разновидность закона распределения — плотность распределения вероятностей (плотность распределения, плотность вероятностей), которую мы обозначим f(x). Она равна производной от функции распределения, т. е.

Функцию f(x) часто называют дифференциальной функцией распределения. График плотности распределения называется кривой распределения (рис. 2.11).

Рис. 2.11

На рис. 2.11 dx — это элементарный участок, который примыкает к точке х. Вероятность попадания случайной величины х на участок dx с точностью до бесконечно малых высших порядков равна f(x)dx. Величина f(x)dx называется элементом вероятности для точки х и геометрически равна площади элементарного заштрихованного прямоугольника. Приведем некоторые основные свойства плотности распределения:

  • 1. f(x) —- неотрицательная функция своего аргумента х, т. е. f(x) > 0.
  • 2. Площадь, ограниченная кривой распределения и осью абсцисс равна единице, т. е.

3. Вероятность попадания случайной величины в интервал (а;Ъ) будет выражаться через плотность распределения следующим образом:

Так как для непрерывной случайной величины вероятность события {X = а} равна нулю, то мы ставим строгое неравенство в формуле (2.24).

4. Функция распределения выражается через плотность распределения следующим образом:

Данное равенство следует из формулы (2.24). Замети, что функция распределения размерности не имеет, а размерность плотности распределения обратна размерности случайной величины X.

Закон распределения полностью характеризует изучаемую случайную величину. Например, известно, что случайные ошибки астрономических или геодезических измерений подчиняются нормальному закону. Но очень часто мы не знаем закона распределения изучаемой случайной величины. В этом случае мы можем охарактеризовать изучаемую случайную величину набором числовых параметров, которые характеризуют наиболее существенные черты закона распределения случайной величины. Эти параметры и называют числовыми характеристиками случайной величины.

Сначала рассмотрим характеристики положения, которые фиксируют положение случайной величины на числовой оси. К ним относятся математическое ожидание, мода, медиана.

Математическиу ожиданием, или средним взвешенным значением дискретной случайной величины X, называется сумма произведений всех ее значений на вероятность этих значений, т. е.

Вместо обозначения М[х] часто применяется М , тх, т.

Например, для данных примера 2.4 получим:

Если случайная величина X непрерывна, то ее математическое ожидание находится по формуле

Математическое ожидание случайной величины тесно связано со средним арифметическим ее наблюдаемых значений при большем числе наблюдений. При большом числе опытов среднее арифметическое наблюдаемых значений случайной величины приблизительно приравнивается к ее математическому ожиданию. Это одно из проявлений закона больших чисел.

Модой случайной величины X называются ее наиболее вероятные значения, т. е., то значение, для которого вероятность Р. или плотность распределения f(x) достигает максимального значения. Мода будет обозначена Мо. Для данных примера 2.4 мода равна 3, т. е. Мо = 3.

В том случае, если вероятность или плотность распределения достигает максимума не в одной, а в нескольких точках, распределение называют полимодальным (рис. 2.12).

Рис. 2.12

Медиана, которую мы будем обозначать Me, применяется, как правило, для непрерывных случайных величин. Медианой случайной величины X называется такое ее значение, для которого выполняется равенство

Геометрически медиана — абсцисса такой точки на оси ОХ, для которой площади под кривой распределения слева и справа от нее одинаковы и равны 1/2 (рис 2.13).

Рис. 2.13

Если распределение симметрично, то математическое ожидание, мода и медиана совпадают.

Кроме характеристик положения используются начальные и центральные моменты различных порядков.

Начальным моментом к-то порядка случайной величины X называется математическое ожидание к-й степени этой величины, т. е.

Если рассматриваемая случайная величина дискретна, то ее начальный момент к-то порядка находится по формуле

Если случайная величина непрерывна, то

Из приведенных формул (2.30) и (2.31) видно, что математическое ожидание — это начальный момент первого порядка, т. е.

Введем понятие центрированной случайной величины, которую будем обозначать X = X - М[Х], т. е. центрированная случайная величина X есть отклонение случайной величины X от ее математического ожидания. Математическое ожидание центрированной случайной величины равно нулю, т. е.

Моменты центрированной случайной величины называются центральными моментами. Центральным моментом порядка к случайной величины X называется математическое ожидание к-й степени центрированной случайной величины X, т. е.

Если рассматриваемая случайная величина X дискретна, то для нахождения центрального момента к-то порядка используется формула

а если непрерывна, то применяется формула

Для любой случайной величины первый центральный момент равен нулю, т. е.

Начальные и центральные моменты можно выражать друг через друга. Например, для второго центрального момента имеем:

Особое значение имеет второй центральный момент ц2. Он называется дисперсией случайной величины и обозначается следующим образом

Согласно формуле 2.32 дисперсия находится по формуле

То есть дисперсия — это математическое ожидание квадрата соответствующей центрированной величины. Дисперсия характеризует разброс значений случайной величины относительно ее математического ожидания. Из формул (2.33) и (2.34) следует, что для дискретной случайной величины она находится из выражения

а для непрерывной случайной величины — из соотношения

Часто для вычисления дисперсии используют формулу (2.35).

Размерность дисперсии равна квадрату размерности случайной величины, а для характеристики рассеивания удобно иметь параметр, который бы имел ту же размерность, что и изучаемая величина. Поэтому из дисперсии извлекают арифметический квадратный корень и получают еще одну числовую характеристику, называемую средним квадратическим отклонением (стандартом), которую обозначаем а[Х] = ст .

Следовательно, имеем

Зная М[Х] и ст[Х] изучаемой случайной величины X, можно приблизительно судить о разбросе ее возможных значений. Значения случайной величины X достаточно редко выходят за пределы интервала

Выражение (2.40) называется “правило трех сигм” и следует из закона больших чисел. Часто в качестве характеристики степени случайности изучаемой случайной величины применяют коэффициент вариации

Например, для рассмотренного нами примера 2.4 имеем:

Для более полного описания распределения используют моменты высших порядков. Для характеристики асимметрии (скошенности) распределения используют центральный момент третьего порядка. Заметим, что если распределение симметрично относительно математического ожидания, то все центральные моменты нечетного порядка равны нулю, а так как первый центральный момент всегда равен нулю, то и используют третий центральный момент. Его размерность равна кубу размерности изучаемой случайной величины, поэтому, для того чтобы получить безразмерный коэффициент |lx3 делят на (а[Х])3 и получают коэффициент асимметрии или скошенности.

Коэффициент Ах может быть как положительным, так и отрицательным (рис. 2.14).

Рис. 2.14

Четвертый центральный момент применяется для характеристики “островершинности” распределения. С его помощью вычисляют так называемый коэффициент эксцесса

Число 3 вычитается из отношения , так как для нормального распределения, очень важного в теории вероятностей, отношение и, следовательно, для нормального распределения

Если изучаемое распределение более островершинное, то для него Ех > 0, а если плосковершинное, то Ех < 0 (рис. 2.15).

Рис. 2.15

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >