Полная версия

Главная arrow Статистика arrow Общая и прикладная статистика

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ

6.6.1. По данным распределения возраста студентов одного из факультетов вуза определим размах распределения, среднее линейное отклонение, дисперсию и среднее квадратическое отклонение.

Группы студентов по возрасту х.лет

Число

студентов

А

Iх/ -х|

х,-х?

k-*f

I -I2 г

( -х|

V/

А

1

2

3

4

5

6

17

10

3,7

37

13,69

136,9

170

18

70

2,7

189

7,29

510,3

1260

19

80

1,7

136

2,89

231,2

1520

20

100

0,7

70

0,49

49,0

2000

21

120

0,3

36

0,09

10,8

2520

22

160

1,3

208

1,69

270,4

3520

23

90

2,3

207

5,29

476,1

2070

Итого

630

883

1684,7

13060

Решение.

Прежде всего находим самое маленькое значение возраста студентов Xmin = 17 лет и самое большое Хтах = 23 года (графа А таблицы).

Находим разницу между максимальным и минимальным значением признака и получаем величину размаха, которая составляет:

Для осуществления дальнейших вычислений показателей вариации проведем дополнительные расчеты и запишем их в имеющуюся таблицу:

  • • определяем произведение значений признака (х.) на соответствующие веса (J|) (графа 6). В итоге получаем сумму, равную 13060;
  • • рассчитаем среднюю величину по формуле средней арифметической взвешенной:

Для расчета среднего линейного отклонения находим абсолютное отклонение значений признака (хг) от средней величины (х) по модулю |xf -х| (графа 2).

Вычисляем произведения отклонений |х, -5с на их веса (/3) и подсчитываем сумму их произведений. Эта сумма равна 883 (графа 3). Делим эту сумму ( ) на сумму весов (/:), чтобы получить

искомую величину d:

Таково в среднем отклонение вариантов признака от их средней величины.

Возведем в квадрат отклонения индивидуальных значений признака от их средней х, -х и запишем результат в графу 4 таблицы.

Затем квадрат отклонений xt -х умножим на веса if) и подсчитаем сумму, которая равна 1684,7 (графа 5).

Разделим эту сумму на сумму весов чтобы получить величину дисперсии:

Извлечем корень квадратный из дисперсии и получим величину среднего квадратического отклонения:

Таким образом, каждое индивидуальное значение возраста студентов отклоняется от их средней величины на 1,63 года.

6.6.2. Дисперсия признака равна 600. Объем совокупности равен 10. Сумма квадратов индивидуальных значений признака равна 6250.

Найдите среднюю величину совокупности.

Решение.

Для нахождения средней величины воспользуемся методом отсчета от условного нуля или методом моментов:

где х2 — средняя арифметическая из квадратов индивидуальных значений признака;

(Зс) — квадрат среднего значения признака.

Тогда

Средняя величина признака:

6.6.3. Для характеристики однородности совокупности следует вычислить показатели вариации: дисперсию, среднее квадратическое отклонение, коэффициент вариации (вычисления выполнить в таблице). Расчет показателей вариации стажа работы продавцов:

Стаж работы, лет

Число продавцов If), чел.

Середина

интервала

Ы)

Отклонение варианты от средней (х,-х)

(x-xf

0-3

6

1,5

-5,0

25,0

150,0

3-6

7

4,5

-2,0

4,0

28,0

6-9

10

7,5

+1,0

1,0

10,0

9-12

5

10,5

+4,0

16,0

80,0

12-15

2

13,5

+7,0

49,0

98,0

Итого:

30

366,0

Вычисляем средний стаж работы:

Вычисляем дисперсию:

Следует иметь в виду, что дисперсия — безмерная величина и самостоятельного экономического значения не имеет. Дисперсия необходима для расчета среднего квадратического отклонения. В данном случае среднее квадратическое отклонение равно:

Среднее квадратическое отклонение показывает, что в среднем варианты отклоняются от средней арифметической (х = 6,5) на 3,5 года при колеблемости стажа работы отдельных работников от 0 до 15 лет.

Для характеристики степени колеблемости признака необходимо среднее квадратическое отклонение выразить в процентах к средней арифметической, т.е. вычислить коэффициент вариации (V):

Коэффициент вариации свидетельствует о том, что колеблемость стажа работы продавцов весьма значительна и неоднородна.

6.6.4. Определите первый и третий квартили интервального ряда по данным о содержании бракованных товаров в поступившей партии товара:

Бракованные товары (х), %

Число образцов

Накопленная частота (S)

Середина интервала (xf)

xf

А

1

2

3

4

До 14

20

20

13

260

14-16

30

50

15

450

16-18

25

75

17

425

18-20

15

90

19

285

20 и более

10

100

21

210

Итого

100

1630

Решение.

Первый и третий квартили имеющегося ряда определяем по формулам:

Следовательно, в ряду распределения по данным о бракованных товарах в поступившей партии товара в магазин первый квартиль составляет 14,3%, а третий — 18,0%, т.е. 25% товаров содержат брак, не превышающий 14,3%, а у 75% товаров брак не превышает 18%.

6.6.5. Определите 1-й и 9-й децили интервального ряда по данным о содержании влаги в поступившей в магазин партии товара:

Влажность (х), %

Число образцов

Накопленная частота (S)

Середина интервала (х')

xf

А

1

2

3

4

До 14

20

20

13

260

14-16

30

50

15

450

16-18

25

75

17

425

Влажность (х), %

Число образцов

<V

Накопленная частота (S)

Середина интервала (х')

x'f

А

1

2

3

4

18-20

15

90

19

285

20 и более

10

100

21

210

Итого

100

1630

Решение.

Первый и девятый децили данных таблицы определяем по формулам:

Таким образом, значения децилей указывают на то, что среди 10% партии товара с минимальным процентом влажности максимальный процент ее составляет 13%, а среди 10% партии товара с наибольшим процентом влажности минимальный процент ее составил 20%, т.е. в 1,54 раза больше.

6.6.6. Имеются данные о времени работы (лет) 24 рабочих в цехе завода:

Стаж рабочих в данном цехе (лет): 4; 3; 6; 4; 4; 2; 3; 5; 4; 4; 5; 2; 3; 4; 4; 5; 2; 3; 6; 5; 4; 2; 4; 3.

Требуется:

  • 1) построить дискретный ряд распределения;
  • 2) дать графическое изображение ряда;
  • 3) вычислить показатели центра распределения, показатели вариации и формы распределения.

Решение.

1. Дискретный ряд распределения стажа рабочих в цехе завода:

Время работы (х), (лет)

Число рабочих (f)

Накопленная частота (S)

2

4

4

3

5

9

4

9

18

5

4

22

6

2

24

Итого

24

2. Представим графическое изображение построенного дискретного вариационного ряда распределения рабочих по времени работы в цехе в виде полигона частот:

Полигон частот замыкается, для этого крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе (в данном случае х= 1 и х = 7).

3. К показателям центра распределения относятся: средняя арифметическая, мода и медиана.

Средняя арифметическая (х) определяется по следующей формуле:

Мода (Мо) = 4 годам (4 года встречается 9 раз, т.е. это наибольшая частота).

Для определения медианы необходимо определить номер интервала, в котором она находится:

Медиана (Me) = 4 годам (так как номера 12 и 13 соответствуют 4 годам).

К показателям вариации относятся: размах вариации (К), среднее линейное отклонение (d), дисперсия (о2), среднее квадратическое отклонение (а), коэффициент вариации (V).

Размах вариации определяем по формуле

Для определения среднего линейного отклонения и других показателей вариации построим дополнительную таблицу вычислений:

Количество отработанных лет (х)

Число рабочих

(V

н

1

н~

II

?**

14/

м

J*"

I

2

4

-1,8

7,2

12,96

3

5

-0,8

4,0

3,20

4

9

+0,2

1,8

0,36

5

4

+ 1,2

4,8

5,76

6

2

+2,2

4,4

9,68

Итого

24

22,2

31,96

Следовательно, индивидуальные значения отличаются в среднем от средней арифметической на 1,15 года, или на 30,3%.

Среднее квадратическое отклонение превышает среднее линейное отклонение (о = 1,15 > d = 0,9) в соответствии со свойствами ма- жорантности средних величин.

Значение коэффициента вариации (V= 30,3%) свидетельствует о том, что совокупность достаточно однородна.

Как видно из построенного ранее полигона вариационного ряда, распределение рабочих цеха по времени их работы в цехе несимметрично, поэтому определяется показатель асимметрии:

Следовательно, асимметрия левосторонняя, незначительная.

6.6.7. Распределение работников производственного предприятия по размеру месячной заработной платы следующее:

Месячная заработная плата, тыс. руб.

До 15,0

  • 15,0-
  • 20,0
  • 20,0-
  • 25,0
  • 25,0-
  • 30,0
  • 30,0-
  • 35,0

35,0 и более

Итого

Число работников

25

89

145

215

65

20

559

Определите коэффициент децильной дифференциации. Сформулируйте вывод.

Решение.

Определяется коэффициент децильной дифференциации:

Для этого определяем место децилей:

Для расчета значений децилей определяем интервалы, в которых они находятся, исчисляем накопленные частоты и записываем в таблицу:

Месячная заработная плата, тыс. руб.

До 15,0

15,0-20,0

20,0-25,0

25,0-30,0

30,0-35,0

35,0 и более

Число работников (нарастающим итогом)

25

114

259

474

539

559

Из таблицы видно, что первая дециль находится в интервале 15,0—20,0, девятая дециль — в интервале 30,0—35,0.

Вычислим числовые значения децилей:

Следовательно, наименьший размер месячной заработной платы 10% наиболее обеспеченных работников в 1,93 раза выше наивысшего размера месячной заработной платы 10% наименее обеспеченных работников.

6.6.8. Имеются следующие данные о возрастном составе работников предприятий потребительской кооперации N района (лет): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28, 25, 29, 26,31,24, 29,27, 32,25, 29,29.

Для анализа распределения работников предприятий потребительской кооперации по возрасту требуется:

  • 1) построить интервальный ряд распределения;
  • 2) исчислить показатели центра распределения, показатели вариации и формы распределения;
  • 3) сформулировать выводы.

Решение.

1. Величина интервала группировки определяется по формуле:

где п (количество интервалов) мы принимаем равным 7.

Полученный интервальный ряд распределения представим в таблице:

Группы работников по возрасту х, (лет)

Число рабочих/

Накопленная частота S

18-21

1

1

21-24

3

4

24-27

6

10

27-30

10

20

30-33

5

25

33-36

3

28

36-39

2

30

Итого

30

Рассчитываем показатели центра распределения (х, Mo, Me):

где х' — среднее значение признака в интервале (центр каждого интервала).

Для определения численного значения моды {Мд) по нашему интервальному ряду определим, что она находится в интервале 27— 30 лет, так как наибольшее число работников (/= 10) находится в этом интервале.

Значение моды определяется по формуле:

Для определения численного значения медианы {Me) также сначала определяем интервал, в котором она находится:

Медианным является также интервал 27—30 лет, так как в этом интервале находятся номера 15 и 16 ряда.

Для расчета показателей вариации составим вспомогательную таблицу:

Группы работников по возрасту (лет)

Центр интервала Ы), (лет)

/

*'•/

d = х'-х

|х'-3с|-/

d2

d2-f

18-21

19,5

1

19,5

-9,2

9,2

84,64

84,64

21-24

22,5

3

67,5

-6,2

18,6

38,44

115,32

24-27

25,5

6

153,0

-3,2

19,2

10,24

61,44

27-30

28,5

10

285,0

-0,2

20,0

0,04

0,40

30-33

31,5

5

157,5

2,8

14,0

7,84

39,20

33-36

34,5

3

103,5

5,8

17,4

33,64

100,92

36-39

37,5

2

75,0

8,8

17,6

77,44

154,88

Итого

30

861,0

116,0

556,80

Следовательно, вариация возраста у работников предприятий потребительской кооперации не является значительной, что подтверждает достаточную однородность совокупности.

Показатель асимметрии распределения работников по возрасту:

Следовательно, асимметрия правосторонняя, незначительная. При правосторонней асимметрии между показателями центра распределения существует соотношение

Для данного распределения это соотношение выполняется, т.е.

Для имеющегося распределения, учитывая незначительную асимметрию, определяем показатель эксцесса (островершинности):

где МА — центральный момент четвертого порядка;

а4 — среднее квадратическое отклонение в четвертой степени.

Отрицательное значение эксцесса свидетельствует о плосковер- шинности данного распределения.

6.6.9. Имеются данные, характеризующие дифференциацию потребления кофе в крайних децильных группах домохозяйств:

Потребление кофе Зд ГОД, кг

% к итогу ПО 10% ДОМОХОЗЯЙСТВ

Объем потребления за год, кг

наименее

наиболее

общий по децильной группе

обеспеченных (1-я группа) Fi

обеспеченных (10-я группа)

в среднем П

1-й: nF1

10-й: nFw

Менее 3

38

6

2

76

12

3-5

22

12

4

88

48

5-7

18

34

6

108

204

7-9

14

28

8

112

224

9 и более

8

20

10

80

200

Итого

100

100

464

688

Обследовано

домохозяйств

126

132

Определите коэффициент вариации потребления кофе и однородность домохозяйств по потреблению кофе в первой и десятой децильных группах, а также долю домохозяйств, потребляющих кофе от 3 до 7 кг в год по группам обеспеченности.

Решение.

1. Вычислим показатели потребления по каждой децильной группе хозяйств.

Средний уровень потребления кофе в домохозяйстве:

• в первой децильной группе:

• в десятой децильной группе:

Дисперсия потребления и среднее квадратическое отклонение:

• в первой децильной группе:

• в десятой децильной группе:

Коэффициент вариации потребления кофе по децильным группам:

• в первой децильной группе:

т.е. вариация потребления кофе в первой децильной группе домохозяйств (наименее обеспеченных) выше умеренной. И по потреблению кофе домохозяйства неоднородны (Vx> 0,33).

• в десятой децильной группе:

т.е. вариация потребления кофе в десятой децильной группе домохозяйств слабая, а потребители однородны.

Доля домохозяйств, потребляющих кофе от 3 до 7 кг в год:

  • • в первой децильной группе: Wl = 22 +18 = 40%;
  • • в десятой децильной группе: IVю = 12 + 34 = 46%.

КОНТРОЛЬНЫЕ ВОПРОСЫ

  • 1. Понятие общей и систематической вариации.
  • 2. Виды показателей вариации и для каких целей они применяются.
  • 3. Абсолютные показатели вариации и их исчисление.
  • 4. Среднее квадратическое отклонение и порядок его исчисления.
  • 5. Среднее квартильное отклонение и порядок его исчисления.
  • 6. Виды относительных показателей вариации.
  • 7. Коэффициент вариации — цели применения и как рассчитывается.
  • 8. Моменты в рядах распределения.
  • 9. Начальный момент распределения и его порядок.
  • 10. Центральный момент распределения и определение его порядка.
  • 11. Ранговые показатели вариации: квартили, децили, процентили.
  • 12. Средняя, мода и медиана в оценке асимметрии распределения.
  • 13. Определение коэффициента асимметрии.
  • 14. Показатель эксцесса распределения и определение его ошибок.
  • 15. Понятие нормального, правостороннего и левостороннего распределения.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>