Полная версия

Главная arrow Логика

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Расчет средней квадратичной и средней арифметической погрешности. Надежность измерения и доверительный интервал

Для оценки величины случайной погрешности измерения существует несколько способов. Наиболее распространена оценка с помощью стандартной или средней квадратичной погрешности (ее часто называют сокращенно стандартом измерений). Средней квадратичной погрешностью называется величина

Если число наблюдений очень велико, то подверженная случайным колебаниям величина Sx стремится к некоторому постоянному значению о,

которое можно назвать статистическим пределом Sx: a = Hm5,;c

П-> оо

Собственно говоря, именно этот предел и называется средней квадратичной погрешностью. Квадрат этой величины называется дисперсией измерений - о2. Это та же величина, которая входит в формулу Гаусса. В действительности, однако, всегда вычисляют не величину а, а ее приближенное значение Sx, которое тем ближе к а, чем больше п.

Наряду со среднеквадратичной погрешностью иногда пользуются средней арифметической погрешностью:

При достаточно большом числе наблюдений (практически при А^> 30) между Sx и Rx существуют простые соотношения:

В большинстве случаев целесообразнее пользоваться величиной Sx, а не Rx. В первую очередь потому, что, пользуясь стандартной погрешностью Sx, легче определять доверительные вероятности, так как для этого имеются специальные таблицы. При малом п следует всегда пользоваться стандартной квадратичной погрешностью.

Для уменьшения влияния случайных ошибок измерение любой величины производят несколько раз. В результате получают ряд значений величины х: хь х2, х3,..., х„.

Этот ряд значений величины х получил название выборки. Для оценки результата измерений рассчитывается среднее значение выборки - х, которое может отклоняться от истинного значения измеряемой величины: ц = х ± Ах.

Пусть р означает вероятность того, что результат измерений отличается от истинного значения на величину не большую чем Ах. Это принято записывать в виде

Вероятность р носит название доверительной вероятности, или коэффициента надежности. Интервал значений от ц - Ах до ц + Ах называется доверительным интервалом, т. е. с вероятностью, равной р, результат измерений не выходит за пределы доверительного интервала от х- Ах до х + Ах. Разумеется, чем большей надежности мы требуем, тем большим получается соответствующий доверительный интервал и, наоборот, чем больший доверительный интервал задают, тем вероятнее, что результаты измерений не выйдут за его пределы.

Что такое статистическая значимость (р-уровень)? Статистическая значимость результата представляет собой оцененную меру уверенности в его «истинности» (в смысле «репрезентативности выборки»); р-уровень - это показатель, находящийся в убывающей зависимости от надежности результата. Более высокий /7-уровень соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. Именно /7-уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Например, /7-уровень = 0,05 (т. е. 1/20) показывает, что имеется 5 %-ная вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Иными словами, если данная зависимость в популяции отсутствует, а вы многократно проводили бы подобные эксперименты, то примерно в одном из двадцати повторений эксперимента можно было бы ожидать такой же или более сильной зависимости между переменными. Отметим, что это не то же самое, что утверждать заведомо о наличии зависимости между переменными, которая в среднем может быть воспроизведена в 5 % или 95 % случаев. Когда между переменными популяции существует зависимость, вероятность повторения результатов исследования, показывающих наличие этой зависимости, называется статистической мощностью плана. Во многих исследованиях /7-уровень 0,05 рассматривается как «приемлемая граница» уровня ошибки.

Как определить, является ли результат действительно значимым. Не существует никакого способа избежать произвола при принятии решения о том, какой уровень значимости следует действительно считать «значимым». Выбор определенного уровня значимости, выше которого результаты отвергаются как ложные, является достаточно произвольным.

На практике окончательное решение обычно зависит от того, был ли результат предсказан априори (т. е. до проведения опыта) или обнаружен апостериорно в результате многих анализов и сравнений, выполненных со множеством данных, а также на традиции, имеющейся в данной области исследований. Обычно во многих областях результат р < 0,05 является приемлемой границей статистической значимости, однако следует помнить, что этот уровень все еще включает довольно большую вероятность ошибки (5 %). Результаты, значимые на уровне р < 0,01, обычно рассматриваются как статистически значимые, а результаты с уровнем р < 0,005 или р < 0,001 как высоко значимые. Однако следует понимать, что данная классификация уровней значимости достаточно произвольна и является всего лишь неформальным соглашением, принятым на основе практического опыта в той или иной области исследования.

Для характеристики величины случайной ошибки необходимо задать два числа, а именно величину самой ошибки (или доверительного интервала) и величину доверительной вероятности. Указание одной только величины ошибки без указания соответствующей ей доверительной вероятности в значительной мере лишено смысла, так как при этом мы не знаем, сколь надежны наши данные.

Знание доверительной вероятности позволяет оценить степень надежности полученного результата. Например, измеряя длину некоторого отрезка, окончательный результат записывают в виде

Это означает, что из 100 шансов 95 за то, что истинное значение длины отрезка заключается в интервале от 8,32 до 8,36 мм.

Необходимая степень надежности задается характером производимых измерений. Естественно, что в этом отношении к деталям мотора самолета предъявляются более жесткие требования, чем к лодочному мотору, а к последнему значительно большие, чем, скажем, к ручной тачке.

Более высокая степень надежности, требуемая при ответственных измерениях, означает, что при их производстве нужно выбирать большой (в долях а) доверительный интервал. Иначе говоря, для получения той же величины ошибки (Дх) следует производить измерения с большей точностью, т. е. нужно тем или иным способом уменьшить в соответствующее число раз величину а. Одна из возможностей такого увеличения состоит в многократном повторении измерений.

При обычных измерениях можно ограничиться доверительной вероятностью 0,9 или 0,95. Для измерений, по условиям которых требуется чрезвычайно высокая степень надежности, иногда задают доверительную вероятность 0,999. Большая величина доверительной вероятности в подавляющем большинстве измерительных задач не требуется.

При проведении небольшой серии параллельных прямых измерений задача заключается в том, чтобы, имея выборку, найти оценку результата измерений х, его ошибку Ах с надежностью а.

Для расчета абсолютной ошибки при малом количестве измерений вводится специальный коэффициент, зависящий от надежности а и числа измерений п, называемый коэффициентом Стьюдента t (a, f) с числом степеней свободы /, равным п- 1. Распределение коэффициента Стьюдента при числе измерений п —> со переходит в распределение Гаусса, а при малом числе отличается от него. Коэффициенты Стьюдента приведены в табл. 7.1.

Таблица 7.1

Квантили распределения Стьюдента (^-критерий)

Число степеней свободы, /

Доверительная вероятность, р

0,80 | 0,90 | 0,95 | 0,98 | 0,99 | 0,995 | 0,999

Уровни значимости,а

0,20

0,10

0,05

0,02

0,01

0,005

0,001

1

3,08

6,31

12,71

31,82

63,66

127,32

636,58

2

1,89

2,92

4,30

6,96

9,92

14,09

31,60

3

1,64

2,35

3,18

4,54

5,84

7,45

12,92

4

1,53

2,13

2,78

3,75

4,60

5,60

8,61

5

1,48

2,02

2,57

3,36

4,03

4,77

6,87

6

1,44

1,94

2,45

3,14

3,71

4,32

5,96

7

1,41

1,89

2,36

3,00

3,50

4,03

5,41

8

1,40

1,86

2,31

2,90

3,36

3,83

5,04

9

1,38

1,83

2,26

2,82

3,25

3,69

4,78

10

1,37

1,81

2,23

2,76

3,17

3,58

4,59

Величина среднеквадратичной ошибки позволяет вычислить вероятность попадания истинного значения измеряемой величины в любой интервал вблизи среднего арифметического:

где Ах - абсолютная ошибка для данной доверительной вероятности; S- - среднеквадратичная ошибка среднего арифметического.

При п —> оо S- —> 0, т. е. интервал, в котором с заданной вероятностью находится истинное значение, стремится к нулю с увеличением числа измерений.

Для большинства простых измерений нормальный закон распределения случайных ошибок (закон Гаусса) выполняется достаточно хорошо. В этом случае порядок расчета случайных погрешностей можно принять следующим.

  • 1. Проводятся измерения заданной физической величины п раз в одинаковых условиях.
  • 2. Вычисляется среднее арифметическое значение х измеряемой величины.
  • 5. Определяется средняя квадратичная ошибка (называемая также средним квадратичным отклонением) среднего арифметического.
  • 6. Задается значение доверительной вероятности р = 1 - а.
  • 7. По выбранной доверительной вероятности р и числу проведенных измерений п определяется коэффициент Стьюдента -1(а, п - 1).
  • 8. Рассчитывается доверительный интервал Ах.
  • 9. Записывается окончательный результат в виде х = х- А*.
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>