Исследование выборочной дисперсии на несмещенность.

Применим условие несмещённости оценивающей функции (193) ко второму варианту записи выборочной дисперсии (176).

Дано: x1, x2,…, xn – простая выборка из генеральной совокупности X; математическое ожидание каждого элемента выборки равно единому математическому ожиданию генеральной совокупности по принципу статистической копии:E(xi) = E(X), и, естественно, = E(X2); = s2 > 0 – следствие равноточности измерений; s2 = ( ) / n–– второй вариант формулы (176) для выборочной дисперсии.

Определить: E(s2) = s2 – ?

Решение: Найдем математическое ожидание правой части оценивающей функции для выборочной дисперсии:

E(s2) = E(( ) / n– ) = ( ) / n– = (n∙ – =

= – = s2 + – s2 / n – = s2 (1 – 1 / n) ≠ s2.

Таким образом, выборочная дисперсия s2 является смещённой (искажённой) оценкой генеральной дисперсии. Для устранения искажения достаточно умножить выборочную дисперсию на величину, обратную искажению:

s2∙n / (n – 1) = m2 = ( ) / (n – 1). # (214)

Естественно, что теперь E(m2) = s2, т.е. m2 – несмещённая (не искажённая) оценка генеральной дисперсии. Величина m в геодезии, астрономии и смежных науках называется средней квадратической погрешностью (СКП), а формула (215) носит имя Бесселя, впервые получившего её:

m= , (215)

где [v2] = + +…+ , а vi = - xi.

Переход от величины m2 к СКП m по формуле (215) – операция нелинейная, что приводит к смещению m относительно стандарта s, т.е. E(m) ≠ s. С доказательством можно ознакомиться в [17] или [18]. Операция извлечения квадратного корня слабо искажает значения, близкие к единице. В связи с этим, на практике рекомендуется выражать НК-поправки vi = - xi в таком масштабе измерений, чтобы подкоренная дробь [v2] / (n – 1)мало отличалась от единицы.

3.2.3 Интервальные оценки.

Точечные оценки, рассмотренные в предыдущих параграфах, характеризуются нулевой вероятностью своего появления, оставаясь возможными событиями. Этот теоретический «недостаток» точечных оценок легко устраняется путем введения интервальных оценок.

Интервальная оценка параметра а представляет собой доверительный интервал (ДИ), определяемый двумя числами aH и aB: Ig = ]aH; aB[. Его нижняя (aH) и верхняя (aB) доверительные границы определяются с использованием точечной оценки ãи числового значения доверительной вероятности g или уровня значимости a = 1 – γ, назначаемым заранее.

Предполагается, что закон распределения оценивающей функции ã известен, например, в форме функции распределения F(a) = P(Ã

aH = ã – εH и aB = ã + εB, (216)

то одинаковая доверительная вероятность g будет соответствовать двум следующим равновероятным событиям:

1) известная точечная оценка ã попадает с вероятностью g в доверительный интервал Ig, построенный относительно неизвестного положения параметра а:

g = P(a – εH < ã < a + εB) = 1 – a. (217)

2) доверительный интервал Ig, построенный относительно известной точечной оценки ã, накрывает неизвестный параметр а с вероятностью g:

g = P(ã – εH< a < ã + εB) = P(aH < a < aB) = 1 – a. (218)

Вероятность именно второго события (218) представляет интерес как с практической, так и с теоретической точек зрения.

Последнее выражение (218) иллюстрируется на графике функции распределения (рис. 3.3):

ã
F(x)
1.0
Ã
0.5
F(aH)
aH
F(aВ)
P(aН
a

Рис. 3.3 Доверительный интервал.

(Положение параметра a остается неизвестным!)

Доверительный интервал может иметь одну границу конечной, а другую – открытой на бесконечность. В таком случае он называется односторонним, в отличие от обычного – двухстороннего.

Перейдем к построению границ доверительного интервала, основываясь на его аналитическом определении (218).

Дано: F(a) = P(Ã

g или a = (1 - g) – доверительная вероятность или уровень значимости.

Найти: нижнюю aн и верхнюю aв границы доверительного интервала Ig.

Решение: Однозначное решение задачи возможно лишь при дополнительных ограничениях, т.к. выражение (218) содержит два неизвестных: aни aв. Обычно, используются следующие ограничения:



1) фиксированная граница (нижняя либо верхняя);

2) равновероятность того, что накрываемый параметр окажется левее или правее границ доверительного интервала.

Односторонний интервал является частным случаем двухстороннего, в связи с чем, получим сначала общее решение, опираясь на уравнение (218):

P(aн< a < aв) = g = 1 – a = F(aв) – F(aн).

1. Зафиксировав сначала нижнюю границу aн, а затем верхнюю aв, выразим их друг через друга, что и даст нам искомое общее решение:

aв = arg(F =F(aн) + g), (219)

aн = arg(F =F(aв) – g). (220)

Для одностороннего доверительного интервала, у которого нижняя граница открыта на бесконечность, получим:

aн → – ∞, т.е. F(aн) = 0

, (221)

aв = arg(F = g) = arg(F = 1 – a)

а для интервала, у которого верхняя граница бесконечно удалена:

aв→ + ∞, т.е. F(aв) = 1

. (222)

aн = arg(F = 1 – g) = arg(F = a)

2. Симметричный доверительный интервал строится, исходя из равновероятности того, что накрываемый параметр окажется слева или справа за его пределами, т.е.

F(aн) =1–F(aв) =a /2=(1–g)/2,

откуда:

aн = arg(F = (1 – g) / 2) = arg(F = a / 2)

. # (223)

aв = arg(F = (1 + g) / 2) = arg(F = 1 – a / 2)


4790382047387630.html
4790425326626685.html
    PR.RU™