Точечные оценки истинного значения и среднеквадратического отклонения

Мы подошли к решению вопроса о том, как на основании полученной в эксперименте группы результатов наблюдений оценить истинное значение, т.е. найти результат измерений, как оценить его точность, т.е. меру его приближения к истинному значению.

Эта задача является частным случаем статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выборки - ряда значений, принимаемых этой величиной в n независимых опытах. Оцениваемыми параметрами являются математическое ожидание и среднеквадратическое отклонение, поскольку только они входят в выражение для дифференциальных функций всех трех рассмотренных выше распределений. В уравнениях (25) и (30) для нормального распределения и распределения Лапласа эти параметры входят явно, а в уравнения (23) и (24) для равномерного распределения - не явно, поскольку

Оценку

параметра а назовем точечной, если она выражается одним числом. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зави-сящим от распределения исходной случайной величины, в том числе от самого оцениваемого параметра и от числа опытов n.

К точечным оценкам предъявляется ряд требований, определяющих их пригодность для описания самих параметров.

1. Оценка называется состоятельной, если при увеличении числа наблюдений она приближается (сходится по вероятности) к значению оцениваемого параметра.

2. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемому параметру.

3. Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра.

На практике не всегда удается удовлетворить одновременно все эти требования, однако выбору оценки должен предшествовать ее критический анализ со всех перечисленных выше точек зрения.

Существует несколько методов определения оценок. Наиболее распространен метод максимального правдоподобия, теоретически обоснованный математиком Р. Фишером. Идея метода заключается в следующем. Вся получаемая в результате многократных наблюдений информация об истинном значении измеряемой величины и рассеивании результатов сосредоточена в ряде наблюдений

, где n - число наблюдений. Их можно рассматривать как n независимых случайных величин с одной и той же дифференциальной функцией распределения

. Вероятность

получения в эксперименте некоторого результата

, лежащего в интервале

, где

- некоторая малая величина, равна соответствующему элементу вероятности

Независимость результатов наблюдений позволяет найти априорную вероятность появления одновременно всех экспериментальных данных, т.е. всего ряда наблюдений

как произведение этих вероятностей:

Если рассматривать Q и

как неизвестные параметры распределения, то, подставляя различные значения Q и

в эту формулу, мы будем получать различные значения вероятности

при каждом фиксированном ряде наблюдений

. При некоторых значениях

вероятность получения экспериментальных данных

достигает наибольшего значения. В соответствии с методом максимального правдоподобия именно эти значения и принимаются в качестве точечных оценок истинного значения и среднеквадратического отклонения результатов наблюдений.

Таким образом, метод максимального правдоподобия сводится к отысканию таких оценок

, при которых функция правдо-подобия

достигает наибольшего значения. Постоянный сомножитель

не оказывает влияния на решение и поэтому может быть отброшен. Полученные оценки

истинного значения и среднеквадратического отклонения называются о ценками максимального правдоподобия.

Для упрощения вычислений иногда бывает удобнее пользоваться логарифмической функцией правдоподобия

Если наибольшее значение функции правдоподобия совпадает с максимальным значением, то оценки получаются из системы уравнений

В противном случае необходимо более подробное исследование функции правдоподобия.

Далее определим оценки максимального правдоподобия для трех распределений случайных погрешностей, представленных в предыдущей главе.

1. Результаты наблюдений распределены нормально. В этом случае

a логарифмическая функция правдоподобия в соответствии с (32)

Из первого уравнения получаем выражение для оценки истинного значения

, а из второго - оценку среднеквадратического отклонения

Таким образом, при нормальном распределении случайных погрешностей оценкой максимального правдоподобия для истинного значения является среднее арифметическое из результатов отдельных наблюдений, а оценкой дисперсии - среднее из квадратов отклонений результатов наблюдений от среднего арифметического.

2. Результаты наблюдений распределены по закону Лапласа

Логарифмическая функция правдоподобия не является дифференцируемой по Q, поэтому приходится прибегать к численным методам, функция правдоподобия достигает наибольшего значения, когда выражение

принимает наименьшее значение. Поэтому задача об отыскании оценки ис-тинного значения сводится к определению такого значения

, сумма модулей отклонений результатов наблюдений от которого является наименьшей. Задача решается методом последовательных приближений, причем в качестве первого приближения можно принять среднее арифметическое из полученных результатов.

3. В условиях равномерного распределения погрешностей

Решение задачи нахождения оценки максимального правдоподобия для равномерного распределения погрешностей проводим численными методами, в результате чего получаем:

Основное достоинство оценок максимального правдоподобия в том, что они являются асимптотически (при

) несмещенными; асимптотически эффективными и асимптотически нормально распределенными.

Если

- оценка максимального правдоподобия для параметра а, то при достаточно большом числе n наблюдений (практически уже при n >20-25) эту оценку можно считать нормально распределенной с математическим ожиданием

и дисперсией

при любом распределении результатов наблюдений.

Для наиболее часто встречающегося на практике нормального распределения случайных погрешностей оценки максимального правдоподобия имеются особые обозначения.

Оценкой истинного значения является среднее арифметическое

из результатов отдельных наблюдений

Вторая производная от логарифмической функции преобразования равна

, поэтому дисперсия среднего арифметического в n раз меньше дисперсии

результатов наблюдений, т. е.

Оценка дисперсии результатов наблюдений при малом n является немного смещенной, поэтому точечную оценку дисперсии принято определять как

а оценку среднеквадратического отклонения результатов наблюдений как

Дисперсия оценки

среднеквадратического отклонения составляет

Последнее соотношение показывает, что относительная погрешность определения среднеквадратического отклонения (в %) по результатам обработки ряда наблюдений достаточно велика:

и даже при

достигает 10%. Для надежного суждения о точности эту погрешность следует увеличить еще минимум в два раза.

С помощью полученных оценок итог измерений можно записать в виде

что уже позволяет сделать некоторые выводы относительно точности проведенных измерений.

Наряду с методом максимального правдоподобия при определении точечных оценок широко используется метод наименьших квадратов. В соответствии с этим методом среди некоторого класса оценок выбирают ту, которая обладает наименьшей дисперсией, т. е. наиболее эффективную оценку. Легко заметить, что среди всех линейных оценок истинного значения вида

, где

- некоторые постоянные, именно среднее арифметическое

обращает в минимум дисперсию

. Поэтому для случая нормально распределенных случайных погрешностей оценки, получаемые методом наименьших квадратов, совпадают с оценками максимального правдоподобия.

Смысл оценки параметров с помощью интервалов заключается в нахождении интервалов, называемых доверительными, между границами которых с определенными вероятностями (доверительными) находятся истинные значения оцениваемых параметров.

Вначале остановимся на определении доверительного интервала для среднего арифметического значения измеряемой величины. Предположим, что распределение результатов наблюдений нормально и известна дисперсия

. Найдем вероятность попадания результата наблюдений в интервал

. Согласно формуле (29)

и, если систематические погрешности исключены

Это означает, что истинное значение Q измеряемой величины с доверительной вероятностью

находится между границами доверительного интервала

Половина длины доверительного интервала

называется доверительной границей случайного отклонения результатов наблюдений, соответствующей доверительной вероятности Р. Для определения доверительной границы (при выполнении перечисленных условий) задаются доверительной вероятностью, например Р =0.95 или Р =0.995 и по формулам

определяют соответствующее значение

интегральной функции нормированного нормального распределения. Затем по данным табл.П.3 приложения находят значение коэффициента

и вычисляют доверительное отклонение

. Проведение многократных наблюдений позволяет значительно сократить доверительный интервал. Действительно, если результаты наблюдений

(i =l, 2,..., n) распределены нормально, то нормально распределены и величины

, а значит, и среднее арифметическое

, являющееся их суммой. Поэтому имеет место равенство

где

определяется по заданной доверительной вероятности Р.

Полученный доверительный интервал, построенный с помощью среднего арифметического результатов n независимых повторных наблюдений, в

раз короче интервала, вычисленного по результату одного наблюдения, хотя доверительная вероятность для них одинакова. Это говорит о том, что сходимость измерений растет пропорционально корню квадратному из числа наблюдений.

Половина длины нового доверительного интервала

называется доверительной границей погрешности результата измерений, а итог измерений записывается в виде

Теперь рассмотрим случай, когда распределение результатов наблюдений нормально, но их дисперсия неизвестна. В этих условиях пользуются отношением

называемым дробью Стьюдента. Входящие в нее величины

вычисляют на основании опытных данных; они представляют собой точечные оценки математического ожидания и среднеквадратического отклонения результатов наблюдений.

Плотность распределения этой дроби, впервые предсказанного Госсетом, писавшим под псевдонимом Стьюдент, выражается следующим уравнением:

где S (t, k) - плотность распределения Стьюдента. Величина k называется числом степеней свободы и равна n - 1. Вероятность того, что дробь Стьюдента в результате выполненных наблюдений примет некоторое значение в интервале

, согласно выражению (8), вычисляется по формуле

или, поскольку S (t, k) является четной функцией аргумента t,

Подставив вместо дроби Стьюдента t ее выражение через

, получим окончательно

Величины

, вычисленные по формулам (40) и (41), были табулированы Фишером для различных значений доверительной вероятности Р в пределах 0.10 - 0.99 при

В табл.П.5 приведены значения

для наиболее часто употребляемых доверительных вероятностей Р.

Таким образом, с помощью распределения Стьюдента по формуле (41) может быть найдена вероятность того, что отклонение среднего арифметического от истинного значения измеряемой величины не превышает

, например

и т.д. Итог измерений записывается в виде

Пример. По результатам пяти наблюдений была найдена длина стержня. Итог измерений составляет L =15.785 мм,

=0.005 мм, причем существуют достаточно обоснованные предположения о том, что распределение результатов наблюдений было нормальным. Требуется оценить вероятность того, что истинное значение длины стержня отличается от среднего арифметического из пяти наблюдений не больше чем на 0.01 мм.

Из условия задачи следует, что имеются все основания для применения распределения Стьюдента.

.
По данным табл.П.4 приложения находим значение доверительной вероятности для

т.е несколько меньше 0.9973, как при нормальном распределении. Итог измерений удобно записать в виде

Для

=1 доверительная вероятность составляет приблизительно 0.62, поэтому итог измерений можно представить также в виде

Пример. В условиях предыдущей задачи найти доверительную границу погрешности результата измерений для доверительной вероятности

. По данным табл.П.5 при

находим

и, следовательно, доверительная граница:

При

, а практически уже при

распределение Стьюдента переходит в нормальное распределение и

где

- интегральная функции нормированного нормального распределения.

В тех случаях, когда распределение случайных погрешностей не является нормальным, все же часто пользуются распределением Стьюдента с приближением, степень которого остается неизвестной.

Кроме того, на основании центральной предельной теоремы теории вероятностей можно утверждать, что при достаточно большом числе наблюдений распределение среднего арифметического как суммы случайных величин

будет сколь угодно близким к нормальному. Тогда, заменяя дисперсию

ее точечной оцен-кой [см.п.4.4. Нормальное распределение], можно для оценки доверительной гра-ницы погрешности результата воспользоваться равенством (35). Число наблюдений n, при котором это становится возможным, зависит, конечно, от распределения случайных погрешностей.

Соотношения (38) показывают, что итог измерения не есть одно определенное число. В результате измерений мы получаем лишь полосу значений измеряемой величины. Смысл итога измерений, например, L =20.00±0.05 заключается не в том, что L = 20.00, как для простоты счи-тают, а в том, что истинное значение лежит где-то в границах от 19.95 до 20.05. К тому же нахождение внутри границ имеет некоторую вероятность, меньшую, чем единица, и, следовательно, нахождение вне границ не исключено, хотя и может быть очень маловероятным.

Теперь найдем доверительные интервалы для дисперсии и среднеквадратического отклонения результатов наблюдений.

Если распределение результатов наблюдений нормально, то отношение

имеет так называемое

-распределение Пирсона с

степенями свободы. Его дифференциальная функция распределения описывается формулой

Кривые плотности

-распределения при различных значениях k, вычисленные по формуле (44), представлены на рис.9.

Значения

, соответствующие различным вероятностям Р того, что отношение (43) в данном опыте будет меньше

, представлены в табл.П.6 приложения для различных вероятностей Р и чисел k степеней свободы.

Пользуясь этой таблицей, можно найти доверительный интервал для оценки дисперсии результатов наблюдений при заданной доверительной вероятности. Этот интервал строится таким образом, чтобы вероятность выхода дисперсии за его границы не превышала некоторой малой величины q, причем вероятности выхода за обе границы интервала были бы равны между собой и составляли соответственно q /2 (рис.10).

Границы

такого доверительного интервала находят из равенства

Теперь, зная границы доверительного интервала для отношения

, запишем доверительный интервал для дисперсии:

Полученное равенство означает, что с вероятностью

истинное значение

среднеквадратического отклонения результатов наблюдений лежит в интервале (

], границы которого равны

Пример. Даны результаты двадцати измерений длины

мм детали (табл.3).

В качестве оценки математического ожидания длины детали принимаем ее среднее арифметическое

Точечная оценка среднеквадратического отклонения результатов наблюдений составляет:

Приняв уровень доверительной вероятности

, находим для числа степеней свободы

в табл.П.6 приложения:

Границы доверительного интервала для среднеквадратического отклонения результатов наблюдений находим по формуле (47):

Полученные результаты говорят о том, что истинное значение среднеквадратического отклонения результатов наблюдений с вероятностью 0.90 лежит в интервале 0.0020 - 0.0034 мм.

В табл.П.6 приведены значения

только при числах степеней свободы от 1 до 30. При k >30 можно пользоваться приближенной формулой

где

определяется из условия

по табл.П.3, в которой помещены значения интегральной функции нормированного нормального распределения.

Тогда границы доверительного интервала для среднеквадратического отклонения результатов наблюдений при доверительной вероятности

вычисляются по формулам (47) при значениях

, равных

Так, если в условиях предыдущей задачи среднеквадратическое отклонение определено на основании

измерений, то для

из табл.П.3 находим:

Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...

Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: