|
ИНФОРМАТИКА, МЕДИЦИНСКАЯ ИНФОРМАТИКА И СТАТИСТИКАСтр 1 из 8Следующая ⇒ ИНФОРМАТИКА, МЕДИЦИНСКАЯ ИНФОРМАТИКА И СТАТИСТИКА
Направление подготовки - 060105 Медико-профилактическое дело Квалификация (степень) выпускника – специалист (врач) Форма обучения – очная, курс I, семестр I, II
РЯЗАНЬ Лекция 1 Теоретико-множественный подход к определению вероятности события Подход к нахождению вероятности, реализуемый в формуле (1.1)непосредственного подсчета вероятности можно использовать и тогда, когда множество равновозможных событий несчетно и интерпретируется как множество всех точек определенной области размера Sn, а множество событий, благоприятствующих событию А, интерпретируется определенной подобластью размера Sm; тогда (1.2) Поскольку данная формула предусматривает определение геометрических размеров (длин, площадей, объемов) областей, то вычислительную на ее основе вероятность часто называет еще геометрической. Для решения задач с помощью данного подходя необходимо: - уяснить существо и при необходимости дать словесную формулировку случайного события А, вероятность которого требуется нейти; - построить область, точки которой интерпретируют все равновозможные события из определенной полной группы и найти ее размер – Sn; - построить подобласть, все точки которой интерпретируют равновозможные события из определенной полной группы и благоприятствуют событию А; найти ее размер Sm; - вычислитьотношение . В условиях ряда задач на эту тему могут отсутствовать явные указания на равновозможность событий, тогда следует принять обоснованные допущения. Пример 1.4. На отрезке единичной длины наугад и независимо друг от друга выбираются две точки. Какова вероятность, что расстояние между этими точками будет не менее 1/3? Решение. Обозначим: А - событие, заключающееся в том, что расстояние между выбранными точками не менее 1/3. Термин “наугад”, фигурирующий в условии, означает, что положение каждой точки равновозможно на отрезке единичной длины. Так как исход опыта характеризуется расположением двух точек, то естественно множество всех возможных исходов (событий), образующих полную группу, интерпретировать как множество точек "единичного" квадрата в системе t1 ° t2 (рис.1.1). Равновозможность выбора 1-ой точки на отрезке [0,l] оси оt1 и равновозможность выбора 2-ой точки на отрезке [0,1] оси оt2 обеспечивают равновозможность всех исходов опыта, интерпретируемых точками единичного квадрата. Размер (площадь) области всех равновозможных событие Sn = 1 × 1 = 1. Равновозможные события, благоприятствующие А, интерпретируются точками квадрата, для которых удовлетворяется условие , т.е. отстоящими от диагонали по каждой из осей более чем на 1/3 (заштриховано на рис. 1.1). Площадь области благоприятных событий При теоретико-множественном подходе к определению вероятностей событий следует для упрощения вычислений использовать свойства теории множеств. Приведем некоторые из них, наиболее распространенные при такого рода вычислениях. Обозначим: W - множество всех исходов опыта; А, В - подмножества W, Æ - пустое множество. (1.3) (1.4) (1.5) (1.6) (1.7) (1.8)
Свойства частот При любом числе n - большом или малой справедливы следующие соотношения. 1. Правило сложения частот для несовместимых событий. С = А + В; (1.18) 2. Правило умножения частот для двух событий. D = AB; или Полученные формулы (1.19) или (1.20) имеют очень большое значение. Они показывают, что от одновременного появления двух событий А и В можно перейти к последовательности появления событий: вначале, например, наступает А, а затем - В, при условии, что событие А произошло. Таким образом, с помощью формул осуществляется переход к методу последовательных испытаний. Метод прост, нагляден, позволяет более осмысленно решать сложные вероятностные задачи. Правило умножения вероятностей легко обобщается на случай произвольного числа событий (1.21) т.е. вероятность произведения нескольких событий равна произведение вероятностей этих событий, причем вероятность каждого последующего события вычисляется при условии, что все предыдущие имели место. Для независимых событий формула (1.21) перепишется в виде (1.22) Следует подчеркнуть, что, если имеется несколько событий А1, А2,…, An, то их попарная независимость еще не означает их независимости в совокупности. Пример 1.6. В урне 7 шаров: 4 белых и 3 черных. Из нее вынимаются (одновременно или последовательно) два шара. Найти вероятность того, что оба они будут белыми. Интересующее событие А = два белых шара. Решение. Рассмотрим следующие два события: первое - вынимание первого шара, второе - вынимание второго шара, при условии, что первый шар вынут из урны. Исходы этих испытаний обозначим d (вынут белый шар) и i (вынут черный шар). Соответствующее пространство исходов W изображено на рис.1.3.
Используя формулы (1.9) и (1.19), (1.20), получаем
Таким образом, для подсчета вероятностей при проведении экспериментальных исследований основными являются теоретико-множественный и частотный методы. В связи с этим рассмотрим алгоритм подсчета вероятности попадания точки в выпуклую область. Любую невыпуклую область можно представить в виде совокупности выпуклых областей. Например, задана невыпуклая область D (рис.1.4). Эту область можно дополнить до выпуклой добавлением следующей области F, которая является выпуклой. Совокупную область назовем G. Тогда задача сведется к нахождению вероятности попадания в область G и непопадания в область F.Возможен другой подход-разбиение исходной области на выпуклые подмножества.
Рис.1.4. Представление невыпуклой области совокупностью выпуклых областей
Наиболее простым и удобным для практики в описании выпуклых множеств является задание системой линейных неравенств.
Литература 1.Компьютерные технологии адаптивной обработки данных,часть1:Лабораторный практикум / РГМУ: сост. Булаев М.П., Дорошина Н.В., Кабанов А.Н. Рязань, 2002, 27 с. 2.Элементы теории вероятностей: Практикум, Б131 /Авт.-сост. М.П.Булаев, Е.В. Прохорова; под ред. М.П. Булаева; Ряз. гос. мед. ун-т им. акад И.П.Павлова. - Рязань: РИО РГМУ, 2006. – 93 с.
ЛЕКЦИЯ 2 Блок 1 Производится выбор первых (N + 1) граничных точек из массива всех граничных точек Блок 2 Процедура построения гиперплоскости через заданные N граничных точек занимает центральное место в данном алгоритме. Коэффициенты гиперплоскости (неравенства) определяются в результате решения системы линейных алгебраических уравнений (N + 1) -го порядка. Систему получают в результате составления уравнений гиперплоскостей, записав вместо переменных координаты N точек, через которые необходимо провести гиперплоскость: . (3) Так как количество неизвестных коэффициентов (N + I), то необходимо одному из них задать произвольное значение, например a = 1, Однако в этом случае невозможно построить гиперплоскости, параллельную оси координат X. Аналогично, если присвоить значение другому коэффициенту b = 1 уравнений (3), то предлагаемый подход будет неприменим для построения гиперплоскостей, параллельных соответствующим осям координат, а при задании k ¹ 0 - для построения гиперплоскостей, проходящих через начало координат. С целью устранения второго недостатка вводятся (N + 1) -я переменная z и дополнительная точка (точка 4 на рис.4). Тогда построение гиперплоскости осуществляется в (N + 1) -м пространстве, а произвольное значение присваивается коэффициенту при переменной z. Координаты дополнительной точки (точка 4) необходимо выбирать такими, чтобы ни одна из гиперплоскостей не была параллельна оси координат (N + 1) -й переменной z. Это требование выполняется, если значение хотя бы одной из координат дополнительной точки (не считая координаты по оси z) меньше минимального или больше максимального значения соответствующей координаты множества граничных точек. Значения остальных координат задаются произвольно. В результате решения (N + 1) -го порядка (3) определяются значения коэффициентов (N + 1) -й гиперплоскости. Исключение из уравнений гиперплоскостей дополнительной переменной позволяет получить область в N -мерном пространстве (заштрихованная область на рис.4).
Блоки 3, 4 Производится проверка - первые ли (N + 1) гиперплоскостей построены. Если первые, то осуществляется поиск генеральной гиперплоскости. В противном случае выполняется проверка - все ли генеральные гиперплоскости найдены и использованы при построении гиперплоскостей для данной граничной точки.
Блоки 5, 6 После построения всех гиперплоскостей для данной граничной точки внутри области работоспособности оказываются генеральная гиперплоскость и одна или несколько пар одинаковых гиперплоскостей, если генеральных гиперплоскостей больше одной (рис.2). Как указывалось ранее, при дальнейшем построении выпуклой
Блоки 7, 8 Проверяется наличие граничных точек. Если есть граничные точки, которые еще не включены в выпуклую оболочку, то выбирается следующая, точка из массива граничных точек и процесс построения области работоспособности продолжается далее.
Блок 9 Поиск генеральной гиперплоскости осуществляется среди всех ранее построенных гиперплоскостей в результате подстановки в уравнение каждой гиперплоскости координат ее вершины и данной граничной точки. Признаком генеральной гиперплоскости является противоположность знаков результатов подстановки.
Блок 10 Проверяется наличие для выбранной граничной точки хотя бы одной генеральной гиперплоскости. Отсутствие генеральной гиперплоскости для данной граничной точки свидетельствует о том, что точка оказалась внутри области работоспособности и данная точка может быть исключена.
Блок 11 Для найденной генеральной гиперплоскости производится поиск координат N точек, по которым она была построена. Блок 12 Знаки неравенств “³” и "£ " определяются в результате подстановки координат вершин гиперплоскости в уравнение гиперплоскости. При этом используется свойство вершин принадлежать области работоспособности. Символ "£” соответствует отрицательному знаку результата подстановки, символ “³” - положительному. Для удобства использования результатов построения области работоспособности все неравенства приводятся к виду “³0”.
Диалоговое меню
Система меню ориентирована на реализацию всех этапов построения области работоспособности. 1 - вычисление величины критерия по параметрам T и x (вычисляется критерий (2) при заданных пользователем T, x). 2 – построение прямой через две заданные точки (на печать выводятся коэффициенты А, В, С прямой AT + Bx + C = 0). 3 – построение области работоспособности [но граничным точкам, заданным в строгой последовательности их расположения вдоль границы (направление обхода граничных точек не играет роли), строится система граничных прямых в координатах: T - ось координат, x - ось абсцисс]. 4 - вычисление линейной формы (вычисление левой части уравнения прямой AT + Bx + C ´ S при заданных пользователем T, x). 5 - построение графика переходного процесса (строится график переходного процесса объекта контроля h(t),где вертикальными линиями отмечаются допустимые значения критерия качества - минимальное и максимальное время регулирования tpmin, tpmax). 6 - справочная информация (содержит рекомендации по выполнению лабораторной роботы). 7 - конец работы. 1.3. Пример расчета попадания точки в заданную область. Задана таблица работоспособности объекта Табл. 1
Вопрос: будет ли работоспособен объект с данными параметрами
Решение. Геометрическое представление исходных данных.
Проведем построение области согласно алгоритму, изложенному в разделе 1.2. 1 шаг. Берется (N + 1) точки в N – мерном пространстве в нашем случае N=2, т.е.берем точки 1, 2, 3. Через каждые N точек проводится гиперплоскость и заполняется таблица Табл.2
2 шаг. Для точки 4 ищем генеральную гиперплоскость среди всех ранее построенных плоскостей. Является ли (1 – 2) генеральной гиперплоскостью для точки 4. S (т.4) = 7 – 2,5 × 5 + 19 > 0 S¢ (т.3) = 2 – 2,5 × 3 + 19 > 0, т.е. (1-2), не является для точки 4 генеральной гиперплоскостью. Для т. 4 генеральная гиперплоскость (1-3); S¢ (т.4) = 7 × 7 – 4,5 - 2 > 0 S¢ (т.2) = 7 × 1 – 4,8 - 2 < 0, т.е. (1-3), является для точки 4 генеральной гиперплоскостью. Мы снова имеем (N + 1) точку – это {1, 3, 4} Через каждые N точек проведем гиперплоскости (в данном случае прямые) Для упрощения построения часть таблицы не заполняется.
После обработки каждой точки генеральная гиперплоскость и плоскости повторяющиеся (одни и те же плоскости в разных таблицах) вычеркиваются.
3 шаг. Для точки 5 генеральная гиперплоскость (1 – 4)
а также (3 – 4)
4 шаг. Для точки 6 генеральная гиперплоскость (1 – 5)
5 шаг. Для точки 7 генеральная гиперплоскость (1 – 6)
Получили границу области работоспособности: (1 – 2) – (2 – 3) – (3 – 5) – (5 – 6) – (6 – 7) – (7 – 1). Окончательный шаг объекта для перехода от уравнений к неравенствам необходимо в линейную форму (левая часть равенства) поставить координаты вершины. Если величина линейной формы положительна, то знак “=” заменяется на “³”, если же отрицательна то знак “=” заменяется на “£”.
Пример: (1 – 2): x1 – 2,5x2 + 19 = 0. S¢(т.3) = 2 – 2,5 × 3 + 19 > 0. Соответствующее неравенство имеет вид: x1 – 2,5x2 + 19 ³ 0.
Полученная область имеет вид, представленный на рис. 1.7.
Рис. 1.7. Область решений системы неравенств.
(1 – 2) Þ x1 – 2,5x2 + 19 ³ 0 (2 – 3) Þ x1 + 0,2x2 – 2,6 ³ 0 (3 – 5) Þ x1 + 6x2 - 20 ³ 0 (5 – 6) Þ -x1 + 0,75x2 + 6,5 ³ 0 (6 – 7) Þ -x1 – 0,5x2 +14 ³ 0 (7 – 1) Þ -x1 - 2x2 + 26 ³ 0
Проверка работоспособности объекта состоит в выполнении данных неравенств. Если хотя бы одно из неравенств не удовлетворяло условию, то точка не попадает в область. Данная методика позволяет исключить сбойные результаты в экспериментах на основе адаптивных (последовательных) процедур. Адаптивность в данном случае означает отбрасывание случайных результатов до тех пор, пока численные характеристики распределения случайной величины, например, вероятность, не будут постоянны. Построение линейной гиперплоскости для большого числа переменных не представляет сложной задачи и легко решается методами линейной алгебры [].
ЛИТЕРАТУРА 1.Компьютерные технологии адаптивной обработки данных,часть1:Лабораторный практикум / РГМУ: сост. Булаев М.П., Дорошина Н.В., Кабанов А.Н. Рязань, 2002, 27 с. 2.Элементы теории вероятностей: Практикум, Б131 /Авт.-сост. М.П.Булаев, Е.В. Прохорова; под ред. М.П. Булаева; Ряз. гос. мед. ун-т им. акад И.П.Павлова. - Рязань: РИО РГМУ, 2006. – 93 с.
ЛЕКЦИЯ 3 Биномиальное распределение Формальная модель – производится n независимых опытов, в каждом из которых с вероятностью P происходит случайное событие, X – число появлений события А имеет биноминальное распределение. Ряд распределения , где ; . Моменты: ; . Пример биноминального распределения дан в таблице 1.1. Таблица 1.1 Биноминальное распределение
Биноминальное распределение в общем случае асимметрично. Оно становится тем более симметричным, чем больше n или чем ближе Р к величине 0,5.
Геометрическое распределение Формальная модель – производятся ряд независимых опытов с целью наблюдать событие А (появление А называют "успехом" опыта). При каждой попытке успех достигается с вероятностью Р. Случайная величина X – число безуспешных попыток (до первой попытки, в которой появляется результат А). Ряд распределения . Моменты: ; ; . Пример геометрического распределения показан на рис. 1.1 (для случая Р=0,5).
Рис. 1.1. Геометрическое распределение
Распределение Пуассона Формальная модель – получается предельным переходом из биноминальной модели (3.1.1.1), если , , . На практике распространено задание , где – интенсивность потока (число событий за единицу времени), – длина интервала. X – число событий на участке длиной . Ряд распределения , где ; . Моменты: ; . Пример распределения Пуассона дан в табл. 1.3. Таблица 1.3 Распределение Пуассона .
ЛИТЕРАТУРА 1.Компьютерные технологии адаптивной обработки данных,часть1:Лабораторный практикум / РГМУ: сост. Булаев М.П., Дорошина Н.В., Кабанов А.Н. Рязань, 2002, 27 с. 2.Элементы теории вероятностей: Практикум, Б131 /Авт.-сост. М.П.Булаев, Е.В. Прохорова; под ред. М.П. Булаева; Ряз. гос. мед. ун-т им. акад И.П.Павлова. - Рязань: РИО РГМУ, 2006. – 93 с.
ЛЕКЦИЯ 4 Таблица 1.4 Значения функции .
Нормальное распределение (закон Гаусса) Нормальное распределение возникает в тех случаях, когда складывается много независимых случайных величин , причем эти величины сравнимы по порядку своего влияния на рассеивание суммы. Плотность вероятности где ; . Функция распределения Для вычисления F(x) часто используется табулированная функция которая называется функцией Лапласа. Функция Лапласа обладает свойствами, которые целесообразно учитывать при расчетах 1) Ф(0) = 0; 2) –Ф(-х) = Ф(х) (нечетная функция); 3) Ф(+¥) = 0,5 и, значит Ф(-¥) = -0,5. Моменты: ; ; . Если не принимать во внимание событий, происходящих с вероятностями не более 0,0027, то можно практически ограничить диапазон возможных значений нормальной случайной величины ; . (правило «трех сигма»). Значения функции приведены в табл. 1.5, 1.6.
Таблица 1.5 Значения плотности стандартного нормального распределения .
Таблица 1.6 Значения функции Лапласа .
Такое распределение имеет самое важное практическое значение.
Распределение Эрланга Формальная модель – имеется стационарный пуассоновский поток с интенсивностью . Интервал Т, состоящий из суммы К интервалов между событиями, подчиняется закону Эрланга К-го порядка. Плотность распределения Плотность распределения может быть выражена через функцию распределения Пуассона (раздел 3.1.1.4). , где ;
Распределение (распределение хи-квадрат, закон Пирсона) Формальная модель – случайные величины подчинены нормированному нормальному распределению, причем переменных независимы, остальные линейно связаны с этими переменными. Тогда случайная величина подчинена – распределению с числом степеней свободы . Для -распределение достаточно хорошо представляется нормальным законом. Распределение широко используется при статистических расчетах для оценки точности определения дисперсии, для оценки точности согласия различных законов распределения.
T-распределение Стьюдента Формальная модель – случайные величины подчинены нормальному распределению с нулевым средним и произвольной дисперсией . Величина не зависит от остальных , а среди имеется линейно независимых величин. Тогда случайная величина подчинена t -распределению с числом степеней свободы . При увеличении числа степеней свободы t -распределение приближается к нормированному гауссовскому распределению (раздел 3.1.2.3, практически при ). Распределение Стьюдента находит широкое применение при статистической оценке параметров распределения, при статистической проверке вероятностных гипотез при неизвестной дисперсии .
F-распределение Фишера Формальная модель – случайные величины и подчинены нормальному закону распределения с нулевым средним и произвольной дисперсией . Величины не зависят от . Кроме того, пусть среди имеется , а среди – линейно независимых величин. Тогда случайная величина подчинена F -распределению с числами степеней свободы числителя и знаменателя .
Распределение Фишера находит применение при проверке оценок дисперсий, при статистической проверке вероятностных гипотез о качестве различных моделей случайных процессов.
Задачи для практических занятий и самостоятельной работы
Задача Построить графически законы распределения (ряды, плотности вероятностей, функции распределения) случайных величин. Отметить значения, соответствующие математическому ожиданию , моде , медиане и отклонениям от математического ожидания
ЛИТЕРАТУРА 1.Компьютерные технологии адаптивной обработки данных,часть1:Лабораторный практикум / РГМУ: сост. Булаев М.П., Дорошина Н.В., Кабанов А.Н. Рязань, 2002, 27 с. 2.Элементы теории вероятностей: Практикум, Б131 /Авт.-сост. М.П.Булаев, Е.В. Прохорова; под ред. М.П. Булаева; Ряз. гос. мед. ун-т им. акад И.П.Павлова. - Рязань: РИО РГМУ, 2006. – 93 с.
ЛЕКЦИЯ 5 Таблица 1.1
Умножение ММ на скаляр При этом каждый элемент матрицы умножается на скаляр. Это можно представить в виде A(p,q)*α = {α*{ }}.
Сложение ММ Суммировать (вычитать) можно только такие матрицы, которые имеют одинаковые размерности, структуру и размеры. При этом суммирование осуществляется поэлементно: если C(p,q) = A(p,q)+B(p,q), то { } = { } + { }.
Транспонирование ММ Операция обозначается верхним индексом «Т» и заключается в замене структуры индексов на противоположную и в последующем упорядочении индексов в соответствии с правилами помечивания. Например, если A = A(1,2) = { }, то B = AT = B(2,1) = { }, так что = .
Свернутое произведение ММ Оно образуется по следующим правилам: 1. Свертка индексов производится тогда и только тогда, когда первый сомножитель содержит строчные индексы, а второй – столбцовые, и размеры соответствующих индексов (столбцового и строчного) совпадают. 2. Свертка строчных индексов первого сомножителя по столбцовым индексам второго сомножителя производится в соответствии с их естественным порядком: первый строчный индекс первого сомножителя свертывается с первым столбцовым индексом второго сомножителя, второй – со вторым и т.д. 3. Свертка двух индексов заключается в том, что элемент результата образуется путем суммирования произведений элементов сомножителей по свернутому индексу. При этом два свернутых индекса обозначаются оди Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все... Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычислить, когда этот... ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между... ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|