|
Матричная игра 2х сторон с нулевой суммой. Принцип максимина. Седловая точка.Оптимальной наз-ся стратегия, кот при много кратном повторении игры обеспечивает данному игроку макс-но возможный средний выигрыш. Игры 2- лиц с нулевой суммой - выигрыш 1го игрока =проигрыш 2го игрока. Игрок А обладает опр-м кол-вом стратегий 1…m штук – Аi. Игрок В 1..n штук – Вj Выбор каждого производится при неполном незнании о действиях др. стороны. В зав-ти от того какую стратегию выберет А и В функция будет U1(Ai: Bj)+U2(Ai: Bj)=0 Как правило рассм-ся позиция 1го игрока U–> max для А, U–> min для В. U(Ai; Bj)= aij для каждого i,j Платежная матрица: а11a12….a1n А=(аm1am2…amn) Строки соот-ют стратегии 1го игрока, столбцы -2го Максиминная стратегия U= max(i)min(j) a(ij)=L(альфа) L –гарантированный выигрыш 1го игрока, нижняя цена игры U= min(j)max(i)a(ij)=B(бетта) В верхняя цена игры (проигрыш >B получит нельзя для 2го игрока) L<компромисс<B если в игре существует реш. что L=В то в игре сущ-ет седловая точка и отклоняться от этой стратегии нет смысла. Ситуация равновесия – есть седловая точка, оптимальное решение.
Задачи опт управления в дискретной форме. Пр-п опт-ти Беллмана В динамич. задачах для описания процесса вводятся 3 группы пер-ных: 1. неконтролируемые факторы 2. фазовые пер-ные 3. пер-ные управления Будем рассм-ть только многошаговые процессы, в к-ых время явл-ся дискретным и описывается как k. Фазовые пер-ные- Xk,а пер-ные управления Uk. Xk+1=Фk (Xk,Uk), k=0,N-1. U={U0,…,Un-1}- последовательность управляющих векторов. След-но, мы найдем X={X0,X1,…,Xn}- фазовая траектория процесса. Задача закл-тся в том,чтобы выбрать такое управление, к-ое вместе с определяемой им траекторией процесса доставляла бы экстремум нек-ой целевой ф-ии. W=summa k=0;N-1 (fk(Xk,Uk) + fn(Xn)->opt При выборе управления на каждом шаге необх-мо учитывать буд. последствия, т.е. возм-ти оптимизации на послед. шагах, однако, на послед. шаге такую возм-ть уже не надо учитывать, а значит на послед. шаге можно минимизировать р-т. Сущ-т сложность связан. с тем,что выбор управл-ия и получающейся р-т зав-т от того в каком состоянии оказался процесс к послед. шагу. Т.к. не решив задачу в целом, мы не знаем этого состояния, следует уметь находить реш-ие на послед. шаге при любом возм-ном состоянии процесса к послед. шагу. Fn=max(max Fn-1 + fn(Xn)) Fn-1=max Fn-2+ fn(Xn-1, Un-1). принципом оптимальности Беллмана: оптимальное поведение обладает тем свойством, что любая его часть, начиная с некоторого шага, также является оптимальным поведением, т.е. каким бы путем мы не пришли к некоторому состоянию на некотором шаге, оптимальное управление на последующих шагах буд таким же, как ес бы это сост было нач-м. Матричная игра 2х сторон с нулев сумм. Решен в смеш стратег. Опр.Случайный выбор игроком своей стратегии называется смешанной стратегией. Х={Х1,Х2,….,Хm} i=1 Y={y1,у2,….,yn} i=1 Хi≥0, Yi≥0. ∑i∑jaijxiyj=φ Теорема(основная теорема теории игр) каждая конечная игра имеет по крайней мере одно решение возможного в области смешанных стратегий. А= α≤υ Будем считать, что в этой игре нет седловой точки. υ-цена игры в смешанных стратегиях. a11x1+a21x2=υ a12x1+a22x2=υ x1+x2=1 x*,υ*-решение с позиции 1 игрока a11у1+a21у2=υ a12у1+a22у2=υ у1+у2=1 у*,υ*-решение с позиции 2 игрока Однозначное решение в смешанных стратегиях может быть получена, только для квадратных матриц системы.
Производная по направлению и градиент Градиент функции- это вектор первых частных производных функции — характеристика, показывающая направление наискорейшего возрастания некоторой величины, значение которой меняется от одной точки пространства к другой. Df/dS=df/dx *cosальфа+df/dy *cоsбета+df/dz*cosгамма=gradf*S0=lgradfl*cosфи Производная по направлению принимает макс значение в данной точке тогда когда направление вектора S совпадает с направлением gradf Таким образом, для вычисления производной по любому направлению достаточно знать градиент функции, то есть вектор, компоненты которого являются её частными производными. Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем... ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования... ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|