Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Матричная игра 2х сторон с нулевой суммой. Принцип максимина. Седловая точка.





Оптимальной наз-ся стратегия, кот при много кратном повторении игры обеспечивает данному игроку макс-но возможный средний выигрыш.

Игры 2- лиц с нулевой суммой - выигрыш 1го игрока =проигрыш 2го игрока.

Игрок А обладает опр-м кол-вом стратегий 1…m штук – Аi. Игрок В 1..n штук – Вj

Выбор каждого производится при неполном незнании о действиях др. стороны. В зав-ти от того какую стратегию выберет А и В функция будет U1(Ai: Bj)+U2(Ai: Bj)=0

Как правило рассм-ся позиция 1го игрока U–> max для А, U–> min для В.

U(Ai; Bj)= aij для каждого i,j

Платежная матрица:

а11a12….a1n

А=(аm1am2…amn)

Строки соот-ют стратегии 1го игрока, столбцы -2го

Максиминная стратегия U= max(i)min(j) a(ij)=L(альфа)

L –гарантированный выигрыш 1го игрока, нижняя цена игры

U= min(j)max(i)a(ij)=B(бетта) В верхняя цена игры (проигрыш >B получит нельзя для 2го игрока)

L<компромисс<B

если в игре существует реш. что L=В то в игре сущ-ет седловая точка и отклоняться от этой стратегии нет смысла.

Ситуация равновесия – есть седловая точка, оптимальное решение.

 

Задачи опт управления в дискретной форме. Пр-п опт-ти Беллмана

В динамич. задачах для описания процесса вводятся 3 группы пер-ных:

1. неконтролируемые факторы

2. фазовые пер-ные

3. пер-ные управления

Будем рассм-ть только многошаговые процессы, в к-ых время явл-ся дискретным и описывается как k. Фазовые пер-ные- Xk,а пер-ные управления Uk.

Xk+1=Фk (Xk,Uk), k=0,N-1. U={U0,…,Un-1}- последовательность управляющих векторов.

След-но, мы найдем X={X0,X1,…,Xn}- фазовая траектория процесса.

Задача закл-тся в том,чтобы выбрать такое управление, к-ое вместе с определяемой им траекторией процесса доставляла бы экстремум нек-ой целевой ф-ии.

W=summa k=0;N-1 (fk(Xk,Uk) + fn(Xn)->opt

При выборе управления на каждом шаге необх-мо учитывать буд. последствия, т.е. возм-ти оптимизации на послед. шагах, однако, на послед. шаге такую возм-ть уже не надо учитывать, а значит на послед. шаге можно минимизировать р-т. Сущ-т сложность связан. с тем,что выбор управл-ия и получающейся р-т зав-т от того в каком состоянии оказался процесс к послед. шагу.

Т.к. не решив задачу в целом, мы не знаем этого состояния, следует уметь находить реш-ие на послед. шаге при любом возм-ном состоянии процесса к послед. шагу.

Fn=max(max Fn-1 + fn(Xn))

Fn-1=max Fn-2+ fn(Xn-1, Un-1).

принципом оптимальности Беллмана: оптимальное поведение обладает тем свойством, что любая его часть, начиная с некоторого шага, также является оптимальным поведением, т.е. каким бы путем мы не пришли к некоторому состоянию на некотором шаге, оптимальное управление на последующих шагах буд таким же, как ес бы это сост было нач-м.

Матричная игра 2х сторон с нулев сумм. Решен в смеш стратег.

Опр.Случайный выбор игроком своей стратегии называется смешанной стратегией.

Х={Х12,….,Хm} i=1

Y={y12,….,yn} i=1

Хi≥0, Yi≥0.

ijaijxiyj

Теорема(основная теорема теории игр) каждая конечная игра имеет по крайней мере одно решение возможного в области смешанных стратегий.

А=

α≤υ

Будем считать, что в этой игре нет седловой точки.

υ-цена игры в смешанных стратегиях.

a11x1+a21x2

a12x1+a22x2

x1+x2=1

x**-решение с позиции 1 игрока

a11у1+a21у2

a12у1+a22у2

у12=1

у**-решение с позиции 2 игрока

Однозначное решение в смешанных стратегиях может быть получена, только для квадратных матриц системы.

 

Производная по направлению и градиент

Градиент функции- это вектор первых частных производных функции

— характеристика, показывающая направление наискорейшего возрастания некоторой величины, значение которой меняется от одной точки пространства к другой.

Df/dS=df/dx *cosальфа+df/dy *cоsбета+df/dz*cosгамма=gradf*S0=lgradfl*cosфи

Производная по направлению принимает макс значение в данной точке тогда когда направление вектора S совпадает с направлением gradf

Таким образом, для вычисления производной по любому направлению достаточно знать градиент функции, то есть вектор, компоненты которого являются её частными производными.







ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры...

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2025 zdamsam.ru Размещенные материалы защищены законодательством РФ.