ПОЛЕЗНОЕ

Как развить коммуникабельность Почему могут возникнуть ссоры между супругами, в то время как их отношения кажутся прочными Почему появляется страх? Как стать богатым и отойти от дел молодым Советы от доктора Айболита «Как быть здоровым» Как сделать приглашение правильно Точка зрения. Как сделать сотрудника вовлеченным? Лень и как с ней бороться. Психологические аспекты Способов заработать с помощью internet Лекции по Основам предпринимательства Последнее добавление

КАТЕГОРИИ

Матричная игра 2х сторон с нулевой суммой. Принцип максимина. Седловая точка.

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

Оптимальной наз-ся стратегия, кот при много кратном повторении игры обеспечивает данному игроку макс-но возможный средний выигрыш.

Игры 2- лиц с нулевой суммой - выигрыш 1го игрока =проигрыш 2го игрока.

Игрок А обладает опр-м кол-вом стратегий 1…m штук – Аi. Игрок В 1..n штук – Вj

Выбор каждого производится при неполном незнании о действиях др. стороны. В зав-ти от того какую стратегию выберет А и В функция будет U1(Ai: Bj)+U2(Ai: Bj)=0

Как правило рассм-ся позиция 1го игрока U–> max для А, U–> min для В.

U(Ai; Bj)= aij для каждого i,j

Платежная матрица:

а11a12….a1n

А=(аm1am2…amn)

Строки соот-ют стратегии 1го игрока, столбцы -2го

Максиминная стратегия U= max(i)min(j) a(ij)=L(альфа)

L –гарантированный выигрыш 1го игрока, нижняя цена игры

U= min(j)max(i)a(ij)=B(бетта) В верхняя цена игры (проигрыш >B получит нельзя для 2го игрока)

L<компромисс<B

если в игре существует реш. что L=В то в игре сущ-ет седловая точка и отклоняться от этой стратегии нет смысла.

Ситуация равновесия – есть седловая точка, оптимальное решение.

Задачи опт управления в дискретной форме. Пр-п опт-ти Беллмана

В динамич. задачах для описания процесса вводятся 3 группы пер-ных:

1. неконтролируемые факторы

2. фазовые пер-ные

3. пер-ные управления

Будем рассм-ть только многошаговые процессы, в к-ых время явл-ся дискретным и описывается как k. Фазовые пер-ные- Xk,а пер-ные управления Uk.

Xk+1=Фk (Xk,Uk), k=0,N-1. U={U0,…,Un-1}- последовательность управляющих векторов.

След-но, мы найдем X={X0,X1,…,Xn}- фазовая траектория процесса.

Задача закл-тся в том,чтобы выбрать такое управление, к-ое вместе с определяемой им траекторией процесса доставляла бы экстремум нек-ой целевой ф-ии.

W=summa k=0;N-1 (fk(Xk,Uk) + fn(Xn)->opt

При выборе управления на каждом шаге необх-мо учитывать буд. последствия, т.е. возм-ти оптимизации на послед. шагах, однако, на послед. шаге такую возм-ть уже не надо учитывать, а значит на послед. шаге можно минимизировать р-т. Сущ-т сложность связан. с тем,что выбор управл-ия и получающейся р-т зав-т от того в каком состоянии оказался процесс к послед. шагу.

Т.к. не решив задачу в целом, мы не знаем этого состояния, следует уметь находить реш-ие на послед. шаге при любом возм-ном состоянии процесса к послед. шагу.

Fn=max(max Fn-1 + fn(Xn))

Fn-1=max Fn-2+ fn(Xn-1, Un-1).

принципом оптимальности Беллмана: оптимальное поведение обладает тем свойством, что любая его часть, начиная с некоторого шага, также является оптимальным поведением, т.е. каким бы путем мы не пришли к некоторому состоянию на некотором шаге, оптимальное управление на последующих шагах буд таким же, как ес бы это сост было нач-м.

Матричная игра 2х сторон с нулев сумм. Решен в смеш стратег.

Опр.Случайный выбор игроком своей стратегии называется смешанной стратегией.

Х={Х₁,Х₂,….,Х_m} _i=1

Y={y₁,у₂,….,y_n} _i=1

Х_i≥0, Y_i≥0.

∑_i∑_ja_ijx_iy_j=φ

Теорема(основная теорема теории игр) каждая конечная игра имеет по крайней мере одно решение возможного в области смешанных стратегий.

А=

α≤υ

Будем считать, что в этой игре нет седловой точки.

υ-цена игры в смешанных стратегиях.

a₁₁x₁+a₂₁x₂=υ

a₁₂x₁+a₂₂x₂=υ

x₁+x₂=1

x^*,υ^*-решение с позиции 1 игрока

a₁₁у₁+a₂₁у₂=υ

a₁₂у₁+a₂₂у₂=υ

у₁+у₂=1

у^*,υ^*-решение с позиции 2 игрока

Однозначное решение в смешанных стратегиях может быть получена, только для квадратных матриц системы.

Производная по направлению и градиент

Градиент функции- это вектор первых частных производных функции

— характеристика, показывающая направление наискорейшего возрастания некоторой величины, значение которой меняется от одной точки пространства к другой.

Df/dS=df/dx *cosальфа+df/dy *cоsбета+df/dz*cosгамма=gradf*S0=lgradfl*cosфи

Производная по направлению принимает макс значение в данной точке тогда когда направление вектора S совпадает с направлением gradf

Таким образом, для вычисления производной по любому направлению достаточно знать градиент функции, то есть вектор, компоненты которого являются её частными производными.

⇐ Предыдущая 1 234 Следующая ⇒

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычислить, когда этот...

Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: