Критерий лапласа основан на том что. Смотреть страницы где упоминается термин лапласа критерий

Этот критерий опирается на «принцип недостаточного основания» Лапласа, согласно которому все состояния «природы» Si, i = 1,n полагаются равновероятными. В соответствии с этим прин­ципом каждому состоянию Si, ставится вероятность q i определяе­мая по формуле

При этом исходной может рассматриваться задача принятия решения в условиях риска, когда выбирается действие R j , дающее наибольший ожидаемый выигрыш. Для принятия решения для каж­дого действия R j вычисляют среднее арифметическое значение вы­игрыша:

Среди Mj(R) выбирают максимальное значение, которое будет соответствовать оптимальной стратегии R j .

Другими словами, находится действие Rj , соответствующее

Если в исходной задаче матрица возможных результатов пред­ставлена матрицей рисков ||r ji ||, то критерий Лапласа принимает следующий вид:

Пример 4. Одно из транспортных предприятий должно опре­делить уровень своих провозных возможностей так, чтобы удовле­творить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги не известен, но ожидается (прогнозируется), что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует на­илучший уровень провозных возможностей транспортного пред­приятия (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превы­шения провозных возможностей над спросом (из-за простоя по­движного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Ниже приводится таблица, определяющая возможные прогнозируемые затраты на развитие провозных воз­можностей:

Таблица 10- прогнозируемые затраты на развитие провозных воз­можностей

Варианты провозных возможностей транспортного предприятия

Варианты спроса на транспортные

Необходимо выбрать оптимальную стратегию.

Согласно условию задачи, имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: S 1 , S 2 , S 3 , S 4 . Известны также четыре стратегии разви­тия провозных возможностей транспортного предприятия: R 1 , R 2 , R 3 , R 4 Затраты на развитие провозных возможностей при каждой паре S i и R j заданы следующей матрицей (таблицей):

Рисунок 4-матрица для принятия решения

Принцип Лапласа предполагает, что S 1 , S 2 , S 3 , S 4 равновероят­ны. Следовательно, P{S = S i }= 1/n= 1/4 = 0,25, i = 1, 2, 3, 4 и ожидае­мые затраты при различных действиях R 1 , R 2 , R 3 , R 4 составляют:

Таким образом, наилучшей стратегией развития провозных воз­можностей в соответствии с критерием Лапласа будет R 2 .

2. Критерий Вальда (минимаксный или максиминный крите­рий).

Применение данного критерия не требует знания вероятнос­тей состояний Si. Этот критерий опирается на принцип наиболь­шей осторожности, поскольку он основывается на выборе наилуч­шей из наихудших стратегий Rj.

Если в исходной матрице (по условию задачи) результат V ij представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии R j необходимо в каждой строке матрицы результатов найти наибольший элемент max{V ij }, а затем выбирается действие R j (строка j), которому будет соответствовать наименьший элемент из этих наибольших элементов, т. е. дейст­вие, определяющее результат, равный

. (29)

Если в исходной матрице по условию задачи результат V ij пред­ставляет выигрыш (полезность) лица, принимающего решение, то при выборе оптимальной стратегии используется максиминный кри­терий.

Для определения оптимальной стратегии R j в каждой строке матрицы результатов находят наименьший элемент min {Vij} , а затем выбирается действие R j (строка j), которому будут соответство­вать наибольшие элементы из этих наименьших элементов, т. е. действие, определяющее результат, равный

Пример 5. Рассмотрим пример 4. Так как V ij в этом примере представляет потери (затраты), применим минимаксный критерий. Необходимые результаты вычисления приведены в следующей таб­лице:

Таблица 11-

Таким образом, наилучшей стратегией развития провозных воз­можностей в соответствии с минимаксным критерием «лучшим из худших» будет третья, т. е. R 3 .

Минимаксный критерий Вальда иногда приводит к нелогич­ным выводам из-за своей чрезмерной «пессимистичности». «Пес­симистичность» этого критерия исправляет критерий Сэвиджа.

Задание . Фирма планирует реализацию своей продукции на рынках, учитывая возможные варианты покупательского спроса П j , j=1,4 (низкий, средний, высокий, очень высокий). На предприятии разработано три стратегии сбыта товаров A 1 , А 2 , А 3 . Объем товарооборота (ден.ед.), зависящий от стратегии и покупательского спроса, представлен в таблице.
П 1 П 2 П 3 П 4
А 1 30 +N 10 20 25 + N/2
А 2 50 70 - N 10 + N/2 25
А 3 25 – N/2 35 40 60 - N/2
где N=3
Известны возможные состояния покупательского спроса, которые соответственно q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Необходимо найти стратегию сбыта, максимизирующую средний товарооборот фирмы. При этом использовать критерии Вальда, Гурвица, Сэвиджа, Байеса.

Решение находим с помощью калькулятора .
Критерий Байеса .
По критерию Байеса за оптимальные принимается та стратегия (чистая) A i , при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(a ij p j)
∑(a 1,j p j) = 33 0.3 + 10 0.2 + 20 0.4 + 26.5 0.1 = 22.55
∑(a 2,j p j) = 50 0.3 + 67 0.2 + 11.5 0.4 + 25 0.1 = 35.5
∑(a 3,j p j) = 23.5 0.3 + 35 0.2 + 40 0.4 + 58.5 0.1 = 35.9

A i П 1 П 2 П 3 П 4 ∑(a ij p j)
A 1 9.9 2 8 2.65 22.55
A 2 15 13.4 4.6 2.5 35.5
A 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

Критерий Лапласа .
Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
A i П 1 П 2 П 3 П 4 ∑(a ij)
A 1 8.25 2.5 5 6.63 22.38
A 2 12.5 16.75 2.88 6.25 38.38
A 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
Вывод: выбираем стратегию N=3.
Критерий Вальда .
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min a ij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
A i П 1 П 2 П 3 П 4 min(a ij)
A 1 33 10 20 26.5 10
A 2 50 67 11.5 25 11.5
A 3 23.5 35 40 58.5 23.5
Вывод: выбираем стратегию N=3.
Критерий Севиджа .
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max r ij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце b j = max(a ij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23.5 = 26.5;
2. Рассчитываем 2-й столбец матрицы рисков.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Рассчитываем 3-й столбец матрицы рисков.
r 13 = 40 - 20 = 20; r 23 = 40 - 11.5 = 28.5; r 33 = 40 - 40 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r 14 = 58.5 - 26.5 = 32; r 24 = 58.5 - 25 = 33.5; r 34 = 58.5 - 58.5 = 0;
A i П 1 П 2 П 3 П 4
A 1 17 57 20 32
A 2 0 0 28.5 33.5
A 3 26.5 32 0 0

A i П 1 П 2 П 3 П 4 max(a ij)
A 1 17 57 20 32 57
A 2 0 0 28.5 33.5 33.5
A 3 26.5 32 0 0 32
Вывод: выбираем стратегию N=3.
Критерий Гурвица .
Критерий Гурвица является критерием пессимизма - оптимизма. За (оптимальную принимается та стратегия, для которой выполняется соотношение:
max(s i)
где s i = y min(a ij) + (1-y)max(a ij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем s i .
s 1 = 0.5 10+(1-0.5) 33 = 21.5
s 2 = 0.5 11.5+(1-0.5) 67 = 39.25
s 3 = 0.5 23.5+(1-0.5) 58.5 = 41
A i П 1 П 2 П 3 П 4 min(a ij) max(a ij) y min(a ij) + (1-y)max(a ij)
A 1 33 10 20 26.5 10 33 21.5
A 2 50 67 11.5 25 11.5 67 39.25
A 3 23.5 35 40 58.5 23.5 58.5 41
Вывод: выбираем стратегию N=3.
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A 3 .

Руководство компании принимает решение о размещении производства нового продукта в некотором месте. Чтобы сформировать представление о ситуации на рынке нового продукта на момент освоения производства, ему необходимо учесть затраты на доставку готовой продукции до потребителя, развитость транспортной и социальной инфраструктуры региона, конкуренцию на рынке, соотношение спроса и предложения, курсы валют и многое другое. Возможные варианты решений, инвестиционная привлекательность которых определяется как процент прироста дохода по отношению к сумме капитальных вложений, представлены в таблице.
Выбрать:
1) место для размещения производства, если руководитель предприятия уверен в том, что на рынке сложится ситуация 4;
2) место для размещения производства, если руководство оценивает вероятность ситуации 1 в 0,2; ситуации 2 в 0,1; ситуации 3 в 0,25;
3) провести выбор варианта в условиях неопределенности по критерию: максимакс, максимин, критерий Лапласа, критерий Сэведжа, критерий Гурвица (y = 0,3);
4) изменится ли наилучший вариант решения по критерию Гурвица если величину a увеличить до 0,5?
5) предположив, что данные таблицы представляют затраты предприятия, определить выбор, который сделает предприятие при использовании каждого из следующих критериев: максимин; максимакс; критерий Гурвица(? = 0,3); критерий Сэведжа; критерий Лапласа

  • 2. Этапы процесса принятия рационального управленческого решения
  • 3. Методы оптимизации решений
  • Лекция 3 Стратегические решения
  • 1. Стратегическое управление, основные принципы стратегического управления
  • 2.Технология выработки стратегических решений
  • Стратегические интересы, лежащие в основе выработки стратегии организации
  • 3. Классификация стратегий
  • Лекция 4 Системный подход в процессе разработки управленческих решений
  • 1. Понятие системного подхода, его основные черты и принципы.
  • 2. Значение системного подхода в управлении
  • 3. Системный подход при принятии управленческих решений, системный анализ
  • Лекция 5 Ситуационный анализ в процессе разработки управленческих решений
  • 1. Ситуационный подход в управлении
  • 2. Этапы ситуационного анализа
  • 3.Методы сиуационного анализа
  • Лекция 6 Целевая ориентация управленческих решений
  • 1. Целеполагание при выборе управленческого решения
  • 2. Оценивание целей
  • 3. Инициативно-целевая технология
  • 4. Программно-целевая технология
  • 5.Регламентная технология
  • Лекция 7 Процессорные технологии принятия управленческих решений
  • 1. Управление по результатам
  • 2. Управление на базе потребностей и интересов
  • 3.Управление путем постоянных проверок и указаний
  • Лекция 8 Информация для принятия управленческих решений
  • 1. Роль информации в процессе принятия решения
  • 2. Сущность информационных систем и подходы к их разработке
  • 3. Автоматизированная система поддержки управленческих решений
  • Лекция 9 Методы анализа и прогнозирования управленческих решений
  • 1. Понятие анализа, классификация методов анализа
  • 2. Приемы анализа
  • 3. Понятие прогнозирования и его задачи
  • 4. Виды прогнозов, классификация прогнозов
  • 5. Классификация основных методов прогнозирования
  • Лекция 10 Принятие управленческих решений в условиях определенности
  • 1. Постановка задачи обоснования решений в условиях определенности, основные этапы разработки решений в условиях определенности.
  • Лекция 11 Принятие управленческих решений в условиях неопределенности
  • 2. Методы и технологии принятия решений в условиях «природной» неопределенности
  • 3. Критерий Лапласа, Вальда, Сэвиджа, Гурвица
  • Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.
  • 4. Метод теории игр при принятии решений в условиях неопределенности
  • Лекция 12 Принятие управленческих решений в условиях риска
  • 1. Риск и его разновидности
  • 2.Управления рисками, способы оценки рисков
  • 3. Критерии принятия решения в условиях риска
  • 4. Дерево решений как метод принятия управленческих решений в условиях риска
  • Лекция 13 Моделирование процесса разработки управленческого решения
  • 1. Понятие и виды моделей
  • 2. Модели процесса разработки управленческого решения
  • 3. Специальные модели принятия решений
  • Лекция 14 Количественные экспертные оценки в процессе разработки управленческих решений
  • 1. Сущность метода экспертных оценок и его область применения
  • 2. Количественные экспертные оценки, их методы
  • 3. Шкалы количественных экспертных измерений
  • Лекция 15 Качественные экспертные оценки в процессе разработки управленческих решений
  • 1. Качественные экспертные оценки, их методы
  • 2.Коллективные методы экспертных оценок
  • Шкалы качественных измерений:
  • Лекция 16 Качество и эффективность управленческих решений
  • 1.Качество управленческих решений
  • 2. Эффективность управленческих решений
  • 2. Методы оценки эффективности управленческих решений
  • Лекция 17 Реализация и контроль выполнения управленческих решений
  • 1. Сущность и виды контроля реализации управленческих решений
  • 2.Процесс контроля реализации управленческих решений
  • 3. Инструменты и характеристики эффективного контроля реализации управленческих решений
  • Лекция 18 Управленческие решения и ответственность руководителей за ур
  • 1.Понятие ответственности за результаты принятия и исполнения управленческого решения.
  • 2. Социальная ответственность руководителя
  • 3. Типы менеджмента и алгоритмы принятия решений.
  • Рекомендуемая литература для самостоятельной работы студентов
  • Словарь понятий
  • 3. Критерий Лапласа, Вальда, Сэвиджа, Гурвица

    Существует несколько критериев для выбора оптимальной стратегии при принятии решения в условиях риска и неопределенности.

    Критерий Лапласа: применяется, если можно предполагать, что все варианты внешних условий одинаково вероятны. Для каждого решения находится средняя оценка по всем вариантам внешних условий (средний выигрыш):

    где N– количество состояний внешней среды.

    где Z – оптимальная стратегия.

    Критерий Вальда: (критерий крайнего пессимизма, максиминный критерий): решение выбирается в расчете на наихудшие внешние условия. Вероятности состояний природы неизвестны и нет возможности получить о них какую-либо статистическую информацию. В качестве оценки каждого решения используется минимальный выигрыш, который можно получить при выборе этого решения:

    Лучшим является решение с максимальной оценкой.

    Лучшим является решение с максимальной оценкой.

    По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния природы.

    Критерий Сэвиджа, как и критерий Вальда, - это критерий крайнего пессимизма, но только пессимизм здесь проявляется в том, что минимизируется максимальная поте­ря в выигрыше. Для оценки решений используется матрица рисков. В качестве оценки используется максимальный риск (максимальный потерянный выигрыш), соответствующий данному решению:

    Лучшим является решение с минимальной оценкой.

    Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.

    Критерий Гурвица: решение принимается с учетом того, что возможны как благоприятные, так и неблагоприятные внешние условия. При использовании этого критерия требуется указать «коэффициент пессимизма» – число в диапазоне от 0 до 1, представляющее собой субъективную (т.е. не рассчитанную, а указанную человеком) оценку возможности неблагоприятных внешних условий. Если есть основания предполагать, что внешние условия будут неблагоприятными, то коэффициент пессимизма назначается близким к единице. Если неблагоприятные внешние условия маловероятны, то используется коэффициент пессимизма, близкий к нулю. Оценки решений находятся по следующей формуле:

    где a – коэффициент пессимизма.

    Лучшим является решение с максимальной оценкой:

    Кроме критериев оптимальности, которые можно применять при принятии решения в условиях риска и неопределенности, существует очень известный и распространенный метод теории игр, используемый в управленческой деятельности в условиях неопределенности.

    4. Метод теории игр при принятии решений в условиях неопределенности

    При принятии решений в условиях неопределенности очень широко используется метод теории игр. Теория игр – это математическая теория конфликтных ситуаций. Задача этой теоpии – выработка рекомендаций по рациональному образу действий участников конфликта. При этом строят упрошенную модель конфликтной ситуации, называемую игрой. Под «игрой» понимают мероприятие, состоящее из ряда действий или «ходов». От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Сторо­ны, участвующие в конфликте, называют игроками, исход конфликта - выигрышем и т.д.

    Если в игре сталкиваются интересы двух сторон, то игра называется парной, если сторон больше - множествен­ной. Множественная игра с двумя постоянными коалициями обращает игру в парную. Наибольшее практическое значе­ние имеют парные игры. Рассматрим конечную игру, в которой игрок А имеет m стратегий, а игрок В - n стратегий. Та­кая игра называется m x n. Стратегии, соответственно, обозначим: А 1 , А 2 , ..., А m - для игрока А; В 1 , В 2 , ..., В n - для игрока В. Если игра состоит только из личных ходов, то выбор стратегий А i и В j игроками однозначно определяет исход игры - наш выигрыш a ij Если известны a ij для всех сочетаний стратегий, то они образуют платежную матрицу размером m x п, где: m - число строк матрицы, а n - число его столбцов.

    Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной и минимаксной), является в теории игр основным принципом и называется принципом минимакса. В платежной матрице такой игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент назы­вают седловой тонкой. При этом значение v=ą=þ назы­вают чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством: если один из игроков придерживает­ся своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной страте­гии . Если верхняя цена игры не совпадает с нижней, то в этом случае стоит говорить об игре в смешанных стратегиях. Смешанной S A называется применение чистых стратегий А 1 ,А 2 ,…,А n с вероятностью p 1 ,p 2 ,…,p n , а смешанной стратегией S B - применение чистых стратегий B 1 ,B 2 ,…,B n с вероятностью p 1 ,p 2 ,…,p m . Пусть игра имеет размерность 2 на 2 и задается платежной матрицей:

    Для игрока А оптимальная стратегия будет иметь вероятности:

    ;
    ; цена игры

    Вероятности состояний природы, предполагаемые известными при применении критерия Байеса, могли быть получены из статистических данных, отражающих многократное решение подобных задач, или в результате наблюдений за частотой пребывания природы в том или ином состоянии. Однако довольно часто складываются ситуации, в которых определить вероятности состояний природы нет возможности. Желая все же принять решение о выборе стратегии в условиях риска, оценивают вероятности состояний природы субъективно. Один из субъективных подходов состоит в том, что лицо, принимающее решение, нс может отдать предпочтение ни одному из состояний природы по частоте его наступления и потому считает их равновероятными, т.с. =п~‘,j = 1,2,...,л. Этот принцип называется "принципом недостаточного основания" Лапласа . Па нём основан определяемый ниже критерий Лапласа {If -критерий), представляющий собой частный случай критерия Байеса, когда вероятности состояний задаются указанным образом.

    Пусть имеем игру с природой, задаваемой матрицей А (см. (2.5.1)) выигрышей игрока А, а = (, = n~",q 2 =л _|) - вектор вероятностей состояний природы, удовлетворяющих очевидно условиям (2.1.1). Таким образом, в данном случае координаты вектора q зависят от числа состояний природы определенным образом, в то время, как в общем случае зависимость этого вектора от состояний природы состоит только в том, что число его координат равно числу состояний природы.

    Из определения критерия Байеса оптимальности чистых стратегий относительно вышрышей получаем следующее определение.

    Пьер-Симон Лаплас (23.03.1749 - 05.03.1827)

    Критерием Лапласа относительно выигрышей (V’ - критерием) называется критерий, но которому:

    - показателем (W -показателем) эффективности чистой стратегии А , (/ = 1,2,...,от) назовем среднее арифметическое выигрышей при этой стратегии, т.с. величину

    - ценой (II -ценой) игры в чистых стратегиях назовем наибольший из показателей эффективности (2.7.1):

    - оптимальной (II -оптимальной) во множестве чистых стратегий назовем стратегию A k eS L с максимальным показателем эффективности

    Из (2.7.2) и (2.7.3) следует, что оптимальность стратегии A k эквивалентна равенству 1!’ к = /,((. Поскольку в правой части формулы (2.7.1) множитель п~" инвариантен относительно номера стратегии, то эффективность стратегий по И - критерию можно характеризовать просто суммами > « = 1,2,...,т. Таким образом, чистая стратегия А к будет II -оптимальной во множестве чистых стратегий, если сумма выигрышей в А-й строке матрицы выигрышей будет максимальной.

    Множество стратегий, V" -оптимальных во множестве чистых стратегий, обозначим (s c)° {LP) .

    Поскольку критерий Лапласа сеть частный случай критерия Байеса, то все предложения, сформулированные в § 2.5 о критерии Байеса, будут справсдливыми и для критерия Лапласа при замене в них вектора q = (q x ,q 2 ,...,q n) вектором q = (q l =n~",q 2 =n~...,q ll =n~").

    Из оценок (2.5.5) и (2.5.6) для показателя эффективности Ц’ и цены игры L p c соответственно получаем:

    Необходимость многократного принятия решения о выборе стратегии приводит к использованию смешанных стратегий, оптимальность которых определяется по критерию Лапласа.

    Из определения В 1 ’(q) -критерия оптимальности смешанных стратегий относительно выигрышей в частности получаем следующее определение.

    По IP -критерию относительно выигрышей

    - показателем (L p -показателем) эффективности смешанной стратегии Р = (р 1 ,р 2 ,...,р т) назовем среднее арифметическое вышрышей (2.2.3):

    - ценой (L" -ценой) игры в смешанных стратегиях назовем наибольший из показателей эффективности (2.7.6):

    - оптимальной (U’ -оптимальной) во множестве смешанных стратегий назовем стратегию Р° =(р“,/>?,...,/?") с наибольшим показателем эффективности:

    Из равенств (2.7.7) и (2.7.8) следует, что для любой смешанной оптимальной стратегии справедливо равенство

    Из теоремы 2.5.1 вытекает следующая теорема.

    Теорема 2.7Л. В любой игре с природой существует стратегия, оптимальная во множестве смешанных стратегий по критерию Лапласа относительно выигрышей.

    Множество И’ -оптимальных стратегий во множестве S смешанных стратегий обозначим через S oaP) .

    Из теоремы 2.5.2 получаем следующую теорему.

    Теорема 2.7.2. Показатель эффективности L’’(P ) смешанной стратегии P = (p l ,p 2 ,...,p m) по If -критерию представляет собой взвешенное среднее показателей эффективности Ц чистых стратегий ф, i = 1,2,.,.,т, по тому же критерию с весами р, / = 1,2.....т :

    Из неравенств (2.5.12) следуют неравенства ^р > аГ

    Из теоремы 2.5.3 следует теорема.

    Теорема 2.7.3. По критерию Лапласа относительно выигрышей цены игры в чистых и в смешанных стратегиях совпадают: Ь р с = L p s .

    Па основании этой теоремы можно общее значение I!" -цеп в чистых и в смешанных стратегиях назвать просто ценой игры по критерию Лапласа относительно выигрышей и обозначить через L p .

    Следствие 2.7.1 (из теоремы 2.13). Для того чтобы чистая стратегия была оптимальной во множестве смешанных стратегий по критерию Лапласа относительно выигрышей необходимо и достаточно, чтобы она была оптимальной по тому же критерию во множестве чистых стратегий.

    Теоретико-множественное выражение этого следствия состоит в справедливости равенства S 1 f|S ouf) = (S c , из которого следует, что множество (^C)O(i") ст р атсги й, V" -оптимальных во множестве 5 е чистых стратегий, является подмножеством множества ) стратегий, If -оптимальных во множестве 5 смешанных стратегий: (S L) оаГ) с: S 0{lf) .

    Теорема 2.5.4 дает в частности следующее утверждение.

    Теорема 2.7.4. Пусть (S L)° {ir) = {ф,ф 2 ,...,ф^, 1

    стратегия Р, спектр которой является подмножеством множества {,/ 2 .....i k },

    будет L" -оптимальной.

    Если в условиях теоремы 2.7.4 1>2 и спектр стратегии Р содержит более одного номера, то эта оптимальная смешанная стратегия не является чистой.

    Геометрическая интерпретация множества S смешанных И" - оптимальных стратегий дастся в следующей теореме.

    Теорема 2 . 1 . 5 . Если (S c ) 0(iP) = {Л-,Л, Ч,...,4,}. 1 йк т, то множество S 0(LP) смешанных стратегий, оптимальных по критерию Лапласа относительно выигрышей, есть симплекс размерности k- с к вершинами, изображающими оптимальные чистые стратегии А^,А и,...,А^.

    Следствие 2.7.2. Если каждая чистая стратегия является оптимальной по критерию Лапласа относительно выигрышей, то и каждая смешанная стратегия также оптимальна по тому же критерию.

    Следствие 2.7.3. Если среди чистых стратегий оптимальной по критерию Лапласа относительно выигрышей является только одна, то во множестве смешанных стратегий других оптимальных по этому же критерию стратегий нет.

    Следствие 2.7.4. Если не все чистые стратегии являются оптимальными по критерию Лапласа относительно выигрышей, то множество S if) смешанных стратегий, оптимальных по тому же критерию, принадлежит границе Fr 5 симплекса S.

    Пример 2.7.1. Рассмотрим игру с природой из примера 2.6.1, в которой т = 4, а п = 5. Из матрицы выигрышей (2.6.20) найдем по формуле (2.7.1) И" - показатели эффективности чистых стратегий:!{" = 0,2(2 + 7 + 3 + 15 + 6) = 6,6, 1!’ г =0,2 (4 +6 + 11 + 3 + 5) = 5,8, =0,2 (6+ +4 + 9 + 10 + 5) = 6,8, =0,2-(3 + 8 + 7 +

    9+ 5) = 6,4. Отсюда делаем вывод, что единственной чистой If -оптимальной является стратегия А 3 .

    Сравнивая полученный результат с результатом решения примера 2.6.1, видим, что по критерию Байеса относительно рисков с вектором вероятностей состояний природы «у = (0,30; 0,20; 0,15; 0,10; 0,25) и критерию Лапласа относительно вышрышей оптимальными являются разные стратегии?

    Вопросы для самоконтроля знаний

    • 1. В чём состоит принцип Лапласа недостаточного основания?
    • 2. Покажите, что вектор вероятностей состояний природы в критерии Лапласа обладает всеми свойствами вектора вероятностей состояний природы в общем случае.
    • 3. Дайте определение показателю эффективности чистой стратегии по критерию Лапласа относительно выигрышей.
    • 4. Что такое цена игры в чистых стратегиях по критерию Лапласа относительно выигрышей?
    • 5. Какая стратегия называется оптимальной во множестве чистых стратегий по критерию Лапласа относительно выигрышей?
    • 6. Определите критерий Лапласа оптимальности смешанных стратегий относительно выигрышей.
    • 7. Каковы границы изменения показателя эффективности чистой стратегии?
    • 8. Каковы границы изменения цены игры?
    • 9. Какова связь между показателем эффективности смешанной стратегии и показателями эффективности чистых стратегий?
    • 10. Существуют ли игры с природой, в которых цена игры в чистых стратегиях отлична от цены игры в смешанных стратегиях?
    • 11. Дайте геометрическую интерпретацию множеству стратегий, оптимальных во множестве смешанных стратегий по критерию Лапласа относительно выигрышей.
    • 12. Что можно сказать о множестве стратегий, оптимальных во множестве смешанных стратегий по критерию Лапласа относительно выигрышей, если каждая чистая стратегия оптимальна?
    • 13. Что можно сказать о множестве стратегий, оптимальных во множестве смешанных стратегий по критерию Лапласа относительно выигрышей, если среди чистых стратегий только одна является оптимальной?
    • 14. Дайте определение границы множества в конечномерном евклидовом пространстве.

    Задачи для самостоятельного решения

    2.7.1. (Реализация химического реактива). Пусть в условиях задачи 2.1.5 состояния спроса на 11, 12 и 13 ящиков реактива ВС-6 в неделю равновероятны. По значениям выигрыш-функции (см. ответ к задаче 2.1.5) сформировать матрицу выигрышей.

    Сколько ящиков реактива надо производить, чтобы среднеарифметическая прибыль была наибольшей?

    Определить, при какой из смешанных стратегий Р" = (0,1; 0,5; 0,4) и Р" = (0,4; 0,5; 0,1) производства реактива ЗАО «Фото и цвет» получит большую среднеарифметическую прибыль?

    • 2.7.2. (Планирование посева). Будем считать, что в условиях задачи 2.5.3 сухая, нормальная и влажная погода наступают с одинаковой вероятностью. Какую культуру посеять с тем, чтобы доход был наибольшим. Полученное решение сравнить с решением задачи 2.5.3.
    • 2.7.3. Пусть игра с природой задастся платежной матрицей

    Найти полное решение по выигрыш-критерию Лаиаласа. Для каждой чистой стратегии и цены игры в чистых стратегиях проиллюстрировать справедливость соответственно неравенств (2.7.4) и (2.7.5).

    • 2.7.4. В условиях задачи 2.7.3 проверить на оптимальность смешанную стратегию Р° =(0,25; 0,00; 0,75). Если стратегия Р° = (0,25; 0,00; 0,75) оптимальна, то показать выполнимость для нес равенства (2.7.9). Для смешанной стратегии Р = (0,15; 0,55; 0,30) проиллюстрировать справедливость равенства (2.7.10) и неравенств (2.7.11).
    • 2.7.5. (Выпуск новой продукции). Предположим, что в условиях задачи
    • 2.4.5 состояния спроса равновероятны. Найти полное решение по выигрыш- критерию Лапласа и дать ему экономическую интерпретацию.
    • Пьер Симон Лаплас (фр. Pierre-Simon tie Laplace) - выдающийся французский математик, физик и ас-троном, родился в Бомон-ан-Ож (Нормандия) 23 марта 1749 года в небогатой крестьянской семье. Рано проявиввыдающиеся способности, с блеском окончил в Бомон-ан-Ож школу монашеского ордена бенедиктинцев, из которой вышел, между прочим, убеждённым атеистом, и был оставлен там же в Бомоне, преподавателем математики ввоенной школе. Первую научную работу написал в 17 лет, т.е. в 1766 г., и в этом же году отправился в Париж, гдес помощью Д"Аламбера получил место преподавателя в Военной школе Парижа. Важнейшие направления научныхисследований Лапласа - математика, математическая физика, астрономия. Лаплас - один из основателей математической теории вероятностей. Получил фундаментальные результаты по интегрированию дифференциальныхуравнений в частных производных, ввел в рассмотрение производящие функции и «преобразование Лапласа», доказал биномиальный закон распределения вероятностей и первые предельные теоремы теории вероятностей. Завершил создание небесной механики. Ему принадлежат основополагающие результаты по теории устойчивостиСолнечной системы, движений Юпитера и Сатурна («законы Лапласа»), приливов и отливов, космогоническойгипотезы И. Канта («гипотеза Канта-Лапласа»), ускорения движения Луны и сжатия Земли (1787), скорости распространения звука в воздухе и плотности воздуха (1809). Лаплас - адъюнкт Французской АН (1773), профессорПарижской артиллерийской школы (1775), а затем экзаменатор Артиллерийского корпуса, председатель Палатымер и весов (1790), член Национального института (с 1795), руководитель Бюро Долгот (1795), после ВеликойФранцузской революции активно участвовал в реорганизации системы образования во Франции и в созданииВысшей нормальной и Политехнической школ. Лаплас - действительный член Парижской АП (1785), член Королевских обществ в Турине и Копенгагене (1801), член Академий наук в Гёттингене (1802), Берлине (1808), Голландии (1809), Почетный член Петербургской АП (с 1802). Во время Консулата был назначен Наполеоном министромвнутренних дел Франции, затем - вице-президентом сената (1803) и через месяц - канцлером; награжден орденом Почетного легиона (1804). В 1811 г. Наполеон присвоил ему звание графа де Лаплас, за что ученый посвятилимператору третий том своего «Трактата о небесной механике». Говорят, что на вопрос Наполеона, почему в егоТрактате нет упоминания о боге, Лаплас ответил: «Ваше величество, эта гипотеза оказалась не нужной». Послереставрации монархии Лаплас пользовался благосклонностью Людовика XVIII, который сделал его пэром Франции и пожаловал титул маркиза. В 1817 г. Лаплас стал членом вновь созданной Французской академии, т.е. - одним из сорока бессмертных. Лаплас был широко образованным человеком. По своим философским взглядам склонялся к материализму. Он знал языки, историю, философию, химию, биологию. Любил поэзию, музыку, живопись.Семейная жизнь Лапласа протекла ровно и приятно. Был женат (1778) на Шарлоте де Курти - красивой женщинес мягким, добрым характером, которая любила своего мужа, преклонялась перед ним и делала все, чтобы оградитьего от домашних забот и волнений, чтобы все свое время он мог посвящать занятиям наукой. Подарила ему дочь исына. Умер ученый 5 марта 1827 г. после недолгой болезни. Его последние слова были: «То, что мы знаем, такничтожно по сравнению с тем, что мы не знаем». (, [ 18], , ).

    Критерий Лапласа

    В ряде случаев представляется правдоподобным следующее рассуждение: поскольку неизвестны будущие состояния природы, постольку можно считать их равновероятными. Этот подход к решению используется в критерии “недостаточного основания” Лапласа.

    Для решения задачи для каждого решения подсчитывается математическое ожидание выигрыша (вероятности состояний природы полагаются равными qj = 1/n, j = 1:n), и выбирается то решение, при котором величина этого выигрыша максимальна.

    Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

    Критерий Байеса-Лапласа

    Этот критерий отступает от условий полной неопределенности - он предполагает, что возможным состояниям природы можно приписать определенную вероятность их наступления и, определив математическое ожидание выигрыша для каждого решения, выбрать то, которое обеспечивает наибольшее значение выигрыша:

    Этот метод предполагает возможность использования какой-либо предварительной информации о состояниях природы. При этом предполагается как повторяемость состояний природы, так и повторяемость решений, и, прежде всего, наличие достаточно достоверных данных о прошлых состояниях природы. То есть, основываясь на предыдущих наблюдениях прогнозировать будущее состояние природы (статистический принцип).

    Возвращаясь к нашей таблице 1 предположим, что q1=0.4, q2=0.2 и q3=0.4. Тогда согласно критерию Байеса-Лапласа таблицу 1 дополняем столбцом математических ожиданий и среди этих значений выбираем максимальное. Получим таблицу 13.

    Таблица 13.

    Оптимальным является решение X1.

    Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение, следующие требования:

    • v вероятности появления состояний Вj известны и не зависят от времени;
    • v решение реализуется (теоретически) бесконечно много раз;
    • v для малого числа реализаций решения допускается некоторый риск.

    При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск исключён.

    Исходная позиция применяющего - критерий оптимистичнее, чем в случае критерия Вальда, однако она предполагает более высокий уровень информированности и достаточно длинные реализации.

    Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной:

    Таблица 14. Оптимальные варианты, полученные с помощью различных критериев

    Из таблицы 14 видно, что от выбранного критерия (а, в конечном счете - от допущений) зависит и выбор оптимального решения.

    Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы.

    Поскольку различные критерии связаны с различными условиями, в которых принимается решение, лучшее всего для сравнительной оценки рекомендации тех или иных критериев получить дополнительную информацию о самой ситуации. В частности, если принимаемое решение относится к сотням машин с одинаковыми параметрами, то рекомендуется применять критерий Байеса-Лапласа. Если же число машин не велико, лучше пользоваться критериями минимакса или Сэвиджа.

    Примеры постановки решения задач

    В данном параграфе на примере решения задач мы должны научиться определять вектор стратегий, вектор состояний и платёжную матрицу и применять различные критерии для получения оптимального решения.

    Задача. В приморском городе решено открыть яхт-клуб. Сколько следует закупить яхт (из расчета: одна яхта на 5 человек), если предполагаемое число членов клуба колеблется от 10 до 25 человек. Годовой абонемент стоит 100 денежных единиц. Цена яхты - 170 денежных единиц. Аренда помещения и хранение яхт обходится в 730 денежных единиц в год.

    Решение. Несомненно, что имеет смысл рассматривать количество приобретаемых яхт в диапазоне от двух до пяти (4 варианта) и количество потенциальных яхтсменов от 10 до 25. Для уменьшения объема перебора ограничимся вариантами 10, 15, 20, 25 (если полученные выводы для смежных вариантов будут существенно разниться, проведем дополнительный, уточняющий расчет). Итак: X= {Xi} = (2, 3, 4, 5) - количество яхт (i=1,2,3,4); B = {Bj} =(10, 15, 20, 25) - количество членов яхт-клуба (j=1,2,3,4).

    Для того, чтобы начать поиск решения, построим матрицу решений, элементы которой показывают прибыль при принятии i -го решения при j -ом количестве членов яхт-клуба:

    aij = 100min(5Xi ; Bj) - 170Xi - 730

    т.е. решающее правило в нашей задаче формулируется как "доход - затраты".

    Выполнив несложные расчеты, заполним матрицу решений {aij} (см. табл. 15):

    теория игра матричный решение

    Таблица 15. Платёжная матрица

    Например, a11 = 100min(52, 10) - 1702-730 =-70

    a12=100min(52, 15)-1702-730=-70

    a13 = a14 = -70 (спрос на яхты останется неудовлетворенным). Отрицательные значения показывают, что при этих соотношениях спроса на яхты и их наличия яхт-клуб несет убытки.

    Критерий Вальда (выбор осторожной, пессимистической стратегии) - для каждой альтернативы (количество яхт в клубе) выбирается самая худшая ситуация (наименьшее значение величины прибыли) и среди них отыскивается гарантированный максимальный эффект:

    ZMM=max(-70; -240; -410; -580)=-70

    Вывод: принимая решение по критерию Вальда, яхт-клубу следует закупить 2 яхты и максимум ожидаемого убытка не превысит 70 д.е.

    Критерий Гурвица (компромиссное решение между самым худшим исходом и излишне оптимистическим). Рассмотрим изменение решения нашей задачи в зависимости от значений коэффициента оптимизма (в таблице 16 выделены значения, удовлетворяющие критерию Гурвица при различных):

    Таблица 16. Решения по Гурвицу для различных

    Вывод: при 0,5 следует закупить 5 яхт и ожидать прибыль порядка, не меньшую 170 д.е. (надеемся на широкую популярность нашего клуба и определенную финансовую состоятельность любителей), при = 0,2 не следует закупать более 2 яхт (мы более осторожны в своих прогнозах и, скорее всего, предпочтем отказаться от создания клуба).

    Критерий Сэвиджа (нахождение минимального риска). При выборе решения по этому критерию сначала матрице полезности сопоставляется матрица сожалений D - для нашего примера, вычитанием (-70) из первого столбца матрицы полезности, 260 из второго столбца, 590 и 920 из третьего и четвертого столбцов соответственно, получим матрицу рисков (см. табл. 17):

    Таблица 17. Матрица рисков

    Наименьшее значение среди максимальных элементов строк (выделенные в таблице значения) равно:

    ZS=min(990; 660; 340; 510)=340

    Вывод: покупая 4 яхты для открываемого яхт-клуба, мы уверены, что в худшем случае убытки клуба не превысят 340 д.е.

    Критерий принятия решения Байеса-Лапласа. Предположим, что есть статистические данные, позволяющие оценить вероятность того или иного спроса на членство в яхт-клубе: q=(0,1; 0,2; 0,4; 0,3). Тогда математическое ожидание величины прибыли для каждого из рассматриваемых вариантов решения (предложение яхт в яхт-клубе):

    a1r = (-700,1)+(-700,2)+(-700,4)+(-700,3) =-70 ,

    a2r= (-2400,1)+(2600,2)+(2600,4)+(2600,3) =210;

    a3r = 390; a4r = 370.

    Вывод: в условиях рассматриваемой ситуации наиболее целесообразно закупить 4 яхты (в этом случае максимальная ожидаемая прибыль яхт-клуба составит 390 денежных единиц).

    Для применения критерия Лапласа находим:

    a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

    a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

    a3r = 215; a4r = 170.

    Вывод: в условиях равновероятности возникновения той или иной величины спроса на членство в яхт-клубе следует закупить 4 яхты и при этом можно рассчитывать на прибыль в размере 215 д.е.

    Общий вывод. Рассмотренные критерии приводят к различным решениям и дают тем самым информацию к размышлению (принятое решение здесь будет существенно зависеть от психологии и интуиции субъекта решения). Это неудивительно, так как критерии основаны на различных гипотезах. вводя ту или иную гипотезу о поведении среды, мы тем самым "снимаем неопределённость", однако сама гипотеза является только предположением, а не знанием. Было бы странным, если различные предположения приводили всегда к одному и тому результату.

    Принятие решений в условиях риска

    Как было сказано выше, принятие решений в условиях риска характеризуется тем, что поведение природы (среды) имеет случайный характер. Это проявляется в том, что существует некоторая вероятностная мера, в соответствии с которой возникают (наступают) те или иные состояния природы. При этом лицо прин имающее решение имеет определённую информацию о вероятностях появления состояний среды, которая по своему характеру может быть весьма разнообразна. Например, имеется три состояния среды B1, B2 и B3, то дополнительная информация о появлении этих состояний может заключаться в том, что состояние B1 наименее вероятно, а состояние B3 более вероятно.

    Следовательно, принятие решений в условиях риска предполагает, кроме задания функции реализации, задание некоторой дополнительной информации о вероятностях состояния среды. Если множество состояний природы B конечно (число состояний равно m), то вероятностная мера на нём может быть задана вероятностным вектором q=(q1, q2, …, qm), где qj?0 и.

    Таким образом, матрица выигрышей в условиях риска может быть представлена в следующем виде (см. таблицу 1)

    Состояния среды

    Выбирая решение Xi, игрок знает, что получит один из выигрышей a11, …, a1m с вероятностями q1, …, qm соответственно. Следовательно, исходом для принимающего решение при выборе им решения Xi является случайная величина

    Итак, сравнение двух решений X1 и X2 сводится к сравнению соответствующих им случайных величин..

    Выбор оптимального решения обычно основывается на одном из следующих критериев:

    • 1) критерий Байеса-Лапласа - ожидаемого значения (прибыли или расходов);
    • 2) комбинации ожидаемого значения и дисперсии;
    • 3) критерий произведения;
    • 4) наиболее вероятного события в будущем и другие.

    Рассмотрим подробнее критерий Байеса-Лапласа.

    Критерий ожидаемого значения (критерий Байеса-Лапласа)

    На прошлой лекции мы рассмотрели критерий Байеса-Лапласа. Использование данного критерия (в литературе встречается другое название - критерий "ожидаемого среднего значения") обусловлено стремлением максимизировать ожидаемую прибыль (или минимизировать ожидаемые затраты). Использование ожидаемых величин предполагает возможность многократного решения одной и той же задачи, пока не будут получены достаточно точные расчётные формулы. Математически это выглядит так: пусть о - случайная величина с математическим ожиданием Mо и дисперсией Dо. Если x1, x2,..., xn - значения случайной величины (с.в.) о, то среднее арифметическое их (выборочное среднее) значений

    имеет дисперсию. Таким образом, когда n>

    Другими словами при достаточно большом объёме выборки разница между средним арифметическим и математическим ожиданием стремится к нулю (так называемая предельная теорема теории вероятности). Следовательно, использование критерия "ожидаемое значение" справедливо только в случае, когда одно и то же решение приходится применять достаточно большое число раз. Верно и обратное: ориентация на ожидания будет приводить к неверным результатам, для решений, которые приходится принимать небольшое число раз.

    Прежде чем перейти к модификации критерия Байеса-Лапласа рассмотрим данный критерий подробнее.

    Известно, что естественной числовой характеристикой случайной величины о является её математическое ожидание Mо, к которому приближается среднее значение этой случайной величины при большом количестве испытаний.

    Если у человека, выступающего против природы, есть статистические данные о закономерностях в конкретных проявлениях природы, то задача легко может быть решена вероятностными методами.

    Таким образом, если вероятности состояний природы известны и не изменяются со временем (стационарны), то оптимальным следует считать решение, максимизирующее ожидаемый выигрыш (которое дает наибольшее математическое ожидание выигрыша против известной стратегии природы - состояния или условия).

    Пример. Фирма купила станок за 100 денежных единиц. Для его ремонта можно купить специальное оборудование за 50 ед. или обойтись старым оборудованием. Если станок выходит из строя, его ремонт с помощью спецоборудования обходится в 10 ед., без спецоборудования - в 40 ед. Известно, что в течение срока эксплуатации станок выходит из строя не более трех раз: вероятность того, что станок не сломается - 0.3; сломается 1 раз - 0.4; сломается 2 раза - 0.2; сломается 3 раза - 0.1. Требуется определить целесообразность приобретения специализированного ремонтного оборудования.

    Формализация. Первый игрок имеет две чистые стратегии: покупать (X1) и не покупать (X2) специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей (см. таблицу 1):

    Таблица 1.

    Выход станка из строя

    B1, ни разу

    X1, не купить

    X2, купить

    Решение. Рассмотрим сначала эту задачу как антагонистическую игру. В матрице методом минимакса находим седловую точку: (X2, B4), таким образом, цена игры v= - 180 денежных единиц (см. таблицу 2).

    Таблица 2.

    Выход станка из строя

    B1,ни разу

    X1, не купить

    X2, купить

    Ответ: нужно купить специализированное оборудование.

    Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: q= (0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.

    Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит M=-150Ч0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161, а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит M=-100Ч0.3 - 140Ч0.4 - 180Ч0.2 -220Ч0.1 =-144.

    Таким образом, первому игроку выгодно играть не оптимально!

    Таблица 3.

    Выход станка из строя

    B1, ни разу

    X1, не купить

    X2, купить

    Ответ: не покупать специализированное оборудование.

    Существенное различие между значениями v(x*) и v(x") объясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 денежных единиц выигрыша.

    Итак, в игре с природой ориентация на математическое ожидание выигрыша есть фактически ориентация на средний выигрыш, который получится при многократном повторении этой игры (при предположении, что условия игры не меняются). Разумеется, если игра в действительности многократно повторяется, то критерий среднего выигрыша (например, в экономических задачах - средней прибыли) можно считать оправданным. Однако разумно ли ориентироваться на этот критерий при единичном испытании?

    Рассмотрим следующий пример. Фирма I может выставить на продажу один из товаров TI1или TI2, а фирма II - один из товаров TII1, TII2, TII3. Товары TI1 и TII1 являются конкурирующими (например, пиво и лимонад), а товары TI1 и TII3 дополнительными (например, пиво и вобла); остальные товары нейтральны. Прибыль фирмы I зависит от сочетания товаров, выставляемых на продажу обеими фирмами, и определяется таблицей 4. Известно, что фирма II выставляет на продажу товар TII3 в три раза реже, чем TII1 и в четыре раза реже, чем TII2. Какой товар следует поставлять на продажу фирме I?

    Таблица 4

    Состояния среды

    Здесь решение выставить на продажу фирмой I товар TI1, решение X2 выставить на продажу фирмой I товар TI2.

    Вычислим математические ожидания для данной таблицы:

    M=8Ч3/8+18Ч4/8+40Ч1/8=17, M=18Ч3/8+15Ч4/8+14Ч1/8=16.

    Оптимальной стратегией будет решение X1, т.е. фирма I поставлять товар TI1. Безусловно, выигрыш в 17 денежных единиц лучше, чем в 16. Однако при выборе решения X1 мы получим не 17 денежных единиц, а один из выигрышей: 8, 18 или 40. При выборе решения X2 мы получим не 16 денежных единиц, а один из выигрышей 18, 15 или 14. Составим таблицу, где указаны отклонения возможных выигрышей от их ожидаемых значений и вероятности этих отклонений.

    Таблица 5. Значения отклонений

    Из данной таблицы видно, что при равных ожидаемых выигрышах, по-разному ведут отклонения от ожидаемых выигрышей: для X1 эти отклонения значительны, а для X2 - сравнительно невелики.

    Из проведённого анализа можно сделать вывод: в условиях риска критерий Байеса-Лапласа (ожидаемого среднего выигрыша) не является адекватным и должен быть изменён с учётом возможных отклонений случайной величины от её среднего значения.

    В теории вероятностей в качестве меры отклонения случайной величины от её среднего значения обычно используют дисперсию Dо или среднеквадратичное отклонение у=. В задачах принятия решений в условиях риска будем рассматривать в качестве показателя риска среднеквадратичное отклонение у, т.к. у.имеет такую же размерность, что и случайная величина о, математическое ожидание Mо.

    Таким образом, для принятия решения в условиях риска выбор альтернативы Xi приводит к случайной величине оi, которая может быть охарактеризована парой показателей (Mо, уi). Теперь приступим к построению адекватного критерия сравнения альтернатив. Фактически здесь получается задача двухкритериальной оптимизации, где в качестве частных критериев выступают математическое ожидание Mо (значение данного критерия нужно максимизировать) и среднеквадратичное отклонение у (значение данного критерия нужно минимизировать).

    Рассмотрим нахождение Парето-оптимальных решений для данной многокритериальной задачи. Предположим, что требуется выбрать одну оптимальное решение из множества допустимых решений, каждое из которых определяется парой показателей (Mоi, уi). Изобразив на координатной плоскости точки с координатами (Mоi, уi), получим картинку типа изображённой на рис. 1, т.е. мы получили пространство оценок. Левая часть рисунка (красные точки) значения математического ожидания мы взяли положительными, а у отрицательные значения, т.к. этот критерий (у) мы должны минимизировать. Парето-оптимальными оценками является правая верхняя граница и соответственно Парето оптимальными решениями X1, X2, X9 и X7.

    В данном примере множество Парето-оптимальных решений есть X1, X2, X9, X7 и окончательный выбор оптимального решения проводится из этого множества. Как было сказано выше, здесь есть два подхода: первый подход заключается в том, что строится множество Парето-оптимальных решений и из этого множества ЛПР выбирает единственное решение на основе неформальных дополнительных соображений. Рассмотрим второй подход на основе сужения множества Парето-оптимальных альтернатив.

    • 1. Выбор главного критерия и назначение нижних границ по остальным критериям. Назначим нижнюю границу по критерию M и минимизировать критерий у. В качестве нижней границы критерия M возьмём значение M4 (см. рис. 1), то оптимальным будет решение X2, так среди решений удовлетворяющих условию Mi? M4, она наименее рискованна.
    • 2. Лексикографическая оптимизация предполагает упорядочение критериев по важности. Пусть, например, M - важнейший критерий. Так как максимальное значение по критерию M имеет единственное решение X7, то оно и является оптимальным. Здесь наглядно проявляется недостаток метода лексикографической оптимизации: учёт одного (важнейшего) критерия. Этот недостаток связан с необходимостью введения жесткого приоритета критериев и может быть снят за счёт ослабления "жесткости" приоритетов. В этом случае используют метод последовательных уступок (метод смены цели), который был рассмотрен выше.

    Например, в нашем случае в качестве уступки по критерию M величину Д, указанную на рис. 1. Тогда результатом выбора на первом шаге будут альтернативы X7, X8, X9. Среди них наилучшей по второму критерию будет X9. Таким образом, несколько снизив требования по критерию M, мы значительно улучшили оценку по критерию у (т.е. некоторое уменьшение ожидаемого выигрыша привело к существенному снижению риска).


    Рис. 1.

    Рассмотрим применение обобщенного критерия для нашей задачи. Возьмём в качестве обобщённого критерия функцию вида:

    f(M, у)= M-лЧу, (1)

    где л - некоторая постоянная величина. Фактически критерий (1) представляет аддитивный критерий оптимальности частных критериев M, у с весовыми коэффициентами 1 и - л. При л>0 оценка случайной величины с помощью аддитивного критерия (1) меньше, чем её среднее значение, что характерно для осторожного человека, т.е. человека не склонного к риску. Напротив, при л<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

    Содержательный смысл аддитивного критерия (1) при л>0 состоит в том, что увеличение критерия f(M, у) может происходить как за счёт увеличения M, так и за счёт уменьшения у. Таким образом, для человека, не склонного к риску, критерий (1) отражает стремление к увеличению ожидаемого выигрыша и уменьшению риска отклонения от него. При этом показатель л характеризует субъективное отношение принимающего решение к риску. Следовательно, л можно рассматривать как субъективный показатель меры несклонности к риску (субъективный показатель осторожности).

    Выбор варианта производимого товара. Фирма может выпускать продукцию из следующих шести видов: зонтики (З), куртки (К), плащи (П), сумки (С), туфли (Т) и (Ш). Глава фирмы должен принять решение, какой из этих видов продукции выпускать в течение предстоящего летнего сезона. Прибыль фирмы зависит от того, каким будет лето - дождливым, жарким или умеренным, и определяется таблицей 6. Выбор какого варианта производства будет оптимальным?

    При отсутствии дополнительной информации о состояниях среды в условиях неопределённости, и её решение возможно при принятии какой-либо гипотезы о поведении среды. Если принимающий решение имеет информацию о вероятностях наступления дождливого, жаркого и умеренного лета, то указанная задача становится задачей принятия в условиях риска. В рассматриваемой случае необходимая информация может быть взята из статистических данных (наблюдений за погодой в данной местности). Предположим, что вероятность дождливого, жаркого и умеренного лета равна соответственно 0.2, 0.5 и 0.3. Тогда получаем задачу принятия решения в условиях риска, заданную таблицей 7.

    Таблица 6.

    Найдём ожидаемые выигрыши, соответствующие решениям З, К, П, С, Т, Ш. Имеем:

    МЗ=0.2Ч80+0.5Ч60+0.3Ч40=58,

    Мк=0.2Ч70+0.5Ч40+0.3Ч80=58,

    МП=0.2Ч70+0.5Ч50+0.3Ч60=57,

    МС=0.2Ч50+0.5Ч50+0.3Ч70=56,

    МТ=0.2Ч75+0.5Ч50+0.3Ч50=55,

    DоЗ=196, DоК=336, DоП=61, DоС=84, DоТ=100, DоШ=231.5. Среднеквадратичные отклонения рассматриваемых случайных величин таковы:

    уЗ=14.0, уК=18.3, уП=7.8, уС=9.2, уТ=10.0, уШ=15.2.

    Составим таблицу значений критериев M и у для каждой альтернативы (таблица 8)

    таблица 8

    Критерии

    Представим рассматриваемые решения точками на координатной плоскости переменных M и у, получим рис. 2, из которого Парето-оптимальные решения З, П, Ш. Окончательный выбор оптимальной альтернативы должен производиться из этого множества.

    Сужение Парето-оптимального множества (в идеале - до одного элемента) может быть произведено только при наличии дополнительной информации о соотношении критериев M и у. Как было сказано выше, это можно сделать методом главного критерия, методом последовательных уступок или с использованием лексикографического критерия.

    Обзор критериев принятия решения в условиях риска

    Критерий произведений

    Правило выбора в этом случае формулируется так:

    Матрица решений дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца.

    Применение этого критерия обусловлено следующими обстоятельствами:

    • · вероятности появления состояния Bj неизвестны;
    • · с появлением каждого из состояний Bj по отдельности необходимо считаться;
    • · критерий применим и при малом числе реализаций решения;
    • · некоторый риск допускается.

    Критерий произведений приспособлен в первую очередь для случаев, когда все aij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвиг aij+а с некоторой константой а> . Результат при этом будет, естественно зависеть от а. На практике чаще всего

    Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.

    Предыдущая Главная Следующая

    Принятие решения в условиях риска с возможностью проведения эксперимента

    При принятии решения в условиях неопределённости (или в условиях риска) принципиальная сложность выбора решения возникает из-за незнания ЛПР истинного состояния среды. В предыдущих лекциях рассмотрено несколько критериев, каждый из которых по-своему "борется" с неопределённостью: с помощью выдвижения гипотезы о поведении среды (критерий Лапласа, Вальда, Гурвица и Сэвиджа); с помощью усреднения получаемых выигрышей (критерий Байеса-Лапласа или критерий ожидаемого выигрыша); с помощью учёта как ожидаемого выигрыша, так и меры отклонения от него. Однако, каждый из этих подходов даёт лишь способ рационального анализа неопределённости, не устраняя самой неопределённости. Устранение или хотя бы уменьшение неопределённости может быть произведено только на основе уточнения истинного состояния среды.

    На практике такое уточнение осуществляется, как правило, с помощью сбора дополнительной информации, а также с помощью проведения экспериментов, по результатам которых судят об имеющемся состоянии среды. Например, прежде чем приступить к лечению больного при неясном диагнозе, врач проводит дополнительные анализы; прежде чем бурить дорогостоящую нефтяную скважину, геолог производит сейсморазведку; прежде чем наладить производство какого-либо товара, предприниматель изготавливает пробную партию этого товара и т.д. В рамках теории принятия решений все эти действия означают не что иное, как проведение эксперимента с целью уточнения состояния среды.

    Эксперимент называется идеальным, если по его результатам ЛПР узнаёт истинное состояние среды. На практике наличие идеального эксперимента - явление довольно редкое. Чаще всего результат эксперимента даёт некоторую информацию, на основе которой может быть произведено уточнение среды.

    Как использовать результаты эксперимента и имеющиеся статистические данные при принятии решений наиболее эффективно? Одна из методик, позволяющая решить эту проблему основана на формуле Байеса - формула переоценки вероятностей событий с учётом результата проведённого эксперимента.

    Отметим, что не для всякой задачи принятия решения эксперимент является возможным. Если для некоторой задачи эксперимент возможен, то возникает задача оценки целесообразности его проведения. Дело в том, что проведение эксперимента всегда требует затрат (материальных, организационных, временных и пр.).

    В книге [Розен] показано, что идеальный эксперимент является выгодным тогда и только тогда, когда его стоимость меньше минимального ожидаемого риска:

    где rij - риски, C - стоимость эксперимента.

    Для изложения байесовского подхода к переоценке вероятностей напомним некоторые понятия из теории вероятностей.

    Условная вероятность события A при условии, что произошло событие B, обозначается P(A/B) и вычисляется по формуле

    Рассмотрим следующую теоретико-вероятностную схему. Пусть B1, B2, …, Bm - полная группа событий и для каждого события Bj, j= известна её вероятность P(Bj). Пусть произведён опыт, в результате которого произошло событие A. Если известны условные вероятности P(A/Bj) для всех j=, тогда условная вероятность (послеопытная) вероятность события Bj (j=,) может быть найдена по формуле Байеса

    Рассмотрим теперь в схематической форме задачу принятия решения в условиях риска, заданную с помощью матрицы выигрышей, которая имеет вид табл.

    Таблица 1. Платёжная матрица с вероятностным вектором состояния среды

    Состояния среды

    Здесь B1, B2, …, Bm - состояния среды, aij - выигрыш игрока в ситуации, когда он выбирает стратегию Xi, а среда принимает состояние Bj. ЛПР известна вероятность P(Bj)= qj наступления состояния Bj, причём P(Bj)?0 и. Предполагается, что среда может находиться в одном и только в одном из состояний B1, B2, …, Bm. Другими словами, случайные события B1, B2, …, Bm образуют полную группу событий, поэтому их можно взять в качестве гипотез. Известные ЛПР вероятности состояний среды P(Bj) (j=) являются безусловными (доопытными, априорными) вероятностями.

    Предположим, что проводится некоторый эксперимент, результат которого как-то зависит от имеющегося состояния среды. Если в результате эксперимента наблюдается событие A и, кроме того, известны условные вероятности P(A/Bj) для всех j=, то используя формулу Байеса, можно найти послеопытные (апостериорные) вероятности каждого состояния среды. Знание уточненных вероятностей состояний среды позволяет более точно указать стратегию ЛПР.

    Описанный подход к принятию решений в условиях риска называется байесовским, так как он основан на формуле Байеса. Этот подход иллюстрируется примером, рассмотренным ниже.

    Задача. Бурение нефтяной скважины.

    Руководитель поисковой группы должен принять решение: бурить нефтяную скважину или нет. Скважина может оказаться "сухой" (С), т.е. без нефти, "маломощной" (М), т.е. с малым содержанием нефти, и "богатой" (Б), т.е. с большим содержанием нефти. Альтернативами руководителя группы являются: x1 - бурить и x2 - не бурить. Чистая прибыль при выборе одной из альтернатив в зависимости от возможного типа скважины приведена в таблице прибылей (см. табл. 1)

    Таблица 1. Платёжная матрица

    Тип скважины

    Кроме того, руководителю поисковой группы известно, что в данной местности вероятности сухой, маломощной или богатой скважины таковы: P(C)=0.5, P(M)=0.3, P(Б)=0.2.

    Руководитель поисковой группы может провести эксперимент с целью уточнения структуры грунта (состояния среды). Этот эксперимент представляет собой сейсморазведку, результатом которой будет ответ - какова структура грунта в данной местности (но не ответ на вопрос о типе скважины!). В принципе структура грунта может быть либо открытой (О), либо замкнутой (З). Руководитель группы имеет таблицу результатов экспериментов, приведённой в этой местности (см. табл. 2).

    Таблица 2. Таблица экспериментальных данных

    Эта таблица показывает, сколько раз на грунтах открытой и грунтах замкнутой структуры встречались скважины типа С, М, Б (т.е. даёт совместную статистику грунта и типа скважин для данной местности).

    Проведём анализ экспериментальных данных полученной таблицы. Предположим, что произведено n экспериментов, результаты которых являются значениями дискретных случайных величин X (тип скважины) и Y (структура грунта), которые принимают соответственно значения С, М, Б и О, З. Обозначим через n11 число экспериментов, в которых X=С и Y=О, через n12 число экспериментов, в которых X=С и Y=З, через n21 число экспериментов, в которых X=М и Y=О и т.д. В нашем случае n=100, n11=45, n12=5, n21=11. Разделив значения таблицы 2 на 100 (на число проведённых экспериментов), мы получим закон распределения двумерной случайной величины (X, Y) заданной в табличной форме (см. табл. 3).

    Таблица 3. Статистический ряд распределения двумерной с.в. (X, Y)

    Из таблицы 3 следует, что Р(X=C)=P(C)=0.5, Р(X=M)=P(M)=0.3, Р(X=Б)=P(Б)=0.2; Р(Y=O)=P(O)=0.6, Р(Y=З)=P(З)=0.4,

    Итак, руководитель группы должен принять решение:

    • · проводить ли эксперимент (его стоимость составляет 10 единиц);
    • · если проводить, то, как поступать в дальнейшем в зависимости от результатов эксперимента.

    Таким образом, получена многошаговая задача принятия решений в условиях риска. Опишем методику нахождения оптимального решения.

    Шаг 1. Построим дерево (рис. 1), на котором указаны все этапы процесса принятия решений - дерево решений. Ветви дерева соответствуют возможным альтернативам, а вершины - возникающим ситуациям. Альтернативами руководителя поисковой группы являются: б - отказ от эксперимента, в - проведение эксперимента, x1 - бурить, x2 - не бурить. Состояния природы: выбор типа скважины (С, М, Б), а также выбор структуры грунта (О, З).

    Построенное дерево определяет игру руководителя группы с природой. Позициями данной игры служат вершины дерева, а ходами игроков - выбираемые ими решения. Позиции, в которых ход делает руководитель группы, изображены прямоугольником; позиции, в которых ход делает природа, - кружком.

    Игра протекает следующим образом. В начальной позиции ход делает руководитель группы. Он должен принять решение - отказаться от эксперимента (выбрать решение б) или проводить эксперимент (выбрать решение в). Если он отказался от эксперимента, то игра переходит в следующую позицию, в которой руководитель группы должен принять решение: бурить (выбрать альтернативу x1) или не бурить (выбрать альтернативу x2). Если же он решает проводить эксперимент, то игра переходит в позицию, в которой ход делает природа, выбирая одно из состояний О или З, соответствующих возможным результатам эксперимента, и т. д. Игра заканчивается тогда, когда она переходит в окончательную позицию (т.е. вершину дерева, для которой нет исходящих из неё ветвей)

    Шаг 2. Для каждого решения, которое является ходом природы (т.е. исходит из позиции, изображённой кружком), надо найти вероятность этого хода. Для этого поступаем следующим образом. Для каждой позиции дерева существует единственный путь, соединяющий эту позицию с начальной позицией. Если это для позиции природы, путь, соединяющий её с с начальной позицией, не проходит через позицию (Э), означающую проведение эксперимента, то вероятности состояний Р(С), Р(М) и Р(Б) являются безусловными (доопытными) и находятся из табл. 3:

    Р(С)=50/100, Р(М)=30/100, Р(Б)=20/100.

    Если же для позиции природы путь, соединяющий её с начальной позицией, проходит через позицию (Э), то вероятности состояний среды становятся условными вероятностями и находятся по формулам (1), используя данные табл. 3:

    В позиции (Э) вероятности ходов, приводящих к позициям (О) и (З), находятся из таблицы 3: Р(О)=0.6, Р(З)=0.4.


    Рис. 1.

    Шаг 3. Произведём оценку всех позиций дерева игры, "спускаясь" от конечных позиций к начальной. Оценкой позиции служит ожидаемый выигрыш в этой позиции. Оценки конечных позиций находим из таблицы 2. Укажем теперь способ нахождения оценки произвольной позиции дерева игры в предположении, что уже найдены оценки всех следующих за ней позиций.

    Для позиции природы её оценка представляет собой ожидаемый выигрыш (см. рис 2);

    Для позиции игрока оценкой служит максимум всех за ней позиций. Мотив: в "своей" позиции игрок может сделать любой ход, поэтому он выберет тот, который приводит к наибольшему возможному выигрышу (см. рис 3). В каждой позиции игрок помечает черточкой ту ветвь дерева, которая приводит к позиции, имеющей максимальную оценку.


    Обратимся к рис. 1. Получаем, что в начальной позиции ожидаемая прибыль без проведения эксперимента (альтернатива б) - 20 единиц; ожидаемая прибыль с проведением эксперимента (альтернатива в) - 28 единиц. Таким образом, целесообразным является решение - проводить эксперимент (сейсморазведку). Далее, если эксперимент покажет, что грунт открытый, то бурение производить не следует, а если замкнутый, то нужно бурить.

    • 1 - ветвь: =20
    • 2 - ветвь: 0
    • 3 - ветвь:= -30
    • 4 - ветвь: 0
    • 5 - ветвь: =95
    • 6 - ветвь: 0

    Как следует из условия задачи, значение в 95 единиц мы можем получить с вероятностью 0.4. Следовательно, ожидаемый выигрыш будет равен 0.4*95=38 единицам. Вычитаем расходы на проведение эксперимента равное 10 единицам.

    В итоге получим 28 единиц.

    Деревья решений иерархически представляют собой логическую структуру принятия решений, и облегчает тем самым понимание задачи и процесс её решения. В отличие от матрицы решений здесь можно видеть временной ход процесса принятия решения. Дерево решений нельзя, однако, в общем случае представить простой матрицей решений; так могут быть представлены лишь отдельные этапы процесса. Разбиение на этапы производят так, чтобы выбор решения начинался с некоторого узла решений, от которого исходят одна или несколько ветвей, представляющих варианты решений. Далее следуют узлы событий и на конце - листья", представляющие конечные состояния с указанием значений соответствующих выходных параметров. Если же за узлами событий следует опять узел решений с соответствующими действиями, тогда это и всё последующие разветвления относятся к более поздней стадии выбора решения.. Таким образом, можно проследить весь путь с начала до конца дерева решений.

    В дереве решений различают узлы событий и узлы решений. Можно себе представить, что в узлах событий выбор дальнейшего пути определяется внешними условиями (природой, в теории игр противником), а в узлах решений - лицом, принимающим решение.

    Деревья решений легко поддаются модификации: при необходимости их можно дополнительно развить, а в случаях, когда какие-либо ветви практически лишены значения, - соответственно уменьшить. Узлы решений, если они связаны с одним действием и не разделены узлами событий могут быть объединены. То же справедливо и для узлов событий.



    Поделиться