Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В математике теория оптимальной остановки [1] [2] или ранней остановки [3] связана с проблемой выбора времени для выполнения определенного действия, чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Проблемы с оптимальной остановкой можно найти в областях статистики , экономики и математических финансов (связанных с ценообразованием на американские опционы ). Ключевым примером проблемы оптимальной остановки является проблема секретаря . Задачи оптимальной остановки часто можно записать в виде уравнения Беллмана, и поэтому часто решаются с помощью динамического программирования .

Определение [ править ]

Случай дискретного времени [ править ]

Проблемы с правилами остановки связаны с двумя объектами:

  1. Последовательность случайных величин , совместное распределение которых считается известным.
  2. Последовательность функций вознаграждения, которые зависят от наблюдаемых значений случайных величин в 1:

Учитывая эти объекты, проблема заключается в следующем:

  • Вы наблюдаете за последовательностью случайных величин, и на каждом этапе вы можете либо прекратить наблюдение, либо продолжить.
  • Если вы перестанете наблюдать за шагом , вы получите награду
  • Вы хотите выбрать правило остановки, чтобы максимизировать ожидаемое вознаграждение (или, что то же самое, минимизировать ожидаемые убытки).

Случай непрерывного времени [ править ]

Рассмотрим коэффициент усиления процессов , определенных на фильтрованной вероятностном пространстве и предположим , что будет адаптирована к фильтрации. Оптимальная задача остановки - найти время остановки, которое максимизирует ожидаемый выигрыш.

где называется функцией ценности . Здесь можно принять значение .

Более конкретная формулировка выглядит следующим образом. Мы считаем , адаптированный сильный марковский процесс , определенный на фильтрованной вероятностном пространстве , где обозначает вероятностную меру где стохастический процесс начинается в . Для непрерывных функций и задача оптимальной остановки:

Это иногда называют формулировкой MLS (что означает Mayer, Lagrange и supremum, соответственно). [4]

Способы решения [ править ]

Обычно существует два подхода к решению проблем оптимальной остановки. [4] Когда основной процесс (или процесс усиления) описывается его безусловными конечномерными распределениями , подходящим методом решения является мартингальный подход, названный так потому, что он использует теорию мартингейла , наиболее важной концепцией которой является огибающая Снеллиуса . В случае дискретного времени, если горизонт планирования конечен, проблема также может быть легко решена с помощью динамического программирования .

Когда основной процесс определяется семейством (условных) переходных функций, приводящих к марковскому семейству переходных вероятностей, часто можно использовать мощные аналитические инструменты, предоставляемые теорией марковских процессов, и этот подход называется методом Маркова. Решение обычно получается путем решения связанных задач со свободной границей ( задачи Стефана ).

Результат диффузии скачка [ править ]

Пусть - диффузия Леви, заданная СДУ

где это - мерное броуновское движение , является -мерном компенсацией Пуассона случайная мера , , , и заданные функции , такие , что единственное решение существует. Пусть - открытое множество (область платежеспособности) и

время банкротства. Оптимальная проблема остановки:

Оказывается, что при некоторых условиях регулярности [5] справедлива следующая теорема проверки:

Если функция удовлетворяет

  • где область продолжения ,
  • на , и
  • на , где это инфинитезимальный из

потом для всех . Более того, если

  • на

Тогда для всех и является оптимальным временем остановки.

Эти условия также можно записать в более компактной форме ( интегро-вариационное неравенство ):

  • на

Примеры [ править ]

Подбрасывание монет [ править ]

(Пример, где сходится)

У вас есть честная монета, и вы постоянно ее подбрасываете. Каждый раз, прежде чем он будет брошен, вы можете прекратить его бросать и получить оплату (например, в долларах) за среднее количество наблюдаемых орлов.

Вы хотите максимизировать получаемую сумму, выбрав правило остановки. Если X i (для i ≥ 1) образует последовательность независимых одинаково распределенных случайных величин с распределением Бернулли

и если

затем последовательности , и являются объектами, связанными с этой проблемой.

Продажа дома [ править ]

(Пример, где не обязательно сходится)

У вас есть дом, и вы хотите его продать. Каждый день вам предлагают дом, и вы платите, чтобы продолжать его рекламировать. Если вы продадите свой дом на день , вы заработаете , где .

Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.

В этом примере последовательность ( ) - это последовательность предложений для вашего дома, а последовательность функций вознаграждения - это то, сколько вы заработаете.

Проблема с секретарем [ править ]

(Пример, где - конечная последовательность)

Вы наблюдаете за последовательностью объектов, которые можно отсортировать от лучших к худшим. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы выбрать лучший объект.

Здесь, если ( n - некоторое большое число) - это ранги объектов и вероятность того, что вы выберете лучший объект, если вы перестанете намеренно отклонять объекты на шаге i, то и - это последовательности, связанные с этой проблемой. Эта проблема была решена в начале 1960-х несколькими людьми. Элегантное решение проблемы секретаря и несколько модификаций этой проблемы обеспечивается более поздним алгоритмом оптимальной остановки (алгоритм Брюсса).

Теория поиска [ править ]

Экономисты изучили ряд задач оптимальной остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно сосредоточена на поиске работником высокооплачиваемой работы или поиске потребителем недорогого товара.

Проблема с парковкой [ править ]

Частным примером применения теории поиска является задача оптимального выбора парковочного места водителем, идущим в оперу (театр, магазины и т. Д.). Подъезжая к месту назначения, водитель идет по улице, вдоль которой есть парковочные места - обычно только некоторые места на парковке свободны. Цель хорошо видна, поэтому расстояние до цели легко оценить. Задача водителя - выбрать свободное парковочное место как можно ближе к месту назначения, не разворачиваясь, чтобы расстояние от этого места до места назначения было кратчайшим. [6]

Торговля опционами [ править ]

При торговле опционами на финансовых рынках держателю американского опциона разрешается реализовать право на покупку (или продажу) базового актива по заранее определенной цене в любое время до или в день истечения срока действия. Следовательно, оценка американских опционов, по сути, является оптимальной задачей для остановки. Рассмотрим классическую Блэка-Шоулза набор-и пусть будет безрисковая процентная ставка и и быть размер дивидендов и волатильность акций. Цена акций следует геометрическому броуновскому движению.

в рамках меры, нейтральной к риску.

Когда опция бессрочная, оптимальная проблема остановки:

где функция выплаты предназначена для опциона колл и опциона пут. Вариационное неравенство

для всех, где проходит граница упражнений. Как известно, решение [7]

  • (Бессрочный звонок) где и
  • (Perpetual put) где и

С другой стороны, когда срок годности конечен, проблема связана с двумерной задачей со свободной границей без известного решения в замкнутой форме. Однако можно использовать различные численные методы. См. Здесь модель Блэка – Шоулза # Американские опционы для различных методов оценки, а также Fugit для дискретного, древовидного расчета оптимального времени для исполнения.

См. Также [ править ]

  • Проблема с остановкой
  • Марковский процесс принятия решений
  • Теорема о необязательной остановке
  • Стохастический контроль

Ссылки [ править ]

  1. ^ Чоу, Ю.С.; Роббинс, Х .; Зигмунд, Д. (1971). Большие надежды: теория оптимальной остановки . Бостон: Хоутон Миффлин .
  2. ^ Фергюсон, Томас С. (2007). Оптимальная остановка и приложения . UCLA.
  3. ^ Хилл, Теодор П. (2009). «Зная, когда остановиться». Американский ученый . 97 : 126–133. DOI : 10.1511 / 2009.77.126 . ISSN 1545-2786 - via (французский перевод см. На обложке июльского выпуска журнала Pour la Science (2009)). 
  4. ^ а б Пескир, Горан; Ширяев, Альберт (2006). «Оптимальная остановка и задачи со свободной границей». Лекции по математике. ETH Zürich. DOI : 10.1007 / 978-3-7643-7390-0 . ISBN 978-3-7643-2419-3. Cite journal requires |journal= (help)
  5. ^ Эксендал, Б .; Сулем, AS (2007). «Прикладное стохастическое управление скачкообразными диффузиями». DOI : 10.1007 / 978-3-540-69826-5 . ISBN 978-3-540-69825-8. Cite journal requires |journal= (help)
  6. ^ MacQueen, J .; Миллер-младший, Р.Г. (1960). «Оптимальные политики настойчивости». Исследование операций . 8 (3): 362–380. DOI : 10.1287 / opre.8.3.362 . ISSN 0030-364X . 
  7. ^ Karatzas, Иоаннис; Шрив, Стивен Э. (1998). «Методы математических финансов». Стохастическое моделирование и прикладная вероятность. 39 . DOI : 10.1007 / b98840 . ISBN 978-0-387-94839-3. Cite journal requires |journal= (help)
  • Томас С. Фергюсон , Оптимальная остановка и приложения , получено 21 июня 2007 г.
  • Томас С. Фергюсон , « Кто решил проблему секретаря? » Статистическая наука , Vol. 4., 282–296, (1989)
  • Ф. Томас Брюсс . «Суммируйте шансы на единицу и остановитесь». Анналы вероятности , Vol. 28, 1384–1391, (2000)
  • Ф. Томас Брюсс. «Искусство принимать правильные решения: почему лица, принимающие решения, хотят знать алгоритм шансов». Информационный бюллетень Европейского математического общества , выпуск 62, 14–20, (2006)
  • Rogerson, R .; Shimer, R .; Райт, Р. (2005). «Теоретико-поисковые модели рынка труда: обзор». Журнал экономической литературы . 43 (4): 959–88. JSTOR  4129380 .