В математике теория оптимальной остановки [1] [2] или ранней остановки [3] связана с проблемой выбора времени для выполнения определенного действия, чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Проблемы с оптимальной остановкой можно найти в областях статистики , экономики и математических финансов (связанных с ценообразованием на американские опционы ). Ключевым примером проблемы оптимальной остановки является проблема секретаря . Задачи оптимальной остановки часто можно записать в виде уравнения Беллмана, и поэтому часто решаются с помощью динамического программирования .
Определение [ править ]
Случай дискретного времени [ править ]
Проблемы с правилами остановки связаны с двумя объектами:
- Последовательность случайных величин , совместное распределение которых считается известным.
- Последовательность функций вознаграждения, которые зависят от наблюдаемых значений случайных величин в 1:
Учитывая эти объекты, проблема заключается в следующем:
- Вы наблюдаете за последовательностью случайных величин, и на каждом этапе вы можете либо прекратить наблюдение, либо продолжить.
- Если вы перестанете наблюдать за шагом , вы получите награду
- Вы хотите выбрать правило остановки, чтобы максимизировать ожидаемое вознаграждение (или, что то же самое, минимизировать ожидаемые убытки).
Случай непрерывного времени [ править ]
Рассмотрим коэффициент усиления процессов , определенных на фильтрованной вероятностном пространстве и предположим , что будет адаптирована к фильтрации. Оптимальная задача остановки - найти время остановки, которое максимизирует ожидаемый выигрыш.
где называется функцией ценности . Здесь можно принять значение .
Более конкретная формулировка выглядит следующим образом. Мы считаем , адаптированный сильный марковский процесс , определенный на фильтрованной вероятностном пространстве , где обозначает вероятностную меру где стохастический процесс начинается в . Для непрерывных функций и задача оптимальной остановки:
Это иногда называют формулировкой MLS (что означает Mayer, Lagrange и supremum, соответственно). [4]
Способы решения [ править ]
Обычно существует два подхода к решению проблем оптимальной остановки. [4] Когда основной процесс (или процесс усиления) описывается его безусловными конечномерными распределениями , подходящим методом решения является мартингальный подход, названный так потому, что он использует теорию мартингейла , наиболее важной концепцией которой является огибающая Снеллиуса . В случае дискретного времени, если горизонт планирования конечен, проблема также может быть легко решена с помощью динамического программирования .
Когда основной процесс определяется семейством (условных) переходных функций, приводящих к марковскому семейству переходных вероятностей, часто можно использовать мощные аналитические инструменты, предоставляемые теорией марковских процессов, и этот подход называется методом Маркова. Решение обычно получается путем решения связанных задач со свободной границей ( задачи Стефана ).
Результат диффузии скачка [ править ]
Пусть - диффузия Леви, заданная СДУ
где это - мерное броуновское движение , является -мерном компенсацией Пуассона случайная мера , , , и заданные функции , такие , что единственное решение существует. Пусть - открытое множество (область платежеспособности) и
время банкротства. Оптимальная проблема остановки:
Оказывается, что при некоторых условиях регулярности [5] справедлива следующая теорема проверки:
Если функция удовлетворяет
- где область продолжения ,
- на , и
- на , где это инфинитезимальный из
потом для всех . Более того, если
- на
Тогда для всех и является оптимальным временем остановки.
Эти условия также можно записать в более компактной форме ( интегро-вариационное неравенство ):
- на
Примеры [ править ]
Подбрасывание монет [ править ]
(Пример, где сходится)
У вас есть честная монета, и вы постоянно ее подбрасываете. Каждый раз, прежде чем он будет брошен, вы можете прекратить его бросать и получить оплату (например, в долларах) за среднее количество наблюдаемых орлов.
Вы хотите максимизировать получаемую сумму, выбрав правило остановки. Если X i (для i ≥ 1) образует последовательность независимых одинаково распределенных случайных величин с распределением Бернулли
и если
затем последовательности , и являются объектами, связанными с этой проблемой.
Продажа дома [ править ]
(Пример, где не обязательно сходится)
У вас есть дом, и вы хотите его продать. Каждый день вам предлагают дом, и вы платите, чтобы продолжать его рекламировать. Если вы продадите свой дом на день , вы заработаете , где .
Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.
В этом примере последовательность ( ) - это последовательность предложений для вашего дома, а последовательность функций вознаграждения - это то, сколько вы заработаете.
Проблема с секретарем [ править ]
(Пример, где - конечная последовательность)
Вы наблюдаете за последовательностью объектов, которые можно отсортировать от лучших к худшим. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы выбрать лучший объект.
Здесь, если ( n - некоторое большое число) - это ранги объектов и вероятность того, что вы выберете лучший объект, если вы перестанете намеренно отклонять объекты на шаге i, то и - это последовательности, связанные с этой проблемой. Эта проблема была решена в начале 1960-х несколькими людьми. Элегантное решение проблемы секретаря и несколько модификаций этой проблемы обеспечивается более поздним алгоритмом оптимальной остановки (алгоритм Брюсса).
Теория поиска [ править ]
Экономисты изучили ряд задач оптимальной остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно сосредоточена на поиске работником высокооплачиваемой работы или поиске потребителем недорогого товара.
Проблема с парковкой [ править ]
Частным примером применения теории поиска является задача оптимального выбора парковочного места водителем, идущим в оперу (театр, магазины и т. Д.). Подъезжая к месту назначения, водитель идет по улице, вдоль которой есть парковочные места - обычно только некоторые места на парковке свободны. Цель хорошо видна, поэтому расстояние до цели легко оценить. Задача водителя - выбрать свободное парковочное место как можно ближе к месту назначения, не разворачиваясь, чтобы расстояние от этого места до места назначения было кратчайшим. [6]
Торговля опционами [ править ]
При торговле опционами на финансовых рынках держателю американского опциона разрешается реализовать право на покупку (или продажу) базового актива по заранее определенной цене в любое время до или в день истечения срока действия. Следовательно, оценка американских опционов, по сути, является оптимальной задачей для остановки. Рассмотрим классическую Блэка-Шоулза набор-и пусть будет безрисковая процентная ставка и и быть размер дивидендов и волатильность акций. Цена акций следует геометрическому броуновскому движению.
в рамках меры, нейтральной к риску.
Когда опция бессрочная, оптимальная проблема остановки:
где функция выплаты предназначена для опциона колл и опциона пут. Вариационное неравенство
для всех, где проходит граница упражнений. Как известно, решение [7]
- (Бессрочный звонок) где и
- (Perpetual put) где и
С другой стороны, когда срок годности конечен, проблема связана с двумерной задачей со свободной границей без известного решения в замкнутой форме. Однако можно использовать различные численные методы. См. Здесь модель Блэка – Шоулза # Американские опционы для различных методов оценки, а также Fugit для дискретного, древовидного расчета оптимального времени для исполнения.
См. Также [ править ]
- Проблема с остановкой
- Марковский процесс принятия решений
- Теорема о необязательной остановке
- Стохастический контроль
Ссылки [ править ]
- ^ Чоу, Ю.С.; Роббинс, Х .; Зигмунд, Д. (1971). Большие надежды: теория оптимальной остановки . Бостон: Хоутон Миффлин .
- ^ Фергюсон, Томас С. (2007). Оптимальная остановка и приложения . UCLA.
- ^ Хилл, Теодор П. (2009). «Зная, когда остановиться». Американский ученый . 97 : 126–133. DOI : 10.1511 / 2009.77.126 . ISSN 1545-2786 - via (французский перевод см. На обложке июльского выпуска журнала Pour la Science (2009)).
- ^ а б Пескир, Горан; Ширяев, Альберт (2006). «Оптимальная остановка и задачи со свободной границей». Лекции по математике. ETH Zürich. DOI : 10.1007 / 978-3-7643-7390-0 . ISBN 978-3-7643-2419-3. Cite journal requires
|journal=
(help) - ^ Эксендал, Б .; Сулем, AS (2007). «Прикладное стохастическое управление скачкообразными диффузиями». DOI : 10.1007 / 978-3-540-69826-5 . ISBN 978-3-540-69825-8. Cite journal requires
|journal=
(help) - ^ MacQueen, J .; Миллер-младший, Р.Г. (1960). «Оптимальные политики настойчивости». Исследование операций . 8 (3): 362–380. DOI : 10.1287 / opre.8.3.362 . ISSN 0030-364X .
- ^ Karatzas, Иоаннис; Шрив, Стивен Э. (1998). «Методы математических финансов». Стохастическое моделирование и прикладная вероятность. 39 . DOI : 10.1007 / b98840 . ISBN 978-0-387-94839-3. Cite journal requires
|journal=
(help)
- Томас С. Фергюсон , Оптимальная остановка и приложения , получено 21 июня 2007 г.
- Томас С. Фергюсон , « Кто решил проблему секретаря? » Статистическая наука , Vol. 4., 282–296, (1989)
- Ф. Томас Брюсс . «Суммируйте шансы на единицу и остановитесь». Анналы вероятности , Vol. 28, 1384–1391, (2000)
- Ф. Томас Брюсс. «Искусство принимать правильные решения: почему лица, принимающие решения, хотят знать алгоритм шансов». Информационный бюллетень Европейского математического общества , выпуск 62, 14–20, (2006)
- Rogerson, R .; Shimer, R .; Райт, Р. (2005). «Теоретико-поисковые модели рынка труда: обзор». Журнал экономической литературы . 43 (4): 959–88. JSTOR 4129380 .