Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Проблема состоит в том, чтобы быстро найти решение среди кандидатов a, b и c, которое было бы таким же хорошим, как и любое другое, где качество равно 0 или 1. Существует восемь примеров («обеденных тарелок») f xyz проблемы, где x , y и z обозначают степень качества a, b и c соответственно. Процедура («ресторан») A оценивает кандидатов в порядке a, b, c, а B оценивает кандидатов в обратном порядке, но каждый «взимает» 1 оценку в 5 случаях, 2 оценки в 2 случаях и 3 оценки в 1 случае. .

В области вычислительной сложности и оптимизации теорема об отсутствии бесплатного обеда является результатом, который утверждает, что для определенных типов математических задач вычислительные затраты на поиск решения, усредненные по всем задачам в классе, одинаковы для любого метода решения. Следовательно, никакое решение не предлагает "короткого пути". Это сделано в предположении, что пространство поиска является функцией плотности вероятности. Это не относится к случаю, когда пространство поиска имеет базовую структуру (например, дифференцируемую функцию), которую можно использовать более эффективно (например , метод Ньютона в оптимизации), чем случайный поиск, или даже имеет решения в замкнутой форме (например, экстремумы квадратичного многочлена), которые могут быть определены вообще без поиска. Для таких вероятностных допущений результаты всех процедур, решающих конкретный тип проблемы, статистически идентичны. Красочный способ описания такого обстоятельства, предложенный Дэвидом Вольпертом и Уильямом Дж. Макреди в связи с проблемами поиска [1] и оптимизации [2], - это сказать, что бесплатного обеда не бывает . Вольперт ранее не выводил теоремы о бесплатном обеде для машинного обучения ( статистический вывод ). [3] Перед публикацией статьи Вольперта Каллен Шаффер независимо доказал ограниченную версию одной из теорем Вольперта и использовал ее для критики текущего состояния исследований в области машинного обучения по проблеме индукции. [4]

В метафоре «без бесплатного обеда» каждый «ресторан» (процедура решения проблемы) имеет «меню», связывающее каждую «обеденную тарелку» (проблему) с «ценой» (выполнение процедуры при решении проблемы). Меню ресторанов идентичны, за исключением одного - цены меняются от одного ресторана к другому. Для всеядного человека, который так же склонен заказывать каждую тарелку, как и любую другую, средняя стоимость обеда не зависит от выбора ресторана. Но веган, который регулярно ходит на обед с хищникомкто стремится к экономии, может заплатить высокую среднюю стоимость обеда. Чтобы методично снизить среднюю стоимость, нужно заранее знать: а) что заказывать и б) сколько будет стоить заказ в различных ресторанах. То есть повышение производительности при решении проблем зависит от использования предшествующей информации для сопоставления процедур с проблемами. [2] [4]

Формально не бывает бесплатного обеда, когда распределение вероятностей для экземпляров проблемы таково, что все решатели задач имеют одинаково распределенные результаты. В случае поиска экземпляром проблемы является целевая функция , а результатом является последовательность значений, полученных при оценке возможных решений в области определения функции. Для типичной интерпретации результатов поиск - это процесс оптимизации . Бесплатного обеда в поиске нет тогда и только тогда, когда распределение по целевым функциям инвариантно относительно перестановки пространства возможных решений. [5] [6][7] Это условие не выполняется в точности на практике, [6] но теорема «(почти) без бесплатного обеда» предполагает, что оно выполняется приблизительно. [8]

Обзор [ править ]

Некоторые вычислительные проблемы решаются путем поиска хороших решений в пространстве возможных решений . Описание того, как многократно выбирать возможные решения для оценки, называется алгоритмом поиска . По конкретной проблеме разные алгоритмы поиска могут давать разные результаты, но по всем задачам они неотличимы. Отсюда следует, что если алгоритм достигает лучших результатов по некоторым задачам, он должен расплачиваться меньшими результатами по другим задачам. В этом смысле бесплатного обеда в поиске не бывает . [1] В качестве альтернативы, согласно Шафферу, [4] производительность поиска сохраняется . Обычно поиск трактуется как оптимизация, и это приводит к наблюдению, что в оптимизации нет бесплатного обеда. [2]

«Теорема Вольперта и Макреди о запрете бесплатного обеда», как прямо сформулировали сами Вольперт и Макреди, заключается в том, что «любые два алгоритма эквивалентны, если их производительность усредняется по всем возможным задачам». [9] Результаты «без бесплатного обеда» показывают, что сопоставление алгоритмов задачам дает более высокую среднюю производительность, чем применение фиксированного алгоритма ко всем. [ необходима цитата ] Игель и Туссен [6] и Инглиш [7] установили общее условие, при котором не будет бесплатного обеда. Хотя это физически возможно, в точности нет. [6]Дросте, Янсен и Вегенер доказали теорему, которую они интерпретируют как указание на то, что на практике «(почти) нет бесплатного обеда». [8]

Чтобы сделать ситуацию более конкретной, представьте, что специалист по оптимизации столкнулся с проблемой. Имея некоторое представление о том, как возникла проблема, практикующий может использовать эти знания при выборе алгоритма, который будет хорошо работать при решении проблемы. Если практикующий не понимает, как использовать эти знания, или просто не имеет знаний, тогда он или она сталкивается с вопросом, превосходит ли какой-то алгоритм в целом по реальным задачам. Авторы теоремы «(почти) без бесплатного обеда» говорят, что ответ по существу отрицательный, но допускают некоторые оговорки относительно того, относится ли эта теорема к практике. [8]

Нет бесплатного обеда (НФЛ) [ править ]

«Проблема» - это, более формально, целевая функция, которая связывает возможные решения с ценностями добродетели. Алгоритм поиска принимает целевую функцию в качестве входных данных и оценивает кандидатов растворы один за другим. Результатом работы алгоритма является последовательность наблюдаемых значений качества. [10] [11]

Вольперт и Макреди утверждают, что алгоритм никогда не переоценивает возможное решение, и что производительность алгоритма измеряется на выходе. [2] Для простоты мы запрещаем случайность в алгоритмах. В этих условиях, когда алгоритм поиска запускается для каждого возможного входа, он генерирует каждый возможный выход ровно один раз. [7] Поскольку производительность измеряется на выходе, алгоритмы неотличимы по тому, как часто они достигают определенных уровней производительности.

Некоторые показатели производительности показывают, насколько хорошо алгоритмы поиска справляются с оптимизацией целевой функции. Действительно, похоже, что в рассматриваемом классе нет интересного применения алгоритмов поиска, кроме задач оптимизации. Обычным показателем производительности является наименьший показатель наименьшего значения в выходной последовательности. Это количество оценок, необходимых для минимизации целевой функции. Для некоторых алгоритмов время, необходимое для поиска минимума, пропорционально количеству оценок. [7]

Исходные теоремы об отсутствии бесплатного обеда (NFL) предполагают, что все целевые функции с одинаковой вероятностью будут входить в алгоритмы поиска. [2] С тех пор было установлено, что NFL существует тогда и только тогда, когда, грубо говоря, «перемешивание» целевых функций не влияет на их вероятности. [6] [7] Хотя это условие для NFL физически возможно, утверждалось, что оно определенно не выполняется в точности. [6]

Очевидное толкование слова «не НФЛ» - это «бесплатный обед», но это вводит в заблуждение. НФЛ - это вопрос степени, а не принцип «все или ничего». Если условие для NFL выполняется приблизительно, то все алгоритмы дают примерно одинаковые результаты по всем целевым функциям. [7] «Не NFL» подразумевает только то, что алгоритмы в целом неэквивалентны по некоторой степени производительности. Для интересующей меры производительности алгоритмы могут оставаться эквивалентными или почти такими же. [7]

НФЛ и колмогоровская случайность [ править ]

Почти все элементы множества всех возможных функций (в теоретико-множественном смысле слова «функция») являются случайными по Колмогорову , и, следовательно, теоремы НФЛ применимы к набору функций, почти все из которых не могут быть выражены более компактно, чем поиск таблица, содержащая отдельную (и случайную) запись для каждой точки в пространстве поиска. Функции, которые можно выразить более компактно (например, математическим выражением разумного размера), по определению не являются случайными по Колмогорову.

Кроме того, в наборе всех возможных целевых функций уровни качества одинаково представлены среди возможных решений, следовательно, хорошие решения разбросаны по всему пространству кандидатов. Соответственно, алгоритм поиска редко оценивает больше, чем небольшую часть кандидатов, прежде чем найти очень хорошее решение. [11]

Почти все целевые функции имеют настолько высокую колмогоровскую сложность, что их нельзя сохранить на конкретном компьютере. [5] [7] [11] Точнее, если мы смоделируем данный физический компьютер как регистровую машину с заданным размером памяти порядка памяти современных компьютеров, то большинство объективных функций не могут быть сохранены в их памяти. Типичная целевая функция или алгоритм содержит больше информации, чем по оценке Сета Ллойда, которую наблюдаемая вселенная способна зарегистрировать. [12] Например, если каждое возможное решение закодировано как последовательность из 300 нулей и единиц, а значения качества равны 0 и 1, то большинство целевых функций имеют сложность Колмогорова не менее 2300бит, [13] и это больше, чем предел Ллойда 10 90 ≈ 2 299 бит. Отсюда следует, что исходная теорема «без бесплатного обеда» неприменима к тому, что может храниться на физическом компьютере; вместо этого нужно применять так называемые «ужесточенные» теоремы об отсутствии бесплатного обеда. Также было показано, что результаты NFL применимы к невычислимым функциям. [14]

Официальный синопсис НФЛ [ править ]

это совокупность всех целевых функций F : XY , где есть конечное пространство решений и является конечным ч.у.м. . Множество всех перестановок из X является J . Случайная величина F распределена на . Для всех j в J , F o j является случайной величиной, распределенной на , с P ( F o j = f ) = P ( F = f o j −1 ) для всех f в .

Пусть a ( f ) обозначает выход алгоритма поиска a на входе f . Если a ( F ) и b ( F ) одинаково распределены для всех поисковых алгоритмов a и b , то F имеет распределение NFL . Это условие выполняется тогда и только тогда , когда F и F о J одинаково распределены для всех J в J . [6] [7]Другими словами, для алгоритмов поиска нет бесплатного обеда тогда и только тогда, когда распределение целевых функций инвариантно относительно перестановки пространства решений. [15] Теоретико-множественные теоремы о НФЛ недавно были обобщены на произвольную мощность и . [16]

Оригинальные теоремы НФЛ [ править ]

Вольперт и Макреди приводят две основные теоремы НФЛ: первая касается целевых функций, которые не меняются во время поиска, а вторая - целевых функций, которые могут измениться. [2]

Теорема 1 : для любой пары алгоритмов a 1 и a 2

где обозначает упорядоченный набор размера значений затрат , связанные с входными значениями , функция оптимизируются и является условной вероятностью получения заданной последовательности значений затрат от алгоритма прогона раз на функции .

По сути, это говорит о том, что когда все функции f равновероятны, вероятность наблюдения произвольной последовательности из m значений в ходе поиска не зависит от алгоритма поиска. Теорема 1 устанавливает «более тонкий» результат НФЛ для изменяющихся во времени целевых функций.

Интерпретации результатов НФЛ [ править ]

Общепринятая, но не совсем точная интерпретация результатов NFL заключается в том, что «универсальная стратегия оптимизации общего назначения теоретически невозможна, и единственный способ, которым одна стратегия может превзойти другую, - это специализированная стратегия для конкретной рассматриваемой проблемы». [17] Несколько комментариев по порядку:

  • Теоретически существует универсальный оптимизатор общего назначения. Каждый алгоритм поиска хорошо работает почти со всеми целевыми функциями. [11] Итак, если вас не беспокоят «относительно небольшие» различия между алгоритмами поиска, например, из-за того, что компьютерное время дешево, то вам не следует беспокоиться об отсутствии бесплатного обеда.
  • Алгоритм может превзойти другой в решении проблемы, если ни один из них не специализируется на решении этой проблемы. В самом деле, может оказаться, что оба алгоритма являются одними из худших для решения проблемы. В более общем плане Вольперт и Макреди разработали меру степени «согласованности» между алгоритмом и распределением проблем (строго говоря, внутренним продуктом). [2] Сказать, что один алгоритм соответствует распределению лучше, чем другой, не означает, что любой из них был сознательно специализирован для этого распределения; у алгоритма может быть хорошее согласование просто по счастливой случайности.
  • На практике некоторые алгоритмы переоценивают возможные решения. Причина, по которой следует учитывать производительность только кандидатов, никогда ранее не оцениваемых, состоит в том, чтобы убедиться, что при сравнении алгоритмов сравниваются яблоки с яблоками. Более того, любое превосходство алгоритма, который никогда не переоценивает кандидатов, над другим алгоритмом, который делает это для конкретной проблемы, может не иметь ничего общего со специализацией проблемы.
  • Практически для всех целевых функций специализация по сути случайна. Несжимаемые, или случайные по Колмогорову , целевые функции не имеют регулярности, которую мог бы использовать алгоритм, что касается универсальной обработки Тьюринга, используемой для определения случайности Колмогорова. Итак, предположим, что есть один, явно лучший выбор - универсальная машина Тьюринга. Тогда при заданной целевой функции, несжимаемой для этой машины Тьюринга, нет оснований для выбора между двумя алгоритмами, если оба являются сжимаемыми, как измерено с помощью этой машины Тьюринга. Если выбранный алгоритм работает лучше, чем большинство других, результатом является случайность. [11]Случайная функция Колмогорова не имеет представления меньше, чем таблица поиска, которая содержит (случайное) значение, соответствующее каждой точке в пространстве поиска; любая функция, которую можно выразить более компактно, по определению не является случайной по Колмогорову.

На практике в хранилище компьютеров помещаются только сильно сжимаемые (далеко не случайные) целевые функции, и не всегда каждый алгоритм хорошо работает почти со всеми сжимаемыми функциями. Как правило, включение в алгоритм предварительных знаний о проблеме дает преимущество в производительности. Хотя результаты НФЛ представляют собой, в строгом смысле, теоремы о полной занятостидля профессионалов по оптимизации важно иметь в виду более широкий контекст. Во-первых, у людей часто мало предварительных знаний, с которыми можно было бы работать. С другой стороны, включение предшествующих знаний не дает большого увеличения производительности при решении некоторых проблем. Наконец, человеческое время очень дорого по сравнению с компьютерным. Во многих случаях компания предпочла бы медленно оптимизировать функцию с помощью неизмененной компьютерной программы, а не быстро с помощью программы, модифицированной человеком.

Результаты НФЛ не указывают на то, что бесполезно пытаться решать проблемы с неспециализированными алгоритмами. Никто не определил долю практических задач, для которых алгоритм быстро дает хорошие результаты. И есть практический бесплатный обед, нисколько не противоречащий теории. Выполнение алгоритма на компьютере стоит очень мало по сравнению с затратами человеческого времени и преимуществом хорошего решения. Если алгоритму удается найти удовлетворительное решение за приемлемое время, небольшие вложения принесут большую отдачу. Если алгоритм не работает, то мало что теряется.

Коэволюционные бесплатные обеды [ править ]

Вольперт и Макреди доказали, что в коэволюционной оптимизации есть бесплатные обеды . [9] Их анализ «охватывает проблемы« самостоятельной игры ». В этих задачах набор игроков работает вместе, чтобы создать чемпиона, который затем вступает в схватку с одним или несколькими антагонистами в последующей многопользовательской игре». [9]То есть цель - получить хорошего игрока, но без целевой функции. Качество каждого игрока (возможное решение) оценивается по тому, насколько хорошо он играет против других. Алгоритм пытается использовать игроков и их качество игры, чтобы получить лучших игроков. Игрок, признанный алгоритмом лучшим из всех, становится чемпионом. Вольперт и Макреди продемонстрировали, что некоторые коэволюционные алгоритмы обычно превосходят другие алгоритмы по качеству получаемых чемпионов. Создание чемпиона путем самостоятельной игры представляет интерес для эволюционных вычислений и теории игр . Результаты неприменимы к коэволюции биологических видов, которая не дает чемпионов. [9]

См. Также [ править ]

  • Эволюционная информатика
  • Индуктивное смещение
  • бритва Оккама
  • Простота
  • Теорема о гадком утенке

Заметки [ править ]

  1. ^ а б Wolpert, DH; Макреди, WG (1995). «Теоремы о запрете бесплатного обеда для поиска» (PDF) . Технический отчет SFI-TR-95-02-010 . Институт Санта-Фе.
  2. ^ a b c d e f g Wolpert, DH; Макреди, WG (1997). «Теоремы об отсутствии бесплатных обедов для оптимизации» (PDF) . IEEE Transactions по эволюционным вычислениям . 1 : 67.
  3. ^ Wolpert, Дэвид (1996). «Отсутствие априорных различий между алгоритмами обучения» (PDF) . Нейронные вычисления . С. 1341–1390.
  4. ^ a b c Шаффер, Каллен (1994). «Закон сохранения для обобщения производительности» (PDF) . В Willian, H .; Коэн, У. (ред.). Международная конференция по машинному обучению . Сан-Франциско: Морган Кауфманн. С. 259–265.
  5. ^ a b Стритер, М. (2003) « Два широких класса функций, для которых не действует результат без бесплатного обеда », Генетические и эволюционные вычисления - GECCO 2003 , стр. 1418–1430.
  6. ^ a b c d e f g Игель, К., Туссент, М. (2004) " Теорема о запрете бесплатного обеда для неравномерного распределения целевых функций ", Журнал математического моделирования и алгоритмов 3 , стр. 313 –322.
  7. ^ a b c d e f g h i English, T. (2004) No More Lunch: Analysis of Sequential Search , Proceedings of the 2004 IEEE Congress on Evolutionary Computing , стр. 227–234.
  8. ^ a b c С. Дросте, Т. Янсен и И. Вегенер. 2002. " Оптимизация с помощью эвристики рандомизированного поиска: (A) теорема NFL, реалистичные сценарии и сложные функции ", Теоретическая информатика, вып. 287, нет. 1. С. 131–144.
  9. ^ a b c d Wolpert, DH, and Macready, WG (2005) « Коэволюционные бесплатные обеды », IEEE Transactions on Evolutionary Computing, 9 (6): 721–735
  10. ^ Алгоритм поиска также выводит последовательность оцененных возможных решений, но этот вывод не используется в этой статье.
  11. ^ a b c d e Английский, TM (2000). «Оптимизация проста, а обучение типичной работе - трудное дело». Труды Конгресса 2000 г. по эволюционным вычислениям: CEC00 : 924–931. DOI : 10,1109 / CEC.2000.870741 .
  12. Перейти ↑ Lloyd, S. (2002). «Вычислительная мощность Вселенной». Письма с физическим обзором . 88 : 237901–237904. arXiv : квант-ph / 0110141 . DOI : 10.1103 / PhysRevLett.88.237901 .
  13. ^ Ли, М .; Витани, П. (1997). Введение в колмогоровскую сложность и ее приложения (2-е изд.). Нью-Йорк: Спрингер. ISBN 0-387-94868-6.
  14. ^ Вудворд, Джон Р. (2009). «Вычислимые и невычислимые функции и алгоритмы поиска» . IEEE Международная конференция по интеллектуальным вычислениям и интеллектуальные системы, 2009 . 1 . IEEE. С. 871–875.
  15. ^ Часть «только если» была впервые опубликована Шумахером, CW (2000). Поиск черного ящика: основы и методы (кандидатская диссертация). Университет Теннесси, Ноксвилл. ProQuest 304620040 . 
  16. ^ Роу; Восе; Райт. «Переосмысление отсутствия бесплатного обеда» . Эволюционные вычисления . 17 (1): 117–129.
  17. ^ Хо, YC; Пепайн, Д.Л. (2002). «Простое объяснение теоремы без бесплатного обеда и ее последствия». Журнал теории оптимизации и приложений . 115 : 549–570. DOI : 10,1023 / A: 1021251113462 .

Внешние ссылки [ править ]

  • http://www.no-free-lunch.org
  • Рэдклифф и Сарри, 1995 г., «Фундаментальные ограничения алгоритмов поиска: эволюционные вычисления в перспективе» (ранее опубликованная статья по NFL, появившаяся вскоре после статьи Шаффера на ICML, которая, в свою очередь, была основана на препринте Вольперта; доступна в различных форматах)
  • Публикации НФЛ Томаса Инглиша
  • Публикации НФЛ Кристиана Игеля и Марка Туссена
  • Публикации Даррелла Уитли о НФЛ и "бесплатных обедах"
  • Старый список публикаций Дэвида Вольперта, Уильяма Макреди и Марио Кёппена по оптимизации и поиску