Последовательная эвристика

При изучении путей ознакомительных проблем в области искусственного интеллекта , эвристическая функция называется последовательными , или монотонным , если его оценка всегда меньше или равна расчетное расстояние от любой соседней вершины до цели, плюс стоимость достижения этот сосед.

Формально, для каждого узла N и каждый преемник P из N , предполагаемая стоимость достижения цели из N не больше , чем на этапе стоимость получения до P плюс предполагаемой стоимость достижения цели из P . Это:

{\ Displaystyle ч (N) \ Leq с (N, P) + ч (P)}

а также

{\ Displaystyle ч (G) = 0. \,}

где

h - последовательная эвристическая функция
N - любой узел в графе
P - любой потомок N
G - любой целевой узел
c (N, P) - стоимость достижения узла P из N

Неформально каждый узел i будет давать оценку, которая с учетом стоимости достижения следующего узла всегда меньше оценки в узле i + 1 .

Последовательная эвристика также допустима , т. Е. Она никогда не переоценивает стоимость достижения цели ( обратное , однако, не всегда верно). Это доказывается по индукции .

Позволять ${\ displaystyle h (N_ {0}) = 0}$ - оценочная стоимость целевого узла. Отсюда следует, что базовое условие тривиально выполняется при 0 ≤ 0. Поскольку эвристика согласована, ${\ displaystyle h (N_ {i + 1}) \ leq c (N_ {i + 1}, N_ {i}) + h (N_ {i}) = c (N_ {i + 1}, N_ {i} ) + c (N_ {i}, N_ {i-1}) + h (N_ {i-1}) = c (N_ {i + 1}, N_ {i}) + c (N_ {i}, N_ {i-1}) + ... + c (N_ {1}, N_ {0}) + h (N_ {0})}$ . Приведенные сроки равны истинной стоимости, ${\ Displaystyle \ сумма _ {я = 1} ^ {п} с (N_ {я}, N_ {я-1})}$ , поэтому любая последовательная эвристика также допустима, поскольку она ограничена сверху истинной стоимостью.

Обратное явно неверно, поскольку мы всегда можем построить эвристику, которая всегда ниже истинной стоимости, но, тем не менее, несовместима, например, путем увеличения эвристической оценки от самого дальнего узла по мере приближения и, когда оценка ${\ displaystyle h (N_ {i})}$ становится в лучшем случае истинной стоимостью ${\ displaystyle h ^ {*} (N_ {i})}$ , мы делаем ${\ displaystyle h (N_ {i-1}) = h (N_ {i}) - c (N_ {i}, N_ {i-1})}$ .

Последствия монотонности

Сравнение допустимой, но непоследовательной функции эвристической оценки.

Согласованные эвристики называются монотонными, потому что предполагаемая окончательная стоимость частичного решения ${\ displaystyle f (N_ {j}) = g (N_ {j}) + h (N_ {j})}$ монотонно не убывает по лучшему пути к цели, где ${\ displaystyle g (N_ {j}) = \ sum _ {i = 2} ^ {j} c (N_ {i-1}, N_ {i})}$ это стоимость наилучшего пути от начального узла ${\ displaystyle N_ {1}}$ к ${\ displaystyle N_ {j}}$ . Это необходимо и достаточно, чтобы эвристика подчинялась неравенству треугольника , чтобы быть последовательной. ^[1]

В алгоритме поиска A * использование последовательной эвристики означает, что после расширения узла стоимость, с которой он был достигнут, является минимально возможной при тех же условиях, которые алгоритм Дейкстры требует при решении задачи кратчайшего пути (отсутствие циклов с отрицательной стоимостью ). Фактически, если в графе поиска задана стоимость ${\ Displaystyle c '(N, P) = c (N, P) + h (P) -h (N)}$ для последовательного ${\ displaystyle h}$ , то A * эквивалентен поиску лучшего первого на этом графе с использованием алгоритма Дейкстры. ^[2] В необычном случае, когда допустимая эвристика несовместима, узел будет нуждаться в повторном расширении каждый раз, когда для него будет достигнута новая лучшая (на данный момент) стоимость.

Если данная эвристика ${\ displaystyle h}$ допустимо, но не согласованно, можно искусственно заставить эвристические значения вдоль пути быть монотонно неубывающими, используя

{\ displaystyle h '(P) \ получает \ max (h (P), h' (N) -c (N, P))}

как эвристическое значение для ${\ displaystyle P}$ вместо ${\ displaystyle h (P)}$ , где ${\ displaystyle N}$ узел, непосредственно предшествующий ${\ displaystyle P}$ на пути и ${\ Displaystyle ч '(начало) = ч (начало)}$ . Эта идея принадлежит Ласло Меро ^[3] и теперь известна как pathmax. Вопреки распространенному мнению, pathmax не превращает допустимую эвристику в последовательную эвристику. Например, если A * использует pathmax и эвристику, которая допустима, но не согласована, не гарантируется наличие оптимального пути к узлу при его первом раскрытии. ^[4]

Смотрите также

Допустимая эвристика

Последовательная эвристика

Последствия монотонности

Смотрите также

Рекомендации