Дерево поведения (искусственный интеллект, робототехника и управление)

Дерево поведения является математической моделью из плана выполнения , используемое в вычислительной технике , робототехнике , системы управления и видеоиграх . Они описывают переключение между конечным набором задач по модульному принципу. Их сила заключается в их способности создавать очень сложные задачи, состоящие из простых задач, не беспокоясь о том, как простые задачи реализуются. Деревья поведения имеют некоторое сходство с иерархическими конечными автоматами.с той ключевой разницей, что основным строительным блоком поведения является задача, а не состояние. Простота понимания человеком делает деревья поведения менее подверженными ошибкам и очень популярными в сообществе разработчиков игр. Было показано, что деревья поведения обобщают несколько других архитектур управления. ^[1]^[2] Математически это ориентированные ациклические графы .

Дерево поведения, моделирующее план поиска и захвата двурукого робота.

Задний план

Поведенческие деревья происходят из индустрии компьютерных игр , как мощный инструмент для моделирования поведения в неигровых персонажей (НПС). ^[3]^[4]^[5]^[6] Они широко использовались в громких видеоиграх, таких как Halo , Bioshock и Spore . Недавние работы предлагают деревья поведения в качестве основы управления несколькими миссиями для БПЛА , сложных роботов, роботизированных манипуляций и систем с несколькими роботами. ^[7]^[8]^[9]^[10]^[11]^[12] Теперь деревья поведения достигли зрелости, чтобы их можно было рассматривать в учебниках по игровому ИИ, ^[13]^[14], а также в общих игровых средах, таких как Unity (game engine) и Unreal Engine (см. ссылки ниже).

Деревья поведения стали популярными благодаря своей парадигме разработки: возможность создавать сложное поведение только путем программирования действий NPC и последующего проектирования древовидной структуры (обычно с помощью перетаскивания ), конечные узлы которой являются действиями, а внутренние узлы определяют принятие решений NPC. Деревья поведения визуально интуитивно понятны, их легко проектировать, тестировать и отлаживать, они обеспечивают большую модульность, масштабируемость и возможность повторного использования, чем другие методы создания поведения.

С годами различные реализации деревьев поведения продолжали улучшаться как по эффективности, так и по возможностям для удовлетворения требований отрасли, пока не превратились в деревья поведения, управляемые событиями . ^[15]^[5] Управляемые событиями деревья поведения решили некоторые проблемы масштабируемости классических деревьев поведения, изменив способ внутренней обработки дерева своим выполнением и введя новый тип узла, который может реагировать на события и прерывать работу узлов. В настоящее время концепция дерева поведения, управляемого событиями, является стандартом и используется в большинстве реализаций, хотя для простоты они все еще называются «деревьями поведения».

Ключевые идеи

Дерево поведения графически представлено как ориентированное дерево, в котором узлы классифицируются как корневые, узлы потока управления или узлы выполнения (задачи). Для каждой пары подключенных узлов исходящий узел называется родительским, а входящий узел - дочерним. У корня нет родителей и ровно одного дочернего элемента, у узлов потока управления есть один родительский элемент и хотя бы один дочерний элемент, а у исполнительных узлов есть один родительский элемент и нет дочерних элементов. Графически дочерние элементы узла потока управления расположены под ним в порядке слева направо. ^[16]

Выполнение дерева поведения начинается с корня, который с определенной частотой отправляет тики своему дочернему элементу. Галочка - это разрешающий сигнал, разрешающий казнь ребенка. Когда выполнение узла в дереве поведения разрешено, он возвращает родительскому элементу статус выполнения, если его выполнение еще не завершено, успех, если он достиг своей цели, или сбой в противном случае.

Узел потока управления

Узел потока управления используется для управления подзадачами, из которых он состоит. Узел потока управления может быть либо узлом селектора (резервным), либо узлом последовательности. Они по очереди выполняют каждую из своих подзадач. Когда подзадача завершена и возвращает свой статус (успех или неудача), узел потока управления решает, выполнять следующую подзадачу или нет.

Селекторный (резервный) узел

Рисунок I. Графическое представление резервной композиции из N задач.

Резервные узлы используются для поиска и выполнения первого исправного дочернего элемента. Резервный узел немедленно вернется с кодом состояния успеха или выполнения, когда один из его дочерних узлов вернет успех или выполнение (см. Рисунок I и псевдокод ниже). Дети отмечены в порядке важности слева направо.

В псевдокоде алгоритм резервной композиции:

1 для я от 1 до n делать2 childstatus ← Отметьте (ребенок (i))3, если childstatus = running4 обратный ход5 иначе, если childstatus = успех6 вернуть успех7 конец
8 возврат неудачи

Узел последовательности

Рисунок II. Графическое представление последовательной композиции N задач.

Узлы последовательности используются для поиска и выполнения первого дочернего элемента, который еще не завершился успешно. Узел последовательности немедленно вернется с кодом состояния сбоя или выполнения, когда один из его дочерних узлов вернет сбой или выполнение (см. Рисунок II и псевдокод ниже). Дети отмечены галочками слева направо.

В псевдокоде алгоритм композиции последовательности:

1 для я от 1 до n делать2 childstatus ← Отметьте (ребенок (i))3, если childstatus = running4 обратный ход5 иначе, если childstatus = failure6 возврат отказа7 конец
8 вернуть успех

Математическое определение пространства состояний

Чтобы применить инструменты теории управления к анализу деревьев поведения, их можно определить как трехкортежные. ^[17]

${\ displaystyle T_ {i} = \ {f_ {i}, r_ {i}, \ Delta t \},}$

где ${\ Displaystyle я \ в \ mathbb {N}}$ это индекс дерева, ${\ displaystyle f_ {i}: \ mathbb {R} ^ {n} \ rightarrow \ mathbb {R} ^ {n}}$ - векторное поле, представляющее правую часть обыкновенного разностного уравнения, ${\ displaystyle \ Delta t}$ это временной шаг и ${\ displaystyle r_ {i}: \ mathbb {R} ^ {n} \ rightarrow \ {R_ {i}, S_ {i}, F_ {i} \}}$ - это статус возврата, который может быть равен либо «Работает» ${\ displaystyle R_ {i}}$ , Успех ${\ displaystyle S_ {i}}$ , или отказ ${\ displaystyle F_ {i}}$ .

Примечание . Задача - это вырожденное дерево поведения без родительского и дочернего элементов.

Выполнение дерева поведения

Выполнение дерева поведения описывается следующими стандартными обыкновенными разностными уравнениями:

${\ displaystyle x_ {k + t} (t_ {k + 1}) = f_ {i} (x_ {k} (t_ {k}))}$

${\ displaystyle t_ {k + 1} = t_ {k} + \ Delta t}$

где ${\ Displaystyle к \ в \ mathbb {N}}$ представляют дискретное время, а ${\ Displaystyle х \ в \ mathbb {R} ^ {п}}$ пространство состояний системы, моделируемой деревом поведения.

Состав последовательности

Два дерева поведения ${\ displaystyle T_ {i}}$ а также ${\ displaystyle T_ {j}}$ можно объединить в более сложное дерево поведения ${\ displaystyle T_ {0}}$ с помощью оператора последовательности.

${\ displaystyle T_ {0} = {\ mbox {sequence}} (T_ {i}, T_ {j}).}$

Затем вернуть статус ${\ displaystyle r_ {0}}$ и векторное поле ${\ displaystyle f_ {0}}$ связаны с ${\ displaystyle T_ {0}}$ определены (для ${\ displaystyle {\ mathcal {S}} _ {1}}$ ^{[ требуется определение ]} ) следующим образом:

${\ displaystyle r_ {0} (x_ {k}) = {\ begin {cases} r_ {j} (x_ {k}) & {\ text {if}} x_ {k} \ in {\ mathcal {S} } _ {1} \\ r_ {i} (x_ {k}) & {\ text {иначе}}. \ End {cases}}}$

${\ displaystyle f_ {0} (x_ {k}) = {\ begin {cases} f_ {j} (x_ {k}) & {\ text {if}} x_ {k} \ in {\ mathcal {S} } _ {1} \\ f_ {i} (x_ {k}) & {\ text {иначе}}. \ End {cases}}}$

Смотрите также

Внешние ссылки

Библиотека дерева поведения ROS
Документация по дереву поведения Unreal Engine 4
Деревья поведения для ИИ: как они работают
Деревья поведения: простой, но мощный ИИ для вашего робота

[Colledanchise_TRO16-1] Colledanchise, Микеле; Огрен, Петтер (2017). «Как деревья поведения модулируют гибридные системы управления и обобщают последовательности последовательного поведения, архитектуру подчинения и деревья решений» . IEEE Transactions по робототехнике . 33 (2): 372–389. DOI : 10.1109 / TRO.2016.2633567 . S2CID 9518238 .

[Colledanchise_BOOK17-2] Colledanchise, Микеле; Огрен, Петтер (2018). Деревья поведения в робототехнике и искусственном интеллекте: введение . CRC Press. arXiv : 1709,00084 . DOI : 10.1201 / 9780429489105 . ISBN 978-1-138-59373-2. S2CID 27470659 .

[Damian_Isla-3] Исла, Д. (2005). «Управление сложностью в Halo 2 AI» . Конференция разработчиков игр (Том 12) .

[Damian_Isla2-4] Исла, Д. (2008). Halo 3 - построение лучшей битвы . Game Developers Conference 2008 .

[agis2020-5] а б Agis, Ramiro A .; Готтифреди, Себастьян; Гарсия, Алехандро Х. (2020). «Расширение деревьев поведения, управляемого событиями, для облегчения координации действий нескольких агентов, не связанных с игроками, в видеоиграх» (PDF) . Экспертные системы с приложениями . 155 (1): 113457. DOI : 10.1016 / j.eswa.2020.113457 .

[lim-6] Lim, CU; Baumgarten, R .; Колтон, С. (2010). «Развивающиеся деревья поведения для коммерческой игры DEFCON» (PDF) . Приложения эволюционных вычислений . Берлин: Springer. С. 100–110. DOI : 10.1007 / 978-3-642-12239-2_11 . ISBN 978-3-642-12238-5.

[ogren2-7] Огрен, Петтер (2012). «Повышение модульности систем управления БПЛА с использованием деревьев поведения компьютерных игр» (PDF) . Конференция AIAA по руководству, навигации и управлению, Миннеаполис, Миннесота . С. 13–16.

[colledanchise-8] Colledanchise, Микеле; Марзинотто, Алехандро; Огрен, Петтер (2014). «Анализ производительности стохастических BT» (PDF) . Робототехника и автоматика (ICRA), 2014 IEEE Международная конференция по . DOI : 10.1109 / ICRA.2014.6907328 . S2CID 14719083 .

[marzonotto-9] Марзинотто, Алехандро; Colledanchise, Микеле; Смит, Кристиан; Огрен, Петтер (2014). «На пути к единой платформе BT для управления роботами» (PDF) . Робототехника и автоматика (ICRA), 2014 IEEE Международная конференция по .

[Klocker-10] Klöckner, Андреас. «Сопряжение ТТ с миром с помощью логики описания». На конференции AIAA по руководству, навигации и управлению, Бостон, Массачусетс. 2013.

[Klocker2-11] Клёкнер, Андреас (2013). "Деревья поведения для управления полетами БПЛА". GI-Jahrestagung . С. 57–68.

[Bagnell-12] Багнелл, Дж. Эндрю; Кавальканти, Фелипе; Цуй, Лей; и другие. (2012). «Интегрированная система для автономных манипуляций робототехникой» (PDF) . Интеллектуальные роботы и системы (IROS), 2012 IEEE / RSJ Международной конференции по . IEEE. С. 2955–2962. DOI : 10.1109 / IROS.2012.6385888 . ЛВП : 20.500.11937 / 14608 . ISBN 978-1-4673-1736-8. S2CID 419179 .

[Millington-13] Миллингтон; Funge (2009). Искусственный интеллект для игр . CRC Press. ISBN 978-0-12-374731-0.

[Rabin-14] Рабин, С. (2014). Игра AI Pro . CRC Press. ISBN 978-1-4665-6596-8.

[champandard2012-15] Шампандард, Алекс Дж .; Дунстан, Филипп (2012). «Стартовый комплект дерева поведения» (PDF) . Game AI Pro: Сборник мудрости профессионалов в области игрового ИИ . С. 72–92.

[craft_ai-16] Крафт ИИ (2015). "BT 101 - основы грамматики Behavior Trees" .

[colledanchise2-17] Colledanchise, Микеле; Огрен, Петтер (2014). «Как деревья поведения модулируют надежность и безопасность в гибридных системах» (PDF) . В «Интеллектуальных роботах и системах» (IROS), Международная конференция IEEE / RSJ, 2014 г., посвященная . IEEE.

[1]