Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

При изучении процесса принятия решений , включая такие дисциплины, как психология , искусственный интеллект и наука об управлении , дерево быстрого и экономного является разновидностью дерева классификации или дерева решений . Как показано на рисунке 1, который будет подробно объяснен позже, деревья быстрого и бережливого обращения представляют собой простые графические структуры, которые задают один вопрос за раз. Цель состоит в том, чтобы классифицировать объект (на рисунке 1: пациент с подозрением на сердечное заболевание) в категорию с целью принятия решения (на рисунке 1 есть две возможности: пациент, назначенный на обычную койку, или в службу неотложной помощи) . В отличие от других деревьев классификации и решений, таких какЛев Брейман CA «s, [1] быстро и-экономные дерева были определены , чтобы быть преднамеренно просто, как в их конструкции, а также их исполнении, и действовать быстро с небольшим количеством информации. Например, дерево на Рисунке 1 задает от одного до трех вопросов.

Деревья быстрого и бережливого использования были введены и концептуализированы в 2003 году Лаурой Мартиньон , Витуш, Такезавой и Форстером [2] и представляют собой семейство простых эвристик в традициях Герда Гигеренцера и Герберта А. Саймона с точки зрения формальных моделей эвристики. . До того, как в 2003 г. появился термин «деревья быстрого и бережливого», эти модели эвристики использовались в нескольких контекстах без явной концептуализации или определения как таковые [GM] [MH] [DA] [DH] [FZBM] .

В задачах, где необходимо принять двоичное решение или классификацию (например, врач должен решить, назначить ли пациента с сильной болью в груди в отделение коронарной терапии или на обычную койку), есть m подсказки (это терминология, используемая в психологии для того, что называется функциями в искусственном интеллекте и атрибутами в науке управления), доступная для принятия такого решения, БПФ определяется следующим образом:

Дерево быстрого и бережливого - это дерево решений, которое имеет m + 1 выход, с одним выходом для каждой из первых m -1 реплик и двумя выходами для последней реплики.

Математически деревья быстрого и бережливого использования могут рассматриваться как лексикографические эвристики или как линейные модели с некомпенсирующими весами, что было доказано Мартиньоном, Кацикопулосом и Войком в 2008 году [MKW] . Их формальные свойства и конструкция также были проанализированы с использованием теории обнаружения сигналов Луаном, Шулером и Гигеренцером в 2011 году [3] [LSG] .

Как работает бережливое дерево [ править ]

В этом разделе описывается, как построить и использовать дерево экономии.

Строительство [ править ]

Напомним, что основными элементами для создания двоичной классификации являются реплики, которые здесь считаются двоичными. В дереве быстрой и бережливой обработки реплики ранжируются: по одной реплике на каждом уровне дерева и выходному узлу на каждом уровне (за исключением двух выходных узлов для последней реплики на последнем уровне дерева). Каждый раз, когда используется реплика, задается вопрос о ее значении. Ответы на вопросы могут немедленно привести к выходу, или они могут привести к следующему вопросу (и, в конечном итоге, к выходу). Характерным свойством деревьев быстрого и бережливого обращения является то, что на каждый вопрос существует по крайней мере один возможный ответ, ведущий к выходу.

В литературе по деревьям быстрого и бережливого обращения было предложено много различных алгоритмов [2] [MKW] [LSG] [4] для (1) упорядочивания сигналов и (2) определения того, какой из возможных ответов на вопрос о сигналах приводит к немедленно к выходу. Обратите внимание, что если (1) и (2) выполнены, дерево быстрой и бережливой работы полностью определено. Часто, чтобы сделать конструкцию простой и интуитивно понятной, алгоритмы используют (1) простые меры «качества» реплики (например, корреляцию между репликой и категорией, рассматривая каждую реплику независимо от других реплик) и (2) делают простой выбор в отношении выходов (например, принимать решение о каждом выходе независимо от других выходов), но также были предложены более сложные алгоритмы.

Казнь [ править ]

Чтобы использовать быстрое и экономное дерево, начните с корня и проверяйте по одной реплике за раз. На каждом шаге одним из возможных результатов является узел выхода, который позволяет принять решение (или действие) - если выход достигнут, остановитесь; в противном случае продолжайте, пока не достигнете выхода. вы выходите, остановитесь; в противном случае продолжайте и задавайте больше вопросов, пока не дойдете до выхода.

Пример дерева быстрого и бережливого
Рис. 1. Дерево быстрой и экономной помощи, которое помогает врачам отделения неотложной помощи решить, направить ли пациента на обычную койку или в отделение коронарной терапии (Green & Mehr, 1997) [GM] .

На рис. 1 показано дерево «быстрых и бережливых» для классификации пациента как пациента с «высоким риском» сердечного инсульта и, следовательно, его необходимо отправить в «отделение коронарной терапии», или как пациента с «низким риском», и, следовательно, его необходимо отправить в «отделение коронарной терапии». «обычная кровать для кормления» [GM] (Green & Mehr, 1997).

Рассмотрим трех пациентов: Джона, Мэри и Джека:

  • У Джона есть изменения сегмента ST, поэтому он классифицируется как «высокий риск» и отправляется в коронарное отделение - без учета других сигналов.
  • У Мэри нет изменений сегмента ST , ее основная жалоба - боль в груди, но у нее нет ни одного из оставшихся пяти факторов, поэтому она классифицируется как «низкий риск» и отправляется на обычную койку после проверки всех трех сигналов.
  • У Джека нет изменения сегмента ST, и у него нет боли в груди в качестве основной жалобы, поэтому он классифицируется как «низкий риск» и отправляется на обычную кровать для медсестер с учетом этих двух сигналов.

Производительность [ править ]

В исследованиях Ласки и Мартиньона (2014) [LM] было показано, что точность и надежность деревьев «быстрого и бережливого» сравнимы с таковой у байесовских тестов . Обширные исследования, сравнивающие производительность быстрых и бережливых деревьев с производительностью алгоритмов классификации, используемых в статистике и машинном обучении, таких как наивный байесовский метод, CART, случайные леса и логистическая регрессия, также были проведены с использованием десятков реальных наборы данных [WHM] [MKW] . [4]

Анализ обнаружения сигналов быстрых и бережливых деревьев [ править ]

Деревья быстрого и бережливого использования используются для выполнения бинарных классификаций или решений. В психологии, медицине и других областях теория обнаружения сигналов (или теория обнаружения ) была классической теорией, в рамках которой анализируются такие задачи.

Теория предполагает, что существует две категории событий или людей (например, люди с проблемами сердца и без них), из которых категория, более важная для нас, называется «сигналом», а другая - «шумом». Эти два показателя различаются по своему распределению по шкале наблюдения, которую мы можем назвать «свидетельством», при этом распределение сигналов имеет более высокое среднее значение. После сбора доказательств можно сделать две возможные классификации, а именно «сигнал» или «шум». Это приводит к четырем возможным исходам: попадание (классифицируется как «сигнал», когда это действительно сигнал), правильное отклонение (классифицируется как «шум», когда это действительно шум), промах (классифицируется как «шум», когда он на самом деле является сигналом). сигнал) и ложная тревога (классифицируются как «сигнал», когда на самом деле это шум). Чтобы максимизировать общую точность или ожидаемую ценность классификации,теория утверждает, что нам необходимо тщательно выбирать критерий классификации по шкале доказательств, выше которой мы принимаем «сигнальное» решение, а ниже - «шум». В частности, когда цена промаха очень высока (т. Е. Классификация пациента с сердечной проблемой как нормального), необходимо выбрать более низкий, более «либеральный» критерий (т. Е. Влево в шкале доказательств), тогда как когда цена ложной тревоги очень высока (например, признание невиновного виновным в убийстве), более высокий, более «консервативный» критерий будет лучше. Это означает, что хороший человек, принимающий решения, должен быть предвзятым в большинстве реальных ситуаций; это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.выше которого мы принимаем «сигнальное» решение, а ниже - «шум». В частности, когда цена промаха очень высока (т. Е. Классификация пациента с сердечной проблемой как нормального), необходимо выбрать более низкий, более «либеральный» критерий (т. Е. Влево в шкале доказательств), тогда как когда цена ложной тревоги очень высока (например, признание невиновного виновным в убийстве), более высокий, более «консервативный» критерий будет лучше. Это означает, что хороший человек, принимающий решения, должен быть предвзятым в большинстве реальных ситуаций; это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.выше которого мы принимаем «сигнальное» решение, а ниже - «шум». В частности, когда цена промаха очень высока (т. Е. Классификация пациента с сердечной проблемой как нормального), необходимо выбрать более низкий, более «либеральный» критерий (т. Е. Влево в шкале доказательств), тогда как когда цена ложной тревоги очень высока (например, признание невиновного виновным в убийстве), более высокий, более «консервативный» критерий будет лучше. Это означает, что хороший человек, принимающий решения, должен быть предвзятым в большинстве реальных ситуаций; это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.влево по шкале доказательств), тогда как, когда цена ложной тревоги очень высока (например, классификация невиновного человека как виновного в убийстве), более высокий, более «консервативный» критерий будет лучше. Это означает, что хороший человек, принимающий решения, должен быть предвзятым в большинстве реальных ситуаций; это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.влево по шкале доказательств), тогда как, когда цена ложной тревоги очень высока (например, классификация невиновного человека как виновного в убийстве), более высокий, более «консервативный» критерий будет лучше. Это означает, что хороший человек, принимающий решения, должен быть предвзятым в большинстве реальных ситуаций; это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.это наиболее важный и актуальный вывод из теории обнаружения сигналов по классификации и принятию решений.

Рисунок 2. Верхняя часть рисунка иллюстрирует предположения теории обнаружения сигналов в задаче двоичного решения. Три вертикальные линии представляют три критерия принятия решения, которые могут принять агент и лицо, принимающее решение. В нижнем разделе показаны четыре возможных БПФ, которые могут быть построены при обращении к трем функциям в фиксированном порядке. Основываясь на классификациях, на которые указывают первые два выхода, деревья получают имена слева направо: FFTss, FFTsn, FFTns и FFTnn. Стрелки, соединяющие части рисунка, приблизительно указывают расположение критериев решения четырех БПФ, когда они используются для создания двоичной s / n (для сигнала и шума, соответственно) классификации или решения. Среди четырех критериев FFTss является наиболее либеральным, а FFTnn - наиболее консервативным.Критерии решения FFTsn и FFTns менее экстремальны, чем два других, при этом FFTsn более либерален, чем FFTns.

В 2011 году Луан, Скулер и Гигеренцер проанализировали характеристики деревьев быстрого и бережливого использования с точки зрения теории обнаружения сигналов. Из этого анализа можно сделать несколько важных выводов. Во-первых, выбор структуры выхода из дерева быстрого и экономного соответствует установке критерия принятия решения при обнаружении сигнала. Вкратце, чем раньше у бережливого дерева появляется «сигнальный выход», тем более либерально оно пристрастно. Относительные смещения двух деревьев быстрого и бережливого производства определяются первым выходом, в котором они различаются, причем тот, у которого есть «сигнальный выход», обозначенный буквой «s», всегда более либерален, чем тот, у которого есть «шум». выход »- обозначается буквой« n »(рисунок 2). Например, FFTsnnn (здесь снова s = "Выход сигнала", n = "выход шума") более смещен, чем FFTnsss. Этот принцип называется «лексикографической ошибкой принятия решений» для деревьев быстрого и бережливого производства.

Во-вторых, серия симуляций показывает, что деревья быстрой и бережливой работы с разными структурами выхода приведут к разной - иногда совершенно разной - ожидаемой ценности решения, когда последствия промаха и ложной тревоги различаются. Следовательно, при построении и применении дерева быстрой и экономной работы необходимо выбрать структуру выхода, которая хорошо соответствует структуре результатов решения задачи.

В-третьих, общая чувствительность бережливого дерева, т. Е. Насколько хорошо дерево может отличить сигнал от шума и которое может быть измерено с помощью d 'или A' из теории обнаружения сигналов, зависит от свойств дерева. реплики, составляющие дерево, такие как среднее значение и дисперсия чувствительности реплик и корреляции между репликами среди реплик, но не сильно зависит от структуры выхода дерева. И, наконец, производительность быстрых и бережливых деревьев надежна и сопоставима с гораздо более сложными алгоритмами принятия решений, разработанными в теории обнаружения сигналов, включая анализ идеального наблюдателя.модель и оптимальная модель последовательной выборки. В контексте прогнозов вне выборки деревья быстрой и экономной работы лучше всего работают по сравнению с другими моделями, когда размер обучающей выборки относительно невелик (например, менее 80 испытаний).

Рисунок 3. Дерево быстрой и бережливой работы, которое может помочь солдатам, дислоцированным в Афганистане, различить, движется ли машина, приближающаяся к контрольно-пропускному пункту, гражданскими лицами или потенциальными террористами-смертниками (Keller & Katsikopoulos, 2016) [KK] .
Рис. 4. Деревья бережливости, которые описывают, как человек решает, прощать ли другому человеку преступление, которое последний совершил во время социальных взаимодействий (слева; Tan, Luan, & Katsikopoulos, 2017) [TLK], и как британские судьи решают, следует ли принять карательное решение об освобождении под залог (право. Dhami, 2003) [D] .

Компьютерная поддержка [ править ]

В 2017 году Phillips, Neth, Woike и Gaissmaier [PNWG] представили R-пакет FFTrees , размещенный на CRAN (с сопутствующим приложением ), который конструирует, графически отображает и оценивает количественно быстрые и экономные деревья удобными для пользователя способами.

Еще несколько примеров деревьев быстрого и бережливого [ править ]

Было много применений деревьев быстрого и бережливого как для предписания того, как следует принимать решение, так и для описания того, как люди на самом деле принимают решения. Помимо медицины, примером их предписывающего применения является инструктаж солдат, дислоцированных в Афганистане, как отличить автомобиль, приближающийся к контрольно-пропускному пункту, за рулем гражданских лиц или потенциальных террористов-смертников [5] [KK] ; дерево проиллюстрировано на рисунке 3. Два примера описательного использования деревьев поспешности и бережливости показаны на рисунке 4. Деревья слева и справа описывают, соответственно, как человек решает, простить ли другому человеку преступление, которое он совершил. последнее совершено во время социальных взаимодействий [TLK] и как британские судьи выносят решение об освобождении под залог или тюремном заключении [D]. В общем, деревья быстроты и бережливости могут применяться для помощи или моделирования любых бинарных процессов принятия решений, которые включают несколько сигналов.

Статьи по теме и другие источники [ править ]

Ссылки [ править ]

  1. ^ Лео Брейман (2017). Деревья классификации и регрессии . www.taylorfrancis.com . Рутледж. DOI : 10.1201 / 9781315139470 . ISBN 9781315139470. Проверено 30 августа 2019 .
  2. ^ a b Мартиньон, Лаура; Витауч, Оливер; Такэдзава, Масанори; Форстер, Малькольм. «Наивный и все же просвещенный: от естественных частот к быстрым и экономным деревьям решений» , опубликованный в журнале « Мышление: психологические перспективы рассуждений, суждений и принятия решений» (Дэвид Хардман и Лора Макки; редакторы), Чичестер: Джон Вили и сыновья, 2003.
  3. ^ Луан, Школьник и Гигеренцер, 2011 Анализ обнаружения сигналов быстрых и бережливых деревьев.
  4. ^ а б Шимшек, Озгюр; Бакманн, Маркус (2015), Кортес, С .; Лоуренс, Северная Дакота; Ли, DD; Сугияма М. (ред.), "Learning from Small Samples: An Analysis of Simple Decision Heuristics" (PDF) , Advances in Neural Information Processing Systems 28 , Curran Associates, Inc., стр. 3159–3167 , получено 2019-09 -01
  5. ^ Keller, Н., & Katsikopoulos, К. (2016) - О роли психологических эвристики в оперативных исследований; и демонстрация операций по обеспечению военной стабильности. Европейский журнал операционных исследований, 249, 1063–1073.