Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Анализ чувствительности на основе дисперсии (часто называемый методом Соболя или индексами Соболя в честь Ильи М. Соболя ) - это форма анализа глобальной чувствительности . [1] [2] Работая в рамках вероятностной структуры, он разбивает дисперсию выходных данных модели или системы на доли, которые можно отнести к входным данным или наборам входных данных. Например, учитывая модель с двумя входами и одним выходом, можно обнаружить, что 70% дисперсии выходных данных вызвано дисперсией на первом входе, 20% - дисперсией во втором и 10% - из-за взаимодействий.между двумя. Эти проценты напрямую интерпретируются как меры чувствительности. Меры чувствительности на основе дисперсии привлекательны, потому что они измеряют чувствительность по всему входному пространству (т. Е. Это глобальный метод), они могут иметь дело с нелинейными откликами и могут измерять эффект взаимодействий в неаддитивных системах. [3]

Разложение дисперсии [ править ]

С точки зрения черного ящика любую модель можно рассматривать как функцию Y = f ( X ), где X - вектор из d неопределенных входных данных модели { X 1 , X 2 , ... X d }, а Y - выбранный выходные данные одномерной модели (обратите внимание, что этот подход исследует выходные данные скалярной модели, но несколько выходных данных могут быть проанализированы с помощью нескольких независимых анализов чувствительности). Кроме того, предполагается, что входные данные независимо и равномерно распределены внутри единичного гиперкуба, т. Е. Для. Это не влечет за собой потери общности, потому что любое входное пространство может быть преобразовано в этот единичный гиперкуб. f ( X ) можно разложить следующим образом [4]

где f 0 - константа, а f i - функция от X i , f ij - функция от X i и X j и т. д. Условием этого разложения является следующее:

т.е. все члены функционального разложения ортогональны . Это приводит к определению терминов функциональной декомпозиции в терминах условных ожидаемых значений,

Из чего можно видеть , что е я является эффект изменения X я в одиночку (известный как основной эффект от X я ), и е Ij является следствием различной Х я и Х J одновременно, дополнительно к действию их индивидуальных вариации . Это называется взаимодействием второго порядка . Термины высшего порядка имеют аналогичные определения.

Теперь, дополнительно предполагая, что f ( X ) интегрируем с квадратом , функциональное разложение можно возвести в квадрат и проинтегрировать, чтобы получить,

Обратите внимание, что левая часть равна дисперсии Y , а члены правой части являются членами дисперсии, теперь разложенными по множествам X i . В конечном итоге это приводит к разложению выражения дисперсии:

где

,

и так далее. X ~ я обозначение указывает множество всех переменных , кроме X я . Вышеупомянутая декомпозиция дисперсии показывает, как дисперсию выходных данных модели можно разложить на термины, относящиеся к каждому входу, а также эффекты взаимодействия между ними. Вместе все члены составляют общую дисперсию выходных данных модели.

Индексы первого порядка [ править ]

Прямая мера чувствительности S i на основе дисперсии , называемая «индексом чувствительности первого порядка» или «индексом основного эффекта», определяется следующим образом [4].

Это вклад в выходной дисперсию основного эффекта X я , поэтому она измеряет влияние изменений X я в одиночку , но в среднем по вариации в других входных параметрах. Он стандартизирован по общей дисперсии, чтобы обеспечить дробный вклад. Индексы взаимодействия более высокого порядка S ij , S ijk и так далее могут быть сформированы путем деления других членов в разложении дисперсии на Var ( Y ). Обратите внимание, что это означает, что,

Индекс общего эффекта [ править ]

Используя приведенные выше индексы S i , S ij и более высокого порядка, можно составить картину важности каждой переменной в определении дисперсии выпуска. Однако, когда количество переменных велико, это требует оценки 2 d -1 индексов, что может быть слишком затратным с точки зрения вычислений. По этой причине используется показатель, известный как «индекс общего эффекта» или «индекс общего порядка», S Ti . [5] Это измеряет вклад в выходную дисперсию X i , включая всю дисперсию, вызванную его взаимодействиями любого порядка с любыми другими входными переменными. Это дается как,

Обратите внимание, что в отличие от S i ,

из-за того, что эффект взаимодействия, например, между X i и X j учитывается как в S Ti, так и в S Tj. Фактически, сумма S Ti будет равна 1, только если модель чисто аддитивная .

Расчет индексов [ править ]

Для аналитически поддающихся обработке функций указанные выше индексы могут быть вычислены аналитически путем оценки интегралов в разложении. Однако в подавляющем большинстве случаев они оцениваются - обычно это делается методом Монте-Карло .

Последовательности выборки [ править ]

Пример построения матриц A B i с d = 3 и N = 4.

Подход Монте-Карло предполагает создание последовательности случайно распределенных точек внутри единичного гиперкуба (строго говоря, это будут псевдослучайные ). На практике обычно случайные последовательности заменяют последовательностями с низким расхождением, чтобы повысить эффективность оценщиков. Тогда это известно как метод квази-Монте-Карло . Некоторые последовательности с низким расхождением, обычно используемые в анализе чувствительности, включают последовательность Соболя и дизайн латинского гиперкуба .

Процедура [ править ]

Для вычисления индексов с помощью (квази) метода Монте-Карло используются следующие шаги: [1] [2]

  1. Сгенерируйте матрицу выборки размером N × 2 d , т.е. каждая строка является точкой выборки в гиперпространстве 2 d измерений. Это должно быть сделано в отношении распределений вероятностей входных переменных.
  2. Используйте первые d столбцов матрицы в качестве матрицы A , а остальные d столбцы матрицы B . Это фактически дает две независимые выборки из N точек в d- мерном единичном гиперкубе.
  3. Сложение д дополнительно N × d матриц A B I , для я = 1,2, ..., D, такие , что я й столбец A B я равна I - й столбец B , а остальные столбцы из .
  4. , Б , и д Б я матриц в общем указать , N ( d + 2) точки в исходном пространстве ( по одному для каждой строки). Запустите модель в каждой проектной точке в матрицах A , B и A B i , получив в общей сложности N ( d +2) оценок модели - соответствующие f ( A ), f ( B ) и f ( A B i ). значения.
  5. Рассчитайте индексы чувствительности, используя приведенные ниже оценки.

Точность оценок, конечно , зависит от N . Значение N может быть выбрано путем последовательного добавления точек и вычисления индексов до тех пор, пока оценочные значения не достигнут некоторой приемлемой сходимости. По этой причине при использовании последовательностей с низким расхождением может быть выгодно использовать те, которые позволяют последовательное добавление точек (например, последовательность Соболя), по сравнению с теми, которые этого не делают (например, последовательности латинского гиперкуба).

Оценщики [ править ]

Для обоих индексов доступен ряд возможных оценок Монте-Карло. Два, которые в настоящее время широко используются: [1] [6]

и

для оценки S i и S Ti соответственно.

Вычислительные расходы [ править ]

Для оценки S i и S Ti для всех входных переменных требуется N ( d +2) прогонов модели. Поскольку N часто составляет порядка сотен или тысяч прогонов, вычислительные затраты могут быстро стать проблемой, когда модель требует значительного количества времени для одного прогона. В таких случаях существует ряд методов, позволяющих снизить вычислительные затраты на оценку индексов чувствительности, таких как эмуляторы , HDMR и FAST .

См. Также [ править ]

  • Анализ чувствительности
  • Метод Монте-Карло
  • Квази-Монте-Карло метод
  • Последовательность Соболя

Ссылки [ править ]

  1. ^ a b c Соболь, И.М. (2001), Глобальные индексы чувствительности для нелинейных математических моделей и их оценки Монте-Карло. МАТЕМАТИКА вычи Simulat , 55 (1-3), 271-280, DOI : 10.1016 / S0378-4754 (00) 00270-6
  2. ^ a b Сальтелли, А., Ратто, М., Андрес, Т., Камполонго, Ф., Карибони, Дж., Гателли, Д. Сайсана, М., и Тарантола, С., 2008, Анализ глобальной чувствительности. Букварь , John Wiley & Sons.
  3. ^ Сальтелли, А., Аннони, П., 2010, Как избежать поверхностного анализа чувствительности, Экологическое моделирование и программное обеспечение 25 , 1508–1517.
  4. ^ а б Соболь, И. (1990). Оценки чувствительности нелинейных математических моделей. Математическое моделирование 2 , 112–118. на русском, перевод на английский в Соболь, И. (1993). Анализ чувствительности нелинейных математических моделей. Математическое моделирование и вычислительный эксперимент , 1993, 1 , 407–414.
  5. ^ Хомма, Т. и А. Saltelli (1996). Меры важности в анализе глобальной чувствительности нелинейных моделей. Техника надежности и системная безопасность , 52 , 1–17.
  6. ^ Andrea Saltelli, Паола Annoni, Ивано Azzini, Франческа Campolongo, Марко Ratto и Стефано Tarantola. Анализ чувствительности выходных данных модели на основе дисперсии. Дизайн и оценка общего индекса чувствительности. Связь по компьютерной физике , 181 (2): 259 {270, 2010