Анализ чувствительности на основе дисперсии - Variance-based sensitivity analysis

Анализ чувствительности на основе дисперсии (часто называемый Метод Соболя или же Индексы Соболя, после Илья Михайлович Соболь ) является формой глобального Анализ чувствительности.[1][2] Работая в вероятностный фреймворк, он разлагает отклонение выходных данных модели или системы на доли, которые можно отнести к входам или наборам входов. Например, для модели с двумя входами и одним выходом можно обнаружить, что 70% дисперсии выхода вызвано дисперсией на первом входе, 20% - дисперсией во втором и 10% - из-за взаимодействия между двумя. Эти проценты напрямую интерпретируются как меры чувствительности. Меры чувствительности на основе дисперсии привлекательны, потому что они измеряют чувствительность по всему входному пространству (т. Е. Это глобальный метод), с которыми можно справиться. нелинейный ответы, и они могут измерить эффект взаимодействия в не-добавка системы.[3]

Разложение дисперсии

Из черный ящик перспектива, любая модель можно рассматривать как функцию Y=ж(Икс), куда Икс вектор d неопределенные исходные данные модели {Икс1, Икс2, ... Иксd}, и Y - выбранный выходной сигнал одномерной модели (обратите внимание, что этот подход исследует выходные данные скалярной модели, но несколько выходных данных можно проанализировать с помощью нескольких независимых анализов чувствительности). Кроме того, предполагается, что входы независимо и равномерно распределены внутри единичного гиперкуба, т.е. за . Это не влечет за собой потери общности, потому что любое входное пространство может быть преобразовано в этот единичный гиперкуб. ж(Икс) можно разложить следующим образом:[4]

куда ж0 является константой и жя является функцией Икся, жij функция Икся и Иксjи т. д. Условием этого разложения является то, что,

т.е. все члены функционального разложения ортогональный. Это приводит к определению условий функциональной декомпозиции в терминах условных ожидаемых значений,

Из чего видно, что жя это эффект изменения Икся в одиночку (известный как главный эффект из Икся), и жij это эффект изменения Икся и Иксj одновременно, дополнительно к эффекту их индивидуальных вариаций. Это известно как второй порядок взаимодействие. Термины высшего порядка имеют аналогичные определения.

Теперь, предполагая, что ж(Икс) является интегрируемый с квадратом, функциональное разложение можно возвести в квадрат и проинтегрировать, чтобы получить

Обратите внимание, что левая часть равна дисперсии Y, а члены правой части являются членами дисперсии, теперь разложенными по множествам Икся. Это в конечном итоге приводит к разложению выражения дисперсии:

куда

,

и так далее. В Икс~я обозначение указывает набор всех переменных Кроме Икся. Вышеупомянутая декомпозиция дисперсии показывает, как дисперсию выходных данных модели можно разложить на термины, относящиеся к каждому входу, а также эффекты взаимодействия между ними. Вместе все члены составляют общую дисперсию выходных данных модели.

Индексы первого порядка

Прямая мера чувствительности на основе дисперсии Sя, называемый «индексом чувствительности первого порядка» или «индексом основного эффекта», определяется следующим образом:[4]

Это вклад в дисперсию выпуска основного эффекта Икся, поэтому он измеряет влияние различных Икся один, но усредненное по вариациям других входных параметров. Он стандартизирован по общей дисперсии для обеспечения дробного вклада. Индексы взаимодействия высших порядков Sij, Sijk и так далее, можно получить путем деления других членов разложения дисперсии на Var (Y). Обратите внимание, что это означает, что,

Индекс общего эффекта

С использованием Sя, Sij и индексы более высокого порядка, приведенные выше, можно построить картину важности каждой переменной в определении дисперсии выпуска. Однако, когда количество переменных велико, это требует оценки 2d-1 индексов, которые могут быть слишком требовательными к вычислениям. По этой причине показатель, известный как «индекс общего эффекта» или «индекс общего порядка», STi, используется.[5] Это измеряет вклад в дисперсию выпуска Икся, включая все отклонения, вызванные его взаимодействиями любого порядка с любыми другими входными переменными. Это дается как,

Обратите внимание, что в отличие от Sя,

из-за того, что эффект взаимодействия между, например, Икся и Иксj засчитывается в обоих STi и STj Фактически, сумма STi будет равняться 1 только тогда, когда модель чисто добавка.

Расчет индексов

Для аналитически поддающихся обработке функций указанные выше индексы могут быть вычислены аналитически путем оценки интегралов в разложении. Однако в подавляющем большинстве случаев они оцениваются - обычно это делается Метод Монте-Карло.

Последовательности отбора проб

Пример построения АBя матрицы с d= 3 и N=4.

Подход Монте-Карло предполагает создание последовательности случайно распределенных точек внутри единичного гиперкуба (строго говоря, это будут псевдослучайный ). На практике случайные последовательности обычно заменяют на последовательности с низким расхождением для повышения эффективности оценщиков. Тогда это известно как квази-Монте-Карло метод. Некоторые последовательности с низким расхождением, обычно используемые в анализе чувствительности, включают Последовательность Соболя и Латинский гиперкуб дизайн.

Процедура

Для расчета индексов с помощью (квази) метода Монте-Карло используются следующие шаги:[1][2]

  1. Создать N×2d матрица выборки, т.е. каждая строка является точкой выборки в гиперпространстве 2d размеры. Это должно быть сделано в отношении распределений вероятностей входных переменных.
  2. Используйте первый d столбцы матрицы как матрицы А, а остальные d столбцы как матрица B. Это фактически дает два независимых образца N точки в d-мерный единичный гиперкуб.
  3. Строить d дальше N×d матрицы АBя, за я = 1,2, ..., d, такие что я-й столбец АBя равно я-й столбец B, а остальные столбцы из А.
  4. В А, B, а d АBя матрицы всего указать N(d+2) точки во входном пространстве (по одной для каждой строки). Запустите модель в каждой проектной точке в А, B, и АBя матрицы, что в сумме дает N(d+2) оценки модели - соответствующие f (А), f (B) и f (АBя) значения.
  5. Рассчитайте индексы чувствительности, используя приведенные ниже оценки.

Конечно, точность оценок зависит от N. Значение N можно выбрать, последовательно добавляя точки и вычисляя индексы до тех пор, пока оценочные значения не достигнут некоторой приемлемой сходимости. По этой причине при использовании последовательностей с низким расхождением может быть выгодно использовать те, которые позволяют последовательное добавление точек (например, последовательность Соболя), по сравнению с теми, которые этого не делают (например, последовательности латинского гиперкуба).

Оценщики

Для обоих индексов доступен ряд возможных оценок Монте-Карло. В настоящее время широко используются два:[1][6]

и

для оценки Sя и STi соответственно.

Вычислительные затраты

Для оценки Sя и STi для всех входных переменных, N(d+2) Требуются прогоны модели. С N часто составляет порядка сотен или тысяч прогонов, вычислительные затраты могут быстро стать проблемой, когда модель требует значительного количества времени для одного прогона. В таких случаях существует ряд методов, позволяющих снизить вычислительные затраты на оценку индексов чувствительности, например: эмуляторы, HDMR и БЫСТРЫЙ.

Смотрите также

Рекомендации

  1. ^ а б c Соболь И. (2001), Глобальные индексы чувствительности для нелинейных математических моделей и их оценки Монте-Карло. Математическое моделирование,55(1–3),271-280, Дои:10.1016 / S0378-4754 (00) 00270-6
  2. ^ а б Сальтелли, А., Ратто, М., Андрес, Т., Камполонго, Ф., Карибони, Дж., Гателли, Д., Сайсана, М., и Тарантола, С., 2008 г., Анализ глобальной чувствительности. Букварь, Джон Уайли и сыновья.
  3. ^ Saltelli, A., Annoni, P., 2010, Как избежать поверхностного анализа чувствительности, Экологическое моделирование и программное обеспечение 25, 1508–1517.
  4. ^ а б Соболь, И. (1990). Оценки чувствительности нелинейных математических моделей. Математическое моделирование. 2, 112–118. на русском языке, переведено на английский в Соболь, И. (1993). Анализ чувствительности нелинейных математических моделей. Математическое моделирование и вычислительный эксперимент (англ. Пер.), 1993, 1, 407–414.
  5. ^ Хомма, Т. и А. Сальтелли (1996). Меры важности в анализе глобальной чувствительности нелинейных моделей. Техника надежности и системная безопасность, 52, 1–17.
  6. ^ Андреа Сальтелли, Паола Аннони, Ивано Аззини, Франческа Камполонго, Марко Ратто и Стефано Тарантола. Анализ чувствительности выходных данных модели на основе дисперсии. Дизайн и оценка общего индекса чувствительности. Компьютерная физика Коммуникации, 181(2):259{270, 2010