Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Обратная задача в науке процесс вычисления из набора наблюдений на причинные факторы , которые производили их: например, вычисления изображения в рентгеновской компьютерной томографии , восстановления источника в акустике, или вычисления плотности Земли из измерений его гравитационное поле . Это называется обратной задачей, потому что она начинается с последствий, а затем вычисляет причины. Это обратная задача прямой задачи, которая начинается с причин и затем вычисляется последствия.

Обратные задачи - одни из самых важных математических задач в науке и математике, потому что они говорят нам о параметрах, которые мы не можем наблюдать напрямую. Они имеют широкое применение в системной идентификации , оптике , радарах , акустике , теории коммуникации , обработке сигналов , медицинской визуализации , компьютерном зрении , [1] геофизике , океанографии , астрономии , дистанционном зондировании , обработке естественного языка , машинном обучении., [2] неразрушающий контроль , анализ устойчивости откосов [3] и многие другие области. [ необходима цитата ]

История [ править ]

Начиная со следствий, чтобы обнаружить причины, на протяжении веков физиков интересовали. Историческим примером являются расчеты Адамса и Леверье, которые привели к открытию Нептуна по нарушенной траектории Урана . Однако формальное изучение обратных задач началось только в 20 веке.

Один из самых ранних примеров решения обратной задачи был открыт Германом Вейлем и опубликован в 1911 году, описывая асимптотическое поведение собственных значений оператора Лапласа – Бельтрами . [4] Сегодня известный как закон Вейля , его, пожалуй, легче всего понять как ответ на вопрос, можно ли услышать форму барабана . Вейль предположил, что собственные частоты барабана будут связаны с площадью и периметром барабана с помощью определенного уравнения, и этот результат улучшили более поздние математики.

Поле обратных задач позже было затронуто на советско - армянский физик Виктор Амбарцумян . [5] [6]

Будучи еще студентом, Амбарцумян досконально изучил теорию строения атома, формирования энергетических уровней, и уравнение Шредингера и его свойство, и , когда он овладел теорию собственных в дифференциальных уравнениях , он указал на очевидную аналогию между дискретными уровнями энергии и собственные значения дифференциальных уравнений. Затем он спросил: можно ли, учитывая семейство собственных значений, найти форму уравнений, собственными значениями которых они являются? По сути, Амбарцумян рассматривал обратную задачу Штурма – Лиувилля , которая касалась определения уравнений колеблющейся струны. Эта статья была опубликована в 1929 г. в немецком физическом журнале Zeitschrift für Physik.и оставался в безвестности довольно долгое время. Описывая эту ситуацию спустя многие десятилетия, Амбарцумян сказал: «Если астроном опубликует в физическом журнале статью с математическим содержанием, то, скорее всего, с ним произойдет забвение».

Тем не менее, ближе к концу Второй мировой войны эта статья, написанная 20-летним Амбарцумяном, была найдена шведскими математиками и послужила отправной точкой для целой области исследований обратных задач, став фундаментом всей дисциплина.

Затем важные усилия были направлены на «прямое решение» обратной задачи рассеяния, особенно Гельфандом и Левитаном в Советском Союзе. [7]Они предложили аналитический конструктивный метод определения решения. Когда стали доступны компьютеры, некоторые авторы исследовали возможность применения своего подхода к аналогичным задачам, таким как обратная задача в одномерном волновом уравнении. Но быстро выяснилось, что инверсия - нестабильный процесс: шум и ошибки могут быть чрезвычайно усилены, что делает прямое решение практически невозможным. Затем, примерно в семидесятых годах, появились методы наименьших квадратов и вероятностный подход, которые оказались очень полезными для определения параметров, задействованных в различных физических системах. Этот подход имел большой успех. В настоящее время обратные задачи также исследуются в областях, не относящихся к физике, таких как химия, экономика и информатика. В конце концов, когда числовые модели станут преобладающими во многих частях общества,мы можем ожидать обратную задачу, связанную с каждой из этих численных моделей.

Концептуальное понимание [ править ]

Начиная с Ньютона, ученые активно пытались моделировать мир. В частности, когда доступна математическая модель (например, закон тяготения Ньютона или уравнение Кулона для электростатики), мы можем предвидеть, учитывая некоторые параметры, которые описывают физическую систему (например, распределение массы или распределение электрических зарядов), поведение системы. Этот подход известен как математическое моделирование, а упомянутые выше физические параметры называются параметрами модели или просто моделью . Точнее, введем понятие состояния физической системы : это решение уравнения математической модели. В теории оптимального управления, эти уравнения называются уравнениями состояния . Во многих ситуациях нас действительно интересует не физическое состояние, а просто его влияние на некоторые объекты (например, влияние гравитационного поля на конкретную планету). Следовательно, мы должны ввести другой оператор, называемый оператором наблюдения , который преобразует состояние физической системы (здесь предсказанное гравитационное поле) в то, что мы хотим наблюдать (здесь движения рассматриваемой планеты). Теперь мы можем представить так называемую прямую задачу , которая состоит из двух шагов:

  • определение состояния системы по физическим параметрам, которые ее описывают
  • применение оператора наблюдения к предполагаемому состоянию системы, чтобы предсказать поведение того, что мы хотим наблюдать.

Это приводит к введению другого оператора ( F означает «вперед»), который отображает параметры модели в данные, которые модель прогнозирует, что является результатом этой двухэтапной процедуры. Оператор называется прямым оператором или прямой картой . В этом подходе мы в основном пытаемся предсказать последствия, зная причины.

В приведенной ниже таблице показано, что Земля рассматривается как физическая система и для различных физических явлений, параметры модели, которые описывают систему, физическая величина, которая описывает состояние физической системы, и наблюдения, обычно производимые за состоянием системы.

В подходе обратной задачи мы, грубо говоря, пытаемся узнать причины с учетом следствий.

Общая постановка обратной задачи [ править ]

Обратная задача - это «обратная» прямой задачи: мы хотим определить параметры модели, которые производят данные, которые являются записанными нами наблюдениями (нижний индекс obs означает наблюдаемое). Так что мы ищем параметры модели такие, что (хотя бы приблизительно)

где прямая карта. Обозначим как количество параметров модели (возможно, бесконечное), так и количество записанных данных. Мы вводим некоторые полезные концепции и соответствующие обозначения, которые будут использоваться ниже:

  • Пространство моделей , обозначенные : в векторном пространстве , натянутом на модельных параметрах; он имеет размеры;
  • Пространство данных , обозначенные : если мы проводим измеренные образцы в векторе с компонентами (если наши измерения состоят из функций, является векторным пространством с бесконечными размерами);
  • : отзыв модели ; он состоит из данных, предсказанных моделью ;
  • : изображение по прямой карте, это подмножество (но не подпространство, если оно не линейное), состоящее из ответов всех моделей;
  • : несоответствия данных (или остатки), связанные с моделью : они могут быть расположены как вектор, элемент .

Концепция остатков очень важна: в рамках поиска модели, соответствующей данным, их анализ показывает, можно ли рассматривать рассматриваемую модель как реалистичную или нет . Систематические нереалистичные расхождения между данными и ответами модели также показывают, что прямая карта неадекватна и может дать представление об улучшенной прямой карте.

Когда оператор линейный, обратная задача линейна. В противном случае обратная задача чаще всего является нелинейной. Кроме того, модели не всегда могут быть описаны конечным числом параметров. Это тот случай, когда мы ищем распределенные параметры (например, распределение волновых скоростей): в таких случаях целью обратной задачи является получение одной или нескольких функций. Такие обратные задачи являются обратными задачами бесконечной размерности.

Линейные обратные задачи [ править ]

В случае линейной прямой карты и когда мы имеем дело с конечным числом параметров модели, прямую карту можно записать как линейную систему

где - матрица , характеризующая прямую карту.

Элементарный пример: гравитационное поле Земли [ править ]

Лишь несколько физических систем действительно линейны по отношению к параметрам модели. Одна из таких геофизических систем - это система гравитационного поля Земли . Гравитационное поле Земли определяется распределением плотности Земли в недрах. Поскольку литология Земли меняется довольно значительно, мы можем наблюдать мельчайшие различия в гравитационном поле Земли на поверхности Земли. Из нашего понимания гравитации (закона всемирного тяготения Ньютона) мы знаем, что математическое выражение гравитации выглядит так:

здесь - мера местного гравитационного ускорения, - это универсальная гравитационная постоянная , - это локальная масса (которая связана с плотностью) породы в недрах и - это расстояние от массы до точки наблюдения.

Дискретизируя вышеприведенное выражение, мы можем связать дискретные данные наблюдений на поверхности Земли с параметрами дискретной модели (плотностью) в геологической среде, о которых мы хотим узнать больше. Например, рассмотрим случай, когда у нас есть измерения, проводимые в 5 точках на поверхности Земли. В этом случае наш вектор данных представляет собой вектор-столбец размерности (5x1): его th компонент связан с th местоположением наблюдения. Мы также знаем, что у нас есть только пять неизвестных масс в недрах (нереалистично, но используется для демонстрации концепции) с известным местоположением: мы обозначаем расстояние между th точкой наблюдения ий масс. Таким образом, мы можем построить линейную систему, связывающую пять неизвестных масс с пятью точками данных, следующим образом:

Чтобы найти параметры модели, которые соответствуют нашим данным, мы могли бы инвертировать матрицу, чтобы напрямую преобразовать измерения в параметры нашей модели. Например:

Система с пятью уравнениями и пятью неизвестными - это очень специфическая ситуация: наш пример был разработан, чтобы в конечном итоге получить эту специфику. Как правило, количество данных и неизвестных различается, поэтому матрица не является квадратной.

Однако даже квадратная матрица не может иметь обратного: матрица может иметь недостаточный ранг (т.е. иметь нулевые собственные значения), и решение системы не является единственным. Тогда решение обратной задачи будет неопределенным. Это первая трудность. У чрезмерно определенных систем (больше уравнений, чем неизвестных) есть другие проблемы. Также шум может исказить наши наблюдения, возможно, вне пространства возможных ответов на параметры модели, так что решение системы может не существовать. Это еще одна трудность.

Инструменты для преодоления первой трудности [ править ]

Первая трудность отражает серьезную проблему: наши наблюдения не содержат достаточно информации и требуются дополнительные данные. Дополнительные данные могут поступать из физической априорной информации о значениях параметров, об их пространственном распределении или, в более общем плане, об их взаимной зависимости. Это также может происходить из других экспериментов: например, мы можем подумать об объединении данных, записанных гравиметрами и сейсмографами, для лучшей оценки плотности. Интеграция этой дополнительной информации - это в основном задача статистики . Эта дисциплина - та, которая может ответить на вопрос: как смешивать количества различной природы? Мы будем более точными в разделе «Байесовский подход» ниже.

Что касается распределенных параметров, априорная информация об их пространственном распределении часто состоит из информации о некоторых производных этих распределенных параметров. Кроме того, обычной практикой, хотя и несколько искусственной, является поиск «простейшей» модели, которая разумно соответствует данным. Обычно это достигается штрафом за норму градиента (или полное изменение ) параметров (этот подход также называется максимизацией энтропии). Можно также упростить модель с помощью параметризации, которая вводит степени свободы только при необходимости. L 1 {\displaystyle L^{1}}

Дополнительная информация также может быть интегрирована через ограничения неравенства на параметры модели или некоторые их функции. Такие ограничения важны, чтобы избежать нереалистичных значений параметров (например, отрицательных значений). В этом случае пространство, охватываемое параметрами модели, больше не будет векторным пространством, а будет подмножеством допустимых моделей, обозначенных в дальнейшем.

Инструменты для преодоления второй трудности [ править ]

Как упоминалось выше, шум может быть таким, что наши измерения не являются изображением какой-либо модели, поэтому мы не можем искать модель, которая производит данные, а скорее искать лучшую (или оптимальную) модель : то есть ту, которая лучше всего соответствует данным. Это приводит к минимизации целевой функции , а именно функционала, который количественно определяет, насколько велики остатки или насколько далеко прогнозируемые данные от наблюдаемых. Конечно, когда у нас есть идеальные данные (т. Е. Без шума), восстановленная модель должна идеально соответствовать наблюдаемым данным. Стандартная целевая функция имеет вид:

где - евклидова норма (это будет норма, когда измерения являются функциями, а не выборками) остатков. Этот подход сводится к использованию обычного метода наименьших квадратов , широко используемого в статистике. Однако известно, что евклидова норма очень чувствительна к выбросам: чтобы избежать этой трудности, мы можем подумать об использовании других расстояний, например нормы, вместо нормы. L 2 {\displaystyle L^{2}}

Байесовский подход [ править ]

Вероятностный подход очень похож на метод наименьших квадратов: если мы знаем статистику шума, загрязняющего данные, мы можем подумать о поиске наиболее вероятной модели m, которая соответствует критерию максимального правдоподобия . Если шум является гауссовским , критерий максимального правдоподобия появляется как критерий наименьших квадратов, причем евклидово скалярное произведение в пространстве данных заменяется скалярным произведением, включающим ковариацию шума. Кроме того, если будет доступна априорная информация о параметрах модели, мы могли бы подумать об использовании байесовского вывода для формулирования решения обратной задачи. Этот подход подробно описан в книге Тарантолы. [8]

Численное решение нашего простейшего примера [ править ]

Здесь мы используем евклидову норму для количественной оценки несоответствия данных. Поскольку мы имеем дело с линейной обратной задачей, целевая функция является квадратичной. Для его минимизации считается классическим вычисление его градиента с использованием того же логического обоснования (как если бы мы минимизировали функцию только одной переменной). В оптимальной модели этот градиент исчезает, что можно записать как:

где Р Т обозначает транспонированную матрицу из F . Это уравнение упрощается до:

Это выражение известно как нормальное уравнение и дает нам возможное решение обратной задачи. В нашем примере матрица , как правило, имеет полный ранг, поэтому приведенное выше уравнение имеет смысл и однозначно определяет параметры модели: нам не нужно интегрировать дополнительную информацию, чтобы получить уникальное решение.

Математические и вычислительные аспекты [ править ]

Обратные задачи обычно некорректны, в отличие от корректных задач, которые обычно встречаются при математическом моделировании. Из трех условий корректной задачи, предложенных Жаком Адамаром (существование, единственность и устойчивость решения или решений), условие устойчивости чаще всего нарушается. В смысле функционального анализа обратная задача представлена ​​отображением между метрическими пространствами. Хотя обратные задачи часто формулируются в бесконечномерных пространствах, ограничения на конечное число измерений и практическое рассмотрение восстановления только конечного числа неизвестных параметров могут привести к тому, что проблемы будут преобразованы в дискретную форму. В этом случае обратная задача обычно будет плохо обусловлена . В этих случаях можно использовать регуляризацию для введения мягких предположений относительно решения и предотвращения переобучения . Многие примеры регуляризованных обратных задач можно интерпретировать как частные случаи байесовского вывода . [9]

Численное решение задачи оптимизации [ править ]

Некоторые обратные задачи имеют очень простое решение, например, когда имеется набор неизвлеченных функций , то есть такой набор функций, при котором их вычисление в различных точках дает набор линейно независимых векторов. Это означает, что при линейной комбинации этих функций коэффициенты можно вычислить, расположив векторы как столбцы матрицы и затем инвертируя эту матрицу. Простейший пример неизольвентных функций - это многочлены, построенные с использованием теоремы о неразрешимости так, чтобы они были неизольвентными. Конкретно это делается путем инвертирования матрицы Вандермонда . Но это очень специфическая ситуация.

В общем, решение обратной задачи требует сложных алгоритмов оптимизации. Когда модель описывается большим количеством параметров (количество неизвестных, используемых в некоторых приложениях дифракционной томографии, может достигать одного миллиарда), решение линейной системы, связанной с нормальными уравнениями, может быть обременительным. Численный метод, который будет использоваться для решения задачи оптимизации, зависит, в частности, от затрат, необходимых для вычисления решения прямой задачи. После выбора подходящего алгоритма для решения прямой задачи (прямое умножение матрицы на вектор может быть неадекватным, когда матрицаогромен), соответствующий алгоритм выполнения минимизации можно найти в учебниках, посвященных численным методам решения линейных систем и минимизации квадратичных функций (см., например, Чиарле [10] или Нокедал [11] ).

Кроме того, пользователь может пожелать добавить к моделям физические ограничения: в этом случае он должен быть знаком с методами оптимизации с ограничениями , что само по себе является предметом. Во всех случаях вычисление градиента целевой функции часто является ключевым элементом решения задачи оптимизации. Как упоминалось выше, информация о пространственном распределении распределенного параметра может быть введена посредством параметризации. Можно также подумать об адаптации этой параметризации во время оптимизации. [12]

Если целевая функция основана на норме, отличной от евклидовой нормы, мы должны выйти из области квадратичной оптимизации. В результате задача оптимизации усложняется. В частности, когда норма используется для количественной оценки несоответствия данных, целевая функция перестает быть дифференцируемой: ее градиент больше не имеет смысла. На помощь приходят специальные методы (см., Например, Lemaréchal [13] ) недифференцируемой оптимизации.

После того, как оптимальная модель рассчитана, мы должны ответить на вопрос: «Можем ли мы доверять этой модели?» Вопрос можно сформулировать следующим образом: насколько велик набор моделей, которые соответствуют данным «почти так же хорошо», как эта модель? В случае квадратичных целевых функций этот набор содержится в гиперэллипсоиде, подмножестве ( количество неизвестных), размер которого зависит от того, что мы подразумеваем под словом «почти так же хорошо», то есть от уровня шума. Направление наибольшей оси этого эллипсоида ( собственный вектор, связанный с наименьшим собственным значением матрицы) является направлением плохо определенных компонентов: если мы будем следовать этому направлению, мы можем внести сильное возмущение в модель без значительного изменения значения целевой функции и, таким образом, получим существенно другую квазиоптимальную модель. Мы ясно видим, что ответ на вопрос «можем ли мы доверять этой модели» определяется уровнем шума и собственными значениями гессиана целевой функции или, что эквивалентно, в случае, когда регуляризация не была интегрирована, сингулярными значениями матрицы . Конечно, использование регуляризации (или других видов априорной информации) уменьшает размер набора почти оптимальных решений и, в свою очередь, увеличивает уверенность, которую мы можем придать вычисленному решению.

Устойчивость, регуляризация и дискретизация модели в бесконечном измерении [ править ]

Мы сосредоточены здесь на восстановлении распределенного параметра. При поиске распределенных параметров мы должны дискретизировать эти неизвестные функции. Поступая так, мы уменьшаем размер проблемы до чего-то конечного. Но теперь возникает вопрос: есть ли какая-либо связь между решением, которое мы вычисляем, и решением исходной проблемы? Тогда еще вопрос: что мы подразумеваем под решением исходной задачи? Поскольку конечное число данных не позволяет определить бесконечное количество неизвестных, исходный функционал несоответствия данных должен быть регуляризован, чтобы гарантировать уникальность решения. Часто сокращение неизвестных до конечномерного пространства обеспечивает адекватную регуляризацию: вычисленное решение будет выглядеть как дискретная версия решения, которое мы искали. Например,наивная дискретизация часто работает для решенияпроблема деконволюции : она будет работать до тех пор, пока мы не позволим пропущенным частотам отображаться в численном решении. Но часто регуляризация должна быть явно интегрирована в целевую функцию.

Чтобы понять, что может произойти, мы должны иметь в виду, что решение такой линейной обратной задачи сводится к решению интегрального уравнения Фредгольма первого рода:

где - ядро, и - векторы , и - область в . Это справедливо для 2D-приложения. Для 3D-приложения мы рассматриваем . Обратите внимание, что здесь параметры модели состоят из функции, и что ответ модели также состоит из функции, обозначенной как . Это уравнение является расширением до бесконечной размерности матричного уравнения, заданного для дискретных задач.

Для достаточно гладких операторов, определенных выше, компактны на разумных банаховых пространствах, таких как . Теория Ф. Рисса утверждает, что множество сингулярных значений такого оператора содержит ноль (отсюда существование нулевого пространства), является конечным или не более чем счетным, и в последнем случае они составляют последовательность, которая стремится к нулю. . В случае симметричного ядра у нас есть бесконечное количество собственных значений, а соответствующие собственные векторы составляют гильбертов базис L 2 {\displaystyle L^{2}} . Таким образом, любое решение этого уравнения определяется с точностью до аддитивной функции в нулевом пространстве, и в случае бесконечности сингулярных значений решение (которое включает обратную величину произвольных малых собственных значений) является нестабильным: два ингредиента, которые делают решение этого интегрального уравнения - типичная некорректная задача! Однако мы можем определить решение через псевдообратное прямое отображение (снова с точностью до произвольной аддитивной функции). Когда прямое отображение компактно, классическая регуляризация Тихонова будет работать, если мы будем использовать ее для интегрирования априорной информации о том, чтоНорма решения должна быть как можно меньше: это сделает обратную задачу корректной. Тем не менее, как и в случае с конечной размерностью, мы должны подвергнуть сомнению нашу уверенность в вычисленном решении. Опять же, в основном информация заключается в собственных значениях оператора Гессе. Если для вычисления решения исследовать подпространства, содержащие собственные векторы, связанные с небольшими собственными значениями, то этому решению вряд ли можно будет доверять: некоторые из его компонентов будут плохо определены. Наименьшее собственное значение равно весу, введенному в регуляризации Тихонова.

Неправильные ядра могут давать прямое отображение, которое не является компактным и даже неограниченным, если мы наивно снабдим пространство моделей нормой. В таких случаях гессиан не является ограниченным оператором, и понятие собственного значения теряет смысл. Требуется математический анализ, чтобы сделать его ограниченным оператором и разработать хорошо поставленную задачу: иллюстрацию можно найти в [14]. И снова мы должны подвергнуть сомнению уверенность, которую мы можем оказать в вычисленном решении, и должны обобщить понятие собственного значения, чтобы получить ответ. [15]

Таким образом, анализ спектра оператора Гессе является ключевым элементом для определения надежности вычисленного решения. Однако такой анализ обычно является очень сложной задачей. Это побудило некоторых авторов исследовать альтернативные подходы в случае, когда нас интересуют не все компоненты неизвестной функции, а только под-неизвестные, которые являются образами неизвестной функции линейным оператором. Эти подходы называются «методом Бэкуса и Гилберта [16] », подходом «Стражей Льва » [17] и методом SOLA: [18] эти подходы оказались тесно связаны друг с другом, как объяснено в Chavent [ 19] Наконец, концепция ограниченного разрешения, часто применяемый физиками, представляет собой не что иное, как конкретное мнение о том, что некоторые плохо определенные компоненты могут испортить решение. Но, вообще говоря, эти плохо определенные компоненты модели не обязательно связаны с высокими частотами.

Некоторые классические линейные обратные задачи восстановления распределенных параметров [ править ]

Упомянутые ниже проблемы соответствуют различным версиям интеграла Фредгольма: каждая из них связана с определенным ядром .

Деконволюция [ править ]

Цель деконволюции - восстановить исходное изображение или сигнал, которые кажутся зашумленными и размытыми на данных . [20] С математической точки зрения ядро здесь зависит только от разницы между и .

Томографические методы [ править ]

В этих методах мы пытаемся восстановить распределенный параметр, причем наблюдение состоит в измерении интегралов этого параметра, проводимом вдоль семейства линий. Обозначим линией в этом семействе точку измерения . Таким образом, наблюдение в можно записать как:

где - длина дуги по длине и известная весовая функция. Сравнивая это уравнение с интегралом Фредгольма, приведенным выше, мы замечаем, что ядро является своего рода дельта-функцией, которая достигает максимума на линии . С таким ядром прямое отображение не компактно.

Компьютерная томография [ править ]

В рентгеновской компьютерной томографии линии, на которых интегрируется параметр, являются прямыми линиями: томографическая реконструкция распределения параметров основана на инверсии преобразования Радона . Хотя с теоретической точки зрения многие линейные обратные задачи хорошо изучены, проблемы, связанные с преобразованием Радона и его обобщениями, по-прежнему представляют собой множество теоретических проблем, а вопросы достаточности данных все еще не решены. К таким проблемам относятся неполные данные для трехмерного рентгеновского преобразования и проблемы, связанные с обобщением рентгеновского преобразования на тензорные поля. Изученные решения включают метод алгебраической реконструкции , обратную проекцию с фильтром., а по мере увеличения вычислительной мощности - итерационные методы реконструкции, такие как итеративная разреженная асимптотическая минимальная дисперсия . [21]

Дифракционная томография [ править ]

Дифракционная томография - это классическая линейная обратная задача в геологоразведочной сейсмологии: амплитуда, зарегистрированная за один раз для данной пары источник-приемник, представляет собой сумму вкладов, возникающих от таких точек, что сумма расстояний, измеренных во времени пробега, от источника и ресивера, соответственно, равно соответствующему времени записи. В 3D параметр интегрируется не по линиям, а по поверхностям. Если скорость распространения постоянна, такие точки располагаются на эллипсоиде. Обратные задачи состоят в восстановлении распределения точек дифрагирования по сейсмограммам, записанным вдоль съемки, при известном распределении скоростей. Прямое решение было первоначально предложено Бейлкиным и Ламбаре и др .: [22]эти работы были отправными точками подходов, известных как миграция с сохранением амплитуды (см. Бейлкин [23] [24] и Блейстайн [25] ). Если для решения волнового уравнения использовать методы геометрической оптики (т.е. лучи ), эти методы окажутся тесно связанными с так называемыми методами миграции наименьших квадратов [26], полученными на основе подхода наименьших квадратов (см. Lailly, [ 27] Тарантола [28] ).

Доплеровская томография (астрофизика) [ править ]

Если мы рассмотрим вращающийся звездный объект, спектральные линии, которые мы можем наблюдать на спектральном профиле, будут смещены из-за эффекта Доплера. Доплеровская томография направлена ​​на преобразование информации, содержащейся в спектральном мониторинге объекта, в двумерное изображение излучения (как функции лучевой скорости и фазы в периодическом вращательном движении) звездной атмосферы. Как объяснил Марш [29], эта линейная обратная задача похожа на томографию: мы должны восстановить распределенный параметр, который был интегрирован вдоль линий, чтобы произвести его эффекты в записях.

Нелинейные обратные задачи [ править ]

Нелинейные обратные задачи представляют собой более сложное семейство обратных задач. Здесь прямое отображение - нелинейный оператор. Моделирование физических явлений часто основывается на решении уравнения в частных производных (см. Таблицу выше, за исключением закона гравитации): хотя эти уравнения в частных производных часто являются линейными, физические параметры, которые появляются в этих уравнениях, зависят нелинейным образом от состояние системы и, следовательно, наши наблюдения за ней.

Некоторые классические нелинейные обратные задачи [ править ]

Обратные задачи рассеяния [ править ]

В то время как линейные обратные задачи были полностью решены с теоретической точки зрения в конце девятнадцатого века [ необходима цитата ] , только один класс нелинейных обратных задач был таковым до 1970 года: обратные спектральные и (с одним пространственным измерением) обратные задачи рассеяния. по основополагающим трудам русской математической школы ( Крейн , Гельфанд , Левитан, Марченко ). Большой обзор результатов был дан Чаданом и Сабатье в их книге «Обратные задачи квантовой теории рассеяния» (два издания на английском языке, одно на русском).

В задачах такого типа данные - это свойства спектра линейного оператора, описывающие рассеяние. Спектр состоит из собственных значений и собственных функций, образующие вместе «дискретный спектр» и обобщения, называемые непрерывным спектром. Очень примечательный физический момент состоит в том, что эксперименты по рассеянию дают информацию только о непрерывном спектре, и что знание его полного спектра необходимо и достаточно для восстановления оператора рассеяния. Следовательно, у нас есть невидимые параметры, гораздо более интересные, чем нулевое пространство, которое обладает аналогичным свойством в линейных обратных задачах. Кроме того, существуют физические движения, в которых спектр такого оператора сохраняется как следствие такого движения. Это явление регулируется специальными нелинейными уравнениями эволюции в частных производных, например уравнением Кортевега – де Фриза.. Если спектр оператора сводится к одному собственному значению, его соответствующее движение будет движением одиночного выступа, распространяющегося с постоянной скоростью и без деформации, уединенной волны, называемой « солитоном ».

Идеальный сигнал и его обобщения для уравнения Кортевега – де Фриза или других интегрируемых нелинейных уравнений в частных производных представляют большой интерес и имеют множество возможных приложений. Эта область изучается как раздел математической физики с 1970-х годов. Нелинейные обратные задачи в настоящее время также изучаются во многих областях прикладной науки (акустика, механика, квантовая механика, электромагнитное рассеяние - в частности, радиолокационное зондирование, сейсмическое зондирование и почти все методы построения изображений).

Последний пример связан с гипотезой Римана был дан В и подрессоренным, идея заключается в том , что в полуклассической старой квантовой теории инверсия потенциала внутри гамильтониана пропорциональна половинной производной счетной функции собственных значений (энергий)  п ( х ).

Согласование проницаемости в нефтяных и газовых коллекторах [ править ]

Цель состоит в том, чтобы восстановить коэффициент диффузии в параболическом уравнении с частными производными, которое моделирует однофазные потоки жидкости в пористой среде. Эта проблема была объектом многих исследований, начиная с новаторской работы, проведенной в начале семидесятых годов. [30] Что касается двухфазных потоков, важной проблемой является оценка относительной проницаемости и капиллярного давления. [31]

Обратные задачи в волновых уравнениях [ править ]

Цель состоит в том, чтобы восстановить волновые скорости (продольные и поперечные волны) и распределение плотности по сейсмограммам . Такие обратные задачи представляют первостепенный интерес в сейсмологии. В основном мы можем рассмотреть две математические модели:

  • Уравнение акустической волны (в котором S-волны игнорируются, когда размеры пространства равны 2 или 3)
  • Уравнение эластодинамики, в котором скорости продольных и поперечных волн могут быть получены из параметров Ламе и плотности.

Эти основные гиперболические уравнения можно улучшить, добавив затухание , анизотропию и т. Д.

Решение обратной задачи в одномерном волновом уравнении было предметом многих исследований. Это одна из немногих нелинейных обратных задач, для которых мы можем доказать единственность решения. [7] Другой проблемой был анализ устойчивости решения. [32] Были разработаны практические приложения, использующие метод наименьших квадратов. [32] [33] Попытки расширения на двумерные или трехмерные задачи и на уравнения эластодинамики предпринимались с 80-х годов, но это оказалось очень трудным! Эта проблема, которую часто называют полной инверсией формы сигнала (FWI), еще не решена полностью: одна из основных трудностей - хаотическое поведение функции несоответствия данных. [34]Некоторые авторы исследовали возможность переформулирования обратной задачи, чтобы сделать целевую функцию менее хаотичной, чем функция несовпадения данных. [35] [36]

Томография во времени [ править ]

Понимая, насколько сложна обратная задача в волновом уравнении, сейсмологи исследовали упрощенный подход с использованием геометрической оптики. В частности, они были нацелены на инверсию распределения скоростей распространения, зная времена прихода волновых фронтов, наблюдаемых на сейсмограммах. Эти волновые фронты могут быть связаны с прямыми приходами или с отражениями, связанными с отражателями, геометрия которых должна быть определена вместе с распределением скорости.

Распределение времени прихода ( точка в физическом пространстве) волнового фронта, испускаемого точечным источником, удовлетворяет уравнению Эйконала :

где обозначает медленное (обратное скорости) распределение. Наличие делает это уравнение нелинейным. Классически она решается путем выстрела лучей (траектории, время прихода которых стационарно) из точечного источника.

Эта проблема похожа на томографию: измеренные времена прихода являются интегралом вдоль пути луча от медленности. Но эта проблема, подобная томографии, является нелинейной, главным образом потому, что неизвестная геометрия траектории луча зависит от распределения скорости (или медленности). Несмотря на свой нелинейный характер, томография во времени пробега оказалась очень эффективной для определения скорости распространения в Земле или в недрах, причем последний аспект является ключевым элементом для построения сейсмических изображений, в частности, с использованием методов, упомянутых в разделе «Дифракция». томография".

Математические аспекты: вопросы Адамара [ править ]

Вопросы касаются корректности: есть ли у задачи наименьших квадратов единственное решение, которое постоянно зависит от данных (проблема стабильности)? Это первый вопрос, но он также сложен из-за нелинейности . Чтобы увидеть, откуда возникают трудности, Чавент [37] предложил концептуально разделить минимизацию функции несоответствия данных на два последовательных шага ( это подмножество допустимых моделей):

  • шаг проекции: найти проекцию на (ближайшая точка в соответствии с расстоянием, используемым в определении целевой функции)
  • учитывая эту проекцию, найдите один прообраз, который является моделью, изображение которой оператором является этой проекцией.

Трудности могут возникать - и обычно возникают - на обоих этапах:

  1. оператор вряд ли будет один к одному, поэтому может быть более одного прообраза,
  2. даже когда он взаимно однозначен, его обратное не может быть непрерывным ,
  3. проекция на может не существовать, если этот набор не закрыт,
  4. проекция на может быть неединственной и не непрерывной, так как она может быть невыпуклой из-за нелинейности .

Мы обратимся к Чавенту [37] за математическим анализом этих точек.

Вычислительные аспекты [ править ]

Функция несовпадения невыпуклых данных [ править ]

Прямая карта является нелинейной, поэтому функция несоответствия данных, вероятно, будет невыпуклой, что сделает методы локальной минимизации неэффективными. Для преодоления этой трудности было исследовано несколько подходов:

  • использование методов глобальной оптимизации, таких как выборка апостериорной функции плотности и алгоритм Метрополиса в вероятностной структуре обратной задачи, [38] генетических алгоритмов (отдельно или в сочетании с алгоритмом Метрополиса: см. [39] для приложения к определению проницаемостей, которые соответствие существующим данным о проницаемости), нейронные сети, методы регуляризации, включая многомасштабный анализ;
  • переформулировку целевой функции методом наименьших квадратов, чтобы сделать ее более гладкой ( обратную задачу в волновых уравнениях см. в [35] [36] ).

Вычисление градиента целевой функции [ править ]

Обратные задачи, особенно в бесконечном измерении, могут иметь большой размер, что требует значительного вычислительного времени. Когда прямое отображение является нелинейным, вычислительные трудности возрастают, и минимизация целевой функции может быть сложной. В отличие от линейной ситуации, явное использование матрицы Гессе для решения нормальных уравнений здесь не имеет смысла: матрица Гессе меняется в зависимости от модели. Гораздо более эффективным является оценка градиента целевой функции для некоторых моделей. Важные вычислительные усилия могут быть сэкономлены, если мы можем избежать очень тяжелого вычисления якобиана (часто называемого « производными Фреше »): метода сопряженных состояний, предложенного Чавентом и Лионсом, [40]направлено на то, чтобы избежать этого очень тяжелого вычисления. Сейчас это очень широко используется. [41]

Приложения [ править ]

Теория обратной задачи широко используется в прогнозировании погоды, океанографии, гидрологии и нефтяной инженерии. [42] [43]

Обратные задачи также встречаются в области теплопередачи, где поверхностный тепловой поток [44] оценивается исходя из температурных данных, измеренных внутри твердого тела. Линейная обратная задача также является основой спектральной оценки и оценки направления прихода (DOA) при обработке сигналов .

См. Также [ править ]

  • Атмосферное зондирование
  • Метод Бэкуса – Гилберта
  • Компьютерная томография
    • Алгебраическая реконструкция
    • Отфильтрованная обратная проекция
    • Итерационная реконструкция
  • Ассимиляция данных
  • Инженерная оптимизация
  • Модель серого ящика
  • Математическая геофизика
  • Оптимальная оценка
  • Сейсмическая инверсия
  • Тихоновская регуляризация
  • Сжатое зондирование

Академические журналы [ править ]

В целом обратные задачи освещаются в четырех основных научных журналах:

  • Обратные задачи
  • Журнал обратных и некорректных задач [45]
  • Обратные задачи в науке и технике [46]
  • Обратные задачи и визуализация [47]

Во многих журналах по медицинской визуализации, геофизике, неразрушающему контролю и т. Д. Преобладают обратные задачи в этих областях.

Ссылки [ править ]

  1. ^ Pizlo, Зигмунт. « Восприятие рассматривается как обратная проблема ». Исследование зрения 41.24 (2001): 3145-3161.
  2. ^ Вито, Эрнесто Де и др. « Учиться на примерах как обратная задача ». Журнал исследований в области машинного обучения 6. мая (2005): 883-904.
  3. ^ Карденас, IC (2019). «Об использовании байесовских сетей в качестве метода мета-моделирования для анализа неопределенностей в анализе устойчивости откосов». Georisk: Оценка и управление рисками для инженерных систем и геологических опасностей . 13 (1): 53–65. DOI : 10.1080 / 17499518.2018.1498524 .
  4. ^ Вейль, Герман (1911). "Über die asymptotische Verteilung der Eigenwerte" . Nachrichten der Königlichen Gesellschaft der Wissenschaften zu Göttingen : 110–117. Архивировано из оригинала на 2013-08-01 . Проверено 14 мая 2018 .
  5. ^ »Эпилог - Статья Амбарцумяна Виктор Амбарцумян
  6. ^ Амбарцумян, Рубен В. (1998). «Жизнь в астрофизике. Избранные труды Виктора Анатольевича Амбарцумяна». Астрофизика . 41 (4): 328–330. DOI : 10.1007 / BF02894658 .
  7. ^ a b Берридж, Роберт (1980). «Интегральные уравнения Гельфанда-Левитана, Марченко и Гопината-Сонди обратной теории рассеяния, рассматриваемые в контексте обратных задач импульсной характеристики». Волновое движение . 2 (4): 305–323. DOI : 10.1016 / 0165-2125 (80) 90011-6 .
  8. ^ Тарантола, Альберт (1987). Теория обратной задачи (1-е изд.). Эльзевир. ISBN 9780444599674.
  9. ^ Тарантола, Альберт (2005). "Главное дело" (PDF) . Теория обратной задачи и методы оценки параметров модели . СИАМ. стр. i – xii. DOI : 10,1137 / 1.9780898717921.fm . ISBN  978-0-89871-572-9.
  10. ^ Ciarlet, Филипп (1994). Введение в матричный анализ и оптимизацию . Париж: Массон. ISBN 9782225688935.
  11. ^ Нокедаль, Хорхе (2006). Численная оптимизация . Springer.
  12. ^ Бен Амер, Хенд; Чавент, Гай; Жаффре, Жером (2002). «Индикаторы уточнения и увеличения для адаптивной параметризации: приложение для оценки гидравлических проницаемостей» (PDF) . Обратные задачи . 18 (3): 775–794. Bibcode : 2002InvPr..18..775B . DOI : 10.1088 / 0266-5611 / 18/3/317 .
  13. ^ Lemaréchal, Claude (1989). Оптимизация, Справочники по исследованию операций и науке управления . Эльзевир. С. 529–572.
  14. ^ Delprat-Jannaud, Флоренция; Лайи, Патрик (1993). Некорректная и корректная постановка задачи томографии времени пробега отражения . Журнал геофизических исследований . 98 . С. 6589–6605.
  15. ^ Delprat-Jannaud, Флоренция; Лайи, Патрик (1992). «Какую информацию о модели Земли дают времена пробега отражений». Журнал геофизических исследований . 98 (B13): 827–844. Bibcode : 1992JGR .... 9719827D . DOI : 10.1029 / 92JB01739 .
  16. ^ Бэкус, Джордж; Гилберт, Фриман (1968). «Разрешающая способность совокупных данных о Земле» . Геофизический журнал Королевского астрономического общества . 16 (10): 169–205. Bibcode : 1968GeoJ ... 16..169B . DOI : 10.1111 / j.1365-246X.1968.tb00216.x .
  17. ^ Львы, Жак Луи (1988). "Sur les sentinelles des systèmes distribués". CR Acad. Sci. Париж . I Math: 819–823.
  18. ^ Пиджперс, Франк; Томпсон, Майкл (1993). «Метод SOLA для гелиосейсмической инверсии». Астрономия и астрофизика . 281 (12): 231–240. Bibcode : 1994A & A ... 281..231P .
  19. ^ Chavent, Guy (1998). Метод наименьших квадратов, Sentinels и вычитающее оптимально локализованное среднее значение в уравнениях aux dérivées partielles и приложений . Париж: Готье Виллар. С. 345–356.
  20. ^ Kaipio J., & Somersalo, Е. (2010). Статистические и вычислительные обратные задачи. Нью-Йорк, штат Нью-Йорк: Спрингер.
  21. ^ Abeida, Habti; Чжан, Цилинь; Ли, Цзянь; Мерабтин, Наджим (2013). «Итерационные разреженные асимптотические подходы на основе минимальной дисперсии для обработки массивов» (PDF) . Транзакции IEEE по обработке сигналов . 61 (4): 933–944. arXiv : 1802.03070 . Bibcode : 2013ITSP ... 61..933A . DOI : 10.1109 / tsp.2012.2231676 . ISSN 1053-587X .  
  22. ^ Ламбаре, Жиль; Virieux, Жан; Мадариага, Рауль; Джин, Сиде (1992). «Итеративное асимптотическое обращение в акустическом приближении» . Геофизика . 57 (9): 1138–1154. Bibcode : 1992Geop ... 57.1138L . DOI : 10.1190 / 1.1443328 .
  23. ^ Beylkin Грегори (1984). «Проблема обращения и приложения обобщенного преобразования Радона» (PDF) . Сообщения по чистой и прикладной математике . XXXVII (5): 579–599. DOI : 10.1002 / cpa.3160370503 .
  24. ^ Бейлкин, Грегори (1985). «Изображение разрывов в обратной задаче рассеяния путем обращения причинного обобщенного преобразования Радона». J. Math. Phys . 26 (1): 99–108. Bibcode : 1985JMP .... 26 ... 99B . DOI : 10.1063 / 1.526755 .
  25. ^ Bleistein, Норман (1987). «К изображению отражателей на земле» . Геофизика . 52 (7): 931–942. Bibcode : 1987Geop ... 52..931B . DOI : 10.1190 / 1.1442363 .
  26. ^ Немет, Тамас; Ву, Чэнцзюнь; Шустер, Джерард (1999). «Миграция методом наименьших квадратов неполных данных отражения» (PDF) . Геофизика . 64 (1): 208–221. Bibcode : 1999Geop ... 64..208N . DOI : 10.1190 / 1.1444517 .
  27. ^ Lailly, Патрик (1983). Сейсмическая обратная задача как последовательность перед суммированием миграций . Филадельфия: СИАМ. С. 206–220. ISBN 0-89871-190-8.
  28. ^ Тарантола, Альберт (1984). «Инверсия данных сейсмических отражений в акустическом приближении» . Геофизика . 49 (8): 1259–1266. Bibcode : 1984Geop ... 49.1259T . DOI : 10.1190 / 1.1441754 .
  29. ^ Марш, Том (2005). «Допплеровская томография». Астрофизика и космическая наука . 296 (1–4): 403–415. arXiv : astro-ph / 0011020 . DOI : 10.1007 / s10509-005-4859-3 .
  30. ^ Чавент, Гай; Лемонье, Патрик; Дюпюи, Мишель (1975). «Историческое согласование с использованием теории оптимального управления». Журнал Общества инженеров-нефтяников . 15 (2): 74–86. DOI : 10.2118 / 4627-PA .
  31. ^ Чавент, Гай; Коэн, Гэри; Эспи, М. (1980). «Определение относительных проницаемостей и капиллярных давлений методом автоматической регулировки». Общество инженеров-нефтяников (январь). DOI : 10.2118 / 9237-MS .
  32. ^ a b Бамбергер, Ален; Чавент, Гай; Лайи, Патрик (1979). «Об устойчивости обратной задачи в одномерном волновом уравнении, приложение к интерпретации сейсмических профилей». Журнал прикладной математики и оптимизации . 5 : 1–47. DOI : 10.1007 / bf01442542 .
  33. ^ Macé, Danièle; Лайи, Патрик (1986). «Решение одномерной обратной задачи ВСП». Геофизические исследования . 34 (7): 1002–1021. Bibcode : 1986GeopP..34.1002M . DOI : 10.1111 / j.1365-2478.1986.tb00510.x . ОСТИ 6901651 . 
  34. ^ Вириё, Жан; Оперто, Стефан (2009). «Обзор инверсии полной формы волны в разведочной геофизике» . Геофизика . 74 (6): WCC1 – WCC26. DOI : 10.1190 / 1.3238367 .
  35. ^ a b Клеман, Франсуа; Чавент, Гай; Гомес, Сузана (2001). «Инверсия формы сигнала времени пробега на основе миграции для двухмерных простых структур: синтетический пример». Геофизика . 66 (3): 845–860. Bibcode : 2001Geop ... 66..845C . DOI : 10.1190 / 1.1444974 .
  36. ^ a b Саймс, Уильям; Карразон, Джим (1991). «Инверсия скорости с помощью оптимизации дифференциального подобия». Геофизика . 56 (5): 654–663. Bibcode : 1991Geop ... 56..654S . DOI : 10.1190 / 1.1443082 .
  37. ^ a b Чавент, Гай (2010). Нелинейный метод наименьших квадратов для обратных задач . Springer. ISBN 978-90-481-2785-6.
  38. ^ Корен, Цви; Мосегаард, Клаус; Ланда, Евгений; Тор, Пьер; Тарантола, Альберт (1991). "Оценка методом Монте-Карло и анализ разрешения скоростей сейсмического фона". Журнал геофизических исследований . 96 (B12): 20289–20299. Bibcode : 1991JGR .... 9620289K . DOI : 10.1029 / 91JB02278 .
  39. ^ Тахмасеби, Пейман; Джавадпур, Фарзам; Сахими, Мухаммад (август 2016 г.). «Согласование стохастической проницаемости сланцев: трехмерная характеристика и моделирование» . Международный журнал угольной геологии . 165 : 231–242. DOI : 10.1016 / j.coal.2016.08.024 .
  40. ^ Chavent, Guy (1971). Идентификация коэффициентов, связанных с частями . Université Paris 6: Thèse d'Etat.CS1 maint: location (link)
  41. ^ Плессикс, Рене (2006). «Обзор метода сопряженных состояний для вычисления градиента функционала с геофизическими приложениями» . Международный геофизический журнал . 167 (2): 495–503. Bibcode : 2006GeoJI.167..495P . DOI : 10.1111 / j.1365-246X.2006.02978.x .
  42. Карл Вунш (13 июня 1996 г.). Обратная задача циркуляции океана . Издательство Кембриджского университета. С. 9–. ISBN 978-0-521-48090-1.
  43. ^ Тахмасеби, Пейман; Джавадпур, Фарзам; Сахими, Мухаммад (август 2016 г.). «Согласование стохастической проницаемости сланцев: трехмерная характеристика и моделирование». Международный журнал угольной геологии . 165 : 231–242. DOI : 10.1016 / j.coal.2016.08.024 .
  44. ^ Patric Фигуэйред (декабрь 2014). Разработка итерационного метода решения многомерных обратных задач теплопроводности . Lehrstuhl für Wärme- und Stoffübertragung RWTH Aachen.
  45. ^ "Журнал обратных и некорректных задач" .
  46. ^ "Обратные задачи в науке и технике: Том 25, № 4" .
  47. ^ "IPI" . Архивировано из оригинального 11 октября 2006 года.

Ссылки [ править ]

  • Чадан, Хосров и Сабатье, Пьер Селестен (1977). Обратные задачи квантовой теории рассеяния . Springer-Verlag. ISBN 0-387-08092-9 
  • Астер, Ричард; Борчерс, Брайан и Тербер, Клиффорд (2018). Оценка параметров и обратные задачи , третье издание, Elsevier. ISBN 9780128134238 , ISBN 9780128134238  
  • Нажмите, WH; Теукольский С.А.; Феттерлинг, штат Вашингтон; Фланнери, ВР (2007). «Раздел 19.4. Обратные задачи и использование априорной информации» . Числовые рецепты: искусство научных вычислений (3-е изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-88068-8.

Дальнейшее чтение [ править ]

  • CW Groetsch (1999). Обратные задачи: занятия для студентов . Издательство Кембриджского университета. ISBN 978-0-88385-716-8.

Внешние ссылки [ править ]

  • Международная ассоциация обратных задач
  • Евразийская ассоциация обратных задач
  • Финское общество обратных задач
  • Сеть обратных задач
  • Веб-сайт Альберта Тарантолы включает бесплатную версию его книги по теории обратных задач в формате PDF и несколько онлайн-статей по обратным задачам.
  • Страница обратных задач в Университете Алабамы
  • Проект обратных задач и геостатистики , Институт Нильса Бора, Копенгагенский университет
  • Страница ресурсов по геофизической обратной теории Энди Гансе
  • Финский центр передового опыта в области исследования обратных задач