Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Линейная система трех переменных определяет набор плоскостей . Точка пересечения - это решение.

В математике , А система линейных уравнений (или линейной системы ) представляет собой набор из одного или более линейных уравнений , связанных с тем же набором переменных . [1] [2] [3] [4] [5] Например,

представляет собой систему трех уравнений от трех переменных x , y , z . Решение для линейной системы является присвоение значений переменных , таких , что все уравнения одновременно удовлетворены. Раствора в системе выше задается

поскольку это делает все три уравнения справедливыми. Слово «система» указывает на то, что уравнения следует рассматривать вместе, а не по отдельности.

В математике теория линейных систем является основой и фундаментальной частью линейной алгебры , предмета, который используется в большинстве разделов современной математики. Вычислительные алгоритмы поиска решений являются важной частью численной линейной алгебры и играют важную роль в инженерии , физике , химии , информатике и экономике . Система нелинейных уравнений часто может быть аппроксимирована линейной системой (см линеаризации ), полезной техникой при принятии математической модели иликомпьютерное моделирование относительно сложной системы .

Очень часто коэффициенты уравнений являются действительными или комплексными числами, и решения ищутся в одном и том же наборе чисел, но теория и алгоритмы применимы для коэффициентов и решений в любой области . Для решений в области целостности подобно кольцу из целых чисел , или в других алгебраических структурах , другие теории были разработаны, см линейного уравнения над кольцом . Целочисленное линейное программирование - это набор методов для поиска «наилучшего» целочисленного решения (когда их много). Основа Грёбнератеория предоставляет алгоритмы, когда коэффициенты и неизвестные являются полиномами . Также тропическая геометрия является примером линейной алгебры в более экзотической структуре.

Элементарные примеры [ править ]

Тривиальный пример [ править ]

Система одного уравнения с одной неизвестной

есть решение

Однако обычно считается, что линейная система имеет как минимум два уравнения.

Простой нетривиальный пример [ править ]

Простейший вид нетривиальной линейной системы включает два уравнения и две переменные:

Один из методов решения такой системы заключается в следующем. Во- первых, решить верхнее уравнение в терминах :

Теперь подставьте это выражение для x в нижнее уравнение:

В результате получается одно уравнение, включающее только переменную . Решение дает и подставляет это обратно в уравнение для доходности . Этот метод обобщается на системы с дополнительными переменными (см. «Исключение переменных» ниже или статью по элементарной алгебре .)

Общая форма [ править ]

Общая система m линейных уравнений с n неизвестными может быть записана как

где - неизвестные, - коэффициенты системы, - постоянные члены.

Часто коэффициенты и неизвестные являются действительными или комплексными числами , но также видны целые и рациональные числа , а также многочлены и элементы абстрактной алгебраической структуры .

Векторное уравнение [ править ]

Одно чрезвычайно полезное представление заключается в том, что каждое неизвестное является весом для вектора-столбца в линейной комбинации .

Это позволяет использовать весь язык и теорию векторных пространств (или, в более общем смысле, модулей ). Например, набор всех возможных линейных комбинаций векторов в левой части называется их диапазоном , и уравнения имеют решение только тогда, когда правый вектор находится в этом диапазоне. Если каждый вектор в этом диапазоне имеет ровно одно выражение как линейную комбинацию заданных левых векторов, то любое решение уникально. В любом случае диапазон имеет базис из линейно независимых векторов, которые действительно гарантируют ровно одно выражение; и количество векторов в этом базисе (его размерность ) не может быть больше m илиn , но может быть и меньше. Это важно, потому что, если у нас есть m независимых векторов, решение гарантировано независимо от правой части, а в противном случае не гарантируется.

Матричное уравнение [ править ]

Векторное уравнение эквивалентно матричному уравнению вида

где A - матрица размера m × n , x - вектор-столбец с n элементами, а b - вектор-столбец с m элементами.

Количество векторов в основе диапазона теперь выражается как ранг матрицы.

Набор решений [ править ]

Множество решений для уравнений x - y = −1 и 3 x + y = 9 - это единственная точка (2, 3).

Решением линейной системы является присвоением значений переменных х 1 , х 2 , ..., х п , такой , что каждый из уравнений удовлетворяются. Множество всех возможных решений называется множество решений .

Линейная система может вести себя одним из трех возможных способов:

  1. У системы бесконечно много решений .
  2. Система имеет единое уникальное решение .
  3. У системы нет решения .

Геометрическая интерпретация [ править ]

Для системы с участием двух переменных ( х и Y ), каждое линейное уравнение определяет линию на ху - плоскость . Поскольку решение линейной системы должно удовлетворять всем уравнениям, набор решений является пересечением этих линий и, следовательно, является линией, одной точкой или пустым набором .

Для трех переменных каждое линейное уравнение определяет плоскость в трехмерном пространстве , а набор решений - это пересечение этих плоскостей. Таким образом, набор решений может быть плоскостью, линией, отдельной точкой или пустым набором. Например, поскольку три параллельные плоскости не имеют общей точки, набор решений их уравнений пуст; система решений уравнений трех пересекающихся в точке плоскостей является единственной точкой; если три плоскости проходят через две точки, их уравнения имеют как минимум два общих решения; на самом деле множество решений бесконечно и состоит из всех прямых, проходящих через эти точки. [6]

Для n переменных каждое линейное уравнение определяет гиперплоскость в n- мерном пространстве . Множество решений является пересечением этих гиперплоскостей и представляет собой плоскость , которая может иметь любую размерность меньше n .

Общее поведение [ править ]

Набор решений для двух уравнений с тремя переменными, как правило, представляет собой линию.

В общем, поведение линейной системы определяется соотношением между количеством уравнений и количеством неизвестных. Здесь «в целом» означает, что для конкретных значений коэффициентов уравнений может иметь место различное поведение.

  • В общем, система с меньшим количеством уравнений, чем неизвестных, имеет бесконечно много решений, но может не иметь решения. Такая система известна как недоопределенная система .
  • В общем, система с таким же количеством уравнений и неизвестных имеет одно единственное решение.
  • В общем, система с большим количеством уравнений, чем неизвестных, не имеет решения. Такая система также известна как переопределенная система .

В первом случае размерность множества решений, как правило, равна n - m , где n - количество переменных, а m - количество уравнений.

Следующие рисунки иллюстрируют эту трихотомию в случае двух переменных:

Первая система имеет бесконечно много решений, а именно все точки на синей линии. Вторая система имеет единственное уникальное решение, а именно пересечение двух линий. Третья система не имеет решений, так как три линии не имеют общей точки.

Следует иметь в виду, что на рисунках выше показан только самый частый случай (общий случай). Система из двух уравнений и двух неизвестных может не иметь решения (если две прямые параллельны) или для системы из трех уравнений и двух неизвестных быть разрешимой (если три линии пересекаются в одной точке).

Система линейных уравнений ведет себя иначе, чем в общем случае, если уравнения линейно зависимы , или если она несовместима и имеет не больше уравнений, чем неизвестных.

Свойства [ править ]

Независимость [ править ]

Уравнения линейной системы независимы, если ни одно из уравнений не может быть выведено алгебраически из других. Когда уравнения независимы, каждое уравнение содержит новую информацию о переменных, и удаление любого из уравнений увеличивает размер набора решений. Для линейных уравнений логическая независимость - это то же самое, что и линейная независимость .

Уравнения x - 2 y = −1 , 3 x + 5 y = 8 и 4 x + 3 y = 7 линейно зависимы.

Например, уравнения

не являются независимыми - они представляют собой одно и то же уравнение при масштабировании в два раза, и они будут давать идентичные графики. Это пример эквивалентности в системе линейных уравнений.

Для более сложного примера уравнения

не являются независимыми, потому что третье уравнение является суммой двух других. Действительно, любое из этих уравнений может быть получено из двух других, и любое из уравнений может быть удалено, не влияя на набор решений. Графики этих уравнений представляют собой три линии, пересекающиеся в одной точке.

Последовательность [ править ]

Уравнения 3 x + 2 y = 6 и 3 x + 2 y = 12 несовместимы.

Линейная система несовместна, если у нее нет решения, в противном случае она называется согласованной . Когда система несовместима, из уравнений можно вывести противоречие , которое всегда можно переписать как утверждение 0 = 1 .

Например, уравнения

непоследовательны. Фактически, вычитая первое уравнение из второго и умножая обе части результата на 1/6, мы получаем 0 = 1 . Графики этих уравнений на плоскости xy представляют собой пару параллельных прямых.

Три линейных уравнения могут быть несовместными, даже если любые два из них согласованы вместе. Например, уравнения

непоследовательны. Сложение первых двух уравнений дает 3 x + 2 y = 2 , которые можно вычесть из третьего уравнения и получить 0 = 1 . Любые два из этих уравнений имеют общее решение. То же явление может иметь место для любого количества уравнений.

В общем случае несоответствия возникают, если левые части уравнений в системе линейно зависимы, а постоянные члены не удовлетворяют соотношению зависимости. Система уравнений, левые части которой линейно независимы, всегда непротиворечива.

Положив это по- другому, в соответствии с теоремой Руш-Капелл , любая система уравнений (переопределено или иначе) противоречива , если ранг в дополненной матрице больше , чем ранг матрицы коэффициентов . Если же, с другой стороны, ранги этих двух матриц равны, система должна иметь хотя бы одно решение. Решение уникально тогда и только тогда, когда ранг равен количеству переменных. В противном случае общее решение имеет k свободных параметров, где k- разница между количеством переменных и рангом; следовательно, в таком случае решений бесконечно много. Ранг системы уравнений (т.е. ранг расширенной матрицы) никогда не может быть выше, чем [количество переменных] + 1, что означает, что система с любым количеством уравнений всегда может быть сведена к системе, которая имеет количество независимых уравнений , не более чем [количество переменных] + 1.

Эквивалентность [ править ]

Две линейные системы, использующие один и тот же набор переменных, эквивалентны, если каждое из уравнений второй системы может быть выведено алгебраически из уравнений в первой системе, и наоборот. Две системы эквивалентны, если либо обе несовместны, либо каждое уравнение каждой из них является линейной комбинацией уравнений другой. Отсюда следует, что две линейные системы эквивалентны тогда и только тогда, когда они имеют одно и то же множество решений.

Решение линейной системы [ править ]

Есть несколько алгоритмов для решения системы линейных уравнений.

Описание решения [ править ]

Когда множество решений конечно, оно сводится к одному элементу. В этом случае единственное решение описывается, например, последовательностью уравнений, левые части которых являются именами неизвестных, а правые части - соответствующими значениями . Когда порядок неизвестных был установлен, например алфавитный порядок, решение можно описать как вектор значений, как в предыдущем примере.

Чтобы описать набор с бесконечным количеством решений, обычно некоторые из переменных обозначаются как свободные (или независимые , или как параметры ), что означает, что им разрешено принимать любое значение, в то время как остальные переменные зависят от значений свободные переменные.

Например, рассмотрим следующую систему:

Набор решений этой системы можно описать следующими уравнениями:

Здесь z - свободная переменная, а x и y зависят от z . Любую точку в наборе решений можно получить, сначала выбрав значение для z , а затем вычислив соответствующие значения для x и y .

Каждая свободная переменная дает пространству решений одну степень свободы , количество которой равно размерности множества решений. Например, набор решений для приведенного выше уравнения представляет собой линию, так как точка в наборе решений может быть выбрана путем указания значения параметра z . Бесконечное решение более высокого порядка может описывать плоскость или многомерное множество.

Различный выбор свободных переменных может привести к разному описанию одного и того же набора решений. Например, решение вышеуказанных уравнений можно альтернативно описать следующим образом:

Здесь x - свободная переменная, а y и z - зависимые.

Удаление переменных [ править ]

Самый простой метод решения системы линейных уравнений - многократное исключение переменных. Этот метод можно описать следующим образом:

  1. В первом уравнении решите одну из переменных через другие.
  2. Подставьте это выражение в остальные уравнения. Это дает систему уравнений с одним уравнением меньше и одним меньше неизвестным.
  3. Повторяйте, пока система не сведется к одному линейному уравнению.
  4. Решите это уравнение, а затем выполните обратную замену, пока не будет найдено полное решение.

Например, рассмотрим следующую систему:

Решение первого уравнения относительно x дает x = 5 + 2 z - 3 y , а включение этого во второе и третье уравнение дает

Решение первого из этих уравнений относительно y дает y = 2 + 3 z , а включение его во второе уравнение дает z = 2 . Теперь у нас есть:

Подстановка z = 2 во второе уравнение дает y = 8 , а замена z = 2 и y = 8 в первое уравнение дает x = −15 . Следовательно, набором решений является единственная точка ( x , y , z ) = (−15, 8, 2) .

Уменьшение строки [ править ]

При сокращении строк (также известном как исключение Гаусса ) линейная система представляется в виде расширенной матрицы :

Затем эта матрица модифицируется с использованием элементарных операций со строками, пока не достигнет уменьшенной формы эшелона строк . Есть три типа операций с элементарными строками:

Тип 1 : поменяйте местами две строки.
Тип 2 : умножьте строку на ненулевой скаляр .
Тип 3 : добавьте к одной строке скаляр, кратный другой.

Поскольку эти операции обратимы, полученная расширенная матрица всегда представляет собой линейную систему, эквивалентную исходной.

Существует несколько конкретных алгоритмов сокращения строки расширенной матрицы, простейшие из которых - исключение Гаусса и исключение Гаусса-Жордана . Следующее вычисление показывает применение метода исключения Гаусса-Жордана к матрице выше:

Последняя матрица представлена ​​в виде сокращенного эшелона строк и представляет систему x = −15 , y = 8 , z = 2 . Сравнение с примером алгебраического исключения переменных в предыдущем разделе показывает, что эти два метода фактически одинаковы; разница заключается в том, как записываются вычисления.

Правило Крамера [ править ]

Правило Крамера - это явная формула для решения системы линейных уравнений, где каждая переменная задается частным двух определителей . Например, решение системы

дан кем-то

Для каждой переменной знаменатель является определителем матрицы коэффициентов , а числитель - определителем матрицы, в которой один столбец заменен вектором постоянных членов.

Хотя правило Крамера имеет важное теоретическое значение, оно не имеет практического значения для больших матриц, поскольку вычисление больших детерминантов является несколько громоздким. (Действительно, большие детерминанты легче всего вычислить с помощью сокращения строк.) Кроме того, правило Крамера имеет очень плохие числовые свойства, что делает его непригодным для надежного решения даже небольших систем, если операции не выполняются в рациональной арифметике с неограниченной точностью. [ необходима цитата ]

Матричное решение [ править ]

Если система уравнений выражена в матричной форме , весь набор решений также может быть выражен в матричной форме. Если матрица A квадратная (имеет m строк и n = m столбцов) и имеет полный ранг (все m строк независимы), то система имеет единственное решение, задаваемое формулой

где есть обратная из A . В более общем плане, независимо от того, m = n или нет, и независимо от ранга A , все решения (если таковые существуют) даются с использованием псевдообратного выражения Мура-Пенроуза для A , обозначаемого следующим образом:

где - вектор свободных параметров, который пробегает все возможные векторы n × 1. Необходимым и достаточным условием для существования любого решения (й) является то, что потенциальное решение, полученное с помощью, удовлетворяет, то есть что если это условие не выполняется, система уравнений несовместима и не имеет решения. Если условие выполняется, система непротиворечива и существует хотя бы одно решение. Например, в вышеупомянутом случае, когда A является квадратом и имеет полный ранг, просто равно, а общее уравнение решения упрощается до, как указано ранее, где полностью выпало из решения, оставив только одно решение. Однако в других случаяхостается и, следовательно, бесконечность возможных значений вектора свободного параметра дает бесконечное количество решений уравнения.

Другие методы [ править ]

В то время как системы из трех или четырех уравнений могут быть легко решены вручную (см. Краковский ), компьютеры часто используются для более крупных систем. Стандартный алгоритм решения системы линейных уравнений основан на методе исключения Гаусса с некоторыми изменениями. Во-первых, важно избегать деления на малые числа, которое может привести к неточным результатам. Это можно сделать, переупорядочив уравнения, если необходимо, - процесс, известный как поворот . Во- вторых, алгоритм точно не делать исключения Гаусса, но он вычисляет разложение LU матрицы A . В основном это организационный инструмент, но он работает намного быстрее, если нужно решать несколько систем с одной и той же матрицей A, но с разными векторами.б .

Если матрица A имеет некоторую особую структуру, ее можно использовать для получения более быстрых или более точных алгоритмов. Например, системы с симметричной положительно определенной матрицей могут быть решены в два раза быстрее с помощью разложения Холецкого . Рекурсия Левинсона - это быстрый метод для матриц Теплица . Специальные методы существуют также для матриц с большим количеством нулевых элементов (так называемые разреженные матрицы ), которые часто используются в приложениях.

Совершенно другой подход часто используется для очень больших систем, которые в противном случае потребовали бы слишком много времени или памяти. Идея состоит в том, чтобы начать с начального приближения к решению (которое совсем не обязательно должно быть точным) и изменить это приближение в несколько шагов, чтобы приблизить его к истинному решению. Если приближение достаточно точное, оно считается решением системы. Это приводит к классу итерационных методов .

Также существует квантовый алгоритм для линейных систем уравнений . [7]

Однородные системы [ править ]

Система линейных уравнений однородна, если все постоянные члены равны нулю:

Однородная система эквивалентна матричному уравнению вида

где A - матрица размера m × n , x - вектор-столбец с n элементами, а 0 - нулевой вектор с m элементами.

Набор однородных растворов [ править ]

Каждая однородная система имеет по крайней мере одно решение, известное как нулевое (или тривиальное ) решение, которое получается путем присвоения значения нуля каждой из переменных. Если в системе есть невырожденная матрица ( det ( A ) 0 ), то это также единственное решение. Если система имеет особую матрицу, то существует множество решений с бесконечным числом решений. Этот набор решений имеет следующие дополнительные свойства:

  1. Если u и v - два вектора, представляющие решения однородной системы, то векторная сумма u + v также является решением системы.
  2. Если u - вектор, представляющий решение однородной системы, а r - любой скаляр , то r u также является решением системы.

Это в точности те свойства, которые требуются для того, чтобы набор решений был линейным подпространством в R n . В частности, множество решений для однородной системы является такой же , как нулевое пространство соответствующей матрицы A . Численные решения однородной системы могут быть найдены с помощью сингулярного разложения .

Отношение к неоднородным системам [ править ]

Между решениями линейной системы и решениями соответствующей однородной системы существует тесная связь:

В частности, если p - любое конкретное решение линейной системы A x = b , то весь набор решений можно описать как

Геометрически это означает, что набор решений для A x = b является переводом набора решений для A x = 0 . В частности, плоскость для первой системы может быть получена путем переноса линейного подпространства для однородной системы на вектор p .

Это рассуждение применимо только в том случае, если система A x = b имеет хотя бы одно решение. Это происходит тогда и только тогда , когда вектор Ь лежит в изображении от линейного преобразования A .

См. Также [ править ]

  • Расположение гиперплоскостей
  • Итеративное уточнение
  • График Коутса
  • LAPACK (бесплатный стандартный пакет для численного решения линейных уравнений; доступен на Fortran , C , C ++ )
  • Линейное уравнение над кольцом
  • Линейный метод наименьших квадратов
  • Разложение матрицы
  • Расщепление матрицы
  • Цифровая библиотека NAG (версии решателей LAPACK из библиотеки NAG)
  • Одновременные уравнения
  • Псевдообратная матрица Мура – ​​Пенроуза

Примечания [ править ]

  1. Антон (1987 , стр.2)
  2. ^ Борегард & Fraleigh (1973 , стр. 65)
  3. Burden & Faires (1993 , стр. 324)
  4. Голуб и Ван Лоан (1996 , с. 87)
  5. Харпер (1976 , с. 57)
  6. ^ Чарльз Г. Каллен (1990). Матрицы и линейные преобразования . МА: Дувр. п. 3. ISBN 978-0-486-66328-9.
  7. ^ Квантовый алгоритм решения линейных систем уравнений, Харроу и др. .

Ссылки [ править ]

  • Антон, Ховард (1987), Элементарная линейная алгебра (5-е изд.), Нью-Йорк: Wiley , ISBN 0-471-84819-0
  • Beauregard, Raymond A .; Фрали, Джон Б. (1973), Первый курс линейной алгебры: с дополнительным введением в группы, кольца и поля , Бостон: Houghton Mifflin Company , ISBN 0-395-14017-X
  • Бэрден, Ричард Л .; Faires, J. Douglas (1993), Numerical Analysis (5-е изд.), Boston: Prindle, Weber and Schmidt , ISBN 0-534-93219-3
  • Golub, Gene H .; Ван Лоан, Чарльз Ф. (1996), Матричные вычисления (3-е изд.), Балтимор: Johns Hopkins University Press , ISBN 0-8018-5414-8
  • Харпер, Чарли (1976), Введение в математическую физику , Нью-Джерси: Прентис-Холл , ISBN 0-13-487538-9

Дальнейшее чтение [ править ]

  • Axler, Sheldon Jay (1997), Linear Algebra Done Done Right (2-е изд.), Springer-Verlag, ISBN 0-387-98259-0
  • Лэй, Дэвид К. (22 августа 2005 г.), Линейная алгебра и ее приложения (3-е изд.), Аддисон Уэсли, ISBN 978-0-321-28713-7
  • Мейер, Карл Д. (15 февраля 2001 г.), Матричный анализ и прикладная линейная алгебра , Общество промышленной и прикладной математики (SIAM), ISBN 978-0-89871-454-8, архивировано с оригинала 1 марта 2001 г.
  • Пул, Дэвид (2006), Линейная алгебра: современное введение (2-е изд.), Брукс / Коул, ISBN 0-534-99845-3
  • Антон, Ховард (2005), Элементарная линейная алгебра (прикладная версия) (9-е изд.), Wiley International
  • Леон, Стивен Дж. (2006), Линейная алгебра с приложениями (7-е изд.), Пирсон Прентис Холл
  • Стрэнг, Гилберт (2005), Линейная алгебра и ее приложения

Внешние ссылки [ править ]

  • СМИ, связанные с Системой линейных уравнений на Викискладе?