Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории информации , то асимптотическое свойство равнораспределения ( AEP ) является общим свойством выходных образцов стохастического источника . Это фундаментально для концепции типичного набора, используемой в теориях сжатия данных .

Грубо говоря, теорема утверждает, что, хотя существует множество серий результатов, которые могут быть получены случайным процессом, фактически полученный результат, скорее всего, является результатом слабо определенного набора результатов, которые имеют примерно одинаковые шансы на то, чтобы быть фактически реализованным. . (Это следствие закона больших чисел и эргодической теории .) Хотя есть отдельные исходы, которые имеют более высокую вероятность, чем любой исход в этом наборе, огромное количество исходов в наборе почти гарантирует, что исход будет исходить из набор. Один из способов интуитивного понимания свойства - использовать теорему Крамера о большом отклонении, который гласит, что вероятность большого отклонения от среднего экспоненциально спадает с количеством выборок. Такие результаты изучаются в теории больших уклонений ; интуитивно понятно, что именно большие отклонения нарушают равнораспределение, но это маловероятно.

В области генерации псевдослучайных чисел кандидатный генератор неопределенного качества, выходная последовательность которого слишком далеко выходит за типичный набор некоторых статистических критериев, отклоняется как недостаточно случайный. Таким образом, хотя типичный набор определяется слабо, на практике возникают представления о достаточной типичности.

Определение [ править ]

Для стационарного эргодического случайного процесса с дискретным временем на вероятностном пространстве свойство асимптотической равнораспределенности является утверждением, что

где либо просто обозначает энтропию скорость из , которая должна существовать для всех дискретных стационарных процессов , включая эргодические них. Свойство асимптотического равнораспределения доказывается для конечнозначных (т.е. ) стационарных эргодических случайных процессов в теореме Шеннона – Макмиллана – Бреймана с использованием эргодической теории и для любых источников iid непосредственно с использованием закона больших чисел как в дискретнозначном случае (где просто энтропия символа) и непрерывнозначный случай (где H- это дифференциальная энтропия). Определение свойства асимптотической равнораспределенности также может быть расширено для некоторых классов случайных процессов с непрерывным временем, для которых типичный набор существует в течение достаточно длительного времени наблюдения. Сходимость доказана почти во всех случаях.

Источники идентификаторов с дискретным временем [ править ]

Дан источник iid, который может принимать значения в алфавите , его временной ряд - iid с энтропией . Слабый закон больших чисел дает свойство асимптотической равнораспределенности со сходимостью по вероятности :

поскольку энтропия равна математическому ожиданию

[1]

Сильный закон больших чисел утверждает более сильную почти верную сходимость,

Дискретное время конечнозначные стационарные эргодические источники [ править ]

Рассмотрим конечнозначное пространство выборок , т. Е. Для дискретного времени стационарного эргодического процесса, определенного на вероятностном пространстве . Свойство асимптотического равнораспределения для такого стохастического источника известно как теорема Шеннона – Макмиллана – Бреймана , принадлежащая Клоду Шеннону , Броквею Макмиллану и Лео Брейману .


Нестационарный источник дискретного времени, создающий независимые символы [ править ]

Предположения о стационарности / эргодичности / идентичности распределения случайных величин не являются существенными для сохранения свойства асимптотической равнораспределенности. В самом деле, интуитивно ясно, что свойство асимптотического равнораспределения требует выполнения лишь некоторой формы закона больших чисел, который является довольно общим. Однако это выражение должно быть соответствующим образом обобщено, а условия должны быть сформулированы точно.

Мы предполагаем, что источник создает независимые символы, с возможной различной выходной статистикой в ​​каждый момент времени. Мы предполагаем, что статистика процесса известна полностью, то есть известно маргинальное распределение процесса, наблюдаемого в каждый момент времени. Совместное распределение - это всего лишь продукт маргиналов. Тогда при условии (которое может быть ослаблено), что для всех i , для некоторого M > 0 выполняется следующее (AEP):

где

Приложения [ править ]

Свойство асимптотического равнораспределения для нестационарного независимого от дискретного времени процесса приводит нас (среди других результатов) к теореме кодирования источника для нестационарного источника (с независимыми выходными символами) и теореме кодирования с шумом для нестационарных каналов без памяти.

Стационарные эргодические источники непрерывного времени [ править ]

Функции с дискретным временем могут быть интерполированы на функции с непрерывным временем. Если такая интерполяция F является измеримым , мы можем определить стационарный процесс непрерывного времени соответственно , как . Если свойство асимптотического равнораспределения выполняется для процесса с дискретным временем, как в iid или конечнозначных стационарных эргодических случаях, показанных выше, оно автоматически выполняется для стационарного процесса с непрерывным временем, полученного из него некоторой измеримой интерполяцией. т.е.

где n соответствует степени свободы по времени τ . nH ( X ) / τ и H ( X ) - энтропия в единицу времени и на степень свободы соответственно, определенная Шенноном .

Важным классом таких стационарных процессов с непрерывным временем является стационарный эргодический процесс с ограниченной полосой пропускания, в котором пространство отсчетов является подмножеством непрерывных функций. Свойство асимптотического равнораспределения сохраняется, если процесс белый, и в этом случае временные отсчеты iid, или существует T > 1/2 W , где W - номинальная ширина полосы , так что временные отсчеты с интервалом T принимают значения в конечном множество, и в этом случае мы имеем конечнозначный стационарный эргодический процесс с дискретным временем.

Любые инвариантные во времени операции также сохраняют свойство асимптотического равнораспределения, стационарность и эргодичность, и мы можем легко превратить стационарный процесс в нестационарный, не теряя свойства асимптотического равнораспределения, обнуляя конечное число временных отсчетов в процессе.

Теория категорий [ править ]

Категории теоретико определение свойства равнораспределении дается Громовым . [3] Для данной последовательности декартовых степеней пространства с мерой P эта последовательность допускает асимптотически эквивалентную последовательность H N однородных пространств с мерой ( т. Е. Все множества имеют одну и ту же меру; все морфизмы инвариантны относительно группы автоморфизмов и, таким образом, разлагают на множители как морфизм к конечному объекту ).

Сказанное выше требует определения асимптотической эквивалентности . Это дается в терминах функции расстояния, показывающей, насколько инъективное соответствие отличается от изоморфизма . Инъективное соответствие - это частично определенное отображение, которое является биекцией ; то есть это взаимно однозначное соответствие между подмножеством и . Затем определите

где | S | обозначает меру множества S . В дальнейшем мера P и Q принимается равной 1, так что пространства с мерой являются вероятностными. Это расстояние обычно называют расстоянием земного движителя или метрикой Вассерштейна .

Аналогичным образом определим

с берется подсчет мера на P . Таким образом, это определение требует, чтобы P было пространством с конечной мерой. Наконец, пусть

Последовательность инъективными соответствий затем асимптотически эквивалентны , когда

Учитывая однородную пространственную последовательность H N, которая асимптотически эквивалентна P N , энтропия H ( P ) P может быть взята как

См. Также [ править ]

  • Теорема Крамера о большом уклонении
  • Теорема исходного кода
  • Теорема кодирования с шумом

Заметки [ править ]

  1. ^ Обложка и Томас (1991) , стр. 51.
  2. ^ Algoet & Cover (1988) .
  3. ^ Миша Громов, (2012) « В поисках структуры, часть 1: об энтропии ». (См. Стр. 5, где свойство равнораспределения называется «аппроксимационной теоремой Бернулли».)

Ссылки [ править ]

Статьи журнала [ править ]

  • Клод Э. Шеннон. « Математическая теория коммуникации ». Технический журнал Bell System , июль / октябрь 1948 г.
  • Algoet, Paul H .; Обложка, Томас М. (1988). "Сэндвич-доказательство теоремы Шеннона-Макмиллана-Бреймана" (PDF) . Летопись вероятности . 16 (2): 899–909.
  • Серхио Верду и Те Сун Хан. «Роль свойства асимптотической равнораспределенности в бесшумном исходном кодировании». IEEE Transactions по теории информации , 43 (3): 847–857, 1997.

Учебники [ править ]

  • Обложка, Томас М .; Томас, Джой А. (1991). Элементы теории информации (первое изд.). Хобокен, Нью-Джерси: Wiley. ISBN 978-0-471-24195-9.
  • Маккей, Дэвид JC (2003). Теория информации, выводы и алгоритмы обучения . Издательство Кембриджского университета. ISBN 0-521-64298-1.