Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории вероятностей , то китайский процесс ресторан является дискретным временем стохастический процесс , аналогичный сидения клиентов на столах в китайском ресторане. Представьте себе китайский ресторан с бесконечным количеством круглых столов, каждый с бесконечной вместимостью. Покупатель 1 сидит за первым столом. Следующий покупатель либо сидит за тем же столом, что и покупатель 1, либо за следующим столом. Это продолжается, когда каждый покупатель выбирает либо сесть за занятый стол с вероятностью, пропорциональной количеству уже присутствующих клиентов (т. Е. Они с большей вероятностью сядут за стол с большим количеством клиентов, чем с несколькими), либо с незанятым столом. В момент времени п , то п клиенты были распределялисреди m  ≤  n таблиц (или блоков раздела). Результаты этого процесса взаимозаменяемы , то есть порядок, в котором сидят клиенты, не влияет на вероятность окончательного распределения . Это свойство значительно упрощает ряд задач популяционной генетики , лингвистического анализа и распознавания образов .

Дэвид Дж. Олдос приписывает ресторанную аналогию Джиму Питману и Лестеру Дубинсу в своей книге 1983 года. [1]

Формальное определение [ править ]

В любой положительный целочисленный момент времени n значение процесса представляет собой разбиение B n множества {1, 2, 3, ...,  n }, распределение вероятностей которого определяется следующим образом. В момент времени n  = 1 тривиальное разбиение {{1}} получается с вероятностью 1. В момент времени n  + 1 элемент n  + 1 либо:

  1. добавлен в один из блоков раздела B n , где каждый блок выбирается с вероятностью | b | / ( n  + 1) где | б | размер блока (т.е. количество элементов), или
  2. добавлен в раздел B n как новый одноэлементный блок с вероятностью 1 / ( n  + 1).

Сгенерированный таким образом случайный раздел имеет некоторые особые свойства. Это заменяемое в том смысле , что перемаркировки {1, ...,  п } не меняет распределение раздела, и это согласуется в том смысле , что закон разбиения п  - 1 , полученное удаление элемента п из случайное разбиение в момент времени n такое же, как и закон случайного разделения в момент времени n  - 1.

Вероятность, присвоенная любому конкретному разделу (без учета порядка, в котором клиенты сидят за любым конкретным столом), равна

где b - блок в разбиении B и | б | это размер b .

Распространение [ править ]

Распределение столов в китайском ресторане (CRT) - это распределение вероятностей количества столиков в китайском ресторане. [2] Его можно понять как сумму n независимых случайных величин, каждая из которых имеет свое распределение Бернулли :

Функция вероятности массы L определяется выражением [3]

где s обозначает числа Стирлинга первого рода .

Обобщение [ править ]

Эта конструкция может быть обобщена на модели с двумя параметрами, θ & α , [4] [5] обычно называют скидки и прочности (или концентрации ) параметров. В момент времени n  + 1 следующий прибывший покупатель находит | B | заняты столами и решает с вероятностью сесть за пустой стол

или за занятым столом b размера | б | с вероятностью

Чтобы конструкция определяла допустимую вероятностную меру, необходимо предположить, что либо α <0 , либо θ  =  - Lα для некоторого L  ∈ {1, 2, ...}; или что 0 ≤  α  <1 и θ  > - α .

Согласно этой модели вероятность, присвоенная любому конкретному разбиению B числа n , в терминах k-символа Похгаммера , равна

где по соглашению , а для

Таким образом, для случая, когда вероятность разбиения может быть выражена через гамма-функцию как

В однопараметрическом случае, когда равно нулю, это упрощается до

Или, когда равно нулю,

Как и раньше, вероятность, присвоенная любому конкретному разделу, зависит только от размеров блока, так что, как и раньше, случайный раздел можно заменять в смысле, описанном выше. Свойство согласованности по-прежнему сохраняется по построению.

Если α  = 0, то распределение вероятностей случайного разбиения целого числа n, сгенерированное таким образом, является распределением Ювенса с параметром θ, используемым в популяционной генетике и единой нейтральной теории биоразнообразия .

Анимация процесса китайского ресторана с параметром масштабирования . Таблицы скрываются, когда клиенты столика больше не могут отображаться; однако за каждым столом бесконечно много мест. (Запись интерактивной анимации. [6] )

Вывод [ править ]

Вот один из способов получить эту вероятность разделения. Пусть C i будет случайным блоком, в который добавлено число i , для i  = 1, 2, 3, .... потом

Вероятность того, что B n является каким-либо конкретным разбиением множества {1, ...,  n  }, является произведением этих вероятностей при изменении i от 1 до n . Теперь рассмотрим размер блока b : он увеличивается на 1 каждый раз, когда мы добавляем в него один элемент. Когда должен быть добавлен последний элемент в блоке b , размер блока равен (| b | - 1). Например, рассмотрим эту последовательность вариантов: (создать новый блок  b ) (присоединиться к  b ) (присоединиться к  b ) (присоединиться к  b ). В конце концов, блок b состоит из 4 элементов, и произведение числителей в приведенном выше уравнении дает θ · 1 · 2 · 3. Следуя этой логике, мы получаем Pr ( B n  =  B ), как указано выше.

Ожидаемое количество столов [ править ]

Для случая с одним параметром, когда α  = 0 и 0 <  θ  <∞, количество столов распределяется в соответствии с распределением столов в китайском ресторане . Ожидаемое значение этой случайной величины при наличии сидящих клиентов составляет [7]

где - дигамма-функция . В общем случае ( α  > 0) ожидаемое количество занятых таблиц составляет [5]

однако обратите внимание, что эта функция не является стандартной гамма-функцией . [5]

Индийский буфет [ править ]

Можно адаптировать модель таким образом, чтобы каждая точка данных больше не была однозначно связана с классом (т. Е. Мы больше не строим раздел), но могла быть связана с любой комбинацией классов. Это усиливает аналогию со столиками в ресторане и вместо этого сравнивается с процессом, в котором группа посетителей пробует из некоторого подмножества бесконечного выбора блюд, предлагаемых на шведском столе. Вероятность того, что конкретный посетитель попробует конкретное блюдо, пропорциональна его популярности среди посетителей, и, кроме того, посетитель может пробовать из непроверенных блюд. Этот процесс получил название « индийский буфет» и может использоваться для вывода скрытых функций в данных. [8]

Приложения [ править ]

Китайский ресторанный процесс тесно связан с процессами Дирихле и схемой урны Поли , и поэтому полезен в приложениях байесовской статистики, включая непараметрические байесовские методы . Обобщенный китайский ресторанный процесс тесно связан с процессом Питмана – Йорка . Эти процессы использовались во многих приложениях, включая моделирование текста, кластеризацию данных биологических микрочипов , [9] моделирование биоразнообразия и реконструкцию изображений [10] [11]

См. Также [ править ]

  • Формула выборки Ювенса
  • Предпочтительная привязанность
  • Парадокс Гильберта в Гранд Отеле

Ссылки [ править ]

  1. ^ Олдос, DJ (1985). «Возможность обмена и смежные темы». École d'Été de Probabilités de Saint-Flour XIII - 1983 . Конспект лекций по математике. 1117 . С. 1–198. DOI : 10.1007 / BFb0099421 . ISBN 978-3-540-15203-3.
  2. ^ Чжоу, Минъюань; Карин, Лоуренс (2012). «Отрицательный биномиальный подсчет процесса и моделирование смеси». IEEE Transactions по анализу шаблонов и машинному анализу . 37 (2): 307–20. arXiv : 1209.3442 . Bibcode : 2012arXiv1209.3442Z . DOI : 10.1109 / TPAMI.2013.211 . PMID 26353243 . 
  3. ^ Антониак, Чарльз Э (1974). «Смеси процессов Дирихле с приложениями к байесовским непараметрическим задачам» . Летопись статистики . 2 (6): 1152–1174. DOI : 10.1214 / AOS / 1176342871 .
  4. ^ Питман, Джим (1995). «Заменяемые и частично заменяемые случайные разделы». Теория вероятностей и смежные области . 102 (2): 145–158. DOI : 10.1007 / BF01213386 . Руководство по ремонту 1337249 . 
  5. ^ a b c Питман, Джим (2006). Комбинаторные случайные процессы . 1875 . Берлин: Springer-Verlag. ISBN 9783540309901.
  6. ^ «Процесс Дирихле и распределение Дирихле - Схема ресторана Поля и китайский ресторанный процесс» .
  7. Синьхуа Чжан, «Очень мягкое примечание о построении процесса Дирихле», сентябрь 2008 г., Австралийский национальный университет, Канберра. Интернет: http://users.cecs.anu.edu.au/~xzhang/pubDoc/notes/dirichlet_process.pdf Архивировано 11 апреля 2011 г., на Wayback Machine
  8. ^ Гриффитс, Т.Л. и Гахрамани, З. (2005) Модели бесконечных скрытых функций и индийский буфетный процесс . Технический отчет подразделения Гэтсби GCNU-TR-2005-001.
  9. ^ Цинь, Zhaohui S (2006). «Кластеризация данных экспрессии генов микроматрицы с использованием взвешенного китайского ресторанного процесса» . Биоинформатика . 22 (16): 1988–1997. DOI : 10.1093 / биоинформатики / btl284 . PMID 16766561 . 
  10. ^ Белый, JT; Госал, С. (2011). «Байесовское сглаживание изображений, ограниченных фотонами, с приложениями в астрономии» (PDF) . Журнал Королевского статистического общества, серия B (статистическая методология) . 73 (4): 579–599. CiteSeerX 10.1.1.308.7922 . DOI : 10.1111 / j.1467-9868.2011.00776.x .  
  11. ^ Ли, М .; Госал, С. (2014). «Байесовское многомасштабное сглаживание гауссовских зашумленных изображений» . Байесовский анализ . 9 (3): 733–758. DOI : 10.1214 / 14-ba871 .

Внешние ссылки [ править ]

  • Введение в распределение Дирихле и связанные с ним процессы Фригика, Капилы и Гупты
  • Выступление Майкла И. Джордана о CRP:
    • http://videolectures.net/icml05_jordan_dpcrp/