Оценка Сулстона - это уравнение, используемое при картировании ДНК для численной оценки вероятности того, что данное сходство «отпечатков пальцев» между двумя клонами ДНК является просто результатом случайности. Используемый как таковой, это тест статистической значимости . То есть низкие значения означают, что сходство является значительным , предполагая, что два клона ДНК перекрывают друг друга и что данное сходство не является случайным событием. Это эпоним, который относится к Джону Салстону , поскольку он был ведущим автором статьи, в которой впервые было предложено использование этого уравнения. [1]
Проблема перекрытия при отображении [ править ]
Каждый клон в проекте картирования ДНК имеет «отпечаток пальца», то есть набор длин фрагментов ДНК, выведенных из (1) ферментативного переваривания клона, (2) разделения этих фрагментов на геле и (3) оценки их длины на основе геля. место расположения. Для каждого попарного сравнения клонов можно установить, сколько длин из каждого набора совпадений. Случаи, имеющие хотя бы одно совпадение, указывают на то, что клоны могут перекрываться, поскольку совпадения могут представлять одну и ту же ДНК. Однако основные последовательности для каждого совпадения неизвестны. Следовательно, два фрагмента, длина которых совпадает, могут по-прежнему представлять разные последовательности. Другими словами, совпадения окончательно не указывают на совпадения. Проблема заключается в том, чтобы использовать совпадения для вероятностного классифицировать статус перекрытия.
Математические баллы при оценивании с перекрытием [ править ]
Биологи использовали множество средств (часто в сочетании), чтобы различать перекрытия клонов в проектах по картированию ДНК . Хотя многие из них являются биологическими, то есть ищут общие маркеры, другие в основном являются математическими, обычно применяя вероятностные и / или статистические подходы.
Экспозиция партитуры Салстона [ править ]
Оценка Сулстона основана на следующих концепциях Бернулли и биномиальных процессов . Рассмотрим два клона, и , имеющие и измеренные длины фрагментов, соответственно, где . То есть у клона как минимум столько же фрагментов, сколько у клона , но обычно больше. Оценка Сулстона - это вероятность того, что по крайней мере длины фрагментов на клоне будут совпадать с любой комбинацией длин на клоне . Интуитивно мы видим, что совпадений может быть самое большее . Таким образом, для данного сравнения двух клонов можно измерить статистическую значимость совпадения фрагментов, т. Е.насколько вероятно, что это совпадение произошло просто случайно. Очень низкие значения будут указывать на значительное совпадение, которое вряд ли возникло по чистой случайности, в то время как более высокие значения предполагают, что данное совпадение могло быть просто совпадением.
Вывод баллов Сулстона Одно из основных предположений состоит в том, что фрагменты равномерно распределены на геле, т.е. фрагмент имеет равную вероятность появления где-нибудь на геле. Поскольку положение геля является индикатором длины фрагмента, это предположение эквивалентно предположению, что длины фрагментов распределены равномерно. Измеренное местоположение любого фрагмента имеет соответствующий допуск на ошибку , так что его истинное местоположение известно только как лежащее в пределах сегмента . В дальнейшем будем называть длины отдельных фрагментов просто длинами . Учитывайте конкретную длину клона и определенную длину клона . Эти две длины произвольно выбираются из соответствующих наборов и . Мы предполагаем, что местоположение фрагмента в геле было определено, и нам нужна вероятность того, что местоположение фрагмента будет совпадать с местоположением фрагмента . Геометрически будет объявлено, что оно совпадает, если оно попадает в окно размера вокруг . Поскольку фрагмент может находиться где угодно в геле длиной , мы имеем . Вероятность того, что не match - это просто дополнение, т. е. поскольку оно должно совпадать или не совпадать.
Теперь давайте расширим это, чтобы вычислить вероятность того, что никакая длина клона не соответствует единственной конкретной длине клона . Это просто пересечение всех отдельных испытаний, на которых происходит событие , т . Е. Это может быть пересчитано в устной форме , как: 1 длина на клоне не соответствует длине на клоне и длины 2 не совпадает с длиной и длина 3 не совпадают, и т.д. Поскольку каждый из этих испытаний предполагаются быть независимыми, то вероятность просто
Конечно, реальное событие , представляющее интерес является дополнением: т.е. нет не «никаких совпадений». Другими словами, вероятность одного или нескольких совпадений равна . Формально это вероятность того, что хотя бы одна группа на клоне совпадает с полосой на клоне .
Это событие принято как испытание Бернулли с вероятностью «успеха» (совпадения) для диапазона . Тем не менее, мы хотим описать процесс для всех бэндов на клоне . Поскольку является константой, количество совпадений распределяется биномиально . Учитывая наблюдаемые совпадения, оценка Сулстона - это просто вероятность получения хотя бы совпадений случайно в соответствии с
где - биномиальные коэффициенты .
Математическое уточнение [ править ]
В статье 2005 года [2] Майкл Вендл привел пример, показывающий, что предположение о независимых испытаниях неверно. Итак, хотя традиционная оценка Сулстона действительно представляет собой распределение вероятностей , на самом деле это не характеристика распределения проблемы отпечатков пальцев. Вендл дал общее решение этой проблемы в терминах полиномов Белла , показав, что традиционная оценка на несколько порядков превышает P-значения. (P-значения в этой задаче очень малы, поэтому мы говорим, например, о вероятностях порядка 10 × 10 −14 по сравнению с 10 × 10 −12.(последнее значение Сулстона на 2 порядка выше). Это решение обеспечивает основу для определения того, когда проблема имеет достаточно информации, чтобы ее можно было обработать с помощью вероятностного подхода, а также является общим решением проблемы дня рождения двух типов .
Недостатком точного решения является то, что его оценка требует больших вычислительных ресурсов и, по сути, невозможна для сравнения больших клонов. [2] Были предложены некоторые быстрые приближения для этой проблемы. [3]
Ссылки [ править ]
- ^ Салстон Дж, Маллетта Ж, Стаден R, R Дарбина, Horsnell Т, Коулсон А (март 1988). «Программное обеспечение для картирования генома методами дактилоскопии». Comput Appl Biosci . 4 (1): 125–32. DOI : 10.1093 / биоинформатики / 4.1.125 . PMID 2838135 .
- ^ a b Wendl MC (апрель 2005 г.). «Вероятностная оценка перекрытий клонов в картировании отпечатков пальцев ДНК с помощью априорных моделей». J. Comput. Биол . 12 (3): 283–97. DOI : 10,1089 / cmb.2005.12.283 . PMID 15857243 .
- Перейти ↑ Wendl MC (2007). «Методы алгебраической коррекции для вычислительной оценки перекрытий клонов при картировании отпечатков пальцев ДНК» . BMC Bioinformatics . 8 : 127. DOI : 10,1186 / 1471-2105-8-127 . PMC 1868038 . PMID 17442113 .
См. Также [ править ]
- FPC : широко используемая программа картирования отпечатков пальцев, использующая шкалу Сулстона.