Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Сайты связывания ДНК - это тип сайтов связывания, обнаруженных в ДНК, где могут связываться другие молекулы. Сайты связывания ДНК отличаются от других сайтов связывания тем, что (1) они являются частью последовательности ДНК (например, генома) и (2) они связаны ДНК-связывающими белками . Сайты связывания ДНК часто связаны со специализированными белками, известными как факторы транскрипции , и, таким образом, связаны с регуляцией транскрипции . Сумма сайтов связывания ДНК конкретного фактора транскрипции называется его цистромом . Сайты связывания ДНК также охватывают мишени других белков, таких как рестрикционные ферменты , сайт-специфические рекомбиназы (см.сайт-специфическая рекомбинация ) и метилтрансферазы . [1]

Таким образом, сайты связывания ДНК можно определить как короткие последовательности ДНК (обычно длиной от 4 до 30 пар оснований, но до 200 п.н. для сайтов рекомбинации), которые специфически связываются одним или несколькими ДНК-связывающими белками или белковыми комплексами. Сообщалось, что некоторые сайты связывания потенциально могут претерпевать быстрые эволюционные изменения. [2]

Типы сайтов связывания ДНК [ править ]

Сайты связывания ДНК можно разделить на категории в соответствии с их биологической функцией. Таким образом, мы можем различать сайты связывания факторов транскрипции, сайты рестрикции и сайты рекомбинации. Некоторые авторы предложили также классифицировать сайты связывания в соответствии с их наиболее удобным способом представления. [3] С одной стороны, сайты рестрикции обычно могут быть представлены консенсусными последовательностями. Это потому, что они нацелены в основном на идентичные последовательности, а эффективность рестрикции резко снижается для менее похожих последовательностей. С другой стороны, сайты связывания ДНК для данного фактора транскрипции обычно все разные, с разной степенью сродства фактора транскрипции к различным сайтам связывания. Это затрудняет точное представление сайтов связывания факторов транскрипции с использованиемсогласованные последовательности , и они обычно представлены с использованием частотных матриц, специфичных для положения (PSFM), которые часто графически изображаются с использованием логотипов последовательностей . Однако этот аргумент отчасти произвольный. Ферменты рестрикции, такие как факторы транскрипции, дают постепенный, хотя и резкий, диапазон сродства к разным сайтам [4] и, таким образом, также лучше всего представлены PSFM. Аналогичным образом, сайт-специфические рекомбиназы также демонстрируют различный диапазон аффинности к различным сайтам-мишеням. [5] [6]

История и основные экспериментальные методы [ править ]

Существование чего-то похожего на сайты связывания ДНК было заподозрено на основании экспериментов по биологии бактериофага лямбда [7] и регуляции lac-оперона Escherichia coli . [8] Сайты связывания ДНК были окончательно подтверждены в обеих системах [9] [10] [11] с появлением методов секвенирования ДНК . С тех пор сайты связывания ДНК для многих факторов транскрипции, рестрикционных ферментов и сайт-специфичных рекомбиназ были открыты с использованием множества экспериментальных методов. Исторически сложилось так, что экспериментальными методами выбора для обнаружения и анализа сайтов связывания ДНК были анализ следа ДНКазы иАнализ сдвига электрофоретической подвижности (EMSA). Однако развитие микрочипов ДНК и методов быстрого секвенирования привело к появлению новых, массово параллельных методов идентификации сайтов связывания in vivo, таких как ChIP-chip и ChIP-Seq . [12] Для количественной оценки аффинности связывания [13] белков и других молекул со специфическими участками связывания ДНК используется биофизический метод микромасштабного термофореза [14] .

Базы данных [ править ]

Из-за разнообразия экспериментальных методов, используемых для определения сайтов связывания, и неоднородного покрытия большинства организмов и факторов транскрипции, отсутствует центральная база данных (по аналогии с GenBank в Национальном центре биотехнологической информации ) для сайтов связывания ДНК. Несмотря на то, что NCBI предполагает аннотацию сайта связывания ДНК в своих контрольных последовательностях ( RefSeq ), в большинстве представленных материалов эта информация отсутствует. Более того, из-за ограниченного успеха биоинформатики в создании эффективных инструментов для прогнозирования сайтов связывания ДНК (большие ложноположительные показатели часто связаны с методами обнаружения мотивов in-silico / поиска сайтов), не предпринималось никаких систематических усилий по компьютерному аннотированию этих функций в секвенированных геномы.

Однако существует несколько частных и общедоступных баз данных, посвященных компиляции экспериментально зарегистрированных, а иногда и предсказанных с помощью вычислений сайтов связывания для различных факторов транскрипции у разных организмов. Ниже представлена ​​неполная таблица доступных баз данных:

Представление сайтов связывания ДНК [ править ]

Набор сайтов связывания ДНК, обычно называемый мотивом связывания ДНК, может быть представлен консенсусной последовательностью . Это представление имеет то преимущество, что оно компактно, но за счет игнорирования значительного объема информации. [15] Более точный способ представления сайтов привязки - использование матриц частот, зависящих от положения (PSFM). Эти матрицы дают информацию о частоте каждого основания в каждом положении ДНК-связывающего мотива. [3] PSFM обычно задумываются с неявным предположением о позиционной независимости (разные положения в сайте связывания ДНК вносят независимый вклад в функцию сайта), хотя это предположение оспаривается для некоторых сайтов связывания ДНК. [16]Информация о частоте в PSFM формально может быть истолкована в рамках теории информации , [17] , ведущих к ее графическому представлению в виде последовательности логотипа .

PSFM для репрессора транскрипции LexA, полученный из 56 сайтов связывания LexA, хранящихся в Prodoric. Относительные частоты получаются делением количества в каждой ячейке на общее количество (56).

Вычислительный поиск и обнаружение сайтов привязки [ править ]

В биоинформатике можно различать две отдельные проблемы, касающиеся сайтов связывания ДНК: поиск дополнительных членов известного ДНК-связывающего мотива (проблема поиска сайта) и обнаружение новых ДНК-связывающих мотивов в коллекциях функционально связанных последовательностей ( проблема обнаружения мотива последовательности ). . [18] Для поиска сайтов связывания было предложено множество различных методов. Большинство из них полагаются на принципы теории информации и имеют доступные веб-серверы (Yellaboina) (Munch), в то время как другие авторы прибегают к методам машинного обучения , таким как искусственные нейронные сети . [3] [19] [20] Также доступно множество алгоритмов дляоткрытие мотива последовательности . Эти методы основаны на гипотезе о том, что набор последовательностей имеет общий связывающий мотив по функциональным причинам. Методы обнаружения мотивов привязки можно условно разделить на перечислительные, детерминированные и стохастические. [21] MEME [22] и Consensus [23] являются классическими примерами детерминированной оптимизации, в то время как пробоотборник Гиббса [24] представляет собой обычную реализацию чисто стохастического метода обнаружения ДНК-связывающих мотивов. Другим примером этого класса методов является SeSiMCMC [25], который ориентирован на слабые сайты TFBS с симметрией. Хотя перечислительные методы часто прибегают к регулярному выражениюпредставление сайтов связывания, PSFM и их формальная обработка в рамках методов теории информации являются предпочтительным представлением как для детерминированных, так и для стохастических методов. Гибридные методы, например ChIPMunk [26] , сочетающие жадную оптимизацию с субдискретизацией, также используют PSFM. Недавние успехи в секвенировании привели к внедрению подходов сравнительной геномики к открытию ДНК-связывающих мотивов, на примере PhyloGibbs. [27] [28]

Более сложные методы поиска сайтов связывания и открытия мотивов основаны на укладке оснований и других взаимодействиях между основаниями ДНК, но из-за небольших размеров выборки, обычно доступных для сайтов связывания в ДНК, их эффективность до сих пор не используется полностью. Примером такого инструмента является ULPB [29]

См. Также [ править ]

  • ДНК-связывающий белок
  • Связывающий сайт
  • Транскрипционная регуляция

Ссылки [ править ]

  1. ^ Halford ES; Марко Дж. Ф. (2004). «Как сайт-специфичные ДНК-связывающие белки находят свои мишени?» . Исследования нуклеиновых кислот . 32 (10): 3040–3052. DOI : 10.1093 / NAR / gkh624 . PMC  434431 . PMID  15178741 .
  2. ^ Borneman, AR; Gianoulis, TA; Zhang, ZD; Yu, H .; Rozowsky, J .; Seringhaus, MR; Wang, LY; Герштейн, М. и Снайдер, М. (2007). «Дивергенция сайтов связывания фактора транскрипции между родственными видами дрожжей». Наука . 317 (5839): 815–819. Bibcode : 2007Sci ... 317..815B . DOI : 10.1126 / science.1140748 . PMID 17690298 . S2CID 21535866 .  
  3. ^ а б в Стормо Г. Д. (2000). «Сайты связывания ДНК: представление и открытие» . Биоинформатика . 16 (1): 16–23. DOI : 10.1093 / биоинформатики / 16.1.16 . PMID 10812473 . 
  4. ^ Pingoud A, Jeltsch A (1997). «Распознавание и расщепление ДНК рестрикционными эндонуклеазами типа II» . Европейский журнал биохимии . 246 (1): 1-22. DOI : 10.1111 / j.1432-1033.1997.t01-6-00001.x . PMID 9210460 . 
  5. ^ Gyohda А, Komano Т (2000). «Очистка и характеристика рекомбиназы, специфичной для шаффлона R64» . Журнал бактериологии . 182 (10): 2787–2792. DOI : 10.1128 / JB.182.10.2787-2792.2000 . PMC 101987 . PMID 10781547 .  
  6. ^ Бирге, Е. А. (2006). «15: Специфическая рекомбинация». Бактериальная и бактериофаговая генетика (5-е изд.). Springer. С. 463–478. ISBN 978-0-387-23919-4.
  7. ^ Кэмпбелл A (1963). "Генетика тонкой структуры и ее связь с функцией". Ежегодный обзор микробиологии . 17 (1): 2787–2792. DOI : 10.1146 / annurev.mi.17.100163.000405 . PMID 14145311 . 
  8. Перейти ↑ Jacob F, Monod J (1961). «Генетические регуляторные механизмы в синтезе белков». Журнал молекулярной биологии . 3 (3): 318–356. DOI : 10.1016 / S0022-2836 (61) 80072-7 . PMID 13718526 . 
  9. ^ Гилберт Вт, Максам А (1973). «Нуклеотидная последовательность оператора lac» . Труды Национальной академии наук Соединенных Штатов Америки . 70 (12): 3581–3584. Bibcode : 1973PNAS ... 70.3581G . DOI : 10.1073 / pnas.70.12.3581 . PMC 427284 . PMID 4587255 .  
  10. ^ Маниатис T, Ptashne М, Бэррелл Б.Г., Донелсон J (1974). «Последовательность сайта связывания репрессора в ДНК бактериофага лямбда». Природа . 250 (465): 394–397. Bibcode : 1974Natur.250..394M . DOI : 10.1038 / 250394a0 . PMID 4854243 . S2CID 4204720 .  
  11. ^ Нэша HA (1975). «Интегративная рекомбинация ДНК бактериофага лямбда in vitro» . Труды Национальной академии наук Соединенных Штатов Америки . 72 (3): 1072–1076. Bibcode : 1975PNAS ... 72.1072N . DOI : 10.1073 / pnas.72.3.1072 . PMC 432468 . PMID 1055366 .  
  12. ^ Elnitski L, Джин VX, Фарнхем PJ, SJ Jones (2006). «Поиск сайтов связывания факторов транскрипции млекопитающих: обзор вычислительных и экспериментальных методов» . Геномные исследования . 16 (12): 1455–1464. DOI : 10.1101 / gr.4140006 . PMID 17053094 . 
  13. ^ Baaske P, Wienken CJ, Reineck P, S Duhr, Braun D (февраль 2010). «Оптический термофорез количественно определяет зависимость связывания аптамера от буфера». Энгью. Chem. Int. Эд . 49 (12): 2238–41. DOI : 10.1002 / anie.200903998 . PMID 20186894 . S2CID 42489892 . Краткое содержание - Phsyorg.com .  
  14. ^ Винкен CJ; и другие. (2010). «Анализы связывания белков в биологических жидкостях с использованием термофореза на микроуровне» . Nature Communications . 1 (7): 100. Bibcode : 2010NatCo ... 1..100W . DOI : 10.1038 / ncomms1093 . PMID 20981028 . 
  15. Перейти ↑ Schneider TD (2002). «Согласованная последовательность Дзэн» . Прикладная биоинформатика . 1 (3): 111–119. PMC 1852464 . PMID 15130839 .  
  16. ^ Булык М.Л .; Johnson PL; Церковь GM (2002). «Нуклеотиды сайтов связывания факторов транскрипции оказывают взаимозависимые эффекты на аффинность связывания факторов транскрипции» . Исследования нуклеиновых кислот . 30 (5): 1255–1261. DOI : 10.1093 / NAR / 30.5.1255 . PMC 101241 . PMID 11861919 .  
  17. ^ Schneider TD, Stormo GD, золото L, эренфойхтова A (1986). «Информационное содержание сайтов связывания нуклеотидных последовательностей». Журнал молекулярной биологии . 188 (3): 415–431X. DOI : 10.1016 / 0022-2836 (86) 90165-8 . PMID 3525846 . 
  18. ^ Эрилл I; О'Нил MC (2009). «Пересмотр основанных на теории информации методов идентификации ДНК-связывающих сайтов» . BMC Bioinformatics . 10 (1): 57. DOI : 10,1186 / 1471-2105-10-57 . PMC 2680408 . PMID 19210776 .  
  19. ^ Bisant D, Майзель J (1995). «Идентификация сайтов связывания рибосом в Escherichia coli с использованием моделей нейронных сетей» . Исследования нуклеиновых кислот . 23 (9): 1632–1639. DOI : 10.1093 / NAR / 23.9.1632 . PMC 306908 . PMID 7784221 .  
  20. Перейти ↑ O'Neill MC (1991). «Обучение нейронных сетей обратного распространения для определения и обнаружения участков связывания ДНК» . Исследования нуклеиновых кислот . 19 (2): 133–318. DOI : 10.1093 / NAR / 19.2.313 . PMC 333596 . PMID 2014171 .  
  21. ^ Bailey TL (2008). «Обнаружение мотивов последовательности». Биоинформатика (PDF) . Методы молекулярной биологии . Методы молекулярной биологии ™. 452 . С. 231–251. DOI : 10.1007 / 978-1-60327-159-2_12 . ISBN  978-1-58829-707-5. PMID  18566768 .
  22. ^ Bailey TL (2002). «Открытие новых мотивов последовательности с цМемом». Текущие протоколы в биоинформатике . 2 (4): 2.4.1–2.4.35. DOI : 10.1002 / 0471250953.bi0204s00 . PMID 18792935 . S2CID 205157795 .  
  23. ^ Stormo GD, Hartzell GW третьего (1989). «Идентификация сайтов связывания с белками из невыровненных фрагментов ДНК» . Труды Национальной академии наук Соединенных Штатов Америки . 86 (4): 1183–1187. Полномочный код : 1989PNAS ... 86.1183S . DOI : 10.1073 / pnas.86.4.1183 . PMC 286650 . PMID 2919167 .  
  24. ^ Лоуренс CE, Альтшул С.Ф. , Богуски М.С. , Лю Дж.С., Нойвальд А.Ф., Вуттон Дж.С. (1993). «Обнаружение тонких сигналов последовательности: стратегия выборки Гиббса для множественного выравнивания». Наука . 262 (5131): 208–214. Bibcode : 1993Sci ... 262..208L . DOI : 10.1126 / science.8211139 . PMID 8211139 . S2CID 3040614 .  
  25. ^ Фаворов, А.В.; М.С. Гельфанд; А.В. Герасимова; Д.А. Равчеев; А.А. Миронов; Макеев В.Ю. (15.05.2005). «Пробоотборник Гиббса для идентификации симметрично структурированных, разнесенных мотивов ДНК с улучшенной оценкой длины сигнала» . Биоинформатика . 21 (10): 2240–2245. DOI : 10.1093 / биоинформатики / bti336 . ISSN 1367-4803 . PMID 15728117 .  
  26. Кулаковский, И.В. В.А. Боева; А.В. Фаворов; В.Ю. Макеев (24.08.2010). «Глубокий и широкий поиск связывающих мотивов в данных ChIP-Seq» . Биоинформатика . 26 (20): 2622–3. DOI : 10.1093 / биоинформатики / btq488 . ISSN 1367-4811 . PMID 20736340 .  
  27. Перейти ↑ Das MK, Dai HK (2007). «Обзор алгоритмов поиска мотивов ДНК» . BMC Bioinformatics . 8 (Дополнение 7): S21. DOI : 10.1186 / 1471-2105-8-S7-S21 . PMC 2099490 . PMID 18047721 .  
  28. ^ Siddharthan R, Siggia ED, ван Нимвеген E (2005). "PhyloGibbs: программа для поиска мотивов Гиббса, которая включает филогению" . PLOS Comput Biol . 1 (7): e67. Bibcode : 2005PLSCB ... 1 ... 67S . DOI : 10.1371 / journal.pcbi.0010067 . PMC 1309704 . PMID 16477324 .  
  29. Перейти ↑ Salama RA, Stekel DJ (2010). «Включение взаимозависимостей соседних оснований существенно улучшает предсказание сайта связывания прокариотического фактора транскрипции по всему геному» . Исследования нуклеиновых кислот . 38 (12): e135. DOI : 10.1093 / NAR / gkq274 . PMC 2896541 . PMID 20439311 .  

Внешние ссылки [ править ]

  • ENCODE темы Explorer Мотивы факторов транскрипции в природе
  • Отобранные вручную связывающие мотивы TF для 157 видов растений