Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску
Образец последовательности, показывающий три различных возможных рамки считывания . Стартовые кодоны выделены фиолетовым цветом, а стоп-кодоны - красным.

В молекулярной генетике , открытая рамка считывания ( ORF ) является частью рамки считывания , которая имеет возможность быть переведено . ORF - это непрерывный участок кодонов, который начинается со стартового кодона (обычно AUG) и заканчивается стоп-кодоном (обычно UAA, UAG или UGA). [1] Кодон ATG (AUG в терминах РНК ) в ORF (не обязательно первый) может указывать, где начинается трансляция. Сайт терминации транскрипции расположен после ORF, за стоп-кодоном трансляции. . Если бы транскрипция прекратилась до появления стоп-кодона, во время трансляции образовался бы неполный белок. [2] В эукариотических генов с множественными экзонов , интроны удаляются , а экзоны затем соединяются вместе после транскрипции с получением окончательного мРНК для трансляции белка. В контексте ген нахождения , старт-стоп определение из ORF применяется таким образом , чтобы только сращенный мРНК, а не геномная ДНК, так как интроны могут содержать стоп - кодоны и / или вызвать сдвиги между чтением кадрами. Альтернативное определение гласит, что ORF - это последовательность, длина которой делится на три и ограничена стоп-кодонами. [3] [4]Это более общее определение также может быть полезно в контексте транскриптомики и / или метагеномики , где стартовый и / или стоп-кодон может не присутствовать в полученных последовательностях. Такая ORF соответствует частям гена, а не полному гену.

Биологическое значение [ править ]

Открытые рамки считывания (ORF) часто используются в качестве доказательства, помогающего в прогнозировании генов . Длинные ORF часто используются, наряду с другими доказательствами, для первоначальной идентификации участков, кодирующих белок- кандидат, или функциональных участков, кодирующих РНК, в последовательности ДНК . [5] Наличие ORF не обязательно означает, что регион всегда транслируется . Так , например, в случайно сгенерированной последовательности ДНК с равным процентом каждого нуклеотида , А стоп-кодон можно был бы ожидать один раз каждые 21 кодонов . [5] Простой алгоритм прогнозирования генов дляПрокариоты могут искать стартовый кодон, за которым следует открытая рамка считывания, достаточно длинная для кодирования типичного белка, где использование кодонов в этой области соответствует частотной характеристике для кодирующих областей данного организма. [5] Поэтому некоторые авторы говорят, что ORF должна иметь минимальную длину, например 100 кодонов [6] или 150 кодонов. [5] Сама по себе даже длинная открытая рамка считывания не является убедительным доказательством наличия гена . [5] С другой стороны, было доказано, что некоторые короткие ORF (кОРС), в которых отсутствуют классические признаки кодирующих белки генов (как из нкРНК, так и из мРНК), могут продуцировать функциональные пептиды. [7]Известно, что 5'-UTR примерно 50% мРНК млекопитающих содержат одну или несколько кОРС. [8] 64–75% экспериментально обнаруженных сайтов инициации трансляции кОРС консервативны в геномах человека и мыши и могут указывать на то, что эти элементы выполняют функцию. [9] Однако кОРС часто можно найти только в минорных формах мРНК и избежать отбора; высокая консервативность сайтов инициации может быть связана с их расположением внутри промоторов соответствующих генов. Это характерно , например, для гена SLAMF1 . [10]

Шестикадровый перевод [ править ]

Поскольку ДНК интерпретируется группами из трех нуклеотидов (кодонов), цепь ДНК имеет три различных рамки считывания. [11] Двойная спираль молекулы ДНК имеет две антипараллельные цепи; с двумя цепями, каждая из которых имеет по три рамки считывания, существует шесть возможных трансляций рамки. [11]

Пример шестикадрового перевода. Нуклеотидная последовательность показана посередине с прямой трансляцией вверху и обратной трансляцией внизу. Выделены две возможные открытые рамки считывания с последовательностями.

Инструменты поиска ORF [ править ]

ORF Finder [ править ]

ORF Finder (Open Reading Frame Finder) [12] - это инструмент графического анализа, который находит все открытые рамки считывания выбираемого минимального размера в пользовательской последовательности или в последовательности, уже имеющейся в базе данных. Этот инструмент идентифицирует все открытые рамки считывания с использованием стандартных или альтернативных генетических кодов. Выведенная аминокислотная последовательность может быть сохранена в различных форматах и ​​найдена в базе данных последовательностей с использованием сервера базового инструмента поиска локального выравнивания (BLAST). ORF Finder должен быть полезен при подготовке полных и точных представлений последовательности. Он также поставляется с программным обеспечением для отправки последовательностей Sequin (анализатор последовательностей).

Исследователь ORF [ править ]

ORF Investigator [13] - это программа, которая не только дает информацию о кодирующих и некодирующих последовательностях, но также может выполнять попарное глобальное выравнивание последовательностей различных участков гена / ДНК. Инструмент эффективно находит ORF для соответствующих аминокислотных последовательностей и преобразует их в их однобуквенный аминокислотный код, а также предоставляет их положения в последовательности. Попарное глобальное выравнивание между последовательностями делает удобным обнаружение различных мутаций, включая однонуклеотидный полиморфизм . Алгоритмы Нидлмана – Вунша используются для выравнивания генов. ORF Investigator написан на переносимом языке программирования Perl. , и поэтому доступен для пользователей всех распространенных операционных систем.

ORF Predictor [ править ]

OrfPredictor [14] - это веб-сервер, разработанный для идентификации областей, кодирующих белок, в последовательностях, производных от меток экспрессии (EST). Для запрашиваемых последовательностей с попаданием в BLASTX программа предсказывает кодирующие области на основе рамок считывания трансляции, идентифицированных при выравнивании BLASTX, в противном случае она предсказывает наиболее вероятную кодирующую область на основе внутренних сигналов запрашиваемых последовательностей. Результатом являются предсказанные пептидные последовательности в формате FASTA и строка определения, которая включает идентификатор запроса, рамку считывания трансляции и положения нуклеотидов, в которых начинается и заканчивается кодирующая область. OrfPredictor упрощает аннотацию последовательностей, производных от EST, в частности, для крупномасштабных проектов EST.

ORF Predictor использует комбинацию двух разных определений ORF, упомянутых выше. Он ищет участки, начиная с стартового кодона и заканчивая стоп-кодоном. В качестве дополнительного критерия он ищет стоп-кодон в 5'- нетранслируемой области (UTR или NTR, нетранслируемая область [15] ).

ORFik [ править ]

ORFik - это R-пакет в Bioconductor для поиска открытых рамок считывания и использования технологий секвенирования нового поколения для обоснования ORF. [16]

орфипи [ править ]

orfipy - это инструмент, написанный на Python / Cython для чрезвычайно быстрого и гибкого извлечения ORF. [17] orfipy может работать с последовательностями FASTA и FASTQ, просто или сжатыми с помощью gzip, и предоставляет несколько опций для точной настройки поиска в ORF; к ним относятся указание стартового и стоп-кодонов, сообщение частичных ORF и использование настраиваемых таблиц трансляции. Результаты могут быть сохранены в нескольких форматах, включая компактный формат BED. orfipy особенно быстрее работает с данными, содержащими несколько меньших последовательностей FASTA, таких как сборки транскриптомов de-novo. [18]

См. Также [ править ]

  • Кодирующая область
  • Предполагаемый ген
  • Sequerome - инструмент профилирования последовательности, который связывает каждую запись BLAST с ORF NCBI, обеспечивая полный анализ ORF отчета BLAST.

Ссылки [ править ]

  1. ^ "Открытая рамка чтения" . Национальная медицинская библиотека США. 2015-10-19 . Проверено 22 октября 2015 .
  2. ^ Слончевский, Жанна; Джон Уоткинс Фостер (2009). Микробиология: развивающаяся наука . Нью-Йорк: WW Norton & Co. ISBN 978-0-393-97857-5. OCLC  185042615 .
  3. ^ Claverie, J.-M. (1997) Вычислительные методы идентификации генов в геномных последовательностях позвоночных. Гм. Мол. Genet. 6 , 1735–1744.
  4. ^ П. Зибер, М. Платцер, С. Шустер (2018) Повторное рассмотрение определения открытой рамки считывания. Тенденции Genet. 34 , 167–170.
  5. ^ a b c d e Деонье, Ричард; Симон Таваре ; Майкл Уотерман (2005). Вычислительный анализ генома: введение . Springer-Verlag . п. 25. ISBN 978-0-387-98785-9.
  6. ^ Клавери, Ж.-М., Пуаро, О., Лопес, Ф. (1997) Трудность идентификации генов в анонимных последовательностях позвоночных. Comput. Chem. 21 203-214
  7. ^ Zanet, J .; Benrabah, E .; Li, T .; Пелисье-Монье, А .; Chanut-Delalande, H .; Ронсин, Б .; Беллен, HJ; Payre, F .; Плаза, С. (2015). «Пептиды Pri sORF индуцируют селективный протеасомный процессинг белка». Наука . 349 (6254): 1356–1358. Bibcode : 2015Sci ... 349.1356Z . DOI : 10.1126 / science.aac5677 . ISSN 0036-8075 . PMID 26383956 . S2CID 206639549 .   
  8. ^ Wethmar, Клаус; Барбоса-Сильва, Адриано; Андраде-Наварро, Мигель А .; Леутц, Ахим (01.01.2014). «uORFdb - обширная база данных литературы по биологии эукариотических НКО» . Исследования нуклеиновых кислот . 42 (D1): D60 – D67. DOI : 10.1093 / NAR / gkt952 . ISSN 0305-1048 . PMC 3964959 . PMID 24163100 .   
  9. ^ Ли, Sooncheol; Лю, Ботао; Ли, Сухён; Хуанг, Шэн-Сюн; Шен, Бен; Цянь, Шу-Бин (11.09.2012). «Глобальное картирование сайтов инициации трансляции в клетках млекопитающих при разрешении одного нуклеотида» . Труды Национальной академии наук . 109 (37): E2424 – E2432. DOI : 10.1073 / pnas.1207846109 . ISSN 0027-8424 . PMC 3443142 . PMID 22927429 .   
  10. ^ Шварц, Антон М .; Путляева, Лидия В .; Кович, Милица; Клепикова, Анна В .; Акулич, Ксения А .; Воронцов, Илья Е .; Корнеев, Кирилл В .; Дмитриев, Сергей Е .; Полановский, Олег Л. (2016-10-01). «Ранний B-клеточный фактор 1 (EBF1) имеет решающее значение для транскрипционного контроля гена SLAMF1 в человеческих B-клетках». Biochimica et Biophysica Acta (BBA) - механизмы регуляции генов . 1859 (10): 1259–1268. DOI : 10.1016 / j.bbagrm.2016.07.004 . PMID 27424222 . 
  11. ^ а б Пирсон, Уильям Р .; Вуд, Тодд; Чжан, Чжэн; Миллер, Уэбб (1997-11-15). «Сравнение последовательностей ДНК с последовательностями белков» . Геномика . 46 (1): 24–36. DOI : 10.1006 / geno.1997.4995 . ISSN 0888-7543 . PMID 9403055 . S2CID 6413018 .   
  12. ^ "ORFfinder" . www.ncbi.nlm.nih.gov .
  13. ^ Двиведи, Вивек Дхар ; Мишра, Сарад Кумар (2012). «Исследователь ORF: новый инструмент поиска ORF, сочетающий попарное глобальное выравнивание генов». Журнал исследований последних наук . 1 (11): 32–35.
  14. ^ "OrfPredictor" . bioinformatics.ysu.edu .
  15. ^ J. C. Carrington, D. D. Freed (1990): Cap-независимое усиление трансляции 5'-нетранслируемой областью потивируса растений . В: J. Virol., 64: 1590-1597. DOI: 10.1128 / JVI.64.4.1590-1597.1990. , PMID 2319646 , PMC PMC249294  
  16. ^ "ORFik - Открытые рамки считывания в геномике" . bioconductor.org .
  17. ^ Сингх, Урминдер; Вуртеле, Ева Сыркина. «orfipy: быстрый и гибкий инструмент для извлечения ORF» . Биоинформатика . DOI : 10.1093 / биоинформатики / btab090 .
  18. ^ Сингх, Урминдер (13 февраля 2021 г.), урми-21 / орфипи , получено 13 февраля 2021 г.

Внешние ссылки [ править ]

  • Перевод и открытые рамки для чтения
  • hORFeome V5.1 - интерактивный веб-инструмент для CCSB Human ORFeome Collection
  • ORF Marker - бесплатный, быстрый и многоплатформенный настольный графический интерфейс для прогнозирования и анализа ORF.
  • StarORF - многоплатформенный инструмент с графическим интерфейсом на основе Java для прогнозирования и анализа ORF и получения последовательности обратного комплемента
  • ORFPredictor - веб-сервер, предназначенный для предсказания ORF и трансляции пакета последовательностей EST или кДНК.