В молекулярной генетике , открытая рамка считывания ( ORF ) является частью рамки считывания , которая имеет возможность быть переведено . ORF - это непрерывный участок кодонов, который может [1] начинаться стартовым кодоном (обычно AUG) и заканчиваться стоп-кодоном (обычно UAA, UAG или UGA). [2] Кодон ATG (AUG в терминах РНК ) в пределах ORF (не обязательно первый) может указывать, где начинается трансляция. Сайт терминации транскрипции расположен после ORF, за стоп-кодоном трансляции. . Если бы транскрипция прекратилась до появления стоп-кодона, во время трансляции образовался бы неполный белок. [3] В эукариотических генов с множественными экзонов , интроны удаляются , а экзоны затем соединяются вместе после транскрипции с получением окончательного мРНК для трансляции белка. В контексте ген нахождения , старт-стоп определение из ORF применяется таким образом , чтобы только сращенный мРНК, а не геномная ДНК, так как интроны могут содержать стоп - кодоны и / или вызвать сдвиги между чтением кадрами. Альтернативное определение гласит, что ORF - это последовательность, длина которой делится на три и ограничена стоп-кодонами. [4] [5]Это более общее определение также может быть полезно в контексте транскриптомики и / или метагеномики , где стартовый и / или стоп-кодон может не присутствовать в полученных последовательностях. Такая ORF соответствует частям гена, а не полному гену.
Биологическое значение [ править ]
Открытые рамки считывания (ORF) часто используются в качестве доказательства, помогающего в прогнозировании генов . Длинные ORF часто используются, наряду с другими доказательствами, для первоначальной идентификации участков, кодирующих белок- кандидат, или функциональных участков, кодирующих РНК, в последовательности ДНК . [6] Наличие ORF не обязательно означает, что регион всегда транслируется . Так , например, в случайно сгенерированной последовательности ДНК с равным процентом каждого нуклеотида , А стоп-кодон можно был бы ожидать один раз каждые 21 кодонов . [6] Простой алгоритм прогнозирования генов дляПрокариоты могут искать стартовый кодон, за которым следует открытая рамка считывания, достаточно длинная для кодирования типичного белка, где использование кодонов в этой области соответствует частотной характеристике для кодирующих областей данного организма. [6] Поэтому некоторые авторы говорят, что ORF должна иметь минимальную длину, например 100 кодонов [7] или 150 кодонов. [6] Сама по себе даже длинная открытая рамка считывания не является убедительным доказательством наличия гена . [6] С другой стороны, было доказано, что некоторые короткие ОРС (кОРС), в которых отсутствуют классические признаки кодирующих белки генов (как из нкРНК, так и из мРНК), могут продуцировать функциональные пептиды. [8]Известно, что 5'-UTR примерно 50% мРНК млекопитающих содержат одну или несколько кОРС. [9] 64–75% экспериментально обнаруженных сайтов инициации трансляции кОРС консервативны в геномах человека и мыши и могут указывать на то, что эти элементы выполняют функцию. [10] Однако кОРС часто можно найти только в минорных формах мРНК и избежать отбора; высокая консервативность сайтов инициации может быть связана с их расположением внутри промоторов соответствующих генов. Это характерно , например, для гена SLAMF1 . [11]
Шестикадровый перевод [ править ]
Поскольку ДНК интерпретируется группами из трех нуклеотидов (кодонов), цепь ДНК имеет три различных рамки считывания. [12] Двойная спираль молекулы ДНК имеет две антипараллельные цепи; с двумя цепями, каждая из которых имеет по три рамки считывания, существует шесть возможных трансляций рамки. [12]
Инструменты поиска ORF [ править ]
ORF Finder [ править ]
ORF Finder (Open Reading Frame Finder) [13] - это инструмент графического анализа, который находит все открытые рамки считывания выбираемого минимального размера в пользовательской последовательности или в последовательности, уже содержащейся в базе данных. Этот инструмент идентифицирует все открытые рамки считывания с использованием стандартных или альтернативных генетических кодов. Выведенная аминокислотная последовательность может быть сохранена в различных форматах и найдена в базе данных последовательностей с использованием сервера основного средства поиска локального выравнивания (BLAST). ORF Finder должен быть полезен при подготовке полных и точных представлений последовательности. Он также поставляется с программным обеспечением для отправки последовательностей Sequin (анализатор последовательностей).
Исследователь ORF [ править ]
ORF Investigator [14] - это программа, которая не только дает информацию о кодирующих и некодирующих последовательностях, но также может выполнять попарное глобальное выравнивание последовательностей различных участков гена / ДНК. Инструмент эффективно находит ORF для соответствующих аминокислотных последовательностей и преобразует их в их однобуквенный аминокислотный код, а также предоставляет их положения в последовательности. Попарное глобальное выравнивание между последовательностями делает удобным обнаружение различных мутаций, включая однонуклеотидный полиморфизм . Алгоритмы Нидлмана – Вунша используются для выравнивания генов. ORF Investigator написан на переносимом языке программирования Perl. , и поэтому доступен для пользователей всех распространенных операционных систем.
ORF Predictor [ править ]
OrfPredictor [15] - это веб-сервер, разработанный для идентификации областей, кодирующих белок, в последовательностях, производных от меток экспрессии (EST). Для запрашиваемых последовательностей с попаданием в BLASTX программа предсказывает кодирующие области на основе рамок считывания трансляции, идентифицированных при выравнивании BLASTX, в противном случае она предсказывает наиболее вероятную кодирующую область на основе внутренних сигналов запрашиваемых последовательностей. Результатом являются предсказанные пептидные последовательности в формате FASTA и строка определения, которая включает идентификатор запроса, рамку считывания трансляции и положения нуклеотидов, в которых начинается и заканчивается кодирующая область. OrfPredictor упрощает аннотацию последовательностей, полученных из EST, в частности, для крупномасштабных проектов EST.
ORF Predictor использует комбинацию двух разных определений ORF, упомянутых выше. Он ищет участки, начиная с стартового кодона и заканчивая стоп-кодоном. В качестве дополнительного критерия он ищет стоп-кодон в 5'- нетранслируемой области (UTR или NTR, нетранслируемая область [16] ).
ORFik [ править ]
ORFik - это R-пакет в Bioconductor для поиска открытых рамок считывания и использования технологий секвенирования нового поколения для обоснования ORF. [17]
орфипи [ править ]
orfipy - это инструмент, написанный на Python / Cython для чрезвычайно быстрого и гибкого извлечения ORF. [18] orfipy может работать с последовательностями FASTA и FASTQ как в простом, так и в сжатом виде, и предоставляет несколько опций для точной настройки поиска в ORF; к ним относятся указание стартового и стоп-кодонов, сообщение частичных ORF и использование настраиваемых таблиц трансляции. Результаты могут быть сохранены в нескольких форматах, включая компактный формат BED. orfipy особенно быстрее работает с данными, содержащими несколько меньших последовательностей FASTA, таких как сборки транскриптомов de-novo. [19]
См. Также [ править ]
- Кодирующая область
- Предполагаемый ген
- Sequerome - инструмент профилирования последовательности, который связывает каждую запись BLAST с ORF NCBI, обеспечивая полный анализ ORF отчета BLAST.
Ссылки [ править ]
- ^ Зибер, Патрисия; Платцер, Матиас; Шустер, Стефан (март 2018 г.). «Возвращение к определению открытой рамки чтения» . Тенденции в генетике . 34 (3): 167–170. DOI : 10.1016 / j.tig.2017.12.009 . ISSN 0168-9525 .
- ^ "Открытая рамка чтения" . Национальная медицинская библиотека США. 2015-10-19 . Проверено 22 октября 2015 .
- ^ Слончевский, Жанна; Джон Уоткинс Фостер (2009). Микробиология: развивающаяся наука . Нью-Йорк: ISBN WW Norton & Co. 978-0-393-97857-5. OCLC 185042615 .
- ^ Claverie, J.-M. (1997) Вычислительные методы идентификации генов в геномных последовательностях позвоночных. Гм. Мол. Genet. 6 , 1735–1744.
- ^ П. Зибер, М. Платцер, С. Шустер (2018) Повторное рассмотрение определения открытой рамки считывания. Тенденции Genet. 34 , 167–170.
- ^ a b c d e Деонье, Ричард; Симон Таваре ; Майкл Уотерман (2005). Вычислительный анализ генома: введение . Springer-Verlag . п. 25. ISBN 978-0-387-98785-9.
- ^ Claverie, J.-M., Poirot, O., Lopez, F. (1997) Трудность идентификации генов в анонимных последовательностях позвоночных. Comput. Chem. 21 203-214
- ^ Zanet, J .; Benrabah, E .; Li, T .; Пелисье-Монье, А .; Chanut-Delalande, H .; Ронсин, Б .; Беллен, HJ; Payre, F .; Плаза, С. (2015). «Пептиды Pri sORF индуцируют селективный протеасомный процессинг белка». Наука . 349 (6254): 1356–1358. Bibcode : 2015Sci ... 349.1356Z . DOI : 10.1126 / science.aac5677 . ISSN 0036-8075 . PMID 26383956 . S2CID 206639549 .
- ^ Wethmar, Клаус; Барбоса-Сильва, Адриано; Андраде-Наварро, Мигель А .; Леутц, Ахим (01.01.2014). «uORFdb - обширная база данных литературы по биологии эукариотических НКО» . Исследования нуклеиновых кислот . 42 (D1): D60 – D67. DOI : 10.1093 / NAR / gkt952 . ISSN 0305-1048 . PMC 3964959 . PMID 24163100 .
- ^ Ли, Sooncheol; Лю, Ботао; Ли, Сухён; Хуанг, Шэн-Сюн; Шен, Бен; Цянь, Шу-Бин (11.09.2012). «Глобальное картирование сайтов инициации трансляции в клетках млекопитающих при разрешении одного нуклеотида» . Труды Национальной академии наук . 109 (37): E2424 – E2432. DOI : 10.1073 / pnas.1207846109 . ISSN 0027-8424 . PMC 3443142 . PMID 22927429 .
- ^ Шварц, Антон М .; Путляева, Лидия В .; Кович, Милица; Клепикова, Анна В .; Акулич, Ксения А .; Воронцов, Илья Е .; Корнеев, Кирилл В .; Дмитриев, Сергей Е .; Полановский, Олег Л. (2016-10-01). «Ранний B-клеточный фактор 1 (EBF1) имеет решающее значение для транскрипционного контроля гена SLAMF1 в человеческих B-клетках». Biochimica et Biophysica Acta (BBA) - механизмы регуляции генов . 1859 (10): 1259–1268. DOI : 10.1016 / j.bbagrm.2016.07.004 . PMID 27424222 .
- ^ а б Пирсон, Уильям Р .; Вуд, Тодд; Чжан, Чжэн; Миллер, Уэбб (1997-11-15). «Сравнение последовательностей ДНК с последовательностями белков» . Геномика . 46 (1): 24–36. DOI : 10.1006 / geno.1997.4995 . ISSN 0888-7543 . PMID 9403055 . S2CID 6413018 .
- ^ "ORFfinder" . www.ncbi.nlm.nih.gov .
- ^ Двиведи, Вивек Дхар ; Мишра, Сарад Кумар (2012). «Исследователь ORF: новый инструмент поиска ORF, сочетающий попарное глобальное выравнивание генов». Журнал исследований последних наук . 1 (11): 32–35.
- ^ "OrfPredictor" . bioinformatics.ysu.edu .
- ^ J. C. Carrington, D. D. Freed (1990): Cap-независимое усиление трансляции 5'-нетранслируемой областью потивируса растений . В: J. Virol., 64: 1590-1597. DOI: 10.1128 / JVI.64.4.1590-1597.1990. , PMID 2319646 , PMC PMC249294
- ^ "ORFik - Открытые рамки считывания в геномике" . bioconductor.org .
- ^ Сингх, Урминдер; Вуртеле, Ева Сыркина. «orfipy: быстрый и гибкий инструмент для извлечения ORF» . Биоинформатика . DOI : 10.1093 / биоинформатики / btab090 .
- ^ Сингх, Урминдер (13 февраля 2021 г.), урми-21 / орфипи , получено 13 февраля 2021 г.
Внешние ссылки [ править ]
- Перевод и открытые рамки для чтения
- hORFeome V5.1 - интерактивный веб-инструмент для CCSB Human ORFeome Collection
- ORF Marker - бесплатный, быстрый и многоплатформенный настольный графический интерфейс для прогнозирования и анализа ORF.
- StarORF - многоплатформенный инструмент с графическим интерфейсом на основе Java для прогнозирования и анализа ORF и получения последовательности обратного комплемента
- ORFPredictor - веб-сервер, предназначенный для предсказания ORF и трансляции пакета последовательностей EST или кДНК.