Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В биоинформатики , то общий формат функции ( формат гена-вывод , универсальный формат функция , GFF ) представляет собой формат файла используется для описания генов и другие особенности ДНК , РНК и белковые последовательности.

Версии GFF [ править ]

Существуют следующие версии GFF:

GFF2 / GTF имеет ряд недостатков, в частности, то, что он может представлять только двухуровневую иерархию признаков и, таким образом, не может обрабатывать трехуровневую иерархию ген → транскрипт → экзон. GFF3 устраняет этот и другие недостатки. Например, он поддерживает произвольное количество иерархических уровней и придает определенные значения определенным тегам в поле атрибутов.

ГТФ идентичен GFF, версия 2. [1]

Общая структура GFF [ править ]

Все форматы GFF (GFF2, GFF3 и GTF) являются вкладка разделителями с 9 полей в каждой строке. Все они имеют одинаковую структуру для первых 7 полей, но различаются по содержанию и формату девятого поля . Общая структура следующая:

Восьмое поле: этап возможностей CDS [ править ]

Проще говоря, CDS означает «последовательность кодирования». Точное значение термина определяется онтологией последовательностей (SO). Согласно спецификации GFF3 : [2] [3]

Для признаков типа «CDS» фаза указывает, где признак начинается со ссылкой на рамку считывания. Фаза - это одно из целых чисел 0, 1 или 2, указывающее количество оснований, которые должны быть удалены из начала этого признака, чтобы достичь первого основания следующего кодона.

Мета-директивы [ править ]

В файлы GFF может быть включена дополнительная метаинформация, которая следует за директивой ##. Эта метаинформация может содержать подробную информацию о версии GFF, регионе последовательности или виде (полный список типов метаданных можно найти в спецификациях Sequence Ontology ).

Программное обеспечение GFF [ править ]

Серверы [ править ]

Серверы, которые генерируют этот формат:

Клиенты [ править ]

Клиенты, использующие этот формат:

Проверка [ править ]

В проекте modENCODE размещен онлайн-инструмент проверки GFF3 с большими лимитами 286,10 МБ и 15 миллионами строк.

Коллекция программного обеспечения Genome Tools содержит инструмент gff3validator , который можно использовать в автономном режиме для проверки и, возможно, очистки файлов GFF3. Служба проверки интернет также доступна.

См. Также [ править ]

  • Распределенная система аннотаций
  • Вариант формата звонка
  • Выравнивание последовательности

Ссылки [ править ]

  1. ^ Информация о GFF / GTF , из Ensembl
  2. ^ «Спецификация GFF3» . 2018-11-24.
  3. ^ "Gff3 - Gmod" .