Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Browser УСК Геном является он-лайн, и загружаемый, геном браузера организовано из Калифорнийского университета в Санта - Круз (УСК). [2] [3] [4]Это интерактивный веб-сайт, предлагающий доступ к данным о последовательности генома различных видов позвоночных и беспозвоночных, а также основных модельных организмов, интегрированный с большой коллекцией выровненных аннотаций. Браузер - это средство просмотра с графическим интерфейсом, оптимизированное для поддержки быстрой интерактивной работы, и представляет собой набор веб-инструментов с открытым исходным кодом, созданный на основе базы данных MySQL для быстрой визуализации, изучения и запроса данных на многих уровнях. Базу данных Genome Browser, инструменты просмотра, загружаемые файлы данных и документацию можно найти на веб-сайте UCSC Genome Bioinformatics.

История [ править ]

Первоначально созданный и до сих пор управляемый Джимом Кентом , тогда еще аспирантом, и Дэвидом Хаусслером , профессором компьютерных наук (ныне биомолекулярной инженерии) Калифорнийского университета в Санта-Крус в 2000 году, браузер генома UCSC начинался как ресурс для распространения первые плоды проекта " Геном человека" . Финансируется Медицинским институтом Говарда Хьюза и Национальным институтом исследования генома человека, NHGRI (один из Национальных институтов здравоохранения США).), браузер предлагал графическое отображение первой полной хромосомной сборки последовательности генома человека. Сегодня браузер используют генетики, молекулярные биологи и врачи, а также студенты и преподаватели эволюции для доступа к геномной информации.

Геномы [ править ]

Геномы UCSC

За годы, прошедшие с момента его создания, браузер UCSC расширился, чтобы вместить геномные последовательности всех видов позвоночных и избранных беспозвоночных, для которых доступны геномные последовательности с высоким охватом [5], в настоящее время включающих 46 видов. Большое покрытие необходимо для обеспечения возможности перекрытия для управления строительством более крупных прилегающих регионов. Геномные последовательности с меньшим охватом включены в дорожки множественного выравнивания в некоторых браузерах, но фрагментированный характер этих сборок не делает их пригодными для создания полнофункциональных браузеров. (подробнее о треках с множественным выравниванием ниже). Виды, поддерживаемые полнофункциональными браузерами генома, показаны в таблице.

С помощью концентраторов сборок пользователи могут загружать уникальные сборки. Пример можно увидеть в сборочном узле Vertebrate Genomes Project .

Функциональность браузера [ править ]

Большой объем данных о биологических системах, который накапливается в литературе, делает необходимым сбор и усвоение информации с помощью инструментов биоинформатики.. Браузер генома UCSC представляет разнообразную коллекцию наборов данных аннотаций (известных как «треки» и представленных в графическом виде), включая сопоставления мРНК, сопоставления повторяющихся элементов ДНК, прогнозы генов, данные об экспрессии генов, данные ассоциации с заболеваниями (представляющие отношения генов к болезням), а также отображение коммерчески доступных генных чипов (например, Illumina и Agilent). Основная парадигма отображения - показать последовательность генома в горизонтальном измерении и показать графические представления расположения мРНК, прогнозов генов и т. Д. Цветные блоки вдоль оси координат показывают расположение выравниваний различных типов данных. . Возможность отображать это большое разнообразие типов данных на одной координатной оси делает браузер удобным инструментом для вертикальной интеграции данных.

Чтобы найти конкретный ген или геномную область, пользователь может ввести имя гена, последовательность ДНК, регистрационный номер для РНК, название геномной цитологической полосы (например, 20p13 для полосы 13 на коротком плече chr20). или положение в хромосоме (chr17: 38 450 000–38 531 000 для области вокруг гена BRCA1 ).

Представление данных в графическом формате позволяет браузеру предоставлять доступ по ссылке для получения подробной информации о любой из аннотаций. На странице сведений о генах трека UCSC Genes есть большое количество ссылок на более конкретную информацию о гене на многих других ресурсах данных, таких как Online Mendelian Inheritance in Man ( OMIM ) и SwissProt .

Браузер UCSC, разработанный для представления сложных и объемных данных, оптимизирован для скорости. Предварительно выравнивая 55 миллионов РНК GenBank с каждой из 81 сборки генома (многие из 46 видов имеют более одной сборки), браузер обеспечивает мгновенный доступ к сопоставлению любой РНК с любым из размещенных видов.

Множественные генные продукты гена FOXP2 (вверху) и эволюционная консервация показаны в множественном выравнивании (внизу)

Сопоставление многих типов данных позволяет исследователям отображать именно ту комбинацию данных, которая отвечает на конкретные вопросы. Функция вывода в формате pdf / postscript позволяет экспортировать готовое к камере изображение для публикации в академических журналах.

Одна уникальная и полезная особенность, которая отличает браузер UCSC от других браузеров генома, - это непрерывно изменяемый характер отображения. Может отображаться последовательность любого размера, от единственного основания ДНК до всей хромосомы (человеческий chr1 = 245 миллионов оснований, МБ) с полными дорожками аннотации. Исследователи могут отображать один ген, один экзон или всю полосу хромосомы, показывая десятки или сотни генов и любую комбинацию множества аннотаций. Удобная функция перетаскивания и масштабирования позволяет пользователю выбрать любую область в изображении генома и развернуть ее, чтобы занять весь экран.

Исследователи также могут использовать браузер для отображения своих данных с помощью инструмента Custom Tracks. Эта функция позволяет пользователям загружать файл со своими данными и просматривать данные в контексте эталонной сборки генома. Пользователи также могут использовать данные, размещенные в UCSC, создавая подмножества данных по своему выбору с помощью инструмента Table Browser (например, только SNP, которые изменяют аминокислотную последовательность белка) и отображать это конкретное подмножество данных в браузере. как пользовательский трек.

Любое представление браузера, созданное пользователем, в том числе содержащее настраиваемые треки, может быть доступно другим пользователям с помощью инструмента «Сохраненные сеансы».

Треки [ править ]

Следы браузера UCSC Genome

Под отображаемым изображением браузера UCSC Genome находятся девять категорий дополнительных треков, которые можно выбрать и отобразить вместе с исходными данными. К этим категориям относятся картирование и секвенирование, гены и предсказания генов, фенотип и литература, мРНК и EST, экспрессия, регуляция, сравнительная геномика, вариация и повторы.

Отображение и последовательность [ править ]

Эти треки позволяют пользователю управлять отображением геномных координат, последовательностей и пробелов. Исследователи имеют возможность выбирать треки, которые лучше всего представляют их запрос, что позволяет отображать более подходящие данные в зависимости от типа и глубины проводимого исследования. Дорожки сопоставления и секвенирования могут также отображать дорожки в процентах, чтобы показать исследователю, является ли конкретный генетический элемент более распространенным в указанной области.

Гены и генные предсказания [ править ]

Дорожки гена и предсказания генов управляют отображением генов и их последующих частей. Различные дорожки позволяют пользователю отображать генные модели, белковые кодирующие области и некодирующую РНК, а также другие данные, связанные с генами. Доступно множество треков, позволяющих исследователям быстро сравнивать свой запрос с заранее выбранными наборами генов, чтобы искать корреляции между известными наборами генов.

Фенотип и литература [ править ]

Дорожки фенотипа и литературы касаются фенотипа, непосредственно связанного с генами, а также генетического фенотипа. Эти треки предназначены для использования в первую очередь врачами и другими специалистами, занимающимися генетическими нарушениями, исследователями-генетиками и продвинутыми студентами в области естественных наук и медицины. Исследователь также может отобразить трек, который показывает геномные позиции естественных и искусственных вариантов аминокислот.

мРНК и EST [ править ]

Эти треки связаны с тегами экспрессируемой последовательности и информационной РНК. EST представляют собой последовательности однократного считывания, обычно длиной около 500 оснований, которые обычно представляют собой фрагменты транскрибируемых генов. Дорожки мРНК позволяют отображать данные о выравнивании мРНК у людей, а также у других видов. Есть также треки, позволяющие сравнивать с участками EST, которые показывают признаки сплайсинга при выравнивании с геномом.

Выражение [ править ]

Дорожки экспрессии используются для соотнесения генетических данных с участками тканей, в которых они экспрессируются. Это позволяет исследователю обнаружить, связаны ли конкретный ген или последовательность с различными тканями по всему телу. Дорожки экспрессии также позволяют отображать согласованные данные о тканях, которые выражают область запроса.

Регламент [ править ]

Регулирующие треки браузера UCSC Genome представляют собой категорию треков, которые контролируют представление промоторных и контрольных областей в геноме. Исследователь может настроить треки регулирования, чтобы добавить график отображения в браузер генома. Эти дисплеи позволяют получить более подробную информацию о регуляторных областях, сайтах связывания факторов транскрипции, сайтах связывания РНК, регуляторных вариантах, гаплотипах и других регуляторных элементах.

Сравнительная геномика [ править ]

Браузер генома UCSC позволяет пользователю отображать различные виды данных о сохранении. Пользователь может выбирать из различных следов, включая приматов, позвоночных, млекопитающих и других, и видеть, как последовательность гена, которую они искали, сохраняется среди других видов. Сравнительные сопоставления дают графическое представление об эволюционных отношениях между видами. Это делает его полезным инструментом как для исследователя, который может визуализировать области сохранения среди группы видов и делать прогнозы относительно функциональных элементов в неизвестных областях ДНК, так и в классе в качестве инструмента для иллюстрации одного из самых убедительных аргументов в пользу эволюция видов. 44-сторонний сравнительный трек на человеческом собрании ясно показывает, что чем дальше в эволюционное время, тем меньше остается гомологии последовательностей,

Данные вариации [ править ]

Также отображаются многие типы данных вариаций. Например, все содержимое каждой версии базы данных dbSNP от NCBI сопоставляется с геномами человека, мыши и других геномов. Это включает в себя плоды проекта «1000 геномов», как только они будут выпущены в dbSNP. Другие типы данных об изменениях включают данные об изменении числа копий ( CNV ) и частотах аллелей человеческой популяции из проекта HapMap .

Повторяется [ править ]

Повторяющиеся треки браузера генома позволяют пользователю видеть визуальное представление участков ДНК с низкой сложностью повторов. Возможность визуализировать повторы в последовательности позволяет быстро делать выводы о поисковом запросе в браузере генома. Исследователь может сразу увидеть, что указанный поиск содержит большое количество повторяющихся последовательностей, и соответствующим образом настроить отображение поиска или отслеживания.

Инструменты анализа [ править ]

На сайте UCSC размещен набор инструментов анализа генома, в том числе полнофункциональный графический интерфейс для анализа информации в базе данных браузера, инструмент FAST для выравнивания последовательностей BLAT [6], который также полезен для простого поиска последовательностей в массивной последовательности (человеческая геном = 3,23 миллиарда баз [Гб]) любого из представленных геномов.

Инструмент liftOver использует выравнивание всего генома для преобразования последовательностей из одной сборки в другую или между видами. Инструмент Genome Graphs позволяет пользователям просматривать сразу все хромосомы и отображать результаты полногеномных ассоциативных исследований (GWAS). Сортировщик генов отображает гены, сгруппированные по параметрам, не связанным с расположением генома, например, паттерном экспрессии в тканях.

Открытый исходный код / ​​зеркала [ править ]

База кода браузера UCSC является открытым исходным кодом для некоммерческого использования и локально зеркалируется многими исследовательскими группами, что позволяет отображать данные в частном порядке в контексте общедоступных данных. Браузер UCSC отображается в нескольких местах по всему миру, как показано в таблице.

Код браузера также используется в отдельных установках браузером UCSC Malaria Genome и браузером Archaea .

См. Также [ править ]

  • Ансамбль
  • КОДИРОВАТЬ
  • Список биологических баз данных

Ссылки [ править ]

  1. ^ Ли, CM; Парикмахерская, врач общей практики; Каспер, Дж; Clawson, H; Диханс, М; Gonzalez, JN; Hinrichs, A; Ли, БТ; Нассар, Л. Р.; Пауэлл, СС; Рэйни, Б.Дж.; Розенблум, КР; Schmelter, D; Speir, ML; Zweig, AS; Haussler, D; Haeussler, M; Kuhn, RM; Кент, штат Висконсин (8 января 2020 г.). «UCSC Genome Browser вступает в двадцатый год» . Исследования нуклеиновых кислот . 48 (D1): D756 – D761. DOI : 10.1093 / NAR / gkz1012 . PMC  7145642 . PMID  31691824 .
  2. ^ Фуджита П.А., Rhead В, Цвейг А.С., Хинрикс А.С., Karolchik Д, Клайн М.С., Голдман М, парикмахера П., Клоусон Н, Коэльо А, Diekhans М, Dreszer ТР, Giardine БМ, Гарт РА, Хиллмен-Джексон Дж, Хсу Р , Киркуп В., Кун Р.М., Лернед К., Ли С.Х., Мейер Л.Р., Поль А., Рэйни Б.Дж., Розенблум К.Р., Смит К.Э., Хаусслер Д., Кент В.Дж. (январь 2011 г.) «База данных UCSC Genome Browser: обновление 2011» . Nucleic Acids Res . 39 (выпуск БД): D876-82. DOI : 10.1093 / NAR / gkq963 . PMC 3242726 . PMID 20959295 .  
  3. ^ Кент WJ, Sugnet CW, Furey TS, Роскин KM, Pringle TH, Захлер AM, Хаусслер D (июнь 2002). «Браузер генома человека в UCSC» . Genome Res . 12 (6): 996–1006. DOI : 10.1101 / gr.229102 . PMC 186604 . PMID 12045153 .  
  4. ^ Кун, РМ; Карольчик, Д .; Zweig, AS; Wang, T .; Smith, KE; Розенблум, КР; Rhead, B .; Рэйни, Б.Дж.; Pohl, A .; Фазан, М .; Мейер, Л. (01.01.2009). «База данных браузера генома UCSC: обновление 2009 г.» . Исследования нуклеиновых кислот . 37 (База данных): D755 – D761. DOI : 10.1093 / NAR / gkn875 . ISSN 0305-1048 . PMC 2686463 . PMID 18996895 .   
  5. ^ «Высокий охват» здесь означает 6-кратное покрытие, или в шесть раз больше общей последовательности, чем размер генома.
  6. ^ Кент, WJ. (Апрель 2002 г.). «BLAT - инструмент для выравнивания типа BLAST» . Genome Res . 12 (4): 656–64. DOI : 10.1101 / gr.229202 . PMC 187518 . PMID 11932250 .  

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Он-лайн обучение / учебные пособия и руководства пользователя
  • Уроки YouTube