В биоинформатики , A базы данных Заболевание Ген представляет собой систематизированы сбор данных, как правило , структурированных в модельных аспектах реальности, таким образом , чтобы понять основные механизмы сложных заболеваний, понимая несколько составных взаимодействий между фенотипа - генотипа отношений и механизмов генной болезни. [1] Базы данных по генным заболеваниям объединяют ассоциации генов и болезней человека из различных баз данных, курируемых экспертами, и ассоциации, основанные на интеллектуальном анализе текста, включая менделевские, сложные и экологические заболевания. [2] [3]
Классификация | Биоинформатика |
---|---|
Подклассификация | Базы данных |
Тип баз данных | Биологические |
Подтип баз данных | Генное заболевание |
Вступление
Специалисты в различных областях биологии и биоинформатики долгое время пытались понять молекулярные механизмы заболеваний для разработки профилактических и терапевтических стратегий. В отношении некоторых болезней стало очевидным, что враждебности достаточно для того, чтобы не получить индекс генов, связанных с болезнью, но чтобы раскрыть, как нарушения молекулярных решеток в клетке вызывают фенотипы болезни. [4] Более того, даже при беспрецедентном объеме доступной информации получить такие каталоги чрезвычайно сложно.
Генетические В общем, генетические заболевания вызываются отклонениями в генах или хромосомах . Многие генетические заболевания развиваются еще до рождения. Генетические расстройства составляют значительную часть проблем здравоохранения в нашем обществе. Прогресс в понимании этой болезни увеличил продолжительность и качество жизни многих людей, страдающих генетическими нарушениями. Недавние разработки в области биоинформатики и лабораторной генетики позволили лучше разграничить определенные синдромы пороков развития и умственной отсталости, чтобы можно было понять их способ наследования. Эта информация позволяет генетическому консультанту предсказать риск возникновения большого количества генетических нарушений. [2] Большинство генетических консультаций проводится, однако, только после того, как рождение хотя бы одного пострадавшего человека предупредило семью об их склонности иметь детей с генетическим заболеванием. Связь одного гена с заболеванием встречается редко, и генетическое заболевание может быть или не быть трансмиссивным расстройством. [5] Некоторые генетические заболевания наследуются от родительских генов, а другие вызываются новыми мутациями или изменениями в ДНК . В других случаях одно и то же заболевание, например, некоторые формы карциномы или меланомы , может быть результатом врожденного состояния у одних людей, новых изменений у других людей и негенетических причин у других людей. [6]
Известно более шести тысяч моногенных заболеваний (моногенных), которые встречаются примерно у 1 из каждых 200 рождений. [1] Как следует из их термина, эти заболевания вызваны мутацией в одном гене. Напротив, полигенные расстройства вызываются несколькими генами, регулярно в сочетании с факторами окружающей среды. [7] Примеры генетических фенотипов включают болезнь Альцгеймера , рак груди, лейкемию, синдром Дауна, пороки сердца и глухоту; поэтому необходима каталогизация для сортировки всех болезней, связанных с генами.
Проблемы с творчеством
На разных этапах любого проекта по генным заболеваниям молекулярные биологи должны выбрать, даже после тщательного статистического анализа данных, какие гены или белки исследовать в дальнейшем экспериментально, а какие оставить из-за ограниченных ресурсов. Вычислительные методы, которые объединяют сложные, разнородные наборы данных, такие как данные экспрессии, информация о последовательностях, функциональная аннотация и биомедицинская литература, позволяют расставлять приоритеты для генов для будущих исследований более осознанным образом. Такие методы могут существенно повысить результативность последующих исследований и становятся неоценимыми для исследователей. Таким образом, одна из основных задач в биологических и биомедицинских исследованиях состоит в том, чтобы распознать механизмы, лежащие в основе этих сложных генетических фенотипов. Большие усилия были потрачены на поиск генов, связанных с болезнями [8]
Однако появляется все больше свидетельств того, что большинство болезней человека нельзя отнести к одному гену, а возникают из-за сложных взаимодействий между множеством генетических вариантов и факторами риска окружающей среды. Было разработано несколько баз данных, хранящих ассоциации между генами и заболеваниями, таких как база данных сравнительной токсикогеномики (CTD), онлайн-менделевское наследование у человека (OMIM), база данных генетических ассоциаций (GAD) или база данных генетических ассоциаций болезней (DisGeNET). Каждая из этих баз данных фокусируется на различных аспектах взаимосвязи фенотип-генотип, и из-за характера процесса курирования базы данных они не являются полными, но в некотором смысле они полностью дополняют друг друга. [9]
Типы баз данных
По сути, существует четыре типа баз данных: курируемые базы данных, базы данных прогнозирования, базы данных литературы и интегративные базы данных [1]
Курируемые базы данных
Термин «курируемые данные» относится к информации, которая может включать в себя самые сложные вычислительные форматы для структурированных данных, научных обновлений и тщательно подобранных знаний, которая была составлена и подготовлена под руководством одного или нескольких экспертов, которые считаются квалифицированными для участия в такой activity [10] Подразумевается, что итоговая база данных имеет высокое качество. Контраст здесь с данными, которые могли быть собраны с помощью некоторого автоматизированного процесса или с использованием данных особенно низкого или неподдерживаемого качества и, возможно, ненадежных. [10] Некоторые из наиболее распространенных примеров: CTD и UNIPROT.
База данных сравнительной токсикогеномики (CTD)
Database Сравнительной Токсикогеномика , помогает понять , о влиянии окружающей среды соединений на здоровье человека путем интеграции данных из куратора научной литературы для описания биохимических взаимодействий с генами и белками, а также связи между заболеваниями и химическими веществами, а также заболеваниями и генами или белками. [11] CTD содержит тщательно отобранные данные, определяющие межвидовые химические взаимодействия между генами и белками, а также ассоциации химикатов и генов с болезнями, чтобы осветить молекулярные механизмы, лежащие в основе переменной восприимчивости и болезней, подверженных влиянию окружающей среды. Эти данные позволяют проникнуть в суть сложных сетей взаимодействия химикатов, генов и белков. Одним из основных источников в этой базе данных является информация, собранная OMIM. [11]
CTD - это уникальный ресурс, где специалисты по биоинформатике читают научную литературу и вручную обрабатывают четыре типа основных данных:
- Химико-генные взаимодействия
- Ассоциации химических болезней
- Ассоциации генных болезней
- Химико-фенотипические ассоциации
Универсальный белковый ресурс (UNIPROT)
Universal Protein Resource ( UniProt ) - это всеобъемлющий ресурс для данных о последовательностях и аннотациях белков. Это всеобъемлющая, первоклассная и свободно доступная база данных последовательностей белков и функциональной информации, в которой много записей, полученных в результате проектов по секвенированию генома . Он содержит большой объем информации о биологической функции белков, взятой из исследовательской литературы, которая может указывать на прямую связь между геном-белком-заболеванием. [12]
Содержание | |
---|---|
Описание | UniProt - это универсальный белковый ресурс, центральное хранилище данных о белках, созданное путем объединения баз данных Swiss-Prot, TrEMBL и PIR-PSD . |
Типы данных захвачены | Аннотации белков |
Организмы | Все |
Контакт | |
Исследовательский центр | EMBL-EBI , Великобритания; SIB , Швейцария; ПИР , США. |
Первичное цитирование | Текущие и будущие разработки Universal Protein Resource [13] |
Доступ | |
Формат данных | Пользовательский плоский файл, FASTA , GFF , RDF , XML . |
Веб-сайт | www www .uniprot .org / новости / |
Скачать URL | www .uniprot .org / загрузки и для загрузки полных наборов данных ftp .uniprot .org |
URL-адрес веб-службы | Да - JAVA API см. Информацию здесь и REST см. Информацию здесь |
Инструменты | |
Интернет | Расширенный поиск, BLAST , Clustal O, массовое извлечение / загрузка, сопоставление идентификаторов |
Разнообразный | |
Лицензия | Creative Commons Attribution-NoDerivs |
Управление версиями | да |
Частота выпуска данных | 4 недели |
Политика курирования | Да - ручной и автоматический. Правила автоматической аннотации, генерируемые кураторами баз данных и вычислительными алгоритмами. |
Добавляемые в закладки объекты | Да - как отдельные записи о белках, так и поиск |
Прогнозные базы данных
База данных прогнозирования основана на статистических выводах. Один конкретный подход к такому выводу известен как прогнозирующий вывод, но прогнозирование может быть выполнено в рамках любого из нескольких подходов к статистическому выводу. Действительно, одно из описаний биостатистики состоит в том, что она обеспечивает средство передачи знаний об образце генетической популяции всей популяции ( геномика ) и другим родственным генам или геномам, что не обязательно аналогично прогнозированию во времени. [15] Когда информация передается во времени, часто в определенные моменты времени, этот процесс известен как прогнозирование. Три основных примера баз данных, которые можно рассматривать в этой категории, включают: База данных генома мыши (MGD), База данных генома крысы (RGD), OMIM и инструмент SIFT от Ensembl. [1]
База данных генома мышей (MGD)
База данных генома мышей (MGD) - это ресурс международного сообщества, содержащий интегрированные генетические, геномные и биологические данные о лабораторных мышах. MGD обеспечивает полную аннотацию фенотипов и ассоциаций болезней человека для моделей мышей (генотипов) с использованием терминов из онтологии фенотипов млекопитающих и названий болезней из OMIM. [16]
База данных генома крыс (RGD)
Содержание | |
---|---|
Описание | Database Rat Геном |
Организмы | Rattus norvegicus (крыса) |
Контакт | |
Исследовательский центр | Медицинский колледж Висконсина |
Лаборатория | Центр молекулярной генетики человека |
Авторы | Мэри Э. Симояма, доктор философии; Ховард Дж. Джейкоб, доктор философии |
Первичное цитирование | PMID 25355511 |
Доступ | |
Веб-сайт | rgd .mcw .edu |
Скачать URL | Выпуск данных RGD |
Rat Геном базы данных (РГД) начал в качестве совместных усилий между ведущими научно - исследовательскими институтами , участвующими в крысиной генетических и геномных исследований. Крыса по-прежнему широко используется исследователями в качестве модельного организма для изучения биологии и патофизиологии болезней. В последние несколько лет наблюдается быстрый рост генетических и геномных данных крыс. [17] Этот всплеск информации подчеркнул необходимость централизованной базы данных для эффективного и действенного сбора, управления и распространения данных, ориентированных на крыс, среди исследователей по всему миру. База данных генома крыс была создана, чтобы служить хранилищем генетических и геномных данных крыс, а также картографической, штаммовой и физиологической информации. Он также облегчает исследовательские усилия исследователей, предоставляя инструменты для поиска, анализа и прогнозирования этих данных. [17]
Данные RGD, полезные для исследователей, изучающих гены болезней, включают аннотации болезней для генов крыс, мышей и человека. Аннотации подбираются вручную из литературы или загружаются с помощью автоматизированных конвейеров из других баз данных, связанных с заболеваниями. Загруженные аннотации сопоставляются с тем же словарем болезней, который используется для ручных аннотаций, чтобы обеспечить единообразие во всем наборе данных. RGD также поддерживает количественные данные фенотипа, связанные с заболеванием, для крыс (PhenoMiner). [18]
Интернет-менделевское наследование в человеке ( OMIM )
Содержание | |
---|---|
Описание | OMIM - это сборник человеческих генов и генетических фенотипов. |
Организмы | Человек ( H. Sapiens ) |
Контакт | |
Исследовательский центр | NCBI |
Первичное цитирование | PMID 25398906 |
Доступ | |
Веб-сайт | www .ncbi .nlm .nih .gov / omim |
При поддержке NCBI, онлайн-менделевское наследование в человеке (OMIM) представляет собой базу данных, в которой каталогизируются все известные заболевания с генетическим компонентом и прогнозируется их связь с соответствующими генами в геноме человека, а также содержатся ссылки для дальнейших исследований и инструменты для геномного анализа. каталогизированного гена. [19] OMIM - это всеобъемлющий авторитетный сборник генов и генетических фенотипов человека, который находится в свободном доступе и ежедневно обновляется. База данных использовалась в качестве ресурса для прогнозирования релевантной информации для унаследованных состояний. [19]
Инструмент Ensembl SIFT
Содержание | |
---|---|
Описание | Ансамбль |
Контакт | |
Исследовательский центр |
|
Первичное цитирование | Хаббард и др. (2002) [20] |
Доступ | |
Веб-сайт | www .ensembl .org |
Это один из крупнейших ресурсов, доступных для всех геномных и генетических исследований, он предоставляет централизованный ресурс для генетиков, молекулярных биологов и других исследователей, изучающих геномы наших собственных видов и других позвоночных, а также модельные болезнетворные организмы. Ensembl - один из нескольких хорошо известных геномных браузеров для поиска информации о геномных заболеваниях. Ensembl импортирует данные об изменениях из множества различных источников, Ensembl прогнозирует влияние вариантов. [21] Для каждой вариации, которая сопоставлена с эталонным геномом, идентифицируется каждый транскрипт Ensembl, который перекрывает вариацию. Затем он использует подход, основанный на правилах, для прогнозирования эффектов, которые каждый аллель вариации может иметь на транскрипт. Набор терминов последствий, определенных онтологией последовательностей (SO), в настоящее время может быть назначен каждой комбинации аллеля и транскрипта. Каждый аллель каждой вариации может иметь разный эффект в разных транскриптах. Для прогнозирования человеческих мутаций в базе данных Ensembl используется множество различных инструментов, одним из наиболее широко используемых является SIFT, который предсказывает, может ли аминокислотная замена повлиять на функцию белка на основе гомологии последовательностей и физико-химического сходства между альтернативные аминокислоты. Данные, предоставленные для каждой аминокислотной замены, представляют собой оценку и качественный прогноз («переносимый» или «вредный»). Оценка - это нормализованная вероятность того, что замена аминокислоты переносится, поэтому оценки, близкие к 0, с большей вероятностью будут вредными. Качественный прогноз выводится из этой оценки, так что замены с оценкой <0,05 называются «вредными», а все другие - «допустимыми». SIFT может применяться к естественным несинонимичным полиморфизмам и лабораторно-индуцированным миссенс-мутациям, которые приведут к построению взаимосвязей в характеристиках фенотипа, протеомике и геномике. [21]
Литературные базы данных
В такого рода базах данных собраны книги, статьи, книжные обзоры, диссертации и аннотации о базах данных по генетическим заболеваниям. Некоторые из следующих являются примерами этого типа: GAD, LGHDN и BeFree Data.
База данных генетической ассоциации (GAD)
База данных генетических ассоциаций - это архив исследований генетических ассоциаций человека сложных заболеваний. GAD в первую очередь ориентирован на архивирование информации об общих сложных заболеваниях человека, а не о редких менделевских расстройствах, как это обнаруживается в OMIM. Он включает кураторские сводные данные, извлеченные из опубликованных статей в рецензируемых журналах по исследованиям генов-кандидатов и общегеномным исследованиям ассоциаций ( GWAS ). [22] GAD был заморожен с 01.09.2014, но все еще доступен для загрузки. [23]
Сеть генетических заболеваний человека, полученная из литературы (LHGDN)
Созданная из литературы сеть генов-заболеваний человека (LHGDN) представляет собой базу данных, основанную на интеллектуальном анализе текста, с упором на извлечение и классификацию ассоциаций ген-заболевание в отношении нескольких биомолекулярных состояний. Он использует алгоритм на основе машинного обучения для извлечения семантических связей между генами и болезнями из интересующего текстового источника. Это часть связанных данных о жизни LMU в Мюнхене, Германия. [1]
Данные BeFree
Извлекает ассоциации "ген-болезнь" из аннотации MEDLINE с помощью системы BeFree. BeFree состоит из модуля биомедицинского распознавания именованных сущностей (BioNER) для обнаружения заболеваний и генов и модуля извлечения отношений на основе морфосинтаксической информации. [24]
Интеграционные базы данных
Такие базы данных включают в себя менделевские, комплексные и экологические заболевания в интегрированном архиве ассоциаций генов и болезней и показывают, что концепция модульности применима ко всем из них. Они обеспечивают функциональный анализ болезней в случае важных новых биологических открытий, которые могут оказаться неприменимыми. обнаруживается при независимом рассмотрении каждой из ассоциаций ген-болезнь. Таким образом, они представляют собой подходящую основу для изучения того, как генетические факторы и факторы окружающей среды, такие как лекарства, способствуют возникновению заболеваний. Лучшим примером для такого рода баз данных является DisGeNET. [8] [25]
База данных ассоциаций генных болезней DisGeNET
Содержание | |
---|---|
Описание | Интегрирует ассоциации генов человека с заболеваниями |
Типы данных захвачены | База данных ассоциаций |
Организмы | Человек ( H. Sapiens ) |
Контакт | |
Исследовательский центр | Программа исследований в области биомедицинской информатики (GRIB) IMIM-UPF |
Лаборатория | Группа интегративной биомедицинской информатики |
Авторы | Ферран Санс и Лаура И. Ферлонг (Пинеро и др., 2015) |
Первичное цитирование | PMID 25877637 |
Доступ | |
Веб-сайт | www .disgenet .org |
Разнообразный | |
Частота выпуска данных | ежегодный |
Версия | 3 |
DisGeNET - это обширная база данных ассоциаций генов и болезней, которая объединяет ассоциации из нескольких источников, охватывающих различные биомедицинские аспекты болезней. [25] В частности, он сосредоточен на современных знаниях о генетических заболеваниях человека, включая менделевские, комплексные и экологические заболевания. Чтобы оценить концепцию модульности человеческих болезней, эта база данных выполняет систематическое изучение новых свойств сетей человеческих болезней с помощью топологии сети и анализа функциональных аннотаций. [1] Результаты указывают на широко распространенное генетическое происхождение болезней человека и показывают, что для большинства болезней, включая менделевские, комплексные и экологические, существуют функциональные модули. Более того, обнаружено, что основной набор биологических путей связан с большинством заболеваний человека. Получая аналогичные результаты при изучении кластеров заболеваний, данные в этой базе данных позволяют предположить, что связанные заболевания могут возникать из-за дисфункции общих биологических процессов в клетке. Сетевой анализ этой интегрированной базы данных показывает, что интеграция данных необходима для получения всестороннего представления о генетическом ландшафте болезней человека и что генетическое происхождение сложных заболеваний встречается гораздо чаще, чем ожидалось. [1]
Некоторые варианты использования
Некоторые из наиболее интересных случаев использования баз данных по генным заболеваниям можно найти в следующих статьях: [1] [8]
- Сантьяго, Хосе А .; Поташкин, Джудит А. (2014). «Сетевой подход к клиническому вмешательству при нейродегенеративных заболеваниях». Тенденции молекулярной медицины . 20 (12): 694–703. DOI : 10.1016 / j.molmed.2014.10.002 . PMID 25455073 .
- Kaikkonen, Minna U .; Нисканен, Анри; Романоски, Кейси Э .; Кансанен, Эмилия; Kivelä, Annukka M .; Лайталайнен, Яркко; Хайнц, Свен; Беннер, Кристофер; Стекло, Кристофер К .; Юля-Херттуала, Сеппо (2014). «Контроль программ транскрипции VEGF-A путем паузы и геномной компартментализации» . Исследования нуклеиновых кислот . 42 (20): 12570–12584. DOI : 10.1093 / NAR / gku1036 . PMC 4227755 . PMID 25352550 .
- Гросдидье, Солен; Феррер, Антони; Фанер, Роза; Пиньеро, Джанет; Рока, Хосеп; Cosío, Borja; Агусти, Альвар; Геа, Хоаким; Санс, Ферран; Ферлонг, Лаура И. (2014). «Сетевая медицина анализа мультиморбидности ХОБЛ» . Респираторные исследования . 15 : 111. DOI : 10,1186 / s12931-014-0111-4 . PMC 4177421 . PMID 25248857 .
- Криштиану, Франческа; Велтри, Пьеранджело (2014). «Инструмент на основе R для анализа данных miRNA и корреляции с клиническими онтологиями». Труды 5-й конференции ACM по биоинформатике, вычислительной биологии и информатике здравоохранения - BCB '14 . С. 768–773. DOI : 10.1145 / 2649387.2660847 . ISBN 9781450328944.
- Галлахер, Сюзанна Реник; Домбровер, Мика; Гольдберг, Дебра С. (2014). «Использование коэффициентов кластеризации 2-узлового гиперграфа для анализа сетей болезни-гена». Труды 5-й конференции ACM по биоинформатике, вычислительной биологии и информатике здравоохранения - BCB '14 . С. 647–648. DOI : 10.1145 / 2649387.2660817 . ISBN 9781450328944.
- Маннил, Дипти; Фогт, Инго; Принц, Жанетт; Кампильос, Моника (2015). «База данных неоднородности системы органов: база данных для визуализации фенотипов на уровне системы органов» . Исследования нуклеиновых кислот . 43 (выпуск базы данных): D900 – D906. DOI : 10.1093 / NAR / gku948 . PMC 4384019 . PMID 25313158 .
- Фогт, Инго; Принц, Жанетт; Кампильос, Моника (2014). «Молекулярно и клинически родственные лекарства и заболевания обогащены фенотипически подобными парами лекарство-заболевание» . Геномная медицина . 6 (7). DOI : 10.1186 / s13073-014-0052-Z .
- Сантьяго, Хосе А .; Поташкин, Джудит А. (2014). «Системные подходы к расшифровке молекулярных связей в болезни Паркинсона и диабете». Нейробиология болезней . 72 : 84–91. DOI : 10.1016 / j.nbd.2014.03.019 . PMID 24718034 .
- Ли, Ин-Хи; Ли, Кёнджун; Хсинг, Майкл; Чхве, Ёнджун; Пак, Джин-Хо; Ким, Шу Хи; Бон, Джастин М .; Neu, Matthew B .; Хван, Кю-Бэк; Грин, Роберт С.; Kohane, Isaac S .; Конг, Сек Вон (2014). «Приоритезация вариантов, генов и путей, связанных с заболеванием, с помощью интерактивного конвейера анализа всего генома» . Человеческая мутация . 35 (5): 537–547. DOI : 10.1002 / humu.22520 . PMC 4130156 . PMID 24478219 .
- Лю, Мин-Си; Чен, Син; Чен, Гэн; Цуй, Цин-Хуа; Ян, Гуй-Ин (2014). «Вычислительная основа для определения длинных некодирующих РНК, связанных с заболеваниями человека» . PLOS One . 9 (1): e84408. Bibcode : 2014PLoSO ... 984408L . DOI : 10.1371 / journal.pone.0084408 . PMC 3879311 . PMID 24392133 .
- Чжао, Илей; Ван, Чен; У, Цзяньвэй; Ван, Ян; Чжу, Вэньлянь; Чжан, Юн; Ду, Чжимин (2013). «Холин защищает от гипертрофии сердца, вызванной повышенной постнагрузкой» . Международный журнал биологических наук . 9 (3): 295–302. DOI : 10.7150 / ijbs.5976 . PMC 3596715 . PMID 23493786 .
- Koczor, Christopher A .; Ли, Ева К .; Торрес, Ребекка А .; Бойд, Эми; Вега, Дж. Дэвид; Уппал, Каран; Юань, Фань; Филдс, Эрл Дж .; Samarel, Allen M .; Льюис, Уильям (2013). «Обнаружение дифференциально метилированных промоторов генов в отказавшем и исправном миокарде левого желудочка человека с использованием вычислительного анализа» . Физиологическая геномика . 45 (14): 597–605. DOI : 10.1152 / physiolgenomics.00013.2013 . PMC 3727018 . PMID 23695888 .
- Гу, Инь; Лю, Гуан-Хуэй; Плонтхонгкум, Нонглюк; Беннер, Кристофер; Йи, Фэй; Цюй, Цзин; Сузуки, Кейитиро; Ян, Цзипин; Чжан, Вэйци; Ли, Мо; Монтсеррат, Нурия; Креспо, Исаак; Дель Соль, Антонио; Эстебан, Консепсьон Родригес; Чжан, Кун; Изписуа Бельмонте, Хуан Карлос (2014). «Глобальное метилирование ДНК и транскрипционный анализ кардиомиоцитов, полученных из ЭСК человека» . Белки и клетки . 5 : 59–68. DOI : 10.1007 / s13238-013-0016-х . PMC 3938846 . PMID 24474197 .
- Гальхардо, Мафальда; Синкконен, Лассе; Бернингер, Филипп; Лин, Джейк; Заутер, Томас; Хейняниеми, Мерья (2014). «Комплексный анализ регуляции метаболизма на уровне транскриптов позволяет выявить узлы метаболической сети человека, имеющие отношение к заболеванию» . Исследования нуклеиновых кислот . 42 (3): 1474–1496. DOI : 10.1093 / NAR / gkt989 . PMC 3919568 . PMID 24198249 .
- Тьери, Паоло; Терманини, Альберто; Беллависта, Елена; Сальвиоли, Стефано; Капри, Мириам; Франчески, Клаудио (2012). «Составление карты интерактивного пути NF-κB» . PLOS One . 7 (3): e32678. Bibcode : 2012PLoSO ... 732678T . DOI : 10.1371 / journal.pone.0032678 . PMC 3293857 . PMID 22403694 .
Замечания о будущем в базах данных по генным болезням
Завершение генома человека изменило способ поиска генов болезней. Раньше подход заключался в том, чтобы сосредоточиться на одном или нескольких генах за раз. Теперь такие проекты, как DisGeNET, служат примером усилий по систематическому анализу всех изменений генов, связанных с одним или несколькими заболеваниями. [26] Следующим шагом является создание полной картины механистических аспектов болезней и разработка лекарств против них. Для этого потребуется сочетание двух подходов: систематический поиск и углубленное изучение каждого гена. Будущее этой области будет определяться новыми методами интеграции больших массивов данных из разных источников и включения функциональной информации в анализ крупномасштабных данных, полученных в результате биоинформатических исследований. [1]
Биоинформатика - это одновременно термин для совокупности исследований биологических заболеваний генов, в которых компьютерное программирование используется как часть своей методологии, а также ссылка на конкретные аналитические конвейеры, которые постоянно используются, особенно в областях генетики и геномики. [1] Обычно биоинформатика используется для идентификации генов-кандидатов и нуклеотидов, SNP . Часто такая идентификация проводится с целью лучшего понимания генетической основы болезни, уникальных приспособлений, желаемых свойств или различий между популяциями. Менее формально биоинформатика также пытается понять организационные принципы в последовательностях нуклеиновых кислот и белков. [1]
Реакция биоинформатики на новые экспериментальные методы открывает новую перспективу в анализе экспериментальных данных, о чем свидетельствуют достижения в области анализа информации из баз данных о генных заболеваниях и других технологий. Ожидается, что эта тенденция сохранится с новыми подходами к ответу на новые методы, такие как технологии секвенирования следующего поколения. Например, наличие большого количества индивидуальных геномов человека будет способствовать развитию вычислительного анализа редких вариантов, включая статистический анализ их отношения к образу жизни, взаимодействию лекарств и другим факторам. [1] Биомедицинские исследования также будут определяться нашей способностью эффективно извлекать большой объем существующих и постоянно генерируемых биомедицинских данных. В частности, методы интеллектуального анализа текста в сочетании с другими молекулярными данными могут предоставить информацию о мутациях и взаимодействиях генов и станут критически важными, чтобы опережать экспоненциальный рост данных, генерируемых в биомедицинских исследованиях. Еще одна область, которая извлекает выгоду из достижений в разработке и интеграции молекулярного, клинического и лекарственного анализа, - это фармакогеномика. Исследования in silico взаимосвязи между человеческими вариациями и их влиянием на болезни будут ключом к развитию персонализированной медицины. [8] Таким образом, базы данных по генным заболеваниям уже изменили поиск генов болезней и могут стать важным компонентом других областей медицинских исследований. [1]
Смотрите также
- Информатика биоразнообразия
- Биоинформатические компании
- Биомедицина
- Вычислительная биология
- Вычислительное биомоделирование
- Вычислительная геномика
- Идентификация гена болезни
- Европейский институт биоинформатики
- Функциональная геномика
- Информатика здоровья
- Проект "Геном человека"
- Интегративная биоинформатика
- Международное общество вычислительной биологии
- Библиотека прыжков
- Список журналов по биоинформатике
- Список биологических баз данных
- Список программного обеспечения для биоинформатики с открытым исходным кодом
- Патология
- Филогенетика
- Структурная биоинформатика
Рекомендации
- ^ a b c d e f g h i j k l m n А. Бауэр-Мерен, «Сетевой анализ генных заболеваний выявляет функциональные модули в менделевских , комплексных и экологических заболеваниях », PLOS One, стр. 1-3, 2011.
- ^ а б Ботштейн, Д. (2003). «Обнаружение генотипов, лежащих в основе фенотипов человека: прошлые успехи в лечении Менделирующей болезни, будущие подходы к комплексной болезни». Генетика природы . 33 (1): 228–237. DOI : 10.1038 / ng1090 . PMID 12610532 .
- ^ Рен Дж. Д., Бейтман А. (2008). «Базы данных, данные могилы и пыль на ветру» . Биоинформатика . 24 (19): 2127–8. DOI : 10.1093 / биоинформатики / btn464 . PMID 18819940 .
- ^ Американская ассоциация медицинской информатики, «Стратегический план Американской ассоциации медицинской информатики», август 2011 г. [Интернет]. Доступно: http://www.amia.org/inside/stratplan/ . [Проверено 15 октября 2014 г.].
- ^ Оти, М. (2007). «Модульный характер генетических заболеваний». Клиническая генетика . 71 (1): 1–11. DOI : 10.1111 / j.1399-0004.2006.00708.x . PMID 17204041 .
- ^ Дэвис, А .; Кинг, Б. (2011). «База данных сравнительной токсикогеномики: обновление 2011 г.» . Nucleic Acids Res . 39 (1): 1067–1072. DOI : 10.1093 / NAR / gkq813 . PMC 3013756 . PMID 20864448 .
- ^ Дэвис, А .; Вигерс, Т. (2013). «Text Mining эффективно оценивает и ранжирует литературу для улучшения лечения химико-генных заболеваний в базе данных сравнительной токсикогеномики» . PLOS One . 8 (4): 1-29. Bibcode : 2013PLoSO ... 858201D . DOI : 10.1371 / journal.pone.0058201 . PMC 3629079 . PMID 23613709 .
- ^ а б в г Bauer-Mehren, A .; Рауча, М. (2010). «DisGeNET: плагин Cytoscape для визуализации, интеграции, поиска и анализа сетей генов и болезней» . Биоинформатика . 26 (22): 2924–2926. DOI : 10.1093 / биоинформатики / btq538 . PMID 20861032 .
- ^ Фогт, И. (2014). «Систематический анализ свойств генов, влияющих на фенотипы систем органов при нарушениях у млекопитающих» . Биоинформатика . 30 (21): 3093–3100. DOI : 10.1093 / биоинформатики / btu487 .
- ^ а б Бунеман, П. (2008). «Курируемые базы данных». Библиометрия . 978 (1): 152–162.
- ^ а б Мерфи, С .; Дэвис, А. (2009). «База данных сравнительной токсикогеномики: база знаний и инструмент для открытия сетей химик-ген-болезнь» . Биоинформатика . 37 (1): 786–792. DOI : 10.1093 / NAR / gkn580 . PMC 2686584 . PMID 18782832 .
- ^ «Универсальный белковый ресурс (UniProt)» . Исследования нуклеиновых кислот . 36 (1): 190–195. 2008. DOI : 10,1093 / NAR / gkm895 . PMC 1669721 . PMID 18045787 .
- ^ Унипрот, К. (2010). «Текущие и будущие разработки Universal Protein Resource» . Исследования нуклеиновых кислот . 39 (выпуск базы данных): D214 – D219. DOI : 10.1093 / NAR / gkq1020 . PMC 3013648 . PMID 21051339 .
- ^ К. Браун, "Онлайн-база данных прогнозируемого взаимодействия человека", " Биоинформатика" , т. 21, нет. 9. С. 2076-2082, 2005.
- ^ С. Хантер и П. Джонс, «InterPro в 2011 году: новые разработки в базе данных прогнозирования семейств и доменов», Nucleic Acids Research , vol. 10, вып. 1. С. 12-22, 2011.
- ^ C. Bult и J. Eppig, "База данных генома мышей (MGD): биология мышей и модельные системы", Nucleic Acids Research , vol. 36, нет. 1. С. 724-728, 2007.
- ^ a b М. Двинелл, Э. Уорти и С. М. "База данных генома крысы 2009: вариации, онтологии и пути", Nucleic Acids Research , vol. 37, нет. 1. С. 744-749, 2009.
- ^ Shimoyama M, De Pons J, Hayman GT и др. (2015). «База данных генома крысы 2015: геномные, фенотипические и экологические вариации и болезни» . Исследования нуклеиновых кислот . 43 (выпуск базы данных): D743–50. DOI : 10.1093 / NAR / gku1026 . PMC 4383884 . PMID 25355511 .
- ^ a b А. Хомош, "Менделирующее наследование в Интернете в человеке (OMIM), база знаний о генах человека и генетических нарушениях", Nucleic Acids Research , vol. 33, нет. 1. С. 514-517, 2005.
- ^ Хаббард Т. и др. (Январь 2002 г.). «Проект базы данных генома Ensembl» . Исследования нуклеиновых кислот . 30 (1): 38–41. DOI : 10.1093 / NAR / 30.1.38 . PMC 99161 . PMID 11752248 .
- ^ a b П. Фличек и М. Ридван, "Ensembl 2012", Nucleic Acids Research , vol. 40, нет. 1. С. 84-90, 2012.
- ^ Беккер, К .; Барнс, К. (2004). «База данных генетических ассоциаций» . Генетика природы . 36 (5): 431–432. DOI : 10.1038 / ng0504-431 . PMID 15118671 .
- ^ https://geneticassociationdb.nih.gov/
- ^ Браво, А; и другие. (2014). «Извлечение отношений между генами и заболеваниями из текста и крупномасштабного анализа данных: значение для трансляционных исследований» . BMC Bioinformatics . 16 (1): 55. DOI : 10,1186 / s12859-015-0472-9 . PMC 4466840 . PMID 25886734 .
- ^ а б Пиньеро; и другие. (2015). «DisGeNET: платформа для динамических исследований болезней человека и их генов» . База данных . 2015 : bav028. DOI : 10,1093 / базы данных / bav028 . PMC 4397996 . PMID 25877637 .
- ^ Оти, М. (2006). «Прогнозирование генов болезней с помощью белок-белковых взаимодействий» . J. Med. Genet . 43 (8): 691–698. DOI : 10.1136 / jmg.2006.041376 . PMC 2564594 . PMID 16611749 .