Послушайте эту статью
Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Ранняя биоинформатика - вычислительное выравнивание экспериментально определенных последовательностей класса родственных белков; см. § Анализ последовательности для получения дополнительной информации.
Карта Х-хромосомы человека (с веб-сайта Национального центра биотехнологической информации )

Биоинформатики ( / ˌ б aɪ . Oʊ ˌ ɪ п х ər м æ т ɪ к s / ( слушать ) ) является междисциплинарным полем , которое разрабатывает методы и программные средства для понимания биологических данных, в частности , когда наборы данных являются большими и сложными . Как междисциплинарная область науки, биоинформатика сочетает в себе биологию , информатику , информационную инженерию , математику истатистика для анализа и интерпретации биологических данных . Биоинформатика использовалась для анализа in silico биологических запросов с использованием математических и статистических методов. [ требуется разъяснение ]

Биоинформатика включает биологические исследования, которые используют компьютерное программирование как часть своей методологии, а также специфические «конвейеры» анализа, которые используются неоднократно, особенно в области геномики . Обычно биоинформатика используется для идентификации генов- кандидатов и однонуклеотидных полиморфизмов ( SNP ). Часто такая идентификация проводится с целью лучшего понимания генетической основы болезни, уникальных приспособлений, желаемых свойств (особенно у сельскохозяйственных видов) или различий между популяциями. Менее формально биоинформатика также пытается понять организационные принципы нуклеиновой кислоты и белка.последовательности, называемые протеомикой . [1]

Обзор [ править ]

Биоинформатика стала важной частью многих областей биологии. В экспериментальной молекулярной биологии методы биоинформатики, такие как обработка изображений и сигналов, позволяют извлекать полезные результаты из больших объемов необработанных данных. В области генетики он помогает секвенировать и аннотировать геномы и наблюдаемые в них мутации . Он играет важную роль в анализе текстов биологической литературы и разработке биологических и генных онтологий.для организации и запроса биологических данных. Он также играет роль в анализе экспрессии и регуляции генов и белков. Инструменты биоинформатики помогают в сравнении, анализе и интерпретации генетических и геномных данных и, в более общем плане, в понимании эволюционных аспектов молекулярной биологии. На более интегративном уровне он помогает анализировать и каталогизировать биологические пути и сети, которые являются важной частью системной биологии . В структурной биологии он помогает моделировать ДНК, [2] РНК, [2] [3] белки [4], а также биомолекулярные взаимодействия. [5] [6] [7] [8]

История [ править ]

Исторически термин биоинформатика не означал то, что он означает сегодня. Полин Хогевег и Бен Хеспер изобрели его в 1970 году для обозначения изучения информационных процессов в биотических системах. [9] [10] [11] Это определение помещало биоинформатику как область, параллельную биохимии (изучение химических процессов в биологических системах). [9]

Последовательности [ править ]

Последовательности генетического материала часто используются в биоинформатике, и ими легче управлять с помощью компьютеров, чем вручную.

Компьютеры стали незаменимыми в молекулярной биологии, когда последовательности белков стали доступны после того, как Фредерик Сэнджер определил последовательность инсулина в начале 1950-х годов. Сравнение нескольких последовательностей вручную оказалось нецелесообразным. Первопроходцем в этой области была Маргарет Окли Дейхофф . [12] Она составила одну из первых баз данных последовательностей белков, первоначально опубликованную в виде книг [13], и впервые разработала методы выравнивания последовательностей и молекулярной эволюции. [14] Еще одним ранним участником биоинформатики был Элвин А. Кабат., который был пионером в области анализа биологических последовательностей в 1970 году, выпустив обширные тома последовательностей антител с Tai Te Wu между 1980 и 1991 годами. [15] В 1970-х годах новые методы секвенирования ДНК были применены к бактериофагам MS2 и øX174, а также к расширенным нуклеотидным последовательностям затем были проанализированы с помощью информационных и статистических алгоритмов. Эти исследования продемонстрировали, что хорошо известные особенности, такие как сегменты кодирования и триплетный код, выявляются в ходе прямого статистического анализа и, таким образом, являются доказательством концепции, согласно которой биоинформатика может быть полезной. [16] [17]

Цели [ править ]

Чтобы изучить, как нормальная клеточная активность изменяется при различных болезненных состояниях, биологические данные должны быть объединены, чтобы сформировать исчерпывающую картину этих действий. Таким образом, область биоинформатики развивалась так, что наиболее актуальной задачей в настоящее время является анализ и интерпретация различных типов данных. Сюда входят нуклеотидные и аминокислотные последовательности , белковые домены и белковые структуры . [18] Фактический процесс анализа и интерпретации данных называется вычислительной биологией . Важные субдисциплины биоинформатики и вычислительной биологии включают:

  • Разработка и внедрение компьютерных программ, обеспечивающих эффективный доступ, управление и использование различных типов информации.
  • Разработка новых алгоритмов (математических формул) и статистических показателей, которые оценивают отношения между членами больших наборов данных. Так , например, существует способы , чтобы найти ген в последовательности, чтобы предсказать структуру белка и / или функцию, а также для кластера белковых последовательностей в семейство родственных последовательностей.

Основная цель биоинформатики - улучшить понимание биологических процессов. Однако, что отличает его от других подходов, так это то, что он ориентирован на разработку и применение вычислительно-ресурсоемких методов для достижения этой цели. Примеры включают: распознавание образов , интеллектуальный анализ данных , алгоритмы машинного обучения и визуализацию . Основные научно - исследовательские работы в этой области включают в себя выравнивание последовательности , генный вывод , геном сборке , дизайн наркотиков , обнаружение наркотиков , выравнивание структуры белка , предсказание структуры белка , предсказаниеэкспрессия генов и белок-белковые взаимодействия , исследования ассоциаций в масштабе всего генома , моделирование эволюции и деления / митоза клеток.

Биоинформатика в настоящее время влечет за собой создание и развитие баз данных, алгоритмов, вычислительных и статистических методов и теории для решения формальных и практических проблем, возникающих в результате управления и анализа биологических данных.

За последние несколько десятилетий быстрое развитие технологий геномных и других молекулярных исследований и развитие информационных технологий объединились, чтобы произвести огромное количество информации, связанной с молекулярной биологией. Биоинформатика - это название, данное этим математическим и вычислительным подходам, используемым для понимания биологических процессов.

Общие виды деятельности в биоинформатике включают картирование и анализ последовательностей ДНК и белков, выравнивание последовательностей ДНК и белков для их сравнения, а также создание и просмотр трехмерных моделей структур белков.

Связь с другими полями [ править ]

Биоинформатика - это область науки, которая похожа на биологические вычисления , но отличается от них , хотя ее часто считают синонимом вычислительной биологии . Биологические вычисления используют биоинженерию и биологию для создания биологических компьютеров , тогда как биоинформатика использует вычисления для лучшего понимания биологии. Биоинформатика и вычислительная биология включают анализ биологических данных, в частности последовательностей ДНК, РНК и белков. Область биоинформатики пережила взрывной рост, начиная с середины 1990-х годов, в основном благодаря проекту « Геном человека» и быстрому прогрессу в технологии секвенирования ДНК.

Анализ биологических данных для получения значимой информации включает в себя написание и запуск программ , которые используют алгоритмы из теории графов , искусственного интеллекта , мягких вычислений , интеллектуального анализа данных , обработки изображений и компьютерного моделирования . Алгоритмы , в свою очередь зависит от теоретических основ , таких как дискретной математики , теории управления , теории систем , теории информации и статистики .

Анализ последовательности [ править ]

Так как Фаг Φ-x174 был секвенирован в 1977 году, [19] , что последовательности ДНК тысяч организмов были декодированы и сохранены в базах данных. Эта информация о последовательностях анализируется для определения генов, кодирующих белки , гены РНК, регуляторные последовательности, структурные мотивы и повторяющиеся последовательности. Сравнение генов внутри одного вида или между разными видами может показать сходство между функциями белков или отношениями между видами (использование молекулярной систематики для построения филогенетических деревьев ). С растущим объемом данных давно стало непрактичным анализировать последовательности ДНК вручную. Компьютерные программытакие как BLAST , обычно используются для поиска последовательностей - по состоянию на 2008 год - из более чем 260 000 организмов, содержащих более 190 миллиардов нуклеотидов . [20]

Секвенирование ДНК [ править ]

Прежде чем последовательности могут быть проанализированы, они должны быть получены из примера банка хранения данных Genbank. Секвенирование ДНК по-прежнему является нетривиальной проблемой, поскольку необработанные данные могут содержать шумы или искажаться слабыми сигналами. Были разработаны алгоритмы для базового вызова различных экспериментальных подходов к секвенированию ДНК.

Сборка последовательности [ править ]

Большинство методов секвенирования ДНК производят короткие фрагменты последовательности, которые необходимо собрать для получения полных последовательностей гена или генома. Так называемый метод секвенирования с дробовиком (который использовался, например, Институтом геномных исследований (TIGR) для секвенирования первого бактериального генома, Haemophilus influenzae ) [21]генерирует последовательности многих тысяч небольших фрагментов ДНК (длиной от 35 до 900 нуклеотидов, в зависимости от технологии секвенирования). Концы этих фрагментов перекрываются и при правильном выравнивании программой сборки генома могут быть использованы для реконструкции всего генома. Секвенирование дробовиком позволяет быстро получить данные о последовательности, но задача сборки фрагментов может быть довольно сложной для больших геномов. Для такого большого генома, как геном человека , для сборки фрагментов может потребоваться много дней процессорного времени на многопроцессорных компьютерах с большой памятью, и полученная сборка обычно содержит многочисленные пробелы, которые необходимо заполнить позже. Секвенирование дробовиком - это метод выбора практически для всех секвенированных сегодня геномов [ когда? ], и алгоритмы сборки генома являются важной областью исследований в области биоинформатики.

Аннотации генома [ править ]

В контексте геномика , аннотации представляют собой процесс маркировки генов и другие биологические функции в последовательности ДНК. Этот процесс необходимо автоматизировать, потому что большинство геномов слишком велики, чтобы их можно было аннотировать вручную, не говоря уже о желании аннотировать как можно больше геномов, поскольку скорость секвенирования перестала быть узким местом. Аннотации стали возможными благодаря тому факту, что гены имеют узнаваемые начальные и конечные области, хотя точная последовательность, обнаруженная в этих областях, может варьироваться между генами.

Первое описание комплексной системы аннотации генома было опубликовано в 1995 году [21] командой Института геномных исследований, которая выполнила первое полное секвенирование и анализ генома свободноживущего организма, бактерии Haemophilus influenzae . [21] Оуэн Уайт разработал и построил систему программного обеспечения для идентификации генов, кодирующих все белки, РНК переноса, рибосомных РНК (и других сайтов) и для выполнения начальных функциональных назначений. Большинство современных систем аннотации генома работают аналогично, но программы, доступные для анализа геномной ДНК, такие как программа GeneMark, обучены и используются для поиска генов, кодирующих белок, у Haemophilus influenzae, постоянно меняются и улучшаются.

Следуя целям, которые оставалось достичь проекту «Геном человека» после его закрытия в 2003 году, появился новый проект, разработанный Национальным институтом исследования генома человека в США. Так называемый проект ENCODE - это совместный сбор данных о функциональных элементах человеческого генома, в котором используются технологии секвенирования ДНК следующего поколения и массивы геномных листов, технологии, способные автоматически генерировать большие объемы данных при значительном снижении стоимости каждой базы. но с той же точностью (ошибка базового вызова) и верностью (ошибка сборки).

Вычислительная эволюционная биология [ править ]

Эволюционная биология - это изучение происхождения и происхождения видов , а также их изменения с течением времени. Информатика помогла эволюционным биологам, позволив исследователям:

  • отслеживать эволюцию большого числа организмов, измеряя изменения в их ДНК , а не только с помощью физической систематики или физиологических наблюдений,
  • сравнивать целые геномы , что позволяет изучать более сложные эволюционные события, такие как дупликация генов , горизонтальный перенос генов , а также предсказывать факторы, важные для видообразования бактерий ,
  • построение сложных вычислительных моделей популяционной генетики для прогнозирования результатов работы системы с течением времени [22]
  • отслеживать и обмениваться информацией о все большем количестве видов и организмов

Будущая работа направлена ​​на реконструкцию уже более сложного древо жизни . [ согласно кому? ]

Область компьютерных исследований, в которой используются генетические алгоритмы , иногда путают с вычислительной эволюционной биологией, но эти две области не обязательно связаны.

Сравнительная геномика [ править ]

Ядром сравнительного анализа генома является установление соответствия между генами ( анализ ортологии ) или другими геномными признаками у разных организмов. Именно эти межгеномные карты позволяют проследить эволюционные процессы, ответственные за расхождение двух геномов. Множество эволюционных событий, действующих на разных организационных уровнях, формируют эволюцию генома. На самом низком уровне точечные мутации влияют на отдельные нуклеотиды. На более высоком уровне большие хромосомные сегменты подвергаются дупликации, латеральному переносу, инверсии, транспозиции, делеции и вставке. [23] В конечном счете, целые геномы участвуют в процессах гибридизации, полиплоидизации и эндосимбиоза., часто приводящее к быстрому видообразованию. Сложность эволюции генома ставит множество интересных задач перед разработчиками математических моделей и алгоритмов, которые прибегают к спектру алгоритмических, статистических и математических методов, начиная от точных, эвристических , алгоритмов с фиксированным параметром и аппроксимации для задач, основанных на моделях экономии, до алгоритмов Маркова. цепные алгоритмы Монте-Карло для байесовского анализа задач на основе вероятностных моделей.

Многие из этих исследований основаны на обнаружении гомологии последовательностей для отнесения последовательностей к семействам белков . [24]

Пан геномика [ править ]

Пангеномика - это концепция, представленная в 2005 году Теттелином и Медини, которая в конечном итоге прижилась в биоинформатике. Пангеном - это полный репертуар генов определенной таксономической группы: хотя изначально он применялся к близкородственным штаммам вида, он может применяться к более широкому контексту, например к роду, типу и т. Д. Он разделен на две части - Основной геном: набор генов, общих для всех исследуемых геномов (часто это гены домашнего хозяйства, жизненно важные для выживания) и «Незаменимый / гибкий геном»: набор генов, не присутствующих во всех исследуемых геномах, кроме одного или некоторых. Инструмент биоинформатики BPGA можно использовать для характеристики пан-генома бактериальных видов. [25]

Генетика болезни [ править ]

С появлением следующего поколения последовательности мы получить достаточно данных последовательности картировать гены сложных заболеваний бесплодия , [26] рака молочной железы [27] или болезнь Альцгеймера . [28] Полногеномные исследования ассоциаций - полезный подход для точного определения мутаций, ответственных за такие сложные заболевания. [29] В ходе этих исследований были идентифицированы тысячи вариантов ДНК, которые связаны со схожими заболеваниями и признаками. [30]Кроме того, возможность использования генов для прогноза, диагностики или лечения является одним из наиболее важных приложений. Во многих исследованиях обсуждаются как многообещающие способы выбора используемых генов, так и проблемы и подводные камни использования генов для прогнозирования наличия или прогноза заболевания. [31]

Анализ мутаций при раке [ править ]

При раке геномы пораженных клеток перестраиваются сложным или даже непредсказуемым образом. Для выявления ранее неизвестных точечных мутаций в различных генах рака используются огромные усилия по секвенированию . Специалисты по биоинформатике продолжают создавать специализированные автоматизированные системы для управления огромным объемом производимых данных о последовательностях, и они создают новые алгоритмы и программное обеспечение для сравнения результатов секвенирования с растущей коллекцией последовательностей генома человека и полиморфизмами зародышевой линии . Используются новые технологии физического обнаружения, такие как олигонуклеотидные микрочипы для определения хромосомных приростов и потерь (так называемая сравнительная геномная гибридизация).) и массивы однонуклеотидного полиморфизма для обнаружения известных точечных мутаций . Эти методы обнаружения одновременно измеряют несколько сотен тысяч сайтов по всему геному, и при использовании с высокой пропускной способностью для измерения тысяч образцов генерируют терабайты данных за эксперимент. И снова огромные объемы и новые типы данных открывают новые возможности для биоинформатиков. Часто обнаруживается, что данные содержат значительную изменчивость или шум , и поэтому разрабатываются скрытая марковская модель и методы анализа точек изменения для вывода реальных изменений количества копий .

При биоинформатическом анализе геномов рака можно использовать два важных принципа, относящихся к идентификации мутаций в экзоме . Во-первых, рак - это болезнь накопленных соматических мутаций в генах. Второй рак содержит мутации водителя, которые нужно отличать от пассажиров. [32]

Благодаря прорывам, которые эта технология секвенирования следующего поколения обеспечивает в области биоинформатики, геномика рака может кардинально измениться. Эти новые методы и программное обеспечение позволяют специалистам по биоинформатике быстро и по доступной цене секвенировать многие геномы рака. Это могло бы создать более гибкий процесс классификации типов рака путем анализа мутаций в геноме, вызванных раком. Кроме того, отслеживание пациентов по мере прогрессирования заболевания может стать возможным в будущем с помощью последовательности образцов рака. [33]

Другой тип данных, который требует разработки новой информатики, - это анализ поражений, которые, как выяснилось, рецидивируют среди многих опухолей.

Экспрессия генов и белков [ править ]

Анализ экспрессии генов [ править ]

Выражение многих генов может быть определена путем измерения мРНК уровней с несколькими способами , включая микрочипов , выражается последовательность кДНК тегов (EST) секвенирование, серийный анализ экспрессии генов (SAGE) тег последовательности, с массовым параллелизмом подписи секвенирование (MPSS), РНК-Seq , также известное как «дробовое секвенирование всего транскриптома» (WTSS) или различные применения мультиплексной гибридизации in-situ. Все эти методы чрезвычайно подвержены шуму и / или подвержены систематической ошибке в биологических измерениях, и основная область исследований в области вычислительной биологии включает разработку статистических инструментов для отделения сигнала от сигнала.шум в высокопроизводительных исследованиях экспрессии генов. [34] Такие исследования часто используются для определения генов, вовлеченных в заболевание: можно сравнить данные микрочипов раковых эпителиальных клеток с данными незлокачественных клеток для определения транскриптов, которые активируются и подавляются в определенной популяции. раковых клеток.

Анализ экспрессии белка [ править ]

Белковые микроматрицы и масс-спектрометрия (МС) с высокой пропускной способностью (HT) могут обеспечить моментальный снимок белков, присутствующих в биологическом образце. Биоинформатика очень активно участвует в осмыслении белковых микрочипов и данных ГТ-МС; Первый подход сталкивается с теми же проблемами, что и с микрочипами, нацеленными на мРНК, второй включает в себя проблему сопоставления больших объемов массовых данных с предсказанными массами из баз данных последовательностей белков, а также сложный статистический анализ образцов, в которых обнаруживаются множественные, но неполные пептиды из каждого белка. обнаружен. Локализация клеточного белка в тканевом контексте может быть достигнута с помощью аффинной протеомики, отображаемой в виде пространственных данных на основе иммуногистохимии и тканевых микрочипов.. [35]

Анализ регулирования [ править ]

Генная регуляция - это сложная оркестровка событий, посредством которых сигнал, потенциально внеклеточный сигнал, такой как гормон , в конечном итоге приводит к увеличению или уменьшению активности одного или нескольких белков . Для изучения различных этапов этого процесса были применены методы биоинформатики.

Например, экспрессия гена может регулироваться соседними элементами генома. Анализ промотора включает идентификацию и изучение мотивов последовательности в ДНК, окружающей кодирующую область гена. Эти мотивы влияют на степень транскрибирования этой области в мРНК. Элементы энхансера, расположенные далеко от промотора, также могут регулировать экспрессию генов посредством трехмерных петлевых взаимодействий. Эти взаимодействия могут быть определены с помощью биоинформатического анализа экспериментов по захвату конформации хромосом .

Данные экспрессии могут использоваться для вывода о регуляции генов: можно сравнивать данные микрочипов из самых разных состояний организма, чтобы сформировать гипотезы о генах, участвующих в каждом состоянии. В одноклеточном организме можно сравнивать этапы клеточного цикла с различными стрессовыми условиями (тепловой шок, голодание и т. Д.). Затем можно применить алгоритмы кластеризации к этим данным экспрессии, чтобы определить, какие гены коэкспрессируются. Например, в вышестоящих областях (промоторах) коэкспрессируемых генов можно проводить поиск чрезмерно представленных регуляторных элементов . Примерами алгоритмов кластеризации, применяемых в кластеризации генов, являются кластеризация k-средних , самоорганизующиеся карты (SOM),иерархическая кластеризация и методы консенсусной кластеризации .

Анализ клеточной организации [ править ]

Было разработано несколько подходов для анализа расположения органелл, генов, белков и других компонентов внутри клеток. Это важно, поскольку расположение этих компонентов влияет на события в клетке и, таким образом, помогает нам предсказать поведение биологических систем. Онтология гена категория, клеточный компонент , была разработана , чтобы захватить внутриклеточную локализацию во многих биологических базах данных .

Микроскопия и анализ изображений [ править ]

Микроскопические изображения позволяют нам обнаруживать как органеллы, так и молекулы. Это также может помочь нам различать нормальные и аномальные клетки, например, при раке .

Локализация белка [ править ]

Локализация белков помогает нам оценить роль белка. Например, если в ядре обнаружен белок, он может участвовать в регуляции генов или сплайсинге . Напротив, если белок обнаружен в митохондриях , он может участвовать в дыхании или других метаболических процессах . Таким образом, локализация белка является важным компонентом прогнозирования функции белка . Доступны хорошо разработанные ресурсы для прогнозирования субклеточной локализации белков , включая базы данных субклеточного местоположения белков и инструменты прогнозирования. [36] [37]

Ядерная организация хроматина [ править ]

Данные высокопроизводительных экспериментов по захвату конформации хромосом , таких как Hi-C (эксперимент) и ChIA-PET , могут предоставить информацию о пространственной близости локусов ДНК. Анализ этих экспериментов может определить трехмерную структуру и ядерную организацию хроматина. Биоинформатические проблемы в этой области включают разделение генома на домены, такие как топологически ассоциированные домены (TAD), которые организованы вместе в трехмерном пространстве. [38]

Структурная биоинформатика [ править ]

Трехмерные белковые структуры, подобные этой, часто используются при биоинформатическом анализе.

Прогнозирование структуры белков - еще одно важное приложение биоинформатики. Аминокислотная последовательность белка, так называемой первичной структуры , может быть легко определено из последовательности на ген , который кодирует его. В подавляющем большинстве случаев эта первичная структура однозначно определяет структуру в ее естественной среде. (Конечно, есть исключения, такие как прион губчатой ​​энцефалопатии крупного рогатого скота (коровье бешенство) .) Знание этой структуры жизненно важно для понимания функции белка. Структурная информация обычно подразделяется на вторичную , третичную и четвертичную.структура. Жизнеспособное общее решение таких прогнозов остается открытой проблемой. До сих пор большинство усилий было направлено на эвристику, которая работает большую часть времени. [ необходима цитата ]

Одна из ключевых идей биоинформатики - понятие гомологии . В геномной ветви биоинформатики гомология используется для прогнозирования функции гена: если последовательность гена A , функция которого известна, гомологична последовательности гена B, функция которого неизвестна, можно сделать вывод, что B может разделяют функцию А. В структурной ветви биоинформатики гомология используется для определения того, какие части белка важны для формирования структуры и взаимодействия с другими белками. В методе, называемом моделированием гомологии , эта информация используется для прогнозирования структуры белка, если структура гомологичного белка известна. В настоящее время это единственный способ надежно предсказать структуру белка.

Одним из примеров этого является гемоглобин у людей и гемоглобин в бобовых ( леггемоглобин ), которые являются дальними родственниками из одного и того же суперсемейства белков . Оба служат одной и той же цели транспортировки кислорода в организме. Хотя оба этих белка имеют совершенно разные аминокислотные последовательности, их белковые структуры практически идентичны, что отражает их почти идентичные цели и общего предка. [39]

Другие методы прогнозирования структуры белка включают в себя потоки белков и моделирование de novo (с нуля), основанное на физике.

Другой аспект структурной биоинформатики включает использование белковых структур для моделей виртуального скрининга, таких как модели количественной взаимосвязи структуры и активности и протеохимометрические модели (PCM). Кроме того, кристаллическую структуру белка можно использовать в моделировании, например, исследований связывания лиганда и исследований мутагенеза in silico .

Сетевая и системная биология [ править ]

Сетевой анализ направлен на понимание взаимоотношений внутри биологических сетей, таких как сети метаболического или межбелкового взаимодействия . Хотя биологические сети могут быть построены из одного типа молекулы или объекта (например, генов), сетевая биология часто пытается интегрировать множество различных типов данных, таких как белки, небольшие молекулы, данные экспрессии генов и другие, которые все физически связаны. , функционально или и то, и другое.

Системная биология включает в себя использование компьютерного моделирования из клеточных подсистем (например, в сетях метаболитов и ферментов , которые включают в себя обмен веществ , сигнальная трансдукция пути и гены регуляторных сетей ) как для анализа и визуализации сложных соединений этих клеточных процессов. Искусственная жизнь или виртуальная эволюция пытается понять эволюционные процессы с помощью компьютерного моделирования простых (искусственных) форм жизни.

Сети молекулярного взаимодействия [ править ]

Взаимодействия между белками часто визуализируются и анализируются с помощью сетей. Эта сеть состоит из белок-белковых взаимодействий Treponema pallidum , возбудителя сифилиса и других заболеваний.

Десятки тысяч трехмерных белковых структур были определены с помощью рентгеновской кристаллографии и ядерно-магнитно-резонансной спектроскопии белков (ЯМР белков), и центральный вопрос в структурной биоинформатике состоит в том, практично ли предсказывать возможные межбелковые взаимодействия только на основе этих данных. 3D-формы, без проведения экспериментов по взаимодействию белок-белок . Было разработано множество методов для решения проблемы стыковки белок-белок , хотя кажется, что в этой области еще предстоит проделать большую работу.

Другие взаимодействия, встречающиеся в этой области, включают белок-лиганд (включая лекарство) и белок-пептид . Молекулярно-динамическое моделирование движения атомов вокруг вращающихся связей является фундаментальным принципом вычислительных алгоритмов , называемых алгоритмами стыковки, для изучения молекулярных взаимодействий .

Другое [ править ]

Анализ литературы [ править ]

Рост количества опубликованной литературы делает практически невозможным читать каждую статью, что приводит к разрозненным разделам исследований. Литературный анализ направлен на использование вычислительной и статистической лингвистики для добычи этой растущей библиотеки текстовых ресурсов. Например:

  • Распознавание аббревиатуры - определение полной формы и сокращения биологических терминов
  • Распознавание именованных сущностей - распознавание биологических терминов, таких как названия генов
  • Взаимодействие белков с белками - определите, какие белки с какими белками взаимодействуют из текста

Область исследования опирается на статистику и компьютерную лингвистику .

Высокопроизводительный анализ изображений [ править ]

Вычислительные технологии используются для ускорения или полной автоматизации обработки, количественной оценки и анализа больших объемов биомедицинских изображений с высоким содержанием информации . Современные системы анализа изображений расширяют способность наблюдателя производить измерения на основе большого или сложного набора изображений за счет повышения точности , объективности или скорости. Полностью разработанная система анализа может полностью заменить наблюдателя. Хотя эти системы не являются уникальными для биомедицинских изображений, биомедицинские изображения становятся все более важными как для диагностики, так и для исследований. Вот несколько примеров:

  • высокая производительность и точность количественной оценки и субклеточной локализации ( высокопроизводительный скрининг , цитогистопатология, информатика биоизображений )
  • морфометрия
  • анализ и визуализация клинических изображений
  • определение в реальном времени моделей воздушного потока в дыхательных легких живых животных
  • количественная оценка размера окклюзии в изображениях в реальном времени от развития и восстановления во время повреждения артерии
  • проведение поведенческих наблюдений на основе расширенных видеозаписей лабораторных животных
  • инфракрасные измерения для определения метаболической активности
  • предположение о перекрытии клонов при картировании ДНК , например, по шкале Сулстона

Высокопроизводительный анализ данных отдельных ячеек [ править ]

Вычислительные методы используются для анализа данных отдельных клеток с высокой пропускной способностью и малым объемом измерений, например, полученных с помощью проточной цитометрии . Эти методы обычно включают обнаружение популяций клеток, соответствующих определенному болезненному состоянию или экспериментальному состоянию.

Информатика биоразнообразия [ править ]

Информатика биоразнообразия занимается сбором и анализом данных о биоразнообразии , таких как таксономические базы данных или данные микробиома . Примеры таких анализов включают филогенетику , моделирование ниш , картирование видового богатства , штрих-кодирование ДНК или инструменты идентификации видов .

Онтологии и интеграция данных [ править ]

Биологические онтологии направлены ациклические графики из контролируемых словарей . Они предназначены для сбора биологических концепций и описаний таким образом, чтобы их можно было легко классифицировать и анализировать с помощью компьютеров. При такой классификации можно получить дополнительную ценность от целостного и комплексного анализа.

OBO Foundry была попытка стандартизировать определенные онтологий. Одной из самых распространенных является онтология генов, описывающая функции генов. Существуют также онтологии, описывающие фенотипы.

Базы данных [ править ]

Базы данных необходимы для исследований и приложений в области биоинформатики. Существует множество баз данных, охватывающих различные типы информации: например, последовательности ДНК и белков, молекулярные структуры, фенотипы и биоразнообразие. Базы данных могут содержать эмпирические данные (полученные непосредственно из экспериментов), предсказанные данные (полученные в результате анализа) или, как правило, и то, и другое. Они могут быть специфичными для конкретного организма, пути или молекулы, представляющей интерес. В качестве альтернативы они могут включать данные, собранные из множества других баз данных. Эти базы данных различаются по своему формату, механизму доступа и тому, являются ли они общедоступными или нет.

Некоторые из наиболее часто используемых баз данных перечислены ниже. Для более полного списка, пожалуйста, проверьте ссылку в начале подраздела.

  • Используется в анализе биологической последовательности: Genbank , UniProt
  • Используется в структурном анализе: Protein Data Bank (PDB)
  • Используется для поиска семейств белков и мотивов : InterPro , Pfam
  • Используется для секвенирования следующего поколения: архив чтения последовательности
  • Используется в сетевом анализе: базы данных метаболических путей ( KEGG , BioCyc ), базы данных анализа взаимодействия, функциональные сети
  • Используется при разработке синтетических генетических схем: GenoCAD

Программное обеспечение и инструменты [ править ]

Программные инструменты для биоинформатики варьируются от простых инструментов командной строки до более сложных графических программ и автономных веб-сервисов, доступных от различных биоинформатических компаний или государственных учреждений.

Программное обеспечение для биоинформатики с открытым исходным кодом [ править ]

Многие бесплатные программные инструменты с открытым исходным кодом существуют и продолжают расти с 1980-х годов. [40] Сочетание постоянной потребности в новых алгоритмах для анализа появляющихся типов биологических считываний, потенциала для инновационных экспериментов in silico и свободно доступных баз открытого кода помогло создать возможности для всех исследовательских групп внести свой вклад в биоинформатику. и диапазон доступного программного обеспечения с открытым исходным кодом, независимо от условий их финансирования. Инструменты с открытым исходным кодом часто выступают в качестве инкубаторов идей или подключаемых модулей, поддерживаемых сообществом, в коммерческих приложениях. Они также могут предоставлять де-фактостандарты и общие объектные модели для помощи в решении проблемы интеграции биоинформации.

Ряд программных пакетов с открытым исходным кодом включает в себя название , такие как Bioconductor , BioPerl , Biopython , BioJava , BioJS , BioRuby , Bioclipse , EMBOSS , .NET Bio , Orange с его биоинформатикой дополнения, Apache таверна , UGENE и GenoCAD . Чтобы сохранить эту традицию и создать новые возможности, некоммерческий фонд Open Bioinformatics Foundation [40] поддержал ежегодную конференцию по открытому исходному коду биоинформатики.(BOSC) с 2000 года. [41]

Альтернативный метод создания общедоступных баз данных биоинформатики - использование движка MediaWiki с расширением WikiOpener . Эта система позволяет всем специалистам в данной области получать доступ к базе данных и обновлять ее. [42]

Веб-сервисы в биоинформатике [ править ]

Интерфейсы на основе SOAP и REST были разработаны для широкого спектра биоинформатических приложений, позволяющих приложению, работающему на одном компьютере в одной части мира, использовать алгоритмы, данные и вычислительные ресурсы на серверах в других частях мира. Основные преимущества заключаются в том, что конечным пользователям не приходится иметь дело с накладными расходами на программное обеспечение и обслуживание баз данных.

Базовые биоинформатические услуги классифицируются EBI на три категории: SSS (службы поиска последовательностей), MSA (множественное выравнивание последовательностей) и BSA (анализ биологической последовательности). [43] Доступность этих сервисно-ориентированных ресурсов по биоинформатике демонстрирует применимость сетевых биоинформатических решений и варьируется от набора автономных инструментов с общим форматом данных в едином, автономном или веб-интерфейсе до интегративных, распределенных и расширяемые системы управления рабочим процессом биоинформатики .

Системы управления рабочим процессом биоинформатики [ править ]

Система управления рабочими процессами биоинформатики - это специализированная форма системы управления рабочими процессами, разработанная специально для составления и выполнения ряда этапов вычислений или обработки данных или рабочего процесса в приложении биоинформатики. Такие системы предназначены для

  • предоставить простую в использовании среду, позволяющую самим разработчикам приложений создавать свои собственные рабочие процессы,
  • предоставить ученым интерактивные инструменты, позволяющие им выполнять свои рабочие процессы и просматривать свои результаты в режиме реального времени,
  • упростить процесс обмена и повторного использования рабочих процессов между учеными, и
  • позволяют ученым отслеживать происхождение результатов выполнения рабочего процесса и этапы создания рабочего процесса.

Некоторые из платформ, предоставляющих эту услугу: Galaxy , Kepler , Taverna , UGENE , Anduril , HIVE .

Объекты BioCompute и BioCompute [ править ]

В 2014 году Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США спонсировало конференцию, проведенную в кампусе Бетесда при Национальном институте здравоохранения, для обсуждения воспроизводимости данных в биоинформатике. [44] В течение следующих трех лет консорциум заинтересованных сторон регулярно встречался, чтобы обсудить, что станет парадигмой BioCompute. [45] Эти заинтересованные стороны включали представителей правительства, промышленности и академических организаций. Лидеры сессии представлены многочисленные ветви некоммерческих организаций FDA и NIH институтов и центров, в том числе проекта человеческого Variome и Европейской Федерации медицинской информатики и научно - исследовательских институтов , включая Стэнфорд , темНью-Йоркский центр генома и Университет Джорджа Вашингтона .

Было решено, что парадигма BioCompute будет иметь форму цифровых «лабораторных тетрадей», которые позволят воспроизводить, воспроизводить, просматривать и повторно использовать протоколы биоинформатики. Это было предложено для обеспечения большей преемственности внутри исследовательской группы в течение обычного потока персонала, способствуя обмену идеями между группами. Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США финансировало эту работу, чтобы информация о трубопроводах была более прозрачной и доступной для их регулирующего персонала. [46]

В 2016 году группа вновь собралась в NIH в Bethesda и обсудила потенциал объекта BioCompute , являющегося примером парадигмы BioCompute. Эта работа была скопирована как документ для «стандартного пробного использования» и как препринт, загруженный на bioRxiv. Объект BioCompute позволяет использовать запись в формате JSON среди сотрудников, сотрудников и регулирующих органов. [47] [48]

Образовательные платформы [ править ]

Программные платформы, предназначенные для обучения концепциям и методам биоинформатики, включают Rosalind и онлайн-курсы, предлагаемые на Учебном портале Швейцарского института биоинформатики . Канадский Биоинформатика Мастерские предоставляет видео и слайды , обучающие семинары на своем веб - сайте в соответствии с лицензией Creative Commons лицензии. Проект 4273π или проект 4273pi [49] также предлагает бесплатные образовательные материалы с открытым исходным кодом. Курс проводится на недорогих компьютерах Raspberry Pi и используется для обучения взрослых и школьников. [50] [51]4273π активно разрабатывается консорциумом ученых и исследователей, которые занимались биоинформатикой исследовательского уровня с использованием компьютеров Raspberry Pi и операционной системы 4273π. [52] [53]

Mooc платформы также предоставляют онлайн сертификаты в биоинформатике и смежных дисциплин, в том числе Coursera «s биоинформатики специализации ( UC San Diego ) и геномных данных Science Специализация ( Johns Hopkins ), а также EDX » Анализ s данных для Life Sciences XSERIES ( Harvard ). Университет Южной Калифорнии предлагает степень магистра трансляционной биоинформатики с упором на биомедицинские приложения.

Конференции [ править ]

Есть несколько крупных конференций, посвященных биоинформатике. Некоторые из наиболее ярких примеров - интеллектуальные системы для молекулярной биологии (ISMB), Европейская конференция по вычислительной биологии (ECCB) и исследования в области вычислительной молекулярной биологии (RECOMB).

См. Также [ править ]

  • Информатика биоразнообразия
  • Биоинформатические компании
  • Вычислительная биология
  • Вычислительное биомоделирование
  • Вычислительная геномика
  • Кибербиобезопасность
  • Функциональная геномика
  • Информатика здоровья
  • Международное общество вычислительной биологии
  • Библиотека прыжков
  • Список институтов биоинформатики
  • Список программного обеспечения для биоинформатики с открытым исходным кодом
  • Список журналов по биоинформатике
  • Метаболомика
  • Последовательность нуклеиновой кислоты
  • Филогенетика
  • Протеомика
  • База данных генных болезней

Ссылки [ править ]

  1. ^ Lesk, AM (26 июля 2013). «Биоинформатика» . Британская энциклопедия .
  2. ^ a b Sim, AYL; Minary, P .; Левитт, М. (2012). «Моделирование нуклеиновых кислот» . Текущее мнение в структурной биологии . 22 (3): 273–78. DOI : 10.1016 / j.sbi.2012.03.012 . PMC 4028509 . PMID 22538125 .  
  3. ^ Доусон, WK; Maciejczyk, M .; Jankowska, EJ; Буйницки, JM (2016). «Грубое моделирование трехмерной структуры РНК» . Методы . 103 : 138–56. DOI : 10.1016 / j.ymeth.2016.04.026 . PMID 27125734 . 
  4. ^ Kmiecik, S .; Gront, D .; Колинский, М .; Wieteska, L .; Давид, AE; Колинский, А. (2016). «Крупнозернистые модели белков и их применение» . Химические обзоры . 116 (14): 7898–936. DOI : 10.1021 / acs.chemrev.6b00163 . PMID 27333362 . 
  5. ^ Вонг, KC (2016). Вычислительная биология и биоинформатика: регуляция генов . CRC Press / Taylor & Francis Group. ISBN 9781498724975.
  6. ^ Джойс, AP; Zhang, C .; Bradley, P .; Гавранек, Дж. Дж. (2015). «Структурное моделирование белка: специфичность ДНК» . Брифинги по функциональной геномике . 14 (1): 39–49. DOI : 10.1093 / bfgp / elu044 . PMC 4366589 . PMID 25414269 .  
  7. ^ Spiga, E .; Degiacomi, MT; Даль Пераро, М. (2014). «Новые стратегии интегративного динамического моделирования сборки макромолекул». В Карабенчева-Христова, Т. (ред.). Биомолекулярное моделирование и симуляции . Достижения в химии белков и структурной биологии. 96 . Академическая пресса. С. 77–111. DOI : 10.1016 / bs.apcsb.2014.06.008 . ISBN 9780128000137. PMID  25443955 .
  8. ^ Ciemny, Maciej; Курчинский, Матеуш; Камель, Кароль; Колинский, Анджей; Алам, Навсад; Шулер-Фурман, Ора; Кмечик, Себастьян (4 мая 2018 г.). «Белок-пептидный докинг: возможности и проблемы» . Открытие наркотиков сегодня . 23 (8): 1530–37. DOI : 10.1016 / j.drudis.2018.05.006 . ISSN 1359-6446 . PMID 29733895 .  
  9. ^ а б Hogeweg P (2011). Сирлс, Дэвид Б. (ред.). «Корни биоинформатики в теоретической биологии» . PLOS Вычислительная биология . 7 (3): e1002021. Bibcode : 2011PLSCB ... 7E2021H . DOI : 10.1371 / journal.pcbi.1002021 . PMC 3068925 . PMID 21483479 .  
  10. ^ Hesper В, Hogeweg Р (1970). «Биоинформатика: концепция работы». 1 (6). Камелеон: 28–29. Цитировать журнал требует |journal=( помощь )
  11. ^ Hogeweg P (1978). «Моделирование роста клеточных форм». Моделирование . 31 (3): 90–96. DOI : 10.1177 / 003754977803100305 . S2CID 61206099 . 
  12. ^ Муди, Глин (2004). Цифровой код жизни: как биоинформатика революционизирует науку, медицину и бизнес . ISBN 978-0-471-32788-2.
  13. ^ Dayhoff, MO (1966) Атлас последовательности и структуры белков. Национальный фонд биомедицинских исследований, 215 стр.
  14. ^ Эк RV, Dayhoff МО (1966). «Эволюция структуры ферредоксина на основе живых остатков примитивных аминокислотных последовательностей». Наука . 152 (3720): 363–66. Bibcode : 1966Sci ... 152..363E . DOI : 10.1126 / science.152.3720.363 . PMID 17775169 . S2CID 23208558 .  
  15. Johnson G, Wu TT (январь 2000 г.). «База данных Kabat и ее приложения: 30 лет после первого графика изменчивости» . Nucleic Acids Res . 28 (1): 214–18. DOI : 10.1093 / NAR / 28.1.214 . PMC 102431 . PMID 10592229 .  
  16. ^ Эриксон, JW; Альтман, GG (1979). «Поиск паттернов в нуклеотидной последовательности генома MS2». Журнал математической биологии . 7 (3): 219–230. DOI : 10.1007 / BF00275725 . S2CID 85199492 . 
  17. ^ Шульман, MJ; Стейнберг, CM; Вестморленд, Н. (1981). «Кодирующая функция нуклеотидных последовательностей может быть определена с помощью статистического анализа». Журнал теоретической биологии . 88 (3): 409–420. DOI : 10.1016 / 0022-5193 (81) 90274-5 . PMID 6456380 . 
  18. Перейти ↑ Xiong, Jin (2006). Основы биоинформатики . Кембридж, Соединенное Королевство: Издательство Кембриджского университета. С.  4 . ISBN 978-0-511-16815-4 - через Интернет-архив.
  19. Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (февраль 1977 г.). «Нуклеотидная последовательность ДНК бактериофага phi X174». Природа . 265 (5596): 687–95. Bibcode : 1977Natur.265..687S . DOI : 10.1038 / 265687a0 . PMID 870828 . S2CID 4206886 .  
  20. ^ Бенсон Д., Karsch-Мизрахи I, Липман DJ, Ostell J, Wheeler DL (январь 2008). «ГенБанк» . Nucleic Acids Res . 36 (выпуск базы данных): D25–30. DOI : 10.1093 / NAR / gkm929 . PMC 2238942 . PMID 18073190 .  
  21. ^ a b c Флейшманн Р.Д., Адамс, доктор медицины, Уайт О., Клейтон Р.А., Киркнесс Э.Ф., Керлаваж А.Р., Булт С.Дж., Могила Дж. Ф., Догерти Б.А., Меррик Дж. М. (июль 1995 г.). «Полное геномное случайное секвенирование и сборка Haemophilus influenzae Rd». Наука . 269 (5223): 496–512. Bibcode : 1995Sci ... 269..496F . DOI : 10.1126 / science.7542800 . PMID 7542800 . 
  22. Перейти ↑ Carvajal-Rodríguez A (2012). «Моделирование генов и геномов вперед во времени» . Текущая геномика . 11 (1): 58–61. DOI : 10.2174 / 138920210790218007 . PMC 2851118 . PMID 20808525 .  
  23. Перейти ↑ Brown, TA (2002). «Мутация, ремонт и рекомбинация». Геномы (2-е изд.). Манчестер (Великобритания): Оксфорд.
  24. ^ Картер, Н. П.; Fiegler, H .; Пайпер, Дж. (2002). «Сравнительный анализ технологий сравнительной геномной гибридизации на микрочипах: отчет семинара, спонсируемого фондом Wellcome Trust». Цитометрии Часть A . 49 (2): 43–48. DOI : 10.1002 / cyto.10153 . PMID 12357458 . 
  25. ^ Chaudhari Narendrakumar М., Кумар Гупта Винод, Датта Читра (2016). «BPGA - сверхбыстрый конвейер пангеномного анализа» . Научные отчеты . 6 : 24373. Bibcode : 2016NatSR ... 624373C . DOI : 10.1038 / srep24373 . PMC 4829868 . PMID 27071527 .  CS1 maint: multiple names: authors list (link)
  26. Перейти ↑ Aston KI (2014). «Генетическая предрасположенность к мужскому бесплодию: новости из полногеномных ассоциативных исследований» . Андрология . 2 (3): 315–21. DOI : 10.1111 / j.2047-2927.2014.00188.x . PMID 24574159 . S2CID 206007180 .  
  27. ^ Верон А, Blein S, Кокс Д. Г. (2014). «Полногеномные исследования ассоциации и клиника: в центре внимания рак груди». Биомаркеры в медицине . 8 (2): 287–96. DOI : 10.2217 / bmm.13.121 . PMID 24521025 . 
  28. ^ Tosto G, Рейц C (2013). «Полногеномные исследования ассоциации при болезни Альцгеймера: обзор» . Текущие отчеты по неврологии и неврологии . 13 (10): 381. DOI : 10.1007 / s11910-013-0381-0 . PMC 3809844 . PMID 23954969 .  
  29. ^ Londin Е, Р Ядав, Суррей S, Kricka LJ, Fortina Р (2013). «Использование анализа сцепления, полногеномных ассоциативных исследований и секвенирования следующего поколения для выявления мутаций, вызывающих заболевание». Фармакогеномика . Методы молекулярной биологии. 1015 . С. 127–46. DOI : 10.1007 / 978-1-62703-435-7_8 . ISBN 978-1-62703-434-0. PMID  23824853 . Отсутствует или пусто |title=( справка )
  30. ^ Hindorff, LA; и другие. (2009). «Возможные этиологические и функциональные последствия полногеномных ассоциативных локусов для болезней и черт человека» . Proc. Natl. Акад. Sci. США . 106 (23): 9362–67. Bibcode : 2009PNAS..106.9362H . DOI : 10.1073 / pnas.0903103106 . PMC 2687147 . PMID 19474294 .  
  31. ^ Холл, LO (2010). «Поиск правильных генов для прогнозирования болезней и прогнозов». 2010 Международная конференция по системным наукам и инженерии . Система науки и техники (ICSSE), 2010 Международная конференция . С. 1–2. DOI : 10.1109 / ICSSE.2010.5551766 . ISBN 978-1-4244-6472-2. S2CID  21622726 .
  32. ^ Васкес, Мигель; Торре, Виктор де ла; Валенсия, Альфонсо (27 декабря 2012 г.). «Глава 14: Анализ генома рака» . PLOS Вычислительная биология . 8 (12): e1002824. Bibcode : 2012PLSCB ... 8E2824V . DOI : 10.1371 / journal.pcbi.1002824 . ISSN 1553-7358 . PMC 3531315 . PMID 23300415 .   
  33. ^ Хе-Юнг, EC; Jaswinder, K .; Мартин, К .; Самуэль, АА; Марко, AM (2014). «Секвенирование второго поколения для анализа генома рака». В Деллере, Грэме; Берман, Джейсон Н .; Арчечи, Роберт Дж. (Ред.). Геномика рака . Бостон (США): Academic Press. С. 13–30. DOI : 10.1016 / B978-0-12-396967-5.00002-5 . ISBN 9780123969675.
  34. ^ Грау, J .; Ben-Gal, I .; Пощ, С .; Гроссе, И. (1 июля 2006 г.). «VOMBAT: предсказание сайтов связывания факторов транскрипции с использованием байесовских деревьев переменного порядка» (PDF) . Исследования нуклеиновых кислот . 34 (веб-сервер): W529 – W533. DOI : 10.1093 / NAR / gkl212 . PMC 1538886 . PMID 16845064 .   
  35. ^ "Атлас человеческого белка" . www.proteinatlas.org . Проверено 2 октября 2017 года .
  36. ^ «Человеческая клетка» . www.proteinatlas.org . Проверено 2 октября 2017 года .
  37. ^ Thul, Питер J .; Окессон, Ловиса; Викинг, Микаэла; Махдесян, Диана; Геладаки, Айкатерини; Блал, Хамму Айт; Алм, Тове; Асплунд, Анна; Бьорк, Ларс (26 мая 2017 г.). «Субклеточная карта протеома человека». Наука . 356 (6340): eaal3321. DOI : 10.1126 / science.aal3321 . PMID 28495876 . S2CID 10744558 .  
  38. ^ Да, Ферхат; Благородный, Уильям С. (2 сентября 2015 г.). «Методы анализа для изучения трехмерной архитектуры генома» . Геномная биология . 16 (1): 183. DOI : 10.1186 / s13059-015-0745-7 . PMC 4556012 . PMID 26328929 .  
  39. ^ Хой, JA; Робинсон, H; Трент Дж.Т., 3-й; Какар, S; Smagghe, BJ; Харгроув, штат Массачусетс (3 августа 2007 г.). «Гемоглобины растений: молекулярная летопись окаменелостей эволюции переноса кислорода». Журнал молекулярной биологии . 371 (1): 168–79. DOI : 10.1016 / j.jmb.2007.05.029 . PMID 17560601 . 
  40. ^ a b «Открытый фонд биоинформатики: О нас» . Официальный сайт . Открытый фонд биоинформатики . Проверено 10 мая 2011 года .
  41. ^ "Открытый фонд биоинформатики: BOSC" . Официальный сайт . Открытый фонд биоинформатики . Проверено 10 мая 2011 года .
  42. ^ Brohée, Сильвен; Баррио, Роланд; Моро, Ив (2010). «Базы биологических знаний с использованием вики-сайтов: сочетание гибкости вики-сайтов со структурой баз данных» . Биоинформатика . 26 (17): 2210–11. DOI : 10.1093 / биоинформатики / btq348 . PMID 20591906 . 
  43. ^ Нисбет, Роберт (2009). «Биоинформатика» . Справочник по приложениям статистического анализа и интеллектуального анализа данных . Джон Старейшина IV, Гэри Майнер. Академическая пресса. п. 328. ISBN 978-0080912035.
  44. ^ Комиссар, Управление. «Развитие регуляторной науки - 24–25 сентября 2014 г. Открытый семинар: Стандарты секвенирования нового поколения» . www.fda.gov . Проверено 30 ноября 2017 года .
  45. Симонян, Ваган; Гокс, Джереми; Мазумдер, Раджа (2017). «Биокомпьютерные объекты - шаг к оценке и подтверждению биомедицинских научных вычислений» . КПК Журнал фармацевтической науки и технологий . 71 (2): 136–46. DOI : 10.5731 / pdajpst.2016.006734 . ISSN 1079-7440 . PMC 5510742 . PMID 27974626 .   
  46. ^ Комиссар, Управление. «Развитие нормативной науки - разработка на уровне сообществ стандартов HTS для проверки данных и вычислений, а также поощрения функциональной совместимости» . www.fda.gov . Проверено 30 ноября 2017 года .
  47. ^ Альтеровиц, Гил; Дин, Деннис А .; Гобл, Кэрол; Крузо, Майкл Р .; Соиланд-Рейес, Стиан; Белл, Аманда; Хейс, Анаис; Кинг, Чарльз Хэдли С .; Йохансон, Элейн (4 октября 2017 г.). «Обеспечение прецизионной медицины посредством стандартной передачи информации о происхождении, анализе и результатах NGS». bioRxiv 10.1101 / 191783 . 
  48. ^ Проект BioCompute Object (BCO) - это совместная и управляемая сообществом структура для стандартизации вычислительных данных HTS. 1. BCO Specification Document: руководство пользователя для понимания и создания B. , biocompute-objects, 3 сентября 2017 г.
  49. ^ Баркер, D; Ferrier, DEK; Голландия, PW; Митчелл, JBO; Plaisier, H; Ричи, MG; Смарт, SD (2013). «4273π: обучение биоинформатике на недорогом оборудовании ARM» . BMC Bioinformatics . 14 : 243. DOI : 10,1186 / 1471-2105-14-243 . PMC 3751261 . PMID 23937194 .  
  50. ^ Баркер, D; Олдерсон, Р.Г.; McDonagh, JL; Plaisier, H; Комри, ММ; Дункан, L; Muirhead, GTP; Суини, SD (2015). «Практическая деятельность университетского уровня по биоинформатике приносит пользу добровольным группам школьников в последние 2 года обучения в школе» . Международный журнал STEM-образования . 2 (17). DOI : 10.1186 / s40594-015-0030-Z .
  51. ^ McDonagh, JL; Баркер, Д; Олдерсон, Р.Г. (2016). «Доведение вычислительной науки до общественности» . SpringerPlus . 5 (259): 259. DOI : 10,1186 / s40064-016-1856-7 . PMC 4775721 . PMID 27006868 .  
  52. ^ Робсон, JF; Баркер, Д. (2015). «Сравнение содержания генов, кодирующих белок, Chlamydia trachomatis и Protochlamydia amoebophila с использованием компьютера Raspberry Pi» . BMC Research Notes . 8 (561): 561. DOI : 10,1186 / s13104-015-1476-2 . PMC 4604092 . PMID 26462790 .  
  53. ^ Wregglesworth, KM; Баркер, Д. (2015). «Сравнение кодирующих белок геномов двух зеленых серных бактерий, Chlorobium tepidum TLS и Pelodictyon phaeoclathratiforme BU-1» . BMC Research Notes . 8 (565): 565. DOI : 10,1186 / s13104-015-1535-8 . PMC 4606965 . PMID 26467441 .  

Дальнейшее чтение [ править ]

  • Sehgal et al. : Структурные, филогенетические и стыковочные исследования активатора оксидазы D-аминокислот (DAOA), гена-кандидата шизофрении. Теоретическая биология и медицинское моделирование 2013 10: 3.
  • Рауль Исеа . Современное значение слова «биоинформатика» , Глобальный журнал перспективных исследований, 2015 г.
  • Achuthsankar S Nair Computational Biology & Bioinformatics - A soft Overview , Communications of Computer Society of India, январь 2007 г.
  • Алуру, Шринивас , изд. Справочник по вычислительной молекулярной биологии . Chapman & Hall / Crc, 2006. ISBN 1-58488-406-1 (серия Chapman & Hall / Crc Computer and Information Science Series) 
  • Балди, П., Брунак, С., Биоинформатика: подход машинного обучения , 2-е издание. MIT Press, 2001. ISBN 0-262-02506-X 
  • Барнс, М. Р. и Грей, И. К., ред., Биоинформатика для генетиков , первое издание. Wiley, 2003. ISBN 0-470-84394-2. 
  • Baxevanis, AD и Ouellette, BFF, ред., Биоинформатика: Практическое руководство по анализу генов и белков , третье издание. Wiley, 2005. ISBN 0-471-47878-4. 
  • Баксеванис, А.Д., Петско, Г.А., Стейн, Л.Д., и Стормо, Г.Д., ред., Текущие протоколы в биоинформатике . Wiley, 2007. ISBN 0-471-25093-7. 
  • Кристианини, Н. и Хан, М. Введение в вычислительную геномику , Cambridge University Press, 2006. ( ISBN 9780521671910 | ISBN 0-521-67191-4 )  
  • Дурбин, Р., С. Эдди, А. Крог и Г. Митчисон, Анализ биологической последовательности . Cambridge University Press, 1998. ISBN 0-521-62971-3 
  • Гилберт Д. (2004). «Программные ресурсы биоинформатики» . Брифинги по биоинформатике . 5 (3): 300–304. DOI : 10.1093 / нагрудник / 5.3.300 . PMID  15383216 .
  • Кидвелл, Э., Интеллектуальная биоинформатика: применение методов искусственного интеллекта к проблемам биоинформатики . Wiley, 2005. ISBN 0-470-02175-6. 
  • Кохан и др. Микромассивы для интегративной геномики. MIT Press, 2002. ISBN 0-262-11271-X 
  • Lund, O. et al. Иммунологическая биоинформатика. MIT Press, 2005. ISBN 0-262-12280-4 
  • Пахтер, Лиор и Штурмфельс, Бернд . «Алгебраическая статистика для вычислительной биологии» Cambridge University Press, 2005. ISBN 0-521-85700-7 
  • Певзнер, Павел А. Вычислительная молекулярная биология: алгоритмический подход . MIT Press, 2000. ISBN 0-262-16197-4 
  • Соинов, Л. Биоинформатика и распознавание образов объединяются Журнал исследований в области распознавания образов ( JPRR ), Том 1 (1) 2006 с. 37–41
  • Стивенс, Халлам, Жизнь вне последовательности: управляемая данными история биоинформатики , Чикаго: Издательство Чикагского университета, 2013, ISBN 9780226080208 
  • Тисдалл, Джеймс. "Начало работы с Perl для биоинформатики" О'Рейли, 2001. ISBN 0-596-00080-4 
  • Катализирующий запрос на стыке вычислений и биологии (2005) Отчет CSTB
  • Вычисление секретов жизни: вклад математических наук и вычислений в молекулярную биологию (1995)
  • Основы вычислительной и системной биологии, курс Массачусетского технологического института
  • Вычислительная биология: геномы, сети, курс без эволюции MIT

Внешние ссылки [ править ]

Послушайте эту статью ( 37 минут )
Разговорный значок Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 20 сентября 2013 года и не отражает последующих правок. (2013-09-20)
  • Словарное определение биоинформатики в Викисловаре
  • Учебные материалы по биоинформатике в Викиверситете
  • СМИ, связанные с биоинформатикой, на Викискладе?
  • Портал ресурсов по биоинформатике (SIB)