Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Тепловые карты значений экспрессии генов показывают, как экспериментальные условия повлияли на выработку (экспрессию) мРНК для набора генов. Зеленый означает пониженное выражение. Кластерный анализ поместил группу генов с пониженной регуляцией в левый верхний угол.

В области молекулярной биологии , экспрессии генов профилирование является измерением деятельности ( экспрессия ) тысяч генов в один раз, чтобы создать глобальную картину клеточной функции. Эти профили могут, например, различать клетки, которые активно делятся, или показывать, как клетки реагируют на определенное лечение. Многие эксперименты такого рода измеряют одновременно весь геном , то есть каждый ген, присутствующий в конкретной клетке.

Несколько технологий транскриптомики могут использоваться для генерации данных, необходимых для анализа. ДНК-микрочипы [1] измеряют относительную активность ранее идентифицированных генов-мишеней. Методы, основанные на последовательностях, такие как RNA-Seq , предоставляют информацию о последовательностях генов в дополнение к их уровню экспрессии.

Фон [ править ]

Профилирование экспрессии - это следующий логический шаг после секвенирования генома : последовательность говорит нам, что клетка может делать, а профиль экспрессии говорит нам, что она на самом деле делает в определенный момент времени. Гены содержат инструкции по созданию информационной РНК ( мРНК ), но в любой момент каждая клетка создает мРНК только из части генов, которые она несет. Если ген используется для производства мРНК, он считается «включенным», в противном случае - «выключенным». Многие факторы определяют, включен или выключен ген, например, время суток, активно ли делится клетка, ее локальное окружение и химические сигналы от других клеток. Например, клетки кожи , печеньклетки и нервные клетки включают (экспрессируют) несколько разные гены, и это во многом их отличает. Таким образом, профиль экспрессии позволяет определить тип, состояние, среду и т. Д. Клетки.

Эксперименты по профилированию экспрессии часто включают измерение относительного количества мРНК, экспрессируемой в двух или более экспериментальных условиях. Это связано с тем, что измененные уровни определенной последовательности мРНК предполагают изменение потребности в белке, кодируемом мРНК, что, возможно, указывает на гомеостатический ответ или патологическое состояние. Например, более высокие уровни мРНК, кодирующей алкогольдегидрогеназу, предполагают, что исследуемые клетки или ткани реагируют на повышенные уровни этанола в окружающей их среде. Точно так же, если клетки рака груди экспрессируют более высокие уровни мРНК, связанной с конкретным трансмембранным рецепторомчем нормальные клетки, возможно, этот рецептор играет роль в раке груди. Препарат, взаимодействующий с этим рецептором, может предотвратить или вылечить рак груди. При разработке лекарства можно проводить эксперименты по профилированию экспрессии генов, чтобы помочь оценить токсичность лекарства, возможно, путем поиска изменения уровней экспрессии генов цитохрома P450 , которые могут быть биомаркером метаболизма лекарства. [2] Профилирование экспрессии генов может стать важным диагностическим тестом. [3] [4]

Сравнение с протеомикой [ править ]

Геном человека содержит порядка 25 000 генов, которые работают сообща, производя порядка 1 000 000 различных белков. Это происходит из-за альтернативного сплайсинга , а также из-за того, что клетки вносят важные изменения в белки посредством посттрансляционной модификации после того, как они впервые их конструируют, поэтому данный ген служит основой для многих возможных версий определенного белка. В любом случае за один масс-спектрометрический эксперимент можно идентифицировать около 2000 белков [5] или 0,2% от общего количества. Зная, какие именно белки производит клетка ( протеомика) важнее, чем знание того, сколько матричной РНК производится из каждого гена, профилирование экспрессии генов дает наиболее полную картину, возможную в одном эксперименте. Однако методология протеомики улучшается. У других видов, таких как дрожжи, можно идентифицировать более 4000 белков всего за один час. [6]

Использование при создании и проверке гипотез [ править ]

Иногда ученый уже имеет представление о том, что происходит, гипотезу , и он или она проводит эксперимент по профилированию выражений с идеей потенциально опровергнуть эту гипотезу. Другими словами, ученый делает конкретный прогноз относительно уровней экспрессии, который может оказаться ложным.

Чаще профилирование экспрессии происходит до того, как станет известно достаточно о том, как гены взаимодействуют с экспериментальными условиями, чтобы существовала проверяемая гипотеза. Без гипотезы нечего опровергать, но профилирование выражений может помочь идентифицировать гипотезу-кандидат для будущих экспериментов. Большинство ранних и многих текущих экспериментов по профилированию выражений имеют эту форму [7], которая известна как обнаружение классов. Популярный подход к обнаружению классов включает группировку похожих генов или образцов вместе с использованием одного из многих существующих методов кластеризации, таких как традиционные k-средние или иерархическая кластеризация , или более поздний MCL . [8]Помимо выбора алгоритма кластеризации, пользователь обычно должен выбрать подходящую меру близости (расстояние или сходство) между объектами данных. [9] На рисунке выше представлены выходные данные двухмерного кластера, в котором похожие образцы (строки выше) и похожие генные зонды (столбцы) были организованы так, чтобы они лежали близко друг к другу. Простейшей формой обнаружения классов было бы перечисление всех генов, которые изменились более чем на определенную величину между двумя экспериментальными условиями.

Предсказание класса труднее, чем определение класса, но оно позволяет ответить на вопросы, имеющие прямое клиническое значение, например, учитывая этот профиль, какова вероятность того, что этот пациент ответит на это лекарство? Для этого требуется множество примеров профилей, которые ответили и не ответили, а также методы перекрестной проверки , чтобы различать их.

Ограничения [ править ]

Как правило, исследования профилей экспрессии сообщают о тех генах, которые показали статистически значимые различия в изменившихся экспериментальных условиях. Обычно это небольшая часть генома по нескольким причинам. Во-первых, разные клетки и ткани экспрессируют подмножество генов как прямое следствие клеточной дифференциации, поэтому многие гены отключены. Во-вторых, многие гены кодируют белки, которые необходимы для выживания в очень определенных количествах, поэтому многие гены не изменяются. В-третьих, клетки используют множество других механизмов для регулирования белков в дополнение к изменению количества мРНК., поэтому эти гены могут оставаться стабильно экспрессируемыми даже при повышении и понижении концентрации белка. В-четвертых, финансовые ограничения ограничивают эксперименты по профилированию экспрессии небольшим количеством наблюдений одного и того же гена в идентичных условиях, что снижает статистическую мощность эксперимента, делая невозможным выявление важных, но незаметных изменений. Наконец, требуется много усилий, чтобы обсудить биологическое значение каждого регулируемого гена, поэтому ученые часто ограничивают свое обсуждение подмножеством. Новые методы анализа микрочипов автоматизируют определенные аспекты придания биологической значимости результатам профилирования экспрессии, но это остается очень сложной проблемой.

Относительно небольшой объем списков генов, опубликованных в результате экспериментов по профилированию экспрессии, ограничивает степень совпадения результатов экспериментов, проведенных в разных лабораториях. Размещение результатов профилирования экспрессии в общедоступной базе данных микрочипов позволяет исследователям оценивать паттерны экспрессии, выходящие за рамки опубликованных результатов, возможно, обнаруживая сходство с их собственной работой.

Подтверждение измерений высокой пропускной способности [ править ]

И ДНК-микроматрицы, и количественная ПЦР используют предпочтительное связывание или « спаривание оснований » комплементарных последовательностей нуклеиновых кислот, и оба они используются для профилирования экспрессии генов, часто последовательным образом. Хотя высокопроизводительным ДНК-микрочипам не хватает количественной точности кПЦР, для измерения экспрессии нескольких десятков генов с помощью кПЦР требуется примерно то же время, что и для измерения всего генома с использованием ДНК-микрочипов. Поэтому часто имеет смысл провести полуколичественные эксперименты по анализу ДНК-микрочипов для идентификации генов-кандидатов, а затем выполнить qPCR на некоторых из наиболее интересных генов-кандидатов для проверки результатов микроматрицы. Другие эксперименты, например Вестерн-блоттинг. относительно некоторых белковых продуктов дифференциально экспрессируемых генов, сделать выводы, основанные на профиле экспрессии, более убедительными, поскольку уровни мРНК не обязательно коррелируют с количеством экспрессируемого белка.

Статистический анализ [ править ]

Анализ данных микрочипов стал областью интенсивных исследований. [10] Простое утверждение, что группа генов регулируется по крайней мере двояко, когда-то было обычной практикой, не имеет прочной статистической основы. При пяти или меньшем количестве повторов в каждой группе, что типично для микроматриц, одно наблюдение выброса может создать видимую разницу более чем в два раза. Кроме того, произвольно устанавливать двойную планку нецелесообразно с биологической точки зрения, поскольку это исключает из рассмотрения многие гены, имеющие очевидное биологическое значение.

Вместо того, чтобы идентифицировать дифференциально экспрессируемые гены с использованием отсечки кратного изменения, можно использовать различные статистические тесты или комплексные тесты, такие как ANOVA , каждый из которых учитывает как кратное изменение, так и вариабельность для создания p-значения , оценки того, как часто мы наблюдать данные случайно. Применение p-значений к микрочипам затруднено из-за большого количества множественных сравнений.(гены) вовлечены. Например, p-значение 0,05 обычно считается показателем значимости, поскольку оно оценивает 5% вероятность случайного наблюдения данных. Но с 10 000 генов на микрочипе 500 генов будут идентифицированы как значимые при p <0,05, даже если не будет различий между экспериментальными группами. Одно очевидное решение состоит в том, чтобы считать значимыми только те гены, которые соответствуют гораздо более строгому критерию значения p, например, можно было бы выполнить поправку Бонферрони на p-значениях или использовать вычисление ложной скорости обнаружения, чтобы скорректировать p-значения пропорционально количеству параллельных тестов. К сожалению, эти подходы могут уменьшить количество значимых генов до нуля, даже если гены фактически дифференциально экспрессируются. Текущая статистика, такая какРанговые продукты стремятся найти баланс между ложным открытием генов из-за случайной вариации и невыявлением дифференциально экспрессируемых генов. Обычно цитируемые методы включают анализ значимости микроматриц (SAM) [11], и широкий спектр методов доступен от Bioconductor, а также множество аналитических пакетов от биоинформатических компаний .

Выбор другого теста обычно определяет другой список значимых генов [12], поскольку каждый тест работает с определенным набором допущений и уделяет особое внимание определенным характеристикам данных. Многие тесты начинаются с предположения о нормальном распределении данных, потому что это кажется разумной отправной точкой и часто дает результаты, которые кажутся более значимыми. Некоторые тесты рассматривают совместное распределение всех наблюдений за генами для оценки общей вариабельности измерений [13], в то время как другие рассматривают каждый ген по отдельности. Многие современные методы анализа микрочипов включают загрузку (статистику) , машинное обучение илиМетоды Монте-Карло . [14]

По мере увеличения количества повторных измерений в эксперименте с микрочипом различные статистические подходы дают все более схожие результаты, но отсутствие согласованности между различными статистическими методами делает результаты массивов менее достоверными. Проект MAQC [15] дает рекомендации, которые помогут исследователям выбрать более стандартные методы (например, использовать p-значение и кратное изменение вместе для выбора дифференциально экспрессируемых генов), чтобы эксперименты, проведенные в разных лабораториях, согласовывались лучше.

В отличие от анализа дифференциально экспрессируемых отдельных генов, другой тип анализа фокусируется на дифференциальной экспрессии или нарушении предварительно определенных наборов генов и называется анализом набора генов. [16] [17] Анализ набора генов продемонстрировал несколько основных преимуществ перед анализом дифференциальной экспрессии отдельных генов. [16] [17] Наборы генов - это группы генов, которые функционально связаны согласно современным знаниям. Поэтому анализ набора генов считается подходом к анализу, основанному на знаниях. [16] Обычно используемые наборы генов включают те, которые получены из путей KEGG , Gene Ontology.термины, группы генов, которые имеют некоторые другие функциональные аннотации, такие как общие регуляторы транскрипции и т. д. Репрезентативные методы анализа набора генов включают анализ обогащения набора генов (GSEA) [16], который оценивает значимость наборов генов на основе перестановки меток образцов и в целом Применимое обогащение набора генов (GAGE) [17], которое проверяет значимость наборов генов на основе перестановки меток генов или параметрического распределения.

Аннотация гена [ править ]

Хотя статистика может определить, какие генные продукты меняются в экспериментальных условиях, биологический смысл профилирования экспрессии основан на знании того, какой белок вырабатывает каждый генный продукт и какую функцию этот белок выполняет. Аннотации генов предоставляют функциональную и другую информацию, например расположение каждого гена в определенной хромосоме. Некоторые функциональные аннотации более надежны, чем другие; некоторые отсутствуют. Базы данных аннотаций генов регулярно меняются, и различные базы данных относятся к одному и тому же белку под разными именами, что отражает меняющееся понимание функции белка. Использование стандартизированной номенклатуры генов помогает решить аспект проблемы наименования, но точное соответствие транскриптов генам [18] [19] остается важным соображением.

Категоризация регулируемых генов [ править ]

После идентификации некоторого набора регулируемых генов следующий шаг в профилировании экспрессии включает поиск паттернов внутри регулируемого набора. Выполняют ли белки, созданные из этих генов, аналогичные функции? Сходны ли они химически? Они проживают в аналогичных частях клетки? Анализ генной онтологии предоставляет стандартный способ определения этих отношений. Онтологии генов начинаются с очень широких категорий, например, «метаболический процесс», и разбивают их на более мелкие категории, например, «углеводный метаболический процесс», и, наконец, на весьма ограничительные категории, такие как «инозитол и производное фосфорилирование».

Гены обладают и другими атрибутами, помимо биологической функции, химических свойств и местоположения клетки. Можно составить наборы генов на основе близости к другим генам, ассоциации с заболеванием и отношений с лекарствами или токсинами. База данных молекулярных сигнатур [20] и база данных сравнительной токсикогеномики [21] являются примерами ресурсов для классификации генов различными способами.

Поиск закономерностей среди регулируемых генов [ править ]

Схема генной сети изобретательности [22], которая динамически собирает гены с известными взаимосвязями. Зеленый цвет указывает на пониженное выражение, красный указывает на повышенное выражение. В алгоритм включены нерегулируемые гены белого цвета для улучшения связи.

Регулируемые гены классифицируются с точки зрения того, что они из себя представляют и что они делают, между генами могут возникать важные взаимосвязи. [23] Например, мы можем увидеть доказательства того, что определенный ген создает белок, чтобы вырабатывать фермент, который активирует белок, чтобы включить второй ген из нашего списка. Этот второй ген может быть фактором транскрипции.который регулирует еще один ген из нашего списка. Наблюдая за этими связями, мы можем начать подозревать, что они представляют собой нечто большее, чем случайные ассоциации в результатах, и что все они находятся в нашем списке из-за лежащего в основе биологического процесса. С другой стороны, может случиться так, что если кто-то выберет гены наугад, можно будет найти много генов, у которых есть что-то общее. В этом смысле нам нужны строгие статистические процедуры, чтобы проверить, значимы ли возникающие биологические темы. Именно здесь на помощь приходит анализ набора генов [16] [17] .

Причинно-следственные связи [ править ]

Достаточно простая статистика позволяет оценить, являются ли ассоциации между генами в списках более значительными, чем можно было бы ожидать случайно. Эти статистические данные интересны, даже если они представляют собой существенное упрощение того, что на самом деле происходит. Вот пример. Предположим, в эксперименте участвует 10000 генов, только 50 (0,5%) из которых играют известную роль в выработке холестерина.. Эксперимент идентифицирует 200 регулируемых генов. Из них 40 (20%) также входят в список генов холестерина. Основываясь на общей распространенности генов холестерина (0,5%), можно ожидать в среднем 1 ген холестерина на каждые 200 регулируемых генов, то есть 0,005 умножить на 200. Это ожидание является средним, поэтому можно ожидать увидеть более одного гена из некоторых. время. Возникает вопрос, как часто мы будем видеть 40 вместо 1 из-за чистой случайности.

Согласно гипергеометрическому распределению , можно ожидать примерно 10 ^ 57 раз (10 с последующими 56 нулями), прежде чем выбрать 39 или более генов холестерина из пула из 10 000 путем случайного извлечения 200 генов. Если обращать внимание на то, насколько ничтожно мала вероятность случайного наблюдения, можно сделать вывод, что список регулируемых генов обогащен [24] генами с известной ассоциацией холестерина.

Можно также предположить, что экспериментальное лечение регулирует холестерин, потому что лечение, по-видимому, избирательно регулирует гены, связанные с холестерином. Хотя это может быть правдой, есть ряд причин, по которым такой твердый вывод, основанный только на обогащении, представляет собой необоснованный прыжок в веру. Одна ранее упомянутая проблема связана с наблюдением, что регуляция генов может не иметь прямого влияния на регуляцию белков: даже если белки, кодируемые этими генами, не делают ничего, кроме производства холестерина, показ того, что их мРНК изменена, не говорит нам напрямую, что происходит на уровне белка. Вполне возможно, что количество этих белков, связанных с холестерином, остается постоянным в условиях эксперимента. Во-вторых, даже если уровень протеина изменится,шаг, определяющий скорость в процессе выработки холестерина. Наконец, белки обычно играют множество ролей, поэтому эти гены могут регулироваться не из-за их общей ассоциации с выработкой холестерина, а из-за общей роли в полностью независимом процессе.

Принимая во внимание вышеизложенные предостережения, хотя генные профили сами по себе не доказывают причинно-следственную связь между лечением и биологическими эффектами, они все же предлагают уникальные биологические идеи, которые часто было бы очень трудно получить другими способами.

Использование паттернов для поиска регулируемых генов [ править ]

Как описано выше, можно сначала идентифицировать в значительной степени регулируемые гены, а затем находить закономерности, сравнивая список важных генов с наборами генов, которые, как известно, имеют определенные ассоциации. Также можно решить задачу в обратном порядке. Вот очень простой пример. Предположим, существует 40 генов, связанных с известным процессом, например, предрасположенностью к диабету. Глядя на две группы профилей экспрессии, одну для мышей, получавших диету с высоким содержанием углеводов, и одну для мышей, получавших диету с низким содержанием углеводов, можно было заметить, что все 40 генов диабета экспрессируются на более высоком уровне в группе с высоким содержанием углеводов, чем в группе с низким содержанием углеводов. Независимо от того, попал ли какой-либо из этих генов в список значительно измененных генов, наблюдение за всеми 40 генами вверх и ни один из них вряд ли будет результатом чистой случайности:

Для типа клетки группа генов, комбинированный паттерн экспрессии которых уникально характерен для данного состояния, составляет генную сигнатуру этого состояния. В идеале сигнатуру гена можно использовать для выбора группы пациентов с определенным состоянием заболевания с точностью, которая облегчает выбор лечения. [25] [26] Анализ обогащения генетического набора (GSEA) [16] и аналогичные методы [17]Воспользуйтесь преимуществами такого рода логики, но с использованием более сложной статистики, потому что гены-компоненты в реальных процессах демонстрируют более сложное поведение, чем просто движение вверх или вниз как группа, и величина, в которой гены перемещаются вверх и вниз, имеет значение, а не только направление. В любом случае, эти статистические данные измеряют, насколько отличается поведение некоторого небольшого набора генов по сравнению с генами, не входящими в этот маленький набор.

GSEA использует статистику стиля Колмогорова-Смирнова, чтобы увидеть, проявляли ли какие-либо ранее определенные наборы генов необычное поведение в текущем профиле экспрессии. Это приводит к возникновению проблемы проверки множества гипотез, но существуют разумные методы ее решения. [27]

Выводы [ править ]

Профилирование экспрессии дает новую информацию о том, что гены делают в различных условиях. В целом, технология микрочипов обеспечивает надежные профили экспрессии. [28] Из этой информации можно генерировать новые гипотезы о биологии или проверять существующие. Однако размер и сложность этих экспериментов часто приводят к широкому спектру возможных интерпретаций. Во многих случаях анализ результатов профилирования выражений требует гораздо больше усилий, чем выполнение первоначальных экспериментов.

Большинство исследователей используют несколько статистических методов и исследовательский анализ данных перед публикацией результатов профилирования экспрессии, координируя свои усилия с биоинформатиком или другим экспертом в области микроматриц ДНК . Хороший экспериментальный план, адекватная биологическая репликация и последующие эксперименты играют ключевую роль в успешных экспериментах по профилированию экспрессии.

См. Также [ править ]

  • Профилирование экспрессии генов при раке
  • Пространственно-временная экспрессия генов
  • Транскриптомика
  • Анализ вариантов стыковки

Ссылки [ править ]

  1. ^ "Microarrays Factsheet" . Проверено 28 декабря 2007 .
  2. ^ Сутер L, Babiss LE, Уилдон EB (2004). «Токсикогеномика в прогнозной токсикологии при разработке лекарств» . Chem. Биол . 11 (2): 161–71. DOI : 10.1016 / j.chembiol.2004.02.003 . PMID 15123278 . 
  3. Перейти ↑ Magic Z, Radulovic S, Brankovic-Magic M (2007). «Микроматрицы кДНК: идентификация генных сигнатур и их применение в клинической практике». J BUON . 12 Дополнение 1: S39–44. PMID 17935276 . 
  4. Перейти ↑ Cheung AN (2007). «Молекулярные мишени при гинекологическом раке». Патология . 39 (1): 26–45. DOI : 10.1080 / 00313020601153273 . PMID 17365821 . S2CID 40896577 .  
  5. Перейти ↑ Mirza SP, Olivier M (2007). «Методы и подходы для комплексной характеристики и количественной оценки клеточных протеомов с использованием масс-спектрометрии» . Physiol Genomics . 33 (1): 3–11. DOI : 10.1152 / physiolgenomics.00292.2007 . PMC 2771641 . PMID 18162499 .  
  6. ^ Хеберт А.С., Ричардс А.Л. и др. (2014). «Протеом дрожжей за один час» . Протеомика клеток Mol . 13 (1): 339–347. DOI : 10.1074 / mcp.M113.034769 . PMC 3879625 . PMID 24143002 .  
  7. ^ Чен JJ (2007). «Ключевые аспекты анализа данных экспрессии генов микрочипов» . Фармакогеномика . 8 (5): 473–82. DOI : 10.2217 / 14622416.8.5.473 . PMID 17465711 . 
  8. van Dongen, Stijn (2000). Кластеризация графов с помощью потокового моделирования . Утрехтский университет.
  9. ^ Ясковяк, Пабло А; Кампелло, Рикардо Дж.Б. Коста, Иван Г (24 января 2014 г.). «О выборе подходящих расстояний для кластеризации данных по экспрессии генов» . BMC Bioinformatics . 15 (Дополнение 2): S2. DOI : 10.1186 / 1471-2105-15-S2-S2 . PMC 4072854 . PMID 24564555 .  
  10. ^ Vardhanabhuti S, Блэкмор SJ, Кларк С., Гоша S, Stephens RJ, Rajagopalan D (2006). «Сравнение статистических тестов для обнаружения дифференциальной экспрессии с использованием микрочипов олигонуклеотидов Affymetrix». ОМИКС . 10 (4): 555–66. DOI : 10.1089 / omi.2006.10.555 . PMID 17233564 . 
  11. ^ «Анализ значимости микрочипов» . Проверено 27 декабря 2007 .
  12. ^ Yauk CL, Берндт ML (2007). «Обзор литературы, изучающей взаимосвязь между технологиями ДНК-микрочипов» . Environ. Мол. Мутаген . 48 (5): 380–94. DOI : 10.1002 / em.20290 . PMC 2682332 . PMID 17370338 .  
  13. Перейти ↑ Breitling R (2006). «Интерпретация биологического микроматрицы: правила применения» (PDF) . Биохим. Биофиз. Acta . 1759 (7): 319–27. DOI : 10.1016 / j.bbaexp.2006.06.003 . PMID 16904203 .  
  14. ^ DRAMIŃSKI М, Рада-Иглесиас А, Enroth S, Wadelius С, Koronacki Дж, Коморовский J (2008). «Выбор характеристик Монте-Карло для контролируемой классификации» . Биоинформатика . 24 (1): 110–7. DOI : 10.1093 / биоинформатики / btm486 . PMID 18048398 . 
  15. ^ Д-р Леминг Ши, Национальный центр токсикологических исследований. «Проект контроля качества MicroArray (MAQC)» . Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США . Проверено 26 декабря 2007 .
  16. ^ Б с д е е Subramanian A, P Tamayo, Mootha В.К., Mukherjee S, Ebert BL, Gillette MA, Паулович A, Помероя SL, TR, Голуб Lander ES, Mesirov JP (2005). «Анализ обогащения набора генов: основанный на знаниях подход к интерпретации профилей экспрессии в масштабе всего генома» . Proc. Natl. Акад. Sci. США . 102 (43): 15545–50. DOI : 10.1073 / pnas.0506580102 . PMC 1239896 . PMID 16199517 .  
  17. ^ a b c d e Луо В., Фридман М., Шедден К., Ханкенсон К. Д., Вульф JP (2009). «GAGE: обычно применимое обогащение набора генов для анализа путей» . BMC Bioinformatics . 10 : 161. DOI : 10,1186 / 1471-2105-10-161 . PMC 2696452 . PMID 19473525 .  
  18. ^ Дай М., Ван П., Бойд А.Д. и др. (2005). «Развитие определений генов / транскриптов значительно меняет интерпретацию данных GeneChip» . Nucleic Acids Res . 33 (20): e175. DOI : 10.1093 / NAR / gni179 . PMC 1283542 . PMID 16284200 .  
  19. ^ Альбертс Р., Терпстра П., Хардонк М. и др. (2007). «Протокол проверки последовательностей зондов в массивах генома Affymetrix показывает высокую точность зондов для исследований на мышах, людях и крысах» . BMC Bioinformatics . 8 : 132. DOI : 10,1186 / 1471-2105-8-132 . PMC 1865557 . PMID 17448222 .  
  20. ^ "GSEA - MSigDB" . Проверено 3 января 2008 .
  21. ^ "CTD: Сравнительная база данных токсикогеномики" . Проверено 3 января 2008 .
  22. ^ «Системы изобретательности» . Проверено 27 декабря 2007 .
  23. ^ Алексеев OM, Ричардсон RT, Алексеев O, O'Rand MG (2009). «Анализ профилей экспрессии генов в клетках HeLa в ответ на сверхэкспрессию или опосредованное siRNA истощение NASP» . Репродукция. Биол. Эндокринол . 7 : 45. DOI : 10,1186 / 1477-7827-7-45 . PMC 2686705 . PMID 19439102 .  
  24. ^ Кертис Р.К., Oresic М, Видал-Пуч А (2005). «Пути к анализу данных микрочипов». Trends Biotechnol . 23 (8): 429–35. DOI : 10.1016 / j.tibtech.2005.05.011 . PMID 15950303 . 
  25. ^ Мук S, Вант Veer LJ, Rutgers EJ, Piccart-Gebhart MJ, Кардосо F (2007). «Индивидуализация терапии с использованием Mammaprint: от разработки до испытания MINDACT». Геномика рака. Протеомика . 4 (3): 147–55. PMID 17878518 . 
  26. ^ Corsello С.М., Roti G, Росс К.Н., Chow KT, Галинский I, DeAngelo DJ, Stone RM, кунг А.Л., Голуб TR, Stegmaier K (июнь 2009). «Идентификация модуляторов AML1-ETO с помощью химической геномики» . Кровь . 113 (24): 6193–205. DOI : 10.1182 / кровь-2008-07-166090 . PMC 2699238 . PMID 19377049 .  
  27. ^ "GSEA" . Проверено 9 января 2008 .
  28. ^ Couzin J (2006). «Геномика. Данные микрочипов воспроизведены, но некоторые опасения остаются». Наука . 313 (5793): 1559. DOI : 10.1126 / science.313.5793.1559a . PMID 16973852 . S2CID 58528299 .  

Внешние ссылки [ править ]

  • Сравнительный анализ транскриптомики в справочном модуле наук о жизни