Из Википедии, бесплатной энциклопедии
  (Перенаправлено из анализа значимости микрочипов )
Перейти к навигации Перейти к поиску
Пример микроматрицы олигонуклеотидов с пятнами приблизительно 40 000 зондов с увеличенной вставкой для демонстрации деталей.

Методы анализа микрочипов используются для интерпретации данных, полученных в результате экспериментов с ДНК ( анализ генных чипов ), РНК и белковыми микрочипами , которые позволяют исследователям исследовать состояние экспрессии большого количества генов - во многих случаях всего генома организма - в одном эксперименте. [ необходима цитата ] Такие эксперименты могут генерировать очень большие объемы данных, позволяя исследователям оценить общее состояние клетки или организма. Данные в таких больших количествах трудно - если вообще возможно - анализировать без помощи компьютерных программ.

Введение [ править ]

Анализ данных микроматрицы - это заключительный этап считывания и обработки данных, производимых микрочипом. Образцы проходят различные процессы, включая очистку и сканирование с помощью микрочипа, который затем производит большой объем данных, требующих обработки с помощью компьютерного программного обеспечения. Он включает в себя несколько отдельных шагов, как показано на изображении ниже. Изменение любого из шагов приведет к изменению результата анализа, поэтому проект MAQC [1] был создан для определения набора стандартных стратегий. Существуют компании, которые используют протоколы MAQC для выполнения полного анализа. [2]

Шаги, необходимые в эксперименте с микрочипом

Методы [ править ]

Ученый Национального центра токсикологических исследований анализирует данные микрочипов

Большинство производителей микрочипов, такие как Affymetrix и Agilent , [3] обеспечивают коммерческое программное обеспечение для анализа данных наряду с их микрочипов продукции. Существуют также варианты с открытым исходным кодом, в которых используются различные методы анализа данных микрочипов.

Агрегация и нормализация [ править ]

Сравнение двух разных наборов или двух разных образцов, гибридизованных с одним и тем же набором, обычно включает внесение поправок на систематические ошибки, вызванные различиями в процедурах и эффектами интенсивности красителя. Нормализация красителя для двух цветовых массивов часто достигается локальной регрессией . LIMMA предоставляет набор инструментов для коррекции фона и масштабирования, а также возможность усреднять повторяющиеся пятна на слайде. [4] Распространенным методом оценки того, насколько хорошо нормализован массив, является построение графика скользящей средней для данных. Графики MA могут быть созданы с использованием таких программ и языков, как R, MATLAB и Excel.

Необработанные данные Affy содержат около двадцати зондов для одной и той же РНК-мишени. Половина из них - это «пятна несоответствия», которые не точно соответствуют целевой последовательности. Теоретически они могут измерить количество неспецифического связывания для данной цели. Надежное усреднение по нескольким массивам (RMA) [5] - это подход к нормализации, который не использует преимущества этих точек несоответствия, но все же должен суммировать идеальные совпадения посредством медианной полировки . [6] Алгоритм медианной полировки, хотя и надежен, ведет себя по-разному в зависимости от количества проанализированных образцов. [7] Квантильная нормализация, также являющаяся частью RMA, является одним из разумных подходов к нормализации пакета массивов, чтобы сделать дальнейшие сравнения значимыми.

Текущий алгоритм Affymetrix MAS5, в котором используются как датчики идеального совпадения, так и датчики несовпадения, по-прежнему пользуется популярностью и демонстрирует хорошие результаты в тестах «лицом к лицу». [8]

Блок-схема, показывающая, как работает алгоритм MAS5 от Agilent.

Факторный анализ для надежного суммирования микрочипов (FARMS) [9] - это основанный на модели метод суммирования данных массива на уровне зонда точного совпадения. Он основан на модели факторного анализа, для которой апостериорный метод байесовского максимума оптимизирует параметры модели в предположении гауссовского шума измерения. Согласно тесту Affycomp [10] FARMS превзошла все другие методы обобщения в отношении чувствительности и специфичности.

Выявление значимого дифференциального выражения [ править ]

Существует множество стратегий для идентификации массивов зондов, которые показывают необычный уровень сверхэкспрессии или недостаточной экспрессии. Самый простой - назвать «значимым» любой зонд, который отличается в среднем как минимум в два раза между группами лечения. Более сложные подходы часто связаны с t-тестами или другими механизмами, которые учитывают как размер эффекта, так и изменчивость. Любопытно, что p-значения, связанные с конкретными генами, плохо воспроизводятся между повторными экспериментами, а списки, созданные прямым кратным изменением, работают намного лучше. [11] [12]Это представляет собой чрезвычайно важное наблюдение, поскольку цель проведения экспериментов связана с предсказанием общего поведения. Группа MAQC рекомендует использовать оценку кратности изменения плюс нестрогую отсечку значения p, дополнительно указывая на то, что изменения в фоновой коррекции и процессе масштабирования оказывают лишь минимальное влияние на порядок ранжирования различий кратных изменений, но существенно влияют на p-значения.

Кластеризация [ править ]

Кластеризация - это метод интеллектуального анализа данных, используемый для группировки генов со схожими паттернами экспрессии. Иерархическая кластеризация и кластеризация k-средних являются широко используемыми методами в анализе микрочипов.

Иерархическая кластеризация [ править ]

Иерархическая кластеризация - это статистический метод поиска относительно однородных кластеров. Иерархическая кластеризация состоит из двух отдельных фаз. Первоначально вычисляется матрица расстояний, содержащая все попарные расстояния между генами. Корреляции Пирсона и корреляции Спирмена часто используются в качестве оценки несходства, но и другие методы, такие как Манхэттен расстояние или евклидово расстояние, также может применяться. Учитывая количество доступных мер расстояния и их влияние на результаты алгоритма кластеризации, в нескольких исследованиях сравнивались и оценивались различные меры расстояния для кластеризации данных микрочипа с учетом их внутренних свойств и устойчивости к шуму. [13] [14] [15]После вычисления исходной матрицы расстояний алгоритм иерархической кластеризации либо (A) итеративно объединяет два ближайших кластера, начиная с отдельных точек данных (агломерационный, восходящий подход, который довольно часто используется), либо (B) итеративно разделяет кластеры. начиная с комплектации (раздельный, нисходящий подход). После каждого шага новая матрица расстояний между вновь сформированными кластерами и другими кластерами пересчитывается. К методам иерархического кластерного анализа относятся:

  • Одиночная связь (минимальный метод, ближайший сосед)
  • Средняя связь ( UPGMA ).
  • Полная связь (максимальный метод, самый дальний сосед)

Различные исследования уже эмпирически показали, что алгоритм кластеризации с одним сцеплением дает плохие результаты при использовании для данных микроматрицы экспрессии генов, и поэтому его следует избегать. [15] [16]

К-средство кластеризации [ править ]

Кластеризация K-средних - это алгоритм для группировки генов или образцов на основе шаблона в K групп. Группировка выполняется путем минимизации суммы квадратов расстояний между данными и соответствующим центроидом кластера . Таким образом, цель кластеризации K-средних - классифицировать данные на основе аналогичного выражения. [17] Алгоритм кластеризации K-средних и некоторые из его вариантов (включая k-medoids ) показали хорошие результаты для данных экспрессии генов (по крайней мере, лучше, чем методы иерархической кластеризации). В литературе можно найти эмпирические сравнения k-средних , k-медоидов , иерархических методов и различных мер расстояния. [15] [16]

Распознавание образов [ править ]

Коммерческие системы для анализа генных сетей, такие как Ingenuity [18] и Pathway studio [19], создают визуальные представления дифференциально экспрессируемых генов на основе современной научной литературы. Некоммерческие инструменты, такие как FunRich, [20] GenMAPP и Moksiskaan, также помогают в организации и визуализации данных генной сети, полученных в результате одного или нескольких экспериментов с микрочипами. Через Bioconductor, написанный на языке программирования R , доступен широкий спектр инструментов анализа микрочипов . Часто цитируемый модуль SAM и другие инструменты микроматрицы [21] доступны в Стэнфордском университете. Другой набор можно приобрести в Гарварде и Массачусетском технологическом институте.[22]

Пример вывода инструмента FunRich. Изображение показывает результат сравнения 4 разных генов.

Также были разработаны специализированные программные инструменты для статистического анализа для определения степени избыточной или недостаточной экспрессии гена в эксперименте с микрочипом относительно эталонного состояния, чтобы помочь в идентификации генов или наборов генов, связанных с конкретными фенотипами . Один из таких методов анализа, известный как анализ обогащения генетического набора (GSEA), использует статистику в стиле Колмогорова-Смирнова для идентификации групп генов, которые регулируются вместе. [23] Этот сторонний статистический пакет предлагает пользователю информацию об интересующих генах или наборах генов, включая ссылки на записи в базах данных, таких как GenBank NCBI, и тщательно подобранных базах данных, таких как Biocarta [24] иГенная онтология . Инструмент анализа обогащения белковых комплексов (COMPLEAT) обеспечивает аналогичный анализ обогащения на уровне белковых комплексов. [25] Инструмент может идентифицировать динамическую регуляцию белкового комплекса в различных условиях или временных точках. Родственная система PAINT [26] и SCOPE [27] выполняет статистический анализ промоторных областей генов, идентифицируя избыточное и недостаточное представление ранее идентифицированных элементов ответа фактора транскрипции . Другой инструмент статистического анализа - это статистика сумм рангов для коллекций наборов генов (RssGsc), которая использует функции распределения вероятностей суммы рангов для поиска наборов генов, которые объясняют экспериментальные данные. [28]Еще один подход - это контекстный метаанализ, то есть выяснение того, как кластер генов реагирует на различные экспериментальные контексты. Genevestigator - это общедоступный инструмент для выполнения контекстного метаанализа по таким контекстам, как анатомические части, стадии развития и реакция на болезни, химические вещества, стрессы и новообразования .

Анализ значимости микрочипов (SAM) [ править ]

Анализ значимости микроматриц (SAM) - это статистический метод , разработанный в 2001 году Вирджинией Тушер, Робертом Тибширани и Гилбертом Чу для определения того, являются ли изменения в экспрессии генов статистически значимыми. С появлением микрочипов ДНК теперь можно измерить экспрессию тысяч генов в одном эксперименте по гибридизации. Сгенерировано много данных, и метод сортировки того, что важно, а что нет, очень важен. SAM распространяется Стэнфордским университетом в R-пакете .

SAM идентифицирует статистически значимые гены путем проведения t-тестов для конкретных генов и вычисляет статистику d j для каждого гена j , которая измеряет силу взаимосвязи между экспрессией гена и переменной ответа. [29] [30] [31] В этом анализе используется непараметрическая статистика , поскольку данные могут не соответствовать нормальному распределению . Переменная ответа описывает и группирует данные на основе экспериментальных условий. В этом методе повторяющиеся перестановкиданных используются, чтобы определить, является ли экспрессия какого-либо гена значимой для ответа. Использование анализа на основе перестановок учитывает корреляции в генах и позволяет избежать параметрических предположений о распределении отдельных генов. Это преимущество перед другими методами (например, ANOVA и Bonferroni ), которые предполагают одинаковую дисперсию и / или независимость генов. [32]

Базовый протокол [ править ]

  • Проведите эксперименты с микрочипами - ДНК-микрочипы с праймерами олиго и кДНК, массивы SNP, массивы белков и т. Д.
  • Анализ входных выражений в Microsoft Excel - см. Ниже
  • Запуск SAM как надстройки Microsoft Excel
  • Отрегулируйте параметр настройки дельты, чтобы получить значительное количество генов вместе с приемлемой частотой ложного обнаружения (FDR) и оценить размер выборки, вычислив среднюю разницу в экспрессии в контроллере графиков SAM.
  • Перечислите дифференциально экспрессируемые гены (положительно и отрицательно экспрессируемые гены)

Запуск SAM [ править ]

  • SAM доступен для загрузки в Интернете по адресу http://www-stat.stanford.edu/~tibs/SAM/ для академических и неакадемических пользователей после завершения этапа регистрации.
  • SAM запускается как надстройка Excel, а контроллер графика SAM позволяет настраивать частоту ложного обнаружения и дельту, в то время как функции вывода SAM и вывода SAM создают список значимых генов, таблицу дельты и оценку размеров выборки.
  • Перестановки рассчитываются на основе количества образцов
  • Блокировать перестановки
    • Блоки - это партии микрочипов; например, для восьми выборок, разделенных на две группы (контрольная и затронутая), существует 4! = 24 перестановки для каждого блока, а общее количество перестановок составляет (24) (24) = 576. Рекомендуется минимум 1000 перестановок; [29] [33] [34]

количество перестановок задается пользователем при вводе правильных значений для набора данных для запуска SAM

Форматы ответов [ править ]

Типы: [29]

  • Количественный - действительный (например, частота сердечных сокращений)
  • Один класс - проверяет, отличается ли средняя экспрессия гена от нуля
  • Два класса - два набора измерений
    • Непарные - единицы измерения в двух группах разные; например, контрольная и лечебная группы с образцами от разных пациентов
    • Парные - одинаковые экспериментальные единицы измеряются в двух группах; например, образцы до и после лечения от одних и тех же пациентов
  • Мультикласс - более двух групп, каждая из которых содержит разные экспериментальные единицы; обобщение двухклассового непарного типа
  • Выживание - данные о времени до события (например, смерти или рецидива).
  • Временной ход - каждая экспериментальная единица измеряется более чем в одной временной точке; экспериментальные единицы делятся на одно- или двухклассные конструкции
  • Обнаружение паттернов - явный параметр ответа не указан; пользователь указывает собственный ген (главный компонент) данных выражения и рассматривает его как количественный ответ

Алгоритм [ править ]

SAM вычисляет тестовую статистику для относительной разницы в экспрессии генов на основе анализа перестановок данных экспрессии и вычисляет частоту ложного обнаружения. Основные расчеты программы проиллюстрированы ниже. [29] [30] [31]

Константа s o выбрана так, чтобы минимизировать коэффициент вариации d i . r i равно уровням экспрессии (x) гена i в y экспериментальных условиях.

Складчатые изменения (t) указаны для гарантии того, что гены, вызывающие существенное изменение, по крайней мере, на заранее заданную величину. Это означает, что абсолютное значение средних уровней экспрессии гена при каждом из двух условий должно быть больше кратного изменения (t), чтобы называться положительным, и меньше, чем обратное кратное изменение (t), чтобы называться отрицательным.

Алгоритм SAM можно сформулировать как:

  1. Упорядочить статистику испытаний по величине [30] [31]
  2. Для каждой перестановки вычислите упорядоченные нулевые (незатронутые) оценки [30] [31]
  3. Постройте график упорядоченной статистики теста против ожидаемых нулевых оценок [30] [31]
  4. Назовите каждый ген значимым, если абсолютное значение тестовой статистики для этого гена за вычетом средней тестовой статистики для этого гена превышает установленный порог [31]
  5. Оцените частоту ложных открытий на основе ожидаемых и наблюдаемых значений [30] [31]

Вывод [ править ]

  • Значимые наборы генов
    • Положительный набор генов - более высокая экспрессия большинства генов в наборе генов коррелирует с более высокими значениями фенотипа y
    • Отрицательный набор генов - более низкая экспрессия большинства генов в наборе генов коррелирует с более высокими значениями фенотипа y

Возможности SAM [ править ]

  • Данные из Oligo или массивов кДНК, массива SNP, массивов белков и т. Д. может использоваться в SAM [30] [31]
  • Коррелирует данные экспрессии с клиническими параметрами [32]
  • Коррелирует данные выражения со временем [29]
  • Использует перестановку данных для оценки уровня ложного обнаружения для множественного тестирования [30] [31] [32] [35]
  • Сообщает о частоте локальных ложных открытий (FDR для генов, имеющих такой же d i, что и у этого гена) [29] и частота промахов [29] [30]
  • Может работать с блокированным дизайном, когда обработки применяются в разных пакетах массивов [29]
  • Может регулировать пороговое значение, определяющее количество гена, называемого значимым [29]

Исправление ошибок и контроль качества [ править ]

Контроль качества [ править ]

Целые массивы могут иметь очевидные недостатки, обнаруживаемые визуальным осмотром, попарными сравнениями с массивами в той же экспериментальной группе или анализом деградации РНК. [36] Результаты можно улучшить, полностью исключив эти массивы из анализа.

Коррекция фона [ править ]

В зависимости от типа массива сигнал, связанный с неспецифическим связыванием флуорофора, можно вычесть для достижения лучших результатов. Один из подходов заключается в вычитании средней интенсивности сигнала в области между пятнами. Различные инструменты для коррекции фона и дальнейшего анализа доступны в TIGR, [37] Agilent ( GeneSpring ), [38] и Ocimum Bio Solutions (Genowiz). [39]

Точечная фильтрация [ править ]

Визуальная идентификация местных артефактов, таких как дефекты печати или стирки, также может предложить удаление отдельных пятен. Это может занять значительное время в зависимости от качества изготовления массива. Кроме того, некоторые процедуры требуют удаления всех пятен со значением экспрессии ниже определенного порога интенсивности.

См. Также [ править ]

  • Базы данных микрочипов
  • Анализ значимости микрочипов
  • Транскриптомика
  • Протеомика

Ссылки [ править ]

  1. ^ Д-р Леминг Ши, Национальный центр токсикологических исследований. «Проект контроля качества MicroArray (MAQC)» . Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США . Проверено 26 декабря 2007 .
  2. ^ «GenUs BioSystems - Услуги - Анализ данных» . Проверено 2 января 2008 .
  3. ^ «Agilent | ДНК-микрочипы» . Архивировано из оригинального 22 декабря 2007 года . Проверено 2 января 2008 .
  4. ^ «Библиотека LIMMA: линейные модели для данных микрочипов» . Проверено 1 января 2008 .
  5. ^ Иризарри, РА; Хоббс, Б; Коллин, Ф; Бизер-Барклай, Ю. Д.; Антонеллис, KJ; Scherf, U; Скорость, ТП (2003). «Изучение, нормализация и обобщение данных уровня зонда массива олигонуклеотидов высокой плотности» . Биостатистика . 4 (2): 249–64. DOI : 10.1093 / биостатистику / 4.2.249 . PMID 12925520 . 
  6. ^ Болстад Б.М., Irizarry RA, Астранд M, скорость TP (2003). «Сравнение методов нормализации для данных массива олигонуклеотидов высокой плотности на основе дисперсии и систематической ошибки» . Биоинформатика . 19 (2): 185–93. DOI : 10.1093 / биоинформатики / 19.2.185 . PMID 12538238 . 
  7. Перейти ↑ Giorgi FM, Bolger AM, Lohse M, Usadel B (2010). «Артефакты, управляемые алгоритмом, в срединном полированном обобщении данных Microarray» . BMC Bioinformatics . 11 : 553. DOI : 10,1186 / 1471-2105-11-553 . PMC 2998528 . PMID 21070630 .  
  8. ^ Lim WK, Ван К, Лефевр C, Califano A (2007). «Сравнительный анализ процедур нормализации микрочипов: влияние на обратную инженерию генных сетей» . Биоинформатика . 23 (13): i282–8. DOI : 10.1093 / биоинформатики / btm201 . PMID 17646307 . 
  9. ^ Hochreiter S, Clevert DA, Obermayer K (2006). «Новый метод обобщения данных уровня зонда affymetrix» . Биоинформатика . 22 (8): 943–949. DOI : 10.1093 / биоинформатики / btl033 . PMID 16473874 . 
  10. ^ «Affycomp III: эталон для мер экспрессии Affymetrix GeneChip» .
  11. ^ Ши Л., Рид Л. Х., Джонс В. Д. и др. (2006). «Проект MicroArray Quality Control (MAQC) демонстрирует межплатформенную и внутриплатформенную воспроизводимость измерений экспрессии генов» . Nat. Biotechnol . 24 (9): 1151–61. DOI : 10.1038 / nbt1239 . PMC 3272078 . PMID 16964229 .  
  12. ^ Го л, Lobenhofer Е. К., Ван С. и др. (2006). «Токсикогеномное исследование крыс показывает аналитическую согласованность на разных платформах микрочипов». Nat. Biotechnol . 24 (9): 1162–9. DOI : 10.1038 / nbt1238 . PMID 17061323 . S2CID 8192240 .  
  13. Джентльмен, Роберт; и другие. (2005). Решения для биоинформатики и вычислительной биологии с использованием R и Bioconductor . Нью-Йорк: Springer Science + Business Media. ISBN 978-0-387-29362-2.
  14. ^ Jaskowiak, Пабло А .; Кампелло, Рикардо Дж.Б. Коста, Иван Г. (2013). «Меры близости для кластеризации данных микрочипа экспрессии генов: методология проверки и сравнительный анализ». Транзакции IEEE / ACM по вычислительной биологии и биоинформатике . 10 (4): 845–857. DOI : 10,1109 / TCBB.2013.9 . PMID 24334380 . S2CID 760277 .  
  15. ^ a b c Ясковяк, Пабло А; Кампелло, Рикардо Дж.Б. Коста, Иван Г (2014). «О выборе подходящих расстояний для кластеризации данных по экспрессии генов» . BMC Bioinformatics . 15 (Дополнение 2): S2. DOI : 10.1186 / 1471-2105-15-S2-S2 . PMC 4072854 . PMID 24564555 .  
  16. ^ а б де Соуто, Марсилио CP; Коста, Иван Г .; де Араужо, Даниэль С.А.; Людермир, Тереза ​​Б .; Шлип, Александр (2008). «Кластеризация данных экспрессии гена рака: сравнительное исследование» . BMC Bioinformatics . 9 (1): 497. DOI : 10,1186 / 1471-2105-9-497 . PMC 2632677 . PMID 19038021 .  
  17. ^ http://www.biostat.ucsf.edu
  18. ^ «Системы изобретательности» . Проверено 31 декабря 2007 .
  19. ^ «Геномика Ариадны: Pathway Studio» . Архивировано из оригинала на 2007-12-30 . Проверено 31 декабря 2007 .
  20. ^ "FunRich: функциональный анализ обогащения" . Проверено 9 сентября 2014 .
  21. ^ [ «Анализ значимости микрочипов» . Проверено 31 декабря 2007 .]
  22. ^ «Программное обеспечение - Широкое» . Проверено 31 декабря 2007 .
  23. ^ Subramanian A, Tamayo P, Mootha VK и др. (2005). «Анализ обогащения набора генов: основанный на знаниях подход для интерпретации профилей экспрессии в масштабе всего генома» . Proc. Natl. Акад. Sci. США . 102 (43): 15545–50. DOI : 10.1073 / pnas.0506580102 . PMC 1239896 . PMID 16199517 .  
  24. ^ "BioCarta - Схема жизненных путей" . Проверено 31 декабря 2007 .
  25. ^ Vinayagam A, Hu Y, Kulkarni M, Roesel C и др. (2013). «Структура анализа на основе белковых комплексов для наборов данных с высокой пропускной способностью. 6, RS5 (2013)» . Sci. Сигнал . 6 (r5): RS5. DOI : 10.1126 / scisignal.2003629 . PMC 3756668 . PMID 23443684 .  
  26. ^ "DBI Web" . Архивировано из оригинала на 2007-07-05 . Проверено 31 декабря 2007 .
  27. ^ «ОБЛАСТЬ ПРИМЕНЕНИЯ» . Проверено 31 декабря 2007 .
  28. ^ "RssGsc" . Проверено 15 октября 2008 .
  29. ^ a b c d e f g h i Чу, Г., Нарасимхан, Б., Тибширани, Р., Тушер, В. "SAM" Анализ значимости микрочипов "Руководство пользователя и технический документ". [1]
  30. ^ a b c d e f g h я Zang, S .; Guo, R .; и другие. (2007). «Интеграция методов статистического вывода и новой меры контроля для повышения чувствительности и специфичности анализа данных в исследованиях профилирования экспрессии». Журнал биомедицинской информатики . 40 (5): 552–560. DOI : 10.1016 / j.jbi.2007.01.002 . PMID 17317331 . 
  31. ^ Б с д е е г ч я <Zhang, S. (2007). «Комплексная оценка SAM, R-пакета SAM и простая модификация для улучшения его характеристик». BMC Bioinformatics 8: 230.
  32. ^ а б в Тушер, В.Г. Tibshirani, R .; и другие. (2001). «Анализ значимости микрочипов применительно к отклику на ионизирующее излучение» (PDF) . Труды Национальной академии наук . 98 (9): 5116–5121. Bibcode : 2001PNAS ... 98.5116G . DOI : 10.1073 / pnas.091062498 . PMC 33173 . PMID 11309499 .   
  33. ^ Дину, ИП; JD; Мюллер, Т; Лю, Q; Adewale, AJ; Джангри, GS; Эйнеке, G; Фамульски, К.С.; Halloran, P; Ясуи, Ю. (2007). «Улучшение анализа набора генов данных микрочипов с помощью SAM-GS» . BMC Bioinformatics . 8 : 242. DOI : 10,1186 / 1471-2105-8-242 . PMC 1931607 . PMID 17612399 .  
  34. ^ Джеффри, штат Айленд; DG; Калхейн, AC. (2006). «Сравнение и оценка методов создания списков дифференциально экспрессируемых генов из данных микрочипа» . BMC Bioinformatics . 7 : 359. DOI : 10,1186 / 1471-2105-7-359 . PMC 1544358 . PMID 16872483 .  
  35. ^ Ларссон, OW C; Тиммонс, Дж. (2005). «Соображения при использовании алгоритма анализа значимости микрочипов (SAM)» . BMC Bioinformatics . 6 : 129. DOI : 10,1186 / 1471-2105-6-129 . PMC 1173086 . PMID 15921534 .  
  36. ^ Уилсон CL Миллер CJ (2005). «Simpleaffy: пакет BioConductor для контроля качества Affymetrix и анализа данных» . Биоинформатика . 21 (18): 3683–5. DOI : 10.1093 / биоинформатики / bti605 . PMID 16076888 . 
  37. ^ "Институт Дж. Крейга Вентера - Программное обеспечение" . Проверено 1 января 2008 .
  38. ^ «Agilent | GeneSpring GX» . Проверено 2 января 2008 .
  39. ^ "Ocimum Biosolutions | Genowiz" . Архивировано из оригинала на 2009-11-24 . Проверено 2 апреля 2009 .

Внешние ссылки [ править ]

  • ArrayExplorer - сравнивайте микрочипы бок о бок, чтобы найти тот, который лучше всего соответствует вашим исследовательским потребностям.
  • FARMS - факторный анализ для надежного суммирования микрочипов, пакет R - программное обеспечение
  • StatsArray - Online Microarray Analysis Services - программное обеспечение
  • ArrayMining.net - веб-приложение для онлайн-анализа данных микрочипов - программное обеспечение
  • FunRich - Выполнение анализа обогащения набора генов - программное обеспечение
  • Сравнительный анализ транскриптомики в справочном модуле наук о жизни
  • Инструкция по загрузке SAM
  • GeneChip® Expression Analysis - Основы анализа данных (от Affymetrix)
  • Герцог data_analysis_fundamentals_manual