Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Как использовать микроматрицу для генотипирования. На видео показан процесс извлечения генотипов из образца слюны человека с помощью микроматриц. Генотипирование - это основное применение микроматриц ДНК, но с некоторыми модификациями они могут также использоваться для других целей, таких как измерение экспрессии генов и эпигенетических маркеров.

ДНК микрочипов (также известный как ДНК - чип или биочипа ) представляет собой набор микроскопических пятен ДНК , прикрепленных к твердой поверхности. Ученые используют микрочипы ДНК для измерения уровней экспрессии большого количества генов одновременно или для генотипирования нескольких участков генома. Каждое пятно ДНК содержит пикомолей (10 -12 молей ) последовательности специфической ДНК, известных как зонды (или репортер или ольи ). Это может быть коротким разрезом гена или другого элемента ДНК, которые используются для гибридизуется аОбразец кДНК или кРНК (также называемый антисмысловой РНК) (называемый мишенью ) в условиях высокой строгости. Гибридизацию зонд-мишень обычно выявляют и количественно определяют путем обнаружения мишеней, меченных флуорофором , серебром или хемилюминесценцией, для определения относительного количества последовательностей нуклеиновых кислот в мишени. Исходные массивы нуклеиновых кислот представляли собой макромассивы размером примерно 9 см × 12 см, а первый компьютерный анализ на основе изображений был опубликован в 1981 году. [1] Он был изобретен Патриком О. Брауном.. Примером его применения являются массивы SNP для полиморфизмов сердечно-сосудистых заболеваний, рака, патогенов и анализ GWAS. Также для идентификации структурных вариаций и измерения экспрессии генов.

Принцип [ править ]

Гибридизация мишени с зондом

Основным принципом микрочипов является гибридизация между двумя цепями ДНК, свойство комплементарных последовательностей нуклеиновых кислот специфически спариваться друг с другом путем образования водородных связей между комплементарными парами нуклеотидных оснований . Большое количество комплементарных пар оснований в нуклеотидной последовательности означает более плотный нековалентныйсоединение между двумя прядями. После смывания неспецифических связывающих последовательностей только сильно спаренные цепи останутся гибридизированными. Флуоресцентно меченые последовательности-мишени, которые связываются с последовательностью зонда, генерируют сигнал, который зависит от условий гибридизации (таких как температура) и отмывки после гибридизации. Общая мощность сигнала от пятна (объекта) зависит от количества целевого образца, связывающегося с зондами, присутствующими в этом пятне. Микромассивы используют относительное количественное определение, при котором интенсивность признака сравнивается с интенсивностью того же признака при различных условиях, а идентичность признака определяется по ее положению.

Шаги, необходимые в эксперименте с микрочипом

Использование и типы [ править ]

Две микросхемы Affymetrix. Матч показан в нижнем левом углу для сравнения размеров.

Существует много типов массивов, и самое широкое различие заключается в том, расположены ли они пространственно на поверхности или на кодированных шариках:

  • Традиционный твердофазный массив представляет собой набор упорядоченных микроскопических «пятен», называемых элементами, каждое из которых имеет тысячи идентичных и специфических зондов, прикрепленных к твердой поверхности, такой как стеклянный , пластиковый или силиконовый биочип (обычно известный как геномный чип , ДНК чип или генный массив ). Тысячи этих элементов могут быть размещены в известных местах на одном микрочипе ДНК.
  • Альтернативный набор шариков представляет собой набор микроскопических шариков из полистирола, каждая из которых имеет определенный зонд и соотношение двух или более красителей, которые не мешают флуоресцентным красителям, используемым в целевой последовательности.

ДНК-микрочипы могут использоваться для обнаружения ДНК (как при сравнительной геномной гибридизации ) или обнаружения РНК (чаще всего в виде кДНК после обратной транскрипции ), которая может транслироваться или не транслироваться в белки. Процесс измерения экспрессии генов с помощью кДНК называется анализом экспрессии или профилированием экспрессии .

Приложения включают:

Изготовление [ править ]

Микроматрицы могут изготавливаться разными способами, в зависимости от количества исследуемых зондов, стоимости, требований к настройке и типа задаваемого научного вопроса. Массивы от коммерческих поставщиков могут содержать всего 10 датчиков или до 5 миллионов или более датчиков микрометрового размера.

Замеченные и синтезированные на месте массивы [ править ]

Воспроизвести медиа
Робот распечатывает микрочип ДНК в Университете Делавэра.

Микроматрицы могут быть изготовлены с использованием различных технологий, включая печать остроконечными штырями на предметных стеклах, фотолитографию с использованием готовых масок, фотолитографию с использованием устройств с динамическими микрозеркалами, струйную печать [10] [11] или электрохимию на массивах микроэлектродов. .

В микрочипах с пятнами зонды представляют собой олигонуклеотиды , кДНК или небольшие фрагменты продуктов ПЦР, которые соответствуют мРНК . Зонды синтезированыперед нанесением на поверхность массива, а затем «нанесены» на стекло. Обычный подход использует набор тонких булавок или игл, которыми управляет роботизированная рука, которая погружается в лунки, содержащие ДНК-зонды, и затем помещает каждый зонд в обозначенные места на поверхности матрицы. Полученная «сетка» зондов представляет профили нуклеиновых кислот приготовленных зондов и готова для приема дополнительных кДНК или «мишеней» кРНК, полученных из экспериментальных или клинических образцов. Этот метод используется учеными-исследователями по всему миру для производства микрочипов с печатью «на дому» в их собственных лабораториях. Эти массивы можно легко настроить для каждого эксперимента, потому что исследователи могут выбирать зонды и места для печати на массивах,синтезировать зонды в своей лаборатории (или на объекте-сотрудничестве) и определить массивы. Затем они могут создавать свои собственные меченые образцы для гибридизации, гибридизировать образцы с массивом и, наконец, сканировать массивы с помощью своего собственного оборудования. Это обеспечивает относительно дешевую микроматрицу, которую можно настроить для каждого исследования, и позволяет избежать затрат на покупку часто более дорогих коммерческих наборов, которые могут представлять огромное количество генов, не представляющих интереса для исследователя. Существуют публикации, в которых указывается, что микроматрицы с пятнами собственного производства могут не обеспечивать такой же уровень чувствительности по сравнению с коммерческими наборами олигонуклеотидов.Это обеспечивает относительно дешевую микроматрицу, которую можно настроить для каждого исследования, и позволяет избежать затрат на покупку часто более дорогих коммерческих наборов, которые могут представлять огромное количество генов, не представляющих интереса для исследователя. Существуют публикации, в которых указывается, что микроматрицы с пятнами собственного производства могут не обеспечивать такой же уровень чувствительности по сравнению с коммерческими наборами олигонуклеотидов.Это обеспечивает относительно дешевую микроматрицу, которую можно настроить для каждого исследования, и позволяет избежать затрат на покупку часто более дорогих коммерческих наборов, которые могут представлять огромное количество генов, не представляющих интереса для исследователя. Существуют публикации, в которых указывается, что микроматрицы с пятнами собственного производства могут не обеспечивать такой же уровень чувствительности по сравнению с коммерческими наборами олигонуклеотидов.[12], возможно, из-за небольших размеров партий и снижения эффективности печати по сравнению с промышленным производством олигомассивов.

В олигонуклеотидных микрочипах зонды представляют собой короткие последовательности, разработанные для соответствия частям последовательности известных или предсказанных открытых рамок считывания . Хотя олигонуклеотидные зонды часто используются в «пятнистых» микрочипах, термин «олигонуклеотидная матрица» чаще всего относится к конкретной методике производства. Массивы олигонуклеотидов получают путем печати коротких олигонуклеотидных последовательностей, предназначенных для представления одного гена или семейства вариантов сплайсинга генов, путем синтеза этой последовательности непосредственно на поверхности массива вместо депонирования интактных последовательностей. Последовательности могут быть длиннее (60-мерные зонды, такие как конструкция Agilent ) или короче (25-членные зонды, произведенные Affymetrix) в зависимости от желаемой цели; более длинные зонды более специфичны для отдельных генов-мишеней, более короткие зонды могут быть обнаружены с большей плотностью по всему массиву и дешевле в производстве. Один метод, используемый для получения массивов олигонуклеотидов, включает фотолитографический синтез (Affymetrix) на подложке из диоксида кремния, где свет и светочувствительные маскирующие агенты используются для «построения» последовательности по одному нуклеотиду за раз по всему массиву. [13]Каждый применимый зонд выборочно «демаскируется» перед погружением массива в раствор одного нуклеотида, затем происходит реакция маскирования, и следующий набор зондов демаскируется для подготовки к воздействию другого нуклеотида. После многих повторений последовательности каждого зонда становятся полностью построенными. Совсем недавно технология синтеза массивов без маски от NimbleGen Systems объединила гибкость с большим количеством датчиков. [14]

Двухканальное и одноканальное обнаружение [ править ]

Схема типичного эксперимента с двухцветным микрочипом

Двухцветные микрочипы или двухканальные микроматрицы обычно гибридизуют с кДНК, полученной из двух сравниваемых образцов (например, больная ткань по сравнению со здоровой тканью), и которые метят двумя разными флуорофорами . [15] Флуоресцентные красители, обычно используемые для мечения кДНК, включают Cy 3 с длиной волны излучения флуоресценции 570 нм (что соответствует зеленой части светового спектра) и Cy5 с длиной волны флуоресцентного излучения 670 нм (соответствует красной части светового спектра). Два Су-меченые образцы кДНКа смешивают и гибридизуют к одному микрочип , который затем сканируемым в сканере микрочип для визуализации флуоресценции два флуорофоров после возбуждения с лазерным лучом с определенной длиной волны. Относительные интенсивности каждого флуорофора затем можно использовать в анализе на основе соотношений для идентификации генов с повышенной и пониженной регуляцией. [16]

Олигонуклеотидные микроматрицы часто содержат контрольные зонды, предназначенные для гибридизации со вставками РНК . Степень гибридизации между шипами и контрольными зондами используется для нормализации измерений гибридизации для целевых зондов. Хотя в редких случаях абсолютные уровни экспрессии генов могут быть определены в двухцветной матрице, относительные различия в экспрессии между разными пятнами в образце и между образцами являются предпочтительным методом анализа данных для двухцветной системы. Примеры поставщиков таких микрочипов включают Agilent с их платформой Dual-Mode, Eppendorf с их платформой DualChip для колориметрического анализа Silverquant.маркировка и TeleChem International с Arrayit .

В одноканальных микрочипах или одноцветных микрочипахмассивы предоставляют данные об интенсивности для каждого зонда или набора зондов, указывающие на относительный уровень гибридизации с меченой мишенью. Однако они не указывают на истинные уровни изобилия гена, а скорее указывают относительное изобилие по сравнению с другими образцами или условиями при обработке в том же эксперименте. Каждая молекула РНК сталкивается с протоколом и смещением, зависящим от партии, на этапах амплификации, мечения и гибридизации в эксперименте, что делает сравнение генов одного и того же микрочипа неинформативным. Сравнение двух условий для одного и того же гена требует двух отдельных гибридизаций с одним красителем. Несколько популярных одноканальных систем: Affymetrix «Gene Chip», Illumina «Bead Chip», одноканальные массивы Agilent, массивы Applied Microarrays «CodeLink» и Eppendorf «DualChip &Silverquant ». Одно из преимуществ системы с одним красителем заключается в том, что отклоняющийся образец не может повлиять на необработанные данные, полученные из других образцов, потому что каждый чип матрицы подвергается воздействию только одного образца (в отличие от двухцветной системы, в которой одна выборка низкого качества может существенно повлиять на общую точность данных, даже если другая выборка была высокого качества.) Другое преимущество состоит в том, что данные легче сравнивать с массивами из разных экспериментов, если учитываются эффекты партии.потому что каждый чип массива подвергается воздействию только одного образца (в отличие от двухцветной системы, в которой один образец низкого качества может существенно повлиять на общую точность данных, даже если другой образец был высокого качества). Еще одно преимущество состоит в том, что данные легче сравнивать с массивами из различных экспериментов, если учитывать пакетные эффекты.потому что каждый чип массива подвергается воздействию только одного образца (в отличие от двухцветной системы, в которой один образец низкого качества может существенно повлиять на общую точность данных, даже если другой образец был высокого качества). Еще одно преимущество состоит в том, что данные легче сравнивать с массивами из различных экспериментов, если учитывать пакетные эффекты.

В некоторых ситуациях одноканальная микроматрица может быть единственным выбором. Предположим, что необходимо сравнить образцы: тогда количество экспериментов, требуемых с использованием двух массивов каналов, быстро становится невозможным, если образец не используется в качестве эталона.

Типичный протокол [ править ]

Примеры уровней применения микроматриц. Внутри организмов гены транскрибируются и сплайсируются для получения зрелых транскриптов мРНК (красный). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную дц-кДНК (синий). В микрочипах ds-кДНК фрагментирована и флуоресцентно помечена (оранжевый). Меченые фрагменты связываются с упорядоченным массивом комплементарных олигонуклеотидов, и измерение интенсивности флуоресценции в массиве указывает на наличие заранее определенного набора последовательностей. Эти последовательности обычно специально выбирают, чтобы сообщить об интересующих генах в геноме организма. [17]

Это пример эксперимента с ДНК-микрочипом, который включает детали для конкретного случая, чтобы лучше объяснить эксперименты с ДНК-микрочипом, при этом перечисляя модификации для РНК или других альтернативных экспериментов.

  1. Два образца для сравнения (попарное сравнение) выращиваются / собираются. В этом примере обработанный образец ( случай ) и необработанный образец ( контроль ).
  2. Нуклеиновая кислота интереса очищает: это может быть РНК для экспрессии профилирования , ДНК для сравнительной гибридизации или ДНК / РНК связывается с конкретным белком , который иммунопреципитация ( ЧИП-на-чип ) для эпигенетических или регулирования исследований. В этом примере общая РНК выделяется (как ядерная, так и цитоплазматическая ) экстракцией гуанидиния тиоцианат-фенол-хлороформ (например, тризол ), которая выделяет большую часть РНК (тогда как колоночные методы имеют отсечку в 200 нуклеотидов) и, если все сделано правильно, имеет лучшую чистоту.
  3. Очищенную РНК анализируют на качество (с помощью капиллярного электрофореза ) и количество (например, с помощью спектрометра NanoDrop или NanoPhotometer ). Если материал приемлемого качества и присутствует в достаточном количестве (например,> 1 мкг , хотя требуемое количество зависит от платформы микроматрицы), эксперимент можно продолжить.
  4. Меченый продукт получают путем обратной транскрипции с последующей необязательной амплификацией ПЦР . РНК подвергается обратной транскрипции с помощью праймеров polyT (которые амплифицируют только мРНК ) или случайных праймеров (которые амплифицируют всю РНК, большая часть которой является рРНК ). Микроматрицы miRNA лигируют олигонуклеотид с очищенной малой РНК (выделенной с помощью фракционирующего устройства), которая затем подвергается обратной транскрипции и амплификации.
    • Метка добавляется либо на этапе обратной транскрипции, либо после амплификации, если она выполняется. Смысл маркировки зависит от микрочипов; например, если метка добавляется со смесью RT, кДНК является антисмысловой, а зонд микроматрицы является смысловым, за исключением случаев отрицательных контролей.
    • Этикетка обычно флуоресцентная ; только одна машина использует радиоактивные метки .
    • Маркировка может быть прямой (не используется) или косвенной (требуется этап связывания). Для двухканальных массивов, стадия муфты происходит до гибридизации, используя aminoallyl уридин трифосфат (УТФ-aminoallyl или aaUTP) и НГС амино-реактивных красителей (например, цианиновых красителей ); для одноканальных матриц стадия связывания происходит после гибридизации с использованием биотина и меченого стрептавидина . Модифицированные нуклеотиды ( как правило , в соотношении 1: 4 aaUTP TTP ( тимидина трифосфата )) добавляют ферментативно в низком соотношении к нормальным нуклеотидов, как правило , в результате чего 1 каждые 60 оснований. Затем aaDNA очищают на колонке.(с использованием фосфатного буферного раствора, так как Трис содержит аминогруппы). Аминоаллильная группа представляет собой аминогруппу на длинном линкере, присоединенном к азотистому основанию, который реагирует с реактивным красителем.
      • Форма репликации, известная как переворот красителя, может быть выполнена для контроля артефактов красителя в двухканальных экспериментах; для переворота красителя используется второй слайд с переставленными метками (образец, помеченный Cy3 на первом слайде, помечен Cy5, и наоборот). В этом примере аминоаллил- УТФ присутствует в смеси с обратной транскрипцией.
  5. Затем меченые образцы смешивают с запатентованным раствором для гибридизации, который может состоять из SDS , SSC , сульфата декстрана , блокирующего агента (такого как ДНК Cot-1, ДНК спермы лосося, ДНК тимуса теленка, PolyA или PolyT), раствора Денхардта , или формамин .
  6. Смесь денатурируют и добавляют в микроматрицы. Отверстия закрывают, и микроматрица гибридизируется либо в гибридной печи, где микроматрица перемешивается вращением, либо в смесителе, где микроматрица перемешивается путем переменного давления на микроматрицы.
  7. После ночной гибридизации все неспецифическое связывание смывается (SDS и SSC).
  8. Микроматрица сушится и сканируется машиной, которая использует лазер для возбуждения красителя и измеряет уровни излучения с помощью детектора.
  9. Изображение разбито на сетку с шаблоном, и интенсивность каждой функции (состоящей из нескольких пикселей) оценивается количественно.
  10. Необработанные данные нормализованы; Самый простой метод нормализации состоит в том, чтобы вычесть интенсивность фона и масштабировать таким образом, чтобы общие интенсивности признаков двух каналов были равны, или использовать интенсивность эталонного гена для вычисления значения t для всех интенсивностей. Более сложные методы включают в себя z-соотношение , регрессию лесса и лесса и RMA (надежный многокристальный анализ) для чипов Affymetrix (одноканальный, кремниевый чип, короткие олигонуклеотиды, синтезированные in situ ).

Микромассивы и биоинформатика [ править ]

Значения экспрессии генов из экспериментов с микрочипами могут быть представлены в виде тепловых карт для визуализации результата анализа данных.

Появление недорогих экспериментов с микрочипами создало несколько конкретных проблем биоинформатики: [ цитата необходима ] множественные уровни репликации в экспериментальном дизайне ( экспериментальный план ); количество платформ и независимых групп и формат данных ( Стандартизация ); статистическая обработка данных ( Анализ данных ); сопоставление каждого зонда с транскриптом мРНК, который он измеряет ( аннотация ); огромный объем данных и возможность их совместного использования ( хранилище данных ).

Экспериментальный дизайн [ править ]

Из-за биологической сложности экспрессии генов соображения дизайна эксперимента, которые обсуждаются в статье о профиле экспрессии, имеют решающее значение, если на основе данных должны быть сделаны статистически и биологически обоснованные выводы.

При разработке эксперимента с микрочипами следует учитывать три основных элемента. Во-первых, для того, чтобы сделать выводы из эксперимента, необходимо воспроизведение биологических образцов. Во-вторых, технические повторы (два образца РНК, полученные от каждой экспериментальной единицы) помогают обеспечить точность и позволяют тестировать различия в группах лечения. Биологические реплики включают независимые экстракции РНК, а технические реплики могут быть двумя аликвотами.того же экстракта. В-третьих, пятна каждого клона кДНК или олигонуклеотида присутствуют в виде реплик (по крайней мере, дубликатов) на предметном стекле микроматрицы, чтобы обеспечить меру технической точности при каждой гибридизации. Очень важно обсудить информацию о подготовке и обращении с образцом, чтобы помочь идентифицировать независимые единицы в эксперименте и избежать завышенных оценок статистической значимости . [18]

Стандартизация [ править ]

Обмен данными микрочипов затруднен из-за отсутствия стандартизации в изготовлении платформ, протоколах анализа и методах анализа. Это представляет проблему совместимости в биоинформатике . Различные низовые проекты с открытым исходным кодом пытаются упростить обмен и анализ данных, полученных с помощью непатентованных чипов:

Например, контрольный список «Минимальная информация об эксперименте с микрочипом» ( MIAME ) помогает определить уровень детализации, который должен существовать, и принимается многими журналами в качестве требования для подачи статей, включающих результаты микроматрицы. Но MIAME не описывает формат информации, поэтому, хотя многие форматы могут поддерживать требования MIAME, с 2007 года ни один формат не позволяет проверить полное семантическое соответствие. «Проект контроля качества MicroArray (MAQC)» проводится Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA) для разработки стандартов и показателей контроля качества, которые в конечном итоге позволят использовать данные MicroArray при открытии лекарств, клинической практике и принятии регулирующих решений. . [19]Общество MGED разработало стандарты для представления результатов экспериментов по экспрессии генов и соответствующих аннотаций.

Анализ данных [ править ]

Ученый Национального центра токсикологических исследований анализирует данные микрочипов

Наборы данных микрочипов обычно очень большие, и на точность анализа влияет ряд переменных. Статистические задачи включают учет эффектов фонового шума и соответствующую нормализацию данных. Методы нормализации могут подходить для конкретных платформ, а в случае коммерческих платформ анализ может быть частным. [20] Алгоритмы, влияющие на статистический анализ, включают:

  • Анализ изображения: сетка, точечное распознавание отсканированного изображения (алгоритм сегментации), удаление или маркировка некачественных и малоинтенсивных элементов (так называемая маркировка ).
  • Обработка данных: вычитание фона (на основе глобального или локального фона), определение интенсивности пятен и соотношений интенсивностей, визуализация данных (например, см. График МА ) и логарифмическое преобразование соотношений, глобальная или локальная нормализация соотношений интенсивностей и сегментация в различные области количества копий с использованием алгоритмов обнаружения шагов . [21]
  • Анализ обнаружения классов: этот аналитический подход, иногда называемый классификацией без учителя или обнаружением знаний, пытается определить, объединяются ли микромассивы (объекты, пациенты, мыши и т. Д.) Или гены в группы. Выявление естественно существующих групп объектов (микрочипов или генов), которые объединяются в кластеры, может позволить обнаруживать новые группы, о существовании которых раньше не было известно. Во время анализа открытия знаний можно использовать различные методы неконтролируемой классификации с данными микрочипов ДНК для идентификации новых кластеров (классов) массивов. [22]Этот тип подхода не основан на гипотезах, а основан на итеративном распознавании образов или методах статистического обучения для нахождения «оптимального» количества кластеров в данных. Примеры методов неконтролируемого анализа включают самоорганизующиеся карты, нейронный газ, кластерный анализ k-средних, [23] иерархический кластерный анализ, кластеризацию на основе геномной обработки сигналов [24] и кластерный анализ на основе моделей. Для некоторых из этих методов пользователь также должен определить меру расстояния между парами объектов. Хотя обычно используется коэффициент корреляции Пирсона, в литературе было предложено и оценено несколько других показателей. [25]Входные данные, используемые в анализе обнаружения классов, обычно основаны на списках генов, имеющих высокую информативность (низкий уровень шума) на основе низких значений коэффициента вариации или высоких значений энтропии Шеннона и т. Д. Определение наиболее вероятного или оптимального количества генов. кластеры, полученные в результате неконтролируемого анализа, называются валидностью кластера. Некоторыми обычно используемыми показателями валидности кластера являются индекс силуэта, индекс Дэвиса-Болдина, [26] индекс Данна или статистика Хьюберта .
  • Анализ предсказания класса: этот подход, называемый контролируемой классификацией, устанавливает основу для разработки модели предсказания, в которую могут быть введены будущие неизвестные тестовые объекты, чтобы предсказать наиболее вероятную принадлежность тестовых объектов к классу. Контролируемый анализ [22] для прогнозирования класса включает использование таких методов, как линейная регрессия, k-ближайший сосед, квантование вектора обучения, анализ дерева решений, случайные леса, наивный байесовский метод, логистическая регрессия, регрессия ядра, искусственные нейронные сети, машины опорных векторов, смесь экспертов и контролируемого нервного газа. Кроме того, используются различные метаэвристические методы, такие как генетические алгоритмы , самоадаптация ковариационной матрицы, оптимизация роя частиц., и оптимизация колонии муравьев . Входные данные для предсказания класса обычно основаны на отфильтрованных списках генов, которые предсказывают класс, определенных с помощью классических тестов гипотез (следующий раздел), индекса разнообразия Джини или увеличения информации (энтропия).
  • Статистический анализ, основанный на гипотезах: идентификация статистически значимых изменений в экспрессии генов обычно определяется с помощью t-критерия , ANOVA , байесовского метода [27]. Методы теста Манна – Уитни, адаптированные к наборам данных микрочипов, которые учитывают множественные сравнения [28] или кластерный анализ . [29] Эти методы оценивают статистическую мощность на основе вариаций, присутствующих в данных, и количества экспериментальных повторов, и могут помочь минимизировать ошибки типа I и типа II в анализах. [30]
  • Уменьшение размерности: аналитики часто сокращают количество измерений (генов) перед анализом данных. [22] Это может включать линейные подходы, такие как анализ главных компонентов (PCA) или нелинейное обучение многообразию (дистанционное метрическое обучение) с использованием ядра PCA, диффузионных карт, лапласовских собственных карт, локального линейного вложения, локально сохраняющих проекций и отображения Сэммона.
  • Сетевые методы: статистические методы, которые учитывают основную структуру генных сетей, представляя либо ассоциативные, либо причинные взаимодействия или зависимости между генными продуктами. [31] Взвешенный сетевой анализ коэкспрессии генов широко используется для идентификации модулей коэкспрессии и внутримодульных узловых генов. Модули могут соответствовать типам клеток или путям. Высокосвязные внутримодульные концентраторы лучше всего представляют соответствующие модули.

Данные микрочипа могут потребовать дальнейшей обработки, направленной на уменьшение размерности данных, чтобы облегчить понимание и более сфокусированный анализ. [32] Другие методы позволяют анализировать данные, состоящие из небольшого количества биологических или технических реплик ; например, тест с локальной объединенной ошибкой (LPE) объединяет стандартные отклонения генов с аналогичными уровнями экспрессии в попытке компенсировать недостаточную репликацию. [33]

Аннотация [ править ]

Связь между зондом и мРНК, которую он должен обнаруживать, нетривиальна. [34] Некоторые мРНК могут перекрестно гибридизовать зонды в массиве, которые, как предполагается, обнаруживают другую мРНК. Кроме того, мРНК могут испытывать систематическую ошибку амплификации, которая зависит от последовательности или молекулы. В-третьих, зонды, разработанные для обнаружения мРНК определенного гена, могут полагаться на геномную информацию EST, которая неправильно связана с этим геном.

Хранилище данных [ править ]

Было обнаружено, что данные микромассивов более полезны по сравнению с другими подобными наборами данных. Огромный объем данных, специализированные форматы (такие как MIAME ) и усилия по курированию, связанные с наборами данных, требуют специализированных баз данных для хранения данных. Ряд решений для хранилищ данных с открытым исходным кодом, таких как InterMine и BioMart , был создан для конкретной цели интеграции различных наборов биологических данных, а также для поддержки анализа.

Альтернативные технологии [ править ]

Достижения в области массового параллельного секвенирования привели к развитию технологии RNA-Seq , которая позволяет использовать метод дробовика всего транскриптома для характеристики и количественной оценки экспрессии генов. [35] [36] В отличие от микрочипов, которые требуют наличия эталонного генома и транскриптома до создания самого микроматрицы, RNA-Seq также может использоваться для новых модельных организмов, геном которых еще не секвенирован. [36]

Глоссарий [ править ]

  • Массив или слайд представляет собой набор функций , пространственно расположенных в виде двумерной сетки, расположенных в столбцах и строках.
  • Блок или подмассив : группа пятен, обычно сделанных за один раунд печати; несколько подмассивов / блоков образуют массив.
  • Случай / контроль : парадигма экспериментального дизайна, особенно подходящая для системы двухцветной матрицы, в которой состояние, выбранное в качестве контроля (например, здоровая ткань или состояние), сравнивается с измененным состоянием (например, пораженной тканью или состоянием).
  • Канал :выходной сигнал флуоресценции, регистрируемый сканером для отдельного флуорофора, может быть даже ультрафиолетовым.
  • Переворот красителя или замена красителя или обращение флюора : взаимное мечение ДНК-мишеней двумя красителями для учета смещения красителя в экспериментах.
  • Сканер : инструмент, используемый для обнаружения и количественной оценки интенсивности флуоресценции пятен на предметном стекле микроматрицы путем выборочного возбуждения флуорофоров лазером и измерения флуоресценции с помощью системы фотоумножителей с фильтром (оптика) .
  • Пятно или особенность : небольшая область на слайде с массивом, содержащая пикомоли определенных образцов ДНК.
  • Для других соответствующих терминов см .:
    • Глоссарий терминов по экспрессии генов
    • Протокол (естественные науки)

См. Также [ править ]

  • Технологии транскриптомики
    • Серийный анализ экспрессии генов
    • РНК-Seq
  • ВОЛШЕБСТВО
  • Методы анализа микрочипов
  • Базы данных микрочипов
  • Цианиновые красители, такие как Cy3 и Cy5, обычно представляют собой флуорофоры с микрочипами.
  • Анализ генного чипа
  • Анализ значимости микрочипов
  • Микромассив олигонуклеотидов, специфичных для метилирования
  • Микрофлюидика или лаборатория на кристалле
  • Патогеномика
  • Фенотип микрочип
  • Системная биология
  • Секвенирование всего генома

Ссылки [ править ]

  1. ^ Тауб, Флойд (1983). «Лабораторные методы: последовательные сравнительные гибридизации, проанализированные с помощью компьютерной обработки изображений, могут идентифицировать и количественно определять регулируемые РНК». ДНК . 2 (4): 309–327. DOI : 10.1089 / dna.1983.2.309 . PMID  6198132 .
  2. ^ Адомас А; Heller G; Олсон А; Осборн Дж; Karlsson M; Нахалкова Ж; Van Zyl L; Sederoff R; Стенлид J; Finlay R; Asiegbu FO (2008). «Сравнительный анализ обилия транскриптов у Pinus sylvestris после заражения сапротрофным, патогенным или мутуалистическим грибком» . Tree Physiol . 28 (6): 885–897. DOI : 10.1093 / treephys / 28.6.885 . PMID 18381269 . 
  3. ^ Поллак младший; Perou CM; Ализаде А.А.; Эйзен МБ; Пергаменщиков А; Уильямс CF; Джеффри СС; Botstein D; Браун ПО (1999). «Полногеномный анализ изменений числа копий ДНК с использованием микрочипов кДНК». Нат Жене . 23 (1): 41–46. DOI : 10.1038 / 12640 . PMID 10471496 . S2CID 997032 .  
  4. ^ Моран G; Стокса C; Thewes S; Hube B; Коулман, округ Колумбия; Салливан Д. (2004). «Сравнительная геномика с использованием микромассивов ДНК Candida albicans выявляет отсутствие и дивергенцию генов, связанных с вирулентностью, у Candida dubliniensis» . Микробиология . 150 (Pt 10): 3363–3382. DOI : 10.1099 / mic.0.27221-0 . PMID 15470115 . 
  5. ^ Hacia JG; Fan JB; Райдер О; Джин Л; Edgemon K; Ghandour G; Майер Р.А.; Вс Б; Hsie L; Роббинс СМ; Brody LC; Ван Д; Lander ES; Lipshutz R; Fodor SP; Коллинз Ф.С. (1999). «Определение предковых аллелей однонуклеотидных полиморфизмов человека с использованием массивов олигонуклеотидов высокой плотности». Нат Жене . 22 (2): 164–167. DOI : 10,1038 / 9674 . PMID 10369258 . S2CID 41718227 .  
  6. ^ a b c Gagna, Claude E .; Ламберт, В. Кларк (1 мая 2009 г.). «Новые многоцепочечные, альтернативные, плазмидные и спиральные переходные ДНК и микромассивы РНК: значение для терапии». Фармакогеномика . 10 (5): 895–914. DOI : 10,2217 / pgs.09.27 . ISSN 1744-8042 . PMID 19450135 .  
  7. ^ a b c Gagna, Claude E .; Кларк Ламберт, W. (1 марта 2007 г.). «Клеточная биология, хемогеномика и хемопротеомика - приложение к открытию лекарств». Мнение эксперта об открытии лекарств . 2 (3): 381–401. DOI : 10.1517 / 17460441.2.3.381 . ISSN 1746-0441 . PMID 23484648 . S2CID 41959328 .   
  8. ^ Мукерджи, Анирбан; Васкес, Карен М. (1 августа 2011 г.). «Триплекс-технология в исследованиях повреждений ДНК, репарации ДНК и мутагенеза» . Биохимия . 93 (8): 1197–1208. DOI : 10.1016 / j.biochi.2011.04.001 . ISSN 1638-6183 . PMC 3545518 . PMID 21501652 .   
  9. ^ Родос, Даниэла; Липпс, Ханс Дж. (15 октября 2015 г.). «G-квадруплексы и их регуляторные роли в биологии» . Исследования нуклеиновых кислот . 43 (18): 8627–8637. DOI : 10.1093 / NAR / gkv862 . ISSN 1362-4962 . PMC 4605312 . PMID 26350216 .   
  10. ^ Методы J Biochem Biophys. 2000 16 марта; 42 (3): 105-10. ДНК-печать: использование стандартного струйного принтера для переноса нуклеиновых кислот на твердые носители. Goldmann T, Gonzalez JS.
  11. ^ Lausted C; и другие. (2004). «POSaM: быстрый, гибкий струйный синтезатор олигонуклеотидов и микроматрица с открытым исходным кодом» . Геномная биология . 5 (8): R58. DOI : 10.1186 / GB-2004-5-8-R58 . PMC 507883 . PMID 15287980 .  
  12. ^ Бэммлер Т, Бейер РП; Консорциум, члены Toxicogenomics Research; Керр, X; Цзин, LX; Лапидус, S; Ласарев Д.А.; Paules, RS; Li, JL; Филлипс, СО (2005). «Стандартизация глобального анализа экспрессии генов между лабораториями и на разных платформах». Нат методы . 2 (5): 351–356. DOI : 10.1038 / nmeth754 . PMID 15846362 . S2CID 195368323 .  
  13. ^ Pease AC; Solas D; Салливан Э.Дж.; Cronin MT; Холмс С.П.; Фодор С.П. (1994). «Световые олигонуклеотидные массивы для быстрого анализа последовательности ДНК» . PNAS . 91 (11): 5022–5026. Bibcode : 1994PNAS ... 91.5022P . DOI : 10.1073 / pnas.91.11.5022 . PMC 43922 . PMID 8197176 .  
  14. ^ Nuwaysir EF; Хуанг В; Альберт TJ; Сингх Дж; Nuwaysir K; Pitas A; Ричмонд Т; Горский Т; Berg JP; Ballin J; McCormick M; Norton J; Pollock T; Sumwalt T; Мясник L; Портер D; Molla M; Зал C; Блаттнер Ф; Sussman MR; Уоллес Р.Л .; Cerrina F; Зеленый РД (2002). «Анализ экспрессии генов с использованием массивов олигонуклеотидов, полученных с помощью фотолитографии без маски» . Genome Res . 12 (11): 1749–1755. DOI : 10.1101 / gr.362402 . PMC 187555 . PMID 12421762 .  
  15. ^ Shalon D; Smith SJ; Браун ПО (1996). «Система микрочипов ДНК для анализа сложных образцов ДНК с использованием гибридизации двухцветных флуоресцентных зондов» . Genome Res . 6 (7): 639–645. DOI : 10.1101 / gr.6.7.639 . PMID 8796352 . 
  16. ^ Тан Т; François N; Glatigny A; Agier N; Mucchielli MH; Aggerbeck L; Делакруа H (2007). «Оценка коэффициента экспрессии в экспериментах с двухцветным микрочипом значительно улучшена за счет исправления несовпадения изображений» . Биоинформатика . 23 (20): 2686–2691. DOI : 10.1093 / биоинформатики / btm399 . PMID 17698492 . 
  17. ^ Шафи, Томас; Лоу, Рохан (2017). «Структура эукариотических и прокариотических генов» . WikiJournal of Medicine . 4 (1). DOI : 10.15347 / wjm / 2017.002 . ISSN 2002-4436 . 
  18. ^ Черчилль, Джорджия (2002). «Основы экспериментального дизайна для микрочипов кДНК» (PDF) . Генетика природы . добавка. 32 : 490–5. DOI : 10.1038 / ng1031 . PMID 12454643 . S2CID 15412245 . Архивировано из оригинала (- Научный поиск ) 8 мая 2005 года . Проверено 12 декабря 2013 года .   
  19. ^ Центр NCTR по токсикоинформатике - Проект MAQC
  20. ^ "Просигна | Алгоритм просигна" . prosigna.com . Проверено 22 июня 2017 года .
  21. ^ Литтл, Массачусетс; Джонс, Н.С. (2011). "Обобщенные методы и решатели для кусочно-постоянных сигналов: Часть I" (PDF) . Труды Королевского общества А . 467 (2135): 3088–3114. DOI : 10,1098 / rspa.2010.0671 . PMC 3191861 . PMID 22003312 .   
  22. ^ a b c Петерсон, Лейф Э. (2013). Классификационный анализ ДНК-микрочипов . Джон Вили и сыновья. ISBN 978-0-470-17081-6.
  23. ^ De Souto M et al. (2008) Кластеризация данных экспрессии гена рака: сравнительное исследование, BMC Bioinformatics, 9 (497).
  24. ^ Istepanian R, Sungoor A, Nebel JC (2011) Сравнительный анализ обработки геномных сигналов для кластеризации данных микрочипов, IEEE Transactions on NanoBioscience, 10 (4): 225-238.
  25. ^ Ясковяк, Пабло А; Кампелло, Рикардо Дж.Б. Коста, Иван Г (2014). «О выборе подходящих расстояний для кластеризации данных по экспрессии генов» . BMC Bioinformatics . 15 (Дополнение 2): S2. DOI : 10.1186 / 1471-2105-15-S2-S2 . PMC 4072854 . PMID 24564555 .  
  26. ^ Большакова Н., Азуайе Ф (2003) Методы кластерной проверки данных экспрессии генома, Обработка сигналов, Vol. 83. С. 825–833.
  27. ^ Бен Гал, I .; Шани, А .; Gohr, A .; Grau, J .; Арвив, С .; Шмилович, А .; Пощ, С .; Гроссе, И. (2005). «Идентификация сайтов связывания факторов транскрипции с байесовскими сетями переменного порядка» . Биоинформатика . 21 (11): 2657–2666. DOI : 10.1093 / биоинформатики / bti410 . ISSN 1367-4803 . PMID 15797905 .  
  28. ^ Юк Фай Леунг и Дуччио Кавальери, Основы анализа данных микрочипов кДНК. Тенденции в генетике, том 19, № 11, ноябрь 2003 г.
  29. ^ Priness I .; Маймон О .; Бен-Гал И. (2007). «Оценка кластеризации экспрессии генов с помощью меры расстояния взаимной информации» . BMC Bioinformatics . 8 (1): 111. DOI : 10,1186 / 1471-2105-8-111 . PMC 1858704 . PMID 17397530 .  
  30. ^ Wei C; Ли Дж; Бумгарнер RE (2004). «Размер выборки для обнаружения дифференциально экспрессируемых генов в экспериментах с микрочипами» . BMC Genomics . 5 : 87. DOI : 10.1186 / 1471-2164-5-87 . PMC 533874 . PMID 15533245 .  
  31. ^ Эммерт-Streib, F. & Dehmer, M. (2008). Анализ данных микрочипов Сетевой подход . Wiley-VCH. ISBN 978-3-527-31822-3.
  32. ^ Воутерс L; Gõhlmann HW; Bijnens L; Касс СУ; Molenberghs G; Леви П.Дж. (2003). «Графическое исследование данных экспрессии генов: сравнительное исследование трех многомерных методов». Биометрия . 59 (4): 1131–1139. CiteSeerX 10.1.1.730.3670 . DOI : 10.1111 / j.0006-341X.2003.00130.x . PMID 14969494 .  
  33. ^ Jain N; Thatte J; Braciale T; Ley K; О'Коннелл М; Ли Дж. К. (2003). «Тест локальной совокупной ошибки для идентификации дифференциально экспрессируемых генов с небольшим количеством реплицированных микрочипов» . Биоинформатика . 19 (15): 1945–1951. DOI : 10.1093 / биоинформатики / btg264 . PMID 14555628 . 
  34. ^ Барбоса-Мораис, Нидерланды; Даннинг, MJ; Самараджива, SA; Darot, JFJ; Ричи, Мэн; Линч, АГ; Таваре, С. (18 ноября 2009 г.). «Конвейер повторного аннотирования для Illumina BeadArrays: улучшение интерпретации данных экспрессии генов» . Исследования нуклеиновых кислот . 38 (3): e17. DOI : 10.1093 / NAR / gkp942 . PMC 2817484 . PMID 19923232 .  
  35. ^ Мортазави, Али; Брайан А. Уильямс; Кеннет МакКью; Лориан Шеффер; Барбара Уолд (июль 2008 г.). «Картирование и количественная оценка транскриптомов млекопитающих с помощью RNA-Seq». Нат методы . 5 (7): 621–628. DOI : 10.1038 / nmeth.1226 . ISSN 1548-7091 . PMID 18516045 . S2CID 205418589 .   
  36. ^ а б Ван, Чжун; Марк Герштейн; Майкл Снайдер (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики» . Nat Rev Genet . 10 (1): 57–63. DOI : 10.1038 / nrg2484 . ISSN 1471-0056 . PMC 2949280 . PMID 19015660 .   

Внешние ссылки [ править ]

  • Экспрессия гена в Керли
  • Микромасштабные продукты и услуги для биохимии и молекулярной биологии в Curlie
  • Продукты и услуги для экспрессии генов в Curlie
  • Онлайн-сервисы для анализа экспрессии генов в Curlie
  • Микроматрица Анимация 1Lec.com
  • PLoS Biology Primer: анализ микроматриц
  • Завершение технологии микрочипов
  • ArrayMining.net  - бесплатный веб-сервер для онлайн-анализа микрочипов
  • Микроматрица - как это работает?
  • Комментарий PNAS: открытие принципов природы на основе математического моделирования данных микрочипов ДНК
  • Виртуальный эксперимент с ДНК-микрочипом