Оценить продукт

Продукт ранга представляет собой биологически мотивированный тест для обнаружения дифференциально экспрессируемых генов в реплицируемых экспериментах с микрочипами . Это простой непараметрический статистический метод, основанный на рангах кратных изменений. Помимо использования в профилировании выражений , его можно использовать для объединения ранжированных списков в различных областях приложений, включая протеомику , метаболомику , статистический метаанализ и выбор общих характеристик .

Расчет ранга продукта [ править ]

Заполненные кружки представляют ранги одного гена в разных повторах. Произведение ранга для этого гена будет (2 × 1 × 4 × 2) ^1/4 = 2.

Учитывая n генов и k реплик, пусть ранг гена g в i -й репликации повторяется. ${\ displaystyle r_ {g, i}}$

Вычислите произведение ранга через среднее геометрическое :

{\ Displaystyle RP (г) = (\ Pi _ {я = 1} ^ {k} r_ {г, я}) ^ {1 / k}}

Определение уровней значимости [ править ]

Простая оценка на основе перестановок используется для определения того, насколько вероятно данное значение RP или лучше наблюдается в случайном эксперименте.

генерировать р перестановок из к ранговых списков длины п .
вычислить ранговые произведения n генов в p перестановках.
подсчитайте, во сколько раз ранговые продукты генов в перестановках меньше или равны наблюдаемому ранговому произведению. Установите c на это значение.
вычислить среднее ожидаемое значение продукта ранга по: . ${\ Displaystyle \ mathrm {E} _ {\ mathrm {RP}} (г) = с / р}$
рассчитать процент ложных срабатываний как: где - ранг гена g в списке всех n генов, отсортированных по возрастанию . ${\ Displaystyle \ mathrm {pfp} (g) = \ mathrm {E} _ {RP} (g) / \ mathrm {rank} (g)}$ ${\ Displaystyle \ mathrm {ранг} (г)}$ ${\ displaystyle \ mathrm {RP}}$

Точное распределение вероятностей и точное приближение [ править ]

Повторная выборка перестановок требует вычислительно затратного количества перестановок, чтобы получить надежные оценки p- значений для наиболее дифференциально экспрессируемых генов, если n велико. Eisinga, Breitling и Heskes (2013) предоставляют точное распределение вероятностей и масс для статистики рангового произведения. Вычисление точных p- значений предлагает существенное улучшение по сравнению с приближением перестановки, что наиболее важно для той части анализа произведения ранга распределения, которая наиболее интересна, т. Е. Тонкого правого хвоста. Однако для вычисления точной статистической значимости продуктов большого ранга может потребоваться неприемлемо много времени. Heskes, Eisinga и Breitling (2014) предлагают метод определения точного приблизительного значения p-значения статистики продукта ранга в вычислительно быстрой манере.

См. Также [ править ]

Ссылки [ править ]

Breitling, R., Armengaud, P., Amtmann, A. , and Herzyk, P. (2004) Rank Products: простой, но мощный новый метод обнаружения дифференциально регулируемых генов в реплицированных экспериментах на микрочипах, FEBS Letters, 573: 83 –-92
Eisinga, R .; Breitling, R .; Хескес, Т. (2013). «Точное распределение вероятностей ранжирования статистики продукта для повторяющихся экспериментов». Письма FEBS . 587 (6): 677–682. DOI : 10.1016 / j.febslet.2013.01.037 . hdl : 2066/116720 . PMID 23395607 .
Heskes, T .; Eisinga, R .; Брейтлинг, Р. (2014). «Быстрый алгоритм для определения границ и точных приблизительных значений p для статистики продукта ранга для повторных экспериментов» . BMC Bioinformatics . 15 (1): 367. DOI : 10,1186 / preaccept-1857144210135244 . PMC 4245829 . PMID 25413493 .