В статистике график вулкана - это тип диаграммы рассеяния, который используется для быстрого выявления изменений в больших наборах данных, состоящих из повторяющихся данных. [1] Он отображает значимость в зависимости от кратности изменения по осям y и x соответственно. Эти графики все чаще встречаются в атомных экспериментах, таких как геномика , протеомика и метаболомика, где часто есть список из многих тысяч реплицируемых точек данных между двумя условиями, и кто-то хочет быстро идентифицировать наиболее значимые изменения. График вулкана объединяет меру статистической значимости из статистического теста (например, значение p из ANOVAмодель) с величиной изменения, что позволяет быстро визуально идентифицировать те точки данных (гены и т. д.), которые отображают большие изменения величины, которые также являются статистически значимыми .
График вулкана строится путем нанесения отрицательного логарифма значения p по оси y (обычно по основанию 10). Это приводит к появлению точек данных с низкими значениями p (очень значимыми) в верхней части графика. Ось й представляет собой логарифм кратного изменения между этими двумя условиями. Журнал изменения складки используется таким образом, чтобы изменения в обоих направлениях казались равноудаленными от центра. Построение точек таким образом приводит к появлению двух областей интереса на графике: тех точек, которые находятся в верхней части графика, которые находятся далеко от левой или правой стороны. Они представляют значения, которые отображают большие кратные изменения величины (следовательно, находятся слева или справа от центра), а также имеют высокую статистическую значимость (следовательно, находятся в верхней части).
Дополнительная информация может быть добавлена путем раскрашивания точек в соответствии с третьим измерением данных (например, интенсивностью сигнала), но это не используется повсеместно. Графики вулканов также используются для графического отображения анализа значимости критерия отбора генов микрочипов (SAM), примера регуляризации . [2]
Концепция графика вулкана может быть обобщена для других приложений, где ось x связана с мерой силы статистического сигнала, а ось y связана с мерой статистической значимости сигнала. Например, в исследовании генетической ассоциации случай-контроль , таком как исследование ассоциации на уровне всего генома , точка на графике вулкана представляет собой однонуклеотидный полиморфизм . Его значение x может быть отношением шансов, а его значение y может быть -log10 значения p из теста хи-квадрат или статистики теста хи-квадрат . [3]
Графики вулканов показывают характерную форму двух рукавов вверх, потому что ось x, то есть лежащие в основе логарифмически кратные изменения, обычно являются нормальным распределением, тогда как ось y, значения log-p, имеют тенденцию к большей значимости для складчатых изменений, которые более сильно отклоняются от нуль. Плотность нормального распределения принимает вид
- .
Итак из этого
и отрицательный является
которая представляет собой параболу, руки которой тянутся вверх с левой и правой стороны. Верхняя граница данных - одна парабола, а нижняя граница - другая парабола.
Рекомендации
- ^ Cui, X .; Черчилль, Джорджия (2003). «Статистические тесты для дифференциальной экспрессии в экспериментах с микрочипами кДНК» . Геномная биология . 4 (4): 210. DOI : 10,1186 / GB-2003-4-4-210 . PMC 154570 . PMID 12702200 .
- ^ Ли, В. (2012). «Графики вулканов в анализе дифференциальных выражений с помощью микромассивов мРНК». Журнал биоинформатики и компьютерной биологии . 10 (6): 1231003. arXiv : 1103.3434 . DOI : 10.1142 / S0219720012310038 . PMID 23075208 .
- ^ Li, W .; Freudenberg, J .; Suh, YJ; Ян, Ю. (2014). «Использование графиков вулканов и регуляризованной статистики ци в исследованиях генетических ассоциаций». Вычислительная биология и химия . 48 : 77–83. arXiv : 1308,6245 . DOI : 10.1016 / j.compbiolchem.2013.02.003 . PMID 23602812 . S2CID 12399345 .
Внешние ссылки
- Документация NCI с описанием статистических методов анализа микромассивов, включая графики вулканов
- Описание графиков вулканов в MathWorks