Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Графическое резюме метаанализа более 1000 случаев диффузной внутренней глиомы моста и других педиатрических глиом, в котором информация об участвующих мутациях, а также об общих исходах была извлечена из основной первичной литературы .

Мета-анализ представляет собой статистический анализ , который сочетает в себе результаты нескольких научных исследований . Мета-анализ может быть выполнен, когда есть несколько научных исследований, посвященных одному и тому же вопросу, причем каждое отдельное исследование сообщает об измерениях, которые, как ожидается, будут иметь некоторую степень ошибки. Затем цель состоит в том, чтобы использовать статистические подходы для получения объединенной оценки, наиболее близкой к неизвестной общей истине, на основе того, как воспринимается эта ошибка.

Существующие методы метаанализа позволяют получить средневзвешенное значение по результатам отдельных исследований, и отличается способ распределения этих весов, а также способ вычисления неопределенности вокруг полученной точечной оценки. Помимо оценки неизвестной общепринятой истины, метаанализ может сопоставить результаты различных исследований и выявить закономерности среди результатов исследований, источники разногласий между этими результатами или другие интересные взаимосвязи, которые могут выявиться в контексте. нескольких исследований. [1]

Ключевым преимуществом этого подхода является агрегирование информации, приводящее к более высокой статистической мощности и более надежной точечной оценке, чем это возможно с помощью меры, полученной из любого отдельного исследования. Однако при выполнении метаанализа исследователь должен делать выбор, который может повлиять на результаты, включая решение о том, как искать исследования, выбирать исследования на основе набора объективных критериев, работать с неполными данными, анализировать данные и учитывать или решив не учитывать предвзятость публикации . [2]Вызовы суждения, сделанные при завершении метаанализа, могут повлиять на результаты. Например, Ванус и его коллеги изучили четыре пары метаанализа по четырем темам: (а) соотношение производительности труда и удовлетворенности, (б) реалистичные предварительные просмотры вакансий, (в) корреляты ролевого конфликта и двусмысленности, и (г) работа. отношения удовлетворенности и прогулов, и проиллюстрировал, как различные суждения, сделанные исследователями, дали разные результаты. [3]

Метаанализ часто, но не всегда, является важным компонентом процедуры систематического обзора . Например, метаанализ может быть проведен по нескольким клиническим испытаниям лечения, чтобы лучше понять, насколько хорошо лечение работает. Здесь удобно следовать терминологии , используемой Кокрановской , [4] и использование «мета-анализ» , чтобы обратиться к статистическим методам объединения доказательств, оставляя другие аспекты « исследований синтеза » или «доказательств синтеза», такие как объединение информация из качественных исследований для более общего контекста систематических обзоров. Метаанализ - вторичный источник . [5] [6]

История [ править ]

Исторические корни метаанализа можно проследить до исследований астрономии 17 века [7], в то время как статья, опубликованная в 1904 году статистиком Карлом Пирсоном в British Medical Journal [8], в которой собраны данные нескольких исследований прививок брюшного тифа, является рассматривается как первый раз, когда метааналитический подход был использован для агрегирования результатов нескольких клинических исследований. [9] [10] Первый метаанализ всех концептуально идентичных экспериментов, касающихся конкретной исследовательской проблемы, и проведенный независимыми исследователями, был идентифицирован как публикация 1940 года « Экстрасенсорное восприятие после шестидесяти лет» , автором которой являются психологи Университета Дьюка.JG Pratt , JB Rhine и соавторы. [11] Это включало обзор 145 отчетов об экспериментах ESP, опубликованных с 1882 по 1939 год, и включал оценку влияния неопубликованных статей на общий эффект ( проблема с файловым ящиком ). Хотя сегодня метаанализ широко используется в эпидемиологии и доказательной медицине , метаанализ лечения не публиковался до 1955 года. В 1970-х годах в образовательные исследования были внедрены более сложные аналитические методы , начиная с работы Джина. В. Гласс , Фрэнк Л. Шмидт и Джон Э. Хантер.

Термин «мета-анализ» был придуман в 1976 году статистиком Gene В. стекла , [12] , который заявил , «мой главный интерес в настоящее время в том, что мы привыкли называть ... мета-анализ исследований. Термин немного грандиозно, но точно и уместно ... Метаанализ относится к анализу анализов » . Хотя это привело к тому, что он получил широкое признание как современный основатель метода, методология, лежащая в основе того, что он назвал «метаанализом», предшествует его работе на несколько десятилетий. [13] [14] Статистическая теория метаанализа была значительно продвинута в работах Намбери С. Раджу , Ларри В. Хеджеса , Харриса Купера, Ингрэма Олкина ,Джон Э. Хантер , Джейкоб Коэн , Томас Чалмерс , Роберт Розенталь , Фрэнк Л. Шмидт и Дуглас Г. Бонетт.

Шаги в метаанализе [ править ]

Метаанализу обычно предшествует систематический обзор, так как это позволяет идентифицировать и критически оценить все соответствующие доказательства (тем самым ограничивая риск систематической ошибки в итоговых оценках). Общие шаги заключаются в следующем:

  1. Формулировка вопроса исследования, например, с использованием модели PICO (популяция, вмешательство, сравнение, результат).
  2. Поиск литературы
  3. Выбор исследований («критерии включения»)
    1. На основе критериев качества, например, требования рандомизации и ослепления в клиническом исследовании.
    2. Выбор конкретных исследований по четко определенной теме, например, по лечению рака груди.
    3. Решите, будут ли включены неопубликованные исследования, чтобы избежать предвзятости публикации ( проблема с файловым ящиком )
  4. Решите, какие зависимые переменные или сводные меры разрешены Например, при рассмотрении метаанализа опубликованных (агрегированных) данных:
    • Различия (дискретные данные)
    • Средства (непрерывные данные)
    • G хеджирования - это популярная сводная мера для непрерывных данных, которая стандартизирована для устранения различий в масштабах, но включает индекс вариации между группами:
      1. где - среднее значение обработки, - среднее значение контроля, объединенная дисперсия.
  5. Выбор модели метаанализа, например метаанализа фиксированных или случайных эффектов.
  6. Изучите источники неоднородности между исследованиями , например, используя анализ подгрупп или мета-регрессию .

Официальное руководство по проведению метаанализов и отчетности по ним содержится в Кокрановском справочнике .

Инструкции по отчетности см . В заявлении о предпочтительных элементах отчетности для систематических обзоров и метаанализов (PRISMA). [15]

Методы и предположения [ править ]

Подходы [ править ]

В общем, при выполнении метаанализа можно выделить два типа свидетельств: данные отдельных участников (IPD) и агрегированные данные (AD). Сводные данные могут быть прямыми или косвенными.

AD более широко доступен (например, из литературы) и обычно представляет собой сводные оценки, такие как отношения шансов или относительные риски. Это можно напрямую синтезировать в концептуально схожих исследованиях с использованием нескольких подходов (см. Ниже). С другой стороны, косвенные совокупные данные измеряют эффект двух видов лечения, каждое из которых сравнивалось с аналогичной контрольной группой в метаанализе. Например, если лечение A и лечение B напрямую сравнивались с плацебо в отдельных метаанализах, мы можем использовать эти два объединенных результата, чтобы получить оценку эффектов A и B в косвенном сравнении как эффект A против плацебо минус эффект B. против плацебо.

Доказательства IPD представляют собой необработанные данные, собранные исследовательскими центрами. Это различие вызвало необходимость в различных метааналитических методах, когда требуется синтез доказательств, и привело к развитию одноэтапных и двухэтапных методов. [16]В одноэтапных методах IPD из всех исследований моделируются одновременно с учетом кластеризации участников в рамках исследований. Двухэтапные методы сначала вычисляют сводную статистику для AD из каждого исследования, а затем вычисляют общую статистику как средневзвешенное значение статистики исследования. За счет сокращения IPD до AD двухэтапные методы также могут применяться, когда IPD доступен; это делает их привлекательным выбором при выполнении метаанализа. Хотя обычно считается, что одноэтапные и двухэтапные методы дают схожие результаты, недавние исследования показали, что иногда они могут приводить к разным выводам. [17] [18]

Статистические модели для агрегированных данных [ править ]

Прямые доказательства: модели, учитывающие только эффекты исследования [ править ]

Модель с фиксированными эффектами [ править ]

Модель с фиксированным эффектом обеспечивает средневзвешенное значение ряда оценок исследования. В качестве веса исследования обычно используется величина, обратная дисперсии оценок, поэтому более крупные исследования, как правило, вносят больший вклад в средневзвешенное значение, чем более мелкие исследования. Следовательно, когда в исследованиях в рамках метаанализа преобладает очень большое исследование, результаты небольших исследований практически игнорируются. [19] Наиболее важно то, что модель фиксированных эффектов предполагает, что все включенные исследования исследуют одну и ту же популяцию, используют одни и те же переменные и определения результатов и т. Д. Это предположение обычно нереалистично, поскольку исследования часто подвержены нескольким источникам неоднородности ; например, эффекты лечения могут различаться в зависимости от места действия, уровней дозировки, условий исследования, ...

Модель случайных эффектов [ править ]

Распространенной моделью, используемой для синтеза гетерогенных исследований, является модель метаанализа со случайными эффектами. Это просто средневзвешенное значение величины эффекта группы исследований. Вес, который применяется в этом процессе взвешенного усреднения с метаанализом случайных эффектов, достигается в два этапа: [20]

  1. Шаг 1. Обратное взвешивание дисперсии
  2. Шаг 2: Отмена взвешивания этого обратного взвешивания дисперсии путем применения компонента дисперсии случайных эффектов (REVC), который просто выводится из степени изменчивости размеров эффекта в базовых исследованиях.

Это означает, что чем больше эта изменчивость в величине эффекта (также известная как неоднородность ), тем больше невзвешенность, и это может достигнуть точки, когда результат метаанализа случайных эффектов станет просто невзвешенным средним размером эффекта по всем исследованиям. С другой стороны, когда все размеры эффекта схожи (или вариабельность не превышает ошибку выборки), REVC не применяется, а метаанализ случайных эффектов по умолчанию сводится к простому метаанализу с фиксированным эффектом (только с обратным взвешиванием дисперсии).

Степень этого разворота зависит исключительно от двух факторов: [21]

  1. Неоднородность точности
  2. Неоднородность величины эффекта

Поскольку ни один из этих факторов автоматически не указывает на ошибочное более крупное исследование или более надежные более мелкие исследования, перераспределение весов в рамках этой модели не будет иметь отношения к тому, что на самом деле могут предложить эти исследования. Действительно, было продемонстрировано, что перераспределение весов происходит просто в одном направлении от больших исследований к меньшим по мере увеличения неоднородности, пока в конечном итоге все исследования не станут равными и перераспределение станет невозможным. [21] Другой проблемой модели случайных эффектов является то, что наиболее часто используемые доверительные интервалы обычно не сохраняют свою вероятность охвата выше указанного номинального уровня и, таким образом, существенно недооценивают статистическую ошибку и потенциально чрезмерно уверены в своих выводах. [22] [23]Было предложено несколько исправлений [24] [25], но дискуссия продолжается. [23] [26] Еще одна проблема заключается в том, что средний лечебный эффект иногда может быть даже менее консервативным по сравнению с моделью фиксированного эффекта [27] и, следовательно, вводить в заблуждение на практике. Одно из предложенных способов интерпретации - создать интервал прогнозирования вокруг оценки случайных эффектов, чтобы отобразить диапазон возможных эффектов на практике. [28] Однако при расчете такого интервала прогноза предполагается, что испытания считаются более или менее однородными, а исследования, включающие популяции пациентов и препараты сравнения, должны считаться взаимозаменяемыми [29] а на практике это обычно недостижимо.

Наиболее широко используемым методом оценки дисперсии между исследованиями (REVC) является подход Дерсимониан-Лэрда (DL). [30] Существует несколько продвинутых итерационных (и дорогостоящих в вычислительном отношении) методов для вычисления дисперсии между исследованиями (например, методы максимального правдоподобия, профильного правдоподобия и ограниченного максимального правдоподобия), и модели случайных эффектов, использующие эти методы, могут быть запущены в Stata с помощью команды metaan. [31] Метан-команду следует отличать от классической метан-команды (одиночная «а») в Stata, которая использует оценщик DL. Эти расширенные методы также были реализованы в бесплатном и простом в использовании надстройке Microsoft Excel MetaEasy. [32] [33]Однако сравнение этих передовых методов и метода DL для вычисления дисперсии между исследованиями показало, что здесь мало пользы, и DL вполне адекватен в большинстве сценариев. [34] [35]

Однако большинство метаанализов включают от 2 до 4 исследований, и такой выборки чаще всего оказывается недостаточно для точной оценки неоднородности . Таким образом, кажется, что в небольших метаанализах получается неверный ноль между оценками дисперсии исследований, что приводит к ложному предположению об однородности. В целом, похоже, что неоднородность постоянно недооценивается в метаанализах и анализах чувствительности, в которых предполагается, что высокие уровни неоднородности могут быть информативными. [36] Эти модели случайных эффектов и программные пакеты, упомянутые выше, относятся к метаанализу совокупных исследований, и исследователям, желающим провести метаанализ данных отдельных пациентов (IPD), необходимо рассмотреть подходы к моделированию смешанных эффектов. [37]

Модель IVhet [ править ]

Дои и Барендрегт в сотрудничестве с Кханом, Талибом и Уильямсом (из Университета Квинсленда, Университета Южного Квинсленда и Университета Кувейта) создали квазиправдоподобную альтернативу обратной дисперсии (IVhet) модели случайных эффектов (RE), для которой подробности доступны в Интернете. [38] Это было включено в MetaXL версии 2.0, [39]бесплатная надстройка Microsoft Excel для метаанализа, разработанная Epigear International Pty Ltd и сделанная доступной 5 апреля 2014 года. Авторы заявляют, что явным преимуществом этой модели является то, что она решает две основные проблемы модели случайных эффектов. Первое преимущество модели IVhet заключается в том, что охват остается на номинальном (обычно 95%) уровне для доверительного интервала, в отличие от модели со случайными эффектами, охват которой уменьшается с увеличением неоднородности. [22] [23]Второе преимущество заключается в том, что модель IVhet поддерживает весовые коэффициенты обратной дисперсии отдельных исследований, в отличие от модели RE, которая придает меньшим исследованиям больший вес (и, следовательно, более крупным исследованиям меньше) с увеличением неоднородности. Когда неоднородность становится большой, веса отдельных исследований в модели RE становятся равными, и, таким образом, модель RE возвращает среднее арифметическое, а не средневзвешенное. Этот побочный эффект модели RE отсутствует в модели IVhet, которая, таким образом, отличается от оценки модели RE с двух точек зрения: [38]Объединенные оценки будут отдавать предпочтение более крупным испытаниям (в отличие от штрафов за более крупные испытания в модели RE) и будут иметь доверительный интервал, который остается в пределах номинального охвата в условиях неопределенности (неоднородности). Дои и Барендрегт предполагают, что, хотя модель RE предоставляет альтернативный метод объединения данных исследования, результаты их моделирования [40]продемонстрируйте, что использование более конкретной вероятностной модели с несостоятельными предположениями, как в случае модели RE, не обязательно дает лучшие результаты. В последнем исследовании также сообщается, что модель IVhet решает проблемы, связанные с недооценкой статистической ошибки, плохим охватом доверительного интервала и повышенным MSE, наблюдаемым с помощью модели случайных эффектов, и авторы приходят к выводу, что исследователи отныне должны отказаться от использования модели случайных эффектов. в метаанализе. Хотя их данные убедительны, разветвления (с точки зрения величины ложно положительных результатов в базе данных Кокрейн) огромны, и поэтому принятие этого вывода требует тщательного независимого подтверждения. Доступность бесплатного программного обеспечения (MetaXL) [39] который запускает модель IVhet (и все другие модели для сравнения), облегчает это для исследовательского сообщества.

Прямые доказательства: модели, включающие дополнительную информацию [ править ]

Модель качественных эффектов [ править ]

Дои и Талиб первоначально представили модель качественных эффектов. [41] Они [42]представил новый подход к корректировке вариабельности между исследованиями путем включения вклада дисперсии из-за соответствующего компонента (качества) в дополнение к вкладу дисперсии из-за случайной ошибки, которая используется в любой модели метаанализа с фиксированными эффектами для генерации весов для каждого исследования. Сила метаанализа качественных эффектов заключается в том, что он позволяет использовать имеющиеся методологические доказательства вместо субъективных случайных эффектов и тем самым помогает закрыть разрушительный разрыв, который образовался между методологией и статистикой в ​​клинических исследованиях. Для этого на основе информации о качестве вычисляется синтетическая дисперсия смещения для корректировки весов обратной дисперсии, и вводится вес с поправкой на качество i- го исследования. [41]Эти скорректированные веса затем используются в метаанализе. Другими словами, если исследование i хорошего качества, а другие исследования низкого качества, часть их весов с поправкой на качество математически перераспределяется между исследованием i.придавая ему больший вес по отношению к общему размеру эффекта. По мере того, как исследования становятся все более похожими с точки зрения качества, повторное распространение становится все меньше и прекращается, когда все исследования имеют одинаковое качество (в случае равного качества модель эффектов качества по умолчанию соответствует модели IVhet - см. Предыдущий раздел). Недавняя оценка модели эффектов качества (с некоторыми обновлениями) демонстрирует, что, несмотря на субъективность оценки качества, производительность (MSE и истинная дисперсия при моделировании) выше, чем достижимая модель со случайными эффектами. [43] [44] Таким образом, эта модель заменяет несостоятельные интерпретации, которые имеются в большом количестве в литературе, и доступно программное обеспечение для дальнейшего изучения этого метода. [39]

Косвенные доказательства: методы сетевого метаанализа [ править ]

Сетевой метаанализ рассматривает косвенные сравнения. На изображении A был проанализирован по отношению к C, а C был проанализирован по отношению к b. Однако связь между A и B известна только косвенно, и сетевой метаанализ рассматривает такие косвенные свидетельства различий между методами и вмешательствами с использованием статистических методов.

В методах метаанализа косвенного сравнения (также называемых сетевым метаанализом, в частности, когда одновременно оценивается несколько видов лечения) обычно используются две основные методологии. Во-первых, это метод Бухера [45], который представляет собой однократное или повторяющееся сравнение замкнутого цикла из трех процедур, так что одно из них является общим для двух исследований и образует узел, на котором цикл начинается и заканчивается. Следовательно, для сравнения нескольких курсов лечения необходимы множественные сравнения два на два (петли из 3 процедур). Эта методология требует, чтобы в исследованиях с более чем двумя группами были выбраны только две группы, поскольку требуются независимые попарные сравнения. Альтернативная методология использует комплексное статистическое моделирование.для одновременного включения нескольких клинических испытаний и сравнений между всеми конкурирующими видами лечения. Они были выполнены с использованием байесовских методов, смешанных линейных моделей и мета-регрессионных подходов. [ необходима цитата ]

Байесовская структура [ править ]

Определение модели метаанализа байесовской сети включает в себя написание модели направленного ациклического графа (DAG) для универсального программного обеспечения Монте-Карло цепи Маркова (MCMC), такого как WinBUGS. [46] Кроме того, для ряда параметров должны быть указаны предыдущие распределения, а данные должны быть предоставлены в определенном формате. [46] Вместе DAG, априорные значения и данные образуют байесовскую иерархическую модель. Чтобы еще больше усложнить ситуацию, из-за характера оценки MCMC необходимо выбрать сверхдисперсные начальные значения для ряда независимых цепочек, чтобы можно было оценить сходимость. [47]В настоящее время нет программного обеспечения, которое автоматически генерирует такие модели, хотя есть некоторые инструменты, помогающие в этом процессе. Сложность байесовского подхода ограничивает использование этой методологии. Методология автоматизации этого метода была предложена [48], но требует наличия данных об исходах на уровне группы, а они обычно недоступны. Иногда делаются большие заявления о врожденной способности байесовской структуры обрабатывать сетевой метаанализ и ее большей гибкости. Однако этот выбор реализации структуры для вывода, байесовской или частотной, может быть менее важным, чем другие варианты моделирования эффектов [49] (см. Обсуждение моделей выше).

Многопараметрическая система частотности [ править ]

С другой стороны, частотные многомерные методы включают приближения и предположения, которые не указываются явно или не проверяются при применении методов (см. Обсуждение моделей метаанализа выше). Например, пакет mvmeta для Stata позволяет выполнять метаанализ сети в частотной структуре. [50] Однако, если в сети нет общего компаратора, то с этим следует справиться путем расширения набора данных вымышленными руками с высокой дисперсией, что не очень объективно и требует решения относительно того, что составляет достаточно высокую дисперсию. [51]Другой проблемой является использование модели случайных эффектов как в этой частотной структуре, так и в байесовской структуре. Сенн советует аналитикам с осторожностью относиться к интерпретации анализа «случайных эффектов», поскольку допускается только один случайный эффект, но можно предусмотреть множество. [49] Сенн продолжает, что это довольно наивно, даже в случае, когда сравниваются только два лечения, предполагать, что анализ случайных эффектов учитывает всю неопределенность в отношении того, как эффекты могут варьироваться от испытания к испытанию. Новые модели метаанализа, такие как рассмотренные выше, безусловно, помогут облегчить эту ситуацию, и они были реализованы в следующей структуре.

Обобщенная структура парного моделирования [ править ]

Подход, который был опробован с конца 1990-х годов, - это реализация множественного анализа с замкнутым контуром с тремя обработками. Это не было популярным, потому что процесс быстро становится подавляющим по мере увеличения сложности сети. Затем от разработок в этой области отказались в пользу байесовских и многомерных частотных методов, которые появились в качестве альтернативы. Совсем недавно некоторые исследователи разработали автоматизацию метода замкнутого контура с тремя режимами для сложных сетей [38].как способ сделать эту методологию доступной для основного исследовательского сообщества. Это предложение действительно ограничивает каждое испытание двумя вмешательствами, но также вводит обходной путь для испытаний нескольких рук: другой фиксированный узел управления может быть выбран в разных прогонах. В нем также используются надежные методы метаанализа, позволяющие избежать многих из перечисленных выше проблем. Требуются дальнейшие исследования этой схемы, чтобы определить, действительно ли она лучше байесовской или многомерной частотной схемы. Исследователи, желающие попробовать это, имеют доступ к этой структуре через бесплатное программное обеспечение. [39]

Индивидуальный мета-анализ [ править ]

Другая форма дополнительной информации исходит из предполагаемой настройки. Если целевая настройка для применения результатов метаанализа известна, то можно будет использовать данные из настройки для адаптации результатов, таким образом, производя «специализированный мета-анализ». [52] [53] Это использовалось в метаанализ точности теста, в котором эмпирические знания о частоте положительных результатов теста и распространенности использовались для получения области в пространстве рабочих характеристик приемника (ROC), известной как «применимая область». Затем выбираются исследования для целевого параметра на основе сравнения с этим регионом и объединяются для получения итоговой оценки, адаптированной к целевому параметру.

Агрегирование IPD и AD [ править ]

Мета-анализ также может применяться для объединения IPD и AD. Это удобно, когда исследователи, проводящие анализ, имеют свои собственные необработанные данные при сборе агрегированных или сводных данных из литературы. Обобщенная интеграционная модель (GIM) [54] является обобщением метаанализа. Это позволяет отличать модель, подобранную по данным отдельных участников (IPD) от моделей, используемых для вычисления агрегированных данных (AD). GIM можно рассматривать как метод калибровки модели для большей гибкости интеграции информации.

Проверка результатов метаанализа [ править ]

Оценка метаанализа представляет собой средневзвешенное значение по исследованиям, и при наличии неоднородности это может привести к тому, что итоговая оценка не будет репрезентативной для отдельных исследований. Качественная оценка первичных исследований с использованием установленных инструментов может выявить потенциальные ошибки [55] [56], но не дает количественной оценки совокупного влияния этих ошибок на итоговую оценку. Хотя результат метаанализа можно сравнить с независимым проспективным первичным исследованием, такое внешнее подтверждение часто нецелесообразно. Это привело к разработке методов, которые используют форму перекрестной проверки исключения по одному , иногда называемую перекрестной проверкой внутри и снаружи (IOCV). [57]Здесь каждое из k включенных исследований по очереди опускается и сравнивается с итоговой оценкой, полученной путем агрегирования оставшихся k-1 исследований. Общая проверочная статистика Vn на основе IOCV была разработана для измерения статистической достоверности результатов метаанализа. [58] Для проверки точности и предсказания, особенно когда есть многомерные эффекты, также были предложены другие подходы, которые стремятся оценить ошибку предсказания. [59]

Проблемы [ править ]

Метаанализ нескольких небольших исследований не всегда позволяет предсказать результаты одного большого исследования. [60] Некоторые утверждали, что недостатком метода является то, что источники систематической ошибки не контролируются методом: хороший метаанализ не может исправить плохой дизайн или систематическую ошибку в исходных исследованиях. [61] Это будет означать, что в метаанализ следует включать только методологически обоснованные исследования, практику, называемую «синтезом наилучших доказательств». [61] Другие метааналитики включили бы более слабые исследования и добавили бы прогностическую переменную на уровне исследования, которая отражает методологическое качество исследований, чтобы изучить влияние качества исследования на величину эффекта. [62]Однако другие утверждали, что лучший подход состоит в том, чтобы сохранить информацию о дисперсии в исследуемой выборке, используя как можно более широкую сеть, и что методологические критерии отбора привносят нежелательную субъективность, сводя на нет цель подхода. [63]

Предвзятость публикации: проблема с файловым ящиком [ править ]

Ожидаемый график воронки без проблем с файловым ящиком. Самые большие исследования сходятся на вершине, в то время как меньшие исследования показывают более или менее симметричный разброс у основания.
Ожидаемый график воронки при проблеме с файловым ящиком. Крупнейшие исследования по-прежнему группируются вокруг вершины, но предвзятость в отношении публикации отрицательных исследований привела к тому, что более мелкие исследования в целом дали неоправданно благоприятный результат для гипотезы.

Еще одна потенциальная ловушка - это опора на доступный объем опубликованных исследований, что может привести к завышенным результатам из-за предвзятости публикации , поскольку исследования, которые показывают отрицательные или незначительные результаты, с меньшей вероятностью будут опубликованы. Например, известно, что фармацевтические компании скрывают отрицательные исследования, а исследователи могут упустить из виду неопубликованные исследования, такие как исследования диссертаций или тезисы конференций, которые не были опубликованы. Это нелегко решить, поскольку невозможно знать, сколько исследований осталось незарегистрированным. [64]

Эта проблема с файловым ящиком (характеризуемая отрицательными или несущественными результатами, спрятанными в шкафу) может привести к смещенному распределению размеров эффекта, создавая серьезную ошибку базовой ставки , в которой значимость опубликованных исследований переоценена, поскольку другие исследования либо не были представлены для публикации, либо были отклонены. Это следует серьезно учитывать при интерпретации результатов метаанализа. [64] [65]

Распределение размеров эффекта можно визуализировать с помощью воронкообразного графика.который (в его наиболее распространенной версии) представляет собой диаграмму разброса стандартной ошибки в зависимости от размера эффекта. Он использует тот факт, что более мелкие исследования (следовательно, более крупные стандартные ошибки) имеют больший разброс величины эффекта (будучи менее точными), в то время как более крупные исследования имеют меньший разброс и образуют вершину воронки. Если многие отрицательные исследования не были опубликованы, оставшиеся положительные исследования дают начало графику воронки, основание которого смещено в одну сторону (асимметрия графика воронки). Напротив, когда нет предвзятости публикации, эффект небольших исследований не имеет причин для отклонения в одну сторону, и поэтому получается симметричный график воронки. Это также означает, что при отсутствии предвзятости публикации не будет никакой связи между стандартной ошибкой и размером эффекта. [66]Отрицательная или положительная связь между стандартной ошибкой и размером эффекта будет означать, что более мелкие исследования, которые обнаружили эффекты только в одном направлении, с большей вероятностью будут опубликованы и / или представлены для публикации.

Помимо визуального графика воронки, также были предложены статистические методы обнаружения систематической ошибки публикации. Они противоречивы, потому что обычно имеют низкую мощность для обнаружения смещения, но также могут давать ложные срабатывания при некоторых обстоятельствах. [67] Например, эффекты небольших исследований (предвзятые более мелкие исследования), в которых существуют методологические различия между меньшими и более крупными исследованиями, могут вызвать асимметрию в размерах эффекта, которая напоминает предвзятость публикации. Однако эффекты небольших исследований могут быть столь же проблематичными для интерпретации метаанализов, и авторы метааналитики обязаны исследовать потенциальные источники систематической ошибки.

Для сокращения числа ложноположительных ошибок был предложен тандемный метод анализа предвзятости публикации. [68]Этот тандемный метод состоит из трех этапов. Во-первых, вычисляется отказоустойчивое N Орвина, чтобы проверить, сколько исследований следует добавить, чтобы уменьшить статистику теста до тривиального размера. Если это количество исследований больше, чем количество исследований, использованных в метаанализе, это признак того, что нет систематической ошибки публикации, поскольку в этом случае требуется много исследований, чтобы уменьшить размер эффекта. Во-вторых, можно провести регрессионный тест Эггера, который проверяет, является ли график воронки симметричным. Как упоминалось ранее: симметричный график воронки является признаком отсутствия предвзятости публикации, поскольку размер эффекта и размер выборки не зависят. В-третьих, можно использовать метод обрезки и заполнения, который вводит данные, если график воронки асимметричен.

Проблема предвзятости публикации не является тривиальной, поскольку предполагается, что 25% метаанализов в психологических науках могли пострадать от предвзятости публикации. [68] Однако низкая мощность существующих тестов и проблемы с внешним видом графика воронки остаются проблемой, и оценки систематической ошибки публикации могут оставаться ниже реальных.

Большинство дискуссий о предвзятости публикации сосредоточено на практике журналов, благоприятствующей публикации статистически значимых результатов. Однако сомнительные методы исследования, такие как переработка статистических моделей до достижения значимости, также могут способствовать получению статистически значимых результатов в поддержку гипотез исследователей. [69] [70]

Проблемы, связанные с исследованиями, в которых не сообщалось о статистически значимых эффектах [ править ]

Исследования часто не сообщают о эффектах, когда они не достигают статистической значимости [ необходима цитата ] . Например, они могут просто сказать, что группы не показали статистически значимых различий, без предоставления какой-либо другой информации (например, статистики или p-значения). Исключение этих исследований привело бы к ситуации, аналогичной систематической ошибке публикации, но их включение (при допущении нулевых эффектов) также повлияло бы на метаанализ. MetaNSUE, метод, созданный Хоакимом Радуа , показал, что позволяет исследователям беспристрастно включать эти исследования. [71] Его шаги следующие:

  • Оценка максимального правдоподобия метааналитического эффекта и неоднородности исследований.
  • Множественное вменение NSUE добавляет шум к оценке эффекта.
  • Отдельный метаанализ для каждого импутируемого набора данных.
  • Объединение результатов этих метаанализов.

Проблемы, связанные со статистическим подходом [ править ]

Другими недостатками является то, что не было определено, является ли статистически наиболее точным методом объединения результатов модели фиксированного, IVhet, случайного или качественного эффекта, хотя критика модели случайных эффектов усиливается из-за восприятия того, что новые случайные эффекты ( используются в метаанализе), по сути, являются формальными устройствами для облегчения сглаживания или сжатия, и прогнозирование может быть невозможным или необдуманным. [72] Основная проблема подхода со случайными эффектами заключается в том, что он использует классическую статистическую идею создания «компромиссной оценки», которая делает веса близкими к естественно взвешенной оценке, если неоднородностьмежду исследованиями велико, но близко к взвешенной оценке обратной дисперсии, если неоднородность между исследованиями мала. Однако игнорировалось различие между моделью, которую мы выбираем для анализа данного набора данных, и механизмом, с помощью которого эти данные возникли . [73]Случайный эффект может присутствовать в любой из этих ролей, но эти две роли совершенно разные. Нет оснований полагать, что модель анализа и механизм (модель) генерации данных похожи по форме, но многие подобласти статистики выработали привычку предполагать, для теории и моделирования, что механизм (модель) генерации данных является идентична модели анализа, которую мы выбираем (или хотели бы, чтобы ее выбрали другие). В качестве гипотетического механизма для получения данных модель случайных эффектов для метаанализа является глупой, и более уместно рассматривать эту модель как поверхностное описание и что-то, что мы выбираем как аналитический инструмент, но этот выбор для метаанализа может не работают, потому что эффекты исследования являются фиксированной функцией соответствующего метаанализа, а распределение вероятностей является только описательным инструментом.[73]

Проблемы, возникающие из-за предвзятого отношения к повестке дня [ править ]

Самая серьезная ошибка в метаанализе [74] часто возникает, когда человек или лица, выполняющие метаанализ, имеют экономическую , социальную или политическую повестку дня, такую ​​как принятие или отмена закона . Люди с такими программами могут с большей вероятностью злоупотребить метаанализом из-за личных предубеждений . Например, исследователи, поддерживающие взгляды автора, скорее всего, выберут свои исследования с особой тщательностью.в то время как неблагоприятные будут проигнорированы или помечены как «не заслуживающие доверия». Кроме того, избранные авторы могут сами быть предвзятыми или получать деньги за получение результатов, которые поддерживают их общие политические, социальные или экономические цели, например, путем выбора небольших благоприятных наборов данных и исключения более крупных неблагоприятных наборов данных. Влияние таких предубеждений на результаты метаанализа возможно, потому что методология метаанализа очень гибкая. [75]

В исследовании 2011 года, проведенном для выявления возможных конфликтов интересов в основных исследованиях, используемых для медицинских метаанализов, было проанализировано 29 метаанализов и обнаружено, что конфликты интересов в исследованиях, лежащих в основе метаанализов, раскрывались редко. 29 метаанализов включали 11 из журналов общей медицины, 15 из специализированных медицинских журналов и три из Кокрановской базы данных систематических обзоров . В 29 метаанализах было проанализировано в общей сложности 509 рандомизированных контролируемых испытаний.(РКИ). Из них 318 РКИ сообщили об источниках финансирования, при этом 219 (69%) получали финансирование от промышленности (т. Е. Один или несколько авторов имели финансовые связи с фармацевтической промышленностью). Из 509 РКИ 132 сообщили о раскрытии информации о конфликте интересов авторов, а 91 исследование (69%) раскрыло, что один или несколько авторов имеют финансовые связи с промышленностью. Однако информация редко отражалась в метаанализах. Только два (7%) сообщили об источниках финансирования РКИ, и ни один не сообщил о связях между авторами РКИ и отраслью. Авторы пришли к выводу, что «без признания ИСП из-за финансирования отрасли или финансовых связей автора с отраслью из РКИ, включенных в метаанализ, понимание читателями и оценка доказательств из метаанализа может быть поставлено под угрозу». [76]

Например, в 1998 году федеральный судья США обнаружил, что Агентство по охране окружающей среды США злоупотребило процессом метаанализа, чтобы подготовить исследование, в котором утверждается, что табачный дым в окружающей среде (ETS) представляет риск рака для некурящих с намерением повлиять на разработчиков политики. принять законы о запрете курения на рабочем месте. Судья установил, что:

Выбор исследования EPA вызывает беспокойство. Во-первых, в протоколе есть доказательства, подтверждающие обвинение в том, что EPA «вишня» собрала его данные. Без критериев объединения исследований в метаанализ суд не может определить, было ли исключение исследований, которые могли бы опровергнуть априорную гипотезу EPA, совпадением или преднамеренным. Во-вторых, исключение EPA почти половины доступных исследований прямо противоречит предполагаемой цели EPA по анализу эпидемиологических исследований и противоречит Руководству EPA по оценке рисков. См. ETS Risk Assessment на стр. 4-29 («Эти данные также следует изучить, чтобы взвесить все имеющиеся доказательства.в соответствии с рекомендациями EPA по оценке канцерогенного риска (US EPA, 1986a) (курсив добавлен)). В-третьих, избирательное использование данных EPA противоречит Закону об исследованиях радона. В законе говорится, что программа EPA должна «собирать данные и информацию по всем аспектам качества воздуха в помещениях» (Закон об исследованиях радона, § 403 (a) (1)) (курсив добавлен). [77]

В результате злоупотребления суд аннулировал главы 1–6 и приложения к EPA «Влияние пассивного курения на респираторное здоровье: рак легких и другие заболевания». [77]

Слабые стандарты включения приводят к ошибочным выводам [ править ]

Мета-анализ в образовании часто недостаточно ограничивает методологическое качество включаемых в него исследований. Например, исследования, включающие небольшие выборки или меры, разработанные исследователями, приводят к завышенным оценкам размера эффекта. [78]

Приложения в современной науке [ править ]

Современный статистический метаанализ делает больше, чем просто объединяет размеры эффекта набора исследований с использованием средневзвешенного значения. Он может проверить, демонстрируют ли результаты исследований больше вариаций, чем ожидаемые, из-за выборки разного числа участников исследования. Кроме того, характеристики исследования, такие как используемый инструмент измерения, выборка совокупности или аспекты дизайна исследования, могут быть закодированы и использованы для уменьшения дисперсии оценочной функции (см. Статистические модели выше). Таким образом, некоторые методологические недостатки исследований можно исправить статистически. Другие виды использования метааналитических методов включают разработку и проверку моделей клинического прогнозирования, где метаанализ может использоваться для объединения данных отдельных участников из разных исследовательских центров и для оценки обобщаемости модели.[79] [80] или даже для агрегирования существующих моделей прогнозирования. [81]

Мета-анализ может проводиться как с индивидуальным дизайном, так и с дизайном групповых исследований. Это важно, потому что многие исследования проводились с использованием планов исследований по одному предмету . Существуют серьезные споры о наиболее подходящей метааналитической технике для исследования одного предмета. [82]

Мета-анализ приводит к смещению акцента с отдельных исследований на множественные. Он подчеркивает практическую важность величины эффекта вместо статистической значимости отдельных исследований. Этот сдвиг в мышлении получил название «метааналитическое мышление». Результаты метаанализа часто отображаются на лесном участке .

Результаты исследований объединены с использованием разных подходов. Один из подходов, часто используемых в метаанализе в медицинских исследованиях, называется « методом обратной дисперсии ». Средний размер эффекта по всем исследованиям вычисляется как средневзвешенное значение , при этом веса равны обратной дисперсии оценки эффекта каждого исследования. Более крупным исследованиям и исследованиям с меньшим количеством случайных вариаций придается больший вес, чем небольшим исследованиям. Другие распространенные подходы включают метод Мантеля – Хензеля [83] и метод Пето . [84]

D-картирование на основе семян (ранее подписанное дифференциальное картирование, SDM) - это статистический метод для метаанализа исследований различий в активности или структуре мозга, в котором использовались методы нейровизуализации, такие как фМРТ, VBM или ПЭТ.

Для понимания экспрессии генов использовались различные высокопроизводительные методы, такие как микроматрицы . МикроРНК профили экспрессии была использована для идентификации дифференциальна выраженный микроРНКа в конкретных условиях клетки или ткани типа или заболевания или для проверки эффекта лечения. Мета-анализ таких профилей экспрессии был проведен для получения новых выводов и подтверждения известных результатов. [85]

См. Также [ править ]

  • Статистика оценок
  • Метанаука
  • Шкала Ньюкасла – Оттавы
  • Предвзятость сообщения
  • Обзор журнала
  • Вторичные исследования
  • Неоднородность исследования
  • Регулярный обзор
  • Заговор Гэлбрейта
  • Агрегация данных

Ссылки [ править ]

  1. ^ Гренландия S, О 'Рурк K: Мета-анализ. Страница 652 в современной эпидемиологии, 3-е изд. Под редакцией Ротмана К.Дж., Гренландии С., Лэша Т. Липпинкотта Уильямса и Уилкинса; 2008 г.
  2. Перейти ↑ Walker E, Hernandez AV, Kattan MW (2008). «Мета-анализ: его сильные и слабые стороны». Cleve Clin J Med . 75 (6): 431–9. DOI : 10.3949 / ccjm.75.6.431 . PMID  18595551 .
  3. ^ Ваноус, Джон П .; Салливан, Шерри Э .; Малинак, Джойс (1989). «Роль суждений в метаанализе». Журнал прикладной психологии . 74 (2): 259–264. DOI : 10.1037 / 0021-9010.74.2.259 . ISSN 0021-9010 . 
  4. ^ «Глоссарий Кокрановского сотрудничества» . cochrane.org .
  5. ^ Gravetter, Фредерик Дж .; Форзано, Лори-Энн Б. (1 января 2018 г.). Методы исследования поведенческих наук . Cengage Learning. п. 36. ISBN 9781337613316. Некоторыми примерами вторичных источников являются (1) книги и учебники, в которых автор описывает и резюмирует прошлые исследования, (2) обзорные статьи или метаанализы ...
  6. ^ Адамс, Кэтрин А .; Лоуренс, Ева К. (2 февраля 2018 г.). Методы исследования, статистика и приложения . Публикации SAGE. ISBN 9781506350462. Наиболее распространенные типы вторичных источников, которые можно найти в академических журналах, - это обзоры литературы и метаанализы.
  7. ^ Плакетта, RL (1958). "Исследования по истории вероятности и статистики: Vii. Принцип среднего арифметического" . Биометрика . 45 (1-2): 133. DOI : 10,1093 / Biomet / 45.1-2.130 . Дата обращения 29 мая 2016 .
  8. ^ Пирсон K (1904). «Отчет по статистике некоторых прививок от кишечной лихорадки» . BMJ . 2 (2288): 1243–1246. DOI : 10.1136 / bmj.2.2288.1243 . PMC 2355479 . PMID 20761760 .  
  9. ^ Nordmann AJ, Kasenda B, Briel M (9 марта 2012). «Мета-анализ: что они могут и что нельзя делать» . Швейцарский медицинский еженедельник . 142 : w13518. DOI : 10.4414 / smw.2012.13518 . PMID 22407741 . 
  10. О'Рурк K (1 декабря 2007 г.). «Исторический взгляд на метаанализ: количественное рассмотрение различных результатов исследования» . JR Soc Med . 100 (12): 579–582. DOI : 10,1258 / jrsm.100.12.579 . PMC 2121629 . PMID 18065712 .  
  11. ^ Pratt JG, Rhine JB, Смит Б. М., Стюарт CE, Greenwood JA. Экстрасенсорное восприятие через шестьдесят лет: критическая оценка исследований экстрасенсорного восприятия. Нью-Йорк: Генри Холт, 1940.
  12. ^ Гласс Г. V (1976). «Первичный, вторичный и метаанализ исследования». Педагогический исследователь . 5 (10): 3–8. DOI : 10.3102 / 0013189X005010003 .
  13. ^ Кокрэн WG (1937). «Проблемы, возникающие при анализе серии подобных экспериментов». Журнал Королевского статистического общества . 4 (1): 102–118. DOI : 10.2307 / 2984123 . JSTOR 2984123 . 
  14. ^ Кокрэн РГ, Кэрролл SP (1953). «Выборочное исследование эффективности взвешивания, обратно пропорционального расчетной дисперсии». Биометрия . 9 (4): 447–459. DOI : 10.2307 / 3001436 . JSTOR 3001436 . 
  15. ^ "Заявление ПРИЗМЫ" . Prisma-statement.org. 2 февраля 2012 . Проверено 2 февраля 2012 года .
  16. ^ Дебрей, Томас PA; Луны, Карел GM; ван Валкенхоф, Герт; Эфтимиу, Орестис; Хаммел, Ноэми; Groenwold, Rolf HH; Reitsma, Johannes B .; от имени группы проверки методов GetReal (1 декабря 2015 г.). «Реальный метаанализ данных отдельных участников (IPD): обзор методологии» . Методы исследования синтеза . 6 (4): 293–309. DOI : 10.1002 / jrsm.1160 . ISSN 1759-2887 . PMC 5042043 . PMID 26287812 .   
  17. ^ Дебрэ Т.П., Спутники КГ, Abo-Зайд Г.М., Koffijberg Н, Райли RD (2013). «Метаанализ данных отдельных участников для двоичного результата: одноэтапный или двухэтапный?» . PLOS One . 8 (4): e60650. Bibcode : 2013PLoSO ... 860650D . DOI : 10.1371 / journal.pone.0060650 . PMC 3621872 . PMID 23585842 .  
  18. ^ Берк, Даниэль Л .; Энсор, Джой; Райли, Ричард Д. (28 февраля 2017 г.). «Мета-анализ с использованием данных отдельных участников: одноэтапный и двухэтапный подходы, и почему они могут различаться» . Статистика в медицине . 36 (5): 855–875. DOI : 10.1002 / sim.7141 . ISSN 1097-0258 . PMC 5297998 . PMID 27747915 .   
  19. ^ Helfenstein U (2002). «Данные и модели определяют предложения по лечению - иллюстрация из метаанализа» . Исследование уровня J Med . 78 (917): 131–4. DOI : 10.1136 / pmj.78.917.131 . PMC 1742301 . PMID 11884693 .  
  20. ^ Senn S (2007). «Пытаюсь уточнить неясность». Stat Med . 26 (7): 1417–30. DOI : 10.1002 / sim.2639 . PMID 16906552 . 
  21. ^ а б Аль-Халаф М.М., Талиб Л., Дои С.А. (2011). «Объединение разнородных исследований с использованием модели случайных эффектов является ошибкой и приводит к неубедительным метаанализам» . Журнал клинической эпидемиологии . 64 (2): 119–23. DOI : 10.1016 / j.jclinepi.2010.01.009 . PMID 20409685 . 
  22. ^ a b Brockwell SE; Гордон И.Р. (2001). «Сравнение статистических методов метаанализа». Статистика в медицине . 20 (6): 825–840. DOI : 10.1002 / sim.650 . PMID 11252006 . 
  23. ^ a b c Noma H (декабрь 2011 г.). «Доверительные интервалы для метаанализа случайных эффектов на основе поправок типа Бартлетта». Stat Med . 30 (28): 3304–12. DOI : 10.1002 / sim.4350 . hdl : 2433/152046 . PMID 21964669 . 
  24. ^ Brockwell SE, Гордон IR (2007). «Простой метод вывода об общем эффекте в метаанализе». Статистика в медицине . 26 (25): 4531–4543. DOI : 10.1002 / sim.2883 . PMID 17397112 . 
  25. ^ Сидик K, Йонкман JN (2002). «Простой доверительный интервал для метаанализа». Статистика в медицине . 21 (21): 3153–3159. DOI : 10.1002 / sim.1262 . PMID 12375296 . 
  26. Перейти ↑ Jackson D, Bowden J (2009). «Переоценка« метода квантильной аппроксимации »для метаанализа случайных эффектов» . Stat Med . 28 (2): 338–48. DOI : 10.1002 / sim.3487 . PMC 2991773 . PMID 19016302 .  
  27. Перейти ↑ Poole C, Greenland S (сентябрь 1999 г.). «Мета-анализ случайных эффектов не всегда консервативен» . Am J Epidemiol . 150 (5): 469–75. DOI : 10.1093 / oxfordjournals.aje.a010035 . PMID 10472946 . 
  28. Перейти ↑ Riley RD, Higgins JP, Deeks JJ (2011). «Интерпретация метаанализов случайных эффектов» . Британский медицинский журнал . 342 : d549. DOI : 10.1136 / bmj.d549 . PMID 21310794 . 
  29. ^ Kriston L (2013). «Работа с клинической неоднородностью в метаанализе. Допущения, методы, интерпретация» . Int J Methods Psychiatr Res . 22 (1): 1–15. DOI : 10.1002 / mpr.1377 . PMC 6878481 . PMID 23494781 .  
  30. ^ DerSimonian R , лэрд Н (1986). «Мета-анализ в клинических исследованиях». Контрольные клинические испытания . 7 (3): 177–88. DOI : 10.1016 / 0197-2456 (86) 90046-2 . PMID 3802833 . 
  31. ^ Контопантелис, Евангелос; Ривз, Дэвид (1 августа 2010 г.). «Метаан: метаанализ случайных эффектов» . Stata Journal . 10 (3): 395–407. doi : 10.1177 / 1536867X1001000307 - через ResearchGate.
  32. ^ Контопантелис, Евангелос; Ривз, Дэвид (2009). «MetaEasy: надстройка мета-анализа для Microsoft Excel, журнал статистического программного обеспечения, 2009» . Журнал статистического программного обеспечения . 30 (7). DOI : 10,18637 / jss.v030.i07 .
  33. ^ "Сайт разработчика" . Statanalysis.co.uk . Проверено 18 сентября 2018 года .
  34. ^ Kontopantelis E, D Reeves (2012). «Эффективность статистических методов метаанализа, когда истинные эффекты исследования распределены ненормально: имитационное исследование». Статистические методы в медицинских исследованиях . 21 (4): 409–26. DOI : 10.1177 / 0962280210392008 . PMID 21148194 . 
  35. ^ Kontopantelis E, D Reeves (2012). «Эффективность статистических методов метаанализа, когда истинные эффекты исследования распределены ненормально: сравнение между DerSimonian-Laird и ограниченной максимальной вероятностью». СММР . 21 (6): 657–9. DOI : 10.1177 / 0962280211413451 . PMID 23171971 . 
  36. ^ Kontopantelis E, Springate DA, Reeves D (2013). Friede T (ред.). «Повторный анализ данных Кокрановской библиотеки: опасность ненаблюдаемой неоднородности в мета-анализах» . PLOS One . 8 (7): e69930. Bibcode : 2013PLoSO ... 869930K . DOI : 10.1371 / journal.pone.0069930 . PMC 3724681 . PMID 23922860 .  
  37. ^ Контопантелис, Евангелос; Ривз, Дэвид (27 сентября 2013 г.). «Краткое руководство и команда лесного участка (ipdforest) для одноэтапного метаанализа» . Stata Journal . 13 (3): 574–587. doi : 10.1177 / 1536867X1301300308 - через ResearchGate.
  38. ^ a b c «Руководство пользователя MetaXL» (PDF) . Проверено 18 сентября 2018 года .
  39. ^ a b c d "Страница программного обеспечения MetaXL" . Epigear.com. 3 июня 2017 . Проверено 18 сентября 2018 года .
  40. ^ Doi SA, Barendregt JJ, Хан S, L Талиба, Williams GM (2015). «Достижения в метаанализе гетерогенных клинических испытаний I: модель гетерогенности обратной дисперсии» (PDF) . Клинические испытания Contemp . 45 (Pt A): 130–8. DOI : 10.1016 / j.cct.2015.05.009 . PMID 26003435 .  
  41. ^ а б Дои С.А., Талиб Л. (2008). «Модель качественных эффектов для метаанализа». Эпидемиология . 19 (1): 94–100. DOI : 10.1097 / EDE.0b013e31815c24e7 . PMID 18090860 . 
  42. ^ Doi SA, Barendregt JJ, Mozurkewich EL (2011). «Метаанализ разнородных клинических исследований: эмпирический пример». Клинические испытания Contemp . 32 (2): 288–98. DOI : 10.1016 / j.cct.2010.12.006 . PMID 21147265 . 
  43. ^ Doi SA, Barendregt JJ, Williams GM, Хан S, L Талиба (2015). «Моделирование сравнения качественных и случайных эффектов методами метаанализа». Эпидемиология . 26 (4): e42–4. DOI : 10.1097 / EDE.0000000000000289 . PMID 25872162 . 
  44. ^ Doi SA, Barendregt JJ, Хан S, L Талиба, Williams GM (2015). «Достижения в метаанализе гетерогенных клинических испытаний II: Модель эффектов качества». Клинические испытания Contemp . 45 (Pt A): 123–9. DOI : 10.1016 / j.cct.2015.05.010 . PMID 26003432 . 
  45. ^ Bucher HC; Guyatt GH; Гриффит Л. Е.; Уолтер С.Д. (1997). «Результаты прямого и косвенного сравнения лечения в метаанализе рандомизированных контролируемых исследований». J Clin Epidemiol . 50 (6): 683–691. DOI : 10.1016 / s0895-4356 (97) 00049-8 . PMID 9250266 . 
  46. ^ a b Valkenhoef G .; Лу Г .; Brock B .; Hillege H .; Ades AE; Велтон, штат Нью-Джерси (2012). «Автоматизация сетевого метаанализа». Методы исследования синтеза . 3 (4): 285–299. DOI : 10.1002 / jrsm.1054 . PMID 26053422 . 
  47. Перейти ↑ Brooks SP, Gelman A (1998). «Общие методы контроля сходимости итеративного моделирования» (PDF) . Журнал вычислительной и графической статистики . 7 (4): 434–455. DOI : 10.1080 / 10618600.1998.10474787 .
  48. ^ Ван Valkenhoef G, Lu G, де Брок B, Hillege H, Эйдс AE, Велтон NJ. Автоматизация сетевого метаанализа. Res Synth Methods. 2012 декабрь; 3 (4): 285-99.
  49. ^ a b Senn S, Gavini F, Magrez D, Scheen A (апрель 2013 г.). «Проблемы при проведении сетевого метаанализа». Stat Methods Med Res . 22 (2): 169–89. DOI : 10.1177 / 0962280211432220 . PMID 22218368 . 
  50. ^ Белый ИК (2011). «Многомерная мета-регрессия со случайными эффектами: обновления для mvmeta» . Журнал Стата . 11 (2): 255–270. DOI : 10.1177 / 1536867X1101100206 .
  51. ^ Ван Valkenhoef G, Lu G, де Брок B, Hillege H, Эйдс AE, Велтон NJ. Автоматизация сетевого метаанализа. Res Synth Methods. 2012 декабрь; 3 (4): 285-99
  52. ^ Уиллис BH, Hyde CJ (2014). «Оценка точности теста с использованием специализированного метаанализа - Как данные, относящиеся к конкретным условиям, могут помочь в выборе исследования» . Журнал клинической эпидемиологии . 67 (5): 538–546. DOI : 10.1016 / j.jclinepi.2013.10.016 . PMID 24447592 . 
  53. ^ Уиллис BH, Hyde CJ (2015). «Какова точность теста в моей практике? Специализированный мета-анализ дает правдоподобную оценку» . Журнал клинической эпидемиологии . 68 (8): 847–854. DOI : 10.1016 / j.jclinepi.2014.10.002 . PMID 25479685 . 
  54. Перейти ↑ Zhang H, Deng L, Schiffman M, Qin J, Yu K (2020). «Обобщенная интеграционная модель для улучшенного статистического вывода за счет использования внешних сводных данных». Биометрика . DOI : 10.1093 / Biomet / asaa014 .
  55. ^ Хиггинс Дж. П., Альтман Д. Г., Гётше П. К., Юни П., Мохер Д., Оксман А. Д., Савович Дж., Шульц К. Ф., Уикс Л., Стерн Дж. А.; Кокрановская группа методов смещения; Кокрановская группа статистических методов (2011 г.). «Инструмент Кокрановского сотрудничества для оценки риска систематической ошибки в рандомизированных испытаниях» . BMJ . 343 : d5928. DOI : 10.1136 / bmj.d5928 . PMC 3196245 . PMID 22008217 .  CS1 maint: несколько имен: список авторов ( ссылка )
  56. ^ Уайтинг PF, Rutjes AW, Westwood ME, Mallett S, Дикс JJ, Reitsma JB, Леефланг MM, Стерн JA, Боссайт PM, QUADAS-2 группы (2011). «QUADAS-2: обновленный инструмент для оценки качества исследований диагностической точности» . Анналы внутренней медицины . 155 (8): 529–36. DOI : 10.7326 / 0003-4819-155-8-201110180-00009 . PMID 22007046 . CS1 maint: несколько имен: список авторов ( ссылка )
  57. ^ Ройстон P, Parmar М.К., Сильвестр R (2004). «Построение и проверка прогностической модели в нескольких исследованиях с применением при поверхностном раке мочевого пузыря». Статистика в медицине . 23 (6): 907–26. DOI : 10.1002 / sim.1691 . PMID 15027080 . 
  58. ^ Willis BH, Райли RD (2017). «Измерение статистической достоверности сводных результатов мета-анализа и мета-регрессии для использования в клинической практике» . Статистика в медицине . 36 (21): 3283–3301. DOI : 10.1002 / sim.7372 . PMC 5575530 . PMID 28620945 .  
  59. ^ Райли РД, Ахмеда I, Дебрэ Т.П., Уиллис BH, Noordzij Р, Хиггинс ДП, Дикс JJ (2015). «Обобщение и проверка результатов точности тестов в нескольких исследованиях для использования в клинической практике» . Статистика в медицине . 34 (13): 2081–2103. DOI : 10.1002 / sim.6471 . PMC 4973708 . PMID 25800943 .  
  60. ^ LeLorier Дж, Грегуар G, Benhaddad А, Лапьер Дж, Derderian F (1997). «Расхождения между метаанализами и последующими крупными рандомизированными контролируемыми испытаниями». Медицинский журнал Новой Англии . 337 (8): 536–542. DOI : 10.1056 / NEJM199708213370806 . PMID 9262498 . 
  61. ^ а б Славин Р.Е. (1986). «Синтез наилучших доказательств: альтернатива метааналитическим и традиционным обзорам». Педагогический исследователь . 15 (9): 5–9. DOI : 10.3102 / 0013189X015009005 .
  62. ^ Хантер, Шмидт, и Джексон, Джон Э. (1982). Метаанализ: обобщение результатов исследований по всем исследованиям . Беверли-Хиллз, Калифорния: Сейдж.CS1 maint: несколько имен: список авторов ( ссылка )
  63. ^ Стекло, МакГо, & Smith (1981). Метаанализ в социальных исследованиях . Беверли-Хиллз, Калифорния: Сейдж.CS1 maint: несколько имен: список авторов ( ссылка )
  64. ^ а б Розенталь Р. (1979). «Проблема с файловым ящиком и допуск на нулевые результаты» . Психологический бюллетень . 86 (3): 638–641. DOI : 10.1037 / 0033-2909.86.3.638 .
  65. ^ Хантер, Джон Э ; Шмидт, Франк Л. (1990). Методы метаанализа: исправление ошибок и предвзятости в результатах исследований . Парк Ньюбери, Калифорния; Лондон; Нью-Дели: SAGE Publications .
  66. Light & Pillemer (1984). Подведение итогов: Наука рецензирования исследований . Кембридж, Калифорния: Гарвардский университет, пре.
  67. ^ Ioannidis JP, Trikalinos TA (2007). «Пригодность тестов асимметрии для систематической ошибки публикации в метаанализах: большой обзор» . CMAJ . 176 (8): 1091–6. DOI : 10,1503 / cmaj.060410 . PMC 1839799 . PMID 17420491 .  
  68. ^ а б Фергюсон CJ, Бранник MT (2012). «Публикационная предвзятость в психологической науке: распространенность, методы выявления и контроля, а также последствия использования метаанализа». Психологические методы . 17 (1): 120–8. DOI : 10.1037 / a0024445 . PMID 21787082 . 
  69. ^ Simmons JP, Нельсон Л.Д., Simonsohn U (2011). «Ложноположительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представить все как значимое» . Psychol Sci . 22 (11): 1359–66. DOI : 10.1177 / 0956797611417632 . PMID 22006061 . 
  70. ^ LeBel, E .; Петерс, К. (2011). «Опасаясь будущего эмпирической психологии: свидетельство Бема (2011) о пси в качестве примера выявления недостатков в модальной исследовательской практике» (PDF) . Обзор общей психологии . 15 (4): 371–379. DOI : 10.1037 / a0025172 . Архивировано из оригинального (PDF) 24 ноября 2012 года.
  71. ^ Radua, J .; Schmidt, A .; Borgwardt, S .; Heinz, A .; Schlagenhauf, F .; McGuire, P .; Фусар-Поли, П. (2015). «Активация брюшного стриатума во время обработки вознаграждения в психозе: нейрофункциональный метаанализ» . JAMA Psychiatry . 72 (12): 1243–1251. DOI : 10,1001 / jamapsychiatry.2015.2196 . PMID 26558708 . 
  72. ^ Ходжес, Джим и Клейтон, Мюррей К. Случайные эффекты: старые и новые. Статистическая наука XX: XX – XX. URL http: // www. Архивировано 24 мая 2011 г. на Wayback Machine . биостат. ммн. edu / ~ hodges / Hodges-ClaytonREONsubToStatSci (2011)
  73. ^ a b Ходжес Дж. С.. Случайные эффекты старые и новые. В Hodges JS. Линейные модели с широкими параметрами: аддитивные, временные ряды и пространственные модели с использованием случайных эффектов. США: CRC Press, 2013: 285–302.
  74. ^ Х. Сабхан
  75. ^ Stegenga J (2011). «Является ли метаанализ платиновым стандартом доказательства?» . Stud Hist Philos Biol Biomed Sci . 42 (4): 497–507. DOI : 10.1016 / j.shpsc.2011.07.003 . PMID 22035723 . 
  76. ^ Роземан M, Milette K, Беро Л.А., Койн JC, Lexchin J, Turner EH, Thombs BD (2011), "Сообщение о конфликте интересов в Мета-анализ испытаний фармакологических методов лечения" , Журнал Американской медицинской ассоциации , 305 (10): 1008-1017, DOI : 10,1001 / jama.2011.257 , PMID 21386079 CS1 maint: несколько имен: список авторов ( ссылка )
  77. ^ а б «Решение Остина» . Окружной суд США по Среднему округу Северной Каролины. 17 июля 1998 . Проверено 18 марта 2017 года .
  78. ^ Cheung, Алан СК; Славин, Роберт Э. (1 июня 2016 г.). «Как методологические особенности влияют на размер эффекта в образовании» . Педагогический исследователь . 45 (5): 283–292. DOI : 10.3102 / 0013189X16656615 . ISSN 0013-189X . 
  79. ^ Дебрей, Томас PA; Райли, Ричард Д .; Роверс, Мароеска М .; Reitsma, Johannes B .; Луны, Карел GM (13 октября 2015 г.). "Индивидуальные данные участников (IPD) Мета-анализ исследований с диагностическим и прогностическим моделированием: руководство по их использованию" . PLOS Medicine . 12 (10): e1001886. DOI : 10.1371 / journal.pmed.1001886 . PMC 4603958 . PMID 26461078 .  
  80. ^ Debray TP, Спутники KG, Ахмед I, Koffijberg H, Райли RD (2013). «Структура для разработки, внедрения и оценки моделей клинического прогнозирования в метаанализе данных отдельных участников». Статистика в медицине . 32 (18): 3158–80. DOI : 10.1002 / sim.5732 . PMID 23307585 . 
  81. ^ Дебрэ Т.П., Koffijberg Н, Vergouwe Y, Спутники КГ, Штайерберг EW (2012). «Агрегирование опубликованных моделей прогнозирования с данными отдельных участников: сравнение различных подходов». Статистика в медицине . 31 (23): 2697–2712. DOI : 10.1002 / sim.5412 . PMID 22733546 . 
  82. ^ Ван ден Noortgate W, Onghena P (2007). «Агрегирование индивидуальных результатов» . Поведенческий аналитик сегодня . 8 (2): 196–209. DOI : 10.1037 / h0100613 .
  83. ^ Мантеля Н, Хензеля Вт (1959). «Статистические аспекты анализа данных ретроспективного анализа болезней» . Журнал Национального института рака . 22 (4): 719–748. DOI : 10.1093 / JNCI / 22.4.719 . PMID 13655060 . 
  84. ^ «9.4.4.2 Метод отношения шансов Пето» . Кокрановское руководство по систематическим обзорам вмешательств, версия 5.1.0. Март 2011 г.
  85. ^ Bargaje R, Харихаран М, Scaria В, Пиллаи В (2010). «Консенсусные профили экспрессии miRNA, полученные в результате межплатформенной нормализации данных микроматрицы» . РНК . 16 (1): 16–25. DOI : 10,1261 / rna.1688110 . PMC 2802026 . PMID 19948767 .  

Дальнейшее чтение [ править ]

  • Купер, Х. и Хеджес, Л.В. (1994). Справочник по синтезу исследований . Нью-Йорк: Рассел Сейдж.
  • Корнелл, Дж. Э. и Малроу, CD (1999). Мета-анализ. В: HJ Adèr и GJ Mellenbergh (ред.). Методология исследования в социальных, поведенческих науках и науках о жизни (стр. 285–323). Лондон: Мудрец.
  • Норманд С.Л. (1999). «Учебное пособие по биостатистике. Мета-анализ: формулирование, оценка, объединение и отчетность». Статистика в медицине . 18 (3): 321–359. DOI : 10.1002 / (SICI) 1097-0258 (19990215) 18: 3 <321 :: AID-SIM28> 3.0.CO; 2-P . PMID  10070677 .
  • Саттон, AJ, Джонс, Д.Р., Абрамс, KR, Шелдон, Т.А., и Сонг, Ф. (2000). Методы метаанализа в медицинских исследованиях . Лондон: Джон Вили. ISBN 0-471-49066-0 
  • Хиггинс JPT, Green S (редакторы). Кокрановское руководство по систематическим обзорам вмешательств, версия 5.0.1 [обновлено в сентябре 2008 г.]. Кокрановское сотрудничество, 2008 г. Доступно на сайте www.cochrane-handbook.org.
  • Томпсон С.Г., Покок С.Дж.; Покок, Стюарт Дж (2 ноября 1991 г.). "Можно ли доверять метаанализу?" (PDF) . Ланцет . 338 (8775): 1127–1130. DOI : 10.1016 / 0140-6736 (91) 91975-Z . PMID  1682553 . Архивировано из оригинального (PDF) 22 ноября 2011 года . Проверено 17 июня 2011 года .. Исследует два противоположных взгляда: предоставляет ли метаанализ «объективные количественные методы для объединения данных из отдельных, но похожих исследований» или просто «статистические уловки, которые делают необоснованные допущения для получения упрощенных обобщений из комплекса разрозненных исследований»?
  • Уилсон, Д. Б. и Липси, М. В. (2001). Практический мета-анализ . Thousand Oaks: Sage публикации. ISBN 0-7619-2168-0 
  • О'Рурк, К. (2007) Просто история объединения информации: исследования и обобщения того, что, возможно, является общим в клинических наблюдениях или исследованиях посредством вероятности. Оксфорд: Оксфордский университет, статистический факультет. Содержит технические справочные материалы и подробную информацию о статье "Исторический взгляд на метаанализ", цитируемой в ссылках.
  • Оуэн, AB (2009). «Повторный визит к метаанализу Карла Пирсона». Анналы статистики , 37 (6B), 3867–3892. Дополнительный отчет.
  • Эллис, Пол Д. (2010). Основное руководство по размерам эффекта: введение в статистическую мощь, метаанализ и интерпретацию результатов исследований . Соединенное Королевство: Издательство Кембриджского университета. ISBN 0-521-14246-6 
  • Бонетт, Д.Г. (2020) Точечно-бисериальная корреляция: доверительные интервалы, проверка гипотез, метаанализ и планирование размера выборки. Британский журнал математической и статистической психологии 73. DOI: 10.1111 / bmsp.12189
  • Бонетт Д.Г., Цена RM (2015). «Метааналитические методы с переменными коэффициентами для отношений шансов и рисков». Психологические методы . 20 (3): 394–406. DOI : 10,1037 / met0000032 . PMID  25751513 .
  • Бонетт Д.Г., Цена RM (2014). «Методы метаанализа различий рисков». Br J Math Stat Psychol . 67 (3): 371–87. DOI : 10.1111 / bmsp.12024 . PMID  23962020 .
  • Бонетт Д.Г. (2010). «Метааналитические методы с переменным коэффициентом для определения альфа-надежности» . Психологические методы . 15 (4): 368–85. DOI : 10.1037 / a0020142 . PMID  20853952 .
  • Бонетт Д.Г. (2009). «Метааналитическая интервальная оценка стандартизированных и нестандартных разностей средних». Психологические методы . 14 (3): 225–38. DOI : 10.1037 / a0016619 . PMID  19719359 .
  • Бонетт Д.Г. (2008). «Метааналитическая интервальная оценка для двумерных корреляций» . Психологические методы . 13 (3): 173–81. DOI : 10.1037 / a0012868 . PMID  18778150 .

Внешние ссылки [ править ]

  • Кокрановское руководство по систематическим обзорам вмешательств
  • Мета-анализ при 25 (стекло Gene V)
  • Предпочтительные элементы отчетности для систематических обзоров и метаанализов (PRISMA) Заявление , «основанный на фактах минимальный набор элементов для отчетности в систематических обзорах и метаанализах».
  • Пакет R и графический интерфейс «metansue»
  • Лучшая энциклопедия доказательств